感谢bilibili-API-colletc 用来爬历史弹幕用的,可以整全弹幕什么的。目前支持爬取所有历史弹幕,输出标准xml格式弹幕 使用的是B站protobuf历史弹幕接口,原因就是b站xml格式历史弹幕接口爆炸了,可以用但是返回弹幕已被关闭的信息。
食用教程:先把浏览器Cookie中的SESSDATA,例如
b7723dd1%1C45141919810%2C6b33f*21
放进danmu.ini,(敲黑板奥)多个账号用英文逗号隔开
之后内容都在ini里头注释写了
;注意奥!这顺序别动,会乱的,改值就行了。(其实就是作者懒得多写) [account] ;账号相关,每个SESSDATA用英文逗号隔开,例如abcde12334232&defj,kdjdhwejkh,wefioywehifh是三个 SESSDATA=
[spider] ;爬虫设置
;要爬取视频的cid,可以使用getcid.py获取 cid=3262388
;开始爬取历史弹幕的年份 start_year=2011 ;结束爬取的年份(爬取时会包含) end_year=2021
;每次请求前的延迟,不宜过快,会封禁IP daily=4
;https代理,与SESSDATA同理用英文逗号隔开,可以为空 proxy=
以下爬取是2021-01-01到2021-01-10 av114514全弹幕效果
把代码中cid改成对应视频的cid即可。