Skip to content

zjkwdy/bilibili-history-danmu-spider

Folders and files

NameName
Last commit message
Last commit date

Latest commit

 

History

21 Commits
 
 
 
 
 
 
 
 
 
 
 
 
 
 

Repository files navigation

bilibili-history-danmu-spider


感谢bilibili-API-colletc 用来爬历史弹幕用的,可以整全弹幕什么的。目前支持爬取所有历史弹幕,输出标准xml格式弹幕 使用的是B站protobuf历史弹幕接口,原因就是b站xml格式历史弹幕接口爆炸了,可以用但是返回弹幕已被关闭的信息。

爬av114514(默认)

食用教程:先把浏览器Cookie中的SESSDATA,例如 b7723dd1%1C45141919810%2C6b33f*21
放进danmu.ini,(敲黑板奥)多个账号用英文逗号隔开 之后内容都在ini里头注释写了

;注意奥!这顺序别动,会乱的,改值就行了。(其实就是作者懒得多写)
[account]
;账号相关,每个SESSDATA用英文逗号隔开,例如abcde12334232&defj,kdjdhwejkh,wefioywehifh是三个
SESSDATA=

[spider] ;爬虫设置

;要爬取视频的cid,可以使用getcid.py获取 cid=3262388

;开始爬取历史弹幕的年份 start_year=2011 ;结束爬取的年份(爬取时会包含) end_year=2021

;每次请求前的延迟,不宜过快,会封禁IP daily=4

;https代理,与SESSDATA同理用英文逗号隔开,可以为空 proxy=

以下爬取是2021-01-01到2021-01-10 av114514全弹幕效果 效果

想要爬别的视频弹幕?

把代码中cid改成对应视频的cid即可。

About

可以拿来爬av114514的全历史弹幕

Resources

License

Stars

Watchers

Forks

Releases

No releases published

Packages

No packages published

Languages