Repository files navigation
近期工作内容比较繁重,大概率会摸一段时间 (from:Jerry-Yan-0912)
使用新版mitmproxy,使mitmproxy进程跑在主进程里,兼容Python3.10
数据无磁盘IO,通过Queue请求传输proto数据,如果对弹幕发送时间要求较高的,可以使用消息对象中的时间
修改输出为组件化,后期通过配置进行启用或禁用,开发者也可以自行编写对应的保存逻辑
自动打开配置的房间及用户首页
删除了mongo相关内容(以后补吧……,重写一个也不麻烦)
未开播时,自动刷新页面进行重新检测
下播事件触发及对应动作
上播事件触发及自动打开对应的房间
录播支持
异步输出支持
首先配置config/settings.yml中webdriver.use将要使用到的浏览器(现仅支持chrome及edge浏览器)
下载对应浏览器WebDriver驱动
配置WebDriver驱动可执行文件目录
Edge浏览器请配置于webdriver.edge.bin
Chrome浏览器请配置于webdriver.chrome.bin
配置浏览器是否需要无头headless模式
webdriver.headless设置为True,浏览器打开后不会显示窗口,适合Linux服务器等无需显示的情况
webdriver.headless设置为False,浏览器打开后会显示窗口,更适合需要自己手动操作浏览器等其他需要显示情况
配置输出插件(output.use),可以自由搭配使用
print:控制台打印的组件,收到弹幕信息会在控制台中输出
xml:B站弹幕姬相兼容的弹幕格式,适用于后期与视频叠加或分析
debug:开发或测试使用,会保存所有未处理的消息类型,及保留报错信息,方便后期维护排查
配置默认需要打开的房间及用户主页
live.rooms: 填写房间号(链接地址最后一串数字),或者完整链接地址
live.users: 填写用户加密ID(用户首页链接地址最后一串字符串),或者完整链接地址 (暂无任何用途)
安装依赖 pip install -r requirements.txt
按照上述步骤进行配置
运行main.py
mitm:mitmproxy相关配置
host:mitmproxy监听地址,无特殊要求不建议修改
port:mitmproxy监听端口,无特殊要求不建议修改
webdriver:浏览器WebDriver相关配置
headless:是否开启无头模式,True/False
use:使用哪个浏览器,chrome/edge
edge:Edge浏览器相关配置,用谷歌可以不管这个
chrome:Chrome浏览器相关配置,用Edge的可以不管这个
bin:webdriver可执行文件路径
no_sandbox:是否添加--no-sandbox启动参数,用于root用户启动浏览器,True/False
output:输出相关配置
use:使用的输出模块,为一个数组,print/xml/debug
xml:XML输出模块相关配置
save_path:预留内容,实际没有作用
file_pattern:xml文件名称格式,现在也只有默认的这个,待后续开发
debug:Debug输出模块相关配置
save_path:保存路径相关配置
error:如果遇见错误,将错误存储在这个路径下
debug:如果遇见未处理的消息类型,将该消息存储在这个路径下
known:预留内容,实际没有作用
live:直播间相关配置
rooms:房间号(链接地址最后一串数字),或者完整链接地址,为一个数组
users:用户加密ID(用户首页链接地址最后一串字符串),或者完整链接地址 ,为一个数组
api:这个现在暂时没啥用了……
About
抖音直播间(web)弹幕抓取 【上抖音,看见别人美好生活!】
Resources
Stars
Watchers
Forks
Languages
JavaScript
98.9%
Python
1.1%
You can’t perform that action at this time.