从生成的聊天中抓取带有时间戳的文本数据 window

Scraping text data with timestamps from a generated chat window

我想从 Twitch 剪辑中抓取 聊天数据。这就像保存的直播剪辑,您可以在其中看到人们在那一刻的反应。我们可以以此为例:

https://clips.twitch.tv/BenevolentPunchyLyrebirdMingLee

因此,如果我使用查询选择器观看视频直到结束,我可以提取所有数据。然而,我想做的是写一个 scraper 它获取剪辑的 link 并输出带有时间戳的原始文本数据。

我搜索了 Twitch.com 的 API,但没有关于剪辑的任何内容。

最后,我创建了这个小 Python 脚本来获取给定 Twitch Clip 的聊天数据。

显然,您可以使用 API 调用获取给定视频的聊天数据:https://api.twitch.tv/v5/videos/$VODID/comments?cursor=$NEXT

其中 vodid 是剪辑视频的 ID,光标的工作方式如下:

您可以按块获取聊天数据,每个块都有一个指示下一个块的游标值。因此,您可以继续获取下一个块,直到找到剪辑的偏移量匹配的偏移量,并且 writing/keeping 聊天数据直到它抑制剪辑的持续时间。

如果有人需要:

https://github.com/OgulcanCelik/twitch-clip-chat