从生成的聊天中抓取带有时间戳的文本数据 window
Scraping text data with timestamps from a generated chat window
我想从 Twitch 剪辑中抓取 聊天数据。这就像保存的直播剪辑,您可以在其中看到人们在那一刻的反应。我们可以以此为例:
https://clips.twitch.tv/BenevolentPunchyLyrebirdMingLee
因此,如果我使用查询选择器观看视频直到结束,我可以提取所有数据。然而,我想做的是写一个 scraper 它获取剪辑的 link 并输出带有时间戳的原始文本数据。
我搜索了 Twitch.com 的 API,但没有关于剪辑的任何内容。
最后,我创建了这个小 Python 脚本来获取给定 Twitch Clip 的聊天数据。
显然,您可以使用 API 调用获取给定视频的聊天数据:https://api.twitch.tv/v5/videos/$VODID/comments?cursor=$NEXT
其中 vodid 是剪辑视频的 ID,光标的工作方式如下:
您可以按块获取聊天数据,每个块都有一个指示下一个块的游标值。因此,您可以继续获取下一个块,直到找到剪辑的偏移量匹配的偏移量,并且 writing/keeping 聊天数据直到它抑制剪辑的持续时间。
如果有人需要:
我想从 Twitch 剪辑中抓取 聊天数据。这就像保存的直播剪辑,您可以在其中看到人们在那一刻的反应。我们可以以此为例:
https://clips.twitch.tv/BenevolentPunchyLyrebirdMingLee
因此,如果我使用查询选择器观看视频直到结束,我可以提取所有数据。然而,我想做的是写一个 scraper 它获取剪辑的 link 并输出带有时间戳的原始文本数据。
我搜索了 Twitch.com 的 API,但没有关于剪辑的任何内容。
最后,我创建了这个小 Python 脚本来获取给定 Twitch Clip 的聊天数据。
显然,您可以使用 API 调用获取给定视频的聊天数据:https://api.twitch.tv/v5/videos/$VODID/comments?cursor=$NEXT
其中 vodid 是剪辑视频的 ID,光标的工作方式如下:
您可以按块获取聊天数据,每个块都有一个指示下一个块的游标值。因此,您可以继续获取下一个块,直到找到剪辑的偏移量匹配的偏移量,并且 writing/keeping 聊天数据直到它抑制剪辑的持续时间。
如果有人需要: