如何使用 R 从多个用户的时间线中提取所有推文?
How to extract all tweets from multiple users' timelines using R?
我正在做一个项目,我想为它提取大约 500 个不同的 Twitter 用户的时间线(我用它来进行历史分析,所以我只需要检索它们一次——不需要更新与传入的推文)。
虽然我知道 Twitter API 只允许检索最后的 3,200 条推文,但当我使用 R twitteR 包的基本 UserTimeline 方法时,我似乎每次尝试只能获取大约 20 条(对于拥有更多、最近的推文的用户)。这是因为速率限制,还是因为我做错了什么?
有没有人有最有效地执行此操作的提示?我意识到由于速率限制可能会花费很多时间,在 R 中是否有 automating/iterating 这个过程的方法?
我很困惑,所以非常感谢你 help/tips 你可能有!
(我有一些使用 Twitter API/twitteR 包提取使用特定主题标签的推文几天的经验。我有基本的 Python 技能,如果结果是 easier/quicker 在 Python 中执行)。
看起来 twitteR documentation 建议使用 maxID
参数进行分页。因此,当您获得第一批结果时,您可以使用该集合中的最小 ID 减去一个作为下一个请求的 maxID
,直到您不再返回任何结果(意味着您已经开始用户的时间轴)。
我正在做一个项目,我想为它提取大约 500 个不同的 Twitter 用户的时间线(我用它来进行历史分析,所以我只需要检索它们一次——不需要更新与传入的推文)。
虽然我知道 Twitter API 只允许检索最后的 3,200 条推文,但当我使用 R twitteR 包的基本 UserTimeline 方法时,我似乎每次尝试只能获取大约 20 条(对于拥有更多、最近的推文的用户)。这是因为速率限制,还是因为我做错了什么?
有没有人有最有效地执行此操作的提示?我意识到由于速率限制可能会花费很多时间,在 R 中是否有 automating/iterating 这个过程的方法?
我很困惑,所以非常感谢你 help/tips 你可能有!
(我有一些使用 Twitter API/twitteR 包提取使用特定主题标签的推文几天的经验。我有基本的 Python 技能,如果结果是 easier/quicker 在 Python 中执行)。
看起来 twitteR documentation 建议使用 maxID
参数进行分页。因此,当您获得第一批结果时,您可以使用该集合中的最小 ID 减去一个作为下一个请求的 maxID
,直到您不再返回任何结果(意味着您已经开始用户的时间轴)。