在推特上历史搜索相关推文

Search twitter historically for relevant tweets

我想要与特定事件相关的所有推文,我该怎么做?粗略的搜索表明这是不可能的。虽然有一些付费解决方案。 https://gnip.com/sources/twitter/historical/ http://keyhole.co/ 有什么解决方法吗?

意图: 我正在做一个项目,让我获得与特定事件相关的所有推文。因此,我使用一些关键字进行搜索。虽然这不准确,但我稍后可以使用一些分类器来过滤噪音。

通过publicAPI,是不可能的。但是,在 Twitter 内部,您可以搜索旧推文,因此可能有使用 click/search 机器人或网络抓取的解决方法。

我会在这里推荐这个 post(和评论):

他们的 API 期限(正如我自己所做的)是 2 年。对于他们在网页上的搜索,是无限制的。

编辑:这不是代码:您可以通过他们的网站使用搜索查询自动收集数据,但您不能使用他们的 API 来这样做。我将向您介绍如何使用搜索查询来获取您想要的内容:

这不是代码:您需要使用他们网站上的搜索服务手动收集数据。

这是您的使用方式: 关键词:从,从,到

示例: 代码 from:tenderlove since:2010-01-01 until:2012-12-31

抓取用户@tenderlove(知名码农)从2010年1月1日到2012年12月31日所有含有"code"字样的推文

现在,如果您尝试使用任何 API 查询,它不会给您任何推文,因为它超出了他们的日期范围。

您可以使用 bs4 来解析您的推文并将关键字存储在某个文件或数据库中

我正在做一个类似的项目,我所做的是创建一个正则表达式来匹配关键字。