使用 Twitter 的 public API 查找相似推文

Using Twitter's public API to find similar tweets

我正在开发一个应用程序,除其他外,它试图根据推文的文本作为输入来查找相似的推文。推文的相似性将基于匹配文本的数量。我想使用 public 推特搜索 api 来完成此操作。

twitter API 提供的最接近的功能是使用 OR 运算符进行搜索。然而,这是一个 returns 看似随机排序的推文列表,其中包含任何查询词,通常匹配 'with' 或 'we' 等常用词(这是 OR 运算符的预期行为)。然而,我对包含尽可能多的匹配文本的结果以及包含输入推文特征文本的结果感兴趣(匹配常用词的相关性低于匹配不常用词)。

有什么方法可以让我使用 Twitter API 找到尽可能多的匹配词的结果?

Example of results from query with OR operators.

Twitter REST API 没有公开执行您所描述的功能的功能。您将需要捕获大量推文(可能来自 Streaming API,然后在您自己的代码中对类似推文进行 comparisons/identifications。