找出推文来自哪个短语

Find out from which phrase a tweet is coming from

我有关注流,当我收到推文时,我想找出我从以下哪个短语和用户那里收到了推文。

stream.filter(track=['python', 'javascript', 'ruby'],follow=['#foo','#bar'])

Twitter api 或 tweepy 上是否有任何支持。如果不是,最好的手动方式是什么?

Here 是一个例子,当收到推文时,我想知道这是因为 python 短语或 javascript 或 ruby 或甚至是所有这些的组合

我认为混淆在于实际理解 Streaming API。

一旦您打开符合您要求的连接,例如 stream.filter(track=['python', 'javascript', 'ruby'],follow=['#foo','#bar']),Twitter 将向您发送符合该条件的所有推文(在其指定限制内​​)。他们不会进行任何类型的分离,您会立即收到所有东西。

你可以做的是为那些词过滤(标记化)每条推文,这可以在你收集到你想要的推文数量后完成,或者通过某种类型的流式实时方法来完成。

根据您提供的示例,他对推文进行了 post 处理,并根据他在收集期间收到的所有数据绘制了提及频率。

我希望这能澄清事情。