找出推文来自哪个短语

Question

我有关注流，当我收到推文时，我想找出我从以下哪个短语和用户那里收到了推文。

stream.filter(track=['python', 'javascript', 'ruby'],follow=['#foo','#bar'])

Twitter api 或 tweepy 上是否有任何支持。如果不是，最好的手动方式是什么？

Here 是一个例子，当收到推文时，我想知道这是因为 python 短语或 javascript 或 ruby 或甚至是所有这些的组合

Answer 1

我认为混淆在于实际理解 Streaming API。

一旦您打开符合您要求的连接，例如 stream.filter(track=['python', 'javascript', 'ruby'],follow=['#foo','#bar'])，Twitter 将向您发送符合该条件的所有推文（在其指定限制内）。他们不会进行任何类型的分离，您会立即收到所有东西。

你可以做的是为那些词过滤（标记化）每条推文，这可以在你收集到你想要的推文数量后完成，或者通过某种类型的流式实时方法来完成。

根据您提供的示例，他对推文进行了 post 处理，并根据他在收集期间收到的所有数据绘制了提及频率。

我希望这能澄清事情。

找出推文来自哪个短语

Find out from which phrase a tweet is coming from

python

twitter

tweepy