找出推文来自哪个短语
Find out from which phrase a tweet is coming from
我有关注流,当我收到推文时,我想找出我从以下哪个短语和用户那里收到了推文。
stream.filter(track=['python', 'javascript', 'ruby'],follow=['#foo','#bar'])
Twitter api 或 tweepy 上是否有任何支持。如果不是,最好的手动方式是什么?
Here 是一个例子,当收到推文时,我想知道这是因为 python 短语或 javascript 或 ruby 或甚至是所有这些的组合
我认为混淆在于实际理解 Streaming API。
一旦您打开符合您要求的连接,例如 stream.filter(track=['python', 'javascript', 'ruby'],follow=['#foo','#bar'])
,Twitter 将向您发送符合该条件的所有推文(在其指定限制内)。他们不会进行任何类型的分离,您会立即收到所有东西。
你可以做的是为那些词过滤(标记化)每条推文,这可以在你收集到你想要的推文数量后完成,或者通过某种类型的流式实时方法来完成。
根据您提供的示例,他对推文进行了 post 处理,并根据他在收集期间收到的所有数据绘制了提及频率。
我希望这能澄清事情。
我有关注流,当我收到推文时,我想找出我从以下哪个短语和用户那里收到了推文。
stream.filter(track=['python', 'javascript', 'ruby'],follow=['#foo','#bar'])
Twitter api 或 tweepy 上是否有任何支持。如果不是,最好的手动方式是什么?
Here 是一个例子,当收到推文时,我想知道这是因为 python 短语或 javascript 或 ruby 或甚至是所有这些的组合
我认为混淆在于实际理解 Streaming API。
一旦您打开符合您要求的连接,例如 stream.filter(track=['python', 'javascript', 'ruby'],follow=['#foo','#bar'])
,Twitter 将向您发送符合该条件的所有推文(在其指定限制内)。他们不会进行任何类型的分离,您会立即收到所有东西。
你可以做的是为那些词过滤(标记化)每条推文,这可以在你收集到你想要的推文数量后完成,或者通过某种类型的流式实时方法来完成。
根据您提供的示例,他对推文进行了 post 处理,并根据他在收集期间收到的所有数据绘制了提及频率。
我希望这能澄清事情。