仅过滤英文推文时出错
Error while filtering english language tweets only
我正在提取仅用英语编写的推文,并且我使用了以下过滤器
stream.filter(stall_warnings=True, track=['#brain'], languages=['en'])
但不幸的是,这个过滤器 returns 一条包含英语和其他语言的推文
请看推文here
如何提取只用英语写的推文?
注意:如链接错误,请见谅。
推文由 Twitter 以一种或另一种语言分类。他们的分类并不总是正确的。如果推文使用多种语言,他们只会将其分配给其中一种语言。
因此,您需要在您的应用中根据字典或使用某些语言检测库来过滤它们,以 100% 确保您收到的推文仅使用英语。
来源:https://blog.twitter.com/2013/introducing-new-metadata-for-tweets
我正在提取仅用英语编写的推文,并且我使用了以下过滤器
stream.filter(stall_warnings=True, track=['#brain'], languages=['en'])
但不幸的是,这个过滤器 returns 一条包含英语和其他语言的推文
请看推文here
如何提取只用英语写的推文?
注意:如链接错误,请见谅。
推文由 Twitter 以一种或另一种语言分类。他们的分类并不总是正确的。如果推文使用多种语言,他们只会将其分配给其中一种语言。
因此,您需要在您的应用中根据字典或使用某些语言检测库来过滤它们,以 100% 确保您收到的推文仅使用英语。
来源:https://blog.twitter.com/2013/introducing-new-metadata-for-tweets