使用 python 使用 api 的 Twitter 抓取标签

twitter crawling hashtag with api for using python

我想在 Twitter 中抓取 10000 条推文,包含带有主题标签的特定词。

例如,包含标签,#love like this。

并抓取推文中的所有主题标签。

例如,一条推文是这样存在的。

[我困了#boring #tired #sleep]

我想抓取数据,然后看到这样的结果。

“#boring”“#tired”“#sleep”

我希望能理解我在说什么。

我尝试使用 Twitter API 为 python 抓取主题标签。

但有一些错误

我的代码如下:

from tweepy.streaming import StreamListener
from tweepy import OAuthHandler
from tweepy import Stream

#Variables that contains the user credentials to access Twitter API 
access_token = "mytoken"
access_token_secret = "mytokenscret"
consumer_key = "consumerkey"
consumer_secret = "consumersecret"

class StdOutListener(StreamListener):

    def on_data(self, data):
        print data
        return True

    def on_error(self, status):
        print status


if __name__ == '__main__':

    l = StdOutListener()
    auth = OAuthHandler(consumer_key, consumer_secret)
    auth.set_access_token(access_token, access_token_secret)
    stream = Stream(auth, l)
    stream.filter(track=['#happy'])

当我运行这段代码时,有这样的弹出窗口。

我该如何解决这个问题,以及如何抓取推文中包含特定主题标签的所有主题标签。

我尝试了 python 3.3.4 和 windows 8.1 64x。

请帮帮我。

感谢阅读我的问题。

您似乎正在使用 Python 3.0+,因此您不能使用 print "Hello world",您需要使用 print("Hello world"),因此只需将打印调用更改为带有括号即可。