使用 python 使用 api 的 Twitter 抓取标签
twitter crawling hashtag with api for using python
我想在 Twitter 中抓取 10000 条推文,包含带有主题标签的特定词。
例如,包含标签,#love like this。
并抓取推文中的所有主题标签。
例如,一条推文是这样存在的。
[我困了#boring #tired #sleep]
我想抓取数据,然后看到这样的结果。
“#boring”“#tired”“#sleep”
我希望能理解我在说什么。
我尝试使用 Twitter API 为 python 抓取主题标签。
但有一些错误
我的代码如下:
from tweepy.streaming import StreamListener
from tweepy import OAuthHandler
from tweepy import Stream
#Variables that contains the user credentials to access Twitter API
access_token = "mytoken"
access_token_secret = "mytokenscret"
consumer_key = "consumerkey"
consumer_secret = "consumersecret"
class StdOutListener(StreamListener):
def on_data(self, data):
print data
return True
def on_error(self, status):
print status
if __name__ == '__main__':
l = StdOutListener()
auth = OAuthHandler(consumer_key, consumer_secret)
auth.set_access_token(access_token, access_token_secret)
stream = Stream(auth, l)
stream.filter(track=['#happy'])
当我运行这段代码时,有这样的弹出窗口。
我该如何解决这个问题,以及如何抓取推文中包含特定主题标签的所有主题标签。
我尝试了 python 3.3.4 和 windows 8.1 64x。
请帮帮我。
感谢阅读我的问题。
您似乎正在使用 Python 3.0+,因此您不能使用 print "Hello world"
,您需要使用 print("Hello world")
,因此只需将打印调用更改为带有括号即可。
我想在 Twitter 中抓取 10000 条推文,包含带有主题标签的特定词。
例如,包含标签,#love like this。
并抓取推文中的所有主题标签。
例如,一条推文是这样存在的。
[我困了#boring #tired #sleep]
我想抓取数据,然后看到这样的结果。
“#boring”“#tired”“#sleep”
我希望能理解我在说什么。
我尝试使用 Twitter API 为 python 抓取主题标签。
但有一些错误
我的代码如下:
from tweepy.streaming import StreamListener
from tweepy import OAuthHandler
from tweepy import Stream
#Variables that contains the user credentials to access Twitter API
access_token = "mytoken"
access_token_secret = "mytokenscret"
consumer_key = "consumerkey"
consumer_secret = "consumersecret"
class StdOutListener(StreamListener):
def on_data(self, data):
print data
return True
def on_error(self, status):
print status
if __name__ == '__main__':
l = StdOutListener()
auth = OAuthHandler(consumer_key, consumer_secret)
auth.set_access_token(access_token, access_token_secret)
stream = Stream(auth, l)
stream.filter(track=['#happy'])
当我运行这段代码时,有这样的弹出窗口。
我该如何解决这个问题,以及如何抓取推文中包含特定主题标签的所有主题标签。
我尝试了 python 3.3.4 和 windows 8.1 64x。
请帮帮我。
感谢阅读我的问题。
您似乎正在使用 Python 3.0+,因此您不能使用 print "Hello world"
,您需要使用 print("Hello world")
,因此只需将打印调用更改为带有括号即可。