使用 R 从推文中抓取图像
Scrape images from tweets using R
我很想用某人发布的图片创建一个 twitter-blogdown 博客,但我不确定是否可行。我使用 'twitteR' 从一个人那里抓取了所有帖子,但看起来我必须做一些完全不同的事情才能获取图像而不是文本。
任何关于采取什么方向的建议都将不胜感激。
这是一个相当宽泛的问题,但这里有一些想法。
首先:我推荐使用rtweet包。根据我的经验,它使身份验证变得更加容易,并且 returns 数据结构易于使用。
举个例子,下面是我如何按照包文档中的描述设置身份验证后获取我自己的最后 100 条推文:
library(rtweet)
library(dplyr)
neilfws <- get_timeline("neilfws", n = 100)
neilfws %>%
glimpse()
media_id
列表示推文是否有附加媒体,如果没有,则值为NA。所以快速计算有多少行有媒体:
neilfws %>%
filter(!is.na(media_id) %>%
nrow()
给媒体的link在media_url
栏中。所以这是与我的推文相关的前 6 张图片:
neilfws %>%
filter(!is.na(media_id)) %>%
select(media_url) %>%
head()
1 http://pbs.twimg.com/media/DHzGbvyVoAAm8in.jpg
2 http://pbs.twimg.com/media/DHfc4idV0AA6qyc.jpg
3 http://pbs.twimg.com/media/DHfNamEVYAA5H_U.jpg
4 http://pbs.twimg.com/media/DHYuG1oUwAADV-z.jpg
5 http://pbs.twimg.com/media/DHQlEQqUAAAHoCK.jpg
6 http://pbs.twimg.com/media/DHLG_ESUMAAMURj.jpg
现在您有了媒体 URL,您可以编写代码来检索或显示它们。
我很想用某人发布的图片创建一个 twitter-blogdown 博客,但我不确定是否可行。我使用 'twitteR' 从一个人那里抓取了所有帖子,但看起来我必须做一些完全不同的事情才能获取图像而不是文本。
任何关于采取什么方向的建议都将不胜感激。
这是一个相当宽泛的问题,但这里有一些想法。
首先:我推荐使用rtweet包。根据我的经验,它使身份验证变得更加容易,并且 returns 数据结构易于使用。
举个例子,下面是我如何按照包文档中的描述设置身份验证后获取我自己的最后 100 条推文:
library(rtweet)
library(dplyr)
neilfws <- get_timeline("neilfws", n = 100)
neilfws %>%
glimpse()
media_id
列表示推文是否有附加媒体,如果没有,则值为NA。所以快速计算有多少行有媒体:
neilfws %>%
filter(!is.na(media_id) %>%
nrow()
给媒体的link在media_url
栏中。所以这是与我的推文相关的前 6 张图片:
neilfws %>%
filter(!is.na(media_id)) %>%
select(media_url) %>%
head()
1 http://pbs.twimg.com/media/DHzGbvyVoAAm8in.jpg
2 http://pbs.twimg.com/media/DHfc4idV0AA6qyc.jpg
3 http://pbs.twimg.com/media/DHfNamEVYAA5H_U.jpg
4 http://pbs.twimg.com/media/DHYuG1oUwAADV-z.jpg
5 http://pbs.twimg.com/media/DHQlEQqUAAAHoCK.jpg
6 http://pbs.twimg.com/media/DHLG_ESUMAAMURj.jpg
现在您有了媒体 URL,您可以编写代码来检索或显示它们。