通过 TwitterR 去除推文中的换行符
Stripping line breaks in tweets via TwitteR
我需要帮助删除我使用 R 语言和 twitteR 包提取的推文中的换行符。这是我一直在使用的代码:
library(twitteR)
library(ROAuth)
consumer_key =''
consumer_secret = ''
access_token = ''
access_secret = ''
setup_twitter_oauth(consumer_key, consumer_secret, access_token,access_secret)
extracted_tweets2 = searchTwitter("'testword'", n=100000, lang="pt", retryOnRateLimit=120, since="2017-11-15", until="2018-01-17")
df <- do.call("rbind", lapply(extracted_tweets2, as.data.frame))
write.table(df,file="tweets1.csv", sep=";")
它 returns 下面的 .csv 格式示例:
1;Tweet text;rest of data
2;Other tweet text;rest of data
3;line
separated
tweet text;rest of data
4;Other tweet text;rest of data
与this question类似,我想删除推文 3 中的换行符。
提前致谢!
假设您所指的换行符只是回车符 return 和换行符(即 \r\n)并且您想从 df$text 列中删除它们,那么,
df <- do.call("rbind", lapply(extracted_tweets2, as.data.frame))
df$text <- gsub("[\r\n]","", df$text)
顺便说一句,twitteR 有函数 twListToDF 来巧妙地处理你正在用你的 do.call 做的事情。尝试:
df <- twListToDF(extracted_tweets2)
我需要帮助删除我使用 R 语言和 twitteR 包提取的推文中的换行符。这是我一直在使用的代码:
library(twitteR)
library(ROAuth)
consumer_key =''
consumer_secret = ''
access_token = ''
access_secret = ''
setup_twitter_oauth(consumer_key, consumer_secret, access_token,access_secret)
extracted_tweets2 = searchTwitter("'testword'", n=100000, lang="pt", retryOnRateLimit=120, since="2017-11-15", until="2018-01-17")
df <- do.call("rbind", lapply(extracted_tweets2, as.data.frame))
write.table(df,file="tweets1.csv", sep=";")
它 returns 下面的 .csv 格式示例:
1;Tweet text;rest of data
2;Other tweet text;rest of data
3;line
separated
tweet text;rest of data
4;Other tweet text;rest of data
与this question类似,我想删除推文 3 中的换行符。
提前致谢!
假设您所指的换行符只是回车符 return 和换行符(即 \r\n)并且您想从 df$text 列中删除它们,那么,
df <- do.call("rbind", lapply(extracted_tweets2, as.data.frame))
df$text <- gsub("[\r\n]","", df$text)
顺便说一句,twitteR 有函数 twListToDF 来巧妙地处理你正在用你的 do.call 做的事情。尝试:
df <- twListToDF(extracted_tweets2)