Select 或在数据框中提取带 # 的单词
Select or extract words with a # in dataframe
我最近开始用 R 分析数据,所以我离好的还很远:
我在 instagram 上收集了 posts,一个变量(行)给我每个 post 的 "title"。此标题是描述和分配的主题标签的组合。
我只对主题标签感兴趣,想 select,仅使用主题标签提取或创建新变量。
我不熟悉分析字符变量,所以欢迎任何帮助!
使用虚拟数据在黑暗中拍摄
# Dummy data
data <- data.frame(title = c("#foo #bar",
"#qwerty #dvorak",
"#R>python"))
data$title <- as.character(data$title)
data
title
1 #foo #bar
2 #qwerty #dvorak
3 #R>python
# Extract hashtags
grep("#", unlist(strsplit(data$title, " ")), value = TRUE)
[1] "#foo" "#bar" "#qwerty" "#dvorak" "#R>python"
我最近开始用 R 分析数据,所以我离好的还很远:
我在 instagram 上收集了 posts,一个变量(行)给我每个 post 的 "title"。此标题是描述和分配的主题标签的组合。
我只对主题标签感兴趣,想 select,仅使用主题标签提取或创建新变量。 我不熟悉分析字符变量,所以欢迎任何帮助!
使用虚拟数据在黑暗中拍摄
# Dummy data
data <- data.frame(title = c("#foo #bar",
"#qwerty #dvorak",
"#R>python"))
data$title <- as.character(data$title)
data
title
1 #foo #bar
2 #qwerty #dvorak
3 #R>python
# Extract hashtags
grep("#", unlist(strsplit(data$title, " ")), value = TRUE)
[1] "#foo" "#bar" "#qwerty" "#dvorak" "#R>python"