Select 或在数据框中提取带 # 的单词

Select or extract words with a # in dataframe

我最近开始用 R 分析数据,所以我离好的还很远:

我在 instagram 上收集了 posts,一个变量(行)给我每个 post 的 "title"。此标题是描述和分配的主题标签的组合。

我只对主题标签感兴趣,想 select,仅使用主题标签提取或创建新变量。 我不熟悉分析字符变量,所以欢迎任何帮助!

使用虚拟数据在黑暗中拍摄

# Dummy data
data <- data.frame(title = c("#foo #bar",
                             "#qwerty #dvorak",
                             "#R>python"))
data$title <- as.character(data$title)
data
            title
1       #foo #bar
2 #qwerty #dvorak
3       #R>python

# Extract hashtags
grep("#", unlist(strsplit(data$title, " ")), value = TRUE)
[1] "#foo"      "#bar"      "#qwerty"   "#dvorak"   "#R>python"