将大小不等的宽数据框重塑为长格式
Reshape wide dataframe of unequal size to long format
我已经开始进行情绪分析,但在将词典转换为所需格式时遇到问题
我的数据是这样的:
word
alternativeform1
alternativeform2
value
abmachen
abgemacht
abmachst
0.4
Aktualisierung
Aktualisierungen
NA
0.2
我需要它看起来像这样
word
value
abmachen
0.4
abgemacht
0.4
abmachst
0.4
Aktualisierung
0.2
Aktualisierungen
0.2
你能帮我找到简单的方法吗?非常感谢:)
你可以使用
library(dplyr)
library(tidyr)
df %>%
pivot_longer(-value, values_to = "word") %>%
drop_na(word) %>%
select(word, value)
这个returns
# A tibble: 5 x 2
word value
<chr> <dbl>
1 abmachen 0.4
2 abgemacht 0.4
3 abmachst 0.4
4 Aktualisierung 0.2
5 Aktualisierungen 0.2
我已经开始进行情绪分析,但在将词典转换为所需格式时遇到问题
我的数据是这样的:
word | alternativeform1 | alternativeform2 | value |
---|---|---|---|
abmachen | abgemacht | abmachst | 0.4 |
Aktualisierung | Aktualisierungen | NA | 0.2 |
我需要它看起来像这样
word | value |
---|---|
abmachen | 0.4 |
abgemacht | 0.4 |
abmachst | 0.4 |
Aktualisierung | 0.2 |
Aktualisierungen | 0.2 |
你能帮我找到简单的方法吗?非常感谢:)
你可以使用
library(dplyr)
library(tidyr)
df %>%
pivot_longer(-value, values_to = "word") %>%
drop_na(word) %>%
select(word, value)
这个returns
# A tibble: 5 x 2
word value
<chr> <dbl>
1 abmachen 0.4
2 abgemacht 0.4
3 abmachst 0.4
4 Aktualisierung 0.2
5 Aktualisierungen 0.2