r tm 在排序操作后提取文档 ID
r tm extract doc ids after sort operation
我对这个问题心存疑虑。我正在从 tm::dtm
中提取最常用的词,如下所示:
> s1<-sort(rowSums(as.matrix(dtm10[,])), decreasing=TRUE)
我得到:
290 429 318 125 128 425 431 153 52 385 144 491 126 423 111 130 492 163 176 391
916 875 860 851 844 823 822 766 759 743 701 700 686 673 670 669 663 658 652 623`
但是文档 ID 和 rowSums
在一个元组中。
> s1[2]
429
875
其中 429 是 doc id,rowsum 是 875。我没有进一步使用 rowSums
,如何获得排序后的 doc id 列表?我正在寻找像这样的矢量输出:
290 429 318 125 128 425 431 153 52 385 144 491 126 423 111 130 492 163 176 391
非常感谢。
s1
是一个命名向量,名称为 290、429、318 等,值如 916,875、860 等。
要仅提取 s1
的名称,我们可以使用
names(s1)
这会给出:
#290 429 318 125 128 425 431 153 52 385 144 491 126 423 111 130 492 163 176 391
我对这个问题心存疑虑。我正在从 tm::dtm
中提取最常用的词,如下所示:
> s1<-sort(rowSums(as.matrix(dtm10[,])), decreasing=TRUE)
我得到:
290 429 318 125 128 425 431 153 52 385 144 491 126 423 111 130 492 163 176 391
916 875 860 851 844 823 822 766 759 743 701 700 686 673 670 669 663 658 652 623`
但是文档 ID 和 rowSums
在一个元组中。
> s1[2]
429
875
其中 429 是 doc id,rowsum 是 875。我没有进一步使用 rowSums
,如何获得排序后的 doc id 列表?我正在寻找像这样的矢量输出:
290 429 318 125 128 425 431 153 52 385 144 491 126 423 111 130 492 163 176 391
非常感谢。
s1
是一个命名向量,名称为 290、429、318 等,值如 916,875、860 等。
要仅提取 s1
的名称,我们可以使用
names(s1)
这会给出:
#290 429 318 125 128 425 431 153 52 385 144 491 126 423 111 130 492 163 176 391