首页
标签

text-mining

TermDocumentMatrix 的 'dictionary' 参数在 R 中不起作用
如何获取文本中匹配的 n-gram 的偏移量
语料库对象缺少文本
Scikit Learn K-means 聚类和 TfidfVectorizer：如何将 tf-idf 得分最高的前 n 个项传递给 k-means
如何使用R从pdf文档中提取标题
在特定单词和右括号之间打印文本
R：一个包含另一个时的多个匹配
如何对 pdf 文件的章节进行分类并分析每章的内容？
如何有效地定位句子中的特定单词序列
在继续进行 dtm 之前，从 data.frame 中删除带有字符 (0) 的行
将阿拉伯语句子分成单词会导致具有不同功能的不同数量的单词
如何通过文本挖掘实现文本的（统计）主题比较？
使用正则表达式从 R 中的 pdf 文档中提取所有不同的参考选项（多个 options/capture 组？）
使用正则表达式从 R 中的 pdf 中提取链接
删除包含某个子字符串的单词
手动插入特定主题的停用词
当我已经设置了文档频率上限时，不删除停用词是否不好？
软件包“Rstem”不可用（对于 R 版本 3.5.1）
Gensim Word2Vec 词汇表：输出不清晰
比较数据框中的单词并计算每对最大单词长度的矩阵

1 2 ... 10 11 12 ... 43 44

©2023 WhoseBug