tm 包中函数 DocumentTermMarix 的默认控制设置是什么?

What are the default control settings for the function DocumentTermMarix from the package tm?

当我调查生成的 dtm 矩阵时,我发现标记是小写的,除非设置被设置为 False。此外,带下划线的词在标记化之前被拆分。

当我查找 documentation 时,我无法检索到默认设置,或者如果没有提供明确的控制则使用了哪些设置。

我在哪里可以找到这个?

DocumentTermMatrix 的文档说 "see termFreq for available local control options."

如果你这样做:

?termFreq

您将看到所有可能的默认选项(包括您所指的 "Defaults to tolower")。