尽管文件路径正确,但 DirSource 返回空目录错误

DirSource returning empty directory error despite correct file path

这似乎是一个非常基本的问题。文件路径有效,我可以在 R 中使用其他方式打开文件,但我希望使用 tm 库。

docs <- Corpus(DirSource("C:/Users/xyz/Work/test.corpus.txt"), encoding = "UTF-8"))

抛出错误:

Error in inherits(x, "Source") : empty directory

编辑:

这适用于原始方法:

docs <- Corpus(DirSource("C:/Users/xyz/Work/"), encoding = "UTF-8"))

显然您不能指定单个文件名。解决方案是通过另一种方法读取文件,然后使用另一种源类型,例如 VectorSource。

您可以指定一个模式,以便 DirSource 只选择具有该模式的文件。所有 txt 文件的 pattern = ".txt"。或者,如果需要,pattern = "test.corpus.txt"。如下所示。

docs <- Corpus(DirSource("C:/Users/xyz/Work/", pattern = "test.corpus.txt", encoding = "UTF-8")