尽管文件路径正确,但 DirSource 返回空目录错误
DirSource returning empty directory error despite correct file path
这似乎是一个非常基本的问题。文件路径有效,我可以在 R 中使用其他方式打开文件,但我希望使用 tm
库。
docs <- Corpus(DirSource("C:/Users/xyz/Work/test.corpus.txt"), encoding = "UTF-8"))
抛出错误:
Error in inherits(x, "Source") : empty directory
编辑:
这适用于原始方法:
docs <- Corpus(DirSource("C:/Users/xyz/Work/"), encoding = "UTF-8"))
显然您不能指定单个文件名。解决方案是通过另一种方法读取文件,然后使用另一种源类型,例如 VectorSource。
您可以指定一个模式,以便 DirSource
只选择具有该模式的文件。所有 txt 文件的 pattern = ".txt"。或者,如果需要,pattern = "test.corpus.txt"。如下所示。
docs <- Corpus(DirSource("C:/Users/xyz/Work/", pattern = "test.corpus.txt", encoding = "UTF-8")
这似乎是一个非常基本的问题。文件路径有效,我可以在 R 中使用其他方式打开文件,但我希望使用 tm
库。
docs <- Corpus(DirSource("C:/Users/xyz/Work/test.corpus.txt"), encoding = "UTF-8"))
抛出错误:
Error in inherits(x, "Source") : empty directory
编辑:
这适用于原始方法:
docs <- Corpus(DirSource("C:/Users/xyz/Work/"), encoding = "UTF-8"))
显然您不能指定单个文件名。解决方案是通过另一种方法读取文件,然后使用另一种源类型,例如 VectorSource。
您可以指定一个模式,以便 DirSource
只选择具有该模式的文件。所有 txt 文件的 pattern = ".txt"。或者,如果需要,pattern = "test.corpus.txt"。如下所示。
docs <- Corpus(DirSource("C:/Users/xyz/Work/", pattern = "test.corpus.txt", encoding = "UTF-8")