什么是 ('/tmp/text8') gensim

what is ('/tmp/text8') gensim

我正在实施包含该行的 gensim http://rare-technologies.com/deep-learning-with-word2vec-and-gensim/ 教程 sentences = word2vec.Text8Corpus('/tmp/text8') 然而,当我 运行 程序时,我得到了 text8 不存在的错误。查看代码,我发现 Text8Corpus 是一种接受参数类型对象的方法。说明表明应该通过

http://mattmahoney.net/dc/text8.zip

当我手动下载此文件并尝试传递生成的 imbd 未压缩数据集时,我被告知权限被拒绝。有没有人对这个问题有任何见解?我应该是自己下载了 imdb 数据集,还是应该在代码中有一些自动执行的指针?

正如他在描述中所说,您需要将文件下载并解压到/tmp 目录。你可以这样做:

 wget http://mattmahoney.net/dc/text8.zip -P /tmp
 unzip text8.zip

现在你应该没问题了 ;)