Mac Os 上的 nltk 语料库位置
nltk corpus location on Mac Os
拜托,有人在 Mac OS 上使用 Eclipse IDE 上的 nltk 吗?我正在尝试定位 nltk 语料库数据的存储位置。我做了一些挖掘,发现它们位于我的机器上的这条路径中:
/Library/Frameworks/Python.framework/Versions/2.7/lib/python2.7/site-packages/nltk/init.pyc
但是当我进入 nltk 目录时,我发现了一个语料库文件夹,但里面与语料库没有任何相似之处。有人知道下一步该怎么做吗?
Corpora 没有作为基础 nltk
包的一部分分发,因为并非该模块的所有用户都需要它们,而且其中很多都非常大 - 最后我检查了一下,有一个被列为1.7 GB,对于任何人来说都不是一个简单的下载。
但是,如果您阅读了出色的 NLTK docs,您将立即了解如何 select 下载语料库:
>>> import nltk
>>> nltk.download()
这将打开一个很好的基于 Tk 的 GUI(在适当的环境中)或一个基于文本的 GUI,并允许您搜索、select、下载感兴趣的语料库,甚至获取所有内容,这在技术含量很高的圈子里被称为 "the whole shebang." 您甚至可以选择用于存储刚下载的语料库的目录。简单!
您以某种方式找到的 corpus
目录包含 nltk.corpus
的源代码,其中包含处理语料库的工具,而不是实际的语料库本身。
在 MacOS 上,它似乎默认为您的主目录,因此 /Users/X/nltk_data
。但是,这取决于您安装它的位置。根据 MattDMo 的评论,如果您找不到所需的内容,打开 GUI 可以为您提供更多答案:
import nltk
nltk.download()
如果您只想将它安装在特定位置,请考虑命令行选项(这对 Docker 和脚本也很有用):
python3 -m nltk.downloader -d /Users/X/nltk_data all
拜托,有人在 Mac OS 上使用 Eclipse IDE 上的 nltk 吗?我正在尝试定位 nltk 语料库数据的存储位置。我做了一些挖掘,发现它们位于我的机器上的这条路径中: /Library/Frameworks/Python.framework/Versions/2.7/lib/python2.7/site-packages/nltk/init.pyc 但是当我进入 nltk 目录时,我发现了一个语料库文件夹,但里面与语料库没有任何相似之处。有人知道下一步该怎么做吗?
Corpora 没有作为基础 nltk
包的一部分分发,因为并非该模块的所有用户都需要它们,而且其中很多都非常大 - 最后我检查了一下,有一个被列为1.7 GB,对于任何人来说都不是一个简单的下载。
但是,如果您阅读了出色的 NLTK docs,您将立即了解如何 select 下载语料库:
>>> import nltk
>>> nltk.download()
这将打开一个很好的基于 Tk 的 GUI(在适当的环境中)或一个基于文本的 GUI,并允许您搜索、select、下载感兴趣的语料库,甚至获取所有内容,这在技术含量很高的圈子里被称为 "the whole shebang." 您甚至可以选择用于存储刚下载的语料库的目录。简单!
您以某种方式找到的 corpus
目录包含 nltk.corpus
的源代码,其中包含处理语料库的工具,而不是实际的语料库本身。
在 MacOS 上,它似乎默认为您的主目录,因此 /Users/X/nltk_data
。但是,这取决于您安装它的位置。根据 MattDMo 的评论,如果您找不到所需的内容,打开 GUI 可以为您提供更多答案:
import nltk
nltk.download()
如果您只想将它安装在特定位置,请考虑命令行选项(这对 Docker 和脚本也很有用):
python3 -m nltk.downloader -d /Users/X/nltk_data all