如何从 nltk 下载程序中删除 data/models?

How to remove an data/models from nltk dowloader?

我在 python3 NLTK(通过 nltk.download())中安装了一些 NLTK 包,尝试了它们并且 - 不需要它们 - 现在想删除它们。

如何从我的 NLTK 安装中删除包 large_grammars 等? (我不想删除完整的 NLTK 安装!)

默认情况下,NLTK packages/data 保存在 nltk_data 目录中。

首先,您必须找到目录可能所在的位置:

>>> import nltk
>>> nltk.data.path
['/home/alvas/nltk_data', '/usr/share/nltk_data', '/usr/local/share/nltk_data', '/usr/lib/nltk_data', '/usr/local/lib/nltk_data']

检查 nltk_data 的确切位置:

>>> import os
>>> next(p for p in nltk.data.path if os.path.exists(p))
'/home/alvas/nltk_data'

在 linux 上,只需转到命令行上的目录:

$ cd /home/alvas/nltk_data/
$ ls
corpora  grammars  tokenizers
$ cd grammars/
$ ls
large_grammars  large_grammars.zip
$ rm -rf large_grammars 
$ rm large_grammars.zip