twitter_samples 在语料库和下载中

twitter_samples in both corpus and download

我正在尝试实施一个基本的 Twitter 情绪分析项目。为此,我从语料库 twitter_samples 中导入如下

from nltk.corpus import twitter_samples

但是还需要使用下面的命令;

nltk.download('twitter_samples')

才能正常工作。

我的直觉是,from nltk.corpus import twitter_samples 中的 twitter_samples 是一个函数,nltk.download('twitter_samples') 中的 twitter_samples 是数据集。我是正确的还是别的什么?请解释。还有什么具体原因可以说明为什么两者的名称 twitter_samples 相同?

两种情况都使用相同名称的原因是您只需下载一次。 Post 你可以直接使用 import 语句。

nltk 有大量的产品,可能并不是每个人都需要所有的产品,因此您必须下载您想要的东西(每个环境只能下载一次),然后使用 import 语句使用它。