训练数据和词汇表的区别——词袋

Differences between Training Data and Vocabulary - Bag Of Words

创建词袋时,您需要创建一个 Vocabulary 以提供给 BOWImgDescriptorExtractor 用于您希望输入的图像。这将创建 Testing Data.

那么 Training Data 是从哪里来的,又用在什么地方呢?

VocabularyTraining Data有什么区别?

VocabularyTraining Data 不是一回事吗?

有一个add函数用来指定训练数据。 docs on opencv bow module

训练数据 是您为应用程序收集的一组图像,作为 BOWTrainer 的输入,vocabularyBOWTrainer 的输出。获得 vocabulary 后,您可以使用 BOWImgDescriptorExtractorvocabulary 中定义的 words 提取图像特征.

一幅图像可以用大量特征(单词)来描述,但是只有其中一些是重要的。首先要做的是找到那些重要的,也就是训练一个词汇。得到词表后,可以更精确地描述图像

So where does the Training Data come from, and where do you use it?

您应该提供训练数据,并用它来训练词汇BOWTrainer训练数据 是一组图像(描述符),取决于您的应用领域。

What's the difference between Vocabulary and Training Data?

词汇是熟的,而训练数据是原始的、无组织的。

Isn't the Vocabulary the same thing as the Training Data?

没有