如何在 Mallet 中使用双精度数组作为特征向量
How to use array of doubles as feature vector in Mallet
根据我在文档和各种示例中看到的内容,
Mallet 中典型的数据工作流要求您处理通常通过 "pipes" 传递数据而获得的特征列表,同时使用某种迭代器迭代它们。数据通常存储在一些 csv 文件中。
我正在尝试从两个双精度数组中获取特征列表。
一个数组存储实际特征,大小为 n x m(其中 n 是特征数量,m 是特征向量的数量),另一个数组大小为 1 x m,包含二进制标签。我应该如何将它们转换为特征列表,以便我可以在分类器中使用它们。
我最终编写了类似于 Mullet 中名为 "ArrayDataAndTargetIterator" 的自定义迭代器。我还必须使用这样定义的管道:
new SerialPipes(Arrays.asList(new Target2Label(), new Array2FeatureVector()));
根据我在文档和各种示例中看到的内容, Mallet 中典型的数据工作流要求您处理通常通过 "pipes" 传递数据而获得的特征列表,同时使用某种迭代器迭代它们。数据通常存储在一些 csv 文件中。
我正在尝试从两个双精度数组中获取特征列表。 一个数组存储实际特征,大小为 n x m(其中 n 是特征数量,m 是特征向量的数量),另一个数组大小为 1 x m,包含二进制标签。我应该如何将它们转换为特征列表,以便我可以在分类器中使用它们。
我最终编写了类似于 Mullet 中名为 "ArrayDataAndTargetIterator" 的自定义迭代器。我还必须使用这样定义的管道:
new SerialPipes(Arrays.asList(new Target2Label(), new Array2FeatureVector()));