测试最大熵分类器

Test Maximum Entropy classifier

是否可以在不创建包含所有特征的外部文件的情况下通过斯坦福最大熵分类器对新数据进行分类?

换句话说,我有一个以下格式的测试文件:

token1 \t feature1_1 \t ... \t feature1_N \t goldLabel1

...

tokenM \t featureM_1 \t ... \t featureM_N \t goldLabelM

我想知道是否可以使用数据结构来包含测试数据 无需创建外部文件。

如果您查看此方法(ColumnDataClassifier 中的第 409 行)

private Pair<GeneralDataset<String,String>, List<String[]>> readDataset(String filename, boolean inTestPhase) {

您可以看到代码如何从文件路径转到 Pair<GeneralDataset<String,String>, List<String[]>>

这是评估所需的关键数据对象。

如果查看此方法(ColumnDataClassifier 中的第 2158 行),您可以了解评估是如何完成的

public Pair<Double, Double> testClassifier(String testFile) {

如果查看 main() 方法(第 2011 行),您将看到正在构建的 ColumnDataClassifier 示例。

通过查看这三种方法,您可以编写额外的代码来执行您想要执行的操作并避免写入磁盘。