opencv C++ 神经网络 predict() 函数抛出 "Bad argument" 错误

opencv C++ neural network predict() function throws "Bad argument" error

我成功地训练了一个神经网络来识别图像中的数字,并将网络参数保存到一个 .xml 文件中。

但是,当针对新图像测试网络时,代码在 predict() 阶段失败并出现错误:

OpenCV Error: Bad argument (Both input and output must be floating-point matrices of the same type and have the same number of rows) in CvANN_MLP::predict, file ........\opencv\modules\ml\src\ann_mlp.cpp, line 279.

ann_mlp.cpp 第 279 行是:

if( !CV_IS_MAT(_inputs) || !CV_IS_MAT(_outputs) ||
    !CV_ARE_TYPES_EQ(_inputs,_outputs) ||
    (CV_MAT_TYPE(_inputs->type) != CV_32FC1 &&
    CV_MAT_TYPE(_inputs->type) != CV_64FC1) ||
    _inputs->rows != _outputs->rows )
    CV_Error( CV_StsBadArg, "Both input and output must be floating-point matrices "
                            "of the same type and have the same number of rows" );

我已经通过 运行 这段代码检查了输入行:

cv::Size s = newVec.size();
    int rows = s.height;
    int cols = s.width;
    cout << "newVec dimensions: " << rows << " x " << cols << endl;

...结果是预期的 1 x 900 向量/矩阵。

我已经按照错误对话框将输入和输出矩阵设置为 CV_32FC1,如下所示:

输入矩阵

cv::Mat newVec(1, 900, CV_32FC1);
    newVec = crop_img.reshape(0, 1); //reshape / unroll image to vector
    CvMat n = newVec;
    newVec = cv::Mat(&n);

输出矩阵

    cv::Mat classOut = cvCreateMatHeader(1, CLASSES, CV_32FC1);

然后我尝试运行这样的预测函数:

CvANN_MLP* nnetwork = new CvANN_MLP;
nnetwork->load("nnetwork.xml", "nnetwork");

int maxIndex = 0;
cv::Mat classOut = cvCreateMatHeader(1, CLASSES, CV_32FC1);

//prediction
nnetwork->predict(newVec, classOut);
    float value;
    float maxValue = classOut.at<float>(0, 0);
    for (int index = 1; index<CLASSES; index++)
    {
        value = classOut.at<float>(0, index);
        if (value>maxValue)
        {
            maxValue = value;
            maxIndex = index;
        }
    }

有什么想法吗?非常感谢...

我怀疑问题出在你的输入上,而不是你的输出上。

首先,重要的是要了解 OpenCV 应该为此承担很多责任,而不是你。他们的C++API相当平庸,给你造成了很大的困惑。

看,通常在 C++ 中,当您定义一个 1x900 的浮点矩阵时,它保持一个浮点矩阵。 C++ 具有很强的类型安全性。

OpenCV 没有。如果将字节矩阵分配给浮点矩阵,后者将更改其类型(!)。 您的代码将 newVec 初始化为这样一个浮点矩阵,然后分配第二个矩阵,然后再分配另一个矩阵。我怀疑 crop_img 仍然是一个图像,即 8 位。重塑它会使它成为 1x900,但不是浮点数。那是 .convertTo 的工作。