用于人脸验证的高斯混合模型
Gaussian Mixture Model for face verification
我尝试为 Matlab 实现主要用于说话人验证的 MSR Identity Toolkit。 This toolkit refer to this paper titled Speaker Verification Using Adapted Gaussian Mixture Models 。我正在使用 Pseudo Zernike Moments 来提取特征(每张图像 363x1)。我尝试改变混合物,但发现设置为 1 时 EER 较低 (EER=40%)。但是我不太明白它是如何执行最后一个过程的,即在试验数据和模型数据之间计算可能性得分。
在给定的Matlab脚本中,score_gmm_trials
,通过
计算每个试验数据的分数
likelihood_score(trial_number) = mean(GMM_posteriorprobability-UBM_posterior_probability);
- 分数指的是什么?
- 如何确定阈值来定义拒绝值和接受值?
- 如果数据未标记为已知或未知,如何测试模型?
- 如何阅读结果以了解我实施的内容是否正确?
您提到的分数 (likelihood_score) 是论文中等式 (2) 中描述的 log-likelihood 比率。
据我所知,找到最佳阈值取决于系统设计者,因为它可能因应用程序而异。因此,最好使用带有 showfig 选项的 compute_eer 函数绘制 DET 曲线,并查看您的系统如何在各种阈值下运行。
您需要一个带标签的试验数据集来计算获得 DET 曲线所需的误报率 (FAR) 或误报率 (FRR)。
具有较低 EER 的系统通常被认为具有更好的性能。所以如果DET曲线越接近原点,说明你的系统综合性能比较好。
虽然看起来你在处理图像数据集,但由于你使用的是 MSR Identity Toolkit,我想向你推荐以下论文:
J. Hansen 和 T. Hasan,"Speaker recognition by machines and humans," IEEE 信号处理杂志,卷。 2015年,没有。 6,第 74--99 页,2015 年。
本文详细解释了说话人识别过程的一般流程以及该领域使用的一些著名算法和性能指标。
希望对您有所帮助!
我尝试为 Matlab 实现主要用于说话人验证的 MSR Identity Toolkit。 This toolkit refer to this paper titled Speaker Verification Using Adapted Gaussian Mixture Models 。我正在使用 Pseudo Zernike Moments 来提取特征(每张图像 363x1)。我尝试改变混合物,但发现设置为 1 时 EER 较低 (EER=40%)。但是我不太明白它是如何执行最后一个过程的,即在试验数据和模型数据之间计算可能性得分。
在给定的Matlab脚本中,score_gmm_trials
,通过
likelihood_score(trial_number) = mean(GMM_posteriorprobability-UBM_posterior_probability);
- 分数指的是什么?
- 如何确定阈值来定义拒绝值和接受值?
- 如果数据未标记为已知或未知,如何测试模型?
- 如何阅读结果以了解我实施的内容是否正确?
您提到的分数 (likelihood_score) 是论文中等式 (2) 中描述的 log-likelihood 比率。
据我所知,找到最佳阈值取决于系统设计者,因为它可能因应用程序而异。因此,最好使用带有 showfig 选项的 compute_eer 函数绘制 DET 曲线,并查看您的系统如何在各种阈值下运行。
您需要一个带标签的试验数据集来计算获得 DET 曲线所需的误报率 (FAR) 或误报率 (FRR)。
具有较低 EER 的系统通常被认为具有更好的性能。所以如果DET曲线越接近原点,说明你的系统综合性能比较好。
虽然看起来你在处理图像数据集,但由于你使用的是 MSR Identity Toolkit,我想向你推荐以下论文: J. Hansen 和 T. Hasan,"Speaker recognition by machines and humans," IEEE 信号处理杂志,卷。 2015年,没有。 6,第 74--99 页,2015 年。 本文详细解释了说话人识别过程的一般流程以及该领域使用的一些著名算法和性能指标。
希望对您有所帮助!