在 iOS 中检测人声的基频

detecting fundamental frequency of human voice in iOS

我对此进行了广泛的搜索,找到了许多有用的代码示例,但它们没有给我确切的结果

我需要在有人发出 a: 元音时检测人声的基频 (F0)。

然后我查看这些代码示例;

https://github.com/krafter/DetectingAudioFrequency 来自克拉夫特 https://github.com/syedhali/EZAudio

但其中 none 给了我基频,它们都给出了最强的频率,所以这通常等于 F2 或 F3 谐波。 我需要帮助通过修改代码来使用此代码示例计算基频。

您无法修改 FFT 峰值检测器以进行正确的音调估计。这是错误的算法。相反,尝试自相关,或这个问题的答案之一:how to know the fundamental frequency is right detected by fft/lomb-scargle?