这个学生的 t 分布 CDF 计算中有任何明显的缺陷吗?

Any obvious pitfalls in this Student's t-distribution CDF computation?

我一直在寻找计算学生 t 分布的 CDF(累积分布函数)的有效函数。

这是我在查看 another Whosebug question, JStat library, the_subtprob function on Line 317 here 后确定的内容。

查看上一篇参考文献中的注释让我找到了一本绝版书,这对我没有帮助

If you are interested in more precise algorithms you could look at: StatLib: http://lib.stat.cmu.edu/apstat/ ;
Applied Statistics Algorithms by Griffiths, P. and Hill, I.D.
Ellis Horwood: Chichester (1985)

cmu 站点有一个我翻译的 FORTRAN 函数,如下所示。

查看其他来源,我发现高阶函数,如不完整的 beta、log gamma,并且实现似乎更复杂,并且在一种情况下是迭代的。

我想知道这个实现是否有任何已知的缺陷。它似乎产生与其他人相同的结果。关于如何评估这一点的任何想法也会有所帮助。

function tcdf (t, v) {
    //
    // ALGORITHM AS 3  APPL. STATIST. (1968) VOL.17, P.189
    // STUDENT T PROBABILITY (LOWER TAIL)
    //               
    var b = v / (v + t * t),
        c = 1,
        s = 1,
        ioe = v % 2,
        k = 2 + ioe;

    if (v < 1) {
        return 0;
    }
    if (v >= 4) {
        while (k <= v - 2) {
            c *= b - b / k;
            s += c;
            k += 2;
        }
    }
    c = t / Math.sqrt(v);

    if (1 !== ioe) {
        return 0.5 + 0.5 * Math.sqrt(b) * c * s;
    }
    return 0.5 + ((1 === v ? 0 : b * c * s) + Math.atan(c)) / Math.PI;
}

此算法可能存在两个问题。

  1. 处理 v 的大值。当 v 变大时,我们应该恢复标准正态分布。但是,您在 v 上有一个 while 循环。所以v=1000000说,变慢了

  2. 尾部精度。该算法如何应对极端的尾巴?通常,我们需要使用 log 来避免舍入错误。