计算 Java 中两个字符串之间的误差

Calculating errors between two strings in Java

我想计算两个字符串之间的错误百分比,这意味着如果我们假设一个字符串是基本事实而另一个字符串是类型字符串,那么我想计算错误的数量输入的字符串。

举个例子:

ground truth = "This is a test"
typed = " Thisi is atest"

typed 中有 2 个错误(额外的 i 和缺失的 space)。

我认为这可以使用一些距离度量来完成。 Java有计算这样错误率的库吗?

您指的是 Levenshtein distance。它在 Apache Commons Text 库中实现:

看这里:http://commons.apache.org/proper/commons-text/

这里:https://commons.apache.org/sandbox/commons-text/jacoco/org.apache.commons.text.similarity/LevenshteinDistance.java.html