计算 TP、FP、TN、FN 值
Calculating TP, FP, TN, FN values
我正在尝试构建一个非常简单的程序来计算 2 个字符串的 TP/FP/FN/TN(预测的二级蛋白质结构与已证实的二级蛋白质结构),但它没有正确计算它们。我缺少什么?
actual_str = '*ΟΟΟΟΟΟ******////////////**//////////*****////ΟΟΟΟΟΟΟΟΟ***'
predicted_str = '****--********/////////-----//////****----**-ΟΟΟΟΟΟΟ/-****'
TP = 0
FP = 0
TN = 0
FN = 0
for i in range(len(predicted_str)):
if predicted_str[i]==actual_str[i]=='O':
TP += 1
if predicted_str[i]!='O' and actual_str[i]=='O':
FP += 1
if predicted_str[i]==actual_str[i]=='/' or predicted_str[i]==actual_str[i]=='*':
TN += 1
if predicted_str[i]=='O' and actual_str[i]!='O':
FN += 1
if predicted_str[i]=='-': #just ignore the '-' and move on to the next
i+=1
print(TP, FP, TN, FN)
输出:0 0 26 0
这很奇怪,但请尝试复制 actual_str
或 predicted_str
变量中使用的 'O' 字符之一,并将其粘贴到您的 if 语句中。我认为存在不匹配,即使它们看起来相同。
最后一个 if 语句也不是必需的。
如前所述,您使用的字符不同,它混合了希腊字母 O omicron 和拉丁字母 o 大写。
https://apps.timwhitlock.info/unicode/inspect?s=%CE%9F
此外,在这个用例中使用 zip 运算符而不是按索引比较它是有意义的:
for (actual, predicted) in zip(actual_str, predicted_str):
if (..
我正在尝试构建一个非常简单的程序来计算 2 个字符串的 TP/FP/FN/TN(预测的二级蛋白质结构与已证实的二级蛋白质结构),但它没有正确计算它们。我缺少什么?
actual_str = '*ΟΟΟΟΟΟ******////////////**//////////*****////ΟΟΟΟΟΟΟΟΟ***'
predicted_str = '****--********/////////-----//////****----**-ΟΟΟΟΟΟΟ/-****'
TP = 0
FP = 0
TN = 0
FN = 0
for i in range(len(predicted_str)):
if predicted_str[i]==actual_str[i]=='O':
TP += 1
if predicted_str[i]!='O' and actual_str[i]=='O':
FP += 1
if predicted_str[i]==actual_str[i]=='/' or predicted_str[i]==actual_str[i]=='*':
TN += 1
if predicted_str[i]=='O' and actual_str[i]!='O':
FN += 1
if predicted_str[i]=='-': #just ignore the '-' and move on to the next
i+=1
print(TP, FP, TN, FN)
输出:0 0 26 0
这很奇怪,但请尝试复制 actual_str
或 predicted_str
变量中使用的 'O' 字符之一,并将其粘贴到您的 if 语句中。我认为存在不匹配,即使它们看起来相同。
最后一个 if 语句也不是必需的。
如前所述,您使用的字符不同,它混合了希腊字母 O omicron 和拉丁字母 o 大写。
https://apps.timwhitlock.info/unicode/inspect?s=%CE%9F
此外,在这个用例中使用 zip 运算符而不是按索引比较它是有意义的:
for (actual, predicted) in zip(actual_str, predicted_str):
if (..