如何在python中绘制带插值的精确召回曲线?
How to draw a precision-recall curve with interpolation in python?
我使用 sklearn
precision_recall_curve
函数和 matplotlib
包绘制了一条精确召回曲线。对于那些熟悉精确召回曲线的人来说,您知道一些科学界只在插值时才接受它,类似于这个例子 here。现在我的问题是你们中是否有人知道如何在 python 中进行插值?我一直在寻找解决方案一段时间但没有成功!任何帮助将不胜感激。
解决方案: @francis 和@ali_m 的两个解决方案都是正确的,并且一起解决了我的问题。因此,假设您从 sklearn
中的 precision_recall_curve
函数获得输出,这就是我绘制图形的方法:
precision["micro"], recall["micro"], _ = precision_recall_curve(y_test.ravel(),scores.ravel())
pr = copy.deepcopy(precision[0])
rec = copy.deepcopy(recall[0])
prInv = np.fliplr([pr])[0]
recInv = np.fliplr([rec])[0]
j = rec.shape[0]-2
while j>=0:
if prInv[j+1]>prInv[j]:
prInv[j]=prInv[j+1]
j=j-1
decreasing_max_precision = np.maximum.accumulate(prInv[::-1])[::-1]
plt.plot(recInv, decreasing_max_precision, marker= markers[mcounter], label=methodNames[countOfMethods]+': AUC={0:0.2f}'.format(average_precision[0]))
如果将这些线放在 for 循环中并在每次迭代时将每个方法的数据传递给它,这些线将绘制插值曲线。请注意,这不会绘制非插值精度召回曲线。
可以进行反向迭代,去掉precision
中增加的部分。然后,可以按照 Bennett Brown 对 vertical & horizontal lines in matplotlib 的回答中指定的方式绘制垂直线和水平线。
这是一个示例代码:
import numpy as np
import matplotlib.pyplot as plt
#just a dummy sample
recall=np.linspace(0.0,1.0,num=42)
precision=np.random.rand(42)*(1.-recall)
precision2=precision.copy()
i=recall.shape[0]-2
# interpolation...
while i>=0:
if precision[i+1]>precision[i]:
precision[i]=precision[i+1]
i=i-1
# plotting...
fig, ax = plt.subplots()
for i in range(recall.shape[0]-1):
ax.plot((recall[i],recall[i]),(precision[i],precision[i+1]),'k-',label='',color='red') #vertical
ax.plot((recall[i],recall[i+1]),(precision[i+1],precision[i+1]),'k-',label='',color='red') #horizontal
ax.plot(recall,precision2,'k--',color='blue')
#ax.legend()
ax.set_xlabel("recall")
ax.set_ylabel("precision")
plt.savefig('fig.jpg')
fig.show()
结果如下:
@francis 的 解决方案可以使用 np.maximum.accumulate
.
向量化
import numpy as np
import matplotlib.pyplot as plt
recall = np.linspace(0.0, 1.0, num=42)
precision = np.random.rand(42)*(1.-recall)
# take a running maximum over the reversed vector of precision values, reverse the
# result to match the order of the recall vector
decreasing_max_precision = np.maximum.accumulate(precision[::-1])[::-1]
您还可以使用 plt.step
摆脱用于绘图的 for
循环:
fig, ax = plt.subplots(1, 1)
ax.hold(True)
ax.plot(recall, precision, '--b')
ax.step(recall, decreasing_max_precision, '-r')
我使用 sklearn
precision_recall_curve
函数和 matplotlib
包绘制了一条精确召回曲线。对于那些熟悉精确召回曲线的人来说,您知道一些科学界只在插值时才接受它,类似于这个例子 here。现在我的问题是你们中是否有人知道如何在 python 中进行插值?我一直在寻找解决方案一段时间但没有成功!任何帮助将不胜感激。
解决方案: @francis 和@ali_m 的两个解决方案都是正确的,并且一起解决了我的问题。因此,假设您从 sklearn
中的 precision_recall_curve
函数获得输出,这就是我绘制图形的方法:
precision["micro"], recall["micro"], _ = precision_recall_curve(y_test.ravel(),scores.ravel())
pr = copy.deepcopy(precision[0])
rec = copy.deepcopy(recall[0])
prInv = np.fliplr([pr])[0]
recInv = np.fliplr([rec])[0]
j = rec.shape[0]-2
while j>=0:
if prInv[j+1]>prInv[j]:
prInv[j]=prInv[j+1]
j=j-1
decreasing_max_precision = np.maximum.accumulate(prInv[::-1])[::-1]
plt.plot(recInv, decreasing_max_precision, marker= markers[mcounter], label=methodNames[countOfMethods]+': AUC={0:0.2f}'.format(average_precision[0]))
如果将这些线放在 for 循环中并在每次迭代时将每个方法的数据传递给它,这些线将绘制插值曲线。请注意,这不会绘制非插值精度召回曲线。
可以进行反向迭代,去掉precision
中增加的部分。然后,可以按照 Bennett Brown 对 vertical & horizontal lines in matplotlib 的回答中指定的方式绘制垂直线和水平线。
这是一个示例代码:
import numpy as np
import matplotlib.pyplot as plt
#just a dummy sample
recall=np.linspace(0.0,1.0,num=42)
precision=np.random.rand(42)*(1.-recall)
precision2=precision.copy()
i=recall.shape[0]-2
# interpolation...
while i>=0:
if precision[i+1]>precision[i]:
precision[i]=precision[i+1]
i=i-1
# plotting...
fig, ax = plt.subplots()
for i in range(recall.shape[0]-1):
ax.plot((recall[i],recall[i]),(precision[i],precision[i+1]),'k-',label='',color='red') #vertical
ax.plot((recall[i],recall[i+1]),(precision[i+1],precision[i+1]),'k-',label='',color='red') #horizontal
ax.plot(recall,precision2,'k--',color='blue')
#ax.legend()
ax.set_xlabel("recall")
ax.set_ylabel("precision")
plt.savefig('fig.jpg')
fig.show()
结果如下:
@francis 的 解决方案可以使用 np.maximum.accumulate
.
import numpy as np
import matplotlib.pyplot as plt
recall = np.linspace(0.0, 1.0, num=42)
precision = np.random.rand(42)*(1.-recall)
# take a running maximum over the reversed vector of precision values, reverse the
# result to match the order of the recall vector
decreasing_max_precision = np.maximum.accumulate(precision[::-1])[::-1]
您还可以使用 plt.step
摆脱用于绘图的 for
循环:
fig, ax = plt.subplots(1, 1)
ax.hold(True)
ax.plot(recall, precision, '--b')
ax.step(recall, decreasing_max_precision, '-r')