如何读取 csv 文件并在 python 中绘制混淆矩阵

Question

我有一个包含 2 列的 CSV 文件

actual,predicted
1,0
1,0
1,1
0,1
.,.
.,.

如何读取此文件并在 Python 中绘制混淆矩阵？我从程序中尝试了以下代码。

import pandas as pd
from sklearn.metrics import confusion_matrix
import numpy

CSVFILE='./mappings.csv'
test_df=pd.read_csv[CSVFILE]

actualValue=test_df['actual']
predictedValue=test_df['predicted']

actualValue=actualValue.values
predictedValue=predictedValue.values

cmt=confusion_matrix(actualValue,predictedValue)
print cmt

但它给了我这个错误。

Traceback (most recent call last):
  File "confusionMatrixCSV.py", line 7, in <module>
    test_df=pd.read_csv[CSVFILE]
TypeError: 'function' object has no attribute '__getitem__'

Answer 1

pd.read_csv 是一个函数。您使用括号调用 Python 中的函数。

您应该使用 pd.read_csv(CSVFILE) 而不是 pd.read_csv[CSVFILE]。

Answer 2

import pandas as pd
from sklearn.metrics import confusion_matrix
import numpy as np

CSVFILE = './mappings.csv'
test_df = pd.read_csv(CSVFILE)

actualValue = test_df['actual']
predictedValue = test_df['predicted']

actualValue = actualValue.values.argmax(axis=1)
predictedValue  =predictedValue.values.argmax(axis=1)

cmt = confusion_matrix(actualValue, predictedValue)
print cmt

Answer 3

这里有一个简单的解决方案，可以计算问题中提到的格式的输入的准确性并绘制混淆矩阵。

from sklearn.metrics import confusion_matrix
from sklearn.metrics import accuracy_score

file=open("results.txt","r")

result=[]
actual=[]

i = 0

for line in file:
    i+=1
    sent=line.split("\t")
    sent[0]=int(sent[0])
    sent[1]=int(sent[1])
    result.append(sent[1])
    actual.append(sent[0])

cnf_mat=confusion_matrix(actual,result)
print cnf_mat

print('Test Accuracy:', accuracy_score(actual,result))

如何读取 csv 文件并在 python 中绘制混淆矩阵

How to read a csv file and plot confusion matrix in python

python

csv

confusion-matrix

scikit-learn