arff 加载到 Python 时数据中出现字母
Letter appeared in data when arff loaded into Python
我已经使用以下代码将 arff 文件加载到 python:
import pandas as pd, scipy as sp
from scipy.io import arff
datos,meta = arff.loadarff(open('selectividad.arff', 'r'))
d = pd.DataFrame(datos)
当我使用 head 函数查看数据框时,它是这样的:
但是,那些 'b' 不存在于 arff 文件中,如下所示:
https://gyazo.com/3123aa4c7007cb4d6f99241b1fc41bcb
这里有什么问题?非常感谢
对于一列,应用以下代码:
data['name_column'] = data['name_column'].str.decode('utf-8')
对于数据框,应用:
str_df = df.select_dtypes([np.object])
str_df = str_df.stack().str.decode('utf-8').unstack()
我已经使用以下代码将 arff 文件加载到 python:
import pandas as pd, scipy as sp
from scipy.io import arff
datos,meta = arff.loadarff(open('selectividad.arff', 'r'))
d = pd.DataFrame(datos)
当我使用 head 函数查看数据框时,它是这样的:
但是,那些 'b' 不存在于 arff 文件中,如下所示: https://gyazo.com/3123aa4c7007cb4d6f99241b1fc41bcb 这里有什么问题?非常感谢
对于一列,应用以下代码:
data['name_column'] = data['name_column'].str.decode('utf-8')
对于数据框,应用: str_df = df.select_dtypes([np.object]) str_df = str_df.stack().str.decode('utf-8').unstack()