数据帧的unicode数据到字符串

unicode datas of a dataframe to strings

我在读取 xls 文件时遇到了一些问题。 此类数据帧上的每个数据都具有 'unicode' 类型,我对此无能为力。我想将其更改为 str 值。另外,如果可能的话,我想知道这个事实的原因。我听说了一些关于 'external data' 的事情,我知道列和索引也在这些名称之前显示了 unicode 的 'u'。我对编码几乎一无所知,如果有人另外解释一下,我将不胜感激。

我正在使用 Python 2,我尝试使用

的函数逐列求解
.astype(str) 
.astype(basestring)
.apply(str) 

.str.decode('iso-8859-1').str.encode('utf-8') 

(我在这里读了最后一个,我只是把它写在我的代码中以尝试另一件事)。我也试过

unicodedata.normalize('NFKD', df_bolsa[l]).encode('ascii','ignore')

但这最后一个不能与系列一起使用。 我希望有人能够帮助我澄清这件事。 非常感谢您!!

您可以使用以下代码。

for column in df:
    df[column] = df_peru[column].str.encode('utf-8')

为了帮助别人,这个版本对我有用。 将我的数据框加载到 Oracle 数据库时出现错误:“UnicodeDecodeError: 'ascii' codec can't decode byte 0xea in position 2: ordinal not in range(128)

我在 Python 版本 2.7

for column in df:
    df[column]=  df[column].astype(str).str.decode('utf-8')