使用包含波斯记录的数据集
working with dataset containing Persian records
我正在处理包含波斯语记录的数据集,我安装了波斯语和 unicodcsv,但仍然出现此错误。
df = pd.read_csv('datasets\NSIA.Individuals.csv')
df.head()
我得到的错误是:
SyntaxError: (unicode error) 'unicodeescape' codec can't decode bytes
in position 8-9: malformed \N character escape
错误显示的问题不是文件内容而是路径本身,我猜你使用的是 windows 和组合 "\N" 是有问题的,因为它是一个转义字符,您可以在以下 link.
中阅读有关转义字符的更多信息
您可以对路径进行如下操作,即可解决上述问题:
df = pd.read_csv('datasets\NSIA.Individuals.csv')
另一种方法是:
df = pd.read_csv(r'datasets\NSIA.Individuals.csv')
不过后面的内容可能会有问题。
我正在处理包含波斯语记录的数据集,我安装了波斯语和 unicodcsv,但仍然出现此错误。
df = pd.read_csv('datasets\NSIA.Individuals.csv')
df.head()
我得到的错误是:
SyntaxError: (unicode error) 'unicodeescape' codec can't decode bytes in position 8-9: malformed \N character escape
错误显示的问题不是文件内容而是路径本身,我猜你使用的是 windows 和组合 "\N" 是有问题的,因为它是一个转义字符,您可以在以下 link.
中阅读有关转义字符的更多信息您可以对路径进行如下操作,即可解决上述问题:
df = pd.read_csv('datasets\NSIA.Individuals.csv')
另一种方法是:
df = pd.read_csv(r'datasets\NSIA.Individuals.csv')
不过后面的内容可能会有问题。