Pandas.read_csv: 需要反斜杠分隔符？

Question

我正在将文件直接读入 pandas，出于某种奇怪的原因，我使用反斜杠作为分隔符。这是代码：尝试使用 escapechar 作为参数来转义反斜杠，正如我在某处发现的那样，但这不起作用。我怎样才能将其直接读入 pandas?

raw = pd.read_csv('http://language.media.mit.edu/data/public/unesco_langlang_20120722_iso639-3.txt', escapechar='\', delimiter = "\")

Answer 1

我认为 escapechar 不是您的问题/解决方法。我阅读了包含以下代码的文件，没有任何问题。解决方案是使用可变空格作为分隔符。

import pandas as pd

raw = pd.read_csv(r'C:\temp\unesco_langlang_20120722_iso639-3.txt',
                  delim_whitespace=True)

raw.head(10)

#   original_language target_language  num_translations
# 0               abk             aze                 1
# 1               abk             bul                 1
# 2               abk             deu                 1
# 3               abk             eng                 2
# 4               abk             est                 2
# 5               abk             fin                 1
# 6               abk             hin                 1
# 7               abk             kat                38
# 8               abk             kaz                 1
# 9               abk             kbd                 2

Pandas.read_csv: 需要反斜杠分隔符？

Pandas.read_csv: backslash delimiter required?

python

csv

pandas

python-3.5