Pandas.read_csv: 需要反斜杠分隔符?
Pandas.read_csv: backslash delimiter required?
我正在将文件直接读入 pandas,出于某种奇怪的原因,我使用反斜杠作为分隔符。这是代码: 尝试使用 escapechar 作为参数来转义反斜杠,正如我在某处发现的那样,但这不起作用。我怎样才能将其直接读入 pandas?
raw = pd.read_csv('http://language.media.mit.edu/data/public/unesco_langlang_20120722_iso639-3.txt', escapechar='\', delimiter = "\")
我认为 escapechar
不是您的问题/解决方法。我阅读了包含以下代码的文件,没有任何问题。解决方案是使用可变空格作为分隔符。
import pandas as pd
raw = pd.read_csv(r'C:\temp\unesco_langlang_20120722_iso639-3.txt',
delim_whitespace=True)
raw.head(10)
# original_language target_language num_translations
# 0 abk aze 1
# 1 abk bul 1
# 2 abk deu 1
# 3 abk eng 2
# 4 abk est 2
# 5 abk fin 1
# 6 abk hin 1
# 7 abk kat 38
# 8 abk kaz 1
# 9 abk kbd 2
我正在将文件直接读入 pandas,出于某种奇怪的原因,我使用反斜杠作为分隔符。这是代码: 尝试使用 escapechar 作为参数来转义反斜杠,正如我在某处发现的那样,但这不起作用。我怎样才能将其直接读入 pandas?
raw = pd.read_csv('http://language.media.mit.edu/data/public/unesco_langlang_20120722_iso639-3.txt', escapechar='\', delimiter = "\")
我认为 escapechar
不是您的问题/解决方法。我阅读了包含以下代码的文件,没有任何问题。解决方案是使用可变空格作为分隔符。
import pandas as pd
raw = pd.read_csv(r'C:\temp\unesco_langlang_20120722_iso639-3.txt',
delim_whitespace=True)
raw.head(10)
# original_language target_language num_translations
# 0 abk aze 1
# 1 abk bul 1
# 2 abk deu 1
# 3 abk eng 2
# 4 abk est 2
# 5 abk fin 1
# 6 abk hin 1
# 7 abk kat 38
# 8 abk kaz 1
# 9 abk kbd 2