双引号 pandas.read_csv

Question

我有一个包含多个单词和字符的大型 txt 文件，我正在尝试将此文件读入 pandas 数据帧，每个单词或字符在不同的行中。

问题是 " 是字符之一，函数将两个 " 之间的所有单词作为单个单词读取（因为引用）。

如何将此字符作为另一个常规字符而不是引用字符来处理？我尝试使用 read_csv 函数的参数，但无法修复它。

我现在的代码：data = pd.read_csv(filepath, header=None, delimiter = "\t")

提前致谢！

Answer 1

你可以使用参数quotechar

data = pd.read_csv("a.txt", delim_whitespace=True, header=None,quotechar="~")
print(data.head())

a.txt

abc def xyz
"abc xyz" def

输出

      0     1    2
0   abc   def  xyz
1  "abc  xyz"  def

这样还有 qoutes。

Answer 2

通过 numpy 的 genfromtxt() 方法尝试：

import numpy as np

data=np.genfromtxt('data.csv',dtype='str',delimeter='\t',skip_header=1)

columns=np.genfromtxt('data.csv',dtype='str',delimiter='\t',skip_footer=len(data))

最后：

df=pd.Dataframe(data=data,columns=columns)

双引号 pandas.read_csv

double quotes pandas.read_csv

python

double-quotes

pandas

txt