Python 读取数据文件时将制表符识别为字符串

Question

所以我已经尝试调试了很长时间，但似乎找不到解决方案。

基本上，我在 excel 中打开了一个 .txt 文件作为 MacO 中的制表符分隔文件。然后，复制并粘贴我想要的列并创建一个新文件。当我使用 readline() 通过我的 python 脚本读取文件中的第一行时，“\t”被 python 作为字符串读取。

例如：

line = column1 column2
10000.00 1000.00

这是我的脚本中发生“错误”的部分：

 13 class read_file:
 14         def __init__(self,filePath):
 15                 self.filePath = filePath
 16                 self.infile = open(self.filePath,'r')
 17                 self.var_names = []
 18                 self.data = []
 19         def get_var_names(self):
 20                 var_names_str = (self.infile).readline().rstrip()
 21                 var_names_list = var_names_str.split(" ")
 22                 for name in var_names_list:
 23                         if name !="line" and name != "=":
 24                                 (self.var_names).append(name)
 25                 print("Headers to plot: {}".format(self.var_names)) 
 26                 return self.var_names

输出：

Headers to plot: ['column1\tcolumn2']

我手动创建了包含 column1 和 column2 的文件，因为想快速绘制结果并在使用 pandas 之前查看图表是否有意义，还有一些其他 post 处理工作我也必须这样做，所以我认为复制和粘贴应该不是问题。但显然是。

如果有人有建议和发生这种情况的原因，我将不胜感激！与此同时，我仍在调试我的代码。

谢谢！

Answer 1

第 21 行应该是：

var_names_list = var_names_str.split("\t")

在选项卡处拆分而不是包含它们。

Python 读取数据文件时将制表符识别为字符串

Python identifying tab as a string when reading a data file

readlines

python-3.x