Python 读取数据文件时将制表符识别为字符串

Python identifying tab as a string when reading a data file

所以我已经尝试调试了很长时间,但似乎找不到解决方案。

基本上,我在 excel 中打开了一个 .txt 文件作为 MacO 中的制表符分隔文件。然后,复制并粘贴我想要的列并创建一个新文件。 当我使用 readline() 通过我的 python 脚本读取文件中的第一行时,“\t”被 python 作为字符串读取。

例如:

line = column1 column2
10000.00 1000.00

这是我的脚本中发生“错误”的部分:

 13 class read_file:
 14         def __init__(self,filePath):
 15                 self.filePath = filePath
 16                 self.infile = open(self.filePath,'r')
 17                 self.var_names = []
 18                 self.data = []
 19         def get_var_names(self):
 20                 var_names_str = (self.infile).readline().rstrip()
 21                 var_names_list = var_names_str.split(" ")
 22                 for name in var_names_list:
 23                         if name !="line" and name != "=":
 24                                 (self.var_names).append(name)
 25                 print("Headers to plot: {}".format(self.var_names)) 
 26                 return self.var_names

输出:

Headers to plot: ['column1\tcolumn2']

我手动创建了包含 column1 和 column2 的文件,因为想快速绘制结果并在使用 pandas 之前查看图表是否有意义,还有一些其他 post 处理工作我也必须这样做,所以我认为复制和粘贴应该不是问题。但显然是。

如果有人有建议和发生这种情况的原因,我将不胜感激!与此同时,我仍在调试我的代码。

谢谢!

第 21 行应该是:

var_names_list = var_names_str.split("\t")

在选项卡处拆分而不是包含它们。