Python 读取数据文件时将制表符识别为字符串
Python identifying tab as a string when reading a data file
所以我已经尝试调试了很长时间,但似乎找不到解决方案。
基本上,我在 excel 中打开了一个 .txt 文件作为 MacO 中的制表符分隔文件。然后,复制并粘贴我想要的列并创建一个新文件。
当我使用 readline() 通过我的 python 脚本读取文件中的第一行时,“\t”被 python 作为字符串读取。
例如:
line = column1 column2
10000.00 1000.00
这是我的脚本中发生“错误”的部分:
13 class read_file:
14 def __init__(self,filePath):
15 self.filePath = filePath
16 self.infile = open(self.filePath,'r')
17 self.var_names = []
18 self.data = []
19 def get_var_names(self):
20 var_names_str = (self.infile).readline().rstrip()
21 var_names_list = var_names_str.split(" ")
22 for name in var_names_list:
23 if name !="line" and name != "=":
24 (self.var_names).append(name)
25 print("Headers to plot: {}".format(self.var_names))
26 return self.var_names
输出:
Headers to plot: ['column1\tcolumn2']
我手动创建了包含 column1 和 column2 的文件,因为想快速绘制结果并在使用 pandas 之前查看图表是否有意义,还有一些其他 post 处理工作我也必须这样做,所以我认为复制和粘贴应该不是问题。但显然是。
如果有人有建议和发生这种情况的原因,我将不胜感激!与此同时,我仍在调试我的代码。
谢谢!
第 21 行应该是:
var_names_list = var_names_str.split("\t")
在选项卡处拆分而不是包含它们。
所以我已经尝试调试了很长时间,但似乎找不到解决方案。
基本上,我在 excel 中打开了一个 .txt 文件作为 MacO 中的制表符分隔文件。然后,复制并粘贴我想要的列并创建一个新文件。 当我使用 readline() 通过我的 python 脚本读取文件中的第一行时,“\t”被 python 作为字符串读取。
例如:
line = column1 column2
10000.00 1000.00
这是我的脚本中发生“错误”的部分:
13 class read_file:
14 def __init__(self,filePath):
15 self.filePath = filePath
16 self.infile = open(self.filePath,'r')
17 self.var_names = []
18 self.data = []
19 def get_var_names(self):
20 var_names_str = (self.infile).readline().rstrip()
21 var_names_list = var_names_str.split(" ")
22 for name in var_names_list:
23 if name !="line" and name != "=":
24 (self.var_names).append(name)
25 print("Headers to plot: {}".format(self.var_names))
26 return self.var_names
输出:
Headers to plot: ['column1\tcolumn2']
我手动创建了包含 column1 和 column2 的文件,因为想快速绘制结果并在使用 pandas 之前查看图表是否有意义,还有一些其他 post 处理工作我也必须这样做,所以我认为复制和粘贴应该不是问题。但显然是。
如果有人有建议和发生这种情况的原因,我将不胜感激!与此同时,我仍在调试我的代码。
谢谢!
第 21 行应该是:
var_names_list = var_names_str.split("\t")
在选项卡处拆分而不是包含它们。