如何在 pandas 中导入此文件?

How to import this file in pandas?

我正在尝试使用 read_csv 从“.txt”文件导入数据,但未能正确导入。所有列都作为一个列导入。我想要四个单独的列。这是文件中的示例:

    TIME                 A        B       C
----                ------- ------- -------
1599004800003299944 51      -731    17271
1599004800008323314 47      -606    17245
1599004800013323079 71      -755    17300
1599004800018324785 23      -621    17273
1599004800023317477 42      -705    17268
1599004800028280442 48      -715    17239
 

试试这个代码:

data = pd.read_csv('data.txt', sep=' ', skiprows=2)

sep 用于列之间的分隔符

skiprows 前两行未读

使用 \s+(1 个或多个空格)作为 sep:

import pandas as pd
df = pd.read_csv('file.txt', sep='\s+')

您必须先用自然语言描述您的文件:

  1. 字段由可变数量的空格分隔
  2. 第一行包含 headers
  3. 应该忽略第二行

现在您只需阅读相关的 doc 并将其转换为适当的参数即可:

  1. sep=r'\s+'delim_whitespace=True(后者不太常用 AFAIK)
  2. header=0
  3. skiprows=[1]

它给出:

df = pd.read_csv(file_name, sep=r'\s+', header=0, skiprows=[1])