如何在 pandas 中导入此文件?
How to import this file in pandas?
我正在尝试使用 read_csv
从“.txt”文件导入数据,但未能正确导入。所有列都作为一个列导入。我想要四个单独的列。这是文件中的示例:
TIME A B C
---- ------- ------- -------
1599004800003299944 51 -731 17271
1599004800008323314 47 -606 17245
1599004800013323079 71 -755 17300
1599004800018324785 23 -621 17273
1599004800023317477 42 -705 17268
1599004800028280442 48 -715 17239
试试这个代码:
data = pd.read_csv('data.txt', sep=' ', skiprows=2)
sep 用于列之间的分隔符
skiprows 前两行未读
使用 \s+
(1 个或多个空格)作为 sep
:
import pandas as pd
df = pd.read_csv('file.txt', sep='\s+')
您必须先用自然语言描述您的文件:
- 字段由可变数量的空格分隔
- 第一行包含 headers
- 应该忽略第二行
现在您只需阅读相关的 doc 并将其转换为适当的参数即可:
sep=r'\s+'
或 delim_whitespace=True
(后者不太常用 AFAIK)
header=0
skiprows=[1]
它给出:
df = pd.read_csv(file_name, sep=r'\s+', header=0, skiprows=[1])
我正在尝试使用 read_csv
从“.txt”文件导入数据,但未能正确导入。所有列都作为一个列导入。我想要四个单独的列。这是文件中的示例:
TIME A B C
---- ------- ------- -------
1599004800003299944 51 -731 17271
1599004800008323314 47 -606 17245
1599004800013323079 71 -755 17300
1599004800018324785 23 -621 17273
1599004800023317477 42 -705 17268
1599004800028280442 48 -715 17239
试试这个代码:
data = pd.read_csv('data.txt', sep=' ', skiprows=2)
sep 用于列之间的分隔符
skiprows 前两行未读
使用 \s+
(1 个或多个空格)作为 sep
:
import pandas as pd
df = pd.read_csv('file.txt', sep='\s+')
您必须先用自然语言描述您的文件:
- 字段由可变数量的空格分隔
- 第一行包含 headers
- 应该忽略第二行
现在您只需阅读相关的 doc 并将其转换为适当的参数即可:
sep=r'\s+'
或delim_whitespace=True
(后者不太常用 AFAIK)header=0
skiprows=[1]
它给出:
df = pd.read_csv(file_name, sep=r'\s+', header=0, skiprows=[1])