使用 Python Pandas 合并 .dat 文件
Merging .dat files using Python Pandas
我正在尝试合并两个 .dat 文件,这样我就可以扫描它们以找到一个项目。我试过搜索它,但我能找到的只是如何合并 csv 文件。如何使用 Pandas 合并这两个文件?如果有必要或只是更容易转换它们,我该怎么做?我正在使用 Jupyterlabs,Python 3.8,并且对两者都很陌生。
合并应该与 csv 几乎相同:
import pandas as pd
df1 = pd.read_csv("fileA.dat")
df2 = pd.read_csv("fileB.dat")
df = pd.concat([df1, df2])
df.to_csv('df.dat')
但这在一定程度上取决于 dat 文件中使用的约定。您可能必须使用不同的解析器来浏览文件
尝试:
df_1 = pd.read_csv('file_1.dat', sep='\s\s+', engine='python')
df_2 = pd.read_csv('file_2.dat', sep='\s\s+', engine='python')
df_3 = df_1.merge(df2, on = "common_column")
我正在尝试合并两个 .dat 文件,这样我就可以扫描它们以找到一个项目。我试过搜索它,但我能找到的只是如何合并 csv 文件。如何使用 Pandas 合并这两个文件?如果有必要或只是更容易转换它们,我该怎么做?我正在使用 Jupyterlabs,Python 3.8,并且对两者都很陌生。
合并应该与 csv 几乎相同:
import pandas as pd
df1 = pd.read_csv("fileA.dat")
df2 = pd.read_csv("fileB.dat")
df = pd.concat([df1, df2])
df.to_csv('df.dat')
但这在一定程度上取决于 dat 文件中使用的约定。您可能必须使用不同的解析器来浏览文件
尝试:
df_1 = pd.read_csv('file_1.dat', sep='\s\s+', engine='python')
df_2 = pd.read_csv('file_2.dat', sep='\s\s+', engine='python')
df_3 = df_1.merge(df2, on = "common_column")