我如何以不同的文件格式读取文件格式?例如- 保存为 CSV

How can i read in file formats as a different file format? e.g. - SAV as CSV

所以在我的工作中,我们必须使用 .sav 文件(SPSS 文件)。原因是出于标准化目的。 我很好奇我是否可以将 SPSS/.sav 文件作为 csv 读入 pandas 并基本上绕过将其作为 sav 读入?

因此,例如,当我读入文件然后转换为 csv 时,我通常会这样做:

df = pd.read_spss('filepath.sav')
df.to_csv('filepath.csv')
df = pd.read_csv('filepath.csv')

这是极其低效和缓慢的,因为读取 .sav 文件是一个 slow/time 消耗过程。

所以我想知道,我是否可以将 .sav 文件作为 .csv 文件读取,而不需要首先将其作为 .sav 文件读取?

您可能对 this topic 感兴趣。简而言之,它指向 C 库 ReadStat 的包装器,它读取 SPSS 文件的速度比 pandas.

他们 GitHub 回购的 link 是 https://github.com/Roche/pyreadstat

pd.read_spss return DataFrame 不就像 pd.read_csv 吗?