我如何以不同的文件格式读取文件格式?例如- 保存为 CSV
How can i read in file formats as a different file format? e.g. - SAV as CSV
所以在我的工作中,我们必须使用 .sav 文件(SPSS 文件)。原因是出于标准化目的。
我很好奇我是否可以将 SPSS/.sav 文件作为 csv 读入 pandas 并基本上绕过将其作为 sav 读入?
因此,例如,当我读入文件然后转换为 csv 时,我通常会这样做:
df = pd.read_spss('filepath.sav')
df.to_csv('filepath.csv')
df = pd.read_csv('filepath.csv')
这是极其低效和缓慢的,因为读取 .sav 文件是一个 slow/time 消耗过程。
所以我想知道,我是否可以将 .sav 文件作为 .csv 文件读取,而不需要首先将其作为 .sav 文件读取?
您可能对 this topic 感兴趣。简而言之,它指向 C 库 ReadStat 的包装器,它读取 SPSS 文件的速度比 pandas.
他们 GitHub 回购的 link 是 https://github.com/Roche/pyreadstat
pd.read_spss return DataFrame 不就像 pd.read_csv 吗?
所以在我的工作中,我们必须使用 .sav 文件(SPSS 文件)。原因是出于标准化目的。 我很好奇我是否可以将 SPSS/.sav 文件作为 csv 读入 pandas 并基本上绕过将其作为 sav 读入?
因此,例如,当我读入文件然后转换为 csv 时,我通常会这样做:
df = pd.read_spss('filepath.sav')
df.to_csv('filepath.csv')
df = pd.read_csv('filepath.csv')
这是极其低效和缓慢的,因为读取 .sav 文件是一个 slow/time 消耗过程。
所以我想知道,我是否可以将 .sav 文件作为 .csv 文件读取,而不需要首先将其作为 .sav 文件读取?
您可能对 this topic 感兴趣。简而言之,它指向 C 库 ReadStat 的包装器,它读取 SPSS 文件的速度比 pandas.
他们 GitHub 回购的 link 是 https://github.com/Roche/pyreadstat
pd.read_spss return DataFrame 不就像 pd.read_csv 吗?