在 python 中读取 csv.gz 文件
Reading a csv.gz file in python
我正在尝试读取 python 中的 csv.gz 文件,我用 urllib.request.open 读取文件,然后遇到两个问题,第一个是文件是以字节为单位,我需要它是 utf-8 才能使用 pandas,第二个问题是我不准确地理解如何使用 pandas 读取这种类型的文件,我想要它是一个数据框,但我不清楚我可以使用 pandas 的方式。到目前为止,这是我尝试过的方法,我使用了解码,但我不信任该方法,因为它唯一有效的方法是因为我避免了错误。在这一点上,我不完全确定它是否真的需要解码部分。
所以我非常感谢在此问题上提供的任何帮助,在此先感谢。
enter image description here
df = pd.read_csv('sample.tar.gz', compression='gzip', header=0, sep=' ', quotechar='"', error_bad_lines=False)
我正在尝试读取 python 中的 csv.gz 文件,我用 urllib.request.open 读取文件,然后遇到两个问题,第一个是文件是以字节为单位,我需要它是 utf-8 才能使用 pandas,第二个问题是我不准确地理解如何使用 pandas 读取这种类型的文件,我想要它是一个数据框,但我不清楚我可以使用 pandas 的方式。到目前为止,这是我尝试过的方法,我使用了解码,但我不信任该方法,因为它唯一有效的方法是因为我避免了错误。在这一点上,我不完全确定它是否真的需要解码部分。
所以我非常感谢在此问题上提供的任何帮助,在此先感谢。
enter image description here
df = pd.read_csv('sample.tar.gz', compression='gzip', header=0, sep=' ', quotechar='"', error_bad_lines=False)