Python 如何在不写入目录的情况下读取 xlsx 文件并转换为 csv
Python how to read xlsx file and convert into csv without writing to directory
我从 HTTP POST
请求中收到一个 xlsx
文件,并使用 pd.read_excel()
读取它。起初它是不可读的二进制格式,所以我使用 .to_csv()
将其转换为 csv
import pandas as pd
import requests
response = http_post('https://data.bls.gov/pdq/SurveyOutputServlet')
xlsx = pd.read_excel(response.content)
xlsx.to_csv('outputname.csv', index=False)
这行得通,它为我提供了数据的可读版本,但问题是 to_csv()
也在将文件写入我的目录,我不想将此数据保存在任何地方。我只想使用 http 获取文件内容,将其转换为 csv,在我的脚本中处理该数据,然后在我不再需要它时让它消失;不写入其他文件。
有办法吗?我什至需要转换为 csv
以获得 xlsx
数据的可读表示吗?
import pandas as pd
import requests
response = http_post('https://data.bls.gov/pdq/SurveyOutputServlet')
xlsx = pd.read_excel(response.content)
xlsx = xlsx.csv('outputname.csv', index=False)
CSV 是一种文件格式;没有特别的理由需要内存中的 CSV,除非你最终将它写入磁盘但需要在此之前以某种方式预处理字节。几乎可以肯定,只需将数据读入 Pandas 数据框即可。
我从 HTTP POST
请求中收到一个 xlsx
文件,并使用 pd.read_excel()
读取它。起初它是不可读的二进制格式,所以我使用 .to_csv()
csv
import pandas as pd
import requests
response = http_post('https://data.bls.gov/pdq/SurveyOutputServlet')
xlsx = pd.read_excel(response.content)
xlsx.to_csv('outputname.csv', index=False)
这行得通,它为我提供了数据的可读版本,但问题是 to_csv()
也在将文件写入我的目录,我不想将此数据保存在任何地方。我只想使用 http 获取文件内容,将其转换为 csv,在我的脚本中处理该数据,然后在我不再需要它时让它消失;不写入其他文件。
有办法吗?我什至需要转换为 csv
以获得 xlsx
数据的可读表示吗?
import pandas as pd
import requests
response = http_post('https://data.bls.gov/pdq/SurveyOutputServlet')
xlsx = pd.read_excel(response.content)
xlsx = xlsx.csv('outputname.csv', index=False)
CSV 是一种文件格式;没有特别的理由需要内存中的 CSV,除非你最终将它写入磁盘但需要在此之前以某种方式预处理字节。几乎可以肯定,只需将数据读入 Pandas 数据框即可。