如何在 python 中上传文件时读取内存中 zip 文件的内容?
How to read contents of zip file in memory on a file upload in python?
我有一个 zip
文件,当用户上传文件时我会收到该文件。 zip
本质上包含一个 json
文件,我想读取和处理该文件,而不必先创建 zip
文件,然后解压缩它,然后读取内部文件的内容。
目前我只有较长的过程,如下所示
import json
import zipfile
@csrf_exempt
def get_zip(request):
try:
if request.method == "POST":
try:
client_file = request.FILES['file']
file_path = "/some/path/"
# first dump the zip file to a directory
with open(file_path + '%s' % client_file.name, 'wb+') as dest:
for chunk in client_file.chunks():
dest.write(chunk)
# unzip the zip file to the same directory
with zipfile.ZipFile(file_path + client_file.name, 'r') as zip_ref:
zip_ref.extractall(file_path)
# at this point we get a json file from the zip say `test.json`
# read the json file content
with open(file_path + "test.json", "r") as fo:
json_content = json.load(fo)
doSomething(json_content)
return HttpResponse(0)
except Exception as e:
return HttpResponse(1)
如您所见,这涉及到 3 个步骤,最终将 zip
文件中的内容获取到内存中。我想要的是获取 zip
文件的内容并直接加载到内存中。
我确实在堆栈溢出中发现了一些类似的问题,比如这个 。但是我不确定在什么时候调用 post
中提到的这个操作
我怎样才能做到这一点?
注意:我在后端使用 django。
zip 中总会有一个 json 文件。
据我了解,@jason 想说的是 here 首先打开一个 zipFile,就像您在此处所做的那样 with zipfile.ZipFile(file_path + client_file.name, 'r') as zip_ref:
。
class zipfile.ZipFile(file[, mode[, compression[, allowZip64]]])
Open a ZIP file, where file can be either a path to a file (a string) or a file-like object.
然后使用BytesIO读入类文件对象的字节。但是从上面看,您正在阅读 r
模式而不是 rb
模式。所以改成如下。
with open(filename, 'rb') as file_data:
bytes_content = file_data.read()
file_like_object = io.BytesIO(bytes_content)
zipfile_ob = zipfile.ZipFile(file_like_object)
现在 zipfile_ob
可以从内存访问。
zipfile.ZipFile()
的第一个参数可以是文件对象而不是路径名。我认为 Django UploadedFile
对象支持这种用法,因此您可以直接从中读取,而不必复制到文件中。
您也可以直接从 zip 存档打开文件,而不是将其解压缩到文件中。
import json
import zipfile
@csrf_exempt
def get_zip(request):
try:
if request.method == "POST":
try:
client_file = request.FILES['file']
# unzip the zip file to the same directory
with zipfile.ZipFile(client_file, 'r') as zip_ref:
first = zip_ref.infolist()[0]
with zip_ref.open(first, "r") as fo:
json_content = json.load(fo)
doSomething(json_content)
return HttpResponse(0)
except Exception as e:
return HttpResponse(1)
我有一个 zip
文件,当用户上传文件时我会收到该文件。 zip
本质上包含一个 json
文件,我想读取和处理该文件,而不必先创建 zip
文件,然后解压缩它,然后读取内部文件的内容。
目前我只有较长的过程,如下所示
import json
import zipfile
@csrf_exempt
def get_zip(request):
try:
if request.method == "POST":
try:
client_file = request.FILES['file']
file_path = "/some/path/"
# first dump the zip file to a directory
with open(file_path + '%s' % client_file.name, 'wb+') as dest:
for chunk in client_file.chunks():
dest.write(chunk)
# unzip the zip file to the same directory
with zipfile.ZipFile(file_path + client_file.name, 'r') as zip_ref:
zip_ref.extractall(file_path)
# at this point we get a json file from the zip say `test.json`
# read the json file content
with open(file_path + "test.json", "r") as fo:
json_content = json.load(fo)
doSomething(json_content)
return HttpResponse(0)
except Exception as e:
return HttpResponse(1)
如您所见,这涉及到 3 个步骤,最终将 zip
文件中的内容获取到内存中。我想要的是获取 zip
文件的内容并直接加载到内存中。
我确实在堆栈溢出中发现了一些类似的问题,比如这个 。但是我不确定在什么时候调用 post
中提到的这个操作我怎样才能做到这一点?
注意:我在后端使用 django。 zip 中总会有一个 json 文件。
据我了解,@jason 想说的是 here 首先打开一个 zipFile,就像您在此处所做的那样 with zipfile.ZipFile(file_path + client_file.name, 'r') as zip_ref:
。
class zipfile.ZipFile(file[, mode[, compression[, allowZip64]]])
Open a ZIP file, where file can be either a path to a file (a string) or a file-like object.
然后使用BytesIO读入类文件对象的字节。但是从上面看,您正在阅读 r
模式而不是 rb
模式。所以改成如下。
with open(filename, 'rb') as file_data:
bytes_content = file_data.read()
file_like_object = io.BytesIO(bytes_content)
zipfile_ob = zipfile.ZipFile(file_like_object)
现在 zipfile_ob
可以从内存访问。
zipfile.ZipFile()
的第一个参数可以是文件对象而不是路径名。我认为 Django UploadedFile
对象支持这种用法,因此您可以直接从中读取,而不必复制到文件中。
您也可以直接从 zip 存档打开文件,而不是将其解压缩到文件中。
import json
import zipfile
@csrf_exempt
def get_zip(request):
try:
if request.method == "POST":
try:
client_file = request.FILES['file']
# unzip the zip file to the same directory
with zipfile.ZipFile(client_file, 'r') as zip_ref:
first = zip_ref.infolist()[0]
with zip_ref.open(first, "r") as fo:
json_content = json.load(fo)
doSomething(json_content)
return HttpResponse(0)
except Exception as e:
return HttpResponse(1)