如何从 tarfile 流式传输文件以供阅读?
How to stream files from tarfile for reading?
我正在尝试从位于存储桶中的 tarfile 中读取 wav 文件。由于有很多文件,我不想先提取这些文件。
相反,我想从 tarfile 中读取数据并将其流式传输到 wavfile.read
(来自 scipy.io
)
with tf.gfile.Open(chunk_fp, mode='rb') as f:
with tarfile.open(fileobj=f, mode='r|*') as tar:
for member in ds_text.index.values:
bytes = BytesIO(tar.extractfile(member)) # Obviously not working
rate, wav_data = wavfile.read(bytes)
# Do stuff with data ..
但是,我无法为 wavfile.read
工作。
尝试不同的事情会导致我出现不同的错误:
tar.extractfile(member).seek(0)
{AttributeError}'_Stream' object has no attribute 'seekable'
tar.extractfile(member).raw.read()
{StreamError}seeking backwards is not allowed
等等。
有什么办法可以实现吗?
原来是我打开文件的方式不对。使用 r:*
而不是 r|*
有效:
with tarfile.open(fileobj=f, mode='r:*') as tar:
我正在尝试从位于存储桶中的 tarfile 中读取 wav 文件。由于有很多文件,我不想先提取这些文件。
相反,我想从 tarfile 中读取数据并将其流式传输到 wavfile.read
(来自 scipy.io
)
with tf.gfile.Open(chunk_fp, mode='rb') as f:
with tarfile.open(fileobj=f, mode='r|*') as tar:
for member in ds_text.index.values:
bytes = BytesIO(tar.extractfile(member)) # Obviously not working
rate, wav_data = wavfile.read(bytes)
# Do stuff with data ..
但是,我无法为 wavfile.read
工作。
尝试不同的事情会导致我出现不同的错误:
tar.extractfile(member).seek(0)
{AttributeError}'_Stream' object has no attribute 'seekable'
tar.extractfile(member).raw.read()
{StreamError}seeking backwards is not allowed
等等。
有什么办法可以实现吗?
原来是我打开文件的方式不对。使用 r:*
而不是 r|*
有效:
with tarfile.open(fileobj=f, mode='r:*') as tar: