安全有效地替换文件的最佳方法?
Best way to replace files in place safely and efficiently?
我正在尝试使用 cryptography
模块就地加密文件,因此我不必缓冲可能占用大量内存的文件的密文,然后我将不得不用它替换原始文件encrypted one.so 我的解决方案是加密一大块明文,然后尝试一次用 16 字节的密文替换它(AES-CTR 模式)。问题似乎是循环是无限循环。
- 那么如何解决这个问题。
- 您还有什么建议。
- 使用下面这种方法的副作用是什么。
pointer = 0
with open(path, "r+b") as file:
print("...ENCRYPTING")
while file:
file_data = file.read(16)
pointer += 16
ciphertext = aes_enc.update(file_data)
file.seek(pointer-16)
file.write(ciphertext)
print("...Complete...")
文件对象没有“真实性”,因此您不能将其用作循环的条件。
读取时文件位于 EOF() returns 一个空字节对象 (https://docs.python.org/3/library/io.html#io.BufferedIOBase.read)
with open(path, "r+b") as file:
print("...ENCRYPTING")
while True:
file_data = file.read(16)
if not file_data:
break
ciphertext = aes_enc.update(file_data)
file.seek(-len(file_data), os.SEEK_CUR)
file.write(ciphertext)
print("...Complete...")
- 那么如何解决这个问题。
正如 Cyril Jouve 已经提到的,检查 如果不是 file_data
- 您还有什么建议。
- 使用下面这种方法的副作用是什么。
读取 16 个字节的块相对较慢。我猜你有足够的内存来读取更大的块,如 4096、8192 ...
除非你有非常大的文件和有限的磁盘空间,否则我认为在同一个文件中读取和写入没有任何好处。如果出现错误并且 os 已经将数据写入磁盘,您将拥有 lost 原始数据并且将拥有一个不完整的加密文件,您不知道哪个部分被加密.
如果没有错误,创建一个新的加密文件然后删除并重命名会更容易和节省。
加密到一个新文件,捕获异常,检查加密文件的存在和大小,删除源并重命名加密文件,只有在一切正常的情况下。
import os
path = r'D:\test.dat'
input_path = path
encrypt_path = path + '_encrypt'
try:
with open(input_path, "rb") as input_file:
with open(encrypt_path, "wb") as encrypt_file:
print("...ENCRYPTING")
while True:
file_data = input_file.read(4096)
if not file_data:
break
ciphertext = aes_enc.update(file_data)
encrypt_file.write(ciphertext)
print("...Complete...")
if os.path.exists(encrypt_path):
if os.path.getsize(input_path) == os.path.getsize(encrypt_path):
print(f'Deleting {input_path}')
os.remove(input_path)
print(f'Renaming {encrypt_path} to {input_path}')
os.rename(encrypt_path, input_path)
except Exception as e:
print(f'EXCEPTION: {str(e)}')
我正在尝试使用 cryptography
模块就地加密文件,因此我不必缓冲可能占用大量内存的文件的密文,然后我将不得不用它替换原始文件encrypted one.so 我的解决方案是加密一大块明文,然后尝试一次用 16 字节的密文替换它(AES-CTR 模式)。问题似乎是循环是无限循环。
- 那么如何解决这个问题。
- 您还有什么建议。
- 使用下面这种方法的副作用是什么。
pointer = 0
with open(path, "r+b") as file:
print("...ENCRYPTING")
while file:
file_data = file.read(16)
pointer += 16
ciphertext = aes_enc.update(file_data)
file.seek(pointer-16)
file.write(ciphertext)
print("...Complete...")
文件对象没有“真实性”,因此您不能将其用作循环的条件。
读取时文件位于 EOF() returns 一个空字节对象 (https://docs.python.org/3/library/io.html#io.BufferedIOBase.read)
with open(path, "r+b") as file:
print("...ENCRYPTING")
while True:
file_data = file.read(16)
if not file_data:
break
ciphertext = aes_enc.update(file_data)
file.seek(-len(file_data), os.SEEK_CUR)
file.write(ciphertext)
print("...Complete...")
- 那么如何解决这个问题。
正如 Cyril Jouve 已经提到的,检查 如果不是 file_data
- 您还有什么建议。
- 使用下面这种方法的副作用是什么。
读取 16 个字节的块相对较慢。我猜你有足够的内存来读取更大的块,如 4096、8192 ...
除非你有非常大的文件和有限的磁盘空间,否则我认为在同一个文件中读取和写入没有任何好处。如果出现错误并且 os 已经将数据写入磁盘,您将拥有 lost 原始数据并且将拥有一个不完整的加密文件,您不知道哪个部分被加密.
如果没有错误,创建一个新的加密文件然后删除并重命名会更容易和节省。
加密到一个新文件,捕获异常,检查加密文件的存在和大小,删除源并重命名加密文件,只有在一切正常的情况下。
import os
path = r'D:\test.dat'
input_path = path
encrypt_path = path + '_encrypt'
try:
with open(input_path, "rb") as input_file:
with open(encrypt_path, "wb") as encrypt_file:
print("...ENCRYPTING")
while True:
file_data = input_file.read(4096)
if not file_data:
break
ciphertext = aes_enc.update(file_data)
encrypt_file.write(ciphertext)
print("...Complete...")
if os.path.exists(encrypt_path):
if os.path.getsize(input_path) == os.path.getsize(encrypt_path):
print(f'Deleting {input_path}')
os.remove(input_path)
print(f'Renaming {encrypt_path} to {input_path}')
os.rename(encrypt_path, input_path)
except Exception as e:
print(f'EXCEPTION: {str(e)}')