安全有效地替换文件的最佳方法?

Best way to replace files in place safely and efficiently?

我正在尝试使用 cryptography 模块就地加密文件,因此我不必缓冲可能占用大量内存的文件的密文,然后我将不得不用它替换原始文件encrypted one.so 我的解决方案是加密一大块明文,然后尝试一次用 16 字节的密文替换它(AES-CTR 模式)。问题似乎是循环是无限循环。

pointer = 0
with open(path, "r+b") as file:
   print("...ENCRYPTING")
   while file:
        file_data = file.read(16)
        pointer += 16
        ciphertext = aes_enc.update(file_data)
        file.seek(pointer-16)
        file.write(ciphertext)
    print("...Complete...")

文件对象没有“真实性”,因此您不能将其用作循环的条件。

读取时文件位于 EOF() returns 一个空字节对象 (https://docs.python.org/3/library/io.html#io.BufferedIOBase.read)

with open(path, "r+b") as file:
   print("...ENCRYPTING")
    while True:
        file_data = file.read(16)
        if not file_data:
            break
        ciphertext = aes_enc.update(file_data)
        file.seek(-len(file_data), os.SEEK_CUR)
        file.write(ciphertext)
    print("...Complete...")
  • 那么如何解决这个问题。

正如 Cyril Jouve 已经提到的,检查 如果不是 file_data

  • 您还有什么建议。
  • 使用下面这种方法的副作用是什么。

读取 16 个字节的块相对较慢。我猜你有足够的内存来读取更大的块,如 4096、8192 ...

除非你有非常大的文件和有限的磁盘空间,否则我认为在同一个文件中读取和写入没有任何好处。如果出现错误并且 os 已经将数据写入磁盘,您将拥有 lost 原始数据并且将拥有一个不完整的加密文件,您不知道哪个部分被加密.

如果没有错误,创建一个新的加密文件然后删除并重命名会更容易和节省。

加密到一个新文件,捕获异常,检查加密文件的存在和大小,删除源并重命名加密文件,只有在一切正常的情况下。

import os

path = r'D:\test.dat'

input_path = path
encrypt_path = path + '_encrypt'

try:
    with open(input_path, "rb") as input_file:
        with open(encrypt_path, "wb") as encrypt_file:

            print("...ENCRYPTING")

            while True:

                file_data = input_file.read(4096)
                if not file_data:
                    break

                ciphertext = aes_enc.update(file_data)
                encrypt_file.write(ciphertext)

            print("...Complete...")

    if os.path.exists(encrypt_path):
        if os.path.getsize(input_path) == os.path.getsize(encrypt_path):
            print(f'Deleting {input_path}')
            os.remove(input_path)
            print(f'Renaming {encrypt_path} to {input_path}')
            os.rename(encrypt_path, input_path)

except Exception as e:
    print(f'EXCEPTION: {str(e)}')