C++ 最健壮的文件复制方式

C++ most robust way to copy a file

好的,所以我知道磁盘写入错误非常罕见,所以请看过去,因为我正在处理的数据非常重要(比如 SSID 很重要)。因此,我想使用绝对最小的内存量以绝对最可靠的方式复制文件。到目前为止,这是我所得到的。它吸收了很多内存,但我找不到来源。它的工作方式是通过多次重新检查直到得到确认的结果(它可能会大大增加错误的误报数量,但它可能会大大降低实际错误的可能性)。此外,底部的睡眠让您有时间使用 windows 任务管理器分析程序的整体性能。


#include <cstdio>   // fopen, fclose, fread, fwrite, BUFSIZ
#include <cstdlib>
#include <unistd.h>
#include <iostream>

using namespace std;

__inline__ bool copy_file(const char* From, const char* To)
{
    FILE infile = (*fopen(From, "rb"));
    FILE outfile = (*fopen(To, "rwb+"));
    setvbuf( &infile, nullptr, _IONBF, 0);
    setvbuf( &outfile, nullptr, _IONBF, 0);

    fseek(&infile,0,SEEK_END);
    long int size = ftell(&infile);
    fseek(&infile,0,SEEK_SET);
    unsigned short error_amount;
    bool success;
    char c;
    char w;
    char l;

    for ( fpos_t i=0; (i != size); ++i ) {
        error_amount=0;
        fsetpos( &infile, &i );
        c = fgetc(&infile);
        fsetpos( &infile, &i );
        success=true;
        for ( l=0; (l != 126); ++l ) {
            fsetpos( &infile, &i );
            success = ( success == ( fgetc(&infile)==c ) );
        }
        while (success==false) {
            fsetpos( &infile, &i );
            if (error_amount==32767) {
                cerr << "There were 32768 failed attemps at accessing a part of the file! exiting the program...";
                return false;
            }
            ++error_amount;
            //cout << "an error has occured at position ";
            //printf("%d in the file.\n", (int)i);
            c = fgetc(&infile);
            fsetpos( &infile, &i );
            success=true;
            for ( l=0; (l != 126); ++l ) {
                fsetpos( &infile, &i );
                success = ( success == ( fgetc(&infile)==c ) );
            }
        }



        fsetpos( &infile, &i );
        fputc( c, &outfile);
        fsetpos( &outfile, &i );


        error_amount=0;
        w = fgetc(&infile);
        fsetpos( &outfile, &i );
        success=true;
        for ( l=0; (l != 126); ++l ) {
            fsetpos( &outfile, &i );
            success = ( success == ( fgetc(&outfile)==w ) );
        }
        while (success==false) {
            fsetpos( &outfile, &i );
            fputc( c, &outfile);
            if (error_amount==32767) {
                cerr << "There were 32768 failed attemps at writing to a part of the file! exiting the program...";
                return false;
            }
            ++error_amount;
            w = fgetc(&infile);
            fsetpos( &infile, &i );
            success=true;
            for ( l=0; (l != 126); ++l ) {
                fsetpos( &outfile, &i );
                success = ( success == ( fgetc(&outfile)==w ) );
            }
        }
        fsetpos( &infile, &i );
    }

    fclose(&infile);
    fclose(&outfile);

    return true;
}

int main( void )
{
    int CopyResult = copy_file("C:\Users\Admin\Desktop\example file.txt","C:\Users\Admin\Desktop\example copy.txt");

    std::cout << "Could it copy the file? " << CopyResult << '\n';

    sleep(65535);
    return 1;
}


那么,如果我的代码以最佳方式走在正确的轨道上,那么我的代码可以做些什么来改进它?但是,如果我的代码完全不符合最佳解决方案,那么最佳解决方案是什么?请注意,这个问题本质上是关于复制非常非常非常(等)重要数据的应用程序的罕见磁盘写入错误的检测。

我会在没有任何特殊检查的情况下复制文件,最后我会读取文件并将其哈希值与预期值进行比较。对于哈希函数,我会使用 MD5 或 SHA-1。

#include <boost/filesystem.hpp>
#include <iostream>

int main()
{
    try
    {
        boost::filesystem::copy_file( "C:\Users\Admin\Desktop\example file.txt",
                                      "C:\Users\Admin\Desktop\example copy.txt" );
    }
    catch ( boost::filesystem::filesystem_error const & ex )
    {
        std::cerr << "Copy failed: " << ex.what();
    }
}

这将调用可以说是最可靠的可用实现——操作系统提供的实现——并报告任何失败。


我的观点是:

您保存的数据最终损坏的可能性从一开始就很小。

任何实际上可能存在问题的应用程序都应该 运行 在冗余存储上,a.k.a。 RAID 阵列、执行校验和的文件系统(如 Btrfs, ZFS)等,再次显着减少故障几率

在 home-grown I/O 函数中做复杂的事情,另一方面,增加 错误和/或漏报的概率 非常.