C++ 最健壮的文件复制方式
C++ most robust way to copy a file
好的,所以我知道磁盘写入错误非常罕见,所以请看过去,因为我正在处理的数据非常重要(比如 SSID 很重要)。因此,我想使用绝对最小的内存量以绝对最可靠的方式复制文件。到目前为止,这是我所得到的。它吸收了很多内存,但我找不到来源。它的工作方式是通过多次重新检查直到得到确认的结果(它可能会大大增加错误的误报数量,但它可能会大大降低实际错误的可能性)。此外,底部的睡眠让您有时间使用 windows 任务管理器分析程序的整体性能。
#include <cstdio> // fopen, fclose, fread, fwrite, BUFSIZ
#include <cstdlib>
#include <unistd.h>
#include <iostream>
using namespace std;
__inline__ bool copy_file(const char* From, const char* To)
{
FILE infile = (*fopen(From, "rb"));
FILE outfile = (*fopen(To, "rwb+"));
setvbuf( &infile, nullptr, _IONBF, 0);
setvbuf( &outfile, nullptr, _IONBF, 0);
fseek(&infile,0,SEEK_END);
long int size = ftell(&infile);
fseek(&infile,0,SEEK_SET);
unsigned short error_amount;
bool success;
char c;
char w;
char l;
for ( fpos_t i=0; (i != size); ++i ) {
error_amount=0;
fsetpos( &infile, &i );
c = fgetc(&infile);
fsetpos( &infile, &i );
success=true;
for ( l=0; (l != 126); ++l ) {
fsetpos( &infile, &i );
success = ( success == ( fgetc(&infile)==c ) );
}
while (success==false) {
fsetpos( &infile, &i );
if (error_amount==32767) {
cerr << "There were 32768 failed attemps at accessing a part of the file! exiting the program...";
return false;
}
++error_amount;
//cout << "an error has occured at position ";
//printf("%d in the file.\n", (int)i);
c = fgetc(&infile);
fsetpos( &infile, &i );
success=true;
for ( l=0; (l != 126); ++l ) {
fsetpos( &infile, &i );
success = ( success == ( fgetc(&infile)==c ) );
}
}
fsetpos( &infile, &i );
fputc( c, &outfile);
fsetpos( &outfile, &i );
error_amount=0;
w = fgetc(&infile);
fsetpos( &outfile, &i );
success=true;
for ( l=0; (l != 126); ++l ) {
fsetpos( &outfile, &i );
success = ( success == ( fgetc(&outfile)==w ) );
}
while (success==false) {
fsetpos( &outfile, &i );
fputc( c, &outfile);
if (error_amount==32767) {
cerr << "There were 32768 failed attemps at writing to a part of the file! exiting the program...";
return false;
}
++error_amount;
w = fgetc(&infile);
fsetpos( &infile, &i );
success=true;
for ( l=0; (l != 126); ++l ) {
fsetpos( &outfile, &i );
success = ( success == ( fgetc(&outfile)==w ) );
}
}
fsetpos( &infile, &i );
}
fclose(&infile);
fclose(&outfile);
return true;
}
int main( void )
{
int CopyResult = copy_file("C:\Users\Admin\Desktop\example file.txt","C:\Users\Admin\Desktop\example copy.txt");
std::cout << "Could it copy the file? " << CopyResult << '\n';
sleep(65535);
return 1;
}
那么,如果我的代码以最佳方式走在正确的轨道上,那么我的代码可以做些什么来改进它?但是,如果我的代码完全不符合最佳解决方案,那么最佳解决方案是什么?请注意,这个问题本质上是关于复制非常非常非常(等)重要数据的应用程序的罕见磁盘写入错误的检测。
我会在没有任何特殊检查的情况下复制文件,最后我会读取文件并将其哈希值与预期值进行比较。对于哈希函数,我会使用 MD5 或 SHA-1。
#include <boost/filesystem.hpp>
#include <iostream>
int main()
{
try
{
boost::filesystem::copy_file( "C:\Users\Admin\Desktop\example file.txt",
"C:\Users\Admin\Desktop\example copy.txt" );
}
catch ( boost::filesystem::filesystem_error const & ex )
{
std::cerr << "Copy failed: " << ex.what();
}
}
这将调用可以说是最可靠的可用实现——操作系统提供的实现——并报告任何失败。
我的观点是:
您保存的数据最终损坏的可能性从一开始就很小。
任何实际上可能存在问题的应用程序都应该 运行 在冗余存储上,a.k.a。 RAID 阵列、执行校验和的文件系统(如 Btrfs, ZFS)等,再次显着减少故障几率 。
在 home-grown I/O 函数中做复杂的事情,另一方面,增加 错误和/或漏报的概率 非常.
好的,所以我知道磁盘写入错误非常罕见,所以请看过去,因为我正在处理的数据非常重要(比如 SSID 很重要)。因此,我想使用绝对最小的内存量以绝对最可靠的方式复制文件。到目前为止,这是我所得到的。它吸收了很多内存,但我找不到来源。它的工作方式是通过多次重新检查直到得到确认的结果(它可能会大大增加错误的误报数量,但它可能会大大降低实际错误的可能性)。此外,底部的睡眠让您有时间使用 windows 任务管理器分析程序的整体性能。
#include <cstdio> // fopen, fclose, fread, fwrite, BUFSIZ
#include <cstdlib>
#include <unistd.h>
#include <iostream>
using namespace std;
__inline__ bool copy_file(const char* From, const char* To)
{
FILE infile = (*fopen(From, "rb"));
FILE outfile = (*fopen(To, "rwb+"));
setvbuf( &infile, nullptr, _IONBF, 0);
setvbuf( &outfile, nullptr, _IONBF, 0);
fseek(&infile,0,SEEK_END);
long int size = ftell(&infile);
fseek(&infile,0,SEEK_SET);
unsigned short error_amount;
bool success;
char c;
char w;
char l;
for ( fpos_t i=0; (i != size); ++i ) {
error_amount=0;
fsetpos( &infile, &i );
c = fgetc(&infile);
fsetpos( &infile, &i );
success=true;
for ( l=0; (l != 126); ++l ) {
fsetpos( &infile, &i );
success = ( success == ( fgetc(&infile)==c ) );
}
while (success==false) {
fsetpos( &infile, &i );
if (error_amount==32767) {
cerr << "There were 32768 failed attemps at accessing a part of the file! exiting the program...";
return false;
}
++error_amount;
//cout << "an error has occured at position ";
//printf("%d in the file.\n", (int)i);
c = fgetc(&infile);
fsetpos( &infile, &i );
success=true;
for ( l=0; (l != 126); ++l ) {
fsetpos( &infile, &i );
success = ( success == ( fgetc(&infile)==c ) );
}
}
fsetpos( &infile, &i );
fputc( c, &outfile);
fsetpos( &outfile, &i );
error_amount=0;
w = fgetc(&infile);
fsetpos( &outfile, &i );
success=true;
for ( l=0; (l != 126); ++l ) {
fsetpos( &outfile, &i );
success = ( success == ( fgetc(&outfile)==w ) );
}
while (success==false) {
fsetpos( &outfile, &i );
fputc( c, &outfile);
if (error_amount==32767) {
cerr << "There were 32768 failed attemps at writing to a part of the file! exiting the program...";
return false;
}
++error_amount;
w = fgetc(&infile);
fsetpos( &infile, &i );
success=true;
for ( l=0; (l != 126); ++l ) {
fsetpos( &outfile, &i );
success = ( success == ( fgetc(&outfile)==w ) );
}
}
fsetpos( &infile, &i );
}
fclose(&infile);
fclose(&outfile);
return true;
}
int main( void )
{
int CopyResult = copy_file("C:\Users\Admin\Desktop\example file.txt","C:\Users\Admin\Desktop\example copy.txt");
std::cout << "Could it copy the file? " << CopyResult << '\n';
sleep(65535);
return 1;
}
那么,如果我的代码以最佳方式走在正确的轨道上,那么我的代码可以做些什么来改进它?但是,如果我的代码完全不符合最佳解决方案,那么最佳解决方案是什么?请注意,这个问题本质上是关于复制非常非常非常(等)重要数据的应用程序的罕见磁盘写入错误的检测。
我会在没有任何特殊检查的情况下复制文件,最后我会读取文件并将其哈希值与预期值进行比较。对于哈希函数,我会使用 MD5 或 SHA-1。
#include <boost/filesystem.hpp>
#include <iostream>
int main()
{
try
{
boost::filesystem::copy_file( "C:\Users\Admin\Desktop\example file.txt",
"C:\Users\Admin\Desktop\example copy.txt" );
}
catch ( boost::filesystem::filesystem_error const & ex )
{
std::cerr << "Copy failed: " << ex.what();
}
}
这将调用可以说是最可靠的可用实现——操作系统提供的实现——并报告任何失败。
我的观点是:
您保存的数据最终损坏的可能性从一开始就很小。
任何实际上可能存在问题的应用程序都应该 运行 在冗余存储上,a.k.a。 RAID 阵列、执行校验和的文件系统(如 Btrfs, ZFS)等,再次显着减少故障几率 。
在 home-grown I/O 函数中做复杂的事情,另一方面,增加 错误和/或漏报的概率 非常.