自定义 std::fstream、std::filebuf 的上溢和下溢函数没有为每个字符调用
custom std::fstream, std::filebuf's overflow and underflow function not invoked for every character
我正在尝试自定义 std::fstream,这会在读取数据时 encode/decode。
template <class T>
class _filebuf : public std::filebuf {
public:
using transform_type = T;
int_type underflow() override {
auto c = std::filebuf::underflow();
return c < 0 ? c : transform.decode(c);
}
int_type overflow(int_type c) override {
return c < 0 ? c : std::filebuf::overflow(transform.encode(c));
}
private:
transform_type transform;
};
template <class T>
class _fstream : public std::iostream {
public:
using buffer_type = _filebuf<T>;
explicit _fstream(const std::string& path, std::ios::openmode openmode)
: std::iostream(0)
{
this->init(&buffer);
buffer.open(path, openmode);
}
private:
buffer_type buffer;
};
这是一个用法示例:
class _transform {
public:
template <class T>
T encode(T value) const {
return value - 1;
}
template <class T>
T decode(T value) const {
return value + 1;
}
};
int main() {
_fstream<_transform> ofs("test.txt", std::ios::out | std::ios::trunc);
ofs << "ABC"; // outputs "@BC" to the file (@ is 64 in ASCII, so only first character encoded properly)
_fstream<_transform> ifs("test.txt", std::ios::in);
std::string s;
ifs >> s; // inputs "ABC" when "@BC" was in the file so again only first character is decoded
// ...
};
经过我自己的研究,我发现'overflow'函数在这个过程中被调用了两次(65和-1,其中 -1 可能是 EOF),'underflow' 也有两次(64 和 -1)。由于其他字符没有丢失,因此可能在不调用这些函数的情况下以某种方式对其进行了处理。
为什么会发生这种情况以及如何改变它?
std::streambuf<CharT,Traits>::underflow
确保 至少一个 字符在获取区域可用,std::filebuf
的高效实现将始终尝试读取完整的将字符值缓冲到获取区域。除非你寻找流 underflow
不会被再次调用,直到通过调用 sgetn
/xsgetn
或 sbumpc
清空获取区域
我认为包装比扩展文件缓冲区可能更成功。
Boost iostreams 使编写流过滤器变得更加简单。
我正在尝试自定义 std::fstream,这会在读取数据时 encode/decode。
template <class T>
class _filebuf : public std::filebuf {
public:
using transform_type = T;
int_type underflow() override {
auto c = std::filebuf::underflow();
return c < 0 ? c : transform.decode(c);
}
int_type overflow(int_type c) override {
return c < 0 ? c : std::filebuf::overflow(transform.encode(c));
}
private:
transform_type transform;
};
template <class T>
class _fstream : public std::iostream {
public:
using buffer_type = _filebuf<T>;
explicit _fstream(const std::string& path, std::ios::openmode openmode)
: std::iostream(0)
{
this->init(&buffer);
buffer.open(path, openmode);
}
private:
buffer_type buffer;
};
这是一个用法示例:
class _transform {
public:
template <class T>
T encode(T value) const {
return value - 1;
}
template <class T>
T decode(T value) const {
return value + 1;
}
};
int main() {
_fstream<_transform> ofs("test.txt", std::ios::out | std::ios::trunc);
ofs << "ABC"; // outputs "@BC" to the file (@ is 64 in ASCII, so only first character encoded properly)
_fstream<_transform> ifs("test.txt", std::ios::in);
std::string s;
ifs >> s; // inputs "ABC" when "@BC" was in the file so again only first character is decoded
// ...
};
经过我自己的研究,我发现'overflow'函数在这个过程中被调用了两次(65和-1,其中 -1 可能是 EOF),'underflow' 也有两次(64 和 -1)。由于其他字符没有丢失,因此可能在不调用这些函数的情况下以某种方式对其进行了处理。
为什么会发生这种情况以及如何改变它?
std::streambuf<CharT,Traits>::underflow
确保 至少一个 字符在获取区域可用,std::filebuf
的高效实现将始终尝试读取完整的将字符值缓冲到获取区域。除非你寻找流 underflow
不会被再次调用,直到通过调用 sgetn
/xsgetn
或 sbumpc
我认为包装比扩展文件缓冲区可能更成功。
Boost iostreams 使编写流过滤器变得更加简单。