哈夫曼解码函数重复解压一个字符
Huffman Decoding Function Uncompressing One Character Repeatedly
我有一个程序可以根据在文本输入文件中读取的 ASCII 字符频率生成哈夫曼树。霍夫曼编码存储在一个包含 256 个元素的字符串数组中,如果未读取该字符,则为空字符串。该程序还对输出文件进行编码和压缩。
我现在正在尝试解压缩和解码我当前作为输入文件打开的输出文件,新的输出文件的解码消息与原始文本输入文件相同。
我对这部分作业的思考过程是用霍夫曼代码重新创建一棵树,然后一次读取 8 位,遍历树直到我到达一个叶节点,在那里我将更新一个空字符串( string answer) 然后输出到我的输出文件。
我的问题:编写此函数后,我发现在原始输入文件的所有其他字符之间只有一个字符重复输出。我对为什么会这样感到困惑,因为我希望输出文件与原始输入文件相同。
对此问题的任何指导或解决方案表示赞赏。
(对于encodedOutput函数,fileName为输入文件参数,fileName2为输出文件参数)
(对于decodeOutput函数,fileName2为输入文件参数,fileName 3为输出文件参数)
code[256] 是这两个函数的参数,保存原始输入文件中读取的每个唯一字符的霍夫曼代码,例如,输入文件中读取的字符 'H' 可能在将代码传递给函数时,将代码“111”存储在代码[72]的代码数组中。
freq[256] 保存每个 ascii 字符读取的频率,如果不在原始输入文件中则保存 0。
void encodeOutput(const string & fileName, const string & fileName2, string code[256]) {
ifstream ifile;
ifile.open(fileName, ios::binary);
if (!ifile)
{
die("Can't read again");
}
ofstream ofile;
ofile.open(fileName2, ios::binary);
if (!ofile) {
die("Can't open encoding output file");
}
int read;
read = ifile.get();
char buffer = 0, bit_count = 0;
while (read != -1) {
for (unsigned b = 0; b < code[read].size(); b++) { // loop through bits (code[read] outputs huffman code)
buffer <<= 1;
buffer |= code[read][b] != '0';
bit_count++;
if (bit_count == 8) {
ofile << buffer;
buffer = 0;
bit_count = 0;
}
}
read = ifile.get();
}
if (bit_count != 0)
ofile << (buffer << (8 - bit_count));
ifile.close();
ofile.close();
}
// Work in progress
void decodeOutput(const string & fileName2, const string & fileName3, string code[256], const unsigned long long freq[256]) {
ifstream ifile;
ifile.open(fileName2, ios::binary);
if (!ifile)
{
die("Can't read again");
}
ofstream ofile;
ofile.open(fileName3, ios::binary);
if (!ofile) {
die("Can't open encoding output file");
}
priority_queue < node > q;
for (unsigned i = 0; i < 256; i++) {
if (freq[i] == 0) {
code[i] = "";
}
}
for (unsigned i = 0; i < 256; i++)
if (freq[i])
q.push(node(unsigned(i), freq[i]));
if (q.size() < 1) {
die("no data");
}
while (q.size() > 1) {
node *child0 = new node(q.top());
q.pop();
node *child1 = new node(q.top());
q.pop();
q.push(node(child0, child1));
} // created the tree
string answer = "";
const node * temp = &q.top(); // root
for (int c; (c = ifile.get()) != EOF;) {
for (unsigned p = 8; p--;) { //reading 8 bits at a time
if ((c >> p & 1) == '0') { // if bit is a 0
temp = temp->child0; // go left
}
else { // if bit is a 1
temp = temp->child1; // go right
}
if (temp->child0 == NULL && temp->child1 == NULL) // leaf node
{
ans += temp->value;
temp = &q.top();
}
ofile << ans;
}
}
}
(c >> p & 1) == '0'
当 (c >> p & 1)
等于 48 时, 仅 return 为真,因此您的 if 语句将始终跟在 else 分支之后。正确的代码是:
(c >> p & 1) == 0
我有一个程序可以根据在文本输入文件中读取的 ASCII 字符频率生成哈夫曼树。霍夫曼编码存储在一个包含 256 个元素的字符串数组中,如果未读取该字符,则为空字符串。该程序还对输出文件进行编码和压缩。
我现在正在尝试解压缩和解码我当前作为输入文件打开的输出文件,新的输出文件的解码消息与原始文本输入文件相同。
我对这部分作业的思考过程是用霍夫曼代码重新创建一棵树,然后一次读取 8 位,遍历树直到我到达一个叶节点,在那里我将更新一个空字符串( string answer) 然后输出到我的输出文件。
我的问题:编写此函数后,我发现在原始输入文件的所有其他字符之间只有一个字符重复输出。我对为什么会这样感到困惑,因为我希望输出文件与原始输入文件相同。
对此问题的任何指导或解决方案表示赞赏。
(对于encodedOutput函数,fileName为输入文件参数,fileName2为输出文件参数)
(对于decodeOutput函数,fileName2为输入文件参数,fileName 3为输出文件参数)
code[256] 是这两个函数的参数,保存原始输入文件中读取的每个唯一字符的霍夫曼代码,例如,输入文件中读取的字符 'H' 可能在将代码传递给函数时,将代码“111”存储在代码[72]的代码数组中。
freq[256] 保存每个 ascii 字符读取的频率,如果不在原始输入文件中则保存 0。
void encodeOutput(const string & fileName, const string & fileName2, string code[256]) {
ifstream ifile;
ifile.open(fileName, ios::binary);
if (!ifile)
{
die("Can't read again");
}
ofstream ofile;
ofile.open(fileName2, ios::binary);
if (!ofile) {
die("Can't open encoding output file");
}
int read;
read = ifile.get();
char buffer = 0, bit_count = 0;
while (read != -1) {
for (unsigned b = 0; b < code[read].size(); b++) { // loop through bits (code[read] outputs huffman code)
buffer <<= 1;
buffer |= code[read][b] != '0';
bit_count++;
if (bit_count == 8) {
ofile << buffer;
buffer = 0;
bit_count = 0;
}
}
read = ifile.get();
}
if (bit_count != 0)
ofile << (buffer << (8 - bit_count));
ifile.close();
ofile.close();
}
// Work in progress
void decodeOutput(const string & fileName2, const string & fileName3, string code[256], const unsigned long long freq[256]) {
ifstream ifile;
ifile.open(fileName2, ios::binary);
if (!ifile)
{
die("Can't read again");
}
ofstream ofile;
ofile.open(fileName3, ios::binary);
if (!ofile) {
die("Can't open encoding output file");
}
priority_queue < node > q;
for (unsigned i = 0; i < 256; i++) {
if (freq[i] == 0) {
code[i] = "";
}
}
for (unsigned i = 0; i < 256; i++)
if (freq[i])
q.push(node(unsigned(i), freq[i]));
if (q.size() < 1) {
die("no data");
}
while (q.size() > 1) {
node *child0 = new node(q.top());
q.pop();
node *child1 = new node(q.top());
q.pop();
q.push(node(child0, child1));
} // created the tree
string answer = "";
const node * temp = &q.top(); // root
for (int c; (c = ifile.get()) != EOF;) {
for (unsigned p = 8; p--;) { //reading 8 bits at a time
if ((c >> p & 1) == '0') { // if bit is a 0
temp = temp->child0; // go left
}
else { // if bit is a 1
temp = temp->child1; // go right
}
if (temp->child0 == NULL && temp->child1 == NULL) // leaf node
{
ans += temp->value;
temp = &q.top();
}
ofile << ans;
}
}
}
(c >> p & 1) == '0'
当 (c >> p & 1)
等于 48 时,仅 return 为真,因此您的 if 语句将始终跟在 else 分支之后。正确的代码是:
(c >> p & 1) == 0