循环外的语句被重复c ++
Statement outside of loop gets repeated c++
我尝试像编译器一样从用户的输入中读取标记。
标记化工作正常但是当输出所有标记时我想在它们全部给出后换行。
这是我的代码:
#include <iostream>
#include <map>
#include <vector>
//import for using std::getline()
#include <string>
//DIGITs
const std::string DIGITS = "0123456789";
const std::string WHITESPACE = " \t\n\r";
//TOKENS
const std::string TT_INT = "INT";
const std::string TT_FLOAT = "FLOAT";
const std::string TT_PLUS = "PLUS";
const std::string TT_MINUS = "MINUS";
const std::string TT_MUL = "MUL";
const std::string TT_DIV = "DIV";
const std::string TT_LPAREN = "LPAREN";
const std::string TT_RPAREN = "RPAREN";
const std::string TT_INVALID_NUMBER = "INVALID_NUMBER_LITERAL";
class Token{
public:
std::string type;
std::string value;
void repr(){
std::cout << type << ":" << "value" << "\n";
}
};
class Lexer{
public:
std::string text;
int position = -1;
std::string current_char;
void advance(){
this->position += 1;
this->current_char = this->text[this->position];
}
void make_digit(std::string *type, std::string *value){
//if its number or floating point
std::string digit = "";
int is_float = 0;
while(DIGITS.find(this->current_char) != std::string::npos || this->current_char == "."){
digit += this->current_char;
if(this->current_char == "."){
is_float += 1;
}
this->advance();
}
*value = digit;
if(is_float == 0){
*type = TT_INT;
} else if((0 < is_float) && (is_float < 2)){
*type = TT_FLOAT;
} else {
*type = TT_INVALID_NUMBER;
}
}
std::vector<std::string> make_tokens(){
std::vector<std::string> tokens;
this->advance();
while (!(this->text.length() <= this->position))
{
if(WHITESPACE.find(this->current_char) != std::string::npos){
//dont add a token
this->advance();
} else if(DIGITS.find(this->current_char) != std::string::npos){
std::string type;
std::string value;
this->make_digit(&type, &value);
tokens.push_back(type);
tokens.push_back(value);
} else if(this->current_char == "+"){
tokens.push_back(TT_PLUS);
tokens.push_back(this->current_char);
this->advance();
} else if(this->current_char == "-"){
tokens.push_back(TT_MINUS);
tokens.push_back(this->current_char);
this->advance();
} else if(this->current_char == "*"){
tokens.push_back(TT_MUL);
tokens.push_back(this->current_char);
this->advance();
} else if(this->current_char == "/"){
tokens.push_back(TT_DIV);
tokens.push_back(this->current_char);
this->advance();
} else if(this->current_char == "("){
tokens.push_back(TT_LPAREN);
tokens.push_back(this->current_char);
this->advance();
} else if(this->current_char == ")"){
tokens.push_back(TT_RPAREN);
tokens.push_back(this->current_char);
this->advance();
} else {
//nothing
this->advance();
}
}
return tokens;
}
};
int main(){
//previous: true
while(std::getline(std::cin, input)){
std::string input;
//previous: std::cin >> input;
//fix
std::getline(std::cin, input);
Lexer mylexer;
mylexer.text = input;
int x = 0;
std::vector<std::string> output = mylexer.make_tokens();
for (int i = 0; i < output.size(); i += 2){
std::cout << output.at(i) << ":" << output.at(i + 1) << std::endl;
}
std::cout << "\n";
}
};
输入1 + 2时
如我所料
1 + 2
INT:1
PLUS:+
INT:2
here is the cursor
我得到了什么
1 + 2
INT:1
PLUS:+
INT:2
here is the cursor
在最后删除换行符时我得到了这个,但是当输入第二个输入行时它全部在一起没有空行,这不是我想要的
1 + 2
INT:1
PLUS:+
INT:2
here is the cursor
但我希望它看起来像这样
1 + 2
INT:1
PLUS:+
INT:2
3 + 4
INT:3
PLUS:+
INT:4
谁能解释一下这种奇怪的行为是什么?
我错过了什么吗?请注意,我没有太多 C++ 经验。
我正在 windows 使用 clang-cl.exe 进行编译。我还想知道使用 MSYS2 g++.exe
编译时 throw_bad_array_new_lengthv 错误意味着什么
输出中出现额外换行符的原因是因为您正在使用 operator>>
读取 input
。
operator>>
一次只读入1个字。遇到空格时停止读取。
因此,当您输入 1 + 2
作为输入时,您最终调用 make_tokens()
时只有第一个词 1
作为 mylexer.text
,然后您的循环打印out INT:1
后跟换行符,然后在循环退出后打印出另一个换行符。然后,您读入下一个单词 +
,将其标记化,并打印出 PLUS:+
后跟 2 个换行符。然后你读入下一个单词 2
,将其标记化,并打印出 INT:2
后跟 2 个换行符。
改用std::getline(std::cin, input);
。然后你将在一次调用 make_tokens()
中标记整个输入 1 + 2
,然后你将打印出你期望的输出类型 - 所有 3 个标记,它们之间有 1 个换行符,然后是 1结束后有更多的换行符。
旁注:您不应该使用 while(true)
循环,尤其是因为您忽略了 std::cin
是否成功读取。您正在导致可能导致代码崩溃的无限循环。
你应该使用std::cin
的错误状态在没有更多的输入可读时停止循环,例如:
std::string input;
while (std::cin >> input){
// use input as needed...
}
或者,在 std::getline()
的情况下:
std::string input;
while (std::getline(std::cin, input)){
// use input as needed...
}
我尝试像编译器一样从用户的输入中读取标记。 标记化工作正常但是当输出所有标记时我想在它们全部给出后换行。
这是我的代码:
#include <iostream>
#include <map>
#include <vector>
//import for using std::getline()
#include <string>
//DIGITs
const std::string DIGITS = "0123456789";
const std::string WHITESPACE = " \t\n\r";
//TOKENS
const std::string TT_INT = "INT";
const std::string TT_FLOAT = "FLOAT";
const std::string TT_PLUS = "PLUS";
const std::string TT_MINUS = "MINUS";
const std::string TT_MUL = "MUL";
const std::string TT_DIV = "DIV";
const std::string TT_LPAREN = "LPAREN";
const std::string TT_RPAREN = "RPAREN";
const std::string TT_INVALID_NUMBER = "INVALID_NUMBER_LITERAL";
class Token{
public:
std::string type;
std::string value;
void repr(){
std::cout << type << ":" << "value" << "\n";
}
};
class Lexer{
public:
std::string text;
int position = -1;
std::string current_char;
void advance(){
this->position += 1;
this->current_char = this->text[this->position];
}
void make_digit(std::string *type, std::string *value){
//if its number or floating point
std::string digit = "";
int is_float = 0;
while(DIGITS.find(this->current_char) != std::string::npos || this->current_char == "."){
digit += this->current_char;
if(this->current_char == "."){
is_float += 1;
}
this->advance();
}
*value = digit;
if(is_float == 0){
*type = TT_INT;
} else if((0 < is_float) && (is_float < 2)){
*type = TT_FLOAT;
} else {
*type = TT_INVALID_NUMBER;
}
}
std::vector<std::string> make_tokens(){
std::vector<std::string> tokens;
this->advance();
while (!(this->text.length() <= this->position))
{
if(WHITESPACE.find(this->current_char) != std::string::npos){
//dont add a token
this->advance();
} else if(DIGITS.find(this->current_char) != std::string::npos){
std::string type;
std::string value;
this->make_digit(&type, &value);
tokens.push_back(type);
tokens.push_back(value);
} else if(this->current_char == "+"){
tokens.push_back(TT_PLUS);
tokens.push_back(this->current_char);
this->advance();
} else if(this->current_char == "-"){
tokens.push_back(TT_MINUS);
tokens.push_back(this->current_char);
this->advance();
} else if(this->current_char == "*"){
tokens.push_back(TT_MUL);
tokens.push_back(this->current_char);
this->advance();
} else if(this->current_char == "/"){
tokens.push_back(TT_DIV);
tokens.push_back(this->current_char);
this->advance();
} else if(this->current_char == "("){
tokens.push_back(TT_LPAREN);
tokens.push_back(this->current_char);
this->advance();
} else if(this->current_char == ")"){
tokens.push_back(TT_RPAREN);
tokens.push_back(this->current_char);
this->advance();
} else {
//nothing
this->advance();
}
}
return tokens;
}
};
int main(){
//previous: true
while(std::getline(std::cin, input)){
std::string input;
//previous: std::cin >> input;
//fix
std::getline(std::cin, input);
Lexer mylexer;
mylexer.text = input;
int x = 0;
std::vector<std::string> output = mylexer.make_tokens();
for (int i = 0; i < output.size(); i += 2){
std::cout << output.at(i) << ":" << output.at(i + 1) << std::endl;
}
std::cout << "\n";
}
};
输入1 + 2时
如我所料
1 + 2
INT:1
PLUS:+
INT:2
here is the cursor
我得到了什么
1 + 2
INT:1
PLUS:+
INT:2
here is the cursor
在最后删除换行符时我得到了这个,但是当输入第二个输入行时它全部在一起没有空行,这不是我想要的
1 + 2
INT:1
PLUS:+
INT:2
here is the cursor
但我希望它看起来像这样
1 + 2
INT:1
PLUS:+
INT:2
3 + 4
INT:3
PLUS:+
INT:4
谁能解释一下这种奇怪的行为是什么? 我错过了什么吗?请注意,我没有太多 C++ 经验。 我正在 windows 使用 clang-cl.exe 进行编译。我还想知道使用 MSYS2 g++.exe
编译时 throw_bad_array_new_lengthv 错误意味着什么输出中出现额外换行符的原因是因为您正在使用 operator>>
读取 input
。
operator>>
一次只读入1个字。遇到空格时停止读取。
因此,当您输入 1 + 2
作为输入时,您最终调用 make_tokens()
时只有第一个词 1
作为 mylexer.text
,然后您的循环打印out INT:1
后跟换行符,然后在循环退出后打印出另一个换行符。然后,您读入下一个单词 +
,将其标记化,并打印出 PLUS:+
后跟 2 个换行符。然后你读入下一个单词 2
,将其标记化,并打印出 INT:2
后跟 2 个换行符。
改用std::getline(std::cin, input);
。然后你将在一次调用 make_tokens()
中标记整个输入 1 + 2
,然后你将打印出你期望的输出类型 - 所有 3 个标记,它们之间有 1 个换行符,然后是 1结束后有更多的换行符。
旁注:您不应该使用 while(true)
循环,尤其是因为您忽略了 std::cin
是否成功读取。您正在导致可能导致代码崩溃的无限循环。
你应该使用std::cin
的错误状态在没有更多的输入可读时停止循环,例如:
std::string input;
while (std::cin >> input){
// use input as needed...
}
或者,在 std::getline()
的情况下:
std::string input;
while (std::getline(std::cin, input)){
// use input as needed...
}