循环外的语句被重复c ++

Statement outside of loop gets repeated c++

我尝试像编译器一样从用户的输入中读取标记。 标记化工作正常但是当输出所有标记时我想在它们全部给出后换行。

这是我的代码:

#include <iostream>
#include <map>
#include <vector>
//import for using std::getline()
#include <string>

//DIGITs
const std::string DIGITS = "0123456789";
const std::string WHITESPACE = " \t\n\r";

//TOKENS
const std::string TT_INT = "INT";
const std::string TT_FLOAT = "FLOAT";
const std::string TT_PLUS = "PLUS";
const std::string TT_MINUS = "MINUS";
const std::string TT_MUL = "MUL";
const std::string TT_DIV = "DIV";
const std::string TT_LPAREN = "LPAREN";
const std::string TT_RPAREN = "RPAREN";

const std::string TT_INVALID_NUMBER = "INVALID_NUMBER_LITERAL";

class Token{
    public: 
        std::string type;
        std::string value;
    
    void repr(){
        std::cout << type << ":" << "value" << "\n";
    }
};

class Lexer{
    public:
        std::string text;
        int position = -1;
        std::string current_char;
    
    void advance(){
        this->position += 1;
        this->current_char = this->text[this->position];
    }

    void make_digit(std::string *type, std::string *value){
        //if its number or floating point
        std::string digit = "";
        int is_float = 0;
        while(DIGITS.find(this->current_char) != std::string::npos || this->current_char == "."){
            digit += this->current_char;
            if(this->current_char == "."){
                is_float += 1;
            }
            this->advance();
        }
        *value = digit;
        if(is_float == 0){
            *type = TT_INT;
        } else if((0 < is_float) && (is_float < 2)){
            *type = TT_FLOAT;
        } else {
            *type = TT_INVALID_NUMBER;
        }
    }    

    std::vector<std::string> make_tokens(){
        std::vector<std::string> tokens;
        this->advance();

        while (!(this->text.length() <= this->position))
        {
            if(WHITESPACE.find(this->current_char) != std::string::npos){
                //dont add a token
                this->advance();
            } else if(DIGITS.find(this->current_char) != std::string::npos){
                std::string type;
                std::string value;
                this->make_digit(&type, &value);
                tokens.push_back(type);
                tokens.push_back(value);
            } else if(this->current_char == "+"){
                tokens.push_back(TT_PLUS);
                tokens.push_back(this->current_char);
                this->advance();
            } else if(this->current_char == "-"){
                tokens.push_back(TT_MINUS);
                tokens.push_back(this->current_char);
                this->advance();
            } else if(this->current_char == "*"){
                tokens.push_back(TT_MUL);
                tokens.push_back(this->current_char);
                this->advance();
            } else if(this->current_char == "/"){
                tokens.push_back(TT_DIV);
                tokens.push_back(this->current_char);
                this->advance();
            } else if(this->current_char == "("){
                tokens.push_back(TT_LPAREN);
                tokens.push_back(this->current_char);
                this->advance();
            } else if(this->current_char == ")"){
                tokens.push_back(TT_RPAREN);
                tokens.push_back(this->current_char);
                this->advance();
            } else {
                //nothing
                this->advance();
            }
        }             
        return tokens;  
    }

};

int main(){
    //previous: true
    while(std::getline(std::cin, input)){
        std::string input;
        //previous: std::cin >> input;
        //fix
        std::getline(std::cin, input);
        Lexer mylexer;
        mylexer.text = input;
        int x = 0;
        std::vector<std::string> output = mylexer.make_tokens();
        for (int i = 0; i < output.size(); i += 2){
            std::cout << output.at(i) << ":" << output.at(i + 1) << std::endl;
        }
        std::cout << "\n";
    }
};

输入1 + 2时

如我所料

1 + 2
INT:1
PLUS:+
INT:2

here is the cursor

我得到了什么

1 + 2
INT:1

PLUS:+

INT:2

here is the cursor

在最后删除换行符时我得到了这个,但是当输入第二个输入行时它全部在一起没有空行,这不是我想要的

1 + 2
INT:1
PLUS:+
INT:2
here is the cursor

但我希望它看起来像这样

1 + 2
INT:1
PLUS:+
INT:2

3 + 4
INT:3
PLUS:+
INT:4

谁能解释一下这种奇怪的行为是什么? 我错过了什么吗?请注意,我没有太多 C++ 经验。 我正在 windows 使用 clang-cl.exe 进行编译。我还想知道使用 MSYS2 g++.exe

编译时 throw_bad_array_new_lengthv 错误意味着什么

输出中出现额外换行符的原因是因为您正在使用 operator>> 读取 input

operator>>一次只读入1个字。遇到空格时停止读取。

因此,当您输入 1 + 2 作为输入时,您最终调用 make_tokens() 时只有第一个词 1 作为 mylexer.text,然后您的循环打印out INT:1 后跟换行符,然后在循环退出后打印出另一个换行符。然后,您读入下一个单词 +,将其标记化,并打印出 PLUS:+ 后跟 2 个换行符。然后你读入下一个单词 2,将其标记化,并打印出 INT:2 后跟 2 个换行符。

改用std::getline(std::cin, input);。然后你将在一次调用 make_tokens() 中标记整个输入 1 + 2,然后你将打印出你期望的输出类型 - 所有 3 个标记,它们之间有 1 个换行符,然后是 1结束后有更多的换行符。


旁注:您不应该使用 while(true) 循环,尤其是因为您忽略了 std::cin 是否成功读取。您正在导致可能导致代码崩溃的无限循环。

你应该使用std::cin的错误状态在没有更多的输入可读时停止循环,例如:

std::string input;
while (std::cin >> input){
    // use input as needed...
}

或者,在 std::getline() 的情况下:

std::string input;
while (std::getline(std::cin, input)){
    // use input as needed...
}