javaparser - 遇到词法错误:<EOF> 之后:“”

javaparser - Lexical error Encountered: <EOF> after : ""

我正在使用这个 java解析器 https://github.com/javaparser/javaparser 来解析一些 github 用户的大量 java 源代码,以便从中进行一些统计(这是为了一个大学项目)。一切似乎都工作正常,但在某些时候,特定的源代码会产生此错误:

Exception in thread "main" com.github.javaparser.TokenMgrError: Lexical error at line 6, column 2.  Encountered: <EOF> after : ""

这是文件中的内容:

public class Test {
    /**<caret>
    public void foo() {
    }
}

这是我解析文件的方式:

...

new NodeIterator(new NodeIterator.NodeHandler() {
    @Override
    public boolean handle(Node node) {
        ...
    };
}).explore(JavaParser.parse(file));

...

这是节点迭代器class:

public class NodeIterator {
    public interface NodeHandler {
        boolean handle(Node node);
    }

    private NodeHandler nodeHandler;

    public NodeIterator(NodeHandler nodeHandler) {
        this.nodeHandler = nodeHandler;
    }

    public void explore(Node node) {
        if (nodeHandler.handle(node)) {
            for (Node child : node.getChildrenNodes()) {
                explore(child);
            }
        }
    }
}

我已经理解了这个问题,但是这个问题停止了整个解析。我在 for 中有很多文件要解析,所以 我怎样才能继续解析其他文件?或者有没有工具可以在解析之前检查一个java文件是否“写得好”?

你无法解决"the problem",因为这不是问题。错误是正确的,因为您尝试解析的源代码不正确。它有一个在文件结束之前没有终止的注释。

如果用 javac 编译相同的源代码,也会出现错误。它比你的javaparser更详细,但它仍然是一个错误,因为你试图解析的源有这个错误。

Javac 输出:

Test.java:2: error: unclosed comment
    /**<caret>
    ^
Test.java:6: error: reached end of file while parsing
2 errors