antlr4 正则表达式生成器5解决正则输入错误问题

1、antlr4 错误处理

默认情况下,ANTLR将所有的错误消息送至标准错误(standard error),不过我们可以通过实现接口ANTLRErrorListener来改变这些消息的目标输出和内容。

该接口有一个同时应用于词法分析器和语法分析器的syntaxError()方法。syntaxError()方法接收各式各样的信息,无论是错误的位置还是错误的内容。它还接收指向语法分析器的引用,因此我们能够通过该引用来查询识别过程的状态。

2、添加错误处理

1、创建错误处理类ErrorListener

java 复制代码
public class ErrorListener extends BaseErrorListener {

    private  String regex;

    public ErrorListener(String regex) {
        this.regex = regex;
    }

    @Override
    public void syntaxError(Recognizer<?, ?> recognizer, Object offendingSymbol, int line,
                            int charPositionInLine, String msg, RecognitionException e) {
        super.syntaxError(recognizer, offendingSymbol, line, charPositionInLine, msg, e);

        String content = regex.substring(0, charPositionInLine + 1);

        StaticLog.error("regex parse syntax error: expression = {}, msg = {}", regex, msg);

        throw new RuntimeException("第" + line + "行,语法错误,错误内容:" + content + ",错误消息:" + msg);

    }
}

2、添加错误监听器

使用这种方法,我们的程序就能在语法分析器调用起始规则之前,轻易地为其增加一个错误监听器。

在我们增加自定义的错误监听器之前,我们需要移除输出目标是控制台的内置错误监听器,以防出现重复的错误消息。

ini 复制代码
public static String gen(String regex) {

    if (regex.startsWith("^")) {
        regex = regex.substring(1);
    }
    if (regex.endsWith("$")) {
        regex = regex.substring(0,regex.length()-1);
    }

    ErrorListener errorListener = new ErrorListener(regex);
    regexLexer regexLexer = new regexLexer(CharStreams.fromString(regex));
    // 移除默认的错误监听器
    regexLexer.removeErrorListeners();
    // 添加新的错误监听器
    regexLexer.addErrorListener(errorListener);
    CommonTokenStream tokens = new CommonTokenStream(regexLexer);
    regexParser parser = new regexParser(tokens);
    // 移除默认的错误监听器
    parser.removeErrorListeners();
    // 添加新的错误监听器
    parser.addErrorListener(errorListener);
    regexParser.RootContext root = parser.root();
    RegVistor2 regexVisitor = new RegVistor2();
    return regexVisitor.visitRoot(root);
}

3、测试代码

csharp 复制代码
System.out.println(RegexUtil.gen("([)11]{aaaqqqxx2"));

输出如下:

css 复制代码
[2024-01-31 09:18:45] [ERROR] com.regex.ErrorListener: regex parse syntax error: expression = ([)11]{aaaqqqxx2, msg = token recognition error at: 'a'
Exception in thread "main" java.lang.RuntimeException: 第1行,语法错误,错误内容:([)11]{a,错误消息:token recognition error at: 'a'
相关推荐
永远不会的CC4 小时前
浙江华昱欣实习(4月23日~ 4月19日)
后端·学习
直奔標竿4 小时前
Java开发者AI转型第二十五课!Spring AI 个人知识库实战(四)——RAG来源追溯落地,拒绝AI幻觉
java·开发语言·人工智能·spring boot·后端·spring
嘟嘟MD4 小时前
程序员副业 | 2026年4月复盘
后端·创业
时空系4 小时前
认识Rust——我的第一个程序 Rust中文编程
开发语言·后端·rust
DevilSeagull5 小时前
Windows 批处理 (Batch) 编程: 从入门到入土. (一) 基础概念与环境配置
开发语言·windows·后端·batch·语言
CAE虚拟与现实5 小时前
五一假期闲来无事,来个前段、后端的说明吧
前端·后端·vtk·three.js·前后端
0xDevNull5 小时前
Java泛型详解
java·开发语言·后端
yeeanna5 小时前
GO函数的特殊性
开发语言·后端·golang
时空系5 小时前
第6篇:数据容器——管理大量数据 Rust中文编程
开发语言·后端·rust
eLIN TECE5 小时前
Go基础之环境搭建
开发语言·后端·golang