Java【代码 19】含有换行符\r\n的字符串匹配(源码分享)处理Word文档里的Excel表格数据

1.问题说明

Java 后台读取包含 Excel 表格的 Word 文档,此时正文数据字符串包含 \r\n也就是换行符,想要通过 yaml 配置文件匹配 Excel 表格的表头,但是无论如何都是匹配不上:

java 复制代码
String excelHeader = configuration.getExcelHeader();
boolean contains = contentStr.contains(excelHeader);

配置如下:

yaml 复制代码
# 1.匹配结果是 false
excelHeader: "姓名\r\n身份证号\r\n手机号\r\n户籍地\r\n"

# 2.匹配结果也是 false
excelHeader: "姓名\\r\\n身份证号\\r\\n手机号\\r\\n户籍地\\r\\n"

但是在 debug 模式下,将 excelHeader设置成 姓名\r\n身份证号\r\n手机号\r\n户籍地\r\n时可以完成匹配:

java 复制代码
sonString.contains("姓名\r\n身份证号\r\n手机号\r\n户籍地\r\n");
// 此时
result = true

2.问题分析

使用 debug 模式查看了读取的正文数据,查看字符串值时发现 \r\n转换为 ASCII 值 1314

但是读取的配置字符串被转义为 \\r\\n且转换为 ASCII 时更加离谱:

3.问题解决

java 复制代码
// 【无法匹配】配置
private String excelHeader;
// 【无法匹配】使用
configuration.getExcelHeader();

// 【可以匹配】配置
private Object excelHeader;
// 【可以匹配】使用
configuration.getExcelHeader().toString();

在 Java 中,toString() 方法通常不会将 \r 转义为 \r。这是因为 toString() 方法的目的是返回对象的字符串表示形式,而不是对特殊字符进行转义。如果直接使用 String 类型,配置里的 \r都会被认为是字符串,且由于\的特殊性,会进行转义 \\导致 \r变成了 \\r前边是单个字符,后边是个字符串。

相关推荐
转转技术团队5 分钟前
打造亿级流量开放平台的架构演进与工程实战
后端·微服务·架构
_风不会停息10 分钟前
RocketMQ 启动过程分析&大流量场景优化
后端·rocketmq
微笑听雨20 分钟前
基于 Drools 的规则引擎性能调优实践:架构、缓存与编译优化全解析
java·后端
五岁小孩吖32 分钟前
实操使用 go pprof 对生产环境进行性能分析(问题定位及代码优化)
后端
_風箏35 分钟前
Java【代码 21】将word、excel文件转换为pdf格式和将pdf文档转换为image格式工具类分享(Gitee源码)aspose转换中文乱码问题处理
后端
景天科技苑36 分钟前
【Rust多进程】征服CPU的艺术:Rust多进程实战指南
开发语言·后端·rust·rust多进程·rust进程·多进程编程
随意石光37 分钟前
JWT在Spring Security中的实战应用:认证、授权一网打尽
后端
就是帅我不改39 分钟前
深入实战模板方法模式与装饰器模式:模板方法模式与装饰器模式在电商系统中的应用
后端
hello早上好39 分钟前
Spring AOP MethodInvocation 工作原理
java·后端·架构
Emma歌小白1 小时前
Vetur can't find tsconfig.json, jsconfig.json in /xxxx/xxxxxx.
javascript·后端