含有换行符的字符串匹配
1.问题说明
Java 后台读取包含 Excel 表格的 Word 文档,此时正文数据字符串包含 \r\n
也就是换行符,想要通过 yaml 配置文件匹配 Excel 表格的表头,但是无论如何都是匹配不上:
java
String excelHeader = configuration.getExcelHeader();
boolean contains = contentStr.contains(excelHeader);
配置如下:
yaml
# 1.匹配结果是 false
excelHeader: "姓名\r\n身份证号\r\n手机号\r\n户籍地\r\n"
# 2.匹配结果也是 false
excelHeader: "姓名\\r\\n身份证号\\r\\n手机号\\r\\n户籍地\\r\\n"
但是在 debug 模式下,将 excelHeader
设置成 姓名\r\n身份证号\r\n手机号\r\n户籍地\r\n
时可以完成匹配:
java
sonString.contains("姓名\r\n身份证号\r\n手机号\r\n户籍地\r\n");
// 此时
result = true
2.问题分析
使用 debug 模式查看了读取的正文数据,查看字符串值时发现 \r\n
转换为 ASCII 值 13
和 14
:
但是读取的配置字符串被转义为 \\r\\n
且转换为 ASCII 时更加离谱:
3.问题解决
java
// 【无法匹配】配置
private String excelHeader;
// 【无法匹配】使用
configuration.getExcelHeader();
// 【可以匹配】配置
private Object excelHeader;
// 【可以匹配】使用
configuration.getExcelHeader().toString();
在 Java 中,toString() 方法通常不会将 \r 转义为 \r。这是因为 toString() 方法的目的是返回对象的字符串表示形式,而不是对特殊字符进行转义。如果直接使用 String 类型,配置里的 \
和 r
都会被认为是字符串,且由于\
的特殊性,会进行转义 \\
导致 \r
变成了 \\r
前边是单个字符,后边是个字符串。