【Java】Jsoup格式化html问题(文本空格折叠等)解决方法

问题说明

Jsoup格式化html文本时,如:

java 复制代码
Document document = Jsoup.parse(html);

这里在对html进行格式化的时候会将如下内容:

html 复制代码
<p>      aaa   </p>

解析成如下格式:

html 复制代码
<p> aaa </p>

即空格折叠问题(HTML的格式规范);

解决方式

在看Jsoup的源码中发现有outputSettings设置类,并且有个属性"prettyPrint",属性在Jsoup的构造函数中是默认设置为true的,也就是会按照html格式规范进行格式化,将此属性设置为false即可将html原样输出,即:

java 复制代码
document.outputSettings(new Document.OutputSettings().prettyPrint(false));

即输出不必再按照html规范进行格式化,即可将处理后的html原样输出。

end。

相关推荐
卡布奇诺-海晨4 分钟前
2025版本的idea解决Git冲突
java·git·intellij-idea
Flash Dog5 分钟前
【MyBatis】——执行过程
java·mybatis
Li_7695327 分钟前
2025.2.X 版本 IDEA maven 打包乱码问题的解决
java·maven·intellij-idea
DKPT1 小时前
JVM栈溢出和堆溢出哪个先满?
java·开发语言·jvm·笔记·学习
m0_475064501 小时前
jvm双亲委派的含义
java·jvm
毕设源码-朱学姐6 小时前
【开题答辩全过程】以 爱心捐赠网站为例,包含答辩的问题和答案
java·eclipse
尘觉7 小时前
中秋节与 Spring Boot 的思考:一场开箱即用的团圆盛宴
java·spring boot·后端
Le1Yu8 小时前
2025-10-7学习笔记
java·笔记·学习
popoxf8 小时前
spring容器启动流程(反射视角)
java·后端·spring
AAA修煤气灶刘哥9 小时前
监控摄像头?不,我们管这个叫优雅的埋点艺术!
java·后端·spring cloud