【Java】Jsoup格式化html问题(文本空格折叠等)解决方法

问题说明

Jsoup格式化html文本时,如:

java 复制代码
Document document = Jsoup.parse(html);

这里在对html进行格式化的时候会将如下内容:

html 复制代码
<p>      aaa   </p>

解析成如下格式:

html 复制代码
<p> aaa </p>

即空格折叠问题(HTML的格式规范);

解决方式

在看Jsoup的源码中发现有outputSettings设置类,并且有个属性"prettyPrint",属性在Jsoup的构造函数中是默认设置为true的,也就是会按照html格式规范进行格式化,将此属性设置为false即可将html原样输出,即:

java 复制代码
document.outputSettings(new Document.OutputSettings().prettyPrint(false));

即输出不必再按照html规范进行格式化,即可将处理后的html原样输出。

end。

相关推荐
这里是彪彪几秒前
Java模拟实现定时器
java·开发语言·python
珂朵莉MM3 分钟前
2025年睿抗机器人开发者大赛CAIP-编程技能赛-本科组(国赛)解题报告 | 珂学家
java·人工智能·算法·机器人·无人机
indexsunny11 分钟前
互联网大厂Java求职面试实战:微服务与Spring Boot在电商场景中的应用
java·数据库·spring boot·微服务·kafka·hibernate·电商
rgeshfgreh16 分钟前
SpringBoot4.0+JDK25+GraalVM:云原生Java新时代
java
逑之17 分钟前
C语言笔记9:指针
java·c语言·笔记
廋到被风吹走21 分钟前
【Spring】AOP深度解析:代理机制、拦截器链与事务失效全解
java·spring·缓存
没有天赋那就反复25 分钟前
JAVA length
java·开发语言·算法
步步为营DotNet33 分钟前
深度探索.NET 中ValueTask:优化异步性能的轻量级利器
java·spring·.net
栈与堆36 分钟前
LeetCode-88-合并两个有序数组
java·开发语言·数据结构·python·算法·leetcode·rust
董世昌4140 分钟前
添加、删除、替换、插入元素的全方法指南
java·开发语言·前端