【Java】Jsoup格式化html问题(文本空格折叠等)解决方法

问题说明

Jsoup格式化html文本时,如:

java 复制代码
Document document = Jsoup.parse(html);

这里在对html进行格式化的时候会将如下内容:

html 复制代码
<p>      aaa   </p>

解析成如下格式:

html 复制代码
<p> aaa </p>

即空格折叠问题(HTML的格式规范);

解决方式

在看Jsoup的源码中发现有outputSettings设置类,并且有个属性"prettyPrint",属性在Jsoup的构造函数中是默认设置为true的,也就是会按照html格式规范进行格式化,将此属性设置为false即可将html原样输出,即:

java 复制代码
document.outputSettings(new Document.OutputSettings().prettyPrint(false));

即输出不必再按照html规范进行格式化,即可将处理后的html原样输出。

end。

相关推荐
美好的事情能不能发生在我身上37 分钟前
Hot100中的:贪心专题
java·数据结构·算法
myloveasuka1 小时前
Java与C++多态访问成员变量/方法 对比
java·开发语言·c++
Andya_net1 小时前
Spring | @EventListener事件机制深度解析
java·后端·spring
lang201509281 小时前
18 Byte Buddy 进阶指南:解锁 `@Pipe` 注解,实现灵活的方法转发
java·byte buddy
重庆小透明1 小时前
【java基础篇】详解BigDecimal
java·开发语言
杰克尼2 小时前
苍穹外卖--day08
java·数据库·spring boot·mybatis·notepad++
lierenvip3 小时前
SQL 建表语句详解
java·数据库·sql
kuntli3 小时前
Spring Bean生命周期全解析
java
ok_hahaha3 小时前
java从头开始-苍穹外卖-day06-微信小程序开发-微信登录和商品浏览
java·微信·微信小程序·小程序
Java面试题总结3 小时前
Spring @Validated失效?原因、排查与高效解决方案全解析
java·spring boot·spring