【Java】Jsoup格式化html问题(文本空格折叠等)解决方法

问题说明

Jsoup格式化html文本时,如:

java 复制代码
Document document = Jsoup.parse(html);

这里在对html进行格式化的时候会将如下内容:

html 复制代码
<p>      aaa   </p>

解析成如下格式:

html 复制代码
<p> aaa </p>

即空格折叠问题(HTML的格式规范);

解决方式

在看Jsoup的源码中发现有outputSettings设置类,并且有个属性"prettyPrint",属性在Jsoup的构造函数中是默认设置为true的,也就是会按照html格式规范进行格式化,将此属性设置为false即可将html原样输出,即:

java 复制代码
document.outputSettings(new Document.OutputSettings().prettyPrint(false));

即输出不必再按照html规范进行格式化,即可将处理后的html原样输出。

end。

相关推荐
代码or搬砖6 分钟前
RBAC(权限认证)小例子
java·数据库·spring boot
青蛙大侠公主9 分钟前
Thread及其相关类
java·开发语言
Coder_Boy_10 分钟前
DDD从0到企业级:迭代式学习 (共17章)之 四
java·人工智能·驱动开发·学习
2301_7683502311 分钟前
MySQL为什么选择InnoDB作为存储引擎
java·数据库·mysql
派大鑫wink27 分钟前
【Java 学习日记】开篇:以日记为舟,渡 Java 进阶之海
java·笔记·程序人生·学习方法
lionliu05191 小时前
WebAssembly (Wasm)
java·开发语言·wasm
咸鱼加辣1 小时前
【java面试题】springboot的生命周期
java·开发语言·spring boot
Billow_lamb1 小时前
MyBatis Plus 中常用的插件列表
java·mybatis
程序猿DD2 小时前
人工智能如何改变 Anthropic 的工作方式
java·后端