【Java】Jsoup格式化html问题(文本空格折叠等)解决方法

问题说明

Jsoup格式化html文本时,如:

java 复制代码
Document document = Jsoup.parse(html);

这里在对html进行格式化的时候会将如下内容:

html 复制代码
<p>      aaa   </p>

解析成如下格式:

html 复制代码
<p> aaa </p>

即空格折叠问题(HTML的格式规范);

解决方式

在看Jsoup的源码中发现有outputSettings设置类,并且有个属性"prettyPrint",属性在Jsoup的构造函数中是默认设置为true的,也就是会按照html格式规范进行格式化,将此属性设置为false即可将html原样输出,即:

java 复制代码
document.outputSettings(new Document.OutputSettings().prettyPrint(false));

即输出不必再按照html规范进行格式化,即可将处理后的html原样输出。

end。

相关推荐
ZK_H14 小时前
半导体工艺流程
java·c语言·开发语言·计算机网络·金融
Crazy________14 小时前
4.10dockerfile构建镜像
java·开发语言
阿维的博客日记14 小时前
锁消除和锁粗化
java·逃逸分析
云烟成雨TD14 小时前
Spring AI 1.x 系列【26】结构化输出执行流程
java·人工智能·spring
雪的季节14 小时前
qt信号槽跨线程使用时候的坑
java·开发语言·qt
chh56314 小时前
C++--内存管理
java·c语言·c++·windows·学习·面试
白緢15 小时前
嵌入式 Linux + 内核开发高频问题及排查
java·linux·运维
juniperhan15 小时前
Flink 系列第4篇:Flink 时间系统与 Timer 定时器实战精讲
java·大数据·数据仓库·flink
超级大只老咪15 小时前
一维度前缀和解题通用模板(java)
java·开发语言·算法
历程里程碑15 小时前
1 . Git本地操作:版本控制 跨平台协作 仓库核心
java·开发语言·数据结构·c++·git·gitee·github