【Java】Jsoup格式化html问题(文本空格折叠等)解决方法

问题说明

Jsoup格式化html文本时,如:

java 复制代码
Document document = Jsoup.parse(html);

这里在对html进行格式化的时候会将如下内容:

html 复制代码
<p>      aaa   </p>

解析成如下格式:

html 复制代码
<p> aaa </p>

即空格折叠问题(HTML的格式规范);

解决方式

在看Jsoup的源码中发现有outputSettings设置类,并且有个属性"prettyPrint",属性在Jsoup的构造函数中是默认设置为true的,也就是会按照html格式规范进行格式化,将此属性设置为false即可将html原样输出,即:

java 复制代码
document.outputSettings(new Document.OutputSettings().prettyPrint(false));

即输出不必再按照html规范进行格式化,即可将处理后的html原样输出。

end。

相关推荐
BestAns20 小时前
一文带你吃透 Java 反射机制
java·后端
wasp52020 小时前
AgentScope Java 核心架构深度解析
java·开发语言·人工智能·架构·agentscope
2501_9167665421 小时前
【Springboot】数据层开发-数据源自动管理
java·spring boot·后端
自在极意功。21 小时前
MyBatis 动态 SQL 详解:从基础到进阶实战
java·数据库·mybatis·动态sql
软件管理系统21 小时前
基于Spring Boot的便民维修管理系统
java·spring boot·后端
百***78751 天前
Step-Audio-2 轻量化接入全流程详解
android·java·gpt·php·llama
快乐肚皮1 天前
MySQL递归CTE
java·数据库·mysql·递归表达式
廋到被风吹走1 天前
【Spring】DispatcherServlet解析
java·后端·spring
廋到被风吹走1 天前
【Spring】PlatformTransactionManager详解
java·spring·wpf