【Java】Jsoup格式化html问题(文本空格折叠等)解决方法

问题说明

Jsoup格式化html文本时,如:

java 复制代码
Document document = Jsoup.parse(html);

这里在对html进行格式化的时候会将如下内容:

html 复制代码
<p>      aaa   </p>

解析成如下格式:

html 复制代码
<p> aaa </p>

即空格折叠问题(HTML的格式规范);

解决方式

在看Jsoup的源码中发现有outputSettings设置类,并且有个属性"prettyPrint",属性在Jsoup的构造函数中是默认设置为true的,也就是会按照html格式规范进行格式化,将此属性设置为false即可将html原样输出,即:

java 复制代码
document.outputSettings(new Document.OutputSettings().prettyPrint(false));

即输出不必再按照html规范进行格式化,即可将处理后的html原样输出。

end。

相关推荐
wellc4 小时前
SpringBoot集成Flowable
java·spring boot·后端
Hui Baby5 小时前
springAi+MCP三种
java
hsjcjh5 小时前
【MySQL】C# 连接MySQL
java
敖正炀5 小时前
LinkedBlockingDeque详解
java
wangyadong3175 小时前
datagrip 链接mysql 报错
java
untE EADO5 小时前
Tomcat的server.xml配置详解
xml·java·tomcat
ictI CABL5 小时前
Tomcat 乱码问题彻底解决
java·tomcat
敖正炀5 小时前
DelayQueue 详解
java
敖正炀6 小时前
PriorityBlockingQueue 详解
java
shark22222226 小时前
Spring 的三种注入方式?
java·数据库·spring