【Java】Jsoup格式化html问题(文本空格折叠等)解决方法

问题说明

Jsoup格式化html文本时,如:

java 复制代码
Document document = Jsoup.parse(html);

这里在对html进行格式化的时候会将如下内容:

html 复制代码
<p>      aaa   </p>

解析成如下格式:

html 复制代码
<p> aaa </p>

即空格折叠问题(HTML的格式规范);

解决方式

在看Jsoup的源码中发现有outputSettings设置类,并且有个属性"prettyPrint",属性在Jsoup的构造函数中是默认设置为true的,也就是会按照html格式规范进行格式化,将此属性设置为false即可将html原样输出,即:

java 复制代码
document.outputSettings(new Document.OutputSettings().prettyPrint(false));

即输出不必再按照html规范进行格式化,即可将处理后的html原样输出。

end。

相关推荐
J2虾虾几秒前
Java使用的可以使用的脚本执行引擎
java·开发语言·脚本执行
老马识途2.06 分钟前
java处理接口返回的json数据步骤 包括重试处理,异常抛出,日志打印,注意事项
java·开发语言
2***d8857 分钟前
Spring Boot中的404错误:原因、影响及处理策略
java·spring boot·后端
c***69308 分钟前
Springboot项目:使用MockMvc测试get和post接口(含单个和多个请求参数场景)
java·spring boot·后端
6***A6639 分钟前
Springboot中SLF4J详解
java·spring boot·后端
五阿哥永琪9 分钟前
Hutool中常用的工具类&真实项目的黄金组合
java
xun-ming12 分钟前
Redis实战之7种数据结构
java
5***846417 分钟前
Spring Boot的项目结构
java·spring boot·后端
SimonKing18 分钟前
基于Netty的TCP协议的Socket客户端
java·后端·程序员
程序员飞哥18 分钟前
几年没面试,这次真的被打醒了!
java·面试