【Java】Jsoup格式化html问题(文本空格折叠等)解决方法

问题说明

Jsoup格式化html文本时,如:

java 复制代码
Document document = Jsoup.parse(html);

这里在对html进行格式化的时候会将如下内容:

html 复制代码
<p>      aaa   </p>

解析成如下格式:

html 复制代码
<p> aaa </p>

即空格折叠问题(HTML的格式规范);

解决方式

在看Jsoup的源码中发现有outputSettings设置类,并且有个属性"prettyPrint",属性在Jsoup的构造函数中是默认设置为true的,也就是会按照html格式规范进行格式化,将此属性设置为false即可将html原样输出,即:

java 复制代码
document.outputSettings(new Document.OutputSettings().prettyPrint(false));

即输出不必再按照html规范进行格式化,即可将处理后的html原样输出。

end。

相关推荐
星辰_mya9 分钟前
彩云之上——[特殊字符]的架构师
java·后端·微服务·面试·架构
phltxy20 分钟前
Redis 主从复制
java·数据库·redis
Full Stack Developme20 分钟前
Spring-Core 解析
java·spring·rpc
摇滚侠1 小时前
针对主键索引的 for update 操作有什么用
java
RainCity1 小时前
Java Swing 自定义组件库分享(六)
java·笔记·后端
xuanjiong1 小时前
DDD架构Repository仓储数据流转全链路详解:Domain与其他层的数据流转
java·系统架构
吴声子夜歌1 小时前
Java——类加载机制
java·开发语言·python
Xiacqi11 小时前
Java 中 String、StringBuffer、StringBuilder 的区别
java
Xiacqi11 小时前
Java 常用集合框架手册
java
笨蛋不要掉眼泪2 小时前
Java并发编程:线程的创建和运行
java·开发语言·jvm