【Java】Jsoup格式化html问题(文本空格折叠等)解决方法

问题说明

Jsoup格式化html文本时,如:

java 复制代码
Document document = Jsoup.parse(html);

这里在对html进行格式化的时候会将如下内容:

html 复制代码
<p>      aaa   </p>

解析成如下格式:

html 复制代码
<p> aaa </p>

即空格折叠问题(HTML的格式规范);

解决方式

在看Jsoup的源码中发现有outputSettings设置类,并且有个属性"prettyPrint",属性在Jsoup的构造函数中是默认设置为true的,也就是会按照html格式规范进行格式化,将此属性设置为false即可将html原样输出,即:

java 复制代码
document.outputSettings(new Document.OutputSettings().prettyPrint(false));

即输出不必再按照html规范进行格式化,即可将处理后的html原样输出。

end。

相关推荐
ZBritney3 小时前
JAVA中的多线程
java
whn19774 小时前
达梦数据库的整体负载变化查看
java·开发语言·数据库
小满、4 小时前
RabbitMQ:Fanout、Direct、Topic 交换机、队列声明与消息转换器
java·分布式·消息队列·rabbitmq·spring amqp
檀越剑指大厂4 小时前
【Idea系列】换行处理
java·ide·intellij-idea
wanghowie4 小时前
01.04 Java基础篇|泛型、注解与反射实战
java·开发语言·windows
深圳佛手4 小时前
Java大对象(如 List、Map)如何复用?错误的方法是?正确的方法是?
java·jvm·windows
言之。4 小时前
Claude Code Skills 实用使用手册
java·开发语言
苹果醋34 小时前
JAVA设计模式之策略模式
java·运维·spring boot·mysql·nginx
千寻技术帮4 小时前
10370_基于Springboot的校园志愿者管理系统
java·spring boot·后端·毕业设计
Rinai_R4 小时前
关于 Go 的内存管理这档事
java·开发语言·golang