Java将String类型的html文本中的img路径替换前缀

1.引入jsoup包

复制代码
<dependency>
    <groupId>org.jsoup</groupId>
    <artifactId>jsoup</artifactId>
    <version>1.13.1</version>
</dependency>

2.编写代码

复制代码
@Service
@Slf4j
public class ImgSrcReplaceServiceImpl implements ImgSrcReplaceService {

    /**
     * @param html html文本
     * @param newPrefix 要替换的前缀路径,路径记得最后+斜杠
     * */
    @Override
    public String ImgSrcReplace(String html,String  newPrefix) {
        log.info("开始解析");
        // 使用 Jsoup 解析 HTML
        Document document = Jsoup.parse(html);
        // 查找所有 img 标签
        Elements imgTags = document.select("img");
        // 修改 img 标签的 src 属性
        for (Element imgTag : imgTags) {
            String src = imgTag.attr("src");
            // 检查图片路径是否包含随机数,假设随机数存在于路径的前缀中
            if (src != null && !src.isEmpty()) {
                // 假设我们要替换路径的前缀部分,可以修改 "https://example.com/" 为新的前缀
//                String newPrefix = "https://zxd.com/"; // 你可以根据需要定义新的前缀
                String fileName = src.substring(src.lastIndexOf("/")); // 获取图片文件名(包含扩展名)
                // 构建新的 src 路径
                String newSrc = newPrefix + fileName;
                // 设置新的 src 属性
                imgTag.attr("src", newSrc);
            }
        }
        // 获取修改后的 HTML
        String updatedHtml = document.html();
        // 输出修改后的 HTML
        log.info(updatedHtml);
        return updatedHtml;
    }
}
相关推荐
京师20万禁军教头9 分钟前
29面向对象(中级)-继承
java
亿牛云爬虫专家11 分钟前
告别空壳HTML!Node.js + Playwright + 代理IP 优雅抓取动态网页实战
node.js·html·爬虫代理·动态网页·数据抓取·代理ip·playwright
disgare17 分钟前
SpringBoot 请求调用时关于高可用机制选型和落地
java·spring boot·后端
鼎道开发者联盟22 分钟前
鼎享会 | OpenClaw Control UI 前端架构全解析:自研 UI 对接 Server 实操指南
前端·ui·架构·openclaw·control ui
CodeMartain24 分钟前
@SpringBootApplication 到底是什么呢?
java·spring boot·intellij-idea
尘世中一位迷途小书童24 分钟前
一套完整的给予ceium封装的组件库,可满足企业级开发
前端
Z_Wonderful25 分钟前
微前端:Webpack 配置 vs Vite 配置 超清晰对比
前端·webpack·node.js
星秀日28 分钟前
大学生开发社区项目-CLXHXH-登录功能
java
码云数智-园园30 分钟前
HTTPS是如何工作的?从HTTP到HTTPS的加密演进
前端
兩尛34 分钟前
struct,union,Class,bitfield各自的作用和区别
java·开发语言