java实现解析html获取图片或视频url

一、前言

有时在实际项目中,比如发布某篇文章,需要取文章中的某张图片作为封面,那么此时需要文章内容,获取html内容中的图片地址作为封面,下面讲下如何获取html中的图片或视频地址。

二、实现

1.先定义一个工具类,解析html获取图片地址。

复制代码
import java.util.ArrayList;
import java.util.List;
import java.util.regex.Matcher;
import java.util.regex.Pattern;
import java.util.stream.Collectors;

public class HtmlParseUtil {
	private static final String regEx_img="<img [^>]*src=\"([^>]*?)\" alt=([^>]*?)>";
	private static final String regEx_video="<video [^>]*src=\"([^>]*?)\">[\\s\\S]*?</video>";

	/**
	 * 解析html获取图片或视频
	 * @param content
	 * @return
	 */
	public static String htmlParseImgOrVedio(String content) {
		Pattern p = Pattern.compile(regEx_img, Pattern.CASE_INSENSITIVE);
		Matcher m = p.matcher(content);
		if(m.find()) {
			return m.group(1).trim();
		}else {
			p = Pattern.compile(regEx_video, Pattern.CASE_INSENSITIVE);
			m=p.matcher(content);
			if(m.find()) {
				return m.group(1).trim();
			}
		}
		return "";
	}
}

上面通过正则匹配获取src中的地址。

2.通过main方法调用看是否可获取。

复制代码
public static void main(String[] args) {
		String s="<p style=\"text-align: center;\"><img src=\"https://myoss.oss-cn-hangzhou.aliyuncs.com/task/e4d1afba664b415cf5bf40eda33b7ba0/2021-04-21/161897103374171750.png\" alt=\"\"></p><p><br></p><p>内容发布后跳转页面有待优化,进来的时候是<strong>测试简介</strong></p><p><strong><img src=\"https://myoss.oss-cn-hangzhou.aliyuncs.com/task/e4d1afba664b415cf5bf40eda33b7ba0/2021-04-21/161897102930795080.png\" alt=\"\"></strong></p>";
		String s1="<p><video class=\"edui-upload-video  vjs-default-skin   video-js\" controls=\"\" preload=\"none\" width=\"420\" height=\"280\" src=\"https://myoss.oss-cn-shenzhen.aliyuncs.com/task/2019-11-28/2019112819471601813428538534561557.mp4\"><source src=\"https://myoss.oss-cn-shenzhen.aliyuncs.com/task/2019-11-28/2019112819471601813428538534561557.mp4\" type=\"video/mp4\"/></video></p>";
		Pattern p = Pattern.compile(regEx_img, Pattern.CASE_INSENSITIVE);
		Matcher m = p.matcher(s);
		if(m.find()) {
			System.err.println(m.group(1).trim());
		}
		Pattern p1 = Pattern.compile(regEx_video, Pattern.CASE_INSENSITIVE);
		Matcher m1 = p1.matcher(s1);
		if(m1.find()) {
			System.err.println(m1.group(1).trim());
		}
	}

运行结果如下:

结果是正常获取到了图片或视频的url。

相关推荐
骄马之死16 小时前
SpringMVC + SpringBoot 核心知识点总结
java·spring boot·后端
sbjdhjd16 小时前
Redis 主从复制、哨兵高可用与 Cluster 集群部署实验手册
运维·前端·redis·云原生·开源·bootstrap·html
郑洁文17 小时前
基于Spring Boot的流浪动物救助网站
java·spring boot·后端·毕设·流浪动物救助
螺丝钉code18 小时前
JAVA项目 Claude code CLAUDE.md 到底应该怎么写
java·人工智能·claude code
摇滚侠19 小时前
Maven 入门+高深 单一架构案例 54-59
java·架构·maven·intellij-idea
VidDown19 小时前
Webhook 调试器:让第三方回调“原形毕露”
java·开发语言·javascript·编辑器·postman
折哥的程序人生 · 物流技术专研19 小时前
Java 23 种设计模式:从踩坑到精通 | 原型模式 —— 克隆对象,深拷贝与浅拷贝的坑你踩过吗?
java·设计模式·架构·原型模式·单一职责原则
装不满的克莱因瓶20 小时前
基于 OpenResty 扩展开发实现动态服务注册与发现能力
java·开发语言·架构·openresty
程序员小羊!20 小时前
06Java 异常机制与常用类
java
weixin_5231853220 小时前
Java基础知识总结(四):引用数据类型与参数传递机制
java·开发语言·python