java jsoup爬虫如何快速获取到html页面的选择器元素

java jsoup爬虫如何快速获取到html页面的选择器元素

一、打开元素选择器

在java采用jsoup爬虫中,返回的是html页面而不是json字段,就需要使用jsoup元素解析器获取元素的值,如何快速获取指定元素的定位和值:

二、选定元素

三、定位元素位置

四、右键 -> copy ->copySelector

五、代码中获取

javascript 复制代码
document.select("#J_babelOptPage > div > div.bab-opt-mod.bab-opt-mod-2_0.multiModuleTab > div.multi-module-body > div > div > div > a:nth-child(9) > div > div.pd_info > div.pd_wrap.null > div > div").text();

这个复制是全局的绝对路径,如果中间有能唯一确定元素的选择器,其实前面的可以去掉,例如:

document.select(" div.pd_info > div.pd_wrap.null > div > div").text();

这样就可以快速获取选择器的定位,然后获取值,大概率是准的,可以极大的提高开发效率,但偶尔由于网页特殊,可能还是需要自己微调一下,所以还是得对jsoup的选择器有一些熟悉的。

相关推荐
liujing102329295 分钟前
Day09_刷题niuke20250609
java·c++·算法
无奈何杨6 分钟前
事件时间驱动的策略版本管理:风控系统中的关键设计抉择
java·后端·架构
程序员JerrySUN27 分钟前
Linux 内核内存管理子系统全面解析与体系构建
java·linux·运维
q5673152329 分钟前
分布式增量爬虫实现方案
开发语言·分布式·爬虫·python
风象南41 分钟前
SpringBoot的5种签到打卡实现方案
java·spring boot·后端
1candobetter1 小时前
JAVA后端开发——多租户
java·开发语言
星辰离彬1 小时前
Java 高级泛型实战:8 个场景化编程技巧
java·开发语言·后端·程序人生
筏.k1 小时前
C++ 网络编程(10) asio处理粘包的简易方式
java·网络·c++
张哈大2 小时前
【 java 虚拟机知识 第一篇 】
java·开发语言·jvm·笔记·缓存
zhaoyang03013 小时前
css3笔记 (1) 自用
前端·javascript·css·vue.js·笔记·html·css3