java jsoup爬虫如何快速获取到html页面的选择器元素

java jsoup爬虫如何快速获取到html页面的选择器元素

一、打开元素选择器

在java采用jsoup爬虫中,返回的是html页面而不是json字段,就需要使用jsoup元素解析器获取元素的值,如何快速获取指定元素的定位和值:

二、选定元素

三、定位元素位置

四、右键 -> copy ->copySelector

五、代码中获取

javascript 复制代码
document.select("#J_babelOptPage > div > div.bab-opt-mod.bab-opt-mod-2_0.multiModuleTab > div.multi-module-body > div > div > div > a:nth-child(9) > div > div.pd_info > div.pd_wrap.null > div > div").text();

这个复制是全局的绝对路径,如果中间有能唯一确定元素的选择器,其实前面的可以去掉,例如:

document.select(" div.pd_info > div.pd_wrap.null > div > div").text();

这样就可以快速获取选择器的定位,然后获取值,大概率是准的,可以极大的提高开发效率,但偶尔由于网页特殊,可能还是需要自己微调一下,所以还是得对jsoup的选择器有一些熟悉的。

相关推荐
爬菜几秒前
包装类(1)
java
带刺的坐椅2 分钟前
高德地图 MCP,可用 Java SolonMCP 接入(支持 java8, java11, java17, java21)
java·ai·solon·高德地图·lbs·mcp
AA-代码批发V哥16 分钟前
Java-List集合类全面解析
java·开发语言·list
cainiao08060517 分钟前
Java大数据机器学习模型在金融衍生品风险建模中的创新实践
java·金融
举一个梨子zz29 分钟前
Java—— IO流 第一期
java·开发语言
鸠。30 分钟前
第二章 苍穹外卖
java
exe4521 小时前
力扣每日一题5-18
java·算法·leetcode
JZihui1 小时前
146. LRU 缓存
java·缓存
shut up1 小时前
计算机底层的多级缓存以及缓存带来的数据覆盖问题
java·缓存
计算机学姐1 小时前
基于SpringBoot的小型民营加油站管理系统
java·vue.js·spring boot·后端·mysql·spring·tomcat