java jsoup爬虫如何快速获取到html页面的选择器元素

java jsoup爬虫如何快速获取到html页面的选择器元素

一、打开元素选择器

在java采用jsoup爬虫中,返回的是html页面而不是json字段,就需要使用jsoup元素解析器获取元素的值,如何快速获取指定元素的定位和值:

二、选定元素

三、定位元素位置

四、右键 -> copy ->copySelector

五、代码中获取

javascript 复制代码
document.select("#J_babelOptPage > div > div.bab-opt-mod.bab-opt-mod-2_0.multiModuleTab > div.multi-module-body > div > div > div > a:nth-child(9) > div > div.pd_info > div.pd_wrap.null > div > div").text();

这个复制是全局的绝对路径,如果中间有能唯一确定元素的选择器,其实前面的可以去掉,例如:

document.select(" div.pd_info > div.pd_wrap.null > div > div").text();

这样就可以快速获取选择器的定位,然后获取值,大概率是准的,可以极大的提高开发效率,但偶尔由于网页特殊,可能还是需要自己微调一下,所以还是得对jsoup的选择器有一些熟悉的。

相关推荐
nlog3n1 小时前
Java策略模式详解
java·bash·策略模式
Mryan20053 小时前
解决GraalVM Native Maven Plugin错误:JAVA_HOME未指向GraalVM Distribution
java·开发语言·spring boot·maven
VX_CXsjNo14 小时前
免费送源码:Java+SSM+Android Studio 基于Android Studio游戏搜索app的设计与实现 计算机毕业设计原创定制
java·spring boot·spring·游戏·eclipse·android studio·android-studio
ylfhpy4 小时前
Java面试黄金宝典33
java·开发语言·数据结构·面试·职场和发展·排序算法
乘风!4 小时前
Java导出excel,表格插入pdf附件,以及实现过程中遇见的坑
java·pdf·excel
小小鸭程序员4 小时前
Vue组件化开发深度解析:Element UI与Ant Design Vue对比实践
java·vue.js·spring·ui·elementui
Liudef065 小时前
deepseek v3-0324 Markdown 编辑器 HTML
前端·编辑器·html·deepseek
南宫生5 小时前
Java迭代器【设计模式之迭代器模式】
java·学习·设计模式·kotlin·迭代器模式
seabirdssss5 小时前
通过动态获取项目的上下文路径来确保请求的 URL 兼容两种启动方式(IDEA 启动和 Tomcat 部署)下都能正确解析
java·okhttp·tomcat·intellij-idea
kill bert5 小时前
第30周Java分布式入门 消息队列 RabbitMQ
java·分布式·java-rabbitmq