java jsoup爬虫如何快速获取到html页面的选择器元素

java jsoup爬虫如何快速获取到html页面的选择器元素

一、打开元素选择器

在java采用jsoup爬虫中,返回的是html页面而不是json字段,就需要使用jsoup元素解析器获取元素的值,如何快速获取指定元素的定位和值:

二、选定元素

三、定位元素位置

四、右键 -> copy ->copySelector

五、代码中获取

javascript 复制代码
document.select("#J_babelOptPage > div > div.bab-opt-mod.bab-opt-mod-2_0.multiModuleTab > div.multi-module-body > div > div > div > a:nth-child(9) > div > div.pd_info > div.pd_wrap.null > div > div").text();

这个复制是全局的绝对路径,如果中间有能唯一确定元素的选择器,其实前面的可以去掉,例如:

document.select(" div.pd_info > div.pd_wrap.null > div > div").text();

这样就可以快速获取选择器的定位,然后获取值,大概率是准的,可以极大的提高开发效率,但偶尔由于网页特殊,可能还是需要自己微调一下,所以还是得对jsoup的选择器有一些熟悉的。

相关推荐
invicinble16 分钟前
对tomcat的提供的功能与底层拓扑结构与实现机制的理解
java·tomcat
较真的菜鸟30 分钟前
使用ASM和agent监控属性变化
java
黎雁·泠崖37 分钟前
【魔法森林冒险】5/14 Allen类(三):任务进度与状态管理
java·开发语言
qq_12498707532 小时前
基于SSM的动物保护系统的设计与实现(源码+论文+部署+安装)
java·数据库·spring boot·毕业设计·ssm·计算机毕业设计
Coder_Boy_2 小时前
基于SpringAI的在线考试系统-考试系统开发流程案例
java·数据库·人工智能·spring boot·后端
Mr_sun.2 小时前
Day06——权限认证-项目集成
java
瑶山2 小时前
Spring Cloud微服务搭建四、集成RocketMQ消息队列
java·spring cloud·微服务·rocketmq·dashboard
abluckyboy2 小时前
Java 实现求 n 的 n^n 次方的最后一位数字
java·python·算法
2301_818732062 小时前
前端调用控制层接口,进不去,报错415,类型不匹配
java·spring boot·spring·tomcat·intellij-idea
2501_941982052 小时前
深度对比:Java、Go、Python 实现企微外部群推送,哪个效率更高?
java·golang·企业微信