java jsoup爬虫如何快速获取到html页面的选择器元素

java jsoup爬虫如何快速获取到html页面的选择器元素

一、打开元素选择器

在java采用jsoup爬虫中,返回的是html页面而不是json字段,就需要使用jsoup元素解析器获取元素的值,如何快速获取指定元素的定位和值:

二、选定元素

三、定位元素位置

四、右键 -> copy ->copySelector

五、代码中获取

javascript 复制代码
document.select("#J_babelOptPage > div > div.bab-opt-mod.bab-opt-mod-2_0.multiModuleTab > div.multi-module-body > div > div > div > a:nth-child(9) > div > div.pd_info > div.pd_wrap.null > div > div").text();

这个复制是全局的绝对路径,如果中间有能唯一确定元素的选择器,其实前面的可以去掉,例如:

document.select(" div.pd_info > div.pd_wrap.null > div > div").text();

这样就可以快速获取选择器的定位,然后获取值,大概率是准的,可以极大的提高开发效率,但偶尔由于网页特殊,可能还是需要自己微调一下,所以还是得对jsoup的选择器有一些熟悉的。

相关推荐
014-code15 小时前
订单超时取消与库存回滚的完整实现(延迟任务 + 状态机)
java·开发语言
java1234_小锋15 小时前
Java高频面试题:Springboot的自动配置原理?
java·spring boot·面试
anOnion16 小时前
构建无障碍组件之Meter Pattern
前端·html·交互设计
末央&16 小时前
【天机论坛】项目环境搭建和数据库设计
java·数据库
枫叶落雨22216 小时前
ShardingSphere 介绍
java
花花鱼17 小时前
Spring Security 与 Spring MVC
java·spring·mvc
修己xj17 小时前
Markdown 里写公式,别只知道 LaTeX!试试 HTML 标签,简单到飞起
html
言慢行善17 小时前
sqlserver模糊查询问题
java·数据库·sqlserver
专吃海绵宝宝菠萝屋的派大星17 小时前
使用Dify对接自己开发的mcp
java·服务器·前端
大数据新鸟18 小时前
操作系统之虚拟内存
java·服务器·网络