java jsoup爬虫如何快速获取到html页面的选择器元素

java jsoup爬虫如何快速获取到html页面的选择器元素

一、打开元素选择器

在java采用jsoup爬虫中,返回的是html页面而不是json字段,就需要使用jsoup元素解析器获取元素的值,如何快速获取指定元素的定位和值:

二、选定元素

三、定位元素位置

四、右键 -> copy ->copySelector

五、代码中获取

javascript 复制代码
document.select("#J_babelOptPage > div > div.bab-opt-mod.bab-opt-mod-2_0.multiModuleTab > div.multi-module-body > div > div > div > a:nth-child(9) > div > div.pd_info > div.pd_wrap.null > div > div").text();

这个复制是全局的绝对路径,如果中间有能唯一确定元素的选择器,其实前面的可以去掉,例如:

document.select(" div.pd_info > div.pd_wrap.null > div > div").text();

这样就可以快速获取选择器的定位,然后获取值,大概率是准的,可以极大的提高开发效率,但偶尔由于网页特殊,可能还是需要自己微调一下,所以还是得对jsoup的选择器有一些熟悉的。

相关推荐
小小菜鸡ing16 小时前
pymysql
java·服务器·数据库
getapi16 小时前
shareId 的产生与传递链路
java
吃饭最爱17 小时前
html的基础知识
前端·html
我没想到原来他们都是一堆坏人17 小时前
(未完待续...)如何编写一个用于构建python web项目镜像的dockerfile文件
java·前端·python
沙二原住民17 小时前
提升数据库性能的秘密武器:深入解析慢查询、连接池与Druid监控
java·数据库·oracle
Jerry&Grj18 小时前
SpringBoot埋点功能技术实现方案深度解析:架构设计、性能优化与扩展性实践
java·微服务·性能优化·springboot·架构设计·埋点技术
没有bug.的程序员18 小时前
Redis Stream:轻量级消息队列深度解析
java·数据库·chrome·redis·消息队列
用户81607918333318 小时前
告别“魔法”:包你解决 Gradle 的下载慢问题
java
AlexMercer101219 小时前
[前端]1.html基础
前端·笔记·学习·html
当归102419 小时前
SQL Server死锁排查实战指南
java·服务器·网络