java jsoup爬虫如何快速获取到html页面的选择器元素

java jsoup爬虫如何快速获取到html页面的选择器元素

一、打开元素选择器

在java采用jsoup爬虫中,返回的是html页面而不是json字段,就需要使用jsoup元素解析器获取元素的值,如何快速获取指定元素的定位和值:

二、选定元素

三、定位元素位置

四、右键 -> copy ->copySelector

五、代码中获取

javascript 复制代码
document.select("#J_babelOptPage > div > div.bab-opt-mod.bab-opt-mod-2_0.multiModuleTab > div.multi-module-body > div > div > div > a:nth-child(9) > div > div.pd_info > div.pd_wrap.null > div > div").text();

这个复制是全局的绝对路径,如果中间有能唯一确定元素的选择器,其实前面的可以去掉,例如:

document.select(" div.pd_info > div.pd_wrap.null > div > div").text();

这样就可以快速获取选择器的定位,然后获取值,大概率是准的,可以极大的提高开发效率,但偶尔由于网页特殊,可能还是需要自己微调一下,所以还是得对jsoup的选择器有一些熟悉的。

相关推荐
廋到被风吹走8 分钟前
【Spring】BeanPostProcessor详解
java·后端·spring
bbq粉刷匠12 分钟前
二叉树中两个指定节点的最近公共祖先
java·算法
ppo9219 分钟前
Spring Boot 集成 Kafka 3.9.0:部署、监控与消息发送教程
java·架构
JavaEdge.26 分钟前
IDEA卡死没反应的全部解决方案
java·ide·intellij-idea
高山上有一只小老虎32 分钟前
使用Memory Analyzer (MAT)分析内存溢出
java·jvm
研☆香42 分钟前
html页面如何精准布局
前端·html
嘴贱欠吻!43 分钟前
JavaSE基础知识
java·开发语言
逝水如流年轻往返染尘1 小时前
Java输入输出
java·开发语言
Alsn861 小时前
29.Java中常见加解密算法的基本实现
java·开发语言·算法
沉默王二1 小时前
TRAE+Gemini,成为我解读 Agent 微服项目的最佳工具
java·后端·程序员