java jsoup爬虫如何快速获取到html页面的选择器元素

java jsoup爬虫如何快速获取到html页面的选择器元素

一、打开元素选择器

在java采用jsoup爬虫中,返回的是html页面而不是json字段,就需要使用jsoup元素解析器获取元素的值,如何快速获取指定元素的定位和值:

二、选定元素

三、定位元素位置

四、右键 -> copy ->copySelector

五、代码中获取

javascript 复制代码
document.select("#J_babelOptPage > div > div.bab-opt-mod.bab-opt-mod-2_0.multiModuleTab > div.multi-module-body > div > div > div > a:nth-child(9) > div > div.pd_info > div.pd_wrap.null > div > div").text();

这个复制是全局的绝对路径,如果中间有能唯一确定元素的选择器,其实前面的可以去掉,例如:

document.select(" div.pd_info > div.pd_wrap.null > div > div").text();

这样就可以快速获取选择器的定位,然后获取值,大概率是准的,可以极大的提高开发效率,但偶尔由于网页特殊,可能还是需要自己微调一下,所以还是得对jsoup的选择器有一些熟悉的。

相关推荐
Seven9710 分钟前
剑指offer-22、从上往下打印⼆叉树
java
A尘埃27 分钟前
企业级Java项目金融应用领域——保险系统(补充)
java·金融·保险系统
冬天vs不冷32 分钟前
Java基础(九):Object核心类深度剖析
java·开发语言·python
悟空聊架构1 小时前
我的网站被攻击了,被干掉了 120G 流量,还在持续攻击中...
java·前端·架构
遗悲风1 小时前
html二次作业
前端·html
中草药z1 小时前
【自动化测试】Selenium详解-WebUI自动化测试
前端·功能测试·selenium·自动化·html·web·测试
Dajiaonew2 小时前
Spring AI RAG 检索增强 应用
java·人工智能·spring·ai·langchain
IT古董5 小时前
第四章:大模型(LLM)】06.langchain原理-(3)LangChain Prompt 用法
java·人工智能·python
轻抚酸~8 小时前
小迪23年-32~40——java简单回顾
java·web安全
Sirius Wu10 小时前
Maven环境如何正确配置
java·maven