java jsoup爬虫如何快速获取到html页面的选择器元素

初夏08112024-10-28 22:23

java jsoup爬虫如何快速获取到html页面的选择器元素

- 一、打开元素选择器
- 二、选定元素
- 三、定位元素位置
- [四、右键 -> copy ->copySelector](#四、右键 -> copy ->copySelector)
- 五、代码中获取

一、打开元素选择器

在java采用jsoup爬虫中，返回的是html页面而不是json字段，就需要使用jsoup元素解析器获取元素的值，如何快速获取指定元素的定位和值：

二、选定元素

三、定位元素位置

四、右键 -> copy ->copySelector

五、代码中获取

javascript 复制代码

document.select("#J_babelOptPage > div > div.bab-opt-mod.bab-opt-mod-2_0.multiModuleTab > div.multi-module-body > div > div > div > a:nth-child(9) > div > div.pd_info > div.pd_wrap.null > div > div").text();

这个复制是全局的绝对路径，如果中间有能唯一确定元素的选择器，其实前面的可以去掉，例如：

document.select(" div.pd_info > div.pd_wrap.null > div > div").text();

这样就可以快速获取选择器的定位，然后获取值，大概率是准的，可以极大的提高开发效率，但偶尔由于网页特殊，可能还是需要自己微调一下，所以还是得对jsoup的选择器有一些熟悉的。

上一篇：python学习笔记:___getattr__

下一篇：关于python的import

热门推荐

012026年7月AI圈大地震：GPT-5.6被政府限制、Claude入驻Slack、Anthropic自研芯片 02GitHub 镜像站点 03如何新建文件夹？电脑新建文件夹的4种方法 04AI科技热点日报 | 2026年07月01日 05AI 编程 IDE 全景解析 2026：Agent 全面接管开发链路 06国内可直接用、免费额度/永久免费的大模型API清单（含 SiliconFlow、火山、阿里、智谱、百度、Kimi、DeepSeek、DMXAPI 等）07幻兽帕鲁 - 服务器管理员权限与 GM 命令完全指南 08【解构】DeepSeek V4 发布：技术报告深度解读 + 横向对比六大开源模型，我们的判断是……09微信历史版本含下载地址（ Windows PC | 安卓 | MAC ）及设置微信不更新 102026 国产 AI 大模型横评：DeepSeek、通义千问、Kimi、文心一言、星火、豆包谁更能打？