简数采集技巧之快速获取特殊链接网址URL方法

简数采集器列表页提取器的默认配置规则:获取a标签的href属性值作为采集的链接网址,对于大部分网站都是适用的;

但有些网站不使用a标签作为链接跳转,而用javascript的onclick事件替代,那列表页提取器的默认规则将无法获取到链接网址。

快速解决方法步骤如下:

一、url字段配置

先按常规配置,获取链接跳转的元素内容,再点击url字段的设置进入字段数据处理界面;

二、获取onclick属性内容

选择 "高级配置" 选项卡 ==》把 "只获取网址" 勾去不选择 ==》提取值类型选择 "节点属性" ==》属性名填写 onclick ==》保存

三、正则提取链接网址

选择 "日期等正则提取" 选项卡 ==》正则捕获组处填写 openW\('(.*)'\) ==》测试 ==》没问题,保存

四、结果

相关推荐
LDR0062 小时前
接口焦虑终结者:LDR6020 芯片如何重新定义 Type-C 拓展坞与多设备互联时代
数据结构·经验分享·智能音箱
中屹指纹浏览器3 小时前
指纹浏览器内核级渲染伪造技术:Canvas/WebGL/AudioContext深度伪造与检测绕过实战
经验分享·笔记
懂懂tty3 小时前
React状态更新流程
前端·react.js
小码哥_常3 小时前
告别繁琐!手把手教你封装超实用Android原生Adapter基类
前端
skywalk81633 小时前
pytest测试的时候这是什么意思?Migrating <class ‘kotti.resources.File‘>
前端·python
一只蝉nahc4 小时前
vue使用iframe内嵌unity模型,并且向模型传递信息,接受信息
前端·vue.js·unity
Cha0~4 小时前
搜索引擎爬虫语言识别机制详解
爬虫·搜索引擎
子兮曰4 小时前
Bun v1.3.12 深度解析:新特性、性能优化与实战指南
前端·typescript·bun
2401_885885045 小时前
易语言彩信接口怎么调用?E语言Post实现多媒体数据批量下发
前端
a1117765 小时前
Three.js 的前端 WebGL 页面合集(日本 开源项目)
前端·javascript·webgl