简数采集技巧之快速获取特殊链接网址URL方法

简数采集器列表页提取器的默认配置规则:获取a标签的href属性值作为采集的链接网址,对于大部分网站都是适用的;

但有些网站不使用a标签作为链接跳转,而用javascript的onclick事件替代,那列表页提取器的默认规则将无法获取到链接网址。

快速解决方法步骤如下:

一、url字段配置

先按常规配置,获取链接跳转的元素内容,再点击url字段的设置进入字段数据处理界面;

二、获取onclick属性内容

选择 "高级配置" 选项卡 ==》把 "只获取网址" 勾去不选择 ==》提取值类型选择 "节点属性" ==》属性名填写 onclick ==》保存

三、正则提取链接网址

选择 "日期等正则提取" 选项卡 ==》正则捕获组处填写 openW\('(.*)'\) ==》测试 ==》没问题,保存

四、结果

相关推荐
Y***K4342 分钟前
TypeScript模块解析
前端·javascript·typescript
JarvanMo5 分钟前
Xcode 没人想解决的问题:为什么苹果对平庸感到满意
前端
罗光记18 分钟前
低空基础设施新突破!优刻得 ×IDEA联合发布 OpenSILAS一体机
数据库·经验分享·其他·百度·facebook
想看一次满天星18 分钟前
阿里140-语雀逆向分析
javascript·爬虫·python·语雀·阿里140
合作小小程序员小小店19 分钟前
web网页开发,在线%餐饮点餐%系统,基于Idea,html,css,jQuery,java,ssm,mysql。
java·前端·数据库·html·intellij-idea·springboot
鹏多多29 分钟前
HTML的Video从基础使用到高级实战+兼容的完全指南
前端·javascript·vue.js
晓得迷路了31 分钟前
栗子前端技术周刊第 107 期 - Angular v21、pnpm 10.22、React 2025 现状调查...
前端·javascript·angular.js
韩曙亮36 分钟前
【Web APIs】JavaScript 事件高级 ③ ( DOM 事件流 | 捕获阶段 | 目标阶段 | 冒泡阶段 )
前端·javascript·web apis·捕获阶段·目标阶段·冒泡阶段·dom 事件流
p***h64341 分钟前
React数据分析应用
前端·react.js·前端框架
4***997441 分钟前
TypeScript类型体操
前端·javascript·typescript