简数采集技巧之快速获取特殊链接网址URL方法

简数采集器列表页提取器的默认配置规则:获取a标签的href属性值作为采集的链接网址,对于大部分网站都是适用的;

但有些网站不使用a标签作为链接跳转,而用javascript的onclick事件替代,那列表页提取器的默认规则将无法获取到链接网址。

快速解决方法步骤如下:

一、url字段配置

先按常规配置,获取链接跳转的元素内容,再点击url字段的设置进入字段数据处理界面;

二、获取onclick属性内容

选择 "高级配置" 选项卡 ==》把 "只获取网址" 勾去不选择 ==》提取值类型选择 "节点属性" ==》属性名填写 onclick ==》保存

三、正则提取链接网址

选择 "日期等正则提取" 选项卡 ==》正则捕获组处填写 openW\('(.*)'\) ==》测试 ==》没问题,保存

四、结果

相关推荐
木辰風几秒前
idea npm install 很慢(nodejs)
前端·npm·node.js
阿笑带你学前端几秒前
Drift数据库开发实战:类型安全的SQLite解决方案
前端·flutter
FE_C_P小麦3 分钟前
Git 常用指令
前端·后端·github
北城笑笑3 分钟前
Server 13 ,CentOS 上使用 Nginx 部署多个前端项目完整指南( 支持多端口与脚本自动化 )
linux·服务器·前端·nginx·centos
卓伊凡5 分钟前
完整的苹果内购in-purchase实例-采用object-c语言使用苹果的Storyboard开发模式的完整购买实例
前端
用泥种荷花5 分钟前
【web音频学习(一)】音频基础
前端
Mintopia6 分钟前
Next.js自建部署:Docker + PM2 + Nginx
前端·javascript·全栈
艾小码8 分钟前
还在重复造轮子?3个Vue3组合函数让你开发效率翻倍!
前端·javascript·vue.js
一枚前端小能手9 分钟前
🎨 CSS-in-JS到底香不香?性能陷阱让我重新思考了
前端·javascript·css
章丸丸11 分钟前
Tube - Infinite Loading
前端·next.js