简数采集技巧之快速获取特殊链接网址URL方法

简数采集器列表页提取器的默认配置规则:获取a标签的href属性值作为采集的链接网址,对于大部分网站都是适用的;

但有些网站不使用a标签作为链接跳转,而用javascript的onclick事件替代,那列表页提取器的默认规则将无法获取到链接网址。

快速解决方法步骤如下:

一、url字段配置

先按常规配置,获取链接跳转的元素内容,再点击url字段的设置进入字段数据处理界面;

二、获取onclick属性内容

选择 "高级配置" 选项卡 ==》把 "只获取网址" 勾去不选择 ==》提取值类型选择 "节点属性" ==》属性名填写 onclick ==》保存

三、正则提取链接网址

选择 "日期等正则提取" 选项卡 ==》正则捕获组处填写 openW\('(.*)'\) ==》测试 ==》没问题,保存

四、结果

相关推荐
恋猫de小郭5 分钟前
八年开源,GSY 用五种技术开发了同一个 Github 客户端,这次轮到 AI + Compose
android·前端·flutter
少年姜太公6 小时前
什么?还不知道git cherry pick?
前端·javascript·git
白兰地空瓶7 小时前
🏒 前端 AI 应用实战:用 Vue3 + Coze,把宠物一键变成冰球运动员!
前端·vue.js·coze
Liu.7749 小时前
vue3使用vue3-print-nb打印
前端·javascript·vue.js
松涛和鸣9 小时前
Linux Makefile : From Basic Syntax to Multi-File Project Compilation
linux·运维·服务器·前端·windows·哈希算法
dly_blog9 小时前
Vue 逻辑复用的多种方案对比!
前端·javascript·vue.js
做cv的小昊10 小时前
【TJU】信息检索与分析课程笔记和练习(1)认识文献
经验分享·笔记·学习·搜索引擎·全文检索
万少10 小时前
HarmonyOS6 接入分享,原来也是三分钟的事情
前端·harmonyos
烛阴10 小时前
C# 正则表达式:量词与锚点——从“.*”到精确匹配
前端·正则表达式·c#
斌蔚司李10 小时前
rayN 客户端使用说明
经验分享