简数采集技巧之快速获取特殊链接网址URL方法

简数采集器列表页提取器的默认配置规则:获取a标签的href属性值作为采集的链接网址,对于大部分网站都是适用的;

但有些网站不使用a标签作为链接跳转,而用javascript的onclick事件替代,那列表页提取器的默认规则将无法获取到链接网址。

快速解决方法步骤如下:

一、url字段配置

先按常规配置,获取链接跳转的元素内容,再点击url字段的设置进入字段数据处理界面;

二、获取onclick属性内容

选择 "高级配置" 选项卡 ==》把 "只获取网址" 勾去不选择 ==》提取值类型选择 "节点属性" ==》属性名填写 onclick ==》保存

三、正则提取链接网址

选择 "日期等正则提取" 选项卡 ==》正则捕获组处填写 openW\('(.*)'\) ==》测试 ==》没问题,保存

四、结果

相关推荐
菠萝+冰4 分钟前
React-Window 虚拟化滚动
前端·react.js·前端框架
皓月Code5 分钟前
第三章、React项目国际化介绍(`react-i18next`)
前端·javascript·react.js·1024程序员节
云中雾丽9 分钟前
react中 所有给 children 传值的方式
前端
加蓓努力我先飞10 分钟前
Vue3小兔鲜-(二)
前端·javascript·css·vue3
豆苗学前端12 分钟前
企业级用户登录Token存储最佳实践,吊打面试官
前端·javascript·后端
李剑一13 分钟前
vite框架下大屏适配方案
前端·vue.js·响应式设计
有点笨的蛋14 分钟前
HTML5 敲击乐:从静态页面到动态交互的前端实战
前端·html
文心快码BaiduComate22 分钟前
冰城码力全开,共赴AI Coding英雄之旅!CEDxCNCC百度文心快码Meetup圆满落幕!
前端·后端·程序员
社恐的下水道蟑螂27 分钟前
用CSS3拍一部《星球大战》片头?前端导演的"原力"修炼指南
前端·javascript
子非鱼37331 分钟前
git 常用命令行
前端