简数采集技巧之快速获取特殊链接网址URL方法

简数采集器列表页提取器的默认配置规则:获取a标签的href属性值作为采集的链接网址,对于大部分网站都是适用的;

但有些网站不使用a标签作为链接跳转,而用javascript的onclick事件替代,那列表页提取器的默认规则将无法获取到链接网址。

快速解决方法步骤如下:

一、url字段配置

先按常规配置,获取链接跳转的元素内容,再点击url字段的设置进入字段数据处理界面;

二、获取onclick属性内容

选择 "高级配置" 选项卡 ==》把 "只获取网址" 勾去不选择 ==》提取值类型选择 "节点属性" ==》属性名填写 onclick ==》保存

三、正则提取链接网址

选择 "日期等正则提取" 选项卡 ==》正则捕获组处填写 openW\('(.*)'\) ==》测试 ==》没问题,保存

四、结果

相关推荐
姜太小白1 小时前
【前端】CSS Grid布局介绍及示例
前端·css
风继续吹..4 小时前
后台管理系统权限管理:前端实现详解
前端·vue
yuanmenglxb20044 小时前
前端工程化包管理器:从npm基础到nvm多版本管理实战
前端·前端工程化
新手小新5 小时前
C++游戏开发(2)
开发语言·前端·c++
我不吃饼干5 小时前
【TypeScript】三分钟让 Trae、Cursor 用上你自己的 MCP
前端·typescript·trae
小杨同学yx6 小时前
前端三剑客之Css---day3
前端·css
Mintopia8 小时前
🧱 用三维点亮前端宇宙:构建你自己的 Three.js 组件库
前端·javascript·three.js
十三浪8 小时前
开源框架推荐:API数据批处理与爬虫集成
爬虫·开源
故事与九8 小时前
vue3使用vue-pdf-embed实现前端PDF在线预览
前端·vue.js·pdf
数据狐(DataFox)9 小时前
CTE公用表表达式的可读性与性能优化
经验分享·python·sql