7.无代码爬虫八爪鱼采集器软件——采集规则/项目的创建与网址输入

接上篇6.零代码网页爬虫软件基础实操------下载与安装八爪鱼采集器

八爪鱼免费爬虫软件下载:

八爪鱼采集器下载 小白数据采集神器https://affiliate.bazhuayu.com/retrieve

直接复制粘贴要采集的网站在这里就可以进入采集规则的设计器

自定义任务

通过这个功能,可以进入到网址构建的更高阶使用方法

手动输入

直接填写网址或者复制网址到这个输入框,再点击保存设置即可

文件导入

导入的文件可以是txt、csv、xlsx,最多100万条数据

从任务导入

我们采集到的数据,在相关规则下,所以可以直接从这里导入之前采集到的数据,作为二次采集的起始网址。

批量生成

这个功能可以把有规律的网址,通过批量生成的方式构建出来,例如:网址的page页是有规律的,每一篇文章的数字编号+1,那就直接构建一个参数即可,可以通过测试生成网站来确认构建是否正确,下方"网址预览"中会显示出100条数据供查看。

数字变更
字母变更
时间变更

有一些新闻站上通过日期的方式生成文章/帖子,用这个时间变更的构建方案就很方便

自定义列表

这里可以填写你提前准备好的内容,例如我们做搜索词项目的采集就会常常用到这个功能,提前把词汇放进这里,会自动循环调取这个自定义列表的参数

至此我们如何创建项目输入网址方法就讲完了,下节课我们来进行一个实际案例的操作讲解


教程专栏的目录链接,快速直达各个知识点:

八爪鱼采集器入门基础教程,日常更新中-CSDN博客


相关推荐
im_AMBER2 分钟前
算法笔记 13 BFS | 图
笔记·学习·算法·广度优先
环己酮5 分钟前
py数据科学学习笔记day4-空间数据统计分析与可视化(2)
python
q***482531 分钟前
基于python语言的网页设计(手把手教你设计一个个人博客网站)
开发语言·python
i***486137 分钟前
Redis重大版本整理(Redis2.6-Redis7.0)
java·数据库·redis
r***869841 分钟前
Redis 6.2.7安装配置
前端·数据库·redis
qq_22589174661 小时前
基于Python+Django餐饮评论大数据分析与智能推荐系统 毕业论文
开发语言·后端·python·信息可视化·数据分析·django
是Judy咋!1 小时前
Mongodb---副本集搭建(hashed分片)
数据库·mongodb·centos
q***14641 小时前
MySQL 批量插入详解:快速提升大数据导入效率的实战方法
大数据·数据库·mysql
FreakStudio1 小时前
串口协议解析实战:以 R60ABD1 雷达为例,详解 MicroPython 驱动中数据与业务逻辑的分离设计
python·单片机·pycharm·嵌入式·面向对象·硬件·电子diy
Unstoppable221 小时前
八股训练营第 21 天 | Redis的数据类型有哪些?Redis是单线程的还是多线程的,为什么?说一说Redis持久化机制有哪些?
数据库·redis·缓存·八股