7.无代码爬虫八爪鱼采集器软件——采集规则/项目的创建与网址输入

接上篇6.零代码网页爬虫软件基础实操------下载与安装八爪鱼采集器

八爪鱼免费爬虫软件下载:

八爪鱼采集器下载 小白数据采集神器https://affiliate.bazhuayu.com/retrieve

直接复制粘贴要采集的网站在这里就可以进入采集规则的设计器

自定义任务

通过这个功能,可以进入到网址构建的更高阶使用方法

手动输入

直接填写网址或者复制网址到这个输入框,再点击保存设置即可

文件导入

导入的文件可以是txt、csv、xlsx,最多100万条数据

从任务导入

我们采集到的数据,在相关规则下,所以可以直接从这里导入之前采集到的数据,作为二次采集的起始网址。

批量生成

这个功能可以把有规律的网址,通过批量生成的方式构建出来,例如:网址的page页是有规律的,每一篇文章的数字编号+1,那就直接构建一个参数即可,可以通过测试生成网站来确认构建是否正确,下方"网址预览"中会显示出100条数据供查看。

数字变更
字母变更
时间变更

有一些新闻站上通过日期的方式生成文章/帖子,用这个时间变更的构建方案就很方便

自定义列表

这里可以填写你提前准备好的内容,例如我们做搜索词项目的采集就会常常用到这个功能,提前把词汇放进这里,会自动循环调取这个自定义列表的参数

至此我们如何创建项目输入网址方法就讲完了,下节课我们来进行一个实际案例的操作讲解


教程专栏的目录链接,快速直达各个知识点:

八爪鱼采集器入门基础教程,日常更新中-CSDN博客


相关推荐
DKPT13 分钟前
Java桥接模式实现方式与测试方法
java·笔记·学习·设计模式·桥接模式
好奇的菜鸟2 小时前
如何在IntelliJ IDEA中设置数据库连接全局共享
java·数据库·intellij-idea
tan180°2 小时前
MySQL表的操作(3)
linux·数据库·c++·vscode·后端·mysql
满昕欢喜2 小时前
SQL Server从入门到项目实践(超值版)读书笔记 20
数据库·sql·sqlserver
巴伦是只猫2 小时前
【机器学习笔记Ⅰ】13 正则化代价函数
人工智能·笔记·机器学习
DuelCode3 小时前
Windows VMWare Centos Docker部署Springboot 应用实现文件上传返回文件http链接
java·spring boot·mysql·nginx·docker·centos·mybatis
幽络源小助理3 小时前
SpringBoot基于Mysql的商业辅助决策系统设计与实现
java·vue.js·spring boot·后端·mysql·spring
Hello.Reader3 小时前
Redis 延迟排查与优化全攻略
数据库·redis·缓存
烛阴3 小时前
简单入门Python装饰器
前端·python
好开心啊没烦恼4 小时前
Python 数据分析:numpy,说人话,说说数组维度。听故事学知识点怎么这么容易?
开发语言·人工智能·python·数据挖掘·数据分析·numpy