接上篇6.零代码网页爬虫软件基础实操------下载与安装八爪鱼采集器
八爪鱼免费爬虫软件下载:
八爪鱼采集器下载 小白数据采集神器https://affiliate.bazhuayu.com/retrieve
直接复制粘贴要采集的网站在这里就可以进入采集规则的设计器
自定义任务
通过这个功能,可以进入到网址构建的更高阶使用方法
手动输入
直接填写网址或者复制网址到这个输入框,再点击保存设置即可
文件导入
导入的文件可以是txt、csv、xlsx,最多100万条数据
从任务导入
我们采集到的数据,在相关规则下,所以可以直接从这里导入之前采集到的数据,作为二次采集的起始网址。
批量生成
这个功能可以把有规律的网址,通过批量生成的方式构建出来,例如:网址的page页是有规律的,每一篇文章的数字编号+1,那就直接构建一个参数即可,可以通过测试生成网站来确认构建是否正确,下方"网址预览"中会显示出100条数据供查看。
数字变更
字母变更
时间变更
有一些新闻站上通过日期的方式生成文章/帖子,用这个时间变更的构建方案就很方便
自定义列表
这里可以填写你提前准备好的内容,例如我们做搜索词项目的采集就会常常用到这个功能,提前把词汇放进这里,会自动循环调取这个自定义列表的参数
至此我们如何创建项目输入网址方法就讲完了,下节课我们来进行一个实际案例的操作讲解
教程专栏的目录链接,快速直达各个知识点: