一、下载安装FlyBullSpider
暂时支持Window,现在只在Win11上做过测试
1 百度
链接:https://pan.baidu.com/s/1gSLKYuezaZgd8iqrXhk8Kg
提取码:Fly6
2 csdn
https://download.csdn.net/download/fencer911/89584687
二、体验初探:获取Boss Java岗位数据
飞牛爬虫 设计与运行在一个界面上,在动作编辑界面 还可以提前执行当前的动作。
基本上一行代码不写,一点配置也不改动的情况下,也能爬到数据。
但是,Boss的第一页与以后的页结构不一样,所以同一信息配置了两次,基本就只需要点点就行了。

在动作编辑界面 还可以提前执行当前的动作 . 自定义JS暂未实现,待更新。向下滚动时,值所对应框为向下的滚动的长度。

点击"运行" ,按钮变为运行中 ,执行完了 变回 "运行"
看下结果 。10页的数据300多条。Boss的同一url的数据,每次执行都不一样。点击 "导出" 可导出Excel

任务管理界面 新建任务 编辑 都可进入任务界面,点保存才会保存为json文件

任务文件 task.json 红圈圈的才是关键字段 简单吧!

三、上传excel 分析下数据
数据有重复的,手动在boss点,也会有重复的数据!
保险可以不搞循环(搞循环,也可以不设置"循环结束"),多次运行的数据可以累积在一起。



专科的不好混呀