飞牛爬虫FlyBullSpider 一款简单方便强大的爬虫,限时免费 特别适合小白!用它爬下Boss的2024年7月底Java岗位,分析一下程序员就业市场行情

一、下载安装FlyBullSpider

暂时支持Window,现在只在Win11上做过测试

1 百度

点击百度网盘 下载

链接:https://pan.baidu.com/s/1gSLKYuezaZgd8iqrXhk8Kg

提取码:Fly6

2 csdn

https://download.csdn.net/download/fencer911/89584687

二、体验初探:获取Boss Java岗位数据

飞牛爬虫 设计与运行在一个界面上,在动作编辑界面 还可以提前执行当前的动作。

基本上一行代码不写,一点配置也不改动的情况下,也能爬到数据。

但是,Boss的第一页与以后的页结构不一样,所以同一信息配置了两次,基本就只需要点点就行了。

在动作编辑界面 还可以提前执行当前的动作 . 自定义JS暂未实现,待更新。向下滚动时,值所对应框为向下的滚动的长度。

点击"运行" ,按钮变为运行中 ,执行完了 变回 "运行"

看下结果 。10页的数据300多条。Boss的同一url的数据,每次执行都不一样。点击 "导出" 可导出Excel

任务管理界面 新建任务 编辑 都可进入任务界面,点保存才会保存为json文件

任务文件 task.json 红圈圈的才是关键字段 简单吧!

三、上传excel 分析下数据

数据有重复的,手动在boss点,也会有重复的数据!

保险可以不搞循环(搞循环,也可以不设置"循环结束"),多次运行的数据可以累积在一起。

专科的不好混呀

相关推荐
iuhart7 分钟前
chromedp 反反爬设计方案
爬虫
橘猫云计算机设计8 分钟前
net+MySQL中小民营企业安全生产管理系统(源码+lw+部署文档+讲解),源码可白嫖!
数据库·后端·爬虫·python·mysql·django·毕业设计
爱吃泡芙的小白白2 小时前
爬虫学习——使用HTTP服务代理、redis使用、通过Scrapy实现分布式爬取
redis·分布式·爬虫·http代理·学习记录
Auroral1567 小时前
【Python爬虫详解】第五篇:使用正则表达式提取网页数据
爬虫
一个天蝎座 白勺 程序猿9 小时前
Python爬虫(4)CSS核心机制:全面解析选择器分类、用法与实战应用
css·爬虫·python
丰锋ff17 小时前
爬虫学习总结
爬虫
西柚小萌新20 小时前
【Python爬虫基础篇】--4.Selenium入门详细教程
爬虫·python·selenium
橘猫云计算机设计20 小时前
springboot基于hadoop的酷狗音乐爬虫大数据分析可视化系统(源码+lw+部署文档+讲解),源码可白嫖!
数据库·hadoop·spring boot·爬虫·python·数据分析·毕业设计
??? Meggie1 天前
Selenium 怎么加入代理IP,以及怎么检测爬虫运行的时候,是否用了代理IP?
爬虫·tcp/ip·selenium
用户199701080181 天前
深入解析淘宝商品详情 API 接口:功能、使用与实践指南
大数据·爬虫·数据挖掘