飞牛爬虫FlyBullSpider 一款简单方便强大的爬虫,限时免费 特别适合小白!用它爬下Boss的2024年7月底Java岗位,分析一下程序员就业市场行情

一、下载安装FlyBullSpider

暂时支持Window,现在只在Win11上做过测试

1 百度

点击百度网盘 下载

链接:https://pan.baidu.com/s/1gSLKYuezaZgd8iqrXhk8Kg

提取码:Fly6

2 csdn

https://download.csdn.net/download/fencer911/89584687

二、体验初探:获取Boss Java岗位数据

飞牛爬虫 设计与运行在一个界面上,在动作编辑界面 还可以提前执行当前的动作。

基本上一行代码不写,一点配置也不改动的情况下,也能爬到数据。

但是,Boss的第一页与以后的页结构不一样,所以同一信息配置了两次,基本就只需要点点就行了。

在动作编辑界面 还可以提前执行当前的动作 . 自定义JS暂未实现,待更新。向下滚动时,值所对应框为向下的滚动的长度。

点击"运行" ,按钮变为运行中 ,执行完了 变回 "运行"

看下结果 。10页的数据300多条。Boss的同一url的数据,每次执行都不一样。点击 "导出" 可导出Excel

任务管理界面 新建任务 编辑 都可进入任务界面,点保存才会保存为json文件

任务文件 task.json 红圈圈的才是关键字段 简单吧!

三、上传excel 分析下数据

数据有重复的,手动在boss点,也会有重复的数据!

保险可以不搞循环(搞循环,也可以不设置"循环结束"),多次运行的数据可以累积在一起。

专科的不好混呀

相关推荐
interception2 小时前
爬虫逆向:瑞数5(华能电子)
爬虫
光算科技3 小时前
商品颜色/尺码选项太多|谷歌爬虫不收录怎么办
java·javascript·爬虫
是Yu欸4 小时前
扫描网站结构的SEO元数据抓取方案
爬虫·seo·亮数据·brightdata
Data_Journal5 小时前
Puppeteer vs. Playwright —— 哪个更好?
运维·人工智能·爬虫·媒体·静态代理
啊巴矲5 小时前
小白从零开始勇闯人工智能:爬虫初级篇(Selenium库)
爬虫·selenium·测试工具
serve the people6 小时前
AI 模型识别 Nginx 流量中爬虫机器人的防御机制
人工智能·爬虫·nginx
薛不痒7 小时前
网络爬虫下(一些对网页的操作)
爬虫
小白学大数据7 小时前
Python 爬虫如何分析并模拟 JS 动态请求
开发语言·javascript·爬虫·python
深蓝电商API7 小时前
2025爬虫技术前沿:AI驱动、多模态与反反爬的军备竞赛
人工智能·爬虫
爱打代码的小林7 小时前
python(爬虫selenium)
爬虫·python·selenium