Selenium + Django + Echarts 实现亚马逊商品数据可视化爬虫项目

最近完成了1个爬虫项目,记录一下自己的心得。

项目功能简介

根据用户输入商品名称、类别名称,使用Selenium, BS4等技术每天定时抓取亚马逊商品数据,使用Pandas进行数据清洗后保存在MySql数据库中.

使用Django提供用户端功能,显示商品数据,以可视化的方式分析数据,以及数据抓取任务管理等。

项目技术难点:

1)亚马逊Anti-scrape 措施较多,页面都是动态网页,因此,页面元素分析,javascript分析工作量占据大部分时间。

2)性能优化,执行任务采用异步,多进程方式运行,提供定时任务管理功能。

3)Django模板中添加Echarts Javascript 脚本进行图表绘制,自定义 filter form 提供数据。 由于时间短,未使用Vue方式。

4)保持项目的扩展性:通过爬虫任务管理器满足用户的各类搜索需求。数据库分为原始数据以及清洗数据,中间的cleaning类可以随时扩展,

5)通用绘图接口功能: 由于绘图是通过模板中的javascript脚本完成,计划另写1套通用接口,将数据、绘图类型以参数方式传入,再向django 模板插入echarts绘图脚本,

合作说明

亚马孙的商品页面依据类别、用户所在地、收货地等不同而有所不同,但毕竟是大公司产品,其页面组织是规范的,因此本项目也很容易扩展。 如有对亚马逊数据分析的合作需求,留私信留言。

相关推荐
_菜鸟果果16 小时前
Vue3+echarts 3d饼图
前端·javascript·echarts
java水泥工18 小时前
基于Echarts+HTML5可视化数据大屏展示-电信厅店营业效能分析
前端·echarts·html5·大屏展示
将车24418 小时前
selenium实现自动化脚本的常用函数
python·selenium·自动化
hwman18 小时前
使用Selenium Server 4连接已经运行的Firefox
selenium·测试工具·firefox
Q_Q51100828521 小时前
python+uniapp基于微信小程序的心理咨询信息系统
spring boot·python·微信小程序·django·flask·uni-app·node.js
程序员杰哥21 小时前
UI自动化测试实战:从入门到精通
自动化测试·软件测试·python·selenium·测试工具·ui·职场和发展
Q_Q5110082851 天前
python+uniapp基于微信小程序的学院设备报修系统
spring boot·python·微信小程序·django·flask·uni-app
paopaokaka_luck1 天前
基于SpringBoot+Vue的数码交流管理系统(AI问答、协同过滤算法、websocket实时聊天、Echarts图形化分析)
vue.js·人工智能·spring boot·websocket·echarts
liweiweili1261 天前
Django中处理多数据库场景
数据库·python·django
麦麦大数据2 天前
F024 RNN+Vue+Flask电影推荐可视化系统 python flask mysql 深度学习 echarts
python·rnn·深度学习·vue·echarts·电影推荐