python爬虫爬取淘宝热销(热门)零食商品加数据清洗、销量、店铺及词云数据分析_源码及相关说明文档；售后可私博主

@TOC

如有侵权,联系删除

一、环境说明

使用前必须检查以下环境

（1）python编译环境

（2）python脚本执行所需要的库，具体看代码（main.py）import导入的部分库

（3）确保电脑可以正常连接网络，可以正常访问淘宝链接

（4）anconda环境（可选）

备注：博主测试的python环境是3.8.8，尽量用python3版本

二、数据爬虫

资源下载后，首先是爬虫爬取数据代码和使用说明，可以查看同级目录下的spider目录

进入spider目录里面有相关说明文档，一定要先看"使用说明（使用前必看）.docx "文件，该文档详细写了运行的步骤，小白也能看得懂的傻瓜式教程

然后看main.py，这个是代码文件，共分为两个主要方法，一个是get_data方法，用于爬取数据，另一个是save_to_csv方法，用于保存数据

_main_是主函数入口，这里默认爬取30页的数据，可以根据实际情况修改要爬取的页数，运行后自动在同级目录生成data文件夹，里面保存爬取后的数据

至此数据爬取部分已完成

三、数据清洗与分析

因为考虑到了有用户用的jupyter，所以这里提供了两个版本

注意：这里提供了两个版本，analysis.ipynb和analysis.py，任意一个跑起来都可以

注意：这里提供了两个版本，analysis.ipynb和analysis.py，任意一个跑起来都可以

注意：这里提供了两个版本，analysis.ipynb和analysis.py，任意一个跑起来都可以

下载资源后，最外层资源有一个"使用说明（使用前必看）.docx "文件，一定要先看这个文件，这个是整理的详细的傻瓜式的运行教程，小白绝对能看得懂