python大作业 写作思路

代码可以交给gpt一步一步来,但是要爬取什么得自己想。

首先爬取方面:

1.确定要爬取的对象,然后用edge,chorom等高级浏览器进行右键检查或者右上角打开 开发者工具,然后一个个翻自己要爬取的哪个class里面哪个标签中哪个标签中的哪个属性。

2.注意不能使用https,要使用http,不然会出现SSL报错

3.提前安装好requests和beautifulsoup,前者用于爬取,后者用于对html这类文件进行筛选

4.一定要记得把爬取的文件按照csv文件格式保存下来,至于选择哪些名称作为列名则看具体需要,csv文件比excel文件好操作,而且csv文件不需要装太多的包(注,csv文件本质上有txt文件改后缀变化,行与行之间之间enter换行即可,列与列之间要用英文逗号隔开)

所有步骤都应该单独列一个py文件进行运行,包括这个爬取,切勿一个文件走到底。

然后是对数据进行处理:

1.拿到的数据大部分都是文本数据,你需要再用一个py程序将其转换成名称,数量这种csv文件,而不是拿第一个爬取的文件去进行数据处理,也就是需要二次处理,除非你第一次爬出来的就是数据类型的,那就无需二次操作。

2.当你完成上面两步的时候,基本就快结束了,这时候就可以乘胜追击,进行数据的求平均值,相关性分析,聚类分析,你不会没关系,gpt会,直接搜就行,注意这也是要单独一个py程序的

3.要求上面要用到mysql,这里简要列出步骤,打开软件,点击你的test,然后新建数据库,起个名字,然后在这个数据库新建查询,输入建表语句(这个数据就是上一步的csv文件的东西,还要起个表名),然后在下一步中加进去你的host名,一般是localhost,用户名root,密码(不一定看你),数据库名,表名。

4.完成数据分析.py之后就是数据可视化分析,画图也好实现,唯一可能不方便的就是不输出中文,这时候在import下加上一句plt.rcParams'font.sans-serif'='SimHei'即可

相关推荐
zzzzzz3101 小时前
当产品经理说这个很简单:我用Python自动化处理奇葩需求的实战指南
python·pycharm·产品经理
雪隐2 小时前
个人电脑玩AI-06让5060 Ti给你打工——不光能画画,Qwen3-TTS还能学人说话,连我老板都信了!
人工智能·后端·python
兵慌码乱13 小时前
面向桌面端的资产管理系统分层架构设计与核心模块实现
python·系统架构·sqlite·pyqt5·数据库设计·桌面应用开发·mvc架构
hboot15 小时前
AI工程师第三课 - 机器学习基础
python·scikit-learn·kaggle
顾林海20 小时前
Agent入门阶段-编程基础-Python:流程控制
python·agent·ai编程
呱呱复呱呱1 天前
Django CBV 源码解读:一个请求是怎么找到你的 get() 方法的
python·django
曲幽1 天前
刚部署的 LibreTranslate 频频翻车?我掏出了 20 年前的 StarDict 词典,用 FastAPI 搭了个本地词典翻译 API
python·fastapi·web·translate·goldendict·libretranslate·stardict·pystardict
荣码1 天前
用Streamlit给AI应用套个界面,10行代码出Web页面
java·python
兵慌码乱2 天前
基于Python+PyQt5+SQLite的药房管理系统实现:事务一致性与界面解耦全流程解析
python·sqlite·信号与槽·pyqt5·数据库设计·桌面应用开发·事务处理
金銀銅鐵2 天前
[Python] 体验用欧几里得算法计算最大公约数的过程
python·数学