我的机器学习学习之路

学习python的初衷

• hi,今天给朋友们分享一下我是怎么从0基础开始学习机器学习的。

• 我是2023年9月开始下定决心要学python的,目的有两个,一是为了提升自己的技能和价值,二是将所学的知识应用到工作中去,提升工作效率。

我的背景与书籍选择

• 我是上班族,2023年非全日制硕士研究生毕业。

• 我的导师是数学博士,在导师的推荐下买了周老师的《机器学习(西瓜书)》和李航老师的《统计学习方法》,这2本书主要讲机器学习的基础理论,对于我这种0基础的小白,完全看不懂,就连简单的代码都不懂,所以只能从基础的python开始学起。

python入门学习

• 于是在网上查了很多资料,买了第一本书《python编程从入门到实践》第三版,在看书的同时,在b站同步看视频,一边学一边用电脑敲代码,感觉挺有意思,兴趣越来越浓了,下班回家、周末,都会找时间学习。

• 这本书学到第11章,后面具体项目实例,没有学。

• 感觉挺简单的,就是学完容易忘,尤其对于我这种新手,不过没关系,后面的学习都会用到python,可以巩固。

python数据分析学习

• 第二本书学的《利用python进行数据分析》第三版,用python操作数据进行分组、合并等等。

• 第三本书学的《 Excel+Python》,用python读写excel等。

• 这2本书主要以看书为主,遇到不懂不会的知识点,就在网上找资料,博客里面有好多大佬讲的非常好,通俗易懂,看完基本都会了。

• 这段时间各大互联网公司陆续发布了大模型,开始用的文心一言,对于自学的人来讲,简直就是自学机器学习神器,不会的不懂的就问,再不懂还可以追问,直到明白为止。

• 2024年与文心一言互动2300多次。

• 学完这2本书,既巩固了python基础,又学习了用python来操作数据。

• 用这些学到的知识,针对日常中经常操作excel工作,做了几个自动化python小程序,可以简单实现办公自动化了。

机器学习理论学习

• 当有了一定的python和数据分析基础之后,再看《西瓜书》和《统计学习方法》,里面的代码至少能看的懂些了。

• 我大学学的工科,学过高数、概率论和线性代数,大学都没好好学,那会沉迷于dota,学这些影响我玩dota(中单影魔,白虎的箭,推塔的小y,憋辉耀的幽鬼,跑题了......)。

• 出来混,迟早是要还的,这2本书是最难的,里面有很多公式,完全看不懂,就在b站找了很多视频,有几个博主是完全按照这2本书内容讲的,讲的非常好,看完视频在看书,就简单很多了,也有的博主讲的某个算法,比大学老师讲的可能都好,《西瓜书》还有周老师给学生将的研究生课程视频。

• 我是边学习边记笔记,后面忘了就看笔记。

• 学到集成学习的时候又买了周老师的《集成学习》,这本书详细介绍集成学习知识。

• 《西瓜书》学到第12章、《统计学习方法》学到第16章,后面内容是马尔科夫链等概率模型,暂时就不学了,之后有需要再来学。

机器学习实战学习

• 当学完理论以后,就迫不及待的学习《Python机器学习基础教程》、《机器学习实战》,主要讲怎么用python库sklearn实现机器学习算法,有监督无监督学习算法、数据预处理、模型评估、调参数、管道等等,也会涉及到数据分析的知识。

• 这部分内容主要以看书+敲代码+豆包+deepseek为主。

• 之前用文心一言,后面发现豆包回答讲解会更好些,deepseek出来之后,深度思考的内容也很好。

• 既巩固了前面几本书的知识,又能手动实现了这些算法。

• 《Python机器学习基础教程》学完了,《机器学习实战》只学习了一部分(200多页),后面第二部分是深度神经网络的内容(有5-6百页吧),以后学习深度神经网络在学。

学习历程回顾

• 截止到2025年3月底,从2023年9月开始学习python基础到数据分析,再到机器学习,已经学习了一年半了,我感觉已经有能力利用python完成一些简单的办公自动化和建模工作了。

后续学习计划

• 后面计划暂时先不学习深度神经网络知识,接下来打算针对自己的工作内容做些自动化的小程序和模型,实战1-2年后再学吧。

切记,光学不练,没用的,所以一定要练习,实战。

对学习的看法

• 身边的人多次问我,现在大模型都能给出你想要的代码,还学习python有啥用?

• 虽然模型能给出代码,但是看不懂,又不懂理论,也没法结合问题去优化代码,有时候给出的代码也不一定是你想要的,有的时候代码也有可能是错误的,无论是文心一言,豆包,还是deepseek,都有错的,已经验证过好多次了,同一个问题三个模型给出的回答都是错的。

你的优势

• 也许过了五年、十年,你的工作因为你会编写代码,自己建模而没有被裁员,这就是你的优势。

相关推荐
vonchenchen111 分钟前
nara wpe去混响学习笔记
机器学习·音视频·音频·信息与通信·信号处理
不爱吃鱼的猫-35 分钟前
Pyside6 开发 使用Qt Designer
python·pyqt·pyside6
天才测试猿43 分钟前
Selenium常用函数总结
自动化测试·软件测试·python·selenium·测试工具·职场和发展·测试用例
邴越1 小时前
人工智能、机器学习经典计算机课程
人工智能·机器学习
nqqcat~1 小时前
STL常用算法
开发语言·c++·算法
汤姆yu1 小时前
基于python大数据的商品数据可视化分析系统
大数据·python·信息可视化·商品数据
_GR1 小时前
2022年蓝桥杯第十三届C&C++大学B组真题及代码
c语言·数据结构·c++·算法·蓝桥杯·动态规划
HABuo1 小时前
【YOLOv8】YOLOv8改进系列(11)----替换主干网络之MobileNetV4
人工智能·深度学习·yolo·目标检测·计算机视觉
Matlab光学1 小时前
MATLAB仿真:Ince-Gaussian光束和Ince-Gaussian矢量光束
开发语言·算法·matlab
鑫优威激光模组2 小时前
红外安防激光器在构建智慧城市过程中扮演的关键角色
人工智能·智慧城市