推荐理由
-
全面:把零基础Python编程、可视化、数学、数据、机器学习,融合在一起,循循渐进。
-
开源:PDF、Python代码、Jupyter文档,在github直接免费下!
-
真实:提供大量真实场景下的数据,对算法进行分析与预测,十分直观!
原文链接:https://www.zhihu.com/question/366915371/answer/31099661433
以下是书中的一些内容摘抄,供参考!
1、相信"反复 + 精进"的力量!反复,不是机械重复,不是当一天和尚撞一天钟。而是在反复中,日拱一卒,不断精进!
2、用好GPT,ChatGpt or kimi!
一、内容大纲
二、了解python
1. python介绍
Python 的版本持续演进。Python 2.x 和 3.x 系列并存一段时间!
建议大家学习时使用最新版本
2. python下的术语
3.利用python编程
python编程示例
4. 对代码的解构
ifelse的运行原理
三、数学、编程和可视化
数学vs编程
四、编程和机器学习
机器学习模型不是黑盒子。只有能合理解释的模型才让人信服,想调参训练模型的话,就必 须要了解其背后的数学原理和算法逻辑。调包虽然方便,但有时会导致对模型的理解不足。这种情况 下,无法解释模型的决策过程,无法识别模型的潜在偏差或不适用性。了解数学背后的工具和算法可以 帮助你理解模型的内部机制,提高模型的可解释性。
机器学习的算法层出不穷。知道数学工具和算法逻辑的局限性和适用性有助于选择合适的算 法,避免不必要的错误。
很多时候标准模型不可能解决你的"定制化"问题,我们常常需要根据问题的具体特征改进、 创新算法。
1. 回归和线性拟合
线性回归
2. 回归和分类模型
拓宽知识边界,多种回归的差异性
3. 决策边界
决策边界
4. 正则化
正则化 (regularization) 可以用来抑制过度拟合。本书前文提过,所谓过度拟合,是指模型参数过多或者结构过于复杂。
正则项 (regularizer, regularization term, penalty term) 通常被加在目标函数 (objective function) 当中。正则项可以让估计参数变小甚至为0,这一现象也叫特征缩减 (shrinkage)。
►L2 正则化,也叫岭 (ridge) 正则化。有助于减小模型参数的大小。图 15 所示为岭正则化原 理。
► L1 正则化,也叫套索 (Lasso) 正则化。可以将某些模型参数缩减为零。
► 弹性网络 (elastic net) 结合了 L2 正则化和 L1 正则化,它同时考虑两种正则化的效果。
L1、L2的差异性
5.聚类
聚类是指将数据集中的样本按照某种相似性指标进行分组的过程。
核技巧 (kernel trick) 将数据映射到高维特征空间,相当于数据升维。
添加图片注释,不超过 140 字(可选)
五、编程和IDE工具
必须要了解的工具,Anaconda、Vscode、Markdown、正则表达式、Jupyter、pycharm
1. Anaconda
Anaconda 可谓"科学计算全家桶",包含科学计算领域可能用到的大部分 Python 工具,包括 Python 解释器、常用的第三方库、包管理器、IDE 等。
2. spyder
spyder示意图
六、快捷键
编辑模式下的快捷键(1)
编辑模式下的快捷键(2)
命令模式下的快捷键