机器学习/深度学习训练day1

今天开始需要一点点的积累深度学习的知识了,会在这个专栏里面记录我学的东西的从0到1。

看的是李宏毅老师的机器学习课程。

很久没看数学的新东西了,死去的回忆。

机器学习的概念:

李老师对机器学习的描述很直接很深刻啊。其实就是要机器去寻找一个函数,并且是尽可能概率高的函数:

py 复制代码
f1(一段语音)  = "how are you"
f2(一张图片) = dog/cat/...
f3(围棋棋盘的落子情况) = 下一步落子的位置
f4(场景) = 一张对应的图片

然后函数有几种:(1) 函数结果为数值,为Regression。(2) 函数结果为一种选项,classification。(3) structure learning,用机器生成一些结构,比如生成一些图片。

loss函数其实就是每个训练项的偏移量的和,其实还更多的衡量方法。
loss=∑abs(resi−res)loss = \sum{abs(res_i - res)}loss=∑abs(resi−res)

假设loss和w、b的表达式为:f=wx+bf = wx + bf=wx+b

然后是举了个例子:

猜测 f = wx + b去预测视频网站上面浏览量,然后通过优化去逼近真实的结果,然后通过偏导数(斜率w对f的,先忽略b)去判断当前的w往哪边偏转,然后引入了一个值 η ,new-w = w - η * 偏导数,如果斜率是正数,说明随着w变大,loss变大,loss变大不是我们的本意,所以我们要减小w,反之,则是增大w。

同样的,对于b我们也可以这么做,然后在二维平面上去移动,刚刚因为只有一个w,现在是w、b的偏导数,所以是平面上移动,是乘以一个向量。

继续扩展,引入更多天的值(x),然后去回归更多的w,如下:
f=b+∑i=17wi∗xif = b + \sum_{i=1}^7w_i * x_if=b+∑i=17wi∗xi

其实就是不断的去猜测实际,然后调整我们的函数。

相关推荐
程序员cxuan17 小时前
为每个任务配一套 harness:Claude Code 里的动态工作流
人工智能
程序员cxuan17 小时前
Claude Fable 5 来了
人工智能·后端·程序员
云边云科技_云网融合17 小时前
云边云科技亮相 2026 WOD 制造业数智化博览会 云网融合赋能制造焕新
人工智能·科技·安全·制造
Σίσυφος190017 小时前
激光三角 光平面标定-多高度误差分析
人工智能·计算机视觉·平面
JS菌17 小时前
手写一个 AI Agent 全栈项目:从沙箱执行到子智能体的完整实现
前端·人工智能·后端
lqqjuly17 小时前
前沿算法深度解析(二)
人工智能·算法·机器学习
Bode_200217 小时前
基于大数据分析的全生命周期质量追溯质量评估体系落地方案
大数据·人工智能
分布式存储与RustFS18 小时前
RustFS S3 Table 开源后,我重新梳理了一下 Iceberg 数据湖的选型思路
人工智能·开源·minio·dpu·rustfs·ai存储·s3 table
DevOpenClub19 小时前
用 Agent 搭建网页内容采集与结构化处理流水线
人工智能
56AI19 小时前
2026 企业级AI智能体开发平台推荐:聚焦底层安全与准确率的智能体平台
人工智能·安全·智能体