机器学习/深度学习训练day1

今天开始需要一点点的积累深度学习的知识了,会在这个专栏里面记录我学的东西的从0到1。

看的是李宏毅老师的机器学习课程。

很久没看数学的新东西了,死去的回忆。

机器学习的概念:

李老师对机器学习的描述很直接很深刻啊。其实就是要机器去寻找一个函数,并且是尽可能概率高的函数:

py 复制代码
f1(一段语音)  = "how are you"
f2(一张图片) = dog/cat/...
f3(围棋棋盘的落子情况) = 下一步落子的位置
f4(场景) = 一张对应的图片

然后函数有几种:(1) 函数结果为数值,为Regression。(2) 函数结果为一种选项,classification。(3) structure learning,用机器生成一些结构,比如生成一些图片。

loss函数其实就是每个训练项的偏移量的和,其实还更多的衡量方法。
loss=∑abs(resi−res)loss = \sum{abs(res_i - res)}loss=∑abs(resi−res)

假设loss和w、b的表达式为:f=wx+bf = wx + bf=wx+b

然后是举了个例子:

猜测 f = wx + b去预测视频网站上面浏览量,然后通过优化去逼近真实的结果,然后通过偏导数(斜率w对f的,先忽略b)去判断当前的w往哪边偏转,然后引入了一个值 η ,new-w = w - η * 偏导数,如果斜率是正数,说明随着w变大,loss变大,loss变大不是我们的本意,所以我们要减小w,反之,则是增大w。

同样的,对于b我们也可以这么做,然后在二维平面上去移动,刚刚因为只有一个w,现在是w、b的偏导数,所以是平面上移动,是乘以一个向量。

继续扩展,引入更多天的值(x),然后去回归更多的w,如下:
f=b+∑i=17wi∗xif = b + \sum_{i=1}^7w_i * x_if=b+∑i=17wi∗xi

其实就是不断的去猜测实际,然后调整我们的函数。

相关推荐
冬奇Lab10 小时前
Workflow 系列(04):Multi-Agent 协调——编排器边界、并发控制与上下文隔离
人工智能·工作流引擎
冬奇Lab10 小时前
每日一个开源项目(第147篇):HyperGraphRAG - 用超图表示 N 元关系,RAG 的第三代范式
人工智能·开源·graphql
甲维斯11 小时前
Github + 阿里云oss实现类似codex的自动更新!
人工智能
阿里云大数据AI技术13 小时前
光轮智能 × 阿里云:共建 Physical AI 云上数据、评测与持续学习基础设施
人工智能·机器学习
机器之心13 小时前
实锤了:Claude Code偷查用户,时区、中国AI实验室全是关键词
人工智能·openai
网易云信13 小时前
Cursor点燃个人开发者,企业级AI为何频频受挫?Agent工厂从提效工具到AI员工的跃迁
人工智能·开源
网易云信13 小时前
解锁触手可及的温暖:网易智企 x Wander Puffs AI 云游泡芙
人工智能
转转技术团队13 小时前
从 PRD 到可验证代码:AI 需求开发闭环实践
人工智能