机器学习/深度学习训练day1

今天开始需要一点点的积累深度学习的知识了,会在这个专栏里面记录我学的东西的从0到1。

看的是李宏毅老师的机器学习课程。

很久没看数学的新东西了,死去的回忆。

机器学习的概念:

李老师对机器学习的描述很直接很深刻啊。其实就是要机器去寻找一个函数,并且是尽可能概率高的函数:

py 复制代码
f1(一段语音)  = "how are you"
f2(一张图片) = dog/cat/...
f3(围棋棋盘的落子情况) = 下一步落子的位置
f4(场景) = 一张对应的图片

然后函数有几种:(1) 函数结果为数值,为Regression。(2) 函数结果为一种选项,classification。(3) structure learning,用机器生成一些结构,比如生成一些图片。

loss函数其实就是每个训练项的偏移量的和,其实还更多的衡量方法。
loss=∑abs(resi−res)loss = \sum{abs(res_i - res)}loss=∑abs(resi−res)

假设loss和w、b的表达式为:f=wx+bf = wx + bf=wx+b

然后是举了个例子:

猜测 f = wx + b去预测视频网站上面浏览量,然后通过优化去逼近真实的结果,然后通过偏导数(斜率w对f的,先忽略b)去判断当前的w往哪边偏转,然后引入了一个值 η ,new-w = w - η * 偏导数,如果斜率是正数,说明随着w变大,loss变大,loss变大不是我们的本意,所以我们要减小w,反之,则是增大w。

同样的,对于b我们也可以这么做,然后在二维平面上去移动,刚刚因为只有一个w,现在是w、b的偏导数,所以是平面上移动,是乘以一个向量。

继续扩展,引入更多天的值(x),然后去回归更多的w,如下:
f=b+∑i=17wi∗xif = b + \sum_{i=1}^7w_i * x_if=b+∑i=17wi∗xi

其实就是不断的去猜测实际,然后调整我们的函数。

相关推荐
Surmon31 分钟前
彻底搞懂大模型 Temperature、Top-p、Top-k 的区别!
前端·人工智能
见行AGV机器人3 小时前
无人机脉动线中的AGV小车
人工智能·无人机·agv·非标定制agv
廋到被风吹走3 小时前
【AI】从 OpenAI Codex 到 GitHub Copilot:AI 编程助手的技术演进脉络
人工智能·github·copilot
newsxun3 小时前
DHA之后,大脑营养进入GPC时代?
人工智能
程序员Better3 小时前
2026年AI大模型选择指南:8大主流模型深度对比,小白秒懂如何选!
人工智能
ai_xiaogui3 小时前
AIStarter新版后端原型图详解:架构全面升级+共享环境一键部署,本地AI模型插件工作流管理新时代来临(2026开发者必看)
人工智能·架构·推动开源ai落地·原型图细节·aistarter新版·aistarter新版原型图·架构全面升级+共享环境一键部署
2501_926978333 小时前
“LLM的智能本质--AGI的可能路径--人类的意识本质”三者的统一基底(5.0理论解读)
人工智能·经验分享·笔记·深度学习·机器学习·ai写作·agi
拾光向日葵3 小时前
2026贵州高职专科报考全问答合集:专业、就业与实力大盘点
大数据·人工智能·物联网
لا معنى له3 小时前
WAM与AC-WM:具身智能时代的世界动作模型与动作条件世界模型
人工智能·笔记·学习
uzong4 小时前
AI Agent 是什么,如何理解它,未来挑战和思考
人工智能·后端·架构