机器学习/深度学习训练day1

今天开始需要一点点的积累深度学习的知识了,会在这个专栏里面记录我学的东西的从0到1。

看的是李宏毅老师的机器学习课程。

很久没看数学的新东西了,死去的回忆。

机器学习的概念:

李老师对机器学习的描述很直接很深刻啊。其实就是要机器去寻找一个函数,并且是尽可能概率高的函数:

py 复制代码
f1(一段语音)  = "how are you"
f2(一张图片) = dog/cat/...
f3(围棋棋盘的落子情况) = 下一步落子的位置
f4(场景) = 一张对应的图片

然后函数有几种:(1) 函数结果为数值,为Regression。(2) 函数结果为一种选项,classification。(3) structure learning,用机器生成一些结构,比如生成一些图片。

loss函数其实就是每个训练项的偏移量的和,其实还更多的衡量方法。
loss=∑abs(resi−res)loss = \sum{abs(res_i - res)}loss=∑abs(resi−res)

假设loss和w、b的表达式为:f=wx+bf = wx + bf=wx+b

然后是举了个例子:

猜测 f = wx + b去预测视频网站上面浏览量,然后通过优化去逼近真实的结果,然后通过偏导数(斜率w对f的,先忽略b)去判断当前的w往哪边偏转,然后引入了一个值 η ,new-w = w - η * 偏导数,如果斜率是正数,说明随着w变大,loss变大,loss变大不是我们的本意,所以我们要减小w,反之,则是增大w。

同样的,对于b我们也可以这么做,然后在二维平面上去移动,刚刚因为只有一个w,现在是w、b的偏导数,所以是平面上移动,是乘以一个向量。

继续扩展,引入更多天的值(x),然后去回归更多的w,如下:
f=b+∑i=17wi∗xif = b + \sum_{i=1}^7w_i * x_if=b+∑i=17wi∗xi

其实就是不断的去猜测实际,然后调整我们的函数。

相关推荐
聆风吟º4 小时前
CANN hccl 深度解析:异构计算集群通信库的跨节点通信与资源管控实现逻辑
人工智能·wpf·transformer·cann
狸奴算君4 小时前
告别机械回复:三步微调AI模型,打造会“读心”的智能客服
人工智能
七夜zippoe4 小时前
脉向AI|当豆包手机遭遇“全网封杀“:GUI Agent是通向AGI的必经之路吗?
人工智能·ai·智能手机·agent·gui
木非哲4 小时前
机器学习--随机森林--从一棵树的直觉到一片林的哲学
人工智能·随机森林·机器学习
神的泪水4 小时前
CANN 系列底层篇:基于 shmem 实现 NPU 设备内存的高效共享
人工智能
皮卡丘不断更4 小时前
手搓本地 RAG:我用 Python 和 Spring Boot 给 AI 装上了“实时代码监控”
人工智能·spring boot·python·ai编程
浪子小院4 小时前
ModelEngine 智能体全流程开发实战:从 0 到 1 搭建多协作办公助手
大数据·人工智能
程序员打怪兽5 小时前
详解YOLOv8网络结构
人工智能·深度学习
Yuer20255 小时前
全国首例“AI 幻觉”侵权案判了:这不是 AI 准不准的问题,而是谁该为 AI 负责
人工智能·edca os·可控ai
一切尽在,你来5 小时前
1.1 AI大模型应用开发和Langchain的关系
人工智能·langchain