机器学习/深度学习训练day1

今天开始需要一点点的积累深度学习的知识了,会在这个专栏里面记录我学的东西的从0到1。

看的是李宏毅老师的机器学习课程。

很久没看数学的新东西了,死去的回忆。

机器学习的概念:

李老师对机器学习的描述很直接很深刻啊。其实就是要机器去寻找一个函数,并且是尽可能概率高的函数:

py 复制代码
f1(一段语音)  = "how are you"
f2(一张图片) = dog/cat/...
f3(围棋棋盘的落子情况) = 下一步落子的位置
f4(场景) = 一张对应的图片

然后函数有几种:(1) 函数结果为数值,为Regression。(2) 函数结果为一种选项,classification。(3) structure learning,用机器生成一些结构,比如生成一些图片。

loss函数其实就是每个训练项的偏移量的和,其实还更多的衡量方法。
loss=∑abs(resi−res)loss = \sum{abs(res_i - res)}loss=∑abs(resi−res)

假设loss和w、b的表达式为:f=wx+bf = wx + bf=wx+b

然后是举了个例子:

猜测 f = wx + b去预测视频网站上面浏览量,然后通过优化去逼近真实的结果,然后通过偏导数(斜率w对f的,先忽略b)去判断当前的w往哪边偏转,然后引入了一个值 η ,new-w = w - η * 偏导数,如果斜率是正数,说明随着w变大,loss变大,loss变大不是我们的本意,所以我们要减小w,反之,则是增大w。

同样的,对于b我们也可以这么做,然后在二维平面上去移动,刚刚因为只有一个w,现在是w、b的偏导数,所以是平面上移动,是乘以一个向量。

继续扩展,引入更多天的值(x),然后去回归更多的w,如下:
f=b+∑i=17wi∗xif = b + \sum_{i=1}^7w_i * x_if=b+∑i=17wi∗xi

其实就是不断的去猜测实际,然后调整我们的函数。

相关推荐
AI 嗯啦31 分钟前
计算机视觉--opencv(代码详细教程)(二)
人工智能·opencv·计算机视觉
Moshow郑锴36 分钟前
什么是主成分分析(PCA)和数据降维
人工智能·主成分分析·数据降维
重启的码农39 分钟前
ggml介绍 (2) 量化 (Quantization)
人工智能·神经网络
人工智能培训43 分钟前
大模型微调方法讲解
人工智能·机器学习
AI人工智能+1 小时前
应用银行卡识别技术,构建更安全、便捷的数字身份认证与支付生态
人工智能·ocr·银行卡识别
张成AI1 小时前
Gemini CLI 2025年8月重大更新:VSCode集成与MCP协议增强
人工智能·gemini cli
二多Lab1 小时前
【终极指南】小白 Windows 系统本地部署 Qwen2.5-VL-7B (GGUF + GPU加速)
人工智能·开源·阿里巴巴
LLM精进之路2 小时前
RCL 2025 | LLM采样机制的新视角:来自处方性偏移的解释
人工智能·深度学习·机器学习·语言模型·transformer
机器之心2 小时前
扎克伯格看OpenAI直播挖人,北大校友孙之清加入Meta
人工智能·openai