再次深入学习深度学习|花书笔记3

SVM支持向量机解决了什么问题

单层神经网络无法异或问题。

单层神经网络得到的线性模型:Y = A1X1+A2 X2+B

Y是二分类,可以使【1,0】,亦可以是【1,-1】。

这个东西我们可以看到,是一个线性的分类器,无法通过一条直线,分开异或这样分布的点。

支持向量机

根据https://blog.csdn.net/qq_53123067/article/details/136060974。

书上写得有些复杂,简单来说就是用一个核函数,把输入转高维特征。

按照我对斯坦福大学cs231n课程的记忆。比如说 用手一拍地面,体重轻的人就飞上天了。这里体重 就是高维特征。然后,在空中画出一个平面,就能做分类了。

当然,这里的高维也可以是更高的维度,分类也不一定是画平面。


相关推荐
h64648564h12 分钟前
CANN 昇腾 FP16 vs FP32 精度博弈:深度学习数值精度实战指南
人工智能·深度学习
T.i.s1 小时前
parall scan(并行扫描)通俗理解
人工智能·深度学习
h64648564h2 小时前
CANN 昇腾训练食谱全景解读:cann-recipes-train 架构与使用指南
人工智能·深度学习
灰灰勇闯IT3 小时前
DeepSeek-R1 在 CANN 上的推理部署
pytorch·python·深度学习
努力学习_小白3 小时前
Inception V1——学习记录
pytorch·深度学习·inception v1
星河耀银海4 小时前
人工智能:注意力机制与Transformer模型实战
人工智能·深度学习·transformer
生成论实验室4 小时前
用事件关系网络重新理解AI:自注意力机制、词向量、CNN、GAN、强化学习、Dropout、知识蒸馏
人工智能·深度学习·语言模型·机器人·自动驾驶
ybdesire4 小时前
详解大模型DPO训练数据格式
人工智能·深度学习·机器学习
文歌子4 小时前
认识 Prithvi:NASA × IBM 的遥感基础模型
人工智能·深度学习
txg6665 小时前
编译无关的漏洞检测:基于 Transformer 的 LLVM-IR 与汇编鲁棒建模
汇编·深度学习·安全·transformer