AI基础知识(3)--神经网络,支持向量机,贝叶斯分类器

1.什么是误差逆传播算法(error BackPropagation,简称BP)?

是一种神经网络学习算法。BP是一个迭代学习算法 ,在迭代的每一轮使用广义的感知机学习规则对参数进行更新估计。基于梯度下降(gradient descent) 策略,以目标的负方向对参数进行更新。BP的算法工作流程 大致是:先将输入样本输入给输入层神经元,再将误差逆向传播至隐层神经元最后根据隐层神经元的误差来对连接权(connection weight)和阈值(threshold)进行调整,该过程迭代调整,直到训练误差达到一个很小的值。

2.如何解决误差函数中参数寻优陷入局部极小的问题?

(1)以多组不同的值初始化多个神经网络,按标准方法训练之后,取其中误差最小的解作为参数。这相当于从不同的初始点开始搜索,这样就可能陷入不同的局部最小。

(2)使用**"模拟退火"(simulated annealing)技术**,模拟退火每一步都在以一定的概率接受比当前更差的结果,从而有助于"跳出"局部极小。

(3)使用随机梯度下降,与标准梯度下降计算机误差精度不同,随机梯度下在计算梯度时加入了随机因素,即使陷入局部极小点,它计算出的梯度仍可能不为0,这样就有机会跳出局部极小。

3.什么是预训练(pre-training)?

由于多隐层神经网络在多隐层逆传播时,往往会"发散"(diverse)而不能收敛到稳定状态,**所以采用预训练方法,训练时将上一层隐结点的输出作为输入,而本层隐结点的输出作为下一层隐结点的输入。**在预训练结束后,再对整个网络进行微调(fine-tuning)。

4.什么是支持向量机(support vector machine)?

首先解释支持向量(support vector),是指距离超平面,最近的几个点使得下面公式的等号成立,他们被称为"支持向量"。

两个异类支持向量到超平面的距离称为间隔(margin),欲找到具有"最大间隔"(maximum margin)的划分超平面,也就是找到能满足上面约束条件的参数w和b,使得margin最大,这就是支持向量机(SVM)的基本型:对于二分类问题,找到一个超平面,使得margin最大。

相关推荐
AI自动化工坊11 分钟前
Late框架技术深度解析:5GB VRAM实现10倍AI编码效率的工程架构
人工智能·5g·架构·ai编程·late
我是大聪明.28 分钟前
DeepSeek V4 Pro + 华为昇腾910:国产大模型落地的性能实测与深度解析
人工智能·华为
机器之心1 小时前
Generalist之后,罗剑岚团队推出LWD,也要变革具身智能训练范式
人工智能·openai
IT_陈寒1 小时前
Vite的public文件夹放静态资源?这坑我替你踩了
前端·人工智能·后端
传说故事1 小时前
【论文阅读】Diffusion Forcing: Next-token Prediction Meets Full-Sequence Diffusion
论文阅读·人工智能·diffusion
xixixi777771 小时前
三重筑基:5G-A超级上行提速千兆,电联低频共享扫平盲点,800V HVDC算电协同破局
人工智能·5g·ai·大模型·算力·通信·信通院
jkyy20141 小时前
AI运动数字化:以技术重塑场景,健康有益赋能全域运动健康管理
大数据·人工智能·健康医疗
金融小师妹1 小时前
4月30日多因子共振节点:鲍威尔“收官效应”与权力结构重塑的预期重构
大数据·人工智能·重构·逻辑回归
2601_949925181 小时前
AI Agent如何重构跨境物流的决策?
大数据·人工智能·重构·ai agent·geo优化·物流科技
AI木马人1 小时前
1.人工智能实战:大模型推理接口响应慢?从模型加载到 FastAPI 部署的完整优化方案
人工智能·python·fastapi