神经网络与深度学习(第二章)

1.机器学习四要素

(1)数据:模型训练的基本

(2)模型:根据任务和数据类型选择合适的模型

(3)学习准则:计算损失

(4)优化算法:根据损失使用梯度下降or反向传播算法更新模型参数,从而优化模型

本质:通过数据训练所选择的模型,然后计算误差,再根据误差进行优化更新模型参数

2.过拟合和欠拟合的含义

过拟合:模型在训练集上学习的"过好",把噪声和无关特征都学习进去了,导致在测试集上的性能很差,泛化性差

欠拟合:模型在训练集和测试集上的性能都很差,主要因为模型的复杂度过低

3.经验风险和结构风险含义

经验风险:优化时追求训练集误差最小化,容易学习噪声导致过拟合

结构风险:考虑经验风险和模型复杂度,让模型复杂度作为经验风险的约束项,从而避免过拟合,提高模型的泛化能力

4.线性回归

机器学习中的基石模型:用一条直线或超平面去拟合所有的数据,通过最小化均值平方误差更新参数(梯度下降法),对异常值敏感,无法拟合非线性的数据集

5.极大似然估计

选择使当前数据出现概率最大的一组参数作为最优估计

步骤:先得到似然函数L,对L取对数然后对各个参数求偏导使偏导为0得到的参数结构即为参数最优估计

相关推荐
心疼你的一切8 小时前
昇腾CANN实战落地:从智慧城市到AIGC,解锁五大行业AI应用的算力密码
数据仓库·人工智能·深度学习·aigc·智慧城市·cann
chian-ocean9 小时前
量化加速实战:基于 `ops-transformer` 的 INT8 Transformer 推理
人工智能·深度学习·transformer
水月wwww9 小时前
【深度学习】卷积神经网络
人工智能·深度学习·cnn·卷积神经网络
杜子不疼.9 小时前
CANN_Transformer加速库ascend-transformer-boost的大模型推理性能优化实践
深度学习·性能优化·transformer
island13149 小时前
CANN HIXL 高性能单边通信库深度解析:PGAS 模型在异构显存上的地址映射与异步传输机制
人工智能·神经网络·架构
renhongxia110 小时前
如何基于知识图谱进行故障原因、事故原因推理,需要用到哪些算法
人工智能·深度学习·算法·机器学习·自然语言处理·transformer·知识图谱
深鱼~10 小时前
ops-transformer算子库:解锁昇腾大模型加速的关键
人工智能·深度学习·transformer·cann
禁默10 小时前
不仅是 FlashAttention:揭秘 CANN ops-transformer 如何重构大模型推理
深度学习·重构·aigc·transformer·cann
笔画人生10 小时前
进阶解读:`ops-transformer` 内部实现与性能调优实战
人工智能·深度学习·transformer
CV@CV10 小时前
2026自动驾驶商业化提速——从智驾平权到Robotaxi规模化落地
人工智能·机器学习·自动驾驶