神经网络与深度学习(第二章)

1.机器学习四要素

(1)数据:模型训练的基本

(2)模型:根据任务和数据类型选择合适的模型

(3)学习准则:计算损失

(4)优化算法:根据损失使用梯度下降or反向传播算法更新模型参数,从而优化模型

本质:通过数据训练所选择的模型,然后计算误差,再根据误差进行优化更新模型参数

2.过拟合和欠拟合的含义

过拟合:模型在训练集上学习的"过好",把噪声和无关特征都学习进去了,导致在测试集上的性能很差,泛化性差

欠拟合:模型在训练集和测试集上的性能都很差,主要因为模型的复杂度过低

3.经验风险和结构风险含义

经验风险:优化时追求训练集误差最小化,容易学习噪声导致过拟合

结构风险:考虑经验风险和模型复杂度,让模型复杂度作为经验风险的约束项,从而避免过拟合,提高模型的泛化能力

4.线性回归

机器学习中的基石模型:用一条直线或超平面去拟合所有的数据,通过最小化均值平方误差更新参数(梯度下降法),对异常值敏感,无法拟合非线性的数据集

5.极大似然估计

选择使当前数据出现概率最大的一组参数作为最优估计

步骤:先得到似然函数L,对L取对数然后对各个参数求偏导使偏导为0得到的参数结构即为参数最优估计

相关推荐
逻辑驱动的ken21 分钟前
Java高频面试考点场景题20
java·开发语言·深度学习·面试·职场和发展
做cv的小昊27 分钟前
【TJU】研究生应用统计学课程笔记(6)——第二章 参数估计(2.4 区间估计)
人工智能·笔记·线性代数·算法·机器学习·数学建模·概率论
2zcode35 分钟前
基于深度学习的口腔疾病图像识别系统(UI界面+改进算法+数据集+训练代码)
人工智能·深度学习·算法
小龙报35 分钟前
【Coze-AI智能体平台】低代码省时高效:Coze 应用开发全流程指南
java·人工智能·python·深度学习·低代码·chatgpt·交互
Echo_NGC223740 分钟前
【论文解读】Attention Is All You Need —— AI 时代的“开山之作“,经典中的经典(transformer小白导读)
人工智能·python·深度学习·神经网络·机器学习·conda·transformer
一切皆是因缘际会1 小时前
下一代 AI 架构:基于记忆演化与单向投影的安全智能系统
大数据·人工智能·深度学习·算法·安全·架构
falldeep1 小时前
五分钟了解OpenClaw底层架构
人工智能·算法·机器学习·架构
FserSuN1 小时前
Machine Learning Specialization - Week 1, 1-8学习总结
人工智能·学习·机器学习
weixin_446260851 小时前
模型能力深度对决:GPT-4o、Claude 3.5和DeepSeek V系列模型的横向评测与未来趋势洞察
人工智能·算法·机器学习
Mr数据杨1 小时前
泰坦尼克乘客生存预测与风险决策建模
机器学习·数据分析·kaggle