9.28 深度学习10

​​1. 模型调试与轻量化方法​​

通过为模型各层创建"钩子函数"来实时监控参数信息的技术,此方式有助于大幅降低调试阶段的内存占用,实现轻量化分析。

"轻量级网络"的核心思想:通过减少参数量(例如使用全局平均池化)来降低计算成本,使其能在普通计算机上运行,与集成学习的优势形成互斥。

​​2. 集成学习原理回顾​​

集成学习通过组合多个基学习器来提升性能的核心思想,前提是这些学习器的表现有差异(各有千秋)且性能都较高。

针对分类问题,明确了采用"投票法"(如多数投票)整合多个模型的预测结果。

针对回归问题,明确了通过"加权取平均"或"普通平均"等方法整合多个模型的连续预测数值,并区分了普通平均与加权平均的不同应用场景。

​​3. 回归问题的评估标准​​

在回归问题中,无法直接套用分类问题中的"准确率"。因此,引入了专门的评估指标。

强调"均方误差"(MSE)是评价回归模型优劣的关键标准,它衡量了预测值与真实值之间的差距平方的平均数。

补充说明了"R方"(决定系数)是另一个常用的回归评估指标,用于衡量模型解释数据方差的能力。

为保证模型评估的一致性和公正性,模型在训练集和测试集上的数据预处理步骤(如标准化)必须保持完全相同。

相关推荐
jie*2 小时前
小杰深度学习(two)——全连接与链式求导
图像处理·人工智能·pytorch·python·深度学习·分类·回归
Bwcx_lzp2 小时前
深度学习核心技术演进:从函数到 Transformer 架构
人工智能·深度学习·transformer
北京耐用通信2 小时前
协议不通,数据何通?耐达讯自动化Modbus TCP与Profibus网关技术破解建筑自动化最大瓶颈
网络·人工智能·网络协议·自动化·信息与通信
IT_陈寒2 小时前
Redis 性能提升秘籍:这5个被低估的命令让你的QPS飙升200%
前端·人工智能·后端
victory04313 小时前
从机器学习到RLHF的完整学科分支脉络与赛道分析
人工智能·机器学习
京东零售技术7 小时前
京东零售胡浩:智能供应链从运筹到大模型到超级智能体的演进
大数据·人工智能
榕壹云7 小时前
GEO正在通过大模型技术重构企业数字营销生态
人工智能·重构·geo
K姐研究社10 小时前
通义万相Wan2.5模型实测,可生成音画同步视频
人工智能·aigc·音视频
云起SAAS10 小时前
老年ai模拟恋爱抖音快手微信小程序看广告流量主开源
人工智能·微信小程序·小程序·ai编程·看广告变现轻·老年ai模拟恋爱·ai模拟恋爱