9.28 深度学习10

​​1. 模型调试与轻量化方法​​

通过为模型各层创建"钩子函数"来实时监控参数信息的技术,此方式有助于大幅降低调试阶段的内存占用,实现轻量化分析。

"轻量级网络"的核心思想:通过减少参数量(例如使用全局平均池化)来降低计算成本,使其能在普通计算机上运行,与集成学习的优势形成互斥。

​​2. 集成学习原理回顾​​

集成学习通过组合多个基学习器来提升性能的核心思想,前提是这些学习器的表现有差异(各有千秋)且性能都较高。

针对分类问题,明确了采用"投票法"(如多数投票)整合多个模型的预测结果。

针对回归问题,明确了通过"加权取平均"或"普通平均"等方法整合多个模型的连续预测数值,并区分了普通平均与加权平均的不同应用场景。

​​3. 回归问题的评估标准​​

在回归问题中,无法直接套用分类问题中的"准确率"。因此,引入了专门的评估指标。

强调"均方误差"(MSE)是评价回归模型优劣的关键标准,它衡量了预测值与真实值之间的差距平方的平均数。

补充说明了"R方"(决定系数)是另一个常用的回归评估指标,用于衡量模型解释数据方差的能力。

为保证模型评估的一致性和公正性,模型在训练集和测试集上的数据预处理步骤(如标准化)必须保持完全相同。

相关推荐
人工智能训练2 小时前
【极速部署】Ubuntu24.04+CUDA13.0 玩转 VLLM 0.15.0:预编译 Wheel 包 GPU 版安装全攻略
运维·前端·人工智能·python·ai编程·cuda·vllm
源于花海3 小时前
迁移学习相关的期刊和会议
人工智能·机器学习·迁移学习·期刊会议
DisonTangor4 小时前
DeepSeek-OCR 2: 视觉因果流
人工智能·开源·aigc·ocr·deepseek
薛定谔的猫19824 小时前
二十一、基于 Hugging Face Transformers 实现中文情感分析情感分析
人工智能·自然语言处理·大模型 训练 调优
发哥来了5 小时前
《AI视频生成技术原理剖析及金管道·图生视频的应用实践》
人工智能
数智联AI团队5 小时前
AI搜索引领开源大模型新浪潮,技术创新重塑信息检索未来格局
人工智能·开源
不懒不懒5 小时前
【线性 VS 逻辑回归:一篇讲透两种核心回归模型】
人工智能·机器学习
冰西瓜6005 小时前
从项目入手机器学习——(四)特征工程(简单特征探索)
人工智能·机器学习
Ryan老房5 小时前
未来已来-AI标注工具的下一个10年
人工智能·yolo·目标检测·ai
丝斯20116 小时前
AI学习笔记整理(66)——多模态大模型MOE-LLAVA
人工智能·笔记·学习