人工智能综合项目开发13——模型优化与调优——超参数

1、什么是超参数?

机器学习中在模型训练前需预先设定的参数,与通过数据训练获得的参数形成区分

2、参数和超参数

参数 是我们训练神经网络 最终要学习的目标, 最基本的就是神经网络的权重 W和b,我们训练的目的,就是要找到一套好的模型参数,用于预测未知的结果。这些参数我们是不用调的,是模型来训练的过程中自动更新生成的。类似y=kx+b中的k、b

超参数 是我们控制我们模型结构、功能、效率等的 调节旋钮,常见超参数:

  • learning rate
  • epochs(迭代次数,也可称为 num of iterations)
  • num of hidden layers(隐层数目)
  • num of hidden layer units(隐层的单元数/神经元数)
  • activation function(激活函数)
  • batch-size(用mini-batch SGD的时候每个批量的大小)
  • optimizer(选择什么优化器,如SGD、RMSProp、Adam)
  • 用诸如RMSProp、Adam优化器的时候涉及到的β1,β2等等

3、常用的超参数?

深度学习中的超参数调节(learning rate、epochs、batch-size...)

参考链接:

DeepSeek模型超参数调优指南:从理论到实践的深度解析-百度开发者中心

机器学习超参数:用大白话讲清楚模型调优的秘密-AI.x-AIGC专属社区-51CTO.COM

深度学习中的超参数调节(learning rate、epochs、batch-size...)

相关推荐
晟诺数字人几秒前
2026年海外直播变革:数字人如何改变游戏规则
大数据·人工智能·产品运营
蛋王派1 分钟前
DeepSeek-OCR-v2 模型解析和部署应用
人工智能·ocr
禁默6 分钟前
基于CANN的ops-cv仓库-多模态场景理解与实践
人工智能·cann
禁默15 分钟前
【硬核入门】无需板卡也能造 AI 算子?深度玩转 CANN ops-math 通用数学库
人工智能·aigc·cann
敏叔V58720 分钟前
AI智能体的工具学习进阶:零样本API理解与调用
人工智能·学习
徐小夕@趣谈前端29 分钟前
拒绝重复造轮子?我们偏偏花365天,用Vue3写了款AI协同的Word编辑器
人工智能·编辑器·word
阿里云大数据AI技术29 分钟前
全模态、多引擎、一体化,阿里云DLF3.0构建Data+AI驱动的智能湖仓平台
人工智能·阿里云·云计算
陈天伟教授30 分钟前
人工智能应用- 语言理解:05.大语言模型
人工智能·语言模型·自然语言处理
池央31 分钟前
CANN GE 深度解析:图编译器的核心优化策略、执行流调度与模型下沉技术原理
人工智能·ci/cd·自动化
七月稻草人34 分钟前
CANN ops-nn:AIGC底层神经网络算力的核心优化引擎
人工智能·神经网络·aigc·cann