人工智能综合项目开发13——模型优化与调优——超参数

1、什么是超参数?

机器学习中在模型训练前需预先设定的参数,与通过数据训练获得的参数形成区分

2、参数和超参数

参数 是我们训练神经网络 最终要学习的目标, 最基本的就是神经网络的权重 W和b,我们训练的目的,就是要找到一套好的模型参数,用于预测未知的结果。这些参数我们是不用调的,是模型来训练的过程中自动更新生成的。类似y=kx+b中的k、b

超参数 是我们控制我们模型结构、功能、效率等的 调节旋钮,常见超参数:

  • learning rate
  • epochs(迭代次数,也可称为 num of iterations)
  • num of hidden layers(隐层数目)
  • num of hidden layer units(隐层的单元数/神经元数)
  • activation function(激活函数)
  • batch-size(用mini-batch SGD的时候每个批量的大小)
  • optimizer(选择什么优化器,如SGD、RMSProp、Adam)
  • 用诸如RMSProp、Adam优化器的时候涉及到的β1,β2等等

3、常用的超参数?

深度学习中的超参数调节(learning rate、epochs、batch-size...)

参考链接:

DeepSeek模型超参数调优指南:从理论到实践的深度解析-百度开发者中心

机器学习超参数:用大白话讲清楚模型调优的秘密-AI.x-AIGC专属社区-51CTO.COM

深度学习中的超参数调节(learning rate、epochs、batch-size...)

相关推荐
>ᴗoಣ6 分钟前
Exploring Persona Sentiment Sensitivity in Personalized Dialogue Generation
人工智能
大数据AI人工智能培训专家培训讲师叶梓7 分钟前
120B 数学语料 + GRPO 算法,DeepSeekMath 刷新开源大模型推理天花板
人工智能·算法·大模型·推理·deepseek·openclaw·openclaw 讲师
智算菩萨10 分钟前
多目标超启发式算法系统文献综述:人机协同大语言模型方法论深度精读
论文阅读·人工智能·深度学习·ai·多目标·综述
兮℡檬,16 分钟前
银行卡卡号识别
人工智能·计算机视觉
海南java第二人18 分钟前
Cursor 高级实战:从 Spring Boot 到微服务,AI 驱动的全流程开发指南
人工智能·spring boot·微服务
码码哈哈0.022 分钟前
开源项目Heygem本地运行 AI 数字人模型
人工智能·ai
CertiK23 分钟前
CertiK实测:Skill扫描并非安全边界
人工智能·安全·openclaw
大傻^23 分钟前
Spring AI Alibaba 项目初始化:Maven依赖与YAML配置全解析
人工智能·spring·maven·springai·springaialibaba·评估框架
OpenCSG29 分钟前
GLM-OCR:轻量级多模态OCR的技术突破
人工智能
ofoxcoding32 分钟前
Qwen3.5 API 接入实测:和 GPT-4o 比到底差多少
人工智能·qwen3.5