人工智能综合项目开发13——模型优化与调优——超参数

1、什么是超参数?

机器学习中在模型训练前需预先设定的参数,与通过数据训练获得的参数形成区分

2、参数和超参数

参数 是我们训练神经网络 最终要学习的目标, 最基本的就是神经网络的权重 W和b,我们训练的目的,就是要找到一套好的模型参数,用于预测未知的结果。这些参数我们是不用调的,是模型来训练的过程中自动更新生成的。类似y=kx+b中的k、b

超参数 是我们控制我们模型结构、功能、效率等的 调节旋钮,常见超参数:

  • learning rate
  • epochs(迭代次数,也可称为 num of iterations)
  • num of hidden layers(隐层数目)
  • num of hidden layer units(隐层的单元数/神经元数)
  • activation function(激活函数)
  • batch-size(用mini-batch SGD的时候每个批量的大小)
  • optimizer(选择什么优化器,如SGD、RMSProp、Adam)
  • 用诸如RMSProp、Adam优化器的时候涉及到的β1,β2等等

3、常用的超参数?

深度学习中的超参数调节(learning rate、epochs、batch-size...)

参考链接:

DeepSeek模型超参数调优指南:从理论到实践的深度解析-百度开发者中心

机器学习超参数:用大白话讲清楚模型调优的秘密-AI.x-AIGC专属社区-51CTO.COM

深度学习中的超参数调节(learning rate、epochs、batch-size...)

相关推荐
爱睡懒觉的焦糖玛奇朵2 小时前
【从视频到数据集:焦糖玛奇朵的魔法工具使用说明】
人工智能·python·深度学习·学习·算法·yolo·音视频
oy_mail2 小时前
2026教程:用Gemini解决PCB设计与EMC/EMI问题,工程师效率跃升指南(国内直访)
人工智能
Runawayliquor2 小时前
opbase:CANN 所有算子的公共地基
大数据·数据库·人工智能·算法
英辰朗迪AI获客2 小时前
AI动态简报之算力基建篇(2026.05.22)
人工智能
徐安安ye2 小时前
FlashAttention 为什么对序列长度这么“敏感”?
人工智能·算法
天行健,君子而铎2 小时前
2026国内政务数据安全平台排名评析:基于AI降噪、全链路、动态性
人工智能·政务
智塑未来2 小时前
app应用怎么接入广告?标准流程与落地实操方案全解析
大数据·网络·人工智能
甲维斯3 小时前
Claude Code的六种种授权模式!安全和效率控制
人工智能·ai编程
curd_boy3 小时前
【AI】生产级 Graph RAG 落地架构
人工智能·架构