1、什么是超参数?
机器学习中在模型训练前需预先设定的参数,与通过数据训练获得的参数形成区分
2、参数和超参数
参数 是我们训练神经网络 最终要学习的目标, 最基本的就是神经网络的权重 W和b,我们训练的目的,就是要找到一套好的模型参数,用于预测未知的结果。这些参数我们是不用调的,是模型来训练的过程中自动更新生成的。类似y=kx+b中的k、b
超参数 是我们控制我们模型结构、功能、效率等的 调节旋钮,常见超参数:
- learning rate
- epochs(迭代次数,也可称为 num of iterations)
- num of hidden layers(隐层数目)
- num of hidden layer units(隐层的单元数/神经元数)
- activation function(激活函数)
- batch-size(用mini-batch SGD的时候每个批量的大小)
- optimizer(选择什么优化器,如SGD、RMSProp、Adam)
- 用诸如RMSProp、Adam优化器的时候涉及到的β1,β2等等
3、常用的超参数?
深度学习中的超参数调节(learning rate、epochs、batch-size...)
参考链接:
DeepSeek模型超参数调优指南:从理论到实践的深度解析-百度开发者中心