人工智能综合项目开发13——模型优化与调优——超参数

机器不学习我也不学习2025-12-01 9:37

1、什么是超参数?

机器学习中在模型训练前需预先设定的参数，与通过数据训练获得的参数形成区分

2、参数和超参数

参数是我们训练神经网络 最终要学习的目标， 最基本的就是神经网络的权重 W和b，我们训练的目的，就是要找到一套好的模型参数，用于预测未知的结果。这些参数我们是不用调的，是模型来训练的过程中自动更新生成的。类似y=kx+b中的k、b

超参数 是我们控制我们模型结构、功能、效率等的 调节旋钮，常见超参数：

learning rate
epochs(迭代次数，也可称为 num of iterations)
num of hidden layers(隐层数目)
num of hidden layer units(隐层的单元数/神经元数)
activation function(激活函数)
batch-size(用mini-batch SGD的时候每个批量的大小)
optimizer(选择什么优化器，如SGD、RMSProp、Adam)
用诸如RMSProp、Adam优化器的时候涉及到的β1，β2等等

3、常用的超参数？

深度学习中的超参数调节（learning rate、epochs、batch-size...）

参考链接：

DeepSeek模型超参数调优指南：从理论到实践的深度解析-百度开发者中心

机器学习超参数：用大白话讲清楚模型调优的秘密-AI.x-AIGC专属社区-51CTO.COM

深度学习中的超参数调节（learning rate、epochs、batch-size...）

上一篇：Spring Boot 整合 MyBatis 与 PostgreSQL 实战指南

下一篇：第三十四：golang 原生 pgsql 对应操作

热门推荐

01GitHub 镜像站点 02【OpenClaw 本地实战 Ep.3】突破瓶颈：强制修改 openclaw.json 解锁 32k 上下文记忆 03OpenClaw 使用和管理 MCP 完全指南 04Clawdbot部署教程：解决‘gateway token missing’授权问题的完整步骤 05OpenClaw + 飞书（Feishu）环境搭建指南 06Window 10部署openclaw报错node.exe : npm error code 128 07Claude Code + GLM4.7 避坑指南：解决 Unable to connect to Anthropic services 08OpenClaw优化飞书API 额度已耗尽问题 09AI 规范驱动开发“三剑客”深度对比：Spec-Kit、Kiro 与 OpenSpec 实战指南 10AI Agent 平台横评：ZeroClaw vs OpenClaw vs Nanobot