人工智能综合项目开发13——模型优化与调优——超参数

1、什么是超参数?

机器学习中在模型训练前需预先设定的参数,与通过数据训练获得的参数形成区分

2、参数和超参数

参数 是我们训练神经网络 最终要学习的目标, 最基本的就是神经网络的权重 W和b,我们训练的目的,就是要找到一套好的模型参数,用于预测未知的结果。这些参数我们是不用调的,是模型来训练的过程中自动更新生成的。类似y=kx+b中的k、b

超参数 是我们控制我们模型结构、功能、效率等的 调节旋钮,常见超参数:

  • learning rate
  • epochs(迭代次数,也可称为 num of iterations)
  • num of hidden layers(隐层数目)
  • num of hidden layer units(隐层的单元数/神经元数)
  • activation function(激活函数)
  • batch-size(用mini-batch SGD的时候每个批量的大小)
  • optimizer(选择什么优化器,如SGD、RMSProp、Adam)
  • 用诸如RMSProp、Adam优化器的时候涉及到的β1,β2等等

3、常用的超参数?

深度学习中的超参数调节(learning rate、epochs、batch-size...)

参考链接:

DeepSeek模型超参数调优指南:从理论到实践的深度解析-百度开发者中心

机器学习超参数:用大白话讲清楚模型调优的秘密-AI.x-AIGC专属社区-51CTO.COM

深度学习中的超参数调节(learning rate、epochs、batch-size...)

相关推荐
冬奇Lab3 小时前
Workflow 系列(06):安全——跨步骤注入传播与四层防御
人工智能·工作流引擎
冬奇Lab3 小时前
每日一个开源项目(第149篇):RAG-Anything - 把图片、表格、公式当成一等公民的多模态 RAG 框架
人工智能·开源
米小虾4 小时前
AI Agent 安全实战指南:当智能体开始"不听话",开发者该如何应对?
人工智能·安全·agent
IT_陈寒5 小时前
Vite的热更新突然不香了,排查三小时差点砸键盘
前端·人工智能·后端
阿里云大数据AI技术7 小时前
构建高转化海外电商搜索:阿里云OpenSearch行业算法版的全链路智能优化策略实战
人工智能·搜索引擎
Awu12277 小时前
⚡从零开发 Agent CLI(五)实现一个可治理、可扩展的工具系统
前端·人工智能·claude
字节跳动视频云技术团队7 小时前
让 Agent 成为音视频工作台:AI MediaKit CLI + Skill 发布
人工智能·音视频开发
魏祖潇7 小时前
framework 整合实战——DDD/TDD/SDD 三件套在 framework 仓的真实落地
人工智能·后端
Token炼金师8 小时前
去噪扩散:从随机噪声到高保真图像的数学之路
人工智能·aigc