基础优化方法

梯度下降

学习率代表每一次沿着这个方向走多远,

batchsize的概念

梯度下降通过不断沿着反梯度方向更新参数求解

两个重要的超参数是 batchsize 和 学习率

相关推荐
饕餮怪程序猿4 分钟前
C++:大型语言模型与智能系统底座的隐形引擎
c++·人工智能
hzp66627 分钟前
基于大语言模型(LLM)的多智能体应用的新型服务框架——Tokencake
人工智能·语言模型·大模型·llm·智能体·tokencake
摘星编程30 分钟前
昇腾NPU性能调优实战:INT8+批处理优化Mistral-7B全记录
人工智能·华为·gitcode·昇腾
中科岩创34 分钟前
陕西某地煤矿铁塔自动化监测服务项目
人工智能·物联网·自动化
亚马逊云开发者38 分钟前
Agentic AI基础设施实践经验系列(三):Agent记忆模块的最佳实践
人工智能
小花皮猪41 分钟前
多模态 AI 时代的数据困局与机遇,Bright Data 赋能LLM 训练以及AEO场景
人工智能·多模态·ai代理·aeo
爱吃烤鸡翅的酸菜鱼1 小时前
深度解析《AI+Java编程入门》:一本为零基础重构的Java学习路径
java·人工智能·后端·ai
snakecy1 小时前
智能家居技术发展与应用综述
人工智能·区块链
飞哥数智坊1 小时前
实测 TRAE SOLO 新模型:半小时搓出一个能用的抽奖系统
人工智能·trae·solo
Juchecar1 小时前
母语,塑造和构成了我们的思维过程本身
人工智能