技术栈
“AI+“行动下的可控智能体:GPT-5 与 GPT-OSS 高性能推理 安全可控 产业落地 GPT-OSS 一可控AI目前全球唯一开源解决方案
段智华
2025-10-02 8:41
"AI+"行动下的可控智能体:GPT-5 与 GPT-OSS 高性能推理 安全可控 产业落地 GPT-OSS 一可控AI目前全球唯一开源解决方案
强化学习
大模型微调
上一篇:
从“氛围编程“到“氛围研究“:OpenAI的GPT-5与未来自动化研究之路
下一篇:
从GPT-1到GPT-3:生成式预训练语言模型的演进之路
相关推荐
大千AI助手
2 天前
MATH-500:大模型数学推理能力评估基准
人工智能
·
大模型
·
llm
·
强化学习
·
评估基准
·
数学推理能力
·
math500
GRITJW
3 天前
大模型参数高效微调技术
大模型微调
帅帅爱数学
5 天前
DeepMimic论文详细解析:基于示例引导的深度强化学习实现物理仿真角色技能
算法
·
强化学习
镰刀韭菜
6 天前
【大语言模型】大模型后训练入门指南
人工智能
·
自然语言处理
·
大语言模型
·
强化学习
·
ppo
·
后训练
·
grpo
bylander
7 天前
【论文阅读】A Survey of Reinforcement Learning for Large Reasoning Models
论文阅读
·
大模型
·
llm
·
强化学习
Phoenixtree_DongZhao
8 天前
《Nature》封面:DeepSeek-R1通过强化学习激发大语言模型的推理能力
人工智能
·
强化学习
·
混合专家
九章云极AladdinEdu
8 天前
集成学习智慧:为什么Bagging(随机森林)和Boosting(XGBoost)效果那么好?
人工智能
·
随机森林
·
机器学习
·
强化学习
·
集成学习
·
boosting
·
ai研究
zzzyzh
20 天前
RL【8】:Value Function Approximation
强化学习
zzzyzh
21 天前
RL【7-1】:Temporal-difference Learning
强化学习
热门推荐
01
GitHub 镜像站点
02
OpenSpeedy简介
03
UV安装并设置国内源
04
KGG转MP3工具|非KGM文件|解密音频
05
在国行 macOS 下用 DeepSeek 补齐 Xcode 26 的 AI 能力:问题、原因与 mitmproxy 解决方案(含可用脚本与安装教程)
06
jdk21下载、安装(Windows、Linux、macOS)
07
UV 工具安装与国内镜像源配置指南
08
Linux下V2Ray安装配置指南
09
阿里最新开源Wan2.2-Animate-14B 本地部署教程:统一双模态框架,MoE架构赋能电影级角色动画与替换
10
Spec-Kit 使用指南