技术栈
“AI+“行动下的可控智能体:GPT-5 与 GPT-OSS 高性能推理 安全可控 产业落地 GPT-OSS 一可控AI目前全球唯一开源解决方案
段智华
2025-10-02 8:41
"AI+"行动下的可控智能体:GPT-5 与 GPT-OSS 高性能推理 安全可控 产业落地 GPT-OSS 一可控AI目前全球唯一开源解决方案
强化学习
大模型微调
上一篇:
从“氛围编程“到“氛围研究“:OpenAI的GPT-5与未来自动化研究之路
下一篇:
从GPT-1到GPT-3:生成式预训练语言模型的演进之路
相关推荐
deephub
14 小时前
2026 年面向 LLM 的 RL方法总结:从 PPO 到 DPO 到 GRPO,再到多智能体 RL
人工智能
·
大语言模型
·
强化学习
·
多智能体
Robot_Nav
1 天前
深度学习与强化学习面试八股文知识点汇总
人工智能
·
深度学习
·
强化学习
盼小辉丶
2 天前
PyTorch强化学习实战(9)——深度Q学习
pytorch
·
深度学习
·
强化学习
我爱C编程
3 天前
基于Sarsa强化学习的异构蜂窝网络中基站休眠算法matlab仿真
网络
·
matlab
·
强化学习
·
sarsa
·
异构蜂窝网络
·
基站休眠
Wilber的技术分享
3 天前
【大模型面试八股 3】大模型微调技术:LoRA、QLoRA等
人工智能
·
深度学习
·
面试
·
lora
·
peft
·
qlora
·
大模型微调
熊猫钓鱼>_>
4 天前
强化学习与决策优化:从理论到工程落地的完整指南
人工智能
·
llm
·
强化学习
·
rl
·
马尔可夫
·
mdp
·
决策过程
盼小辉丶
6 天前
PyTorch强化学习实战(8)——Q学习详解与实现
pytorch
·
深度学习
·
强化学习
星座528
6 天前
驾驭AI 2.0时代:Transformer、扩散模型与物理信息神经网络核心技术解析
人工智能
·
深度学习
·
神经网络
·
transformer
·
强化学习
·
目标检测算法
橘白316
6 天前
rl笔记(一):策略梯度更新算法推导
人工智能
·
算法
·
机器人
·
强化学习
盼小辉丶
9 天前
PyTorch强化学习实战(7)——表格学习与贝尔曼方程
pytorch
·
深度学习
·
强化学习
热门推荐
01
GitHub 镜像站点
02
Codex 接入 DeepSeek API 完整配置文档
03
CC-Switch & Claude 基于 Linux 服务器安装使用指南
04
用了半年 OpenRouter,我换到了 Ofox.ai — 两个 AI API 聚合平台的真实对比
05
裂开!ChatGPT 居然开始要手机号验证,附详细解决方法
06
Gemini大升级、AI眼镜首发、Android XR亮相,13天后见分晓
07
【踩坑记录 | 第一篇】微软商店无法使用时,如何手动安装 OpenAI Codex?附`.msix`文件系统错误解决方法
08
几个好用的ip纯净度检测网站
09
【AI】2026 年具身智能模型和世界模型总结
10
codex app每次打开重连5次Reconnecting问题解决