技术栈
“AI+“行动下的可控智能体:GPT-5 与 GPT-OSS 高性能推理 安全可控 产业落地 GPT-OSS 一可控AI目前全球唯一开源解决方案
段智华
2025-10-02 8:41
"AI+"行动下的可控智能体:GPT-5 与 GPT-OSS 高性能推理 安全可控 产业落地 GPT-OSS 一可控AI目前全球唯一开源解决方案
强化学习
大模型微调
上一篇:
从“氛围编程“到“氛围研究“:OpenAI的GPT-5与未来自动化研究之路
下一篇:
从GPT-1到GPT-3:生成式预训练语言模型的演进之路
相关推荐
Python算法实战
1 天前
腾讯送命题:手写多头注意力机制。。。
人工智能
·
算法
·
面试
·
大模型
·
强化学习
L.fountain
1 天前
强化学习2.2 MDP实践——Frozen lake
人工智能
·
强化学习
神州问学
2 天前
最高推理效率提升100%+|让满血DeepSeekV3.1在L40S上大展身手
强化学习
Scc_hy
3 天前
强化学习_Paper_2000_Eligibility Traces for Off-Policy Policy Evaluation
人工智能
·
深度学习
·
算法
·
强化学习
·
rl
山顶夕景
4 天前
【RL】DAPO的后续:VAPO算法
大模型
·
强化学习
·
dapo
·
vapo
i.ajls
5 天前
强化学习入门-1-CartPole-v1(DQN)
机器学习
·
强化学习
·
dqn
HyperAI超神经
6 天前
AI预判等离子体「暴走」,MIT等基于机器学习实现小样本下的等离子体动力学高精度预测
人工智能
·
神经网络
·
机器学习
·
ai
·
强化学习
·
可控核聚变
·
托卡马克
赋范大模型技术圈
6 天前
11G显存DPO强化学习微调实战
人工智能
·
强化学习
i.ajls
6 天前
强化学习入门-2(Dueling DQN)
人工智能
·
机器学习
·
强化学习
·
dqn
喜欢吃豆
7 天前
一份关于语言模型对齐的技术论述:从基于PPO的RLHF到直接偏好优化
人工智能
·
语言模型
·
自然语言处理
·
大模型
·
强化学习
热门推荐
01
GitHub 镜像站点
02
BongoCat - 跨平台键盘猫动画工具
03
UV安装并设置国内源
04
GitLab 零基础入门指南:从安装到项目管理全流程
05
Linux下V2Ray安装配置指南
06
NVIDIA显卡驱动、CUDA、cuDNN 和 TensorRT 版本匹配指南
07
在VSCode配置Java开发环境的保姆级教程(适配各类AI编程IDE)
08
2025软件测试面试八股文(含答案+文档)
09
Labelme从安装到标注:零基础完整指南
10
一文了解国产算子编程语言 TileLang,TileLang 对国产开源生态的影响与启示