技术栈
“AI+“行动下的可控智能体:GPT-5 与 GPT-OSS 高性能推理 安全可控 产业落地 GPT-OSS 一可控AI目前全球唯一开源解决方案
段智华
2025-10-02 8:41
"AI+"行动下的可控智能体:GPT-5 与 GPT-OSS 高性能推理 安全可控 产业落地 GPT-OSS 一可控AI目前全球唯一开源解决方案
强化学习
大模型微调
上一篇:
从“氛围编程“到“氛围研究“:OpenAI的GPT-5与未来自动化研究之路
下一篇:
从GPT-1到GPT-3:生成式预训练语言模型的演进之路
相关推荐
山顶夕景
4 天前
【RLVR】GRPO中奖励函数的设计逻辑
llm
·
强化学习
·
rl
·
奖励函数
·
reward
JJJJ_iii
7 天前
【机器学习16】连续状态空间、深度Q网络DQN、经验回放、探索与利用
人工智能
·
笔记
·
python
·
机器学习
·
强化学习
CoovallyAIHub
8 天前
当视觉语言模型接收到相互矛盾的信息时,它会相信哪个信号?
深度学习
·
计算机视觉
·
强化学习
盼小辉丶
9 天前
优势演员-评论家(Advantage Actor-Critic,A2C)算法详解与实现
深度学习
·
keras
·
强化学习
AI-Frontiers
9 天前
收藏!强化学习从入门到封神:5 本经典教材 + 8 大实战项目 + 7个免费视频,一站式搞定
强化学习
山顶夕景
10 天前
【RL】Scaling RL Compute for LLMs
深度学习
·
大模型
·
强化学习
九年义务漏网鲨鱼
12 天前
【Agentic RL 专题】二、Agentic RL——Memory
人工智能
·
大模型
·
强化学习
·
记忆模块
盼小辉丶
13 天前
Double DQN(DDQN)详解与实现
深度学习
·
keras
·
强化学习
沉迷单车的追风少年
14 天前
Diffusion Model与视频超分(2):解读字节开源视频增强模型SeedVR2
人工智能
·
深度学习
·
aigc
·
音视频
·
强化学习
·
视频生成
·
视频超分
信鑫
14 天前
AIO Sandbox:为 AI Agent 打造的一体化、可定制的沙箱环境
llm
·
agent
·
强化学习
热门推荐
01
GitHub 镜像站点
02
UV安装并设置国内源
03
综合整理:pdf预览显示:你尝试预览的文件可能对你的计算机有害。如果你信任此文件以及其来源,请打开此文件以看其内容,如何解决以正常预览文件
04
Linux下V2Ray安装配置指南
05
安娜的档案(Anna’s Archive) 镜像网站/国内最新可访问入口(持续更新)
06
BongoCat - 跨平台键盘猫动画工具
07
Labelme从安装到标注:零基础完整指南
08
《大数据技术原理与应用》实验报告三 熟悉HBase常用操作
09
全面评测 | Photoshop 2026 新特性深度解析与实测体验
10
看了下昨日泄露的苹果 App Store 源码……