技术栈
“AI+“行动下的可控智能体:GPT-5 与 GPT-OSS 高性能推理 安全可控 产业落地 GPT-OSS 一可控AI目前全球唯一开源解决方案
段智华
2025-10-02 8:41
"AI+"行动下的可控智能体:GPT-5 与 GPT-OSS 高性能推理 安全可控 产业落地 GPT-OSS 一可控AI目前全球唯一开源解决方案
强化学习
大模型微调
上一篇:
从“氛围编程“到“氛围研究“:OpenAI的GPT-5与未来自动化研究之路
下一篇:
从GPT-1到GPT-3:生成式预训练语言模型的演进之路
相关推荐
简简单单做算法
15 小时前
基于Qlearning强化学习和Parzen窗的图像分割算法matlab仿真
matlab
·
图像分割
·
强化学习
·
qlearning
·
parzen窗
深度之眼
16 小时前
强化学习与目标检测王炸组合,IEEE Trans顶刊发表!
目标检测
·
计算机视觉
·
强化学习
ACCELERATOR_LLC
1 天前
【DataWhale组队学习】DIY-LLM Task5 大模型的基本训练流程
人工智能
·
深度学习
·
大模型
·
强化学习
·
模型训练
传说故事
1 天前
【论文阅读】AWR:Simple and scalable off-policy RL
论文阅读
·
强化学习
Narrastory
2 天前
Note:强化学习(五)
人工智能
·
深度学习
·
强化学习
盼小辉丶
3 天前
PyTorch强化学习实战(3)——Gymnasium API扩展功能
人工智能
·
pytorch
·
深度学习
·
强化学习
我爱C编程
6 天前
移动边缘网络中基于双深度QLearning强化学习(DDQL)的高能效资源分配方法
matlab
·
强化学习
·
移动边缘网络
·
双深度qlearning
·
ddql
·
高能效资源分配
盼小辉丶
6 天前
PyTorch强化学习实战(2)——强化学习环境库Gymnasium
pytorch
·
深度学习
·
强化学习
谷哥的小弟
6 天前
大模型核心基础知识(03)—大模型的分类方法与应用场景
人工智能
·
深度学习
·
机器学习
·
大模型
·
强化学习
·
智能体
m0_65010824
7 天前
LoRA:大语言模型低秩适配
论文阅读
·
lora
·
大模型微调
·
经典方法
热门推荐
01
GitHub 镜像站点
02
2026年4月AI大事件深度解读:大模型竞争进入“深水区“
03
Codex 接入 DeepSeek API 完整配置文档
04
近期有什么ai的新消息,新动态? 2026.4月
05
【AI】2026 年具身智能模型和世界模型总结
06
2026年AI编程工具终极横评:Cursor vs Claude Code vs Copilot
07
实测可用|小米 MiMo 百万亿 Token 免费领,开发者速冲
08
在Windows 11上安装Docker的踩坑记录
09
裂开!ChatGPT 居然开始要手机号验证,附详细解决方法
10
零基础教你claude code 接入 deepseek V4