技术栈
“AI+“行动下的可控智能体:GPT-5 与 GPT-OSS 高性能推理 安全可控 产业落地 GPT-OSS 一可控AI目前全球唯一开源解决方案
段智华
2025-10-02 8:41
"AI+"行动下的可控智能体:GPT-5 与 GPT-OSS 高性能推理 安全可控 产业落地 GPT-OSS 一可控AI目前全球唯一开源解决方案
强化学习
大模型微调
上一篇:
从“氛围编程“到“氛围研究“:OpenAI的GPT-5与未来自动化研究之路
下一篇:
从GPT-1到GPT-3:生成式预训练语言模型的演进之路
相关推荐
QiZhang | UESTC
2 小时前
RL4LLM
大模型
·
强化学习
·
rl4llm
nju_spy
5 小时前
动手学强化学习上交张伟楠(一)导论 + 多臂老虎机 MAB(ε-greedy+上置信界+汤普森采样)
人工智能
·
python
·
强化学习
·
actor-critic
·
多臂老虎机
·
汤普森采样
·
探索与利用
程序员Agions
1 天前
程序员武学修炼手册(三):融会贯通——从写好代码到架构设计
前端
·
程序员
·
强化学习
索木木
2 天前
强化学习与思维链
大模型
·
sft
·
强化学习
·
思维链
nju_spy
3 天前
RL4LLM_Survey 强化学习在大语言模型后训练综述
人工智能
·
强化学习
·
reinforce
·
ppo
·
数据异质性
·
大模型后训练
·
奖励函数
郭庆汝
3 天前
大模型-微调相关内容
大模型微调
·
llamafactory
AI-Frontiers
4 天前
小白也能看懂的LLM-RL算法:PPO/DPO/GRPO/GSPO
强化学习
·
大模型训练
超的小宝贝
4 天前
机器学习期末复习
深度学习
·
机器学习
·
强化学习
空山新雨后、
4 天前
深度学习VS强化学习:预测与决策的本质差异
人工智能
·
深度学习
·
强化学习
Tfly__
5 天前
Ubuntu20.04安装Genesis(最新)
linux
·
人工智能
·
pytorch
·
ubuntu
·
github
·
无人机
·
强化学习
热门推荐
01
GitHub 镜像站点
02
Labelme从安装到标注:零基础完整指南
03
网站改了域名,如何查找?
04
Linux下V2Ray安装配置指南
05
安娜的档案(Anna’s Archive) 镜像网站/国内最新可访问入口(持续更新)
06
【踩坑笔记】50系显卡适配的 PyTorch 安装
07
2025-04-03 Latex学习1——本地配置Latex + VScode环境
08
Claude Code 2.1.2 升级报错?别折腾了,一行命令搞定
09
CentOS的ISO镜像下载
10
KGG转MP3工具|非KGM文件|解密音频