技术栈
“AI+“行动下的可控智能体:GPT-5 与 GPT-OSS 高性能推理 安全可控 产业落地 GPT-OSS 一可控AI目前全球唯一开源解决方案
段智华
2025-10-02 8:41
"AI+"行动下的可控智能体:GPT-5 与 GPT-OSS 高性能推理 安全可控 产业落地 GPT-OSS 一可控AI目前全球唯一开源解决方案
强化学习
大模型微调
上一篇:
从“氛围编程“到“氛围研究“:OpenAI的GPT-5与未来自动化研究之路
下一篇:
从GPT-1到GPT-3:生成式预训练语言模型的演进之路
相关推荐
boss-dog
2 小时前
关于强化学习入门理解和示例
python
·
强化学习
2401_84149564
3 天前
【强化学习】REINFORCE 算法
人工智能
·
python
·
算法
·
强化学习
·
reinforce
·
策略梯度
·
蒙特卡洛
deephub
3 天前
让 Q 值估计更准确:从 DQN 到 Double DQN 的改进方案
人工智能
·
pytorch
·
深度学习
·
强化学习
nju_spy
4 天前
离线强化学习(一)BCQ 批量限制 Q-learning
人工智能
·
强化学习
·
cvae
·
离线强化学习
·
双 q 学习
·
bcq
·
外推泛化误差
盼小辉丶
6 天前
PyTorch实战(25)——使用PyTorch构建DQN模型
人工智能
·
pytorch
·
深度学习
·
强化学习
山顶夕景
7 天前
【RL】Absolute Zero: Reinforced Self-play Reasoning with Zero Data
大模型
·
llm
·
强化学习
·
rl
_pinnacle_
7 天前
多维回报与多维价值矢量化预测的PPO算法
神经网络
·
算法
·
强化学习
·
ppo
·
多维价值预测
人工智能培训
10 天前
企业如何安全、私密地部署大模型?
人工智能
·
深度学习
·
安全
·
大模型
·
知识图谱
·
强化学习
·
大模型工程师
盼小辉丶
10 天前
PyTorch实战(24)——深度强化学习
pytorch
·
深度学习
·
强化学习
2401_84149564
10 天前
【强化学习】DQN 改进算法
人工智能
·
python
·
深度学习
·
强化学习
·
dqn
·
double dqn
·
dueling dqn
热门推荐
01
GitHub 镜像站点
02
Clawdbot 中文汉化版 接入微信、飞书
03
OpenCode 入门教程:介绍 · 安装 · 配置第三方 API (如 Claude)
04
OpenClaw部署与配置教程:在Mac mini上接入国产大模型与飞书
05
2026美赛A题智能手机电池续航时间预测的连续时间数学模型
06
Claude Code + GLM4.7 避坑指南:解决 Unable to connect to Anthropic services
07
UV安装并设置国内源
08
Claude Code Skills 实用使用手册
09
在Trae中使用Pencil MCP
10
Linux下V2Ray安装配置指南