“AI+“行动下的可控智能体:GPT-5 与 GPT-OSS 高性能推理 安全可控 产业落地 GPT-OSS 一可控AI目前全球唯一开源解决方案

"AI+"行动下的可控智能体:GPT-5 与 GPT-OSS 高性能推理 安全可控 产业落地 GPT-OSS 一可控AI目前全球唯一开源解决方案

相关推荐
QiZhang | UESTC2 小时前
RL4LLM
大模型·强化学习·rl4llm
nju_spy5 小时前
动手学强化学习上交张伟楠(一)导论 + 多臂老虎机 MAB(ε-greedy+上置信界+汤普森采样)
人工智能·python·强化学习·actor-critic·多臂老虎机·汤普森采样·探索与利用
程序员Agions1 天前
程序员武学修炼手册(三):融会贯通——从写好代码到架构设计
前端·程序员·强化学习
索木木2 天前
强化学习与思维链
大模型·sft·强化学习·思维链
nju_spy3 天前
RL4LLM_Survey 强化学习在大语言模型后训练综述
人工智能·强化学习·reinforce·ppo·数据异质性·大模型后训练·奖励函数
郭庆汝3 天前
大模型-微调相关内容
大模型微调·llamafactory
AI-Frontiers4 天前
小白也能看懂的LLM-RL算法:PPO/DPO/GRPO/GSPO
强化学习·大模型训练
超的小宝贝4 天前
机器学习期末复习
深度学习·机器学习·强化学习
空山新雨后、4 天前
深度学习VS强化学习:预测与决策的本质差异
人工智能·深度学习·强化学习
Tfly__5 天前
Ubuntu20.04安装Genesis(最新)
linux·人工智能·pytorch·ubuntu·github·无人机·强化学习