技术栈

glm强化推理

Nicolas893
5 个月前
大模型·大模型推理·o1·强化推理·多步推理·glm强化推理
【大模型实战篇】GLM-Zero模型初代版本的尝鲜在 2024 年的最后一天,智谱发布了 GLM-Zero 的初代版本 GLM-Zero-Preview,是基于扩展强化学习技术训练的推理模型【1】。GLM-Zero-Preview的推理能力还挺强的,类似于open ai的o1模型,擅长在一些有确定性结果的场景,比如逻辑推理、数学、编程。