glm强化推理 - glm强化推理技术,学习,经验文章

Nicolas893

2 年前

【大模型实战篇】GLM-Zero模型初代版本的尝鲜在 2024 年的最后一天，智谱发布了 GLM-Zero 的初代版本 GLM-Zero-Preview，是基于扩展强化学习技术训练的推理模型【1】。GLM-Zero-Preview的推理能力还挺强的，类似于open ai的o1模型，擅长在一些有确定性结果的场景，比如逻辑推理、数学、编程。