技术栈
glm强化推理
Nicolas893
5 天前
大模型
·
大模型推理
·
o1
·
强化推理
·
多步推理
·
glm强化推理
【大模型实战篇】GLM-Zero模型初代版本的尝鲜
在 2024 年的最后一天,智谱发布了 GLM-Zero 的初代版本 GLM-Zero-Preview,是基于扩展强化学习技术训练的推理模型【1】。GLM-Zero-Preview的推理能力还挺强的,类似于open ai的o1模型,擅长在一些有确定性结果的场景,比如逻辑推理、数学、编程。