技术栈
多步推理
冰糖猕猴桃
20 小时前
大数据
·
人工智能
·
ai
·
提示词
·
多步推理
【AI】把“大杂烩抽取”拆成多步推理:一个从单提示到多阶段管线的实践案例
很多做 LLM 应用的同学,都会遇到一个经典场景: 一条长文本,要求模型一次性抽一堆字段,还要严格 JSON 输出。 规则写得越来越长,few-shot 越堆越多,但效果总是“差点意思”。
Nicolas893
1 年前
大模型
·
大模型推理
·
o1
·
强化推理
·
多步推理
·
glm强化推理
【大模型实战篇】GLM-Zero模型初代版本的尝鲜
在 2024 年的最后一天,智谱发布了 GLM-Zero 的初代版本 GLM-Zero-Preview,是基于扩展强化学习技术训练的推理模型【1】。GLM-Zero-Preview的推理能力还挺强的,类似于open ai的o1模型,擅长在一些有确定性结果的场景,比如逻辑推理、数学、编程。
我是有底线的