deepseek-R1模型输出时截断异常

deepseek-r1调用时,中间的思考以及答案都可以输出,可以最后却异常。2025-11-14 15:27:52,827 - MainThread - src.session.session_service - session_service.py 131 - ERROR - {'session_id': 'S99d663183d29408991896cb37b913f64', 'agent': 'output', 'id': 'run--17759891-b8a0-4def-b41b-91122e1fde97', 'role': 'assistant', 'content': 'xi', 'type': 'text', 'finish_reason': 'length'}

DeepSeek-R1 的服务端在流式输出时触发了「生成长度限制」,模型被强行截断,于是最后一段内容不完整,SDK/你的代码在收到非正常结束后又继续处理,导致最终抛异常。

建议:R1 至少 4096~8192 才不会被思考部分撑爆。

✔ 设置:

max_tokens = 8192

✔ 系统指令抑制思考过程(如你不需要):

只输出最终答案,不要输出推理过程。

✔ 代码层支持 finish_reason="length",不要抛异常

相关推荐
努力努力再努力wz13 小时前
【C++高阶系列】外存查找的极致艺术:数据库偏爱的B+树底层架构剖析与C++完整实现!(附B+树实现的源码)
linux·运维·服务器·数据结构·数据库·c++·b树
PH = 713 小时前
virtualbox+vagrant创建CentOS-7虚拟机
运维·ruby·vagrant
财迅通Ai13 小时前
SuperX完成日本全球供应中心首批高性能AI服务器交付,全球战略迈出关键一步
运维·服务器·人工智能·superx·中恒电气
踏着七彩祥云的小丑13 小时前
Linux命令——开机自启配置
linux·运维·网络
clear sky .13 小时前
[linux]buildroot什么用途
linux·运维·数据库
砍材农夫13 小时前
番外篇-ollama一步一步docker安装部署
运维·docker·容器
德宏大魔王(AI自动回关)13 小时前
当龙虾接管浏览器:龙虾邪修——自动化破解网页JS登录的“魔法”
运维·javascript·自动化·qclaw·qclaw脑洞名场面
SpikeKing13 小时前
VibeCoding - OpenClaw 公网访问配置指南 (自动化)
运维·自动化·vibecoding·openclaw
ulias21220 小时前
Linux系统中的权限问题
linux·运维·服务器
青花瓷21 小时前
Ubuntu下OpenClaw的安装(豆包火山API版)
运维·服务器·ubuntu