deepseek-R1模型输出时截断异常

deepseek-r1调用时,中间的思考以及答案都可以输出,可以最后却异常。2025-11-14 15:27:52,827 - MainThread - src.session.session_service - session_service.py 131 - ERROR - {'session_id': 'S99d663183d29408991896cb37b913f64', 'agent': 'output', 'id': 'run--17759891-b8a0-4def-b41b-91122e1fde97', 'role': 'assistant', 'content': 'xi', 'type': 'text', 'finish_reason': 'length'}

DeepSeek-R1 的服务端在流式输出时触发了「生成长度限制」,模型被强行截断,于是最后一段内容不完整,SDK/你的代码在收到非正常结束后又继续处理,导致最终抛异常。

建议:R1 至少 4096~8192 才不会被思考部分撑爆。

✔ 设置:

max_tokens = 8192

✔ 系统指令抑制思考过程(如你不需要):

只输出最终答案,不要输出推理过程。

✔ 代码层支持 finish_reason="length",不要抛异常

相关推荐
开开心心就好几秒前
发票合并打印工具,多页布局设置实时预览
linux·运维·服务器·windows·pdf·harmonyos·1024程序员节
火车叼位20 分钟前
脚本伪装:让 Python 与 Node.js 像原生 Shell 命令一样运行
运维·javascript·python
css趣多多28 分钟前
add组件增删改的表单处理
java·服务器·前端
Sheep Shaun33 分钟前
揭开Linux的隐藏约定:你的第一个文件描述符为什么是3?
linux·服务器·ubuntu·文件系统·缓冲区
野犬寒鸦42 分钟前
从零起步学习并发编程 || 第七章:ThreadLocal深层解析及常见问题解决方案
java·服务器·开发语言·jvm·后端·学习
迎仔44 分钟前
06-存储设备运维进阶:算力中心的存储管家
运维
?re?ta?rd?ed?1 小时前
linux中的调度策略
linux·运维·服务器
全栈工程师修炼指南1 小时前
Nginx | stream content 阶段:TCP 协议四层反向代理浅析与实践
运维·网络·网络协议·tcp/ip·nginx
hweiyu001 小时前
Linux 命令:tr
linux·运维·服务器
Trouvaille ~1 小时前
【Linux】应用层协议设计实战(一):自定义协议与网络计算器
linux·运维·服务器·网络·c++·http·应用层协议