llamafactory推理消除模型的随机性

匆匆那年9672026-02-08 8:12

llamafactory采用vllm推理时有一个do_sample参数，do_sample参数（是否采样）等于True(默认），为False为采用贪婪解码，即为不随机采样，生成将会更加稳定，自己测试了，结果是采用do_sample参数为False时效果有所提升。

参考链接：
https://github.com/vllm-project/vllm/blob/main/vllm/sampling_params.py#L117

temperature为0意味着采用贪婪策略

所以在LLaMA-Factory\src\llamafactory\api\protocol.py中：

将temperature: float | None = None改为temperature: Optional[float] = 0，即为采用贪婪策略，生成的更加稳定

上一篇：从回调地狱到Promise：JavaScript异步编程的演进之路

下一篇：C++异常处理机制反汇编（三）：32位下的异常结构分析

热门推荐

01GitHub 镜像站点 02【OpenClaw 本地实战 Ep.3】突破瓶颈：强制修改 openclaw.json 解锁 32k 上下文记忆 03OpenClaw 使用和管理 MCP 完全指南 04Clawdbot部署教程：解决‘gateway token missing’授权问题的完整步骤 05OpenClaw + 飞书（Feishu）环境搭建指南 06Claude Code + GLM4.7 避坑指南：解决 Unable to connect to Anthropic services 07Window 10部署openclaw报错node.exe : npm error code 128 08AI 规范驱动开发“三剑客”深度对比：Spec-Kit、Kiro 与 OpenSpec 实战指南 09AI Agent 平台横评：ZeroClaw vs OpenClaw vs Nanobot 10OpenClaw优化飞书API 额度已耗尽问题