Value error, The repository contains custom code which must be executed to...

1. 问题描述

  • 用以下命令启动 vllm 服务时报错,报错截图如下。
shell 复制代码
# 启动命令
vllm serve /home/paulyu12/models/ilama-3.2-1B \
        --gpu-memory-utilization 0.8
  • 报错文本
txt 复制代码
Value error, The repository /home/paulyu12/models/ilama-3.2-1B contains custom code which must be executed to correctly load the model. You can inspect the repository content at /home/paulyu12/models/ilama-3.2-1B .
  • 报错截图

2. 问题分析

查看模型文件目录,可以看到存在 *.py 的脚本文件。这些文件就是报错中所说的 "custom code"。

3. 问题解决

启动 vllm 服务时,添加 --trust-remote-code 参数。

4. 其它参数说明

  • max_model_len:模型的最大生成长度,包含prompt长度和generated长度。这个值需要根据实际情况输入。当显存容量不足时,也可以通过控制该参数,使模型得以正常启动。否则会报如下错误。
相关推荐
Juchecar17 小时前
交叉熵:深度学习中最常用的损失函数
人工智能
林木森ai17 小时前
爆款AI动物运动会视频,用Coze(扣子)一键搞定全流程(附保姆级拆解)
人工智能·aigc
聚客AI18 小时前
🙋‍♀️Transformer训练与推理全流程:从输入处理到输出生成
人工智能·算法·llm
BeerBear19 小时前
【保姆级教程-从0开始开发MCP服务器】一、MCP学习压根没有你想象得那么难!.md
人工智能·mcp
小气小憩19 小时前
“暗战”百度搜索页:Monica悬浮球被“围剿”,一场AI Agent与传统巨头的流量攻防战
前端·人工智能
神经星星20 小时前
准确度提升400%!印度季风预测模型基于36个气象站点,实现城区尺度精细预报
人工智能
IT_陈寒1 天前
JavaScript 性能优化:5 个被低估的 V8 引擎技巧让你的代码快 200%
前端·人工智能·后端
Juchecar1 天前
一文讲清 PyTorch 中反向传播(Backpropagation)的实现原理
人工智能
黎燃1 天前
游戏NPC的智能行为设计:从规则驱动到强化学习的演进
人工智能
机器之心1 天前
高阶程序,让AI从技术可行到商业可信的最后一公里
人工智能·openai