Value error, The repository contains custom code which must be executed to...

1. 问题描述

  • 用以下命令启动 vllm 服务时报错,报错截图如下。
shell 复制代码
# 启动命令
vllm serve /home/paulyu12/models/ilama-3.2-1B \
        --gpu-memory-utilization 0.8
  • 报错文本
txt 复制代码
Value error, The repository /home/paulyu12/models/ilama-3.2-1B contains custom code which must be executed to correctly load the model. You can inspect the repository content at /home/paulyu12/models/ilama-3.2-1B .
  • 报错截图

2. 问题分析

查看模型文件目录,可以看到存在 *.py 的脚本文件。这些文件就是报错中所说的 "custom code"。

3. 问题解决

启动 vllm 服务时,添加 --trust-remote-code 参数。

4. 其它参数说明

  • max_model_len:模型的最大生成长度,包含prompt长度和generated长度。这个值需要根据实际情况输入。当显存容量不足时,也可以通过控制该参数,使模型得以正常启动。否则会报如下错误。
相关推荐
程序员cxuan7 分钟前
LobsterAI 快把职业门槛打没了
人工智能·程序员
cqbzcsq7 分钟前
CellFlow虚拟细胞论文阅读
论文阅读·人工智能·笔记·学习·生物信息
AndrewHZ11 分钟前
【LLM技术全景】大模型能力探秘:In-Context Learning与思维链(CoT)
人工智能·语言模型·大模型·llm·cot·思维链·icl
生成论实验室20 分钟前
机器人:一个自主运动的系统
人工智能·算法·语言模型·机器人·自动驾驶·agi·安全架构
Godspeed Zhao23 分钟前
现代智能汽车系统——智驾SoC之框架版图
人工智能·机器学习·自动驾驶·汽车·soc
薛定猫AI24 分钟前
【技术干货】OpenRouter Fusion复合API实战:多模型协同调用如何突破单模型性能瓶颈
人工智能·agi
dayuOK630725 分钟前
写作卡壳怎么办?我的“5分钟启动法”
人工智能·职场和发展·自动化·新媒体运营·媒体
大山佬27 分钟前
边缘 AI 部署实战:从模型量化到 MCU 推理的端到端工程方案
人工智能
XIAOYU67201333 分钟前
不限物化选科的大数据管理与应用靠谱吗
人工智能
初晴融雪-快雪时晴34 分钟前
产业分析:AI产业 上下游 全景分析 202606版本
人工智能·基础知识