Value error, The repository contains custom code which must be executed to...

1. 问题描述

  • 用以下命令启动 vllm 服务时报错,报错截图如下。
shell 复制代码
# 启动命令
vllm serve /home/paulyu12/models/ilama-3.2-1B \
        --gpu-memory-utilization 0.8
  • 报错文本
txt 复制代码
Value error, The repository /home/paulyu12/models/ilama-3.2-1B contains custom code which must be executed to correctly load the model. You can inspect the repository content at /home/paulyu12/models/ilama-3.2-1B .
  • 报错截图

2. 问题分析

查看模型文件目录,可以看到存在 *.py 的脚本文件。这些文件就是报错中所说的 "custom code"。

3. 问题解决

启动 vllm 服务时,添加 --trust-remote-code 参数。

4. 其它参数说明

  • max_model_len:模型的最大生成长度,包含prompt长度和generated长度。这个值需要根据实际情况输入。当显存容量不足时,也可以通过控制该参数,使模型得以正常启动。否则会报如下错误。
相关推荐
小陈phd2 分钟前
TensorRT 入门完全指南(一)——从核心定义到生态工具全解析
人工智能·笔记
CeshirenTester19 分钟前
从0到1学自动化测试该怎么规划?
人工智能
:mnong23 分钟前
以知识驱动 AIAD 行业进化
人工智能·cad
xmdy586630 分钟前
Flutter+开源鸿蒙实战|智安盾电商溯源平台Day1 项目搭建与整体方案拆解
flutter·开源·harmonyos
ZhengEnCi31 分钟前
03-注意力机制基础 📚
人工智能
该昵称用户已存在37 分钟前
以开源筑基,架构先行——深度拆解 MyEMS 微服务能源管理系统的技术内核
微服务·架构·开源
我是大聪明.40 分钟前
CUDA矩阵乘法优化:共享内存分块与Warp级执行机制深度解析
人工智能·深度学习·线性代数·机器学习·矩阵
郑寿昌1 小时前
文化差异如何重塑AI语言理解能力
人工智能
lizhihai_991 小时前
股市学习心得-六张分时保命图
大数据·人工智能·学习