Xinference Huggingface常用命令

指定Xinference下载模型的路径

1. 通过环境变量全局设置

  • 修改默认存储路径 在启动Xinference服务前,通过设置环境变量 XINFERENCE_HOME 指定模型和数据的存储目录。例如:

    javascript 复制代码
    Bash
    export XINFERENCE_HOME=/your/custom/path
    xinference-local --host 0.0.0.0 --port 9997

    这样所有模型和缓存文件都会保存在 /your/custom/path 目录下

  • 指定模型下载来源 若需从魔搭社区(ModelScope)下载模型,可额外设置:

    ini 复制代码
    Bash
    export XINFERENCE_MODEL_SRC=modelscope

    这会将默认的HuggingFace源替换为ModelScope

2. 在代码中指定模型路径

  • 使用ModelScope下载时自定义路径 若通过代码下载模型,可以在 snapshot_download 函数中直接设置 cache_dir 参数:

    ini 复制代码
    Python
    from modelscope import snapshot_download
    model_dir = snapshot_download('Jerry0/text2vec-base-chinese', cache_dir='/your/custom/path')

    此方法适用于需要临时调整单个模型的存储位置

  • 注册自定义模型时指定路径 自定义模型需在 model.json 配置文件中明确 model_uri 字段为模型的绝对路径:

    json 复制代码
    Json
    {
      "model_uri": "/home/your_model_path",
      ...
    }

    注册后,Xinference会直接从此路径加载模型

3. 通过软链接调整路径

  • 创建软链接覆盖默认缓存目录 如果已手动下载模型文件,可以通过软链接将自定义路径映射到Xinference的默认缓存路径:

    bash 复制代码
    Bash
    ln -s /your/custom/model/path ~/.xinference/cache/model-name-format

    例如,将已下载的ChatGLM3模型链接到默认缓存目录:

    javascript 复制代码
    Bash
    ln -s ~/Downloads/chatglm3-6b ~/.xinference/cache/chatglm3-pytorch-6b

    此方法适用于希望复用现有模型文件的情况

4. 通过启动参数临时指定

  • 启动服务时指定路径 直接在启动命令中结合环境变量设置:

    lua 复制代码
    Bash
    XINFERENCE_HOME=/your/custom/path xinference-local --host 0.0.0.0 --port 9997

    这种方式无需永久修改环境变量,适合临时调整

注意事项

  • 路径权限:确保自定义路径有读写权限。

  • 软链接校验 :Xinference会检查 ~/.xinference/cache 目录下的 __valid_download 文件,若通过软链接添加模型,需手动复制该文件或确保其存在

  • 模型格式 :路径中的模型目录需符合Xinference的命名规则(如 model-name-format),否则可能无法识别

以上方法可根据实际需求灵活选择。如果需要进一步调试,可参考Xinference的日志文件(默认在 ~/.xinference/logs 或自定义路径中)。

相关推荐
试着1 小时前
【AI面试准备】掌握常规的性能、自动化等测试技术,并在工作中熟练应用
面试·职场和发展·自动化·测试
独行soc2 小时前
2025年渗透测试面试题总结-某步在线面试(题目+回答)
linux·网络·安全·web安全·面试·职场和发展·渗透安全
为美好的生活献上中指7 小时前
面试问题总结(回忆版)
面试·职场和发展
蓝婷儿9 小时前
前端面试每日三题 - Day 28
前端·面试·职场和发展
机器视觉知识推荐、就业指导12 小时前
Qt/C++面试【速通笔记七】—Qt中为什么new QWidget不需要手动调用delete?
c++·qt·面试
青松@FasterAI20 小时前
【大模型面试】大模型(LLMs)高频面题全面整理(★2025年5月最新版★)
面试·职场和发展·大模型开发·大模型面试·nlp面试·nlp面题·大模型面题
爱吃涮毛肚的肥肥(暂时吃不了版)20 小时前
仿腾讯会议——创建房间&加入房间
c++·qt·面试·职场和发展·腾讯会议
_Power_Y1 天前
面试算法刷题练习1(核心+acm)
算法·面试
程序员JerrySUN1 天前
驱动开发硬核特训 · 专题篇:Vivante GPU 与 DRM 图形显示体系全解析(i.MX8MP 平台实战)
linux·驱动开发·嵌入式硬件·面试·职场和发展·架构