下载**Qwen3.5-35B-A3B**的GGUF格式文件

要下载Qwen3.5-35B-A3B 的GGUF格式文件,可通过Hugging Face (国际主流)或ModelScope(国内镜像)平台获取,以下是具体步骤和注意事项:

一、核心下载地址

Qwen3.5-35B-A3B的GGUF文件主要由Unsloth团队上传至Hugging Face和ModelScope,这两个平台是最可靠的来源:

二、下载方式选择

根据网络环境和需求,可选择以下下载方式:

1. 直接下载(适合小文件或稳定网络)

进入上述平台的文件页面,找到需要的GGUF文件(如Qwen3.5-35B-A3B-UD-Q4_K_XL.gguf,这是常用的量化版本),点击Download按钮直接下载。

2. 命令行下载(适合大文件或批量下载)

若需下载大文件(如19GB的UD-Q4_K_XL版本),可使用**huggingface-cli aria2c**工具,支持断点续传和多线程加速:

(1)使用huggingface-cli(Python工具)
  • 安装依赖:pip install huggingface-hub

  • 下载命令(示例):

    bash 复制代码
    huggingface-cli download unsloth/Qwen3.5-35B-A3B-GGUF \
      --include "Qwen3.5-35B-A3B-UD-Q4_K_XL.gguf" \
      --local-dir ./Qwen3.5-35B-A3B-GGUF \
      --local-dir-use-symlinks False

    该命令会将文件下载至当前目录的Qwen3.5-35B-A3B-GGUF文件夹,且不使用符号链接(避免路径问题)。

(2)使用aria2c(多线程下载工具)
  • 安装aria2(参考官网:https://aria2.github.io/);

  • 下载命令(示例):

    bash 复制代码
    aria2c -x16 -s16 -k 1M \
      "https://huggingface.co/unsloth/Qwen3.5-35B-A3B-GGUF/resolve/main/Qwen3.5-35B-A3B-UD-Q4_K_XL.gguf" \
      -d ./Qwen3.5-35B-A3B-GGUF \
      -o Qwen3.5-35B-A3B-UD-Q4_K_XL.gguf

    其中,-x16表示16个连接线程,-s16表示16个分段下载,-k 1M表示每个分段1MB,适合高速网络环境。

3. 国内用户优化(解决网络问题)

若国内访问Hugging Face缓慢,可通过ModelScope镜像 下载,或使用HF Mirror(Hugging Face镜像站):

三、注意事项

  1. 量化版本选择

    Qwen3.5-35B-A3B的GGUF文件提供多种量化版本(如UD-Q2_K_XL、UD-Q3_K_XL、UD-Q4_K_XL、UD-Q5_K_XL等),其中UD-Q4_K_XL是平衡性能和显存占用的常用选择(约19GB,适合24GB显存的RTX 4090/3090显卡)。

  2. 文件完整性

    下载后可通过平台提供的SHA256校验和 验证文件完整性(如Hugging Face页面的Checksums section),避免因网络问题导致的文件损坏。

  3. 部署建议

    下载后的GGUF文件可用于llama.cppvLLM 等推理框架,部署时需参考对应框架的文档(如llama.cpp的llama-cli命令)。

总结

最推荐的下载路径是:

若需快速下载大文件,建议使用aria2c多线程工具,或通过ModelScope的镜像加速。

相关推荐
阿里云大数据AI技术9 小时前
EMR Serverless StarRocks 湖仓多模态检索:One SQL on One Data,实现全文 + 标量 + 向量三路混合检索
人工智能
冬奇Lab11 小时前
Skill 系列(02):Skill 安全风险——三类攻击面的实战测试
人工智能·安全·开源
冬奇Lab11 小时前
每日一个开源项目(第138篇):OpenMontage - 把 AI 编程助手变成完整的视频制作团队
人工智能·开源·claude
米小虾11 小时前
智谱港股盘中市值突破万亿港元!GLM-5.2 开源引爆国产 AI 价值重估
人工智能·chatglm (智谱)
阿里云大数据AI技术11 小时前
义乌小商品城基于MaxFrame AI Function的亿级AI 数据产线提速之路
人工智能
甲维斯12 小时前
用AI还原《坦克大战》并3D化升级!
前端·人工智能·游戏开发
IT_陈寒13 小时前
SpringBoot自动配置坑了我一晚上,原来问题出在这
前端·人工智能·后端
吴佳浩14 小时前
Hermes Agent 连环 400 真凶找到了:一个 call_id 让人炸毛
人工智能·llm·agent
程序员cxuan14 小时前
幽默,一个 Github 名字叫“马尾辫”,但是他给你省了 80% 的 token
人工智能·后端·程序员