下载**Qwen3.5-35B-A3B**的GGUF格式文件

要下载Qwen3.5-35B-A3B 的GGUF格式文件,可通过Hugging Face (国际主流)或ModelScope(国内镜像)平台获取,以下是具体步骤和注意事项:

一、核心下载地址

Qwen3.5-35B-A3B的GGUF文件主要由Unsloth团队上传至Hugging Face和ModelScope,这两个平台是最可靠的来源:

二、下载方式选择

根据网络环境和需求,可选择以下下载方式:

1. 直接下载(适合小文件或稳定网络)

进入上述平台的文件页面,找到需要的GGUF文件(如Qwen3.5-35B-A3B-UD-Q4_K_XL.gguf,这是常用的量化版本),点击Download按钮直接下载。

2. 命令行下载(适合大文件或批量下载)

若需下载大文件(如19GB的UD-Q4_K_XL版本),可使用**huggingface-cli aria2c**工具,支持断点续传和多线程加速:

(1)使用huggingface-cli(Python工具)
  • 安装依赖:pip install huggingface-hub

  • 下载命令(示例):

    bash 复制代码
    huggingface-cli download unsloth/Qwen3.5-35B-A3B-GGUF \
      --include "Qwen3.5-35B-A3B-UD-Q4_K_XL.gguf" \
      --local-dir ./Qwen3.5-35B-A3B-GGUF \
      --local-dir-use-symlinks False

    该命令会将文件下载至当前目录的Qwen3.5-35B-A3B-GGUF文件夹,且不使用符号链接(避免路径问题)。

(2)使用aria2c(多线程下载工具)
  • 安装aria2(参考官网:https://aria2.github.io/);

  • 下载命令(示例):

    bash 复制代码
    aria2c -x16 -s16 -k 1M \
      "https://huggingface.co/unsloth/Qwen3.5-35B-A3B-GGUF/resolve/main/Qwen3.5-35B-A3B-UD-Q4_K_XL.gguf" \
      -d ./Qwen3.5-35B-A3B-GGUF \
      -o Qwen3.5-35B-A3B-UD-Q4_K_XL.gguf

    其中,-x16表示16个连接线程,-s16表示16个分段下载,-k 1M表示每个分段1MB,适合高速网络环境。

3. 国内用户优化(解决网络问题)

若国内访问Hugging Face缓慢,可通过ModelScope镜像 下载,或使用HF Mirror(Hugging Face镜像站):

三、注意事项

  1. 量化版本选择

    Qwen3.5-35B-A3B的GGUF文件提供多种量化版本(如UD-Q2_K_XL、UD-Q3_K_XL、UD-Q4_K_XL、UD-Q5_K_XL等),其中UD-Q4_K_XL是平衡性能和显存占用的常用选择(约19GB,适合24GB显存的RTX 4090/3090显卡)。

  2. 文件完整性

    下载后可通过平台提供的SHA256校验和 验证文件完整性(如Hugging Face页面的Checksums section),避免因网络问题导致的文件损坏。

  3. 部署建议

    下载后的GGUF文件可用于llama.cppvLLM 等推理框架,部署时需参考对应框架的文档(如llama.cpp的llama-cli命令)。

总结

最推荐的下载路径是:

若需快速下载大文件,建议使用aria2c多线程工具,或通过ModelScope的镜像加速。

相关推荐
txp玩Linux2 小时前
嵌入式音视频:语音识别开源项目
人工智能·音视频·语音识别
Roselind_Yi2 小时前
【吴恩达2026 Agentic AI】面试向+项目实战(含面试题+项目案例)-1
人工智能·python·面试·职场和发展·langchain·gpt-3·agent
新缸中之脑2 小时前
Vane 安装指南(本地AI问答引擎)
人工智能
Coremail邮件安全2 小时前
2025企业邮箱安全报告发布:AI攻击升级,技术与管理协同成防护趋势
人工智能·安全
道一云黑板报2 小时前
企业微信CLI开源项目发布,支持通过CLI使用接口能力
人工智能·开源·企业微信
OpenCSG2 小时前
AgenticOps全景解读:CSGHub + OpenClaw x AgenticHub 如何重构企业AI基础设施
人工智能·重构
deephub2 小时前
多 Agent 验证架构实战:从输出评分到过程验证
人工智能·深度学习·大语言模型·agent
Deepoch2 小时前
Deepoc具身模型:重塑采摘机器人“手眼脑”
人工智能·科技·机器人·具身模型·deepoc
剑穗挂着新流苏3122 小时前
206_深度学习进阶:模型选择、过拟合与欠拟合的生存法则
人工智能·pytorch·深度学习·神经网络·线性代数