使用.py脚本下载并加载开源大模型LLMs

  1. 可以通过以下代码下载并加载模型,以facebook/opt-6.7b为例:

    python 复制代码
    from transformers import AutoModelForCausalLM, AutoTokenizer
    
    tokenizer = AutoTokenizer.from_pretrained('facebook/opt-6.7b', cache_dir='your_loaded_path')
    model = AutoModelForCausalLM.from_pretrained('facebook/opt-6.7b', cache_dir='your_loaded_path',
                                                 device_map='your_device', load_in_8bit=True)
  2. 如果出现以下报错,则说明是网络连接问题:无法连接到 Hugging Face 的服务器

    python 复制代码
    OSError: We couldn't connect to 'https://huggingface.co' to load this file, couldn't find it in the cached files and it looks like facebook/opt-6.7b is not the path to a directory containing a file named config.json.
    Checkout your internet connection or see how to run the library in offline mode at 'https://huggingface.co/docs/transformers/installation#offline-mode'.

    解决方法:只需要设置 HF mirror 就可以修复HF的网络连接问题,在终端输入以下命令

    python 复制代码
    export HF_ENDPOINT=https://hf-mirror.com

    成功开始下载:

  3. 如果仅需要下载模型,且安装了 Hugging Face CLI 工具,可以使用以下命令简单快捷地下载模型ckpt到本地:

    python 复制代码
    huggingface-cli download facebook/opt-6.7b --cache-dir [/本地路径]
    
    # Shell
    huggingface-cli download --repo-type dataset --token [你的token] --resume-download [数据集名称] --cache-dir [/本地路径] --local-dir-use-symlinks False
相关推荐
编写人生8 小时前
如何更优雅地提供 MCP Resources
ai
摸鱼同学8 小时前
14-oh-my-claude / oh-my-claudecode:多 Agent 编排框架
ai·agent·claude·skill·omc
找藉口是失败者的习惯8 小时前
LLM 调用 MCP 工具的实现原理-源码解析
ai
珺毅同学8 小时前
YOLO生成预测json标签迁移问题
python·yolo·json
骑士雄师8 小时前
18.4 长期记忆可修改版
python
~小先生~9 小时前
Python从入门到放弃(一)
开发语言·python
天佑木枫9 小时前
第2天:变量与数据类型 —— 让程序记住信息
python
Dust-Chasing10 小时前
Claude Code源码剖析 - Claude Code 上下文压缩机制
人工智能·python·ai
zhangpba11 小时前
IntelliJ IDEA 集成通义灵码
ai·idea
身如柳絮随风扬11 小时前
LangGraph State记忆机制深度解析:短期与长期记忆的实现原理与实战
ai