使用.py脚本下载并加载开源大模型LLMs

  1. 可以通过以下代码下载并加载模型,以facebook/opt-6.7b为例:

    python 复制代码
    from transformers import AutoModelForCausalLM, AutoTokenizer
    
    tokenizer = AutoTokenizer.from_pretrained('facebook/opt-6.7b', cache_dir='your_loaded_path')
    model = AutoModelForCausalLM.from_pretrained('facebook/opt-6.7b', cache_dir='your_loaded_path',
                                                 device_map='your_device', load_in_8bit=True)
  2. 如果出现以下报错,则说明是网络连接问题:无法连接到 Hugging Face 的服务器

    python 复制代码
    OSError: We couldn't connect to 'https://huggingface.co' to load this file, couldn't find it in the cached files and it looks like facebook/opt-6.7b is not the path to a directory containing a file named config.json.
    Checkout your internet connection or see how to run the library in offline mode at 'https://huggingface.co/docs/transformers/installation#offline-mode'.

    解决方法:只需要设置 HF mirror 就可以修复HF的网络连接问题,在终端输入以下命令

    python 复制代码
    export HF_ENDPOINT=https://hf-mirror.com

    成功开始下载:

  3. 如果仅需要下载模型,且安装了 Hugging Face CLI 工具,可以使用以下命令简单快捷地下载模型ckpt到本地:

    python 复制代码
    huggingface-cli download facebook/opt-6.7b --cache-dir [/本地路径]
    
    # Shell
    huggingface-cli download --repo-type dataset --token [你的token] --resume-download [数据集名称] --cache-dir [/本地路径] --local-dir-use-symlinks False
相关推荐
张哈大8 小时前
解密Function Calling:AI Agent工具调用的标准化核心
人工智能·python·ai
搬砖的小码农_Sky8 小时前
特斯拉FSD Supervised(监督版)的技术原理
人工智能·ai·自动驾驶
子榆.8 小时前
CANN ATC编译器:模型从Python到达芬奇指令走了多远
开发语言·python·neo4j
lookaroundd8 小时前
llm-compressor 普通量化调用链分析
python·算法
Loo国昌8 小时前
从 Agent 编排到 Skill Runtime:企业 AI 工程化的下一层抽象
大数据·人工智能·后端·python·自然语言处理
编码者卢布8 小时前
【Azure Service Bus】Azure Service Bus Java SDK 中 Token 刷新异常的排查思路
java·python·azure
liuyunshengsir8 小时前
PyTorch 最小模型转 ONNX 完整样例
人工智能·pytorch·python
z202305088 小时前
RDMA之RoCEv2 无损网络PFC 、DCQCN 和ECN (7)
linux·服务器·网络·人工智能·ai
m0_380167148 小时前
CoinGlass API vs Glassnode:全面对比分析
人工智能·ai·区块链