llama大模型部署

看模型加载的参数设置.

import torch

# 初始化Half Tensor
h = torch.tensor([1.0,2.0,3.0], dtype=torch.half)
# h = torch.tensor([1.0,2.0,3.0], dtype=torch.float16) # 跟上面一行一样.

# 查看数据类型
print(h.dtype)
import accelerate
import bitsandbytes
from transformers import AutoTokenizer, AutoModelForCausalLM,TextIteratorStreamer
from transformers import AlbertTokenizer, AlbertModel
model = AlbertModel.from_pretrained('./albert',device_map='auto',torch_dtype=torch.float16,load_in_8bit=True,low_cpu_mem_usage=True)
# torch_dtype 模型本身的类型, 不写的话就自己根据权重文件查询出来.这个是权重文件本身决定的,一般在config.json里面
# load_in_8bit 会把模型转化为8bit类型.这个可以自己设置.

print(1)
  • low_cpu_mem_usage algorithm:

    This is an experimental function that loads the model using ~1x model size CPU memory
    
      Here is how it works:
    
      1. save which state_dict keys we have
      2. drop state_dict before the model is created, since the latter takes 1x model size CPU memory
      3. after the model has been instantiated switch to the meta device all params/buffers that
      are going to be replaced from the loaded state_dict
      4. load state_dict 2nd time
      5. replace the params/buffers from the state_dict
    
      Currently, it can't handle deepspeed ZeRO stage 3 and ignores loading errors
    

这个算法low_cpu_mem 如果设置True

那么他会进行.

把权重字典的keys保存下来.

然后把state_dict删除.

初始化模型.把需要加载的参数位置放到meta device里面.

再加载state_dict

可以节省cpu内存. 小内存时候需要打开.

相关推荐
jiayoushijie-泽宣5 分钟前
VITA-1.5接近GPT4o水平的多模态模型:理解和跑通这套多模态实时交互系统
人工智能·算法·交互
摸鱼仙人~24 分钟前
Deep Learning Meets Hyperspectral Image Analysis: A Multidisciplinary 参考文献翻译
人工智能·深度学习
思通数科多模态大模型25 分钟前
开源AI视频监控系统,助力公租房廉租房管理,打击倒卖行为
人工智能·深度学习·目标检测·机器学习·目标跟踪·自然语言处理·数据挖掘
weixin_3499105026 分钟前
机器学习在智能外呼机器人中的作用
人工智能·机器学习·机器人
2013crazy29 分钟前
Python 基于 opencv 的人脸识别监控打卡系统(源码+部署)
开发语言·python·opencv·python 人脸识别·python 人脸识别打卡
爱研究的小牛31 分钟前
Synthesia技术浅析(六):生成对抗网络
人工智能·神经网络·生成对抗网络·aigc
远洋录44 分钟前
WebSocket 安全实践:从认证到加密
前端·人工智能·react
常政1 小时前
零基础学编程 | 2025年 Python 安装、调试保姆级教程
python·入门教程·python编程·零基础学编程·python安装·vscode安装
pzx_0011 小时前
【集成学习】Bagging算法详解及代码实现
python·算法·机器学习·集成学习
老板多放点香菜1 小时前
DAY15 神经网络的参数和变量
人工智能·深度学习·神经网络·线性代数·机器学习·矩阵