llama大模型部署

看模型加载的参数设置.

复制代码
import torch

# 初始化Half Tensor
h = torch.tensor([1.0,2.0,3.0], dtype=torch.half)
# h = torch.tensor([1.0,2.0,3.0], dtype=torch.float16) # 跟上面一行一样.

# 查看数据类型
print(h.dtype)
import accelerate
import bitsandbytes
from transformers import AutoTokenizer, AutoModelForCausalLM,TextIteratorStreamer
from transformers import AlbertTokenizer, AlbertModel
model = AlbertModel.from_pretrained('./albert',device_map='auto',torch_dtype=torch.float16,load_in_8bit=True,low_cpu_mem_usage=True)
# torch_dtype 模型本身的类型, 不写的话就自己根据权重文件查询出来.这个是权重文件本身决定的,一般在config.json里面
# load_in_8bit 会把模型转化为8bit类型.这个可以自己设置.

print(1)
  • low_cpu_mem_usage algorithm:

    复制代码
    This is an experimental function that loads the model using ~1x model size CPU memory
    
      Here is how it works:
    
      1. save which state_dict keys we have
      2. drop state_dict before the model is created, since the latter takes 1x model size CPU memory
      3. after the model has been instantiated switch to the meta device all params/buffers that
      are going to be replaced from the loaded state_dict
      4. load state_dict 2nd time
      5. replace the params/buffers from the state_dict
    
      Currently, it can't handle deepspeed ZeRO stage 3 and ignores loading errors

这个算法low_cpu_mem 如果设置True

那么他会进行.

把权重字典的keys保存下来.

然后把state_dict删除.

初始化模型.把需要加载的参数位置放到meta device里面.

再加载state_dict

可以节省cpu内存. 小内存时候需要打开.

相关推荐
焦糖夹心几秒前
python中,怎么同时输出字典的键和值?
开发语言·python
ValhallaCoder15 分钟前
hot100-回溯II
数据结构·python·算法·回溯
2401_8288906422 分钟前
正/余弦位置编码 Sinusoidal Encoding
python·自然语言处理·transformer·embedding
MoonOutCloudBack25 分钟前
VeRL 框架 RL 微调大语言模型,algorithm.use_pf_ppo 参数详解
人工智能·机器学习·语言模型·自然语言处理
流烟默26 分钟前
Python爬虫之下载豆瓣电影图片到本地
爬虫·python
hhzz32 分钟前
【Vision人工智能设计 】Wan(万相) 内容创作平台与能力
人工智能·阿里·视觉大模型·wan·万相
黑巧克力可减脂33 分钟前
Vibe Coding重构CRM:以AI编程之术,破传统管理之困,承革新致远之道
人工智能·重构·软件工程·ai编程
wuxi_joe34 分钟前
工业信息化与AI:制造业配置能力的重构
人工智能·重构
heimeiyingwang41 分钟前
从 0 到 1:企业 AI 战略规划与落地路线图
大数据·人工智能
喵手43 分钟前
Python爬虫实战:构建“时光机”——网站数据增量监控与差异分析系统!
爬虫·python·爬虫实战·差异分析·零基础python爬虫教学·网站数据增量·网站数据增量监控系统