大模型.safetensors文件

文章目录

.safetensors(安全张量)是大模型中的权重配置文件,本身是二进制,不可直接修改。

如果想看内容的话,txt打开可以看到头部内容便于理解。

如果直接修改了里面的内容,启动大模型会报错,因为二进制文件会损坏。

如果把模型比作一个人:

  • config.json 是这个人的骨架结构(身高、臂长、关节数)。
  • tokenizer 是这个人的语言能力(懂中文还是英文)。
  • .safetensors 就是这个人的"大脑"和"记忆"(所有的知识、经验、性格)。

生成示例文件

不太好找,直接用代码生成比较方便。
1、安装依赖:

bash 复制代码
pip install torch safetensors

2、用代码生成文件

python 复制代码
import torch
import os
from safetensors.torch import save_file


# 1. 创建一些模拟的模型权重数据
# 假设这是一个小型的神经网络,包含嵌入层和两个线性层
tensors = {
    # 嵌入层权重 (词汇表大小 1000, 隐藏层维度 128)
    "model.embed_tokens.weight": torch.randn(1000, 128, dtype=torch.float32),

    # 第一层线性变换 (输入 128, 输出 256)
    "model.layers.0.self_attn.q_proj.weight": torch.randn(256, 128, dtype=torch.float16),
    "model.layers.0.self_attn.q_proj.bias": torch.zeros(256, dtype=torch.float16),

    # 第二层线性变换 (输入 256, 输出 10)
    "model.lm_head.weight": torch.randn(10, 256, dtype=torch.float32),
}

# 2. 定义元数据 (可选,但推荐)
metadata = {
    "format": "pt",
    "created_by": "user_demo",
    "description": "这是一个用于演示的示例 safetensors 文件"
}

# 3. 保存文件
output_filename = "original_model.safetensors"
save_file(tensors, output_filename, metadata=metadata)

print(f"✅ 成功生成文件: {output_filename}")
print(f"📂 文件大小: {os.path.getsize(output_filename) / 1024:.2f} KB")

打印文件内容

代码:

python 复制代码
# 4. 验证:读取刚刚生成的文件
from safetensors import safe_open
output_filename="original_model.safetensors"
print("\n🔍 文件内容验证:")
with safe_open(output_filename, framework="pt", device="cpu") as f:
    for key in f.keys():
        tensor = f.get_tensor(key)
        print(f" - {key}: 形状 {tensor.shape}, 类型 {tensor.dtype}")

修改并保存示例

代码:

python 复制代码
from safetensors import safe_open
from safetensors.torch import save_file
import torch

# 1. 读取
tensors = {}
with safe_open("original_model.safetensors", framework="pt", device="cpu") as f:
    for key in f.keys():
        tensors[key] = f.get_tensor(key)

# 2. 修改 (例如:把第一层的权重全部乘以 2)
first_layer_key = list(tensors.keys())[0]
tensors[first_layer_key] = tensors[first_layer_key] * 2

# 3. 保存为新文件 (原文件不变,生成新文件)
save_file(tensors, "modified_model.safetensors")
print("修改完成!生成了新文件。")

调用之前的查看代码查看内容,记得替换文件名为modified_model.safetensors

相关推荐
roman_日积跬步-终至千里7 分钟前
【深度学习】国科大:CIFAR-100 图像分类项目
人工智能·深度学习·分类
jarvisuni7 分钟前
成了!Opus4.7直接克隆Claude桌面版!
人工智能·ai编程
福大大架构师每日一题18 分钟前
ollama v0.20.7 最新版更新详解:ROCm 7.2.1、Gemma4 渲染修复与多项 Metal/Renderer 回归修补
人工智能·数据挖掘·回归·ollama
格林威26 分钟前
AI视觉检测:Jetson Orin vs RTX A2000 推理速度对比
人工智能·数码相机·机器学习·计算机视觉·视觉检测·机器视觉·工业相机
后端小肥肠36 分钟前
公众号破圈难?我写了个skill把长文拆成IP卡片,小红书小绿书同时发
人工智能·aigc·agent
陈天伟教授41 分钟前
四川省中小学和职业院校教师校长省级培训专家库专家名单
人工智能·安全·架构
Uncle 城41 分钟前
AI日报速递-20260418
人工智能
F_U_N_1 小时前
拒绝手动配环境!MonkeyCode:手机就能写项目,AI全程扛事
人工智能·ai编程
helloworddm1 小时前
Vulkan GPU图像处理之对数变换:Kompute框架实战与性能分析
图像处理·人工智能·计算机视觉
旺仔Sec1 小时前
一万字带您看懂:从“赛项”到“赛道”解读世界职业院校技能大赛改革与备赛策略
人工智能·世界职业院校技能大赛·大赛