hook来获取模型每层的激活值输出

1.利用train_dataset来提取数据集,并且提取第一个数据集图像,没有batch维度

2.添加 batch 维度: [C, H, W] -> [1, C, H, W]img = img.unsqueeze(0)

import sys

import os

from pathlib import Path

解决 OpenMP 库冲突问题

os.environ['KMP_DUPLICATE_LIB_OK'] = 'TRUE'

添加项目根目录到 Python 路径

project_root = Path(file).parent.parent

sys.path.insert(0, str(project_root))

from utils.hanfeng_dataset import HanfengDataset

import torch

import torch.nn as nn

import matplotlib.pyplot as plt

import torchvision

from models.UNeXt.UNeXt_Stripe_Conv import UNext_Stripe_Conv

========== 1. 准备一个存储激活值的字典 ==========

activations = {}

data_root = r"D:\github\DSNet-main\data\hanfeng"

def get_activation(name):

"""定义hook函数"""

def hook(model, input, output):

activations[name] = output.detach()

return hook

========== 2. 给模型的层注册hook ==========

model = UNext_Stripe_Conv(num_classes=1)

model.eval()

给所有卷积层注册hook

for name, layer in model.named_modules():

if isinstance(layer, nn.Conv2d):

layer.register_forward_hook(get_activation(name))

========== 3. 前向传播,自动捕获激活值 ==========

定义数据预处理 transform

import albumentations as A

from albumentations.pytorch import ToTensorV2

transform = A.Compose([

A.Resize(224, 224), # 调整大小,避免显存溢出

A.Normalize(mean=[0.105, 0.105, 0.105], std=[0.203, 0.203, 0.203]), # ImageNet 标准化

ToTensorV2(), # 转换为 tensor,自动变成 [C, H, W]

])

train_dataset = HanfengDataset(data_root, mode='trainval', transform=transform, auto_fix_path=True)

print(f"✓ 训练集加载成功: {len(train_dataset)} 个样本")

img, mask, meta = train_dataset[0]

print(f"图像形状: {img.shape}") # 现在应该是 [C, H, W]

# 添加 batch 维度: [C, H, W] -> [1, C, H, W]

img = img.unsqueeze(0)

with torch.no_grad():

output = model(img)

========== 4. 可视化任意层 ==========

def visualize_layer(layer_name, num_channels=16):

"""显示某层的前num_channels个通道"""

act = activations[layer_name][0] # [C, H, W]

fig, axes = plt.subplots(4, 4, figsize=(10, 10))

for i, ax in enumerate(axes.flat):

if i < min(num_channels, act.shape[0]):

ax.imshow(act[i].cpu(), cmap='viridis')

ax.set_title(f'Ch {i}')

ax.axis('off')

plt.suptitle(f'{layer_name}')

plt.show()

使用

print(f"捕获了 {len(activations)} 层")

first_conv = list(activations.keys())[0]

visualize_layer(first_conv)

相关推荐
SiYuanFeng1 小时前
Colab复现 NanoChat:从 Tokenizer(CPU)、Base Train(CPU) 到 SFT(GPU) 的完整踩坑实录
python·colab
炸炸鱼.2 小时前
Python 操作 MySQL 数据库
android·数据库·python·adb
sinat_286945192 小时前
AI Coding 时代的 TDD:从理念到工程落地
人工智能·深度学习·算法·tdd
_深海凉_2 小时前
LeetCode热题100-颜色分类
python·算法·leetcode
AC赳赳老秦3 小时前
OpenClaw email技能:批量发送邮件、自动回复,高效处理工作邮件
运维·人工智能·python·django·自动化·deepseek·openclaw
zhaoshuzhaoshu3 小时前
Python 语法之数据结构详细解析
python
AI问答工程师3 小时前
Meta Muse Spark 的"思维压缩"到底是什么?我用 Python 复现了核心思路(附代码)
人工智能·python
Rabbit_QL4 小时前
【理论分析】信息熵的极值问题:什么时候最小?什么时候最大?
人工智能·深度学习
Z.风止4 小时前
Large Model-learning(3)
人工智能·笔记·后端·深度学习
zfan5204 小时前
python对Excel数据处理(1)
python·excel·pandas