LibTorch张量基础

一、代码中的张量类型

张量类型 代码定义逻辑 维度本质(直观理解) 实际应用场景举例
1D int 张量 torch::tensor({1,2,...10}, torch::kInt32) 一维向量(长度 10) 标签数组、单维度特征
2D float 张量 torch::randn({4,512}, torch::kFloat32) 二维矩阵(4 行 512 列) 4 个样本,每个样本 512 维特征
3D float 张量 torch::randn({8,4,64}, torch::kFloat32) 三维张量(8 个 4×64 的矩阵) 8 个批次,每个批次 4×64 的特征图

1D的张量 步长也是stride={1}

2D张量 步长为{列数,1}

3D张量 步长为{行×列,列,1}

二、函数签名

复制代码
torch::Tensor torch::tensor(
    const c10::ArrayRef<T>& data,//数据源
    const torch::TensorOptions& options = {}//张量配置
);

使用的场景如下:

复制代码
//1D
auto tensor_1d = torch::tensor({1,2,3}, torch::dtype(torch::kInt32));

//从数组创建
int arr[] = {4,5,6};
auto tensor_from_arr = torch::tensor(arr, torch::dtype(torch::kInt32));

//std::vector创建,适合动态数据
std::vector<float> vec = {1.1f, 2.2f, 3.3f};
auto tensor_from_vec = torch::tensor(vec, torch::dtype(torch::kFloat32));

//指定设备(GPU,需GPU版LibTorch)
auto tensor_gpu = torch::tensor({1,2,3}, 
    torch::dtype(torch::kInt32).device(torch::kCUDA)
);

当然,如果不指定dtype,LibTorch 会自动推断:int 列表→kInt64,float 列表→kFloat32

如果数据量极大(如 100 万元素),torch::tensor的拷贝会非常耗时,此时用torch::from_blob也就是浅拷贝(共享内存),但需注意原数据的生命周期否则原数据释放,会导致张量野指针。

三、常用接口

接口 适用场景 数据来源
torch::tensor 从已有 C++ 数据创建张量 原生数据(拷贝)
torch::randn 初始化权重(正态分布) 无(生成随机数)
torch::zeros 初始化偏置、全零矩阵 无(生成 0)
torch::ones 生成全 1 张量 无(生成 1)

补充:

张量的内存布局

连续张量的步长满足stride[i] = stride[i+1] * size[i+1],可通过is_contiguous()判断;张量转置后会变成非连续张量,而view操作要求张量内存连续,因此转置后用view会报错,需先调用contiguous()(触发数据拷贝)转为连续张量。

张量的设备迁移

LibTorch 张量默认在 CPU,迁移到 GPU 用tensor.to(torch::kCUDA),转回 CPU 用tensor.to(torch::kCPU);核心考点是不同设备的张量无法直接运算,必须先统一设备,否则会报错。

张量的数据类型转换

不同数据类型(如 int、float)的张量无法直接运算,会触发类型错误;转换可使用通用方法tensor.to(torch::kFloat32),或快捷方法tensor.float()/tensor.int(),运算前需先统一类型。

张量的形状操作

view仅支持连续张量,仅修改维度描述无数据拷贝;reshape更灵活,非连续时会自动转连续再改形状(可能拷贝)。squeeze压缩尺寸为 1 的维度,unsqueeze扩展维度(如 1D 张量转 2D 可用unsqueeze(0))。

相关推荐
小刘的大模型笔记2 小时前
POP原理落地到实际微调
数据库·人工智能·深度学习·算法·机器学习
Yaozh、2 小时前
【word2vec模型】两种模型结构CBOW和Skip-gram的具体过程
人工智能·深度学习·神经网络·自然语言处理·nlp·word2vec
byzh_rc2 小时前
[深度学习网络从入门到入土] 使用块的网络VGG
网络·人工智能·深度学习
七夜zippoe2 小时前
Scikit-learn高级实战:自定义评估器与流水线架构设计
python·机器学习·scikit-learn·mixin·baseestimator
3Bronze1Pyramid4 小时前
【RNAErnie 大模型】
人工智能·深度学习·算法
天云数据11 小时前
神经网络,人类表达的革命
人工智能·深度学习·神经网络·机器学习
独自归家的兔12 小时前
深度学习之 CNN:如何在图像数据的海洋中精准 “捕捞” 特征?
人工智能·深度学习·cnn
deephub13 小时前
RAG 文本分块:七种主流策略的原理与适用场景
人工智能·深度学习·大语言模型·rag·检索