LibTorch张量基础

一、代码中的张量类型

张量类型 代码定义逻辑 维度本质(直观理解) 实际应用场景举例
1D int 张量 torch::tensor({1,2,...10}, torch::kInt32) 一维向量(长度 10) 标签数组、单维度特征
2D float 张量 torch::randn({4,512}, torch::kFloat32) 二维矩阵(4 行 512 列) 4 个样本,每个样本 512 维特征
3D float 张量 torch::randn({8,4,64}, torch::kFloat32) 三维张量(8 个 4×64 的矩阵) 8 个批次,每个批次 4×64 的特征图

1D的张量 步长也是stride={1}

2D张量 步长为{列数,1}

3D张量 步长为{行×列,列,1}

二、函数签名

复制代码
torch::Tensor torch::tensor(
    const c10::ArrayRef<T>& data,//数据源
    const torch::TensorOptions& options = {}//张量配置
);

使用的场景如下:

复制代码
//1D
auto tensor_1d = torch::tensor({1,2,3}, torch::dtype(torch::kInt32));

//从数组创建
int arr[] = {4,5,6};
auto tensor_from_arr = torch::tensor(arr, torch::dtype(torch::kInt32));

//std::vector创建,适合动态数据
std::vector<float> vec = {1.1f, 2.2f, 3.3f};
auto tensor_from_vec = torch::tensor(vec, torch::dtype(torch::kFloat32));

//指定设备(GPU,需GPU版LibTorch)
auto tensor_gpu = torch::tensor({1,2,3}, 
    torch::dtype(torch::kInt32).device(torch::kCUDA)
);

当然,如果不指定dtype,LibTorch 会自动推断:int 列表→kInt64,float 列表→kFloat32

如果数据量极大(如 100 万元素),torch::tensor的拷贝会非常耗时,此时用torch::from_blob也就是浅拷贝(共享内存),但需注意原数据的生命周期否则原数据释放,会导致张量野指针。

三、常用接口

接口 适用场景 数据来源
torch::tensor 从已有 C++ 数据创建张量 原生数据(拷贝)
torch::randn 初始化权重(正态分布) 无(生成随机数)
torch::zeros 初始化偏置、全零矩阵 无(生成 0)
torch::ones 生成全 1 张量 无(生成 1)

补充:

张量的内存布局

连续张量的步长满足stride[i] = stride[i+1] * size[i+1],可通过is_contiguous()判断;张量转置后会变成非连续张量,而view操作要求张量内存连续,因此转置后用view会报错,需先调用contiguous()(触发数据拷贝)转为连续张量。

张量的设备迁移

LibTorch 张量默认在 CPU,迁移到 GPU 用tensor.to(torch::kCUDA),转回 CPU 用tensor.to(torch::kCPU);核心考点是不同设备的张量无法直接运算,必须先统一设备,否则会报错。

张量的数据类型转换

不同数据类型(如 int、float)的张量无法直接运算,会触发类型错误;转换可使用通用方法tensor.to(torch::kFloat32),或快捷方法tensor.float()/tensor.int(),运算前需先统一类型。

张量的形状操作

view仅支持连续张量,仅修改维度描述无数据拷贝;reshape更灵活,非连续时会自动转连续再改形状(可能拷贝)。squeeze压缩尺寸为 1 的维度,unsqueeze扩展维度(如 1D 张量转 2D 可用unsqueeze(0))。

相关推荐
极光代码工作室7 小时前
基于NLP的论文关键词提取系统
python·深度学习·自然语言处理·nlp
刘大猫.7 小时前
宇树科技回应联合英伟达开发“H2+”人形机器人,预计今年下半年正式亮相
人工智能·科技·机器学习·ai·chatgpt·机器人·大模型
Hali_Botebie7 小时前
变分推断(Variational Inference, VI)数学角度,以及结合神经网络的形式
人工智能·神经网络·机器学习
lqqjuly7 小时前
一致性模型深度解析
人工智能·深度学习·算法
SilentSamsara7 小时前
特征工程系统方法论:编码、分箱、交互特征与特征选择
开发语言·人工智能·python·机器学习·青少年编程·信息可视化·pandas
ZHW_AI课题组7 小时前
腾讯云驾车路线规划实现 —— 从 API 调用到代码解析的深度实践
人工智能·机器学习·信息可视化
哈伦20198 小时前
第十二章 深度学习基础 案例:CNN分析K线图来评估股票价格趋势
深度学习·cnn·k线图
张飞飞飞飞飞8 小时前
多模态目标检测-LLVIP数据集处理(清洗+YOLO格式)
人工智能·深度学习·目标检测
暖阳华笺8 小时前
【高频考点】K-Means聚类算法
c++·算法·机器学习·kmeans·聚类
lqqjuly8 小时前
FlashAttention 深度解析
人工智能·深度学习·算法