pytorch张量数据类型

python常用数据类型在pytorch中的对应

python PyTorch
Int IntTensor of size()
float FloatTensor of size()
Int array IntTensor of size d1, d2,...
float array FloatTensor of sized1, d2,...
string - -

pytorch不是一个完备的语言库,而是一个面向数据计算的GPU加速库,对str字符类型没有直接支持的对应数据类型。

复制代码
在免不了要处理str的情况下,那要如何表达str呢
	1、One-hot
		[0,1,0,0,...]
		如表达猫狗两类别
	2、Embedding(NLP):
		Word2vec
		glove

torch常用内置数据类型

数据类型推断

复制代码
a为二维tensor数据,随机初始化两行三列数据
a.type() 返回一个字符串告诉a,其tensor的类型
type(a) 返回a的数据类型
isinstance(a,某tensor数据类型) 参数合法化检验,如果a跟该tensor数据类型一致,返回True

注:CPU和GPU的tensor不是同一类型,可以使用.cuda(),a.cuda()可以返回一个gpu上的引用

标量

标量是最简单的数据类型,dim为0

在python中直接表示为1.0、1.3,pytorch中的表示为:

复制代码
torch.tensor(1.)
torch.tensor(1.3)
注:1.3是0维,但[1.3]是一维,长度为1的tensor

标量的shape:

复制代码
a = torch.tensor(2.2)
a.shape 或者 a.size()
# 因为a是一个标量,会返回一个空的list类型的size
len(a.shape) 或者用 a.dim()
# 结果都会返回0的大小

向量

在torch中都统一称为张量

dim = 1时

复制代码
torch.tensor([x1,x2,...])
#dim=1,张量长度可以为1,2,。。。

torch.FloatTensor(n)
#随机生成长度为n的一维张量

也可以从numpy引入
先通过numpy方法生成长度为n的向量
data = np.ones(n)
再使用 torch.from_numpy(data)引入
# 或者直接 torch.ones(2)

注: 主要用在 1、Bias,2、batch为1,dim为1.图片打平后的线性输入。

dim = 2时

复制代码
随机初始化一个两行三列张量a
a = torch.randn(2,3)

a的尺寸:
a.shape
a.size()

具体看某一维度大小
a.shape[0] / a.shape[1]
a.size(0) / a.size(1)

dim = 3时

三维使用场景比较广泛,如 RNN语言处理

假如有5句话,每句话10个单词,batch设置每次处理8个单词

则输入为8,5,10

复制代码
a = torch.rand(1,2,3)
# 生成三维张量
a.shape
a.[0] # ->(2,3)
list(a.shape)
#将a的尺寸格式转化为python通用列表

dim = 4时

较广泛适用于图片数据处理,如CNN:b, c, h, w

a.dim()查询维度为4

a.numel()

#a占有内存的数量,2328*28

相关推荐
jimi112614 小时前
从零理解 Transformer
人工智能·深度学习·nlp
abcy07121314 小时前
sqlalchemy 原生sql判断条件是否为空,为空则跳过
开发语言·python
Ada's14 小时前
【解决方案设计】001:类型
人工智能
段一凡-华北理工大学14 小时前
工业领域的Hadoop架构学习~系列文章18:制造业Hadoop应用实践 - 从数据到智能的完整闭环
大数据·人工智能·hadoop·分布式·学习·架构·高炉炼铁
知识分享小能手14 小时前
数据预处理入门学习教程,从入门到精通, 实战演练——数据分析师岗位分析知识点详解(8)
python·学习·信息可视化
Wonderful U14 小时前
Python+Django实战:打造智能生鲜果蔬进销存管理系统(采购入库、库存预警、销售开单、毛利统计)
数据库·python·django
用户9385156350714 小时前
从模块化到 Prompt 工程:我用 Node.js + LLM 复刻了传统 NLP 的流程
javascript·人工智能·node.js
贵慜_Derek14 小时前
《从零实现 Agent 系统》连载 20|MCP 与 Code Execution:协议、档位与 Sidecar
人工智能·设计模式·架构
冬奇Lab14 小时前
AI Agent 找代码:多仓库多技术栈下的代码定位工程
人工智能·agent·代码规范
冬奇Lab14 小时前
每日一个开源项目 第124篇:last30days —— 洞察最近30天:跨越信息茧房的 AI Agent 搜索引擎
人工智能·搜索引擎·开源