【Pytorch笔记】1. tensor的创建

参考视频:
深度之眼官方账号:01-02-张量简介与创建

torch.tensor()

python 复制代码
b = torch.tensor(data, 
				 dtype=None, 
				 device=None, 
				 requires_grad=False, 
				 pin_memory=False)

data:创建的tensor的数据来源,可以是list或numpy

dtype:数据类型,默认与data一致

device:所选设备,cuda/cpu

requires_grad:是否需要梯度

pin_memory:是否存在锁页内存(与转换效率有关,通常设置为False)

python 复制代码
import numpy as np
import torch

arr = np.ones((3, 3))
print("ndarray的数据类型:", arr.dtype)
t = torch.tensor(arr)
# t = torch.tensor(arr, device='cuda')
print(t)

输出:

python 复制代码
ndarray的数据类型: float64
tensor([[1., 1., 1.],
        [1., 1., 1.],
        [1., 1., 1.]], dtype=torch.float64)

torch.from_numpy(ndarray)

功能:从numpy创建tensor
注意:从torch.from_numpy创建的tensor与原ndarray共享内存,当修改其中一个的数据,另一个也会被改动。

python 复制代码
import numpy as np
import torch

arr = np.array([[1, 2, 3], [4, 5, 6]])
t = torch.from_numpy(arr)
print(t)
arr[0, 0] = 7
print(t)

输出:

python 复制代码
tensor([[1, 2, 3],
        [4, 5, 6]], dtype=torch.int32)
tensor([[7, 2, 3],
        [4, 5, 6]], dtype=torch.int32)

torch.zeros()

功能:根据给定size创建全0的tensor

python 复制代码
torch.zeros(*size, 
            out=None, 
            dtype=None, 
            layout=torch.strided, 
            device=None, 
            requires_grad=False)

*size:创建的tensor的尺寸

out:输出到哪个tensor当中

dtype:创建的tensor中内容的类型

layout:tensor在内存中的分布方式,目前支持torch.stridedtorch.sparse_coo

device:所在设备,gpu/cpu

requires_grad:是否需要梯度

python 复制代码
import torch

t = torch.zeros((3, 3))     #不使用out参数创建
tt = torch.tensor([2.])
torch.zeros((3, 3), out=tt) #使用out参数输出到已有tensor
print(t, '\n', tt)

输出:

python 复制代码
tensor([[0., 0., 0.],
        [0., 0., 0.],
        [0., 0., 0.]])
 tensor([[0., 0., 0.],
        [0., 0., 0.],
        [0., 0., 0.]])

有一点需要注意,如果像这样使用:

python 复制代码
t = torch.tensor([2.])
p = torch.zeros((3, 3), out=t)

那么tp会指向同一个地址。

torch.zeros_like()

功能:根据input的形状创建全0的tensor。

python 复制代码
torch.zeros_like(input,
                 dtype=None,
                 layout=None,
                 device=None,
                 requires_grad=False)

input:创建新的tensor所用的形状的基准,生成的tensor和input的形状相同。
:input只能为tensor,不能是np.array。

其余参数和torch.zeros()相同。

python 复制代码
import numpy as np
import torch

data = torch.tensor(np.array([[1, 2], [3, 4]]))
t = torch.zeros_like(data)
print(t)

输出:

python 复制代码
tensor([[0, 0],
        [0, 0]], dtype=torch.int32)

torch.ones()

功能:根据给定size创建全1的tensor,与torch.zeros()基本一样。

python 复制代码
torch.ones(*size, 
           out=None,
           dtype=None,
           layout=torch.strided,
           device=None,
           requires_grad=False)

torch.ones_like()

功能:根据input的形状创建全1的tensor,与torch.zeros_like()基本一样。

python 复制代码
torch.ones_like(input, 
           dtype=None,
           layout=None,
           device=None,
           requires_grad=False)

torch.full()

功能:根据给定size创建tensor,元素全部赋值为fill_value。

python 复制代码
torch.full(size,
           fill_value,
           out=None,
           dtype=None,
           layout=torch.strided,
           device=None,
           requires_grad=False)

fill_value:传入的参数,full()将创建好的tensor全部赋值为fill_value。

python 复制代码
import numpy as np
import torch

t = torch.full(size=(3, 3), fill_value=4)
print(t)

输出:

python 复制代码
tensor([[4, 4, 4],
        [4, 4, 4],
        [4, 4, 4]])

torch.arange()

功能:创建等差的一维tensor。

python 复制代码
torch.arange(start=0,
             end,
             step=1,
             out=None,
             dtype=None,
             layout=torch.strided,
             device=None,
             requires_grad=False)

范围是[start, end),左闭右开的,step为步长。其他的参数与上面的函数一样。

python 复制代码
import numpy as np
import torch

t = torch.arange(start=3, end=6, step=1)
print(t)

输出:

python 复制代码
tensor([3, 4, 5])

torch.linspace()

功能:创建均分的1维tensor。

linspace: Linear space,类比下面的logspace。

python 复制代码
torch.linspace(start=0,
               end,
               steps=100,
               out=None,
               dtype=None,
               layout=torch.strided,
               device=None,
               requires_grad=False)

范围是[start, end],是闭区间(和arange不同)。steps为生成的tensor的长度。

python 复制代码
import numpy as np
import torch

t = torch.linspace(start=2, end=10, steps=4)
print(t)

输出:

python 复制代码
tensor([ 2.0000,  4.6667,  7.3333, 10.0000])

torch.logspace()

功能:创建对数均分的1维tensor。

logspace: Log space,类比上面的linspace。

python 复制代码
torch.logspace(start,
               end,
               steps=100,
               base=10.0,
               out=None,
               dtype=None,
               layout=torch.strided,
               device=None,
               requires_grad=False)

start、end、steps与linspace相同。base指对数函数的底,默认为10。

和linspace不同的是,我们通过start, end, steps枚举出来的数列,是tensor的内容外面要套一个 l o g b a s e log_{base} logbase。反过来讲,我们枚举的就是以base为底的那些幂数。

可以参考下面的代码:

python 复制代码
import numpy as np
import torch

t = torch.logspace(start=1, end=3, steps=3, base=10.0)
print(t)

输出:

python 复制代码
tensor([  10.,  100., 1000.])

torch.eye()

功能:创建单位对角矩阵,是2维tensor。默认为方阵

python 复制代码
torch.eye(n,
          m=None,
          out=None,
          dtype=None,
          layout=torch.strided,
          device=None,
          requires_grad=False)

n、m:矩阵行数、列数。通常我们只需要设置n。

python 复制代码
import numpy as np
import torch

t = torch.eye(n=3)
p = torch.eye(n=3, m=4)
print(t)
print(p)

输出:

python 复制代码
tensor([[1., 0., 0.],
        [0., 1., 0.],
        [0., 0., 1.]])
tensor([[1., 0., 0., 0.],
        [0., 1., 0., 0.],
        [0., 0., 1., 0.]])

torch.normal()

功能:根据给定的均值 μ \mu μ和标准差 σ \sigma σ,通过 N ( μ , σ ) N(\mu,\sigma) N(μ,σ)生成对应尺寸的随机数(具体如何对应尺寸,下面会有说明)。

python 复制代码
torch.normal(mean,
             std,
             out=None)

mean:均值;std:标准差。

均值和标准差的类型,既可以是float,也可以是tensor。此时出现了4种情况,先看示例代码。

python 复制代码
import numpy as np
import torch

t1 = torch.normal(mean=2, std=3, size=(2, 3))
print("t1:\n", t1)
t2 = torch.normal(mean=torch.arange(1., 3.), std=torch.arange(3., 5.))
print("t2:\n", t2)
t3 = torch.normal(mean=1., std=torch.arange(1., 5.))
print("t3:\n", t3)
t4 = torch.normal(mean=torch.arange(1., 4.), std=2.)
print("t4:\n", t4)

输出:

python 复制代码
t1:
 tensor([[-0.1495,  0.2061,  3.0486],
        [ 6.1257,  1.6023,  1.1515]])
t2:
 tensor([-5.4967,  7.4201])
t3:
 tensor([ 3.3218,  0.7347, -3.6644,  3.4812])
t4:
 tensor([2.2250, 1.1026, 0.9171])

mean和std都是float

见示例代码中t1。

此时我们必须要再加一个参数size,表示我们要生成的tensor的尺寸。生成的t1中每一个元素都是由 N ( m e a n , s t d ) N(mean,std) N(mean,std)生成的一个随机数。

mean和std都是tensor

见示例代码中t2。

经过尝试,需要mean和std的shape相同,这样生成的tensor的对应位置就是由mean和std中对应位置的均值和标准差随机出来的数。

mean是float,std是tensor

见示例代码中t3。

生成的tensor和std的shape相同,对应的位置是由mean、std中的对应位置的标准差随机出来的数。

mean是tensor,std是float

见示例代码中t4。

生成的tensor和mean的shape相同,对应的位置是由mean中的对应位置的均值、std随机出来的数。

torch.randn()

功能:生成标准正态分布 N ( 0 , 1 ) N(0,1) N(0,1)。

python 复制代码
torch.randn(*size, 
            out=None,
            dtype=None,
            layout=torch.strided,
            device=None,
            requires_grad=False)
python 复制代码
import numpy as np
import torch

t = torch.randn((2, 3))
print(t)

输出:

python 复制代码
tensor([[ 0.2370, -1.4351, -0.0624],
        [ 0.7974,  1.2915, -1.0052]])

torch.randn_like()

功能:生成与给定tensor同样尺寸的标准正态分布tensor。(类比torch.zeros_like()和torch.ones_like())

python 复制代码
import numpy as np
import torch

tmp = torch.ones((2, 3))
t = torch.randn_like(tmp)
print(t)

输出:

python 复制代码
tensor([[-0.3384, -0.8061,  0.7020],
        [ 0.1602,  0.6525, -0.6860]])

torch.rand()、torch.rand_like()

功能:在区间[0,1)上生成均匀分布,示例略。

torch.randint()、torch.randint_like()

功能:在区间[low, high)生成整数均匀分布。

torch.randperm()

功能:生成从0到n-1的随机排列,n是张量的长度。

python 复制代码
torch.randperm(n,
               out=None,
               dtype=torch.int64,
               layout=torch.strided,
               device=None,
               requires_grad=False)
python 复制代码
import numpy as np
import torch

t = torch.randperm(5)
print(t)

输出:

python 复制代码
tensor([3, 2, 1, 0, 4])

torch.bernoulli()

功能:以input为概率,生成伯努利分布(0-1分布,两点分布)

python 复制代码
torch.bernoulli(input,
                *,
                generator=None,
                ont=None)

input为概率值,为tensor。

python 复制代码
import numpy as np
import torch

p = torch.rand((3, 3))
t = torch.bernoulli(p)
print("p:\n", p)
print("t:\n", t)

输出:

python 复制代码
p:
 tensor([[0.6881, 0.7921, 0.4212],
        [0.6857, 0.4809, 0.4009],
        [0.2400, 0.5160, 0.1303]])
t:
 tensor([[1., 1., 1.],
        [1., 1., 0.],
        [0., 0., 0.]])
相关推荐
IE062 分钟前
深度学习系列76:流式tts的一个简单实现
人工智能·深度学习
GIS数据转换器6 分钟前
城市生命线安全保障:技术应用与策略创新
大数据·人工智能·安全·3d·智慧城市
一水鉴天1 小时前
为AI聊天工具添加一个知识系统 之65 详细设计 之6 变形机器人及伺服跟随
人工智能
雁于飞2 小时前
c语言贪吃蛇(极简版,基本能玩)
c语言·开发语言·笔记·学习·其他·课程设计·大作业
梅见十柒2 小时前
计算机系统原理:一些断言
经验分享·笔记
青椒大仙KI113 小时前
25/1/21 算法笔记<ROS2> 服务通信,参数
笔记
井底哇哇7 小时前
ChatGPT是强人工智能吗?
人工智能·chatgpt
Coovally AI模型快速验证7 小时前
MMYOLO:打破单一模式限制,多模态目标检测的革命性突破!
人工智能·算法·yolo·目标检测·机器学习·计算机视觉·目标跟踪
AI浩8 小时前
【面试总结】FFN(前馈神经网络)在Transformer模型中先升维再降维的原因
人工智能·深度学习·计算机视觉·transformer
可为测控8 小时前
图像处理基础(4):高斯滤波器详解
人工智能·算法·计算机视觉