PyTorch torch.ones()张量创建详解

在深度学习中，我们经常需要初始化各种形状的张量（Tensor）。

有时，这些张量的初始值是固定的，比如全零或全一矩阵。

在 PyTorch 中，torch.ones() 就是一个用于创建所有元素都为 1 的张量 的高效函数。

本文将深入介绍它的用法、参数、返回值和常见应用场景。

文章目录

- [一、`torch.ones()` 是什么？](#一、torch.ones() 是什么？)
- 二、函数语法
- 三、参数说明
- 四、基本用法示例
- - [🎯 示例 1：创建一个 2×3 的全 1 张量](#🎯 示例 1：创建一个 2×3 的全 1 张量)
  - [🎯 示例 2：指定数据类型和设备](#🎯 示例 2：指定数据类型和设备)
  - [🎯 示例 3：创建 GPU 上的张量](#🎯 示例 3：创建 GPU 上的张量)
  - [🎯 示例 4：设置 `requires_grad=True`](#🎯 示例 4：设置 requires_grad=True)
- [五、创建不同维度的全 1 张量](#五、创建不同维度的全 1 张量)
- 六、与其他张量创建函数的对比
- [七、基于现有张量创建全 1 张量](#七、基于现有张量创建全 1 张量)
- - [🎯 torch.ones_like()示例：](#🎯 torch.ones_like()示例：)
- 八、常见应用场景
- [⚠️ 九、注意事项](#⚠️ 九、注意事项)
- [📚 参考资料](#📚 参考资料)

一、`torch.ones()` 是什么？

torch.ones() 是 PyTorch 中的张量创建函数之一，用于生成一个指定形状、全部元素为 1 的张量。

它常用于：

初始化权重矩阵
占位符（placeholder）张量
模型调试与测试
掩码（mask）或逻辑矩阵构造

二、函数语法

python 复制代码

torch.ones(size, *, out=None, dtype=None, layout=torch.strided, device=None, requires_grad=False)

三、参数说明

参数	类型	说明
`size`	`tuple` 或 `int`	张量的形状（如 `(2, 3)`）
`out`	`Tensor`	可选参数，用于输出结果的张量
`dtype`	`torch.dtype`	数据类型（如 `torch.float32`、`torch.int64`）
`layout`	`torch.layout`	内存布局（一般使用默认值 `torch.strided`）
`device`	`torch.device`	张量所在设备（如 `'cpu'` 或 `'cuda'`）
`requires_grad`	`bool`	是否需要计算梯度（用于自动求导）

四、基本用法示例

🎯 示例 1：创建一个 2×3 的全 1 张量

python 复制代码

import torch

x = torch.ones(2, 3)
print(x)

输出：

plain 复制代码

tensor([[1., 1., 1.],
        [1., 1., 1.]])

🎯 示例 2：指定数据类型和设备

python 复制代码

x = torch.ones((2, 3), dtype=torch.int32, device='cpu')
print(x)
print(x.dtype)

输出：

plain 复制代码

tensor([[1, 1, 1],
        [1, 1, 1]], dtype=torch.int32)
torch.int32

🎯 示例 3：创建 GPU 上的张量

python 复制代码

x = torch.ones((3, 3), device='cuda')
print(x)
print(x.device)

输出（若有 GPU）：

plain 复制代码

tensor([[1., 1., 1.],
        [1., 1., 1.],
        [1., 1., 1.]], device='cuda:0')

🎯 示例 4：设置 `requires_grad=True`

当你希望张量参与梯度计算（例如模型参数）时：

python 复制代码

x = torch.ones((2, 2), requires_grad=True)
print(x)

输出：

plain 复制代码

tensor([[1., 1.],
        [1., 1.]], requires_grad=True)

此时，PyTorch 会追踪该张量的计算图，用于反向传播。

五、创建不同维度的全 1 张量

维度	调用方式	输出形状
一维	`torch.ones(5)`	`[5]`
二维	`torch.ones(2, 3)`	`[2, 3]`
三维	`torch.ones(2, 3, 4)`	`[2, 3, 4]`
四维	`torch.ones(2, 3, 4, 5)`	`[2, 3, 4, 5]`

示例：

python 复制代码

x = torch.ones(2, 3, 4)
print(x.shape)

输出：

plain 复制代码

torch.Size([2, 3, 4])

六、与其他张量创建函数的对比

函数	功能	示例
`torch.ones()`	创建全 1 张量	`torch.ones(2,3)`
`torch.zeros()`	创建全 0 张量	`torch.zeros(2,3)`
`torch.full()`	创建固定值张量	`torch.full((2,3), 5)`
`torch.eye()`	创建单位矩阵	`torch.eye(3)`
`torch.rand()`	创建随机张量（0~1）	`torch.rand(2,3)`

七、基于现有张量创建全 1 张量

有时我们希望创建一个与现有张量形状相同的全 1 张量。

这时可以使用 torch.ones_like()。

🎯 torch.ones_like()示例：

python 复制代码

a = torch.randn(2, 3)
b = torch.ones_like(a)

print(a)
print(b)

输出：

plain 复制代码

tensor([[-0.5,  0.3,  1.2],
        [ 0.8, -1.0,  0.4]])
tensor([[1., 1., 1.],
        [1., 1., 1.]])

👉 ones_like() 会自动匹配原张量的形状、数据类型与设备。

八、常见应用场景

初始化权重或偏置

在模型定义中，可以使用 torch.ones() 初始化权重或偏置，方便调试：

python 复制代码

w = torch.ones((3, 3), requires_grad=True)
b = torch.ones(3)

逻辑掩码（Mask）

在需要构造全 1 掩码的场景中（如注意力机制、序列填充）：

python 复制代码

mask = torch.ones((4, 5))
masked_tensor = some_tensor * mask

模型测试或占位

在模型推理（inference）或测试阶段，使用全 1 张量作为输入占位：

python 复制代码

dummy_input = torch.ones((1, 3, 224, 224))
output = model(dummy_input)

⚠️ 九、注意事项

数据类型默认是 torch.float32，若需整数张量需手动指定 dtype。
torch.ones() 创建的是新的张量，与已有张量无关联。
若在 GPU 上创建张量，确保设置 device='cuda'，否则仍会在 CPU 上。
对需要求导的张量，必须设置 requires_grad=True。

📚 参考资料

PyTorch 官方文档 -- torch.ones

PyTorch 张量创建函数汇总

PyTorch torch.ones()张量创建详解

文章目录

一、torch.ones() 是什么？

二、函数语法

三、参数说明

四、基本用法示例

🎯 示例 1：创建一个 2×3 的全 1 张量

🎯 示例 2：指定数据类型和设备

🎯 示例 3：创建 GPU 上的张量

🎯 示例 4：设置 requires_grad=True

五、创建不同维度的全 1 张量

六、与其他张量创建函数的对比

七、基于现有张量创建全 1 张量

🎯 torch.ones_like()示例：

八、常见应用场景

初始化权重或偏置

逻辑掩码（Mask）

模型测试或占位

⚠️ 九、注意事项

📚 参考资料

一、`torch.ones()` 是什么？

🎯 示例 4：设置 `requires_grad=True`