无脑入门pytorch系列(二)—— torch.mean

本系列教程适用于没有任何pytorch的同学(简单的python语法还是要的),从代码的表层出发挖掘代码的深层含义,理解具体的意思和内涵。pytorch的很多函数看着非常简单,但是其中包含了很多内容,不了解其中的意思就只能【看懂代码】,无法【理解代码】。

目录

官方定义

顾名思义,torch.mean返回输入张量中所有元素的平均值:

复制代码
def mean(input: Tensor, dim: Sequence[Union[str, ellipsis, None]], keepdim: _bool=False, *, dtype: Optional[_dtype]=None, out: Optional[Tensor]=None) -> Tensor:

上述的源码的定义,看起来参数十分多,但实际只需要记住下面几个参数:

  • input,输出是一个张量(tensor),注意如果不是tensor可以通过torch.tensor转换为tensor
  • dim,取平均值的维度,默认值是对tensor里的所有元素取平均值
  • keepdim,即保留张量的维度,因为取平均值后肯定是降维的,但是keepdim=True可以使得输出张量的维度与输入张量保持一致

官方的文档如下,torch.mean

demo

看下面一个例子:

python 复制代码
matrix = [[1, 2, 3],
          [4, 5, 6],
          [7, 8, 9]]

tensor = torch.tensor(matrix)
print(tensor)

输出的结果:

直接求mean:

复制代码
torch.mean(tensor)

出现错误:RuntimeError: mean(): could not infer output dtype. Input dtype must be either a floating point or complex dtype. Got: Long

意思是mean(),只能接受浮点数或复数类型的张量作为输入,所以先将tensor转化为float:

复制代码
tensor = tensor.float()

不配置任何参数

直接使用torch.mean():

复制代码
torch.mean(tensor)

输出的结果正好是1+2+...+9的平均值是5,所以如果不设置任何参数,那么默认取各个维度的平均值

设置按维度求平均

维度0:

复制代码
torch.mean(tensor, dim=0)

可以理解为矩阵按求平均值。

维度0:

复制代码
torch.mean(tensor, dim=0)

可以理解为矩阵按求平均值。

设置keepdim=True

复制代码
torch.mean(tensor, dim=0, keepdim=True)

其实就是在torch.mean(tensor, dim=0)的基础上,输出的一位张量上加上一对[]从而变为二维张量。

因为之前是按列求和,所以最后压缩为一行,然后补充行。

复制代码
torch.mean(tensor, dim=1, keepdim=True)

而dim=1是按行计算平均值,最后压缩的是列。

总结

torch.mean是个比较简单的函数,但是需要明白以下两点:

  • 第二个参数dim,决定了按哪个维度进行计算
  • 第三个参数keepdim,可以将输出张量的维度与输入张量保持一致
相关推荐
旧故新长4 分钟前
支持Function Call的本地ollama模型对比评测-》开发代理agent
人工智能·深度学习·机器学习
明月与玄武12 分钟前
Python编程的真谛:超越语法,理解编程本质
python·编程语言
CodeCraft Studio14 分钟前
Excel处理控件Aspose.Cells教程:使用 Python 在 Excel 中进行数据验
开发语言·python·excel
微学AI16 分钟前
融合注意力机制和BiGRU的电力领域发电量预测项目研究,并给出相关代码
人工智能·深度学习·自然语言处理·注意力机制·bigru
知来者逆28 分钟前
计算机视觉——速度与精度的完美结合的实时目标检测算法RF-DETR详解
图像处理·人工智能·深度学习·算法·目标检测·计算机视觉·rf-detr
一勺汤31 分钟前
YOLOv11改进-双Backbone架构:利用双backbone提高yolo11目标检测的精度
人工智能·yolo·双backbone·double backbone·yolo11 backbone·yolo 双backbone
武汉唯众智创33 分钟前
高职人工智能技术应用专业(计算机视觉方向)实训室解决方案
人工智能·计算机视觉·人工智能实训室·计算机视觉实训室·人工智能计算机视觉实训室
Johny_Zhao44 分钟前
MySQL 高可用集群搭建部署
linux·人工智能·mysql·信息安全·云计算·shell·yum源·系统运维·itsm
拾忆-eleven1 小时前
C语言实战:用Pygame打造高难度水果消消乐游戏
c语言·python·pygame
一只可爱的小猴子1 小时前
2022李宏毅老师机器学习课程笔记
人工智能·笔记·机器学习