龙良曲pytorch笔记14-33

一、张量数据类型

张量维度 含义
0维 标量
1维 向量
2维 矩阵
3维 时间序列数据 股价 文本数据 单张彩色图片(RGB)

例如,一个图像可以用三个字段表示:

(width, height, channel) = 3D

但是,在机器学习工作中,我们经常要处理不止一张图片或一篇文档------我们要处理一个集合。我们可能有10,000张郁金香的图片,这意味着,我们将用到4D张量:

(batch_size, width, height, channel) = 4D

在PyTorch中, torch.Tensor 是存储和变换数据的主要工具。Tensor 和NumPy的多维数组非常类似,但Tensor 提供GPU计算和自动求梯度等更多功能,使其更加适合深度学习。

显然string类型在pytorch没有对应的,可以使用one-hot编码

1,0\]代表狗 \[0,1\]代表猫

但是这种方式对于具有大量唯一类别值的字符串数据,one-hot编码可能会导致非常高的维度,从而显著增加内存消耗和计算成本。这在处理大规模数据集时尤其成问题。

因此我们可以使用Embedding的Word2vec或glove方法,后面详解。

二、pytorch类间的数据类型

即使同一个数据,但是放在不同的位置,类型仍然可能是不一样的

详细

https://gitee.com/mingren1314/torch-basic-function

相关推荐
机器之心1 分钟前
AI发布首个全球科学家社区爆火,硅谷投资圈:科技研究领域的「谷歌地图」来了!
人工智能·openai
ECH00O008 分钟前
06-Attention/注意力机制:AI的"聚光灯"
人工智能
机器之心16 分钟前
1美元Token撬动4800美元收益!AI挑战百万美元级基准,最赚钱的Agent出现了
人工智能·openai
ECH00O0030 分钟前
05-Transformer:AI界的"变形金刚"
人工智能
非优秀程序员35 分钟前
推荐五个OPENclaw 可以应用的场景,让你明白他能干怎么
人工智能·架构·浏览器
孟祥_成都1 小时前
Cursor 要被淘汰了?开发者最应该关注的 10 个信号
前端·人工智能
非优秀程序员1 小时前
OpenClaw 2026 最新功能全解析:Gemini、PDF 原生到安全强化完整拆解
人工智能·开源·产品经理
非优秀程序员1 小时前
OpenClaw 教学:25 个工具 + 53 个技能完整指南
人工智能·开源·全栈
Ray Liang2 小时前
一小时手搓轻量级可代替 Qdrant 的向量数据库
人工智能·架构设计·mindx·qrant
aircrushin2 小时前
国产大模型全球逆袭的技术与商业逻辑
人工智能