龙良曲pytorch笔记14-33

一、张量数据类型

张量维度 含义
0维 标量
1维 向量
2维 矩阵
3维 时间序列数据 股价 文本数据 单张彩色图片(RGB)

例如,一个图像可以用三个字段表示:

(width, height, channel) = 3D

但是,在机器学习工作中,我们经常要处理不止一张图片或一篇文档------我们要处理一个集合。我们可能有10,000张郁金香的图片,这意味着,我们将用到4D张量:

(batch_size, width, height, channel) = 4D

在PyTorch中, torch.Tensor 是存储和变换数据的主要工具。Tensor 和NumPy的多维数组非常类似,但Tensor 提供GPU计算和自动求梯度等更多功能,使其更加适合深度学习。

显然string类型在pytorch没有对应的,可以使用one-hot编码

1,0\]代表狗 \[0,1\]代表猫

但是这种方式对于具有大量唯一类别值的字符串数据,one-hot编码可能会导致非常高的维度,从而显著增加内存消耗和计算成本。这在处理大规模数据集时尤其成问题。

因此我们可以使用Embedding的Word2vec或glove方法,后面详解。

二、pytorch类间的数据类型

即使同一个数据,但是放在不同的位置,类型仍然可能是不一样的

详细

https://gitee.com/mingren1314/torch-basic-function

相关推荐
Ginkgo_Lo14 分钟前
【LLM越狱】AI大模型DRA攻击解读与复现
人工智能·安全·ai·语言模型
凯子坚持 c22 分钟前
AI 赋能云端运维:基于 MCP 协议深度集成 Codebuddy CLI 与腾讯云 Lighthouse 的实战全解
运维·人工智能·腾讯云·腾讯轻量云ai创想家
胖达不服输22 分钟前
「日拱一码」087 机器学习——SPARROW
人工智能·python·机器学习·sparrow
The_Second_Coming27 分钟前
容器应用学习笔记:containerd 篇
运维·笔记·学习·容器·containerd
minhuan1 小时前
构建AI智能体:三十一、AI医疗场景实践:医学知识精准问答+临床智能辅助决策CDSS
人工智能·医学知识问答·临床辅助决策·cdss·医学模型
大千AI助手1 小时前
线性预热机制(Linear Warmup):深度学习训练稳定性的关键策略
人工智能·深度学习·大模型·模型训练·学习率·warmup·线性预热机制
七牛云行业应用1 小时前
企业级AI大模型选型指南:从评估部署到安全实践
大数据·人工智能·安全
진영_1 小时前
深度学习打卡第N6周:中文文本分类-Pytorch实现
人工智能·深度学习
龙亘川1 小时前
智慧城市SaaS平台之智慧城管十大核心功能(六):业务指导系统
人工智能·智慧城市
龙亘川1 小时前
智慧城市SaaS平台之智慧城管十大核心功能(七):后台支撑系统
服务器·人工智能·系统架构·智慧城市·运维开发·智慧城市saas平台