龙良曲pytorch笔记14-33

一、张量数据类型

张量维度 含义
0维 标量
1维 向量
2维 矩阵
3维 时间序列数据 股价 文本数据 单张彩色图片(RGB)

例如,一个图像可以用三个字段表示:

(width, height, channel) = 3D

但是,在机器学习工作中,我们经常要处理不止一张图片或一篇文档------我们要处理一个集合。我们可能有10,000张郁金香的图片,这意味着,我们将用到4D张量:

(batch_size, width, height, channel) = 4D

在PyTorch中, torch.Tensor 是存储和变换数据的主要工具。Tensor 和NumPy的多维数组非常类似,但Tensor 提供GPU计算和自动求梯度等更多功能,使其更加适合深度学习。

显然string类型在pytorch没有对应的,可以使用one-hot编码

1,0代表狗 0,1代表猫

但是这种方式对于具有大量唯一类别值的字符串数据,one-hot编码可能会导致非常高的维度,从而显著增加内存消耗和计算成本。这在处理大规模数据集时尤其成问题。

因此我们可以使用Embedding的Word2vec或glove方法,后面详解。

二、pytorch类间的数据类型

即使同一个数据,但是放在不同的位置,类型仍然可能是不一样的

详细

https://gitee.com/mingren1314/torch-basic-function

相关推荐
MacroZheng11 分钟前
斩获20w star!Claude Code最强插件,AI编程必备!
java·人工智能·后端
米小虾20 分钟前
从零实现SKILLHARNESS:让AI Agent学会安全地做事
人工智能·agent
IT_陈寒36 分钟前
Vite打包后的路径问题差点让我改了一天代码
前端·人工智能·后端
米小虾1 小时前
SKILLHARNESS:让AI Agent学会"安全地做事"
人工智能·agent
冬奇Lab13 小时前
每日一个开源项目(第140篇):AgentScope 2.0 - 阿里开源的生产级 Agent 框架
人工智能·开源·agent
冬奇Lab13 小时前
Skill 系列(04):Skill 指标体系——L1/L2/L3 三层监控,让质量下降有据可查
人工智能·开源·llm
IT_陈寒15 小时前
Vite的静态资源打包让我熬夜到三点,这坑千万别跳
前端·人工智能·后端
玩转AI不是事15 小时前
用IndexedDB做AI对话离线缓存实战
人工智能
Asize16 小时前
多模态生图:从 Vite 工程化到前端调用 Qwen Image
javascript·人工智能·后端
MobotStone16 小时前
AI项目越多,为什么越容易失控
人工智能·aigc