龙良曲pytorch笔记14-33

一、张量数据类型

张量维度 含义
0维 标量
1维 向量
2维 矩阵
3维 时间序列数据 股价 文本数据 单张彩色图片(RGB)

例如,一个图像可以用三个字段表示:

(width, height, channel) = 3D

但是,在机器学习工作中,我们经常要处理不止一张图片或一篇文档------我们要处理一个集合。我们可能有10,000张郁金香的图片,这意味着,我们将用到4D张量:

(batch_size, width, height, channel) = 4D

在PyTorch中, torch.Tensor 是存储和变换数据的主要工具。Tensor 和NumPy的多维数组非常类似,但Tensor 提供GPU计算和自动求梯度等更多功能,使其更加适合深度学习。

显然string类型在pytorch没有对应的,可以使用one-hot编码

1,0\]代表狗 \[0,1\]代表猫

但是这种方式对于具有大量唯一类别值的字符串数据,one-hot编码可能会导致非常高的维度,从而显著增加内存消耗和计算成本。这在处理大规模数据集时尤其成问题。

因此我们可以使用Embedding的Word2vec或glove方法,后面详解。

二、pytorch类间的数据类型

即使同一个数据,但是放在不同的位置,类型仍然可能是不一样的

详细

https://gitee.com/mingren1314/torch-basic-function

相关推荐
Mr Sorry19 分钟前
Non-stationary Diffusion For Probabilistic Time Series Forecasting论文阅读笔记
论文阅读·笔记
dundunmm22 分钟前
【论文阅读】SIMBA: single-cell embedding along with features(2)
论文阅读·人工智能·embedding·生物信息·单细胞·多组学·细胞类型识别
金井PRATHAMA44 分钟前
意象框架:连接感知与认知的统一信息结构分析——基于上古汉语同源词意义系统的词源学与认知语言学探索
人工智能·自然语言处理
聚客AI1 小时前
🧠深度解析模型压缩革命:减枝、量化、知识蒸馏
人工智能·深度学习·llm
南猿北者1 小时前
Cmake学习笔记
笔记·学习·策略模式
SHIPKING3931 小时前
【机器学习&深度学习】Ollama、vLLM、LMDeploy对比:选择适合你的 LLM 推理框架
人工智能·深度学习·机器学习
zzywxc7871 小时前
AI 行业应用:金融、医疗、教育、制造业领域的落地案例与技术实现
android·前端·人工智能·chrome·金融·rxjava
新智元1 小时前
刚刚,GPT-5 Pro 自证全新数学定理!OpenAI 总裁直呼颠覆,大佬们集体转发
人工智能·openai
新智元2 小时前
28 岁华人执掌 1.85 万亿科技巨头 AI 大权!一觉醒来,图灵奖得主也要向他汇报
人工智能·openai
居然JuRan2 小时前
从LoRA到QLoRA再到全量微调
人工智能