N——>BatchSize &&数据维度理解和处理(chun, cat, squeeze, unsqueeze)

数据处理之N------>BatchSize

N------>batch_size

py 复制代码
train_data = TensorDataset(torch.Tensor(x_train).double(), torch.Tensor(y_train).double())
train_loader = DataLoader(train_data, batch_size=args.bs, shuffle=True, drop_last=True)
for batch_idx, (inputs, results) in enumerate(train_data):
	print(inputs.shape, results.shape) 

不过我得说,train_loader局限于第一维,做的事如下代码:

py 复制代码
for i in range(0, num_samples, batch_size):
	batch = data[i:i + batch_size]
	yield batch

维度

  • 分块:iter.chunk(分成几块,dim)
  • 连接:torch.cat( tensor1, tensor2 (放在列表中),dim)
  • 升维1 / 降维1:squeeze(dim), unsqueeze(dim)

64, 32, 1, 541维度互换有影响吗?怎么去想这个事

数据本身并没有改变,只是数据在张量中的排列顺序发生了变化,也就是索引方式变了

例如,如果你将形状为5266, 32, 541, 1的张量的第3和第4维度交换,你得到的张量仍然包含相同的元素,但它们在张量中的排列方式不同,变成了形状为5266, 32, 1, 541的张量。这在某些情况下可能对特定的计算或模型操作更有用。
既然要求你按照什么样的维度去排列索引,而且你也知道每个数字代表的对应的是什么意思,你就直接按照他说的顺序去改就是了啊!

只要你给的数据的维度能对得上就没有任何问题,最主要的是首先要搞明白你需要几维的数据并搞明白每一维的意思 ,要对上,不然就会出现channel对到T上的尴尬问题。
s e q _ l e n seq\_len seq_len:序列长度
i n p u t _ s i z e input\_size input_size:序列的个体的维度

举一个例子,你的目的是要跑RNN,用RNNCELL,那么首先外部循环的肯定是seq_len,每次输入 b s , c h a n n e l , i n p u t _ s i z e bs, channel, input\\_size bs,channel,input_size的数据到model里面。

那么如果如果提供的数据是 5266 , 32 , 1 , 541 , N = 5266 5266, 32, 1, 541,N = 5266 5266,32,1,541,N=5266 s e q _ l e n = 32 , i n p u t _ s i z e = 541 , c h a n n e l = 1 seq\_len = 32, input\_size = 541, channel = 1 seq_len=32,input_size=541,channel=1

那么每一批次的维度比如是 128 , 32 , 1 , 541 128, 32, 1, 541 128,32,1,541

你的目标也就是得到每次的输入 128 , 1 , 541 128, 1, 541 128,1,541

按照第二个维度展开 ,即将第二个维度分成32个块------>pytorch带的chunk函数

用法:iter.chunk(要分的快数量,沿着哪个维度)

py 复制代码
seq.chunk(seq.size(1), dim = 1)#传入的是seq.size(1)即要分成每个为1的

然后得到: 128 , 1 , 1 , 541 128, 1, 1, 541 128,1,1,541

再使用seq.squeeze(1)

squeeze 函数有一个可选的参数,即 dim,它指定了要挤压的维度。如果指定 dim,则 squeeze

仅删除指定的维度,如果该维度大小为1。如果不指定 dim,则默认情况下会删除所有尺寸为1的维度。

没看懂的深浅拷贝,clone,copy etc.

https://www.jb51.net/article/201724.htm

相关推荐
半个落月41 分钟前
LLM如何预测下一个Token?一文拆解Transformer核心流程
人工智能
触底反弹41 分钟前
🔥 2026 年爆火的 Harness Engineering 到底是什么?从原理到实战一文讲透
javascript·人工智能·程序员
user44651179179141 分钟前
源码深读 XAgent:6 个 Agent 怎么分工?工具失败不崩、死循环怎么防?
人工智能
魏祖潇42 分钟前
SDD 完整指南——Spec 端打底、Story 端交付、留白区
人工智能·后端
常丛丛42 分钟前
5.9 式输出:实时查看 LangGraph Agent 思考过程
人工智能
Token炼金师1 小时前
从节点图到低秩矩阵:ComfyUI 推理引擎与 LoRA 适配机制拆解
人工智能·aigc
武子康1 小时前
调查研究-210 Netflix 用 AI 复刻 Gene Wilder 的声音:语音克隆的下半场,不是模型,而是权利
人工智能·aigc·openai
你好潘先生1 小时前
别再记命令了,用 yeero do 说句人话就能跑脚本,而且不烧 token
服务器·python·命令行
Quz1 小时前
在 Obsidian 中嵌入 Claude Code 的实践记录
人工智能·claude
雪隐1 小时前
个人电脑玩AI-10让5060 Ti给你打工——部署 Odysseus:终于有个能打的"AI管家"了
人工智能·后端