x.view()

x.view()就是对tensor进行reshape

python 复制代码
import torch
v1 = torch.range(1, 4)
v2 = v1.view(2, 2)
print(v2)
v3 = v2.view(4,-1)
print(v3)
python 复制代码
tensor([[1., 2.],
        [3., 4.]])
tensor([[1.],
        [2.],
        [3.],
        [4.]])

在函数的参数中经常可以看到-1例如x.view(-1, 4)

这里-1表示一个不确定的数,就是你如果不确定你想要reshape成几行,但是你很肯定要reshape成4列,那不确定的地方就可以写成-1

例如一个长度的16向量x,

x.view(-1, 4)等价于x.view(4, 4)

x.view(-1, 2)等价于x.view(8,2)

相关推荐
Jet769几秒前
DeepSeek V4预览版解析:Flash、Pro、1M上下文与落地重点
人工智能
无心水3 分钟前
【Hermes:核心机制】9、40+ 内置工具全解:执行/信息/媒体/记忆/协调五大类 —— 智能体手脚架完全手册
大数据·人工智能·openclaw·养龙虾·hermes·养马
程序员三明治5 分钟前
【AI】Java 调用大模型 API 实战:从 OpenAI 协议到 SiliconFlow 流式响应解析
java·开发语言·人工智能
xinlianyq5 分钟前
文艺复兴科技新增AI因子,量化基金重夺主导权
人工智能·ai
数据牧羊人的成长笔记6 分钟前
机器学习预备知识
人工智能·机器学习
互联网推荐官9 分钟前
上海小程序开发:从技术架构到工程落地的完整拆解
人工智能·物联网·软件工程
人工智能培训10 分钟前
大模型部署资源不足?轻量化部署解决方案
人工智能·机器学习·prompt·agent·智能体
两万五千个小时13 分钟前
Agent 任务没做完就停了?我扒了 Claude Code 源码,找到了 4 层原因
人工智能·程序员·架构
老成说AI15 分钟前
DEEPSEEK V4 实测:它不够炸裂,但正在啃最硬的骨头
人工智能·ai·deepseek
Wanderer X16 分钟前
【LLM】GSPO DAPO
人工智能