神经网络常见操作（卷积）输入输出

被放养的研究生2025-01-18 10:11

卷积

dim=d的tensor可以进行torch.nn.Convnd(in_channels,out_channels),其中n=d-1,d-2
对于torch.nn.Convnd(in_channels,out_channels)，改变的是tensor的倒数n+1维的大小

全连接

使用torch.nn.Linear(in_features,out_features,bias)实现
Y=XW^T +b,其中X 的形状为 (batch_size,in_features)，而 W ^T的形状为 (in_features,out_features),b 的形状为 (out_features)，在加法操作中会自动扩展为 (batch_size,out_features)。
在 PyTorch 中，torch.nn.Linear 的权重矩阵W不需要手动设置，它会在初始化时自动生成并进行默认的初始化，使用均匀分布或正态分布（由参数设定）
偏置向量 b 默认为全零

上一篇：实时外汇 API|初学者入门数据分析

下一篇：语音技术在播客领域的应用（2）

热门推荐

01UV安装并设置国内源 02DeepSeek更新！速览DeepSeek V3.1新特性 03Qwen3-Coder 快速上手教程 | Qwen Code + Claude Code 04KGG转MP3工具|非KGM文件|解密音频 05蜘蛛磁力搜索引擎大全，如何使用蜘蛛磁力查找磁力链接 06【2025.08.06最新版】Android Studio下载、安装及配置记录（自动下载sdk）072025最新国内服务器可用docker源仓库地址大全（2025年8月更新）08阿里开源首个图像生成基础模型——Qwen-Image本地部署教程，超强中文渲染能力刷新SOTA！09NVIDIA显卡驱动、CUDA、cuDNN 和 TensorRT 版本匹配指南 10TRAE 规则（Rules）配置指南：个人习惯、团队规范与最佳实践