神经网络汇聚层

文章目录

最大汇聚层

汇聚窗口从输入张量的左上角开始,从左往右、从上往下的在输入张量内滑动。在汇聚窗口到达的每个位置,它计算该窗口中输入子张量的最大值或平均值。计算最大值或平均值是取决于使用了最大汇聚层还是平均汇聚层。

可以设定一个任意大小的矩形汇聚窗口,并分别设定填充和步幅的高度和宽

python 复制代码
pool2d = nn.MaxPool2d((2, 3), stride=(2, 3), padding=(0, 1))

平均汇聚层

python 复制代码
 nn.AvgPool2d(kernel_size=2, stride=2)

自适应平均池化层

python 复制代码
nn.AdaptiveAvgPool2d()

这个层可以生成任意大小的输出特征图,而不需要指定池化窗口的大小。

你只需要指定输出特征图的尺寸(output_size),自适应池化层会自动计算池化窗口的大小和步长,以适应输入特征图的尺寸。

这种方式使得模型能够更好地适应不同尺寸的输入,同时保持输出尺寸的一致性。

自适应池化层特别适用于需要固定尺寸输出的场景,例如在处理不同分辨率的图像时,或者在将特征图送入全连接层之前。

相关推荐
胡耀超1 小时前
Token的八副面孔:为什么“词元“不需要更好的翻译,而需要更多的读者
大数据·人工智能·python·agent·token·代币·词元
带娃的IT创业者1 小时前
WeClaw_42_Agent工具注册全链路:从BaseTool到意图识别的标准化接入
大数据·网络·人工智能·agent·意图识别·basetool·工具注册
CV矿工1 小时前
VLA(Vision-Language-Action)模型在机器人领域的action 输出编码
人工智能·深度学习·机器人
冬奇Lab1 小时前
一天一个开源项目(第62篇):lark-cli - 飞书/Lark 官方 CLI 与 AI Agent Skills
人工智能·开源·资讯
guslegend1 小时前
Ollama
人工智能·大模型
空空潍2 小时前
Spring AI与LangChain对比:组件对应关系、设计差异与选型指南
人工智能·spring·langchain
0 12 小时前
260401日志
人工智能·深度学习·nlp
是有头发的程序猿2 小时前
用Open Claw接口做1688选品、价格监控、货源对比
开发语言·c++·人工智能
chools2 小时前
Java后端拥抱AI开发之个人学习路线 - - Spring AI【第一期】
java·人工智能·学习·spring·ai
IT_陈寒3 小时前
Vite热更新坑了我三天,原来配置要这么写
前端·人工智能·后端