技术栈

注意力屏蔽(Attention Masking)在Transformer中的作用 【gpt学习记录】

A half moon2023-10-14 9:56

填充遮挡(Padding Masking):


未来遮挡(Future Masking):

上一篇:CH6-中断和异常处理
下一篇:ThreeJS-3D教学九-line的绘制
相关推荐
Qhumaing
5 分钟前
C++学习:【PTA】数据结构 7-1 实验7-1(最小生成树-Prim算法)
c++·学习·算法
好大哥呀
20 分钟前
Java Web的学习路径
java·前端·学习
梦雨羊
2 小时前
Base-NLP学习
人工智能·学习·自然语言处理
丝斯2011
2 小时前
AI学习笔记整理(42)——NLP之大规模预训练模型Transformer
人工智能·笔记·学习
小猪佩奇TONY
3 小时前
Linux 内核学习(14) --- linux x86-32 虚拟地址空间
linux·学习
副露のmagic
3 小时前
更弱智的算法学习 day28
学习
ha2042894194
3 小时前
Linux操作系统学习记录之---TcpSocket
linux·网络·c++·学习
凉、介
5 小时前
深入 QEMU Guest Agent:虚拟机内外通信的隐形纽带
c语言·笔记·学习·嵌入式·虚拟化
崇山峻岭之间
5 小时前
Matlab学习记录31
开发语言·学习·matlab
石像鬼₧魂石
5 小时前
22端口(OpenSSH 4.7p1)渗透测试完整复习流程(含实战排错)
大数据·网络·学习·安全·ubuntu
热门推荐
01GitHub 镜像站点02Labelme从安装到标注:零基础完整指南03安娜的档案(Anna’s Archive) 镜像网站/国内最新可访问入口(持续更新)04Linux下V2Ray安装配置指南05Claude Code 2.1.2 升级报错?别折腾了,一行命令搞定062025-04-03 Latex学习1——本地配置Latex + VScode环境07jdk21下载、安装(Windows、Linux、macOS)08【踩坑笔记】50系显卡适配的 PyTorch 安装09Overleaf编译超时,超出免费计划编译时限(已解决)10UV安装并设置国内源