大模型面试题:prefixDecodercausalDecoder和EncoderDecodder的区别是什么

我整理好的1000+面试题,请看
大模型面试题总结-CSDN博客

或者

https://gitee.com/lilitom/ai_interview_questions/blob/master/README.md

最好将URL复制到浏览器中打开,不然可能无法直接打开


好了,我们今天针对上面的问题,

prefixDecoder、causalDecoder和Encoder-Decoder的区别是什么?

prefix Decoder、causal Decoder 和 Encoder-Decoder 的区别在于 attention mask 不同:

Encoder-Decoder

  • 介绍:输入双向注意力,输出单向注意力

  • 代表模型:T5、Flan-T5、BART

  • 特点

    • 在输入上采用双向注意力,对问题的编码理解更充分

    • 适用任务:在偏理解的 NLP 任务上效果好

    • 缺点:在长文本生成任务上效果差,训练效率低

causal Decoder

  • 特点
    • 自回归语言模型,预训练和下游应用是完全一致的,严格遵守只有后面的 token 才能看到前面的 token 的规则

    • 适用任务:文本生成任务效果好

    • 优点:训练效率高,zero-shot 能力更强,具有涌现能力

prefix Decoder

  • 特点:prefix 部分的 token 互相能看到,是 causal Decoder 和 Encoder-Decoder 的折中

  • 缺点:训练效率低

相关推荐
147API5 分钟前
Claude进入受监管系统前,接入层应该先怎么设计
人工智能
Szime6 分钟前
深智微:面向汽车电子与工业控制的电子元器件原装现货服务商
人工智能·汽车
gis分享者7 分钟前
Claude Code 接入蓝耘 GLM-5.1:终端 AI 编程助手配置实战
人工智能·ai·实战·claude·cc·接入glm
企学宝10 分钟前
央国企数字化培训升级路径:学分制+AI评卷的全新实践
人工智能·企业培训·公司内训
三更两点11 分钟前
AI拉呱-2026年06月12日AI技术洞察简报
人工智能
终端域名12 分钟前
AI与区块链融合:加密货币的下一前沿——技术架构、企业价值与未来趋势
人工智能·架构·区块链
lauo13 分钟前
ibbot青春版:当腾讯AI“换船”,一部手机如何成为你的Token“私矿”?
大数据·人工智能·chatgpt·智能手机·ai-native
yzqy_18 分钟前
AMD AI 开发者计划学习笔记:从 ROCm 到 Ryzen AI,理解 AMD 的 AI 开发生态
人工智能·笔记·学习·datawhale·amdev
老虾头22 分钟前
合规化背景下,本地私有 AI 成为行业主流发展方向
大数据·人工智能
行业研究员22 分钟前
腾讯会议同传功能实测与选型建议
大数据·人工智能·腾讯会议·腾讯会议会议同传