大模型面试题:prefixDecodercausalDecoder和EncoderDecodder的区别是什么

我整理好的1000+面试题,请看
大模型面试题总结-CSDN博客

或者

https://gitee.com/lilitom/ai_interview_questions/blob/master/README.md

最好将URL复制到浏览器中打开,不然可能无法直接打开


好了,我们今天针对上面的问题,

prefixDecoder、causalDecoder和Encoder-Decoder的区别是什么?

prefix Decoder、causal Decoder 和 Encoder-Decoder 的区别在于 attention mask 不同:

Encoder-Decoder

  • 介绍:输入双向注意力,输出单向注意力

  • 代表模型:T5、Flan-T5、BART

  • 特点

    • 在输入上采用双向注意力,对问题的编码理解更充分

    • 适用任务:在偏理解的 NLP 任务上效果好

    • 缺点:在长文本生成任务上效果差,训练效率低

causal Decoder

  • 特点
    • 自回归语言模型,预训练和下游应用是完全一致的,严格遵守只有后面的 token 才能看到前面的 token 的规则

    • 适用任务:文本生成任务效果好

    • 优点:训练效率高,zero-shot 能力更强,具有涌现能力

prefix Decoder

  • 特点:prefix 部分的 token 互相能看到,是 causal Decoder 和 Encoder-Decoder 的折中

  • 缺点:训练效率低

相关推荐
秦歌66637 分钟前
DeepAgents框架详解和文件后端
人工智能·langchain
测试员周周1 小时前
【Appium 系列】第06节-页面对象实现 — LoginPage 实战
开发语言·前端·人工智能·python·功能测试·appium·测试用例
霸道流氓气质1 小时前
基于 Milvus Lite 的 Spring AI RAG 向量库实践方案与示例
人工智能·spring·milvus
ar01232 小时前
AR巡检平台:构筑智能巡检新模式的数字化引擎
人工智能·ar
语音之家2 小时前
【预讲会征集】ACL 2026 论文预讲会
人工智能·论文·acl
碳基硅坊2 小时前
电商场景下的商品自动识别与辅助上架
人工智能
熊猫钓鱼>_>2 小时前
强化学习与决策优化:从理论到工程落地的完整指南
人工智能·llm·强化学习·rl·马尔可夫·mdp·决策过程
-柚子皮-2 小时前
强化学习DPO算法
人工智能
tzc_fly2 小时前
AnisoAlign:各向异性模态对齐
人工智能·深度学习·机器学习