技术栈
transformer架构
nju_spy
13 天前
人工智能
·
gpt
·
nlp
·
大语言模型
·
zero-shot
·
transformer架构
·
半监督训练
GPT 系列论文1-2 两阶段半监督 + zero-shot prompt
GPT,GPT-2,GPT-3 论文精读【论文精读】--B站GPT前三和 Transformer还有BERT 时间轴。
Shannon@
4 个月前
人工智能
·
深度学习
·
transformer
·
encoder-decoder
·
transformer架构
·
自回归生成
·
top-p采样
Transformer架构解析:Encoder与Decoder核心差异、生成式解码技术详解
Transformer是一种Encoder-Decoder架构,主要有Encoder:负责对输入序列进行特征提取,得到一系列隐藏向量表示
我是有底线的