技术栈

transformer架构

nju_spy
13 天前
人工智能·gpt·nlp·大语言模型·zero-shot·transformer架构·半监督训练
GPT 系列论文1-2 两阶段半监督 + zero-shot promptGPT,GPT-2,GPT-3 论文精读【论文精读】--B站GPT前三和 Transformer还有BERT 时间轴。
Shannon@
4 个月前
人工智能·深度学习·transformer·encoder-decoder·transformer架构·自回归生成·top-p采样
Transformer架构解析:Encoder与Decoder核心差异、生成式解码技术详解Transformer是一种Encoder-Decoder架构,主要有Encoder:负责对输入序列进行特征提取,得到一系列隐藏向量表示
我是有底线的