技术栈

rwkv

华为云开发者联盟
10 个月前
rnn·深度学习·大模型·transformers·rwkv·华为云开发者联盟
结合RNN与Transformer双重优点,深度解析大语言模型RWKV本文分享自华为云社区《【云驻共创】昇思MindSpore技术公开课 RWKV 模型架构深度解析》,作者:Freedom123。
BQW_
2 年前
rnn·自然语言处理·llm·rwkv·模型结构
【自然语言处理】【大模型】RWKV:基于RNN的LLM相关博客 【自然语言处理】【大模型】RWKV:基于RNN的LLM 【自然语言处理】【大模型】CodeGen:一个用于多轮程序合成的代码大语言模型 【自然语言处理】【大模型】CodeGeeX:用于代码生成的多语言预训练模型 【自然语言处理】【大模型】LaMDA:用于对话应用程序的语言模型 【自然语言处理】【大模型】DeepMind的大模型Gopher 【自然语言处理】【大模型】Chinchilla:训练计算利用率最优的大语言模型 【自然语言处理】【大模型】大语言模型BLOOM推理工具测试 【自然语言处理】【