计算机基础·cs336·损失函数,优化器,调度器,数据处理和模型加载保存人工智能·深度学习·计算机视觉·transformer
《Transformer模型PyTorch实现全攻略:架构拆解、代码示例与优化技巧》深度学习·transformer·构建transformer模型·定义多头注意力模块·定义位置前馈网络·构建解/编码器模块·训练transformer模型
如何基于知识图谱进行故障原因、事故原因推理,需要用到哪些算法人工智能·深度学习·算法·机器学习·自然语言处理·transformer·知识图谱
ops-transformer算子库:解锁昇腾大模型加速的关键人工智能·深度学习·transformer·cann
不仅是 FlashAttention:揭秘 CANN ops-transformer 如何重构大模型推理深度学习·重构·aigc·transformer·cann