技术栈
大模型架构演进:从Transformer到MoE
人工智能培训
2026-02-14 16:47
Transformer的辉煌与局限
MoE:用"稀疏激活"撬动模型容量
MoE为何成为大模型新范式?
典型实践:从GLaM到Qwen-MoE
挑战与未来方向
#Transformer#MoE(混合专家)#稀疏激活#专家#模型容量
人工智能
深度学习
大模型
transformer
知识图谱
具身智能
人工智能 培训
上一篇:
MYSQL---事务
下一篇:
2026主权AI趋势:DeepSeek搭建企业自有可控AI环境,保障数据安全实战
相关推荐
冬奇Lab
1 小时前
Workflow 系列(02):设计范式——四层架构、三种 Context 传递模式与确认门设计
人工智能
·
agent
·
工作流引擎
冬奇Lab
1 小时前
每日一个开源项目(第145篇):Trellis - 把项目记忆、规范和任务上下文持久化进代码仓库
人工智能
·
开源
·
资讯
有道AI情报局
1 小时前
Harness即产品
人工智能
·
agent
罗西的思考
3 小时前
机器人 / 强化学习】HIL-SERL:人类在环驱动的具身智能进化框架
人工智能
·
算法
·
机器学习
IT_陈寒
4 小时前
SpringBoot自动配置的坑,我的API突然就404了
前端
·
人工智能
·
后端
笃行350
4 小时前
从零到上线:用 EdgeOne Makers + CodeBuddy 搭一个「对账核对员」AI Agent
人工智能
用户685632620869
4 小时前
Claude Code 乱猜字段名?我给它写了一个"数据库查询约束 Skill"
人工智能
你_好
4 小时前
# 给你的产品嵌入一个「会操作界面的 AI 助手」
人工智能
ShallWeL
4 小时前
【机器学习】(3)—— 线性回归:梯度下降
人工智能
·
机器学习
陈广亮
4 小时前
Prompt、Context、Harness、Agentic:LLM 应用四层嵌套结构,搞清自己卡在哪一层
人工智能
热门推荐
01
2026年6月AI大模型全景报告:GPT-5.6、Claude Opus 4.8、Gemini 3.5,中美AI三足鼎立谁主沉浮?
02
2026年6月AI行业全景:从百模大战到Agent元年,这30天发生了什么?
03
2026 年 AI 编程工具终极横评:Cursor vs Claude Code vs Copilot vs Windsurf
04
飞书长连接_事件订阅(接收消息,审批任务状态变更)
05
Trae国际版与国内版深度测评:AI原生IDE的双生花
06
【AI】2026 年具身智能模型和世界模型总结
07
GitHub 镜像站点
08
Claude Code、Codex、Cursor三分天下:2026年AI编程Agent生态全景剖析
09
2026年AI架构实战:彻底解决OpenAI接口超时与封号,Python调用GPT-5.2/Sora2企业级架构详解(附源码+压测报告)
10
2026 AI 编程工具终极实战指南:Cursor vs Claude Code vs Copilot,开发者该怎么选?