技术栈

deepseek架构

大傻^
4 小时前
transformer·生成式ai·多模态·qwen模型·大模型基础·deepseek架构·参数规模
从感知机到DeepSeek:AI大模型基础认知全栈解析(演进史·架构对比·参数详解)摘要:本文基于"AI大模型基础认知"知识体系,系统梳理从早期NLP到现代大模型的技术演进脉络,深度解析DeepSeek与Qwen底层架构差异,并通过可视化方式拆解"大模型究竟大在哪里"这一核心命题。适合作为大模型技术入门的系统性学习手册。
我是有底线的