技术栈
参数规模
大傻^
4 小时前
transformer
·
生成式ai
·
多模态
·
qwen模型
·
大模型基础
·
deepseek架构
·
参数规模
从感知机到DeepSeek:AI大模型基础认知全栈解析(演进史·架构对比·参数详解)
摘要:本文基于"AI大模型基础认知"知识体系,系统梳理从早期NLP到现代大模型的技术演进脉络,深度解析DeepSeek与Qwen底层架构差异,并通过可视化方式拆解"大模型究竟大在哪里"这一核心命题。适合作为大模型技术入门的系统性学习手册。
我是有底线的