大型语言模型简史

Transformer:理论架构创新

自注意力机制:支持并行计算/全局上下文的理解能力

• 多头注意力:从多个角度捕捉复杂的语义关系

• 前馈网络/位置编码/层归一化:解决了传统模型的诸多局限性

在理解语言任务时,Attention 机制本质上是捕捉单词间的关系

相关推荐
言萧凡_CookieBoty11 分钟前
一文讲清 RAG:让 AI 读懂业务知识库的核心方法
ai编程
冬奇Lab16 分钟前
Agent 系列(一):Agent 是什么——不只是「会调工具的 LLM」
人工智能·llm·agent
冬奇Lab23 分钟前
RAG 系列(二十四):代码 RAG——让 AI 理解你的代码库
人工智能·llm
南屹川32 分钟前
【算法】动态规划实战:从入门到精通
人工智能
人工智能培训35 分钟前
大模型与传统小模型、传统NLP模型的核心差异解析
人工智能·深度学习·神经网络·机器学习·生成对抗网络
沪漂阿龙40 分钟前
面试题详解:智能客服 Agent 系统全栈拆解——Rasa Pro、对话管理、意图识别、GraphRAG、Qwen 与 RAG 优化实战
人工智能·架构
kyriewen1 小时前
产品经理把PRD写成“天书”,我用AI半小时重写了一遍,他当场愣住
前端·ai编程·cursor
薛定猫AI1 小时前
【深度解析】Gemini Omni 多模态生成与 Agent 化创作工作流:从视频编辑到 UI 生成的技术演进
人工智能·ui·音视频
羊羊小栈1 小时前
AI赋能电力巡检:智能故障预警系统
人工智能·yolo·目标检测·毕业设计·大作业
Python私教1 小时前
视觉 Agent 爬取 vs Playwright 脚本:Browser Use 2026 选型表
人工智能