从人工智能到大语言模型

从人工智能到大语言模型

下图展示了人工智能、机器学习、深度学习和大语言模型以及生成式大语言模型之间的关系。

人工智能是包括机器学习、深度学习等众多分支的领域,旨在开发能够执行需要人类智能水平的任务(包括语音理解、模式识别、决策制定)的机器。

机器学的重点研究内容是实现人工智能的算法。机器学习涉及开发能够从数据中学习的算法。无需明确编程,这些算法就能基于数据做出预测或决策。

深度学习是机器学习的一个分支,它主要利用 3 层及以上的神经网络(深度神经网络)来建模数据中的复杂模式和抽象特征。与深度学习不同,在传统的机器学习方法中,特征提取过程通常依赖于人工干预,这要求领域专家手动识别并选定对于给定任务最为关键的数据特征。

尽管当前人工智能领域现在由机器学习和深度学习所主导,但该领域也涉及其他方法,比如基于规则的系统、遗传算法、专家系统、模糊逻辑或符号推理。这些多样化的技术手段共同构成了现代人工智能研究领域。

构建大语言模型

大语言模型的预训练目标是在大量无标注的文本语料库(原始文本)上进行下一单词预测。预训练完成后,可以使用较小的带标注的数据集对大语言模型进行微调。

构建大语言模型有3个主要阶段:实现模型架构和准备数据(第一阶段);在海量的无标注文本上进行预训练,以获得基础模型(第二阶段);在更小规模且经过标注的目标数据集上进行微调,以得到个人助手或文本分类器(第三阶段)

参考

● 《从零构建大模型》

相关推荐
NAGNIP6 小时前
一文搞懂深度学习中的通用逼近定理!
人工智能·算法·面试
冬奇Lab7 小时前
一天一个开源项目(第36篇):EverMemOS - 跨 LLM 与平台的长时记忆 OS,让 Agent 会记忆更会推理
人工智能·开源·资讯
冬奇Lab7 小时前
OpenClaw 源码深度解析(一):Gateway——为什么需要一个"中枢"
人工智能·开源·源码阅读
AngelPP10 小时前
OpenClaw 架构深度解析:如何把 AI 助手搬到你的个人设备上
人工智能
宅小年11 小时前
Claude Code 换成了Kimi K2.5后,我再也回不去了
人工智能·ai编程·claude
九狼11 小时前
Flutter URL Scheme 跨平台跳转
人工智能·flutter·github
ZFSS11 小时前
Kimi Chat Completion API 申请及使用
前端·人工智能
天翼云开发者社区12 小时前
春节复工福利就位!天翼云息壤2500万Tokens免费送,全品类大模型一键畅玩!
人工智能·算力服务·息壤
知识浅谈12 小时前
教你如何用 Gemini 将课本图片一键转为精美 PPT
人工智能
Ray Liang13 小时前
被低估的量化版模型,小身材也能干大事
人工智能·ai·ai助手·mindx