【大模型】1.基础概念

AI发展的4个关键节点:

  • 人工智能:1950年-至今
  • 机器学习:1980年-至今
  • 深度学习:2010年-至今
  • 大模型:2020年-至今
1. 机器学习

机器学习是实现人工智能的一种途径。

机器学习,即分析数据以获得规律,并利用规律对未知数据进行预测、分类或决策的过程。

机器学习的应用,需要做这么几件事:

  1. 找到大量的样本,如100万张相关的图片或者文件
  2. 提取样本的特征,如样本的颜色、高度、类型、形状等
  3. 写一套算法,这个算法可以理解成一个数学公式、一套处理逻辑、也可以笼统理解为模型
  4. 训练算法(模型),将样本按特定的要求标注好,然后喂给前面的算法,进行算法训练,直到达到满意的准确度
  5. 处理未知样本,将未知样本送给已经训练好的算法(模型),让算法(模型)给出处理结论

机器学习一般用于简单的应用场景。

2. 深度学习

机器学习的特征提取是靠手动完成的,需要大量专业领域的知识。

深度学习通常由多个层组成,每层包含多个模型,将简单的模型组合在一起,以构建更复杂的模型,它通过大量的数据训练,自动得到目标模型,省去人工设计特征提取环节。

深度学习应用场景:

  • 图像识别(OCR),如物体识别、场景识别、车型识别、人脸识别等
  • 自然语言处理技术(NLP),如机器翻译,文本识别,聊天对话等
  • 语音技术(ASR/TTS),如语音识别等

神经网络,全称人工神经网络(Artificial Neural Network,简写为ANN),是一种模仿生物神经网络结构和功能的计算模型,是深度学习中的一个代表算法,用在图像(例如图像的分类、检测)和自然语言处理(如文本的分类、聊天等)。

3. 大语言模型

大语言模型(简称大模型),Large Language Model,缩写为LLM。

深度学习的核心是由多层神经元构成的计算模型,而大语言模型本质上是一种专门设计用于自然语言处理领域的特殊的深度神经网络。

大语言模型特点:

  • 训练数据大
  • 规模大
  • 算力大
  • 参数规模巨大
  • 具备强大泛化能力
相关推荐
aqi001 天前
15天学会AI应用开发(八)使用向量数据库实现RAG功能
人工智能·python·大模型·ai编程·ai应用
aqi002 天前
15天学会AI应用开发(七)有了大模型为什么还要引入RAG
人工智能·python·大模型·ai编程·ai应用
vivo互联网技术4 天前
CVPR 2026 | 全新强化学习框架 BeautyGRPO:重塑真实人像
算法·大模型·cvpr·影像
AndrewHZ5 天前
【LLM技术全景】大模型能力探秘:In-Context Learning与思维链(CoT)
人工智能·语言模型·大模型·llm·cot·思维链·icl
Vergelight5 天前
实战拆解|三类RAG架构差异:朴素、进阶、多轮RAG落地选型指南
架构·大模型·aigc·agent·ai产品经理·转行·ai后台设计
问道飞鱼5 天前
【大模型相关】意图识别实现方案行业分析报告
大模型·意图识别
DogDaoDao5 天前
【GitHub】CL4R1T4S:AI 系统提示词的透明革命
人工智能·python·ai·大模型·github·ai agent·cl4r1t4s
文艺倾年5 天前
【强化学习】数学推导专题,20W字总结(十五)
人工智能·分布式·大模型·强化学习·vibecoding
IRevers5 天前
【大模型】Gemma4在ROCm和vLLM部署
人工智能·pytorch·深度学习·大模型·datawhale·vllm·amdev
张彦峰ZYF6 天前
从嵌入、表征到潜空间:理解大模型向量世界的三种视角
人工智能·大模型·向量空间