【大模型】1.基础概念

AI发展的4个关键节点:

  • 人工智能:1950年-至今
  • 机器学习:1980年-至今
  • 深度学习:2010年-至今
  • 大模型:2020年-至今
1. 机器学习

机器学习是实现人工智能的一种途径。

机器学习,即分析数据以获得规律,并利用规律对未知数据进行预测、分类或决策的过程。

机器学习的应用,需要做这么几件事:

  1. 找到大量的样本,如100万张相关的图片或者文件
  2. 提取样本的特征,如样本的颜色、高度、类型、形状等
  3. 写一套算法,这个算法可以理解成一个数学公式、一套处理逻辑、也可以笼统理解为模型
  4. 训练算法(模型),将样本按特定的要求标注好,然后喂给前面的算法,进行算法训练,直到达到满意的准确度
  5. 处理未知样本,将未知样本送给已经训练好的算法(模型),让算法(模型)给出处理结论

机器学习一般用于简单的应用场景。

2. 深度学习

机器学习的特征提取是靠手动完成的,需要大量专业领域的知识。

深度学习通常由多个层组成,每层包含多个模型,将简单的模型组合在一起,以构建更复杂的模型,它通过大量的数据训练,自动得到目标模型,省去人工设计特征提取环节。

深度学习应用场景:

  • 图像识别(OCR),如物体识别、场景识别、车型识别、人脸识别等
  • 自然语言处理技术(NLP),如机器翻译,文本识别,聊天对话等
  • 语音技术(ASR/TTS),如语音识别等

神经网络,全称人工神经网络(Artificial Neural Network,简写为ANN),是一种模仿生物神经网络结构和功能的计算模型,是深度学习中的一个代表算法,用在图像(例如图像的分类、检测)和自然语言处理(如文本的分类、聊天等)。

3. 大语言模型

大语言模型(简称大模型),Large Language Model,缩写为LLM。

深度学习的核心是由多层神经元构成的计算模型,而大语言模型本质上是一种专门设计用于自然语言处理领域的特殊的深度神经网络。

大语言模型特点:

  • 训练数据大
  • 规模大
  • 算力大
  • 参数规模巨大
  • 具备强大泛化能力
相关推荐
威化饼的一隅2 小时前
【大模型LLM学习】从强化学习到GRPO【上】
大模型·llm·agent·强化学习·智能体·grpo
靴子学长3 小时前
GRPO 深度解析 (TRL 源码视角)
大模型·强化学习·算法设计·大模型推理·源码解读
guslegend3 小时前
3月29日(openclaw安全保障)
人工智能·安全·大模型
最初的↘那颗心3 小时前
企业级 AI Agent 工程方法论:从原型到生产的完整指南(上)
大模型·rag·ai agent·mcp·企业级ai
加斯顿工程师3 小时前
国产开源大模型发布时间线
大模型
光仔December4 小时前
【从0学习Spring AI Alibaba】2、Spring AI Alibaba版本选型及环境搭建
人工智能·大模型·saa·spring ai·ai alibaba
张彦峰ZYF4 小时前
大模型LLM ACA - ACP认证考试模拟试卷六
大模型·llm·aca - acp
guslegend16 小时前
大模型RAG进阶多格式文档解析
人工智能·大模型