【大模型】1.基础概念

AI发展的4个关键节点:

  • 人工智能:1950年-至今
  • 机器学习:1980年-至今
  • 深度学习:2010年-至今
  • 大模型:2020年-至今
1. 机器学习

机器学习是实现人工智能的一种途径。

机器学习,即分析数据以获得规律,并利用规律对未知数据进行预测、分类或决策的过程。

机器学习的应用,需要做这么几件事:

  1. 找到大量的样本,如100万张相关的图片或者文件
  2. 提取样本的特征,如样本的颜色、高度、类型、形状等
  3. 写一套算法,这个算法可以理解成一个数学公式、一套处理逻辑、也可以笼统理解为模型
  4. 训练算法(模型),将样本按特定的要求标注好,然后喂给前面的算法,进行算法训练,直到达到满意的准确度
  5. 处理未知样本,将未知样本送给已经训练好的算法(模型),让算法(模型)给出处理结论

机器学习一般用于简单的应用场景。

2. 深度学习

机器学习的特征提取是靠手动完成的,需要大量专业领域的知识。

深度学习通常由多个层组成,每层包含多个模型,将简单的模型组合在一起,以构建更复杂的模型,它通过大量的数据训练,自动得到目标模型,省去人工设计特征提取环节。

深度学习应用场景:

  • 图像识别(OCR),如物体识别、场景识别、车型识别、人脸识别等
  • 自然语言处理技术(NLP),如机器翻译,文本识别,聊天对话等
  • 语音技术(ASR/TTS),如语音识别等

神经网络,全称人工神经网络(Artificial Neural Network,简写为ANN),是一种模仿生物神经网络结构和功能的计算模型,是深度学习中的一个代表算法,用在图像(例如图像的分类、检测)和自然语言处理(如文本的分类、聊天等)。

3. 大语言模型

大语言模型(简称大模型),Large Language Model,缩写为LLM。

深度学习的核心是由多层神经元构成的计算模型,而大语言模型本质上是一种专门设计用于自然语言处理领域的特殊的深度神经网络。

大语言模型特点:

  • 训练数据大
  • 规模大
  • 算力大
  • 参数规模巨大
  • 具备强大泛化能力
相关推荐
weixin_4684668520 小时前
Ava 2.0 智能应用场景落地指南
人工智能·自然语言处理·大模型·智能交互·ava
张彦峰ZYF1 天前
检索增强生成(RAG)系统的基础:全面深入矢量数据库
数据库·大模型·rag
Jing_jing_X1 天前
AI 产品模型评测工具怎么选?用 Promptfoo / DeepEval / Ragas 找到最低可用模型
大模型·agent·ai应用开发
万俟淋曦1 天前
【论文速递】2026年第02周(Jan-04-10)(Robotics/Embodied AI/LLM)
人工智能·深度学习·机器人·大模型·论文·robotics·具身智能
格桑阿sir1 天前
10-大模型智能体开发工程师:RAG检索增强生成
ai·大模型·llm·embedding·agent·检索增强·rag
追光者♂1 天前
【测评系列5】CSDN AI数字营销实测体验官——Claude 大模型深度评测:从参数解析到实战边界
人工智能·ai·大模型·大语言模型·claude·模型幻觉·架构参数
万俟淋曦1 天前
【论文速递】2026年第01周(Dec-28-Jan-03)(Robotics/Embodied AI/LLM)
人工智能·ai·机器人·大模型·论文·robotics·具身智能
shandianchengzi1 天前
【记录】Claude Code|Ubuntu26给Claude Code新增任务消息提示音
运维·服务器·ubuntu·ai·大模型·音频·claude
aqi001 天前
15天学会AI应用开发(三)把历史对话作为提示词会怎样
人工智能·python·大模型·ai编程·ai应用
谷哥的小弟1 天前
大模型核心基础知识(14)—神经网络的结构
人工智能·深度学习·神经网络·大模型·大语言模型