【大模型】1.基础概念

yuhuofei20212026-03-30 10:21

AI发展的4个关键节点：

人工智能：1950年-至今
机器学习：1980年-至今
深度学习：2010年-至今
大模型：2020年-至今

1. 机器学习

机器学习是实现人工智能的一种途径。

机器学习，即分析数据以获得规律，并利用规律对未知数据进行预测、分类或决策的过程。

机器学习的应用，需要做这么几件事：

找到大量的样本，如100万张相关的图片或者文件
提取样本的特征，如样本的颜色、高度、类型、形状等
写一套算法，这个算法可以理解成一个数学公式、一套处理逻辑、也可以笼统理解为模型
训练算法（模型），将样本按特定的要求标注好，然后喂给前面的算法，进行算法训练，直到达到满意的准确度
处理未知样本，将未知样本送给已经训练好的算法（模型），让算法（模型）给出处理结论

机器学习一般用于简单的应用场景。

2. 深度学习

机器学习的特征提取是靠手动完成的，需要大量专业领域的知识。

深度学习通常由多个层组成，每层包含多个模型，将简单的模型组合在一起，以构建更复杂的模型，它通过大量的数据训练，自动得到目标模型，省去人工设计特征提取环节。

深度学习应用场景：

图像识别（OCR），如物体识别、场景识别、车型识别、人脸识别等
自然语言处理技术（NLP），如机器翻译，文本识别，聊天对话等
语音技术（ASR/TTS），如语音识别等

神经网络，全称人工神经网络（Artificial Neural Network，简写为ANN），是一种模仿生物神经网络结构和功能的计算模型，是深度学习中的一个代表算法，用在图像（例如图像的分类、检测）和自然语言处理（如文本的分类、聊天等）。

3. 大语言模型

大语言模型（简称大模型），Large Language Model，缩写为LLM。

深度学习的核心是由多层神经元构成的计算模型，而大语言模型本质上是一种专门设计用于自然语言处理领域的特殊的深度神经网络。

大语言模型特点：

训练数据大
规模大
算力大
参数规模巨大
具备强大泛化能力

上一篇：模型加载与初始化(3)

下一篇：C++传记详解单例模式（面向对象）

热门推荐

01GitHub 镜像站点 02如何新建文件夹？电脑新建文件夹的4种方法 03国内可直接用、免费额度/永久免费的大模型API清单（含 SiliconFlow、火山、阿里、智谱、百度、Kimi、DeepSeek、DMXAPI 等）042026年7月AI圈大地震：GPT-5.6被政府限制、Claude入驻Slack、Anthropic自研芯片 05微信历史版本含下载地址（ Windows PC | 安卓 | MAC ）及设置微信不更新 062026 国产 AI 大模型横评：DeepSeek、通义千问、Kimi、文心一言、星火、豆包谁更能打？07AI 编程 IDE 全景解析 2026：Agent 全面接管开发链路 0800 Debian字符界面如何支持中文 09Agnes AI 免费 API 接入指南：文本、生图、生视频，一套接口全免费 10历年考研数学一、数学二、数学三真题试卷及答案PDF