【大模型】1.基础概念

AI发展的4个关键节点:

  • 人工智能:1950年-至今
  • 机器学习:1980年-至今
  • 深度学习:2010年-至今
  • 大模型:2020年-至今
1. 机器学习

机器学习是实现人工智能的一种途径。

机器学习,即分析数据以获得规律,并利用规律对未知数据进行预测、分类或决策的过程。

机器学习的应用,需要做这么几件事:

  1. 找到大量的样本,如100万张相关的图片或者文件
  2. 提取样本的特征,如样本的颜色、高度、类型、形状等
  3. 写一套算法,这个算法可以理解成一个数学公式、一套处理逻辑、也可以笼统理解为模型
  4. 训练算法(模型),将样本按特定的要求标注好,然后喂给前面的算法,进行算法训练,直到达到满意的准确度
  5. 处理未知样本,将未知样本送给已经训练好的算法(模型),让算法(模型)给出处理结论

机器学习一般用于简单的应用场景。

2. 深度学习

机器学习的特征提取是靠手动完成的,需要大量专业领域的知识。

深度学习通常由多个层组成,每层包含多个模型,将简单的模型组合在一起,以构建更复杂的模型,它通过大量的数据训练,自动得到目标模型,省去人工设计特征提取环节。

深度学习应用场景:

  • 图像识别(OCR),如物体识别、场景识别、车型识别、人脸识别等
  • 自然语言处理技术(NLP),如机器翻译,文本识别,聊天对话等
  • 语音技术(ASR/TTS),如语音识别等

神经网络,全称人工神经网络(Artificial Neural Network,简写为ANN),是一种模仿生物神经网络结构和功能的计算模型,是深度学习中的一个代表算法,用在图像(例如图像的分类、检测)和自然语言处理(如文本的分类、聊天等)。

3. 大语言模型

大语言模型(简称大模型),Large Language Model,缩写为LLM。

深度学习的核心是由多层神经元构成的计算模型,而大语言模型本质上是一种专门设计用于自然语言处理领域的特殊的深度神经网络。

大语言模型特点:

  • 训练数据大
  • 规模大
  • 算力大
  • 参数规模巨大
  • 具备强大泛化能力
相关推荐
nvd1117 小时前
OpenClaw 避坑指南:如何彻底从本地/Hunyuan 切换到第三方大模型
大模型
前端摸鱼匠19 小时前
【AI大模型春招面试题31】什么是“零样本学习(Zero-Shot)”“少样本学习(Few-Shot)”?大模型实现这类能力的核心原因?
人工智能·学习·面试·大模型·求职招聘
一切皆是因缘际会20 小时前
可自我迭代升级数字生命工程:从记忆厮杀到自我意识觉醒全链路——AGI内生智能硅基生命心智建模(下)
系统架构·大模型·agi·具身智能·通用人工智能·数字生命·自主智能体
Resistance丶未来21 小时前
Sub2API:订阅转API网关平台,魔芋AI接入指南
人工智能·gpt·大模型·claude·gemini·skill·sub2api
CoderJia程序员甲1 天前
GitHub 热榜项目 - 周榜(2026-05-10)
人工智能·ai·大模型·llm·github
小马过河R1 天前
从官方定义读懂智能体的时代分量
人工智能·语言模型·大模型·llm·agent·ai编程·多模态
邵奈一1 天前
M1 Max Mac版本实测 Rapid-MLX 项目(据说比ollama快4倍)
人工智能·macos·大模型
DogDaoDao1 天前
【GitHub】SuperClaude Framework深度解析:将Claude Code打造为专业开发平台的元编程配置框架
人工智能·深度学习·程序员·大模型·github·ai编程·claude
前端摸鱼匠1 天前
【AI大模型春招面试题30】交叉熵损失(Cross-Entropy Loss)在大模型训练中的作用?为何适合语言生成任务?
人工智能·ai·面试·大模型·求职招聘
低调小一1 天前
Midscene.js 原理拆解:它不是“自然语言点按钮”,而是一套会看屏幕的 UI 自动化运行时
人工智能·rnn·架构·大模型·transformer·tdd·midscene