【大模型】1.基础概念

AI发展的4个关键节点:

  • 人工智能:1950年-至今
  • 机器学习:1980年-至今
  • 深度学习:2010年-至今
  • 大模型:2020年-至今
1. 机器学习

机器学习是实现人工智能的一种途径。

机器学习,即分析数据以获得规律,并利用规律对未知数据进行预测、分类或决策的过程。

机器学习的应用,需要做这么几件事:

  1. 找到大量的样本,如100万张相关的图片或者文件
  2. 提取样本的特征,如样本的颜色、高度、类型、形状等
  3. 写一套算法,这个算法可以理解成一个数学公式、一套处理逻辑、也可以笼统理解为模型
  4. 训练算法(模型),将样本按特定的要求标注好,然后喂给前面的算法,进行算法训练,直到达到满意的准确度
  5. 处理未知样本,将未知样本送给已经训练好的算法(模型),让算法(模型)给出处理结论

机器学习一般用于简单的应用场景。

2. 深度学习

机器学习的特征提取是靠手动完成的,需要大量专业领域的知识。

深度学习通常由多个层组成,每层包含多个模型,将简单的模型组合在一起,以构建更复杂的模型,它通过大量的数据训练,自动得到目标模型,省去人工设计特征提取环节。

深度学习应用场景:

  • 图像识别(OCR),如物体识别、场景识别、车型识别、人脸识别等
  • 自然语言处理技术(NLP),如机器翻译,文本识别,聊天对话等
  • 语音技术(ASR/TTS),如语音识别等

神经网络,全称人工神经网络(Artificial Neural Network,简写为ANN),是一种模仿生物神经网络结构和功能的计算模型,是深度学习中的一个代表算法,用在图像(例如图像的分类、检测)和自然语言处理(如文本的分类、聊天等)。

3. 大语言模型

大语言模型(简称大模型),Large Language Model,缩写为LLM。

深度学习的核心是由多层神经元构成的计算模型,而大语言模型本质上是一种专门设计用于自然语言处理领域的特殊的深度神经网络。

大语言模型特点:

  • 训练数据大
  • 规模大
  • 算力大
  • 参数规模巨大
  • 具备强大泛化能力
相关推荐
ACCELERATOR_LLC3 小时前
【DataWhale组队学习】DIY-LLM Task1分词器
人工智能·大模型·datawhale
程序员三明治7 小时前
【AI探索】程序员到底该怎么理解 LLM?
人工智能·ai·大模型·llm·量化·java后端·api调用
极客小云8 小时前
【AiCodeAudit 2.0 发布:基于调用图与局部子图的 AI 代码安全审计平台】
人工智能·网络安全·语言模型·大模型·github·安全性测试·代码复审
DFCED20 小时前
突发!Sora 之父 Bill Peebles 离职:OpenAI 理想主义的又一次落幕
人工智能·大模型·agent·sora
今天你TLE了吗1 天前
LLM到Agent&RAG——AI概念概述 第一章:大模型
java·人工智能·语言模型·大模型
被制作时长两年半的个人练习生1 天前
kerminal工具试用
大模型·算子
AI精钢1 天前
Claude Opus 4.7 是一次失败的升级吗?一次基于用户反馈的技术复盘
网络·人工智能·ai·大模型·llm·claude·技术评论
Wenweno0o2 天前
Eino-Document 组件使用指南
golang·大模型·智能体·eino
陈振wx:zchen20082 天前
SpringAI+DeepSeek大模型开发
大模型·springai·deepseek
liu****2 天前
LangGraph-AI应用开发框架(二)
windows·langchain·大模型·工作流·langgraph