【大模型】大模型学习总结之机器学习 - 1.基础知识

这里写目录标题

1. 机器学习概述

1、什么是机器学习?

机器学习(Machine Learning, ML)主要研究计算机系统对于特定任务的性能,逐步进行改善的算法和统计模型。通过输入海量训练数据对模型进行训练,使模型掌握数据所蕴含的潜在规律,进而对新输入的数据进行准确的分类或预测。

机器学习是一门多领域交叉学科,涉及概率论、统计学、逼近论、凸优化、算法复杂度理论等多门学科。

要点速记:

机器学习是一种通过算法模型 使计算机从数据中自动学习 并进行预测决策的技术,属于人工智能的一个分支。

2、 人工智能、机器学习、深度学习的关系?

人工智能、机器学习与深度学习三者之间存在明确的层级包含关系:‌人工智能(AI)是一个宏大的目标领域,旨在让机器具备类人智能;机器学习(ML)是实现人工智能目标的一种核心方法,它让机器通过数据来学习;而深度学习(DL)则是机器学习领域内一个重要的分支或技术,特指基于深层神经网络的学习方法,能够自动从数据中提取复杂特征。‌‌‌

要点速记:

总而言之,人工智能包含机器学习,机器学习是人工智能的一个分支;机器学习又分为 监督学习、非监督学习、半监督学习、深度学习,所以 机器学习又包含深度学习。

3、机器学习的应用领域

今天,在计算机科学的诸多分支学科领域中,无论是多媒体、图形学,还是网络通信、软件工程,乃至体系结构、芯片设计,都能找到机器学习技术的身影,尤其是在计算机视觉、自然语言处理等计算机应用技术领域,机器学习已成为最重要的技术进步源泉之一,并为许多交叉学科提供了重要的技术支撑。

2. 机器学习基本理论

1、 机器学习的三要素?

机器学习的三要素是‌模型‌、‌策略‌和‌算法‌,它们构成了从问题定义到求解的完整框架,是理解和构建机器学习系统的核心基石。‌‌

模型:解决问题的假设形式

模型定义了机器学习系统能够理解和解决的问题类型,它是对数据中未知规律的假设。‌‌

‌作用与类型‌:模型的核心作用是将输入数据映射到输出结果。常见的模型包括线性模型(如线性回归)和非线性模型(如神经网络)。线性模型假设输入和输出之间存在线性关系,

非线性模型则通过引入非线性基函数(如 ϕ(x))来捕捉更复杂的特征关系

参数与超参数‌:模型本身包含需要从数据中学习的参数以及用于定义模型结构或优化策略的超参数(如神经网络层数),后者通常需要基于经验或搜索来设定。‌‌

策略:评估与指导学习的准则

策略决定了如何从数据中学习模型,它为模型训练提供了目标和评估标准。‌‌

算法:求解最优参数的具体方法

2、 机器学习的分类?


3、总结监督学习建模的整体流程如下:

可以看到,机器学习是由数据驱动的,核心是利用数据来"训练模型";模型训练的结果需要用一定的方法来进行评估、优化,最终得到一个成熟的学习模型;最后就可以用这个模型来进行预测和解决问题了

3. 机器学习的基本术语

  • 数据集(Data Set):多条记录的集合。
    • 训练集(Training Set):用于训练模型的数据。
    • 验证集(Validation Set):用于调节超参数的数据。
    • 测试集(Test Set):用于评估模型性能的数据。
  • 样本(Sample):数据集中的一条记录是关于一个事件或对象的描述,称为一个样本。
  • 特征(Feature):数据集中一列反映事件或对象在某方面的表现或性质的事项,称为特征或属性。
  • 特征向量(Feature Vector):将样本的所有特征表示为向量的形式,输入到模型中。
  • 标签(Label):监督学习中每个样本的结果信息,也称作目标值(target)。
  • 模型(Model):一个机器学习算法与训练后的参数集合,用于进行预测或分类。
  • 参数(Parameter):模型通过训练学习到的值,例如线性回归中的权重和偏置。
  • 超参数(Hyper Parameter):由用户设置的参数,不能通过训练自动学习,例如学习率、正则化系数等。
相关推荐
Ting-yu10 小时前
Spring AI Alibaba零基础速成(1) ---- 项目创建与配置
java·人工智能·spring
松果财经10 小时前
灵尾科技拿下四场全球大展,开拓爬宠市场新蓝海
人工智能·科技
喜欢coding的谢同学10 小时前
ArthasClaw:用自然语言诊断 JVM 的 AI 助手,告别繁琐的 Arthas 命令
java·人工智能·arthas
淡海水10 小时前
ComfyUI全面掌握-知识点详解——基础示例:文生图与图生图实操(参数+案例)
大数据·人工智能·算法·comfyui
T_Wang_Lab10 小时前
可计算元认知文本分析:癌症经济学语义基线的构建与边界信号检测
人工智能·知识图谱·数字人文·deepseek百万token
belldeep10 小时前
CSR座席模块 如何结合AI 大模型应用?
人工智能·ai·大模型·csr坐席
后端小肥肠10 小时前
漫画工坊续篇 | Coze+Skill 实现老纪漫画完整制作全流程
人工智能·aigc·agent
收放扳机10 小时前
PCB收放板取放方式对比:吸盘与夹板边的技术差异与选型分析
人工智能·科技·自动化·制造·pcb工艺
小黄人软件10 小时前
写一个最小AI Agent智能体真实能用的示例,分别调用mcp和skill
人工智能
Freak嵌入式10 小时前
WIZnet-EVB-Pico2开始,用MicroPython玩转以太网开发
arm开发·人工智能·python·嵌入式硬件·机器人·嵌入式·micropython