【大模型】大模型学习总结之机器学习 - 1.基础知识

这里写目录标题

1. 机器学习概述

1、什么是机器学习?

机器学习(Machine Learning, ML)主要研究计算机系统对于特定任务的性能,逐步进行改善的算法和统计模型。通过输入海量训练数据对模型进行训练,使模型掌握数据所蕴含的潜在规律,进而对新输入的数据进行准确的分类或预测。

机器学习是一门多领域交叉学科,涉及概率论、统计学、逼近论、凸优化、算法复杂度理论等多门学科。

要点速记:

机器学习是一种通过算法模型 使计算机从数据中自动学习 并进行预测决策的技术,属于人工智能的一个分支。

2、 人工智能、机器学习、深度学习的关系?

人工智能、机器学习与深度学习三者之间存在明确的层级包含关系:‌人工智能(AI)是一个宏大的目标领域,旨在让机器具备类人智能;机器学习(ML)是实现人工智能目标的一种核心方法,它让机器通过数据来学习;而深度学习(DL)则是机器学习领域内一个重要的分支或技术,特指基于深层神经网络的学习方法,能够自动从数据中提取复杂特征。‌‌‌

要点速记:

总而言之,人工智能包含机器学习,机器学习是人工智能的一个分支;机器学习又分为 监督学习、非监督学习、半监督学习、深度学习,所以 机器学习又包含深度学习。

3、机器学习的应用领域

今天,在计算机科学的诸多分支学科领域中,无论是多媒体、图形学,还是网络通信、软件工程,乃至体系结构、芯片设计,都能找到机器学习技术的身影,尤其是在计算机视觉、自然语言处理等计算机应用技术领域,机器学习已成为最重要的技术进步源泉之一,并为许多交叉学科提供了重要的技术支撑。

2. 机器学习基本理论

1、 机器学习的三要素?

机器学习的三要素是‌模型‌、‌策略‌和‌算法‌,它们构成了从问题定义到求解的完整框架,是理解和构建机器学习系统的核心基石。‌‌

模型:解决问题的假设形式

模型定义了机器学习系统能够理解和解决的问题类型,它是对数据中未知规律的假设。‌‌

‌作用与类型‌:模型的核心作用是将输入数据映射到输出结果。常见的模型包括线性模型(如线性回归)和非线性模型(如神经网络)。线性模型假设输入和输出之间存在线性关系,

非线性模型则通过引入非线性基函数(如 ϕ(x))来捕捉更复杂的特征关系

参数与超参数‌:模型本身包含需要从数据中学习的参数以及用于定义模型结构或优化策略的超参数(如神经网络层数),后者通常需要基于经验或搜索来设定。‌‌

策略:评估与指导学习的准则

策略决定了如何从数据中学习模型,它为模型训练提供了目标和评估标准。‌‌

算法:求解最优参数的具体方法

2、 机器学习的分类?


3、总结监督学习建模的整体流程如下:

可以看到,机器学习是由数据驱动的,核心是利用数据来"训练模型";模型训练的结果需要用一定的方法来进行评估、优化,最终得到一个成熟的学习模型;最后就可以用这个模型来进行预测和解决问题了

3. 机器学习的基本术语

  • 数据集(Data Set):多条记录的集合。
    • 训练集(Training Set):用于训练模型的数据。
    • 验证集(Validation Set):用于调节超参数的数据。
    • 测试集(Test Set):用于评估模型性能的数据。
  • 样本(Sample):数据集中的一条记录是关于一个事件或对象的描述,称为一个样本。
  • 特征(Feature):数据集中一列反映事件或对象在某方面的表现或性质的事项,称为特征或属性。
  • 特征向量(Feature Vector):将样本的所有特征表示为向量的形式,输入到模型中。
  • 标签(Label):监督学习中每个样本的结果信息,也称作目标值(target)。
  • 模型(Model):一个机器学习算法与训练后的参数集合,用于进行预测或分类。
  • 参数(Parameter):模型通过训练学习到的值,例如线性回归中的权重和偏置。
  • 超参数(Hyper Parameter):由用户设置的参数,不能通过训练自动学习,例如学习率、正则化系数等。
相关推荐
五度易链-区域产业数字化管理平台2 小时前
2026年315启示:用技术手段“穿透”产业链,实现风险“事前预防”
人工智能
VillanelleS2 小时前
AI工程化之LLM基础入门
人工智能
Hello.Reader2 小时前
深入理解学习率调度器原理、公式与 PyTorch 实战
人工智能·pytorch·学习
码农小白AI2 小时前
IACheck赋能教学实验样品分析检测,AI报告审核保障实验报告精准可靠
大数据·人工智能
钮钴禄·爱因斯晨2 小时前
AIGC | Midjourney使用指南,直接拿捏~
人工智能·aigc·midjourney
纤纡.2 小时前
基于 OpenCV 的银行卡号识别:传统计算机视觉实战详解
人工智能·opencv·计算机视觉
码喽7号2 小时前
Springboot学习五:MybatisPlus的快速上手
spring boot·学习·spring
云安全联盟大中华区2 小时前
[特殊字符] | OpenClaw威胁模型:MAESTRO框架分析
大数据·人工智能·深度学习·安全·ai
月流霜2 小时前
Midjourney 零基础控图七大参数
人工智能·算法·midjourney