【人工智能学习笔记】3_1 机器学习基础之机器学习概述

机器学习概述

  • 人工智能、机器学习和深度学习的关系

目标一致,三者统一:给机器赋予人的智能,让机器能够像人一样地思考问题,做出决策;

  • 机器学习是实现人工智能的一种途径,让机器使用算法解析数据、从中学习数据特征,并进行归纳判断
  • 深度学习是机器学习的一类重要方法,采用多层非线性函数(即神经网络)学习数据特征,并进行判断,属于机器学习解决图像、语音、文本等领域的一个重要分支

机器学习的定义及其方向

定义:通过技术的手段,利用已有的数据(经验)开发可以用来对新数据进行预测的模型

主要方向:1.基于学习方式的划分;2.基于学习策略的划分

  • 基于学习方式 的划分:根据输入的数据是否需要进行标注进行划分

    • 有监督学习

      有监督学习的过程

      • 输入数据:为"训练数据",每组训练数据有明确标识
      • 学习过程:将预测过程与"训练数据"的实际结果进行比较,不断调整预测模型,直到模型预测结果达到一个预期的准确率
      • 应用场景:分类、回归

      分类和回归

      • 概念
        分类就是将不同的类别进行分开,而回归则是找到一个空间,是得数据点尽可能的落在空间上,分类预测变量是离散的 ,如:今天的天气为晴天;回测预测变量是连续的 ,如:明天的温度为36.4°。

      分类(上)和回归(下)

      • 区别
        分类和回归的区别
    • 无监督学习

      有监督学习(左)和无监督学习(右)

      • 输入数据:数据没有被明确的标识
      • 学习过程:不存在目标变量,基于数据本身去识别变量之间内在的模式和特征
      • 应用场景:关联分析、 聚类
    • 强化学习

      强化学习

      • 一种机器学习方式:以"试错"的方式进行学习,通过与环境进行交互获得奖赏指导行为,目标是是智能体获得最大的奖赏或实现特定目标
      • 输入数据:不要求预先给定任何数据,通过接收环境对动作的奖励(反馈)获得学习信息
      • 输出:模型参数调整
      • 应用领域:机器人控制、计算机视觉、自然语言处理
  • 基于学习策略的划分:根据学习策略是否基于经典数学原理还是模拟人脑感知进行划分

    • 传统机器学习:基于统计、概率、线性代数等数学原理,通过分析输入数据的模式,进行判断与预测
    • 深度学习:机器学习的一个重要分支,通过模拟人类大脑感知与组织的工作方式,通过人工神经网络构建,分析输入数据,进行判断与预测

机器学习的常见函数

机器学习模型训练过程设计两个重要函数

损失函数

定义:用来估量模型的预测值与真实值的不一致程度,是一个非负实值函数

特点:损失函数的值越小,说明模型的预测值与真实值越接近;不同的算法可能使用的损失函数不同

损失函数的示例

优化函数

优化函数通过调节参数使误差函数值变小


常见的优化函数

  • 优化函数的执行过程

    梯度下降执行过程
    以梯度下降法为例,球要运动到最低点需要知道三个要素:所处位置、运动方向、移动速度
  • 三种梯度下降法特点对比
    1. 批量梯度下降法BGD
      易收敛,每次学习使用整个样本集,学习一次的时间长。
    2. 随机梯度下降法SGD
      每次学习使用随机单个样本,学习一次时间短。下降会出现损失函数波动且难收敛。
    3. 小批量梯度下降法MBGD
      每次学习使用小批量样本集,结合了BGD和SGD的优点,弱化了缺点

机器学习常见的评估指标

评价指标是建立在不同的机器学习任务上的:

  • 混淆矩阵
    混淆矩阵也称误差矩阵,是表示精度评价的一种标准格式,用n行n列的矩阵形式来表示

二分类混淆矩阵示例
.


分类任务常见的评估指标
.


回归任务常见的评估指标
.

相关推荐
虾球xz30 分钟前
游戏引擎学习第55天
学习·游戏引擎
oneouto1 小时前
selenium学习笔记(二)
笔记·学习·selenium
B站计算机毕业设计超人1 小时前
计算机毕业设计PySpark+Hadoop中国城市交通分析与预测 Python交通预测 Python交通可视化 客流量预测 交通大数据 机器学习 深度学习
大数据·人工智能·爬虫·python·机器学习·课程设计·数据可视化
学术头条1 小时前
清华、智谱团队:探索 RLHF 的 scaling laws
人工智能·深度学习·算法·机器学习·语言模型·计算语言学
sealaugh321 小时前
aws(学习笔记第十九课) 使用ECS和Fargate进行容器开发
笔记·学习·aws
18号房客1 小时前
一个简单的机器学习实战例程,使用Scikit-Learn库来完成一个常见的分类任务——**鸢尾花数据集(Iris Dataset)**的分类
人工智能·深度学习·神经网络·机器学习·语言模型·自然语言处理·sklearn
feifeikon1 小时前
机器学习DAY3 : 线性回归与最小二乘法与sklearn实现 (线性回归完)
人工智能·机器学习·线性回归
游客5201 小时前
opencv中的常用的100个API
图像处理·人工智能·python·opencv·计算机视觉
古希腊掌管学习的神1 小时前
[机器学习]sklearn入门指南(2)
人工智能·机器学习·sklearn
炭烤玛卡巴卡1 小时前
学习postman工具使用
学习·测试工具·postman