【人工智能学习笔记】3_1 机器学习基础之机器学习概述

机器学习概述

  • 人工智能、机器学习和深度学习的关系

目标一致,三者统一:给机器赋予人的智能,让机器能够像人一样地思考问题,做出决策;

  • 机器学习是实现人工智能的一种途径,让机器使用算法解析数据、从中学习数据特征,并进行归纳判断
  • 深度学习是机器学习的一类重要方法,采用多层非线性函数(即神经网络)学习数据特征,并进行判断,属于机器学习解决图像、语音、文本等领域的一个重要分支

机器学习的定义及其方向

定义:通过技术的手段,利用已有的数据(经验)开发可以用来对新数据进行预测的模型

主要方向:1.基于学习方式的划分;2.基于学习策略的划分

  • 基于学习方式 的划分:根据输入的数据是否需要进行标注进行划分

    • 有监督学习

      有监督学习的过程

      • 输入数据:为"训练数据",每组训练数据有明确标识
      • 学习过程:将预测过程与"训练数据"的实际结果进行比较,不断调整预测模型,直到模型预测结果达到一个预期的准确率
      • 应用场景:分类、回归

      分类和回归

      • 概念
        分类就是将不同的类别进行分开,而回归则是找到一个空间,是得数据点尽可能的落在空间上,分类预测变量是离散的 ,如:今天的天气为晴天;回测预测变量是连续的 ,如:明天的温度为36.4°。

      分类(上)和回归(下)

      • 区别
        分类和回归的区别
    • 无监督学习

      有监督学习(左)和无监督学习(右)

      • 输入数据:数据没有被明确的标识
      • 学习过程:不存在目标变量,基于数据本身去识别变量之间内在的模式和特征
      • 应用场景:关联分析、 聚类
    • 强化学习

      强化学习

      • 一种机器学习方式:以"试错"的方式进行学习,通过与环境进行交互获得奖赏指导行为,目标是是智能体获得最大的奖赏或实现特定目标
      • 输入数据:不要求预先给定任何数据,通过接收环境对动作的奖励(反馈)获得学习信息
      • 输出:模型参数调整
      • 应用领域:机器人控制、计算机视觉、自然语言处理
  • 基于学习策略的划分:根据学习策略是否基于经典数学原理还是模拟人脑感知进行划分

    • 传统机器学习:基于统计、概率、线性代数等数学原理,通过分析输入数据的模式,进行判断与预测
    • 深度学习:机器学习的一个重要分支,通过模拟人类大脑感知与组织的工作方式,通过人工神经网络构建,分析输入数据,进行判断与预测

机器学习的常见函数

机器学习模型训练过程设计两个重要函数

损失函数

定义:用来估量模型的预测值与真实值的不一致程度,是一个非负实值函数

特点:损失函数的值越小,说明模型的预测值与真实值越接近;不同的算法可能使用的损失函数不同

损失函数的示例

优化函数

优化函数通过调节参数使误差函数值变小


常见的优化函数

  • 优化函数的执行过程

    梯度下降执行过程
    以梯度下降法为例,球要运动到最低点需要知道三个要素:所处位置、运动方向、移动速度
  • 三种梯度下降法特点对比
    1. 批量梯度下降法BGD
      易收敛,每次学习使用整个样本集,学习一次的时间长。
    2. 随机梯度下降法SGD
      每次学习使用随机单个样本,学习一次时间短。下降会出现损失函数波动且难收敛。
    3. 小批量梯度下降法MBGD
      每次学习使用小批量样本集,结合了BGD和SGD的优点,弱化了缺点

机器学习常见的评估指标

评价指标是建立在不同的机器学习任务上的:

  • 混淆矩阵
    混淆矩阵也称误差矩阵,是表示精度评价的一种标准格式,用n行n列的矩阵形式来表示

二分类混淆矩阵示例
.


分类任务常见的评估指标
.


回归任务常见的评估指标
.

相关推荐
麦麦大数据5 分钟前
Python棉花病虫害图谱系统CNN识别+AI问答知识neo4j vue+flask深度学习神经网络可视化
人工智能·python·深度学习
段传涛7 分钟前
PAL(Program-Aided Language Model)
人工智能·语言模型·自然语言处理
声网9 分钟前
实时多模态 AI 的 N 种新可能丨实时互动和大模型专场@RTE2024回顾
人工智能·实时互动
魔珐科技11 分钟前
以3D数字人AI产品赋能教育培训人才发展,魔珐科技亮相AI+教育创新与人才发展大会
大数据·人工智能
weixin_4432906911 分钟前
【阅读记录-章节3】Build a Large Language Model (From Scratch)
人工智能·语言模型·自然语言处理
HackKong11 分钟前
小白怎样入门网络安全?
网络·学习·安全·web安全·网络安全·黑客
算家云16 分钟前
快速识别模型:simple_ocr,部署教程
开发语言·人工智能·python·ocr·数字识别·检测模型·英文符号识别
澜世32 分钟前
2024小迪安全基础入门第三课
网络·笔记·安全·网络安全
Bald Baby33 分钟前
JWT的使用
java·笔记·学习·servlet