机器学习概览

目录

1:AI,ML,DL概念以及关系

2:数据相关概念

1:术语

2:数据结构

3:数据集划分

4:算法分类

1:有监督

1:数据连续,回归任务

2:数据不连续,分类任务

2:无监督

3:半监督

4:强化学习

5:机器学习流程

6:评估模型

1:拟合

2:泛化

3:奥卡姆剃刀原则

7:虚拟环境

1:AI,ML,DL概念以及关系

  1. AI:人工智能,让机器像人一样思考
  2. ML:机器学习,在数据中找规律,根据规律预测
  3. DL:类神经网络
  4. ML是实现AI的途径,DL是ML的子集

2:数据相关概念

1:术语

  1. 样本(sample) //行
  2. 特征(feature) //列
  3. 标签(tabel) //预测

2:数据结构

  1. 有结构:二维数组
  2. 无结构:音频,视频
  3. 半结构:xml,json

3:数据集划分

一般按(8:2)(7:3)划分

  1. 训练集
  2. 测试集

4:算法分类

1:有监督

有人工标签

其数据分为连续和不连续

1:数据连续,回归任务

用回归算法

2:数据不连续,分类任务

用分类算法

2:无监督

无人工标签

用聚类算法

3:半监督

部分人工标签

4:强化学习

尽可能获取多的奖励分数,重复学习

5:机器学习流程

  1. 准备数据
  2. 数据预处理
  3. 特征工程
  4. 模型训练
  5. 模型评估
  6. 部署上线

6:评估模型

1:拟合

  1. 过拟合:训练集表现好,测试集表现差
  2. 欠拟合,训练集和测试集表现都差

2:泛化

模型在新数据的表现能力

3:奥卡姆剃刀原则

在相同泛化能力情况下,选择简单模型

7:虚拟环境

python 复制代码
conda env list #查看虚拟环境
conda create -n 环境名字 python = 版本号 #创建虚拟环境
conda activate 环境名 #启动环境
conda deactivate 环境名 #关闭环境
conda env remove -n环境名 #删除换进

然后安装包,pip install scikit-learn

相关推荐
福客AI智能客服2 小时前
智能跟单革新:AI客服软件与人工智能客服机器人重构服务链路价值
人工智能·机器人
GISer_Jing2 小时前
从工具辅助到AI开发前端新范式
前端·人工智能·aigc
美狐美颜SDK开放平台2 小时前
从抖音到私域直播:抖动特效正在重塑直播美颜sdk
前端·人工智能·第三方美颜sdk·视频美颜sdk·美狐美颜sdk
努力犯错2 小时前
如何使用AI图片放大器提升图片质量:2026年完整指南
人工智能
云和数据.ChenGuang2 小时前
鲲鹏HPC+AI赋能风电产业 筑牢绿电根基 助力双碳目标落地
人工智能
云飞云共享云桌面2 小时前
SolidWorks如何实现多人共享
服务器·前端·数据库·人工智能·3d
EchoL、2 小时前
【论文阅读】Generative Text Steganography with Large Language Model(MM‘24)
论文阅读·人工智能·语言模型
Chef_Chen2 小时前
数据科学每日总结--Day47--计算机视觉
图像处理·人工智能·计算机视觉
Pythonliu72 小时前
BindCraft Installation 使用
人工智能·pytorch·计算化学