机器学习概览

目录

1:AI,ML,DL概念以及关系

2:数据相关概念

1:术语

2:数据结构

3:数据集划分

4:算法分类

1:有监督

1:数据连续,回归任务

2:数据不连续,分类任务

2:无监督

3:半监督

4:强化学习

5:机器学习流程

6:评估模型

1:拟合

2:泛化

3:奥卡姆剃刀原则

7:虚拟环境

1:AI,ML,DL概念以及关系

  1. AI:人工智能,让机器像人一样思考
  2. ML:机器学习,在数据中找规律,根据规律预测
  3. DL:类神经网络
  4. ML是实现AI的途径,DL是ML的子集

2:数据相关概念

1:术语

  1. 样本(sample) //行
  2. 特征(feature) //列
  3. 标签(tabel) //预测

2:数据结构

  1. 有结构:二维数组
  2. 无结构:音频,视频
  3. 半结构:xml,json

3:数据集划分

一般按(8:2)(7:3)划分

  1. 训练集
  2. 测试集

4:算法分类

1:有监督

有人工标签

其数据分为连续和不连续

1:数据连续,回归任务

用回归算法

2:数据不连续,分类任务

用分类算法

2:无监督

无人工标签

用聚类算法

3:半监督

部分人工标签

4:强化学习

尽可能获取多的奖励分数,重复学习

5:机器学习流程

  1. 准备数据
  2. 数据预处理
  3. 特征工程
  4. 模型训练
  5. 模型评估
  6. 部署上线

6:评估模型

1:拟合

  1. 过拟合:训练集表现好,测试集表现差
  2. 欠拟合,训练集和测试集表现都差

2:泛化

模型在新数据的表现能力

3:奥卡姆剃刀原则

在相同泛化能力情况下,选择简单模型

7:虚拟环境

python 复制代码
conda env list #查看虚拟环境
conda create -n 环境名字 python = 版本号 #创建虚拟环境
conda activate 环境名 #启动环境
conda deactivate 环境名 #关闭环境
conda env remove -n环境名 #删除换进

然后安装包,pip install scikit-learn

相关推荐
kjmkq2 分钟前
2026实战效果优选GEO服务商测评:效果好+服务优首选合作
大数据·人工智能
明志数科3 分钟前
机器人数据采集方案设计:从场景到落地的完整指南
人工智能·数据挖掘
neocheng_5225 分钟前
周末独处充电,深耕AI技能打造长期竞争力
人工智能
2501_945837435 分钟前
OpenClaw:重塑 AI 执行边界的开源智能体
人工智能
旧曲重听17 分钟前
我的Vibe Coding一周记…
前端·人工智能·程序人生·面试
开开心心_Every8 分钟前
能把网页藏在Word里的实用摸鱼工具
人工智能·科技·目标跟踪·pdf·计算机外设·语音识别·mllib
互联圈运营观察11 分钟前
深圳干式变压器智能温控箱哪家强?2026年专业测评与选型指南
大数据·人工智能
byte轻骑兵12 分钟前
【HID】规范精讲[19]: 蓝牙HID设备SDP交互实战——从服务搜索到属性解析的全流程拆解
人工智能·人机交互·键盘·hid·蓝牙遥控
沐风_ZTL13 分钟前
RKNN YOLOv5 推理直接使用 NV12 视频帧可行性分析
人工智能·yolo·音视频
wenzhangli715 分钟前
OoderAI V3.5.0 技术白皮书——NLP 驱动的 AI 原生开发平台
人工智能·自然语言处理