机器学习概览

目录

1:AI,ML,DL概念以及关系

2:数据相关概念

1:术语

2:数据结构

3:数据集划分

4:算法分类

1:有监督

1:数据连续,回归任务

2:数据不连续,分类任务

2:无监督

3:半监督

4:强化学习

5:机器学习流程

6:评估模型

1:拟合

2:泛化

3:奥卡姆剃刀原则

7:虚拟环境

1:AI,ML,DL概念以及关系

  1. AI:人工智能,让机器像人一样思考
  2. ML:机器学习,在数据中找规律,根据规律预测
  3. DL:类神经网络
  4. ML是实现AI的途径,DL是ML的子集

2:数据相关概念

1:术语

  1. 样本(sample) //行
  2. 特征(feature) //列
  3. 标签(tabel) //预测

2:数据结构

  1. 有结构:二维数组
  2. 无结构:音频,视频
  3. 半结构:xml,json

3:数据集划分

一般按(8:2)(7:3)划分

  1. 训练集
  2. 测试集

4:算法分类

1:有监督

有人工标签

其数据分为连续和不连续

1:数据连续,回归任务

用回归算法

2:数据不连续,分类任务

用分类算法

2:无监督

无人工标签

用聚类算法

3:半监督

部分人工标签

4:强化学习

尽可能获取多的奖励分数,重复学习

5:机器学习流程

  1. 准备数据
  2. 数据预处理
  3. 特征工程
  4. 模型训练
  5. 模型评估
  6. 部署上线

6:评估模型

1:拟合

  1. 过拟合:训练集表现好,测试集表现差
  2. 欠拟合,训练集和测试集表现都差

2:泛化

模型在新数据的表现能力

3:奥卡姆剃刀原则

在相同泛化能力情况下,选择简单模型

7:虚拟环境

python 复制代码
conda env list #查看虚拟环境
conda create -n 环境名字 python = 版本号 #创建虚拟环境
conda activate 环境名 #启动环境
conda deactivate 环境名 #关闭环境
conda env remove -n环境名 #删除换进

然后安装包,pip install scikit-learn

相关推荐
NAGNIP16 小时前
一文搞懂深度学习中的通用逼近定理!
人工智能·算法·面试
冬奇Lab17 小时前
一天一个开源项目(第36篇):EverMemOS - 跨 LLM 与平台的长时记忆 OS,让 Agent 会记忆更会推理
人工智能·开源·资讯
冬奇Lab17 小时前
OpenClaw 源码深度解析(一):Gateway——为什么需要一个"中枢"
人工智能·开源·源码阅读
AngelPP21 小时前
OpenClaw 架构深度解析:如何把 AI 助手搬到你的个人设备上
人工智能
宅小年21 小时前
Claude Code 换成了Kimi K2.5后,我再也回不去了
人工智能·ai编程·claude
九狼21 小时前
Flutter URL Scheme 跨平台跳转
人工智能·flutter·github
ZFSS21 小时前
Kimi Chat Completion API 申请及使用
前端·人工智能
天翼云开发者社区1 天前
春节复工福利就位!天翼云息壤2500万Tokens免费送,全品类大模型一键畅玩!
人工智能·算力服务·息壤
知识浅谈1 天前
教你如何用 Gemini 将课本图片一键转为精美 PPT
人工智能
Ray Liang1 天前
被低估的量化版模型,小身材也能干大事
人工智能·ai·ai助手·mindx