机器学习概览

目录

1:AI,ML,DL概念以及关系

2:数据相关概念

1:术语

2:数据结构

3:数据集划分

4:算法分类

1:有监督

1:数据连续,回归任务

2:数据不连续,分类任务

2:无监督

3:半监督

4:强化学习

5:机器学习流程

6:评估模型

1:拟合

2:泛化

3:奥卡姆剃刀原则

7:虚拟环境

1:AI,ML,DL概念以及关系

  1. AI:人工智能,让机器像人一样思考
  2. ML:机器学习,在数据中找规律,根据规律预测
  3. DL:类神经网络
  4. ML是实现AI的途径,DL是ML的子集

2:数据相关概念

1:术语

  1. 样本(sample) //行
  2. 特征(feature) //列
  3. 标签(tabel) //预测

2:数据结构

  1. 有结构:二维数组
  2. 无结构:音频,视频
  3. 半结构:xml,json

3:数据集划分

一般按(8:2)(7:3)划分

  1. 训练集
  2. 测试集

4:算法分类

1:有监督

有人工标签

其数据分为连续和不连续

1:数据连续,回归任务

用回归算法

2:数据不连续,分类任务

用分类算法

2:无监督

无人工标签

用聚类算法

3:半监督

部分人工标签

4:强化学习

尽可能获取多的奖励分数,重复学习

5:机器学习流程

  1. 准备数据
  2. 数据预处理
  3. 特征工程
  4. 模型训练
  5. 模型评估
  6. 部署上线

6:评估模型

1:拟合

  1. 过拟合:训练集表现好,测试集表现差
  2. 欠拟合,训练集和测试集表现都差

2:泛化

模型在新数据的表现能力

3:奥卡姆剃刀原则

在相同泛化能力情况下,选择简单模型

7:虚拟环境

python 复制代码
conda env list #查看虚拟环境
conda create -n 环境名字 python = 版本号 #创建虚拟环境
conda activate 环境名 #启动环境
conda deactivate 环境名 #关闭环境
conda env remove -n环境名 #删除换进

然后安装包,pip install scikit-learn

相关推荐
机器之心6 小时前
Claude Fable 5四日惊魂
人工智能·openai
机器之心6 小时前
打破SWE-bench唯分数论,首个独立测量harness的基准开源了
人工智能·openai
江畔柳前堤7 小时前
github实战指南07-CLI 与高级技巧
前端·人工智能·chrome·深度学习·github·caffe·issue
右耳朵猫AI7 小时前
GitHub周趋势2026W23 | last30days-skill AI搜索、headroom令牌压缩、apple/container开源
人工智能·开源·github
ZhengEnCi7 小时前
09ba-斯坦福CS336作业一-前馈网络
人工智能
武子康7 小时前
调查研究-175 Supermemory:AI 时代的 Memory API,不只是另一个向量数据库
人工智能·openai
寒山李白7 小时前
人工智能训练师报考指南
人工智能·ai·证书·职称·训练师
努力努力再努力FFF7 小时前
大学四年AI能力规划:从入门学习到简历表达
人工智能·学习
Litluecat7 小时前
配合多角色提示语3,学习AI漫剧(刚开始学)
人工智能·学习·ai·提示词·短剧·漫剧
xixingzhe27 小时前
AI开发工具-大需求
人工智能