机器学习概览

目录

1:AI,ML,DL概念以及关系

2:数据相关概念

1:术语

2:数据结构

3:数据集划分

4:算法分类

1:有监督

1:数据连续,回归任务

2:数据不连续,分类任务

2:无监督

3:半监督

4:强化学习

5:机器学习流程

6:评估模型

1:拟合

2:泛化

3:奥卡姆剃刀原则

7:虚拟环境

1:AI,ML,DL概念以及关系

  1. AI:人工智能,让机器像人一样思考
  2. ML:机器学习,在数据中找规律,根据规律预测
  3. DL:类神经网络
  4. ML是实现AI的途径,DL是ML的子集

2:数据相关概念

1:术语

  1. 样本(sample) //行
  2. 特征(feature) //列
  3. 标签(tabel) //预测

2:数据结构

  1. 有结构:二维数组
  2. 无结构:音频,视频
  3. 半结构:xml,json

3:数据集划分

一般按(8:2)(7:3)划分

  1. 训练集
  2. 测试集

4:算法分类

1:有监督

有人工标签

其数据分为连续和不连续

1:数据连续,回归任务

用回归算法

2:数据不连续,分类任务

用分类算法

2:无监督

无人工标签

用聚类算法

3:半监督

部分人工标签

4:强化学习

尽可能获取多的奖励分数,重复学习

5:机器学习流程

  1. 准备数据
  2. 数据预处理
  3. 特征工程
  4. 模型训练
  5. 模型评估
  6. 部署上线

6:评估模型

1:拟合

  1. 过拟合:训练集表现好,测试集表现差
  2. 欠拟合,训练集和测试集表现都差

2:泛化

模型在新数据的表现能力

3:奥卡姆剃刀原则

在相同泛化能力情况下,选择简单模型

7:虚拟环境

python 复制代码
conda env list #查看虚拟环境
conda create -n 环境名字 python = 版本号 #创建虚拟环境
conda activate 环境名 #启动环境
conda deactivate 环境名 #关闭环境
conda env remove -n环境名 #删除换进

然后安装包,pip install scikit-learn

相关推荐
哈__11 小时前
CANN加速Image-to-Image转换:风格迁移与图像编辑优化
人工智能·计算机视觉
ujainu11 小时前
解码昇腾AI的“中枢神经”:CANN开源仓库全景式技术解析
人工智能·开源·cann
Elastic 中国社区官方博客11 小时前
Elasticsearch:Workflows 介绍 - 9.3
大数据·数据库·人工智能·elasticsearch·ai·全文检索
组合缺一11 小时前
Solon AI (Java) v3.9 正式发布:全能 Skill 爆发,Agent 协作更专业!仍然支持 java8!
java·人工智能·ai·llm·agent·solon·mcp
哈__11 小时前
CANN: AI 生态的异构计算核心,从架构到实战全解析
人工智能·架构
熊猫钓鱼>_>11 小时前
移动端开发技术选型报告:三足鼎立时代的开发者指南(2026年2月)
android·人工智能·ios·app·鸿蒙·cpu·移动端
想你依然心痛11 小时前
ModelEngine·AI 应用开发实战:从智能体到可视化编排的全栈实践
人工智能·智能体·ai应用·modelengine
KIKIiiiiiiii11 小时前
微信个人号API二次开发中的解决经验
java·人工智能·python·微信
哈哈你是真的厉害12 小时前
解构 AIGC 的“核动力”引擎:华为 CANN 如何撑起万亿参数的大模型时代
人工智能·aigc·cann
Ekehlaft12 小时前
这款国产 AI,让 Python 小白也能玩转编程
开发语言·人工智能·python·ai·aipy