数据挖掘与机器学习——机器学习概述

一、什么是机器学习

机器学习的英文名称叫Machine Learning,简称ML,该领域主要研究的是如何使计算机能够模拟人类的学习行为从而获得新的知识。

机器学习与数据挖掘的联系:简单来说,机器学习就是让计算机从大量

的数据中学习到相关的规律和逻辑,然后利用学习来的规律来预测以后的未知事物。

机器学习中非常重要的概念:训练,预测,模型

二、机器学习的分类

  • 按任务类型进行分类
  • 按监督模式进行分类
  • 最新方向:增强学习和深度学习

三、机器如何学习

通过模拟人类学习的步骤进行:

机器学习的六大步骤:

四、机器学习框架

scikit-learn(sklearn)是机器学习中一个常用的python第三方模块,网址:http://scikit-learn.org/stable/index.html
基于Scipy,Numpy,扩展,对一些常用的机器学习方法进行了封装
高扩展,spark等采用相同框架

五、示例(iris数据集进行展示)

数据集内容:

第一步:导入数据 & 数据分割

第二步:使用sklearn进行模型选择

第三步:使用sklearn进行模型训练

第四步:使用sklearn进行模型预测

第五步:机器学习评价的指标

如何实现:

交叉验证出现的原因:

  • 即使模型在训练集上表现良好,往往其在测试集上可能会出现表现不佳的情况。
  • 验证集-初步的评估。
  • 可用数据不够。

交叉验证的分类:

  • 简单交叉验证
  • K折叠交叉验证
  • 留一交叉验证

第六步:模型的保存

相关推荐
roman_日积跬步-终至千里4 分钟前
【Java并发】多线程/并发问题集
java·开发语言
调皮连续波(rsp_tiaopige)8 分钟前
毫米波雷达 : OpenRadar(Matlab版本)正式发布
开发语言·matlab
xian_wwq11 分钟前
【学习笔记】对网络安全“三化六防挂图作战”的理解与思考
笔记·学习·三化六防
loui robot12 分钟前
规划与控制之局部路径规划算法local_planner
人工智能·算法·自动驾驶
玄同76515 分钟前
Llama.cpp 全实战指南:跨平台部署本地大模型的零门槛方案
人工智能·语言模型·自然语言处理·langchain·交互·llama·ollama
格林威18 分钟前
Baumer相机金属焊缝缺陷识别:提升焊接质量检测可靠性的 7 个关键技术,附 OpenCV+Halcon 实战代码!
人工智能·数码相机·opencv·算法·计算机视觉·视觉检测·堡盟相机
冷雨夜中漫步19 分钟前
python反转列表reverse()和[::-1]哪个效率更高
开发语言·python
rainbow688921 分钟前
Python面向对象编程与异常处理实战
开发语言·python
独处东汉26 分钟前
freertos开发空气检测仪之按键输入事件管理系统设计与实现
人工智能·stm32·单片机·嵌入式硬件·unity
你大爷的,这都没注册了26 分钟前
AI提示词,zero-shot,few-shot 概念
人工智能