数据挖掘与机器学习——机器学习概述

一、什么是机器学习

机器学习的英文名称叫Machine Learning,简称ML,该领域主要研究的是如何使计算机能够模拟人类的学习行为从而获得新的知识。

机器学习与数据挖掘的联系:简单来说,机器学习就是让计算机从大量

的数据中学习到相关的规律和逻辑,然后利用学习来的规律来预测以后的未知事物。

机器学习中非常重要的概念:训练,预测,模型

二、机器学习的分类

  • 按任务类型进行分类
  • 按监督模式进行分类
  • 最新方向:增强学习和深度学习

三、机器如何学习

通过模拟人类学习的步骤进行:

机器学习的六大步骤:

四、机器学习框架

scikit-learn(sklearn)是机器学习中一个常用的python第三方模块,网址:http://scikit-learn.org/stable/index.html
基于Scipy,Numpy,扩展,对一些常用的机器学习方法进行了封装
高扩展,spark等采用相同框架

五、示例(iris数据集进行展示)

数据集内容:

第一步:导入数据 & 数据分割

第二步:使用sklearn进行模型选择

第三步:使用sklearn进行模型训练

第四步:使用sklearn进行模型预测

第五步:机器学习评价的指标

如何实现:

交叉验证出现的原因:

  • 即使模型在训练集上表现良好,往往其在测试集上可能会出现表现不佳的情况。
  • 验证集-初步的评估。
  • 可用数据不够。

交叉验证的分类:

  • 简单交叉验证
  • K折叠交叉验证
  • 留一交叉验证

第六步:模型的保存

相关推荐
程序员-King.13 小时前
【Qt开源项目】— ModbusScope-day 4
开发语言·qt
美狐美颜sdk13 小时前
什么是美颜SDK?一套成熟直播美颜SDK需要解决哪些工程技术问题?
人工智能·美颜sdk·第三方美颜sdk·视频美颜sdk·人脸美型sdk
j_hy13 小时前
OOP组件及事件处理(一)
java·开发语言
南棱笑笑生13 小时前
20251215给飞凌OK3588-C开发板适配Rockchip原厂的Buildroot【linux-5.10】后调通typeC1接口
linux·c语言·开发语言·rockchip
无代码专家14 小时前
无代码:打破技术桎梏,重构企业数字化落地新范式
大数据·人工智能·重构
usrcnusrcn14 小时前
告别PoE管理盲区:有人物联网工业交换机如何以智能供电驱动工业未来
大数据·网络·人工智能·物联网·自动化
雍凉明月夜14 小时前
视觉opencv学习笔记Ⅴ-数据增强(1)
人工智能·python·opencv·计算机视觉
金牌归来发现妻女流落街头14 小时前
【阻塞队列的等待唤醒机制】
java·开发语言·阻塞队列
骚戴14 小时前
深入解析:Gemini 3.0 Pro 的 SSE 流式响应与跨区域延迟优化实践
java·人工智能·python·大模型·llm
毕设源码-朱学姐14 小时前
【开题答辩全过程】以 基于Java技术的羽毛球积分赛管理系统的设计与实现 为例,包含答辩的问题和答案
java·开发语言