数据挖掘与机器学习——机器学习概述

一、什么是机器学习

机器学习的英文名称叫Machine Learning,简称ML,该领域主要研究的是如何使计算机能够模拟人类的学习行为从而获得新的知识。

机器学习与数据挖掘的联系:简单来说,机器学习就是让计算机从大量

的数据中学习到相关的规律和逻辑,然后利用学习来的规律来预测以后的未知事物。

机器学习中非常重要的概念:训练,预测,模型

二、机器学习的分类

  • 按任务类型进行分类
  • 按监督模式进行分类
  • 最新方向:增强学习和深度学习

三、机器如何学习

通过模拟人类学习的步骤进行:

机器学习的六大步骤:

四、机器学习框架

scikit-learn(sklearn)是机器学习中一个常用的python第三方模块,网址:http://scikit-learn.org/stable/index.html
基于Scipy,Numpy,扩展,对一些常用的机器学习方法进行了封装
高扩展,spark等采用相同框架

五、示例(iris数据集进行展示)

数据集内容:

第一步:导入数据 & 数据分割

第二步:使用sklearn进行模型选择

第三步:使用sklearn进行模型训练

第四步:使用sklearn进行模型预测

第五步:机器学习评价的指标

如何实现:

交叉验证出现的原因:

  • 即使模型在训练集上表现良好,往往其在测试集上可能会出现表现不佳的情况。
  • 验证集-初步的评估。
  • 可用数据不够。

交叉验证的分类:

  • 简单交叉验证
  • K折叠交叉验证
  • 留一交叉验证

第六步:模型的保存

相关推荐
人生游戏牛马NPC1号1 分钟前
学习 Android (二十一) 学习 OpenCV (六)
android·opencv·学习
yongche_shi2 分钟前
第二篇:Python“装包”与“拆包”的艺术:可迭代对象、迭代器、生成器
开发语言·python·面试·面试宝典·生成器·拆包·装包
嘀咕博客2 分钟前
SafeEar:浙大和清华联合推出的AI音频伪造检测框架,错误率低至2.02%
人工智能·音视频·ai工具
Hello123网站2 分钟前
FinChat-金融领域的ChatGPT
人工智能·chatgpt·金融·ai工具
嘀咕博客8 分钟前
PixVerse -免费在线AI视频生成工具
人工智能·音视频·ai工具
mit6.82421 分钟前
[rStar] 解决方案节点 | `BaseNode` | `MCTSNode`
人工智能·python·算法
Elastic 中国社区官方博客25 分钟前
介绍 Python Elasticsearch Client 的 ES|QL 查询构建器
大数据·开发语言·数据库·python·elasticsearch·搜索引擎·全文检索
Hóng xīng qiáo28 分钟前
swVBA自学笔记014、Lisp适合对SolidWorks进行二次开发吗 ?
开发语言·笔记·lisp
普蓝机器人29 分钟前
AutoTrack-IR-DR200底盘仿真详解:为教育领域打造的高效机器人学习实验平台
人工智能·学习·计算机视觉·机器人·移动机器人·三维仿真导航
带鱼吃猫1 小时前
C++的诗行:一文读懂C++的继承机制
开发语言·c++·学习·visual studio