数据挖掘概览

数据挖掘(Data Mining)就是从大量的,不完全的,有噪声的,模糊的,随机的实际应用数据中,提取隐含在其中的,人们事先不知道的,但又是潜在有用的信息和知识的过程.

预测性数据挖掘

分类

定义:分类就是把一些新的数据项映射到给定类别中的某一个类别

分类流程:①特征提取

②特征选择

③分类

常用的分类方法:

  • 决策树
  • 贝叶斯分类
  • 神经网络
  • 支持向量机(SVM)
  • K近邻分类(KNN)
  • CART算法
  • ID3算法
  • C4.算法

分类与聚类的最大区别在于,分类数据中的一部分的类别是已知的,而聚类数据的类别未知。

回归

应用现有的数值来预测其他数值是什么.

描述性数据挖掘

聚类

聚类的目的是把数据对象分成各个聚类,各个蔟.

关联分析

帮助识别数据库中数值之间的关系

关联规则(Association rule):指从事务数据库、关系数据库和其他信息存储中的大量数据的项集之间发现有趣的、频繁出现的模式、关联和相关性。

关联分析(Association analysis):用于发现隐藏在大型数据集中的令人感兴趣的联系。所发现的联系可以用关联规则或者频繁项集的形式表示。关联规则挖掘就是从大量的数据中挖掘出描述数据项之间相互联系的有价值的有关知识。

关联规则分类

1)基于规则中处理的变量的类别,关联规则可以分为布尔型和数值型。

2)基于规则中数据的抽象层次,可以分为单层关联规则和多层关联规则。

3)基于规则中涉及到的数据的维数,关联规则可以分为单维的和多维的。

相关推荐
Leinwin4 小时前
智能体驱动业务转型:Microsoft Copilot Studio平台全面升级
人工智能·microsoft·copilot
腾飞开源4 小时前
17_Spring AI 干货笔记之谷歌生成式AI聊天
人工智能·多模态·工具调用·gemini·spring ai·google genai·思维配置
qxbs4 小时前
汽修帮手资料库终身免费使用——首家免费资料库网站,查汽车维修资料就用汽修帮手,里面几万套车型维修手册电路图保养手册培训资料针脚定义保险丝图解
人工智能·汽车
算法与编程之美4 小时前
理解pytorch中的L2正则项
人工智能·pytorch·python·深度学习·机器学习
学兔兔VIP4 小时前
多模态AI融合的电力边缘物联终端研究与应用
人工智能·物联网·电力系统·智能终端·多模态ai
阿恩.7705 小时前
金融经济学国际期刊/会议:前沿研究与创新
大数据·人工智能·笔记·计算机网络
smart19985 小时前
Infortrend普安存储GS支持GPU Direct存储,带宽最大化适合AI/HPC/科研制造
人工智能·能源·制造·智能硬件
R-G-B5 小时前
【P19 机器学习-分类算法及应用实践】手写数字识别(KNN)
python·机器学习·分类·手写数字识别·knn算法
南极星10055 小时前
OPENCV(python)--初学之路(十二)霍夫线/圆变换
人工智能·opencv·计算机视觉
roman_日积跬步-终至千里5 小时前
【模式识别与机器学习】机器学习练习题集
人工智能·机器学习