数据挖掘概览

数据挖掘(Data Mining)就是从大量的,不完全的,有噪声的,模糊的,随机的实际应用数据中,提取隐含在其中的,人们事先不知道的,但又是潜在有用的信息和知识的过程.

预测性数据挖掘

分类

定义:分类就是把一些新的数据项映射到给定类别中的某一个类别

分类流程:①特征提取

②特征选择

③分类

常用的分类方法:

  • 决策树
  • 贝叶斯分类
  • 神经网络
  • 支持向量机(SVM)
  • K近邻分类(KNN)
  • CART算法
  • ID3算法
  • C4.算法

分类与聚类的最大区别在于,分类数据中的一部分的类别是已知的,而聚类数据的类别未知。

回归

应用现有的数值来预测其他数值是什么.

描述性数据挖掘

聚类

聚类的目的是把数据对象分成各个聚类,各个蔟.

关联分析

帮助识别数据库中数值之间的关系

关联规则(Association rule):指从事务数据库、关系数据库和其他信息存储中的大量数据的项集之间发现有趣的、频繁出现的模式、关联和相关性。

关联分析(Association analysis):用于发现隐藏在大型数据集中的令人感兴趣的联系。所发现的联系可以用关联规则或者频繁项集的形式表示。关联规则挖掘就是从大量的数据中挖掘出描述数据项之间相互联系的有价值的有关知识。

关联规则分类

1)基于规则中处理的变量的类别,关联规则可以分为布尔型和数值型。

2)基于规则中数据的抽象层次,可以分为单层关联规则和多层关联规则。

3)基于规则中涉及到的数据的维数,关联规则可以分为单维的和多维的。

相关推荐
愚公搬代码1 分钟前
【愚公系列】《移动端AI应用开发》017-Android端应用开发(网络通信与API集成)
android·人工智能
零梦ing1 分钟前
零基础将deepseek和mimo接入codex(codex管理工具版)
人工智能
前端的阶梯2 分钟前
Conda 开发 Python 程序完全指南
前端·人工智能·后端
程序员cxuan4 分钟前
AI 时代,如何超过大多数人
人工智能·后端·程序员
库拉大叔5 分钟前
GPT-5.5 多模态能力实战:2026 年 AI 工具进阶使用指南
人工智能·gpt·aigc
海兰7 分钟前
【红楼梦:第二篇】梦境漫游,详细设计指南
人工智能·游戏
code bean7 分钟前
【LangChain】 文本分割器全景指南:从 RecursiveCharacterTextSplitter 到各类分割器对比
人工智能·自然语言处理·langchain
暗夜猎手-大魔王7 分钟前
hermes源码学习3-Agent Loop 内部机制
人工智能·学习
ting945200010 分钟前
Superlog 开源自主可观测性工具全栈技术深度剖析
人工智能·架构·开源
学计算机的计算基16 分钟前
2026 年 AI 助手三国杀:Claude Code vs 腾讯马维斯 vs MiniMax Mavis,我同时用了三周,结论很意外
java·人工智能·python·算法·langchain