数据挖掘可以挖掘什么类型的模式?

一、挖掘频繁模式、关联和相关性

频繁模式(frequent pettern)是在数据中频繁出现的模式。

频繁项集一般是指频繁的在事务数据集中一起出现的商品的集合。

频繁出现的子序列,如顾客倾向于先买相机,再买内存卡这样的模式就是一个(频繁)序列模式。

子结构可能涉及不同的机构模式,如图、数或格。如果一个子结构频繁出现,则可称为(频繁)结构模式。

挖掘频繁模式可以发现数据中有趣的关联和相关性。

关联规则可分为单维关联规则和多维关联规则。

二、用于预测分析的分类与回归

分类是找出描述和区分数据类或概念的模型,以便能够使用模型预测类标号未知的对象的类标号。

分类和回归是有监督的学习方法。数据集分为训练集和测试集。

分类是预测类别的标号。

回归是建立连续值函数模型,即用来预测难以获得的数据值或缺失的数据。

两种方法可以成为数值预测和类标号预测。

三、聚类分析

聚类分析是一种无监督的学习方法。

聚类的特点是最大化类簇间的距离、最小化类簇内样本的距离。

四、离群点分析

大部分数据挖掘方法都将离群点视为噪声或异常而丢弃。

但在欺诈检测等应用中,离群点的出现则很重要。


参考文献:数据挖掘:概念与技术(原书第三版)

相关推荐
thinkMoreAndDoMore9 分钟前
深度学习(3)-TensorFlow入门(梯度带)
人工智能·深度学习·tensorflow
Dream251215 分钟前
【Transformer架构】
人工智能·深度学习·transformer
黎智程16 分钟前
AI助力小微企业技术开发规范化管理 | 杂谈
人工智能
web1508541593539 分钟前
超级详细Spring AI运用Ollama大模型
人工智能·windows·spring
啊哈哈哈哈哈啊哈哈42 分钟前
J4打卡—— ResNet 和 DenseNet结合实现鸟类分类
人工智能·pytorch·分类
alden_ygq1 小时前
Ollama API 交互
人工智能·交互
小刘私坊1 小时前
机器梦境:AI如何在创意的狂野边疆上重塑艺术
人工智能
香橙薄荷心1 小时前
人工智能之自动驾驶技术体系
人工智能·机器学习·自动驾驶
孤寂大仙v1 小时前
深度学习入门:从零开始理解神经网络
人工智能·深度学习·神经网络
本就是菜鸟何必心太浮1 小时前
神经网络——梯度下溢
人工智能·深度学习·神经网络