数据仓库与数据挖掘

1.数据挖掘的概念

数据挖掘(Data mining),又译为资料探勘、数据采矿。它是数据库知识发现(Knowledge-Discovery in Databases,KDD)中的一个步骤。

数据挖掘一般是指从大量的数据中通过算法搜索隐藏于其中的信息的过程。

数据挖掘通常与计算机科学有关,并通过统计、在线分析处理、情报检索、机器学习、专家系统(依靠过去的经验法则)和模式识别等诸多方法来实现上述目标。

数据挖掘是从数据库的大量数据中揭示出隐含的、先前未知的并有潜在价值的信息的非平凡过程,主要任务有聚类分析、分类分析、关联规则挖掘等。

2.数据挖掘的3个步骤

数据挖掘是通过分析每个数据,从大量数据中寻找其规律的技术,主要有数据准备、规律寻找和规律表示3个步骤。

2.1数据准备

数据准备是从相关的数据源中选取所需的数据并整合成用于数据挖掘的数据集;

2.2规律寻找

规律寻找是用某种方法将数据集所含的规律找出来;

2.3规律表示

规律表示是尽可能以用户可理解的方式(如可视化)将找出的规律表示出来。

3.数据挖掘的任务

数据挖掘的任务有关联分析、聚类分析、分类分析、异常分析、特异群组分析和演变分析等。

相关推荐
砚边数影1 分钟前
架构演进:从单一NoSQL到“一库多模”的融合实践
数据库·oracle·kingbase·kingbasees·数据库平替用金仓·金仓数据库
清风~徐~来8 分钟前
【视频点播系统】Redis-SDK 介绍及使用
数据库·redis·wpf
SelectDB技术团队15 分钟前
日志成本降低 83%:云上 Elasticsearch 和 SelectDB 的基准测试及成本分析
数据库·apache
全栈前端老曹21 分钟前
【Redis】Redis 客户端连接与编程实践——Python/Java/Node.js 连接 Redis、实现计数器、缓存接口
前端·数据库·redis·python·缓存·全栈
霖霖总总21 分钟前
[小技巧72]AFTER COMMIT vs AFTER SYNC:MySQL 半同步复制的持久性博弈
数据库·mysql
麦聪聊数据22 分钟前
后端研发范式演进:从对象映射(ORM)到逻辑解耦(SQL2API)
数据库·sql·架构
爱敲代码的小鱼28 分钟前
后端web开发Mysql数据库:
数据库·mysql
Franciz小测测29 分钟前
GitLab 双物理机高可用新方案(基于 Rsyncd + Keepalived+PostgreSQL 流复制)
数据库·postgresql·gitlab
野犬寒鸦31 分钟前
WebSocket协同编辑:高性能Disruptor架构揭秘及项目中的实战应用
java·开发语言·数据库·redis·后端
鸽芷咕31 分钟前
迁移即一致!金仓数据库内置数据校验能力如何支撑信创平滑替换?
数据库