数据仓库与数据挖掘

1.数据挖掘的概念

数据挖掘(Data mining),又译为资料探勘、数据采矿。它是数据库知识发现(Knowledge-Discovery in Databases,KDD)中的一个步骤。

数据挖掘一般是指从大量的数据中通过算法搜索隐藏于其中的信息的过程。

数据挖掘通常与计算机科学有关,并通过统计、在线分析处理、情报检索、机器学习、专家系统(依靠过去的经验法则)和模式识别等诸多方法来实现上述目标。

数据挖掘是从数据库的大量数据中揭示出隐含的、先前未知的并有潜在价值的信息的非平凡过程,主要任务有聚类分析、分类分析、关联规则挖掘等。

2.数据挖掘的3个步骤

数据挖掘是通过分析每个数据,从大量数据中寻找其规律的技术,主要有数据准备、规律寻找和规律表示3个步骤。

2.1数据准备

数据准备是从相关的数据源中选取所需的数据并整合成用于数据挖掘的数据集;

2.2规律寻找

规律寻找是用某种方法将数据集所含的规律找出来;

2.3规律表示

规律表示是尽可能以用户可理解的方式(如可视化)将找出的规律表示出来。

3.数据挖掘的任务

数据挖掘的任务有关联分析、聚类分析、分类分析、异常分析、特异群组分析和演变分析等。

相关推荐
Zoey的笔记本34 分钟前
2026告别僵化工作流:支持自定义字段的看板工具选型与部署指南
大数据·前端·数据库
静听山水35 分钟前
docker安装starrocks
数据库
学编程的小程1 小时前
从“兼容”到“超越”:金仓KESBSON引擎如何借多模融合改写文档数据库规则
数据库
千层冷面1 小时前
数据库分库分表
java·数据库·mysql·oracle
DBA小马哥2 小时前
金仓数据库引领国产化替代新范式:构建高效、安全的文档型数据库迁移解决方案
数据库·安全·mongodb·dba·迁移学习
企业对冲系统官2 小时前
基差风险管理系统日志分析功能的架构与实现
大数据·网络·数据库·算法·github·动态规划
冉冰学姐2 小时前
SSM学毕电设信息采集系统74v6w(程序+源码+数据库+调试部署+开发环境)带论文文档1万字以上,文末可获取,系统界面在最后面
数据库·学生管理·ssm 框架应用·学毕电设·信息采集系统
茁壮成长的露露3 小时前
MongoDB备份恢复工具mongodump、mongorestore
数据库·mongodb
香气袭人知骤暖3 小时前
SQL慢查询常见优化步骤
android·数据库·sql
Star Learning Python3 小时前
MySQL日期时间的处理函数
数据库·sql