数据仓库与数据挖掘

1.数据挖掘的概念

数据挖掘(Data mining),又译为资料探勘、数据采矿。它是数据库知识发现(Knowledge-Discovery in Databases,KDD)中的一个步骤。

数据挖掘一般是指从大量的数据中通过算法搜索隐藏于其中的信息的过程。

数据挖掘通常与计算机科学有关,并通过统计、在线分析处理、情报检索、机器学习、专家系统(依靠过去的经验法则)和模式识别等诸多方法来实现上述目标。

数据挖掘是从数据库的大量数据中揭示出隐含的、先前未知的并有潜在价值的信息的非平凡过程,主要任务有聚类分析、分类分析、关联规则挖掘等。

2.数据挖掘的3个步骤

数据挖掘是通过分析每个数据,从大量数据中寻找其规律的技术,主要有数据准备、规律寻找和规律表示3个步骤。

2.1数据准备

数据准备是从相关的数据源中选取所需的数据并整合成用于数据挖掘的数据集;

2.2规律寻找

规律寻找是用某种方法将数据集所含的规律找出来;

2.3规律表示

规律表示是尽可能以用户可理解的方式(如可视化)将找出的规律表示出来。

3.数据挖掘的任务

数据挖掘的任务有关联分析、聚类分析、分类分析、异常分析、特异群组分析和演变分析等。

相关推荐
胖咕噜的稞达鸭18 分钟前
算法入门:滑动窗口--->找到字符串中所有的字母异位词,串联所有的子串,最小覆盖子串
数据库·redis·算法
SelectDB35 分钟前
上海证券 SelectDB 升级实践:湖仓流批一体落地与 Elasticsearch 全面替换
数据库·apache
一个天蝎座 白勺 程序猿43 分钟前
KingbaseES在政务领域的应用实践——武汉人社大数据平台“数字化服务新模式”
大数据·数据库·政务·kingbasees·金仓数据库
f***01932 小时前
【MySQL】JDBC的连接
数据库·mysql
5***T4482 小时前
开启mysql的binlog日志
数据库·mysql
q***33372 小时前
UNION 和 UNION ALL 的区别:深入解析 SQL 中的合并操作
数据库·sql·oracle
郑重其事,鹏程万里2 小时前
关系型数据库(derby)
数据库
Elastic 中国社区官方博客2 小时前
使用 A2A 协议和 MCP 在 Elasticsearch 中创建一个 LLM agent 新闻室:第二部分
大数据·数据库·人工智能·elasticsearch·搜索引擎·ai·全文检索
秋邱2 小时前
价值升维!公益赋能 + 绿色技术 + 终身学习,构建可持续教育 AI 生态
网络·数据库·人工智能·redis·python·学习·docker
郑重其事,鹏程万里2 小时前
关系型数据库(h2)
数据库