数据挖掘笔记part one (认识数据挖掘)

定义

从大量的,不完全的,有噪音的,模糊的,随机的数据中提取出存在潜在价值信息和知识的过程。

数据,信息,知识的关系

数据>信息>情报>知识>智慧(越小越精炼,越牛)

数据挖掘流程

数据--(筛选)--目标数据--(预处理)--已处理数据--(变换)--变换后数据--(数据挖掘)--模式

关联规则挖掘

通过样本数据来预测-------买面包后是否买牛奶的问题

分类和聚类

分类:有标签的学习(有对数据的明确定义,然后在对数据贴标签)

聚类:有学习的标签(先对数据进行学习,后面在判断并贴上标签)

eg:人的认识是从聚类到分类的过程

相关推荐
im_AMBER13 分钟前
React 15
前端·javascript·笔记·学习·react.js·前端框架
许泽宇的技术分享15 分钟前
AI黑客来袭:Strix如何用大模型重新定义渗透测试游戏规则
人工智能
Oxo Security22 分钟前
【AI安全】检索增强生成(RAG)
人工智能·安全·网络安全·ai
WarPigs25 分钟前
Visual Studio笔记
ide·笔记·visual studio
少林码僧25 分钟前
2.3 Transformer 变体与扩展:BERT、GPT 与多模态模型
人工智能·gpt·ai·大模型·bert·transformer·1024程序员节
shayudiandian28 分钟前
如何使用 DeepSeek 帮助自己的工作
人工智能
卡提西亚31 分钟前
C++笔记-24-文件读写操作
开发语言·c++·笔记
雾岛听蓝32 分钟前
算法复杂度解析:时间与空间的衡量
c语言·数据结构·经验分享·笔记
程序猿追1 小时前
轻量级云原生体验:在OpenEuler 25.09上快速部署单节点K3s
人工智能·科技·机器学习·unity·游戏引擎
yuxb731 小时前
LNMP部署及应用
笔记·云计算