数据挖掘笔记part one (认识数据挖掘)

定义

从大量的,不完全的,有噪音的,模糊的,随机的数据中提取出存在潜在价值信息和知识的过程。

数据,信息,知识的关系

数据>信息>情报>知识>智慧(越小越精炼,越牛)

数据挖掘流程

数据--(筛选)--目标数据--(预处理)--已处理数据--(变换)--变换后数据--(数据挖掘)--模式

关联规则挖掘

通过样本数据来预测-------买面包后是否买牛奶的问题

分类和聚类

分类:有标签的学习(有对数据的明确定义,然后在对数据贴标签)

聚类:有学习的标签(先对数据进行学习,后面在判断并贴上标签)

eg:人的认识是从聚类到分类的过程

相关推荐
sp_fyf_20241 小时前
【大语言模型-论文精读】谷歌-BERT:用于语言理解的预训练深度双向Transformers
人工智能·语言模型·bert
算家云2 小时前
PhotoMaker部署文档
人工智能·aigc·conda·图像生成·comfyui·工作流·文本转图像
五羟基己醛2 小时前
【学习笔记】SquareLine Studio安装教程(LVGL官方工具)
笔记·学习·ui
小猪包3333 小时前
ai论文写作软件哪个好?分享5款ai论文题目生成器
人工智能·深度学习·计算机视觉·ai写作
歌者長門3 小时前
AD21中如何给过孔添加盖油
笔记·学习·pcb工艺
HL_LOVE_C4 小时前
架构设计笔记-7-系统架构设计基础知识
笔记·系统架构·软考·架构设计
云翼时代科技4 小时前
【探索艺术新纪元:Midjourney中文版,让创意无界!】
人工智能
坚持学习的你4 小时前
Jax(Random、Numpy)常用函数
人工智能·pytorch·python·jax
小狮子安度因4 小时前
Linux源码阅读笔记-以太网驱动分析
linux·运维·笔记
KGback4 小时前
【项目记录】大模型基于llama.cpp在Qemu-riscv64向量扩展指令下的部署
人工智能·llama·riscv