数据分析与数据挖掘

一、数据分析和数据挖掘的概念

从规范的概念上来说:

数据分析是指用适当的统计分析的方法对收集来的大量数据进行分析,提取有用信息和形成结论而对数据加以详细研究和概括总结的过程。

数据挖掘是在大型数据存储库中,自动地发现有用的信息的过程。

大白话说:其实数据分析和数据挖掘都是从数据中提取有用信息的过程。只不过是他们两个的提取方法和侧重不相同。数据分析侧重于用统计学的方法从现有数据中分析出信息;数据挖掘侧重于利用机器学习技术从大量数据中挖掘出有用信息的过程。

二、数据分析和数据挖掘需要掌握的三方面要素

工具:R语言、Python语言、Excel、PPT、Hive、Spark、MySQL、Orcal等等

思维:"树"和"田"

理论:

三、探索性数据分析

(1)、集中趋势

平均值、中位数、众数

(2)、离散程度

表示离散程度的几个指标:极差、标准差、方差、变异系数

(3)、相关系数

相关系数的指标有:皮尔森相关系数、斯皮尔曼等级相关系数

(4)、可视化展示

可视化展示的原则就是利用合适的图表来清晰的表达出数据中的信息。

常见的一些数据图表:

(5)、总结

四、预测和分类

首先先说数据挖掘的流程就是:数据选取--->模型训练--->模型验证--->模型修正--->使用模型

预测和分类中的五个算法(有监督学习):线性回归、逻辑回归、决策树算法、支持向量机、朴素贝叶斯

五、分群和降维

相关推荐
AKAMAI1 分钟前
了解视频处理单元(VPU)、图形处理器(GPU)与中央处理器(CPU)
人工智能·云计算
沃丰科技19 分钟前
沃丰科技出海客服系统对接沃尔玛全球电商平台,赋能中企出海
人工智能
nnerddboy25 分钟前
预测模型及超参数:1.传统机器学习:SVR与KNN
人工智能·机器学习
SelectDB32 分钟前
Apache Doris 登顶 RTABench —— 实时分析领域的性能王者
数据库·数据分析·开源
MaxHua42 分钟前
SQL查询优化全指南:从语句到架构的系统性优化策略
后端·数据分析
春末的南方城市1 小时前
统一虚拟试穿框架OmniTry:突破服装局限,实现多品类可穿戴物品虚拟试穿无蒙版新跨越。
人工智能·深度学习·机器学习·计算机视觉·aigc
aneasystone本尊1 小时前
GraphRAG 索引构建之文档处理
人工智能
用户5191495848451 小时前
HTTP/3/QUIC TLS密码套件配置错误漏洞分析
人工智能·aigc
thesky1234561 小时前
camel agent
大数据·人工智能·深度学习·智能体
苏三福1 小时前
ffmpeg+opencv交叉编译
人工智能·opencv·ffmpeg