13类高频数据分析方法分类汇总

第一次写论文的同学,常面临这样的难题:多种看似相近的方法让人难以抉择,不确定每种方法的适用情境,也难以区分它们之间的细微差异,稍不留神就可能做出错误的选择。 若你也遭遇此类困惑,不妨参考本篇文章,总结了14类超高频数据分析方法,帮助你明确不同方法的特点及其适用场景,从而确保你能够选择恰当的分析方法。

1、基本描述统计

基本描述统计分析包括频数分析、描述分析、分类汇总;是对收集的数据进行基本的说明。

  • 频数分析一般使用频数、百分比、饼图等形式进行描述。
  • 描述分析常见的指标有平均值、标准差、最大值、最小值、中位数等;更深入的描述指标包括百分位数、峰度、偏度、变异系数等。
  • 分类汇总用于研究不同分类时的汇总情况,输出的指标为汇总结果。比如不同区域分类项,销售额(汇总项)的差异情况。

点击下方链接均会跳转至SPSSAU帮助手册:

频数分析

描述分析

分类汇总

2、差异关系研究

常见的差异关系研究方法包括方差分析、 t 检验、卡方检验、非参数检验

‍(1)方差分析

方差分析用于进行定类数据与定量数据之间的差异关系研究;按照研究内容和数据类型等不同,可分为以下几类:

下方链接均会跳转至SPSSAU帮助手册:

单因素方差分析

双因素方差分析

多因素方差分析

协方差分析

事后多重比较

重复测量方差分析

(2)t检验

t检验,用于分析定类数据与定量数据之间的差异情况,按照研究内容和数据类型等不同,可分为以下几类:

下方链接均会跳转至SPSSAU帮助手册:

独立样本t检验

单样本t检验

配对t检验

概要t检验

(3)卡方检验

卡方检验,用于分析定类数据与定类数据之间的差异情况,按照研究内容和数据类型等不同,可分为以下几类:

下方链接均会跳转至SPSSAU帮助手册:

卡方检验

配对卡方

卡方拟合优度

分层卡方

(4)非参数检验

前面讲的常见的数据差异性分析方法:例如方差分析、 t 检验 都属于参数检验 的范围。参数检验一般需要数据满足正态性、方差齐性。 与参数检验相对的是非参数检验,非参数检验不对总体的分布形态做假定,所以当数据不正态或方差不齐时,可使用非参数检验进行差异性研究。

参数检验对应非参数秩和检验如下:

下方链接均会跳转至SPSSAU帮助手册:

单样本Wilcoxon秩和检验

配对样本Wilcoxon秩和检验

非参数检验(Mann-Whitney秩和检验&Kruskal-Wallis秩和检验)

Friedman秩和检验相关分析(Spearman秩相关&Kendall秩相关)

3、相关影响关系

相关影响关系研究包括进行相关分析、回归分析、 logistic 回归分析三大类。

‍(1)相关分析

相关分析可分为以下三类:

下方链接均会跳转至SPSSAU帮助手册:

相关分析

偏相关分析

典型相关分析

‍(2)回归分析

回归分析主要进行影响关系研究,可以细分为四十多种,之前有文章详细梳理过,点击查看下方文章:

如何研究X与Y之间的影响关系?实证分析40+回归模型汇总整理

‍(3)logistic回归分析

当研究X对Y的影响时,如果因变量Y为定类数据,则应该使用logistic回归分析。

下方链接均会跳转至SPSSAU帮助手册:

二元logit回归

有序logit回归

多分类logit回归

4、信息浓缩方法

因子分析和主成分分析 都是信息浓缩的方法,即将多个分析项信息浓缩成几个概括性指标。如果希望进行将指标命名,SPSSAU建议使用因子分析。原因在于因子分析在主成分基础上,多出一项旋转功能,该旋转目的即在于命名。

下方链接均会跳转至SPSSAU帮助手册:

因子分析

主成分分析

5、聚类分析方法

聚类分析是一种无监督学习方法,旨在将数据集中的对象根据其特征划分为相似的组或簇。

下方链接均会跳转至SPSSAU帮助手册:

聚类分析(K-means、K-modes、K-prototype)

分层聚类

6、信度分析

信度 是指测量工具在重复测量同一对象时,所得结果的一致性和稳定性。常见的有以下5类信度系数:Cronbach α信度系数、折半信度、McDonald's ω信度、theta信度、重测信度。

关于5类信度的详细描述与分析可查看下方文章:

问卷要不要做信效度分析?5类信度与4类效度常用指标及评价标准

7、效度分析

效度有很多种,可分为四种类型:内容效度、结构效度、区分效度、聚合效度

下方链接均会跳转至SPSSAU帮助手册:

内容效度

结构效度区分效度&聚合效度

8、问卷常用模型

量表类问卷分析时,经常会结合以下方法进行深入研究:中介作用、调节作用、调节中介、路径分析、结构方程模型 ,说明如下:

下方链接均会跳转至SPSSAU帮助手册:

中介作用

调节作用

调节中介

路径分析

结构方程模型

9、权重研究

权重研究是用于分析各因素或指标在综合体系中的重要程度,最终构建出权重体系。权重计算的方法有很多种,包括主观赋权法、客观赋权法,也可进行组合赋权,下面是一下相对常用的指标权重计算方法:

下方链接均会跳转至SPSSAU帮助手册:

AHP层次分析法

熵值法

模糊层次分析法

因子分析

主成分分析

CRITIC权重

10、综合评价

综合评价是一种方法,用于对多个方案或对象进行比较和排序,以确定其优劣程度,通常基于多个指标的综合得分。常用的综合评价方法有TOPSIS 法、熵权TOPSIS 法、灰色关联法、模糊综合评价 等。

下方链接均会跳转至SPSSAU帮助手册:

TOPSIS法

熵权TOPSIS法

灰色关联法

模糊综合评价

11、预测类分析方法

根据历史数据进行数据预测,常用的预测类分析方法包括指数平滑法、灰色预测模型、 ARIMA 预测、季节Sarima 法、马尔科夫预测 等。

下方链接均会跳转至SPSSAU帮助手册:

指数平滑法

灰色预测模型

ARIMA预测

季节Sarima

马尔科夫预测

12、医学Meta分析

Meta荟萃分析是一种综合各种文献结论,进而汇总综合评价的方法。按照数据类型,Meta分析可包括多种类型,比如连续性数据进行均值差异比较,二分类数据进行比率差值对比 (或计算优势比OR值,相对危险度RR值等),当然SPSSAU中还包括单个率、相关系数、平均值,或者 OR 值/HR 的Meta分析等,并且提供一般倒方差法 时的Meta分析。

下方链接均会跳转至SPSSAU帮助手册:

连续性

二分类

单个率

平均值

相关系数

OR值/HR值

p值合并

一般倒方差

13、文本分析

文本分析是一种对文本数据进行处理和理解的技术,旨在从中提取有用的信息和见解。针对文本数据可进行词云分析、文本情感分析、文本聚类分析、社会网络关系图、 LDA 主题分析 。说明如下:

下方链接均会跳转至SPSSAU帮助手册:

词云分析

文本情感分析

文本聚类分析

社会网络关系图

LDA主题分析

相关推荐
arnold668 分钟前
探索 ElasticSearch:性能优化之道
大数据·elasticsearch·性能优化
NiNg_1_2341 小时前
基于Hadoop的数据清洗
大数据·hadoop·分布式
Altair澳汰尔1 小时前
数据分析和AI丨知识图谱,AI革命中数据集成和模型构建的关键推动者
人工智能·算法·机器学习·数据分析·知识图谱
成长的小牛2332 小时前
es使用knn向量检索中numCandidates和k应该如何配比更合适
大数据·elasticsearch·搜索引擎
goTsHgo2 小时前
在 Spark 上实现 Graph Embedding
大数据·spark·embedding
程序猿小柒3 小时前
【Spark】Spark SQL执行计划-精简版
大数据·sql·spark
隔着天花板看星星3 小时前
Spark-Streaming集成Kafka
大数据·分布式·中间件·spark·kafka
奥顺3 小时前
PHPUnit使用指南:编写高效的单元测试
大数据·mysql·开源·php
小屁孩大帅-杨一凡3 小时前
Flink 简介和简单的demo
大数据·flink
天冬忘忧3 小时前
Flink调优----反压处理
大数据·flink