R语言进行正态分布检验

查了很多资料,还是比较模糊

Kolmogorov-Smirnov检验(K-S检验)广泛用于正态性检验和其他分布的拟合检验。适用于中等到大样本。

Lilliefors检验是K-S检验的一种变体,专门为小样本设计。其通过使用更准确的临界值来提高对小样本的适应性。

Shapiro-Wilk(S-W)检验通常在小样本下表现较好,而在大样本下可能对正态性的敏感性降低。在小样本情况下通常比K-S检验更准确。对于大样本,由于S-W检验可能会过于严格,导致拒绝正态性的可能性较大,这种情况下,应该使用K-S检验。

SPSS 5000及以下用Lilliefors检验、S-W检验;5000以上仅用Lilliefors检验

样本量>30时,倾向于看K-S检验结果;样本量≤30时,倾向于看Lilliefors检验、S-W检验结果

K-S检验

复制代码
ks_result <- ks.test(sample_data, "pnorm")

ks_result <- ks.test(sample_data, "pnorm", mean = mean(sample_data), sd = sd(sample_data))

S-W检验

复制代码
shapiro_result <- shapiro.test(sample_data)

lillie修正的K-S检验

复制代码
需要先安装
install.packages("nortest")
library(nortest)
lillie_result <- lillie.test(sample_data)

读取excel数据

library(readxl)

excel_file <- "数据分析测试数据.xlsx"

first_column <- data[[0]]

相关推荐
RestCloud8 小时前
数据传输中的三大难题,ETL 平台是如何解决的?
数据分析·api
IT毕设梦工厂3 天前
大数据毕业设计选题推荐-基于大数据的客户购物订单数据分析与可视化系统-Hadoop-Spark-数据可视化-BigData
大数据·hadoop·数据分析·spark·毕业设计·源码·bigdata
大数据CLUB3 天前
基于spark的澳洲光伏发电站选址预测
大数据·hadoop·分布式·数据分析·spark·数据开发
智数研析社3 天前
9120 部 TMDb 高分电影数据集 | 7 列全维度指标 (评分 / 热度 / 剧情)+API 权威源 | 电影趋势分析 / 推荐系统 / NLP 建模用
大数据·人工智能·python·深度学习·数据分析·数据集·数据清洗
qingyunliushuiyu3 天前
BI数据可视化:驱动数据价值释放的关键引擎
数据挖掘·数据分析·数据分析系统·数据分析平台·bi数据可视化
折翼的恶魔3 天前
数据分析:排序
python·数据分析·pandas
数据牧羊人的成长笔记4 天前
数据分析需要掌握的数学知识(易理解)
数学建模·数据分析
折翼的恶魔4 天前
数据分析:合并二
python·数据分析·pandas
czhc11400756634 天前
LINUX913 shell:set ip [lindex $argv 0],\r,send_user,spawn ssh root@ip “cat “
tcp/ip·r语言·ssh