R语言快速生成三线表(1)

R语言的优势在于批量处理,常使用到循环和函数,三线表是科研文章中必备的内容。利用函数实现自动判断数据类型和计算。使用R包(table1)。

复制代码
# 创建连续性变量
continuous_var1 <- c(1.2, 2.5, 3.7, 4.8, 5.9)
continuous_var2 <- c(10.5, 20.3, 15.2, 8.7, 12.1)
continuous_var3 <- c(0.3, 0.7, 1.1, 2.0, 1.5)

# 创建分类变量
category_var1 <- factor(c("A", "B", "A", "C", "B"))
category_var2 <- factor(c("X", "Y", "Z", "X", "Z"))
category_var3 <- factor(c("High", "Low", "Medium", "Medium", "High"))

# 创建data.frame
df <- data.frame(
  ContinuousVar1 = continuous_var1,
  ContinuousVar2 = continuous_var2,
  ContinuousVar3 = continuous_var3,
  CategoryVar1 = category_var1,
  CategoryVar2 = category_var2,
  CategoryVar3 = category_var3
)

# 显示data.frame
df

#generate three line table
#pvalue
pvalue <- function(x, name, ...){
  y <- df[[name]]#variable
  g <- df[,"Group"]#Group
  if (is.numeric(y)) {
    if (shapiro.test(y)$p.value>0.05){
      p <- t.test(y ~ g)$p.value
      p_with_symbol <- paste0(format.pval(p, digits = 3, eps = 0.001), "*")
    }else{
      p <- wilcox.test(y ~ g)$p.value
      p_with_symbol <- paste0(format.pval(p, digits = 3, eps = 0.001), "**")
      }
  }else{
    if (length(y) > 40 & any(sapply(chisq.test(y,g)$expected, function(x) x >=1))){
      p <- chisq.test(y, g)$p.value
      p_with_symbol <- paste0(format.pval(p, digits = 3, eps = 0.001,trim = FALSE), "#")
      } else {
        p<-fisher.test(y,g)$p.value
        p_with_symbol <- paste0(format.pval(p, digits = 3, eps = 0.001), "##")
      }
  }
  c("",  p_with_symbol)
}

#自定义函数准备显示统计值(t值或卡方值)
stat_value <- function(x, name, ...) {
  y <- df[[name]] # 变量
  g <- df[,"Group"] # 分组变量
  if (is.numeric(y)) {
    # 连续变量使用 t 检验或 Mann-Whitney U 测试
    if (shapiro.test(y)$p.value > 0.05) {
      s <- abs(t.test(y ~ g)$statistic[["t"]]) # 正态分布,使用 t 检验
    } else {
      s <- wilcox.test(y ~ g)[["statistic"]][["W"]] # 非正态分布,使用 Mann-Whitney U 测试
    }
  } else {
    if(length(y) > 40 & any(sapply(chisq.test(y,g)$expected, function(x) x >=1))){
      s<-chisq.test(y, g)$statistic[["X-squared"]]
    } else {
      s<-fisher.test(y, g)$statistic[["X-squared"]]
    }
    # 分类变量使用卡方检验
    s <- chisq.test(y, g)$statistic[["X-squared"]]
  }
  c("",  format.pval(s, digits=3, eps=0.001))
}
#定义变量的展现形式
# rndr <- function(x, name, ...) {
#   if (!is.numeric(x)) return(render.categorical.default(x))
#   what <- switch(name,
#                  Age = "Median [Min, Max]",
#                  `Survival months` = "Median [Min, Max]"
#   )
#   parse.abbrev.render.code(c("", what))(x)
# }

#绘图
library(table1)
paste(sprintf("`%s`",colnames(df)),collapse="+")
df$Group<-c(rep("A",2),rep("B",3))
table<-table1(~`ContinuousVar1`+`ContinuousVar2`+`ContinuousVar3`+`CategoryVar1`+`CategoryVar2`+`CategoryVar3`|Group,ender=rndr,data=df,extra.col=list(`Statistics`=stat_value,`P-value`=pvalue))
复制代码
#保存为docx
library(flextable);help(package="flextable")
table_fl<-t1flex(table)
save_as_docx(table_fl,path="table.docx")
相关推荐
AI科技星5 小时前
精细结构常数α作为SI 7大基本量纲统一耦合常数的量子几何涌现理论
算法·机器学习·数学建模·数据挖掘·量子计算
知识分享小能手5 小时前
R语言入门学习教程,从入门到精通,R语言数据计算与分组统计(9)
开发语言·学习·r语言
STLearner5 小时前
SIGIR 2026 | LLM × Graph论文总结(图增强LLM,GraphRAG,Agent,多模态,知识图谱,搜索,推
人工智能·python·深度学习·神经网络·机器学习·数据挖掘·知识图谱
xrui587 小时前
2026实测:让 Gemini 3.1镜像站抓取邮箱并智能分类,GTD 效率提升 3 倍
人工智能·分类·数据挖掘
geneculture8 小时前
《一种智能通信子母机》(申请日 1993.4.7公开号CN1095341A)专利文件的全文汉英双语对照版本+系统点评
人工智能·数据挖掘·哲学与科学统一性·智能通信
一晌小贪欢9 小时前
第1节:数据分析环境配置——Jupyter Notebook全攻略
jupyter·数据挖掘·数据分析·可视化·数据可视化
HQChart9 小时前
HQChart使用教程105-K线图,分时图如何对接AI进行数据分析
人工智能·数据挖掘·数据分析·hqchart·k线图·走势图
AI科技星9 小时前
全域数学·数术本源·第四卷《分析原本》【乖乖数学】
人工智能·机器学习·数学建模·数据挖掘·agi
babe小鑫9 小时前
零经验转行学习数据分析的价值分析
学习·数据挖掘·数据分析
katheta11 小时前
时间序列模型总体分类
人工智能·分类·数据挖掘·时间序列·时序模型