R语言优雅的进行广义可加模型泊松回归分析

泊松回归(Poisson regression)是以结局变量为计数结果时的一种回归分析。泊松回归在我们的生活中应用非常广泛,例如:1分钟内过马路人数,1天内火车站的旅客流动数,1天内的银行取钱人数,一周内的销售经营数据等等都可以使用泊松回归进行分析。

既往已经有文章《R语言进行泊松回归》初步的介绍了泊松回归,本期介绍下如何使用tidygam包来优雅的进行泊松回归,tidygam包主要是通过mgcv包来进行分析,通过对tidygam包对mgcv包的数据转换后,上手难度大大降低,可以轻松优雅的进行泊松回归分析。

咱们先导入R包和数据,数据使用的是tidygam自带的gest数据

r 复制代码
library(tidygam)
library(mgcv)
library(dplyr)
library(ggplot2)
data("gest")
theme_set(theme_light())

这个数据是一个10、11和12个月婴儿的手势数量的数据,这个数据表包含了来自孟加拉、中国和英国背景的60名婴儿所做的三种手势的计数。我解释一下变量名:dyad是ID标识的意思,background:表明来自哪个国家,months:月份,只有10,11,12共3个月,gesture手势的类型,count:手势的计数,这个是 结局变量

先生成gam模型

r 复制代码
gs <- gam(
  count ~ s(months, k = 3),
  data = gest,
  family = poisson
)

这个模型gam是mgcv包生成的,解析模型,表明月数和手势计数是相关的

生成预测值

r 复制代码
gs_pred <- predict_gam(gs)

绘图,一定要用series标明绘制哪个变量

r 复制代码
gs_pred %>%
  plot(series = "months")

R包介绍,这个时候生成的Y周是count的对数值,因此我们还需要转换一下

r 复制代码
predict_gam(gs, tran_fun = exp) %>%
  plot(series = "months")

如果咱们想了解不同国家的分类,可以再gam函数中设定

r 复制代码
gs_by <- gam(
  count ~ s(months, by = background, k = 3),
  data = gest,
  family = poisson
)

解析模型,表明不同的国家婴儿,手势计数都是和月份相关

r 复制代码
summary(gs_by)

接下来咱们可以绘制分类图形,需要再comparison处指明根据哪个变量分类

r 复制代码
gs_by %>%
  predict_gam(length_out = 20, series = "months", tran_fun = exp) %>%
  plot(comparison = "background")

R包指出,虽然使用plot函数绘图,但是它的本质上是一个ggplot2绘制的图片,所以咱们可以使用ggplot的方法修改它

r 复制代码
gs_by %>%
  predict_gam(length_out = 20, series = "months", tran_fun = exp) %>%
  plot(comparison = "background") +
  scale_color_brewer(type = "qual") + scale_fill_brewer(type = "qual")

咱们如果考虑有2个非连续的变量,可以再模型里面定义

r 复制代码
gs_by_2 <- gam(
  count ~ s(months, by = background, k = 3) +
    s(months, by = gesture, k = 3),
  data = gest,
  family = poisson
)

解析模型,这里虽然有变量交叉,但是这种做法并不是交互效应,应该理解为亚组更加准确

r 复制代码
summary(gs_by_2)

绘图

r 复制代码
gs_by_2 %>%
  predict_gam(length_out = 20, series = "months", tran_fun = exp) %>%
  plot(comparison = "gesture") +
  scale_color_brewer(type = "qual") + scale_fill_brewer(type = "qual") +
  facet_grid(~ background)

如果咱们想了解background和gesture的交互关系,要先生成一个交互变量

r 复制代码
gest <- gest %>%
  mutate(back_gest = interaction(background, gesture))

然后咱们使用这个交互变量进行模型分类

r 复制代码
gs_i <- gam(
  count ~ s(months, by = back_gest, k = 3),
  data = gest,
  family = poisson
)
summary(gs_i)

绘图,

r 复制代码
predict_gam(
  gs_i, tran_fun = exp,
  separate = list(back_gest = c("background", "gesture"))
) %>%
  plot(series = "months", comparison = "gesture") +
  facet_grid(~ background)

这样一个亚组交互图形就生成好啦。

相关推荐
猫头虎1 天前
如何解决 pip install -r requirements.txt 本地轮子路径 ‘./packages/xxx.whl’ 不存在 问题
开发语言·网络·python·r语言·pip·gpu算力·国产
TeleostNaCl1 天前
如何在 IDEA 中使用 Proguard 自动混淆 Gradle 编译的Java 项目
android·java·经验分享·kotlin·gradle·intellij-idea
TeleostNaCl2 天前
使用 jintellitype 库在 Java 程序中实现监听 Windows 全局快捷键(热键)
java·开发语言·windows·经验分享·kotlin·电脑
zhangfeng11332 天前
R语言 表达矩阵 count_table 筛选出 行名是 某个 基因的 数据或者某个列中的数据是某个基因的数据
矩阵·r语言·生物信息
zhangfeng11333 天前
geo Counts 数据 ,机器学习 模型的外部验证 ROC外部验证数据处理流程
人工智能·机器学习·r语言·生物信息
爱学啊3 天前
1.Android Compose 基础系列:您的第一个 Kotlin 程序
android·kotlin·jetpack
zhangfeng11333 天前
生物信息 R语言和 cytoscape 相互沟通的组件RCy3,构建cytoscape网络表 节点类型表 链接边的表,并推送到cytoscape
数据库·r语言·生物信息
zhangfeng11333 天前
R语言 安装老一点的班装包 核心是从CRAN归档(Archive)下载对应版本的安装包
开发语言·r语言
数模加油站4 天前
最新R(4.4.1)及R-studio保姆级安装配置详细教程及常见问题解答
开发语言·windows·数学建模·r语言
czliutz4 天前
R语言绘制股票K线图及布林线
开发语言·r语言