Sum of Single Effects Linear Regression (susieR):多个因果变异位点的鉴定

使用susieR鉴定多个因果变异位点只需要两个输入文件,一个输入文件是包含Zscore值的SNP位点(zscore.txt),另一个文件是LD matrix(LD.matrix.ld)。

zscore.txt 文件如下所示:

LD.matrix.ld 文件如下所示:

LD.matrix.ld 文件是通过plink生成的,使用到的命令如下:

bash 复制代码
plink --bfile file --r2 --matrix --out LD.matrix

其中,file是指包含zscore.txt文件中所有SNP的plink格式文件。注意,file.bim的SNP顺序要跟zscore.txt的SNP一列的顺序完全一致,不然后面运行susieR的时候会报错。

通过以上命令得到LD.matrix.ld 文件后,即可通过susieR包鉴定多个因果变异位点,如下所示:

r 复制代码
install.packages("susieR")
rm(list=ls())
library(susieR)
library(data.table)
eq=read.table("zscore.txt", sep="\t", stringsAsFactors=FALSE,header=F)
dat <- fread("LD.matrix.ld")
dat1=as.matrix(dat)
fitted_rss3 <- susie_rss(c(eq$zscore), dat1, n=eq$N, L = 10)
susie_plot(fitted_rss3, y="PIP")
summary(fitted_rss3)$cs

运行susie_plot(fitted_rss3, y="PIP")命令后得到如下图像:

其中,真正的因果变量以红色显示。95%的因果集通过三种不同的颜色(绿色、紫色、蓝色)来表示。

运行summary(fitted_rss3)$cs命令后得到如下结果:

复制代码
#   cs cs_log10bf cs_avg_r2 cs_min_r2
# 1  2   4.033879 1.0000000 1.0000000
# 2  1   6.744086 0.9634847 0.9634847
# 3  3   3.461470 0.9293299 0.7545197
#                                                                                                      variable
# 1                                                                                                         653
# 2                                                                                                     773,777
# 3 362,365,372,373,374,379,381,383,384,386,387,388,389,391,392,396,397,398,399,400,401,403,404,405,407,408,415

结果表示这三个因果信号已被三个因果集(CSs)捕获。注意的是,第三个因果集中包含许多变量,包括真正的因果变量403。

相关推荐
xin007hoyo1 小时前
算法笔记.染色法判断二分图
数据结构·笔记·算法
এ᭄画画的北北4 小时前
力扣-234.回文链表
算法·leetcode·链表
八股文领域大手子4 小时前
深入理解缓存淘汰策略:LRU 与 LFU 算法详解及 Java 实现
java·数据库·算法·缓存·mybatis·哈希算法
__lost5 小时前
C++ 解决一个简单的图论问题 —— 最小生成树(以 Prim 算法为例)
算法·图论·最小生成树·prim算法
wuqingshun3141596 小时前
蓝桥杯 11. 打印大X
数据结构·算法·职场和发展·蓝桥杯·深度优先
Blossom.1186 小时前
量子网络:构建未来通信的超高速“高速公路”
网络·opencv·算法·安全·机器学习·密码学·量子计算
A林玖7 小时前
【机器学习】朴素贝叶斯
人工智能·算法·机器学习
六边形战士DONK7 小时前
神经网络基础[损失函数,bp算法,梯度下降算法 ]
人工智能·神经网络·算法
wuqingshun3141597 小时前
蓝桥杯 2. 确定字符串是否是另一个的排列
数据结构·c++·算法·职场和发展·蓝桥杯
小刘|7 小时前
JVM 自动内存管理
java·jvm·算法