R语言迅速计算多基因评分(PRS)

Polygenic Risk Scores in R

最朴素的理解PRS:

GWAS分析结果中,有每个SNP的beta值、se值、P值,因为GWAS分析中将SNP变为0-1-2编码,所以这些显著的SNP的beta值,就可以用于预测。

比如:GWAS分析中,显著的SNP效应值为:

SNP1: 0.3

SNP2: 0.2

SNP3: -0.1

对于target data(目标群体),检测了3个个体,3个SNP的分型分别为:

ID1 0 0 1

ID2 1 0 2

ID3 2 2 1

那么个体1的多基因评分为:00.3 + 00.2 + 1*-0.1 = -0.1

个体2的多基因评分为:0.3 + 0 + -0.1 = 0.2

个体3的多基因评分为:0.6 + 0.4 + -0.1 = 0.9

用数学公式表示:

  • beta是效应值
  • G是0-1-2的编码
  • m是m个SNP

实际项目的PRS计算

实际中的项目,考虑的因素比较多,比如:

  • 数据质控
  • 群体结构
  • LD值(clumping)
  • beta矫正值
  • 通过P值筛选最优组合

相关软件实现PRS分析

  • plink
  • biqsnpr,一个R包
  • PRSice,应用最广泛,通过C+T的策略
  • LDpred,通过贝叶斯收缩的模型
  • PRS-CS
  • JAMPred
  • Lassosum

之前写过PRS的操作流程,可以作为参考:

多基因风险预测模型1--先立Flag

多基因风险预测模型2--相关概念和软件

不会安装使用PRSice-2软件就太不讲究了

相关推荐
曲幽1 分钟前
FastAPI部署中间件实战:从CORS到自定义,让你的API更健壮
python·fastapi·web·cors·starlette·middleware·call_next
郝学胜-神的一滴6 分钟前
Python中的bisect模块:优雅处理有序序列的艺术
开发语言·数据结构·python·程序人生·算法
jackylzh13 分钟前
PyTorch 2.x 中 `torch.load` 的 `FutureWarning` 与 `weights_only=False` 参数分析
人工智能·pytorch·python
MACKEI24 分钟前
服务器流式传输接口问题排查与解决方案
python·nginx·流式
毕设源码-郭学长44 分钟前
【开题答辩全过程】以 基于Python爬取学院师资队伍信息的设计与分析为例,包含答辩的问题和答案
开发语言·python
2301_765703141 小时前
工具、测试与部署
jvm·数据库·python
Jackson@ML1 小时前
Kimi K2.5横空出世!K2.5模型功能详解
python·大语言模型·kimi
BYSJMG1 小时前
计算机毕设选题推荐:基于大数据的癌症数据分析与可视化系统
大数据·vue.js·python·数据挖掘·数据分析·课程设计
我材不敲代码1 小时前
Python爬虫介绍——简单了解一下爬虫
开发语言·爬虫·python
naruto_lnq2 小时前
Python日志记录(Logging)最佳实践
jvm·数据库·python