MungeSumstats包介绍(二)——rsid和chr:pos转换

https://zhuanlan.zhihu.com/p/648475139

MungeSumstats包介绍(二)------rsid和chr:pos转换

今天介绍如何使用MungeSumstats包来转换rsid和chr:pos。MungeSumstats包被开发出来是用来统一GWAS summary格式的,因此,也可以用它来进行rsid和chr:pos之间的转换,具体代码如下:

复制代码
library(MungeSumstats)
library(tidyverse)
library(data.table)
## 示例数据路径
eduAttainOkbayPth <- system.file("extdata","eduAttainOkbay.txt",
                                 package="MungeSumstats")
## 读取示例数据并删除rsid
df <- fread(eduAttainOkbayPth) %>% 
  dplyr::select(-MarkerName)
## MungeSumstats包检验数据并填充rsid
reformatted <- format_sumstats(df,
                               ref_genome = "GRCh37",
                               nThread = 2,
                               return_data =T)

但是这个包对输入数据的格式有要求,必须要包含以下几列:

像EAF和SE可有可没有,但是以上几列则必须要有,否则该包就会报错。

如果我们知道dbSNP的版本号,可以使用dbSNP参数指定版本号,减少rsid转换后的损失,不过目前好像只支持144和155版本,其他版本如果有小伙伴感兴趣的可以试一下行不行,不过要提前安装相应的数据:

复制代码
reformatted2 <- format_sumstats(df,
                               ref_genome = "GRCh37",
                               nThread = 2,
                               dbSNP = 155,
                               return_data =T)

当然了,我们还可以用这个函数在转换rsid的同时变更参考基因组:

复制代码
reformatted2 <- format_sumstats(df,
                               ref_genome = "GRCh37",
                               convert_ref_genome = "GRCh38",
                               nThread = 2,
                               return_data =T)

如果想转换后直接存储,可以设置save_path参数:

复制代码
reformatted2 <- format_sumstats(df,
                               ref_genome = "GRCh37",
                               convert_ref_genome = "GRCh38",
                               nThread = 2,
                               save_path = "path/to/dir")

这里还有蛮多参数大家可以自行探索。后面抽空写一下其他可以转换rsid和chr:pos的方法。

相关推荐
讲不出 再见6 天前
go语言-包
golang·go·package··包冲突
咬_咬1 个月前
go语言学习(变量定义与输入输出)
开发语言·学习·golang·io·go语言··go变量定义
会蹦的鱼1 年前
知识了解03——怎么解决使用npm包下载慢的问题?
npm·nrm·
奔跑吧邓邓子1 年前
【Python爬虫(3)】解锁Python爬虫技能树:深入理解模块与包
开发语言·爬虫·python·模块·
跳跳的向阳花1 年前
01、NodeJS学习笔记,第一节:Node.js初识与内置模块
学习·npm·node.js·模块化··内置模块·模块加载机制
码农飞飞1 年前
通过包和模块来组织Rust项目
rust·模块·项目··工作空间·可见性
大福是小强2 年前
老古董Lisp实用主义入门教程(5):好奇先生用Lisp探索Lisp
开发语言·lisp·入门·函数·文档··repl
xcg3401232 年前
【UML用户指南】-13-对高级结构建模-包
uml··对高级结构建模
无名之逆2 年前
Rust 第三方库创建和导入(cargo --lib)
开发语言·前端·后端·rust·cargo··lib