https://zhuanlan.zhihu.com/p/648475139
MungeSumstats包介绍(二)------rsid和chr:pos转换
今天介绍如何使用MungeSumstats包来转换rsid和chr:pos。MungeSumstats包被开发出来是用来统一GWAS summary格式的,因此,也可以用它来进行rsid和chr:pos之间的转换,具体代码如下:
library(MungeSumstats)
library(tidyverse)
library(data.table)
## 示例数据路径
eduAttainOkbayPth <- system.file("extdata","eduAttainOkbay.txt",
package="MungeSumstats")
## 读取示例数据并删除rsid
df <- fread(eduAttainOkbayPth) %>%
dplyr::select(-MarkerName)
## MungeSumstats包检验数据并填充rsid
reformatted <- format_sumstats(df,
ref_genome = "GRCh37",
nThread = 2,
return_data =T)
但是这个包对输入数据的格式有要求,必须要包含以下几列:

像EAF和SE可有可没有,但是以上几列则必须要有,否则该包就会报错。
如果我们知道dbSNP的版本号,可以使用dbSNP参数指定版本号,减少rsid转换后的损失,不过目前好像只支持144和155版本,其他版本如果有小伙伴感兴趣的可以试一下行不行,不过要提前安装相应的数据:
reformatted2 <- format_sumstats(df,
ref_genome = "GRCh37",
nThread = 2,
dbSNP = 155,
return_data =T)
当然了,我们还可以用这个函数在转换rsid的同时变更参考基因组:
reformatted2 <- format_sumstats(df,
ref_genome = "GRCh37",
convert_ref_genome = "GRCh38",
nThread = 2,
return_data =T)
如果想转换后直接存储,可以设置save_path参数:
reformatted2 <- format_sumstats(df,
ref_genome = "GRCh37",
convert_ref_genome = "GRCh38",
nThread = 2,
save_path = "path/to/dir")
这里还有蛮多参数大家可以自行探索。后面抽空写一下其他可以转换rsid和chr:pos的方法。