TCGA数据下载推荐:R语言easyTCGA包

复制代码
#使用easyTCGA获取数据
#清空
rm(list=ls())
gc()
# 安装bioconductor上面的R包
options(BioC_mirror="https://mirrors.tuna.tsinghua.edu.cn/bioconductor")
if(!require("BiocManager")) install.packages("BiocManager")
if(!require("TCGAbiolinks")) BiocManager::install("TCGAbiolinks")
if(!require("SummarizedExperiment")) BiocManager::install("SummarizedExperiment")
if(!require("DESeq2")) BiocManager::install("DESeq2")
if(!require("edgeR")) BiocManager::install("edgeR")
if(!require("limma")) BiocManager::install("limma")
# 安装cran上面的R包
if(!require("survival")) install.packages("survival")
if(!require("broom")) install.packages("broom")
if(!require("devtools")) install.packages("devtools")
if(!require("cli")) install.packages("cli")
#devtools::install_github("ayueme/easyTCGA")
library(easyTCGA)
help(package="easyTCGA")
setwd("F:\\TCGA\\TCGA-COAD")
#下载mRNA、lncRNA和临床信息
COAD<-getmrnaexpr("TCGA-COAD")#原始下载的count, TPM, FPKM 均没有经过log2转化
#下载miRNA
COAD_miRNA<-getmirnaexpr("TCGA-COAD")
#下载copy number variation data
COAD_cnv<-getcnv("TCGA-COAD")
#下载masked somatic mutation 体细胞突变
COAD_snv<-getsnvmaf("TCGA-COAD")
#下载DNA methylation beta value 甲基化数据
getmethybeta("TCGA-COAD")
复制代码
#从下载目录中打开数据
#差异分析
diff<-diff_analysis(exprset=mrna_expr_counts,#没有经过log2转化
              project="TCGA-COAD",
              save=F)

#批量生存分析
surv<-batch_survival(
  exprset=mrna_expr_counts,
  clin=clin_info,
  is_count = T,
  optimal_cut = TRUE,
  project="TCGA-COAD",
  save_data = FALSE,
  min_sample_size = 5,
  print_index = TRUE
)

#突变分析:瀑布图
#BiocManager::install("maftools")
library(maftools)
maf<-read.maf(snv,clinicalData=clin_snv)
plotmafSummary(maf)
colnames(clin_snv)
oncoplot(maf=maf,
         clinicalFeatures=c("ajcc_pathologic_stage","vital_status"),
         top=10,
         sortByAnnotation=T
)
复制代码
#绘制KM曲线
dim(mrna_expr_counts)
set.seed(123)
colnames(clin_info)
clin<-data.frame(time=clin_info$days_to_last_follow_up,
                 event=clin_info$vital_status)
clin$event<-ifelse(clin$event=="Alive",0,1)
plot_KM(exprset=mrna_expr_counts, 
        marker="CHPF", #基因
        clin=clin, 
        optimal_cut = TRUE, 
        return_data = TRUE)
复制代码
#正常和癌症组织基因表达对比箱线图
rownames(mrna_expr_counts)
plot_gene_paired(exprset=mrna_expr_counts, 
                 marker="CHPF", #基因
                 return_data = TRUE)
复制代码
#比较组间基因表达差异
set.seed(123)
group=sample(c(0,1),524,replace = T)
plot_gene(exprset=mrna_expr_counts, 
          marker=c("CHPF","MAOA"), 
          group=group, 
          return_data = TRUE)
相关推荐
wfeqhfxz25887827 小时前
毒蝇伞品种识别与分类_Centernet模型优化实战
人工智能·分类·数据挖掘
ZCXZ12385296a8 小时前
YOLOv26在水果图像识别与分类中的应用:苹果、猕猴桃、橙子和红毛丹的检测研究
yolo·分类·数据挖掘
Dingdangcat8614 小时前
YOLOX-L在钢丝绳损伤检测中的应用:基于300轮训练与COCO数据集的智能分类系统详解
人工智能·分类·数据挖掘
地球资源数据云18 小时前
从 DEM 到 3D 渲染:R 语言 rayshader 地形可视化全指南
3d·数据分析·r语言
AAD5558889918 小时前
基于改进Mask-RCNN的文化文物遗产识别与分类系统_1
人工智能·数据挖掘
2501_9413220319 小时前
【医疗AI】基于Mask R-CNN的支气管镜内窥镜目标检测系统实现
人工智能·r语言·cnn
地球资源数据云21 小时前
R语言网络分析与路径规划——线数据应用实战:规划散步路线
数据分析·r语言
Aloudata1 天前
破解监管溯源难题:从表级血缘到算子级血缘的数据治理升级
数据库·数据挖掘·数据治理·元数据·数据血缘
AC赳赳老秦1 天前
等保2.0合规实践:DeepSeek辅助企业数据分类分级与自动化报告生成
大数据·人工智能·分类·数据挖掘·自动化·数据库架构·deepseek
LOnghas12111 天前
文化遗产物品识别与分类——基于Mask R-CNN的改进模型详解
分类·r语言·cnn