R语言:单细胞:挑选PC分群聚类

复制代码
> library(dplyr)
> library(patchwork)
> library(ggplot2)
> library(SingleR)
> library(randomcoloR)
> library(clustree)

#生成随机颜色

> randomColor <- function() {

paste0("#",paste0(sample(c(0:9, letters1:6), 6, replace = TRUE),collapse = ""))

}

生成100个随机颜色

> randomColors <- replicate(100,randomColor())

> seurat=readRDS("去批次后seurat.rds")#读取数据

> collist=c(ggsci::pal_nejm()(8))

> names(collist)=names(table(seurat$Type))

#热图可视化前20个PC

> pdf(file = "前20个PC热图.pdf",width =7.5,height = 9)

> DimHeatmap(seurat, dims = 1:20, cells = 1000, balanced = TRUE)

> dev.off()

##确定使用PC个数

> seurat <- JackStraw(seurat, num.replicate = 100)

> seurat <- ScoreJackStraw(seurat, dims = 1:20)

> pdf(file = "jackstrawplot.pdf",width =7.5,height = 5.5)

> JackStrawPlot(seurat, dims = 1:20)

> dev.off()

> pdf(file = "ElbowPlot.pdf",width =5,height = 4)

> ElbowPlot(seurat,ndims = 30)

> dev.off()

#选择PC数

> seuratPC=9

##对细胞聚类

> seurat=FindNeighbors(seurat, dims = 1:seuratPC, reduction = "harmony")

#挑选分辨率

> for (res in c(0.01,0.05,0.1,1,1.5,2,2.5,3,3.5,4)) {

seurat=FindClusters(seurat, graph.name = "RNA_snn", resolution = res, algorithm = 1)}

apply(seurat@meta.data,grep("RNA_snn_res",colnames(seurat@meta.data)),2,table)

> p2_tree=clustree(seurat@meta.data, prefix = "RNA_snn_res.")

> pdf(file = "挑选分辨率.pdf",width =12,height =10)

> p2_tree

> dev.off()

> seurat=FindNeighbors(seurat, dims = 1:seuratPC, reduction = "harmony")

#选择分辨率进行降维

> px=1

> seurat <- FindClusters(seurat, resolution = px)

only.pos:只保留上调差异表达的基因

> seurat.markers <- FindAllMarkers(seurat, only.pos = TRUE, min.pct = 0.25, logfc.threshold = 0.25)

> write.csv(seurat.markers,file = "每个聚类的marker基因.csv")

> head(seurat.markers)

#选择每个聚类前5各基因绘制热图

> top5seurat.markers <- seurat.markers %>%

group_by(cluster) %>%

top_n(n = 5, wt = avg_log2FC)

> col <- c(ggsci::pal_npg()(9),ggsci::pal_jco()(9),ggsci::pal_jama()(7),ggsci::pal_nejm()(8))

> pdf(file = "聚类热图.pdf",width =22,height = 16)

> DoHeatmap(seurat,features = top5seurat.markers$gene,

group.colors = col) +

ggsci::scale_colour_npg() +

scale_fill_gradient2(low = '#0099CC',mid = 'white',high = '#CC0033',

name = 'Z-score')

> dev.off()

将细胞在低维空间可视化UMAP/tSNE

> seurat <- RunUMAP(seurat, dims = 1:seuratPC, reduction = "harmony")

> seurat <- RunTSNE(seurat, dims = 1:seuratPC, reduction = "harmony")

可视化UMAP/tSNE3

> pdf(file = "聚类后UMAP.pdf",width =6.5,height = 5.5)

> DimPlot(seurat, reduction = "umap", label = T, label.size = 3.5,pt.size = 2)+theme_classic()+theme(panel.border = element_rect(fill=NA,color="black", size=0.5, linetype="solid"),legend.position = "right")

> dev.off()

> pdf(file = "聚类后TSEN.pdf",width =6.5,height = 5.5)

> DimPlot(seurat, reduction = "tsne", label = T, label.size = 3.5,pt.size = 2)+theme_classic()+theme(panel.border = element_rect(fill=NA,color="black", size=0.5, linetype="solid"),legend.position = "right")

> dev.off()

学习交流

相关推荐
GZ同学7 天前
单双变量Ripley’s K函数 R 语言实现
开发语言·r语言
popcorn_min8 天前
共享单车需求预测:时间特征工程 + 随机森林,R² 达到 0.931
随机森林·r语言·kotlin
爱基百客10 天前
植物单细胞配受体数据库:PlantCellChatDB详解
数据库·单细胞·单细胞分析
m0_4970489312 天前
.NET10+Avalonia跨平台截屏工具解析
r语言
dongf201913 天前
R语言朴素贝叶斯算法---iris数据集
开发语言·算法·数据分析·r语言
追风少年ii13 天前
课前准备--肿瘤细胞邻域分类
数据分析·空间·单细胞·培训
All_Will_Be_Fine噻13 天前
重建R环境
开发语言·r语言
梦想的初衷~13 天前
基于R语言APSIM模型高级应用及批量模拟
r语言·apsim·作物生长模型·农业模拟·气象数据处理·土壤水分平衡
dongf201913 天前
R 语言 逻辑斯蒂回归
开发语言·数据分析·回归·r语言
dongf201916 天前
R 语言 Apriori 关联规则算法
数据分析·r语言·关联规则