Scanpy 默认画出来的图,「能看」但离「能发」还有距离。这篇文章系统梳理 Scanpy 可视化的进阶技巧,帮你做出直接能贴进论文的图表。
一、默认配色的问题
python
import scanpy as sc
import matplotlib.pyplot as plt
# 默认配色
sc.pl.umap(adata, color='leiden', legend_loc='on data', save='_default.pdf')
问题:
- 默认颜色循环对色盲不友好
- 聚类多了之后颜色难以区分
- 保存的是 PNG,缩放会模糊
二、用 Nature 风格配色
ini
# Nature 风格配色方案
nature_colors = [
'#1B9E77', '#D95F02', '#7570B3', '#E7298A',
'#66A61E', '#E6AB02', '#A6761D', '#666666',
'#377EB8', '#FF7F00', '#4DAF4A', '#984EA3',
]
# 应用到 UMAP
sc.pl.umap(adata, color='leiden',
palette=nature_colors,
legend_loc='on data',
save='_nature_palette.pdf')
色盲友好配色(推荐):
ini
# 色盲友好配色(ColorBrewer Set2)
colorblind_safe = [
'#66C2A5', '#FC8D62', '#8DA0CB', '#E78AC3',
'#A6D854', '#FFD92F', '#E5C494', '#B3B3B3',
]
sc.pl.umap(adata, color='leiden',
palette=colorblind_safe,
save='_colorblind_safe.pdf')
三、矢量图输出(论文必备)
ini
# 正确方式:保存为 PDF/SVG
sc.settings.figdir = './figures/'
# PDF(推荐,矢量,任意缩放)
sc.pl.umap(adata, color='cell_type',
save='_celltype.pdf', dpi=300)
# SVG(网页用)
sc.pl.umap(adata, color='cell_type',
save='_celltype.svg', dpi=300)
# 高分辨率 PNG(最后备选)
sc.pl.umap(adata, color='cell_type',
save='_celltype.png', dpi=600)
注意 :save 参数只接受文件名后缀,实际保存路径由 sc.settings.figdir 控制。
四、DotPlot:高效展示 Marker 基因表达
ini
# 为每个聚类展示 Top Marker
sc.pl.dotplot(adata,
var_names=['CD3D', 'CD79A', 'FCGR3A', 'FCER1A', 'DCN'],
groupby='leiden',
color_map='Reds',
figsize=(10, 4),
save='_marker_dotplot.pdf'
)
进阶:只展示每个聚类的 Top 5 Marker:
ini
# 获取每个聚类的 Top 5 基因
result = adata.uns['rank_genes_groups']
top5 = {}
for cluster in result['names'].dtype.names:
top5[cluster] = result['names'][cluster][:5].tolist()
# 展开为列表
genes = []
groups = []
for k, v in top5.items():
genes.extend(v)
groups.extend([k] * len(v))
# 用 matrixplot 展示
sc.pl.matrixplot(adata,
var_names=list(set(genes)),
groupby='leiden',
cmap='Reds',
figsize=(12, 6),
save='_marker_matrixplot.pdf'
)
五、UMAP 拆分多面板(一图展示多个 Marker)
ini
# 一图展示多个基因的 UMAP
genes_to_show = ['CD3D', 'CD79A', 'FCGR3A', 'FCER1A', 'DCN', 'COL1A1']
sc.pl.umap(adata,
color=genes_to_show,
ncols=3,
vmax='p99',
save='_multi_gene_umap.pdf')
六、自定义图例和字体(符合期刊要求)
ini
import matplotlib.pyplot as plt
import scanpy as sc
# 设置全局字体
sc.settings.set_figure_params(
dpi=300,
facecolor='white',
fontsize=12,
figsize=(6, 6)
)
# 自定义图例
sc.pl.umap(adata, color='cell_type',
legend_loc='right margin', # 图例放右侧
legend_fontsize=10,
title='Cell Type',
save='_custom_legend.pdf')
七、发表级图表检查清单
| 检查项 | 要求 |
|---|---|
| 分辨率 | ≥ 300 dPI(PDF/SVG 矢量最优) |
| 字体 | Arial / Helvetica(期刊通用) |
| 配色 | 色盲友好,避免红绿并用 |
| 图例 | 清晰可读,不遮挡数据 |
| 面板标签 | A/B/C 标注,符合期刊格式 |
| 颜色条 | 有单位说明(如:Expression Level) |