R的seurat和python的scanpy对比学习

现在的单细胞分析,往往避免不了scanpy的使用,我们可以通过对比seurat来学习scanpy

今天的格式怎么都改不了。。。手机阅读有点费劲,,推荐电脑阅读。

单细胞数据分析概览

单细胞分析,总流程


python教程

seurat教程

seurat中与scanpy对等的函数操作

|----------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------|
| #### 数据预处理 ##### Seurat (R) CreateSeuratObject(): 创建Seurat对象。 NormalizeData(): 数据标准化。 FindVariableFeatures(): 识别高变异基因。 ScaleData(): 数据缩放和中心化。 ##### Scanpy (Python) sc.read() / sc.read_10x_mtx(): 读取数据创建AnnData对象。 sc.pp.normalize_total(): 数据标准化。 sc.pp.highly_variable_genes(): 识别高变异基因。 sc.pp.scale(): 数据缩放和中心化。 *** ** * ** *** #### 降维分析 ##### Seurat (R) RunPCA(): 主成分分析(PCA)。 RunUMAP(): UMAP降维。 RunTSNE(): t-SNE降维。 ##### Scanpy (Python) sc.tl.pca(): 主成分分析(PCA)。 sc.tl.umap(): UMAP降维。 sc.tl.tsne(): t-SNE降维。 *** ** * ** *** #### 聚类分析 ##### Seurat (R) FindNeighbors(): 计算邻居图。 FindClusters(): 基于图的聚类。 ##### Scanpy (Python) sc.pp.neighbors(): 计算邻居图。 sc.tl.louvain() / sc.tl.leiden(): 基于图的聚类。 *** ** * ** *** #### 差异表达分析 ##### Seurat (R) FindMarkers(): 寻找差异表达基因。 ##### Scanpy (Python) sc.tl.rank_genes_groups(): 寻找差异表达基因。 *** ** * ** *** #### 数据可视化 ##### Seurat (R) DimPlot(): 降维数据可视化。 FeaturePlot(): 基因表达水平可视化。 VlnPlot(): 小提琴图展示基因表达分布。 ##### Scanpy (Python) sc.pl.umap() / sc.pl.tsne(): 降维数据可视化。 sc.pl.dotplot() / sc.pl.violin(): 基因表达水平可视化。 |

为何seurat中没有与scanpy中的sc.pp.log1p(adata)对应步骤

有几个方面考虑:

|----------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------|
| #### 1. 数据标准化方法的差异 Seurat和Scanpy在数据预处理和标准化方面采取了不同的方法。Seurat的NormalizeData函数默认使用的是LogNormalize方法,这个方法首先对每个细胞的基因表达量进行归一化处理,使得每个细胞的总表达量相同(默认是1e4),然后对归一化后的表达量加1后取对数(使用自然对数)。这个过程实质上包含了与Scanpy中sc.pp.normalize_total后跟sc.pp.log1p相似的步骤,只是Seurat将其整合在了一个步骤中进行。 #### 2. 集成的处理流程 Seurat的设计哲学是提供一个相对简化和集成的分析流程,使得用户可以通过少量的函数调用完成从数据预处理到高级分析的整个过程。因此,Seurat在其标准化函数中内置了对数变换,而无需用户手动进行这一步。这种设计选择简化了分析流程,减少了需要记住的函数数量,但也意味着用户在使用过程中可能对于数据处理的每一步不如Scanpy那样清晰明了。 #### 3. 灵活性与透明度 Scanpy采取的是更模块化的策略,每个处理步骤都由不同的函数完成。这种方法提供了更大的灵活性和透明度,使得用户能够更清楚地看到数据是如何被逐步处理和分析的。这对于需要定制处理流程的研究人员来说是一个优点。 |

看完记得顺手点个 "在看" 哦!

相关推荐
hmywillstronger41 分钟前
【Rhino】【Python】 查询指定字段并cloud标注
开发语言·python
dyyx1111 小时前
如何从Python初学者进阶为专家?
jvm·数据库·python
嗯嗯=1 小时前
STM32单片机学习篇9
stm32·单片机·学习
二十雨辰1 小时前
[python]-函数
开发语言·python
CryptoRzz2 小时前
如何高效接入日本股市实时数据?StockTV API 对接实战指南
java·python·kafka·区块链·状态模式·百度小程序
小二·2 小时前
Python Web 开发进阶实战(终章):从单体应用到 AI 原生生态 —— 45 篇技术演进全景与未来开发者生存指南
前端·人工智能·python
极客小云2 小时前
【基于 PyQt6 的红外与可见光图像配准工具开发实战】
c语言·python·yolo·目标检测
ooo-p2 小时前
FPGA学习篇——Verilog学习之“呼吸灯”
学习·fpga开发
求真求知的糖葫芦3 小时前
微波工程4.2节阻抗与导纳矩阵学习(自用)
笔记·学习·线性代数·矩阵·射频工程
炽烈小老头3 小时前
【 每天学习一点算法 2026/01/26】缺失数字
学习·算法