学术分享丨清华大学博士后李雨哲详解 Cell/Nature 子刊论文,探索基因组学的 AI 应用

空间转录组技术是生物信息学领域近年来的重大突破之一,曾在 2020 年被 Nature Method 评为年度技术。

基于空间转录组技术,既能获得高分辨率的转录组数据,还能和位置信息相对应,确定不同细胞亚型或转录状态在空间上的分布和位置关系。

随着空间转录组技术的不断发展与迭代,研究者能够在单细胞分辨率下获得细胞的基因表达谱,同时保留细胞在组织内的空间位置信息。如何有效地利用这些空间信息来识别空间细胞亚型并发现组织模块,成为空间转录组数据分析的核心任务。

近年来,AI 浪潮涌向科研领域,也为空间转录组学与单细胞组学研究提供了创新思路。

例如,**清华大学生命科学学院张强锋副教授课题组,开发了基于图自编码器深度学习框架的人工智能算法 SPACE,**能够从单细胞分辨率的空间转录组数据中识别空间细胞类型和发现组织模块,可被用于大规模的空间转录组研究。

在「Meet AI4S」系列直播的第二期中,HyperAI超神经有幸邀请到了该研究成果的论文第一作者清华大学张强锋实验室博士后李雨哲,8 月 21 日,李雨哲博士将以线上直播的形式进一步为大家分享空间转录组学和单细胞组学研究中的 AI 方法。

点击预约直播:https://7322399494606.huodongxing.com/event/8767758074022

扫码备注「AI4S」加入讨论群 ⬇️

活动详情

李雨哲

清华大学张强锋实验室博士后

分享主题

探索基因组学的 AI 应用:以空间转录组数据表征算法 SPACE 为例

内容简介

随着生命科学研究和人工智能 (AI) 技术的快速发展,AI 在生物医学研究中正发挥越来越重要的推动作用,产生了「AI for Science」的交叉研究新范式。

本次直播将分享基因组学研究,主要是空间转录组学和单细胞组学研究中的人工智能方法。

观众获益

  1. 初步了解基因组学研究中人工智能方法的发展过程以及前沿进展。

  2. 了解基于生成模型的单细胞组学数据整合算法SCALEX。

  3. 了解基于图神经网络的空间转录组学数据表征算法 SPACE 和细胞社区概念。

论文回顾

HyperAI超神经此前曾解读分享了李雨哲博士为第一作者的研究论文「Tissue module discovery in single-cell resolution spatial transcriptomics data via cell-cell interaction-aware cell embedding」。

研究亮点

  • 开发了空间转录组数据人工智能分析工具 SPACE,可从单细胞分辨率的空间转录组数据中,识别空间细胞类型并发现组织模块。

  • SPACE 在细胞类型识别和组织模块发现方面明显优于其他工具,尤其是在包含多种细胞类型的复杂组织中。

  • SPACE 定义并发现了细胞社区,即一种其所组成的细胞类型的空间分布较为均质且具有可辨识边界的组织模块。

  • 细胞社区是由其所组成的细胞间相似的相互作用网络定义的,这种相互作用网络可以用于优化基于配体-受体的细胞通讯推断。

  • SPACE 可用于大规模的空间转录组研究,以了解空间邻近细胞之间的相互作用如何影响细胞类型和组织模块生物学功能。

数据集的获取

为了验证 SPACE 的能力,研究中用到了多个数据集,下载地址:

https://go.hyper.ai/CBJfX

模型架构:基于细胞-细胞相互作用感知的细胞嵌入的模型

SPACE 使用图自编码器 (Graph autoencoder) 框架来学习低维的细胞嵌入,该细胞嵌入描述了空间转录组数据中每个细胞自身的基因表达信息以及其与空间邻近细胞的相互作用信息(因此称该细胞嵌入为细胞-细胞相互作用感知的细胞嵌入,cell-cell interaction-aware cell embedding)。在该细胞嵌入基础上,SPACE 再通过聚类算法识别空间细胞亚型和发现组织模块。

从架构来看,SPACE 模型由三部分组成:编码器 (三层图注意网络)、邻近图解码器和基因表达解码器,下图显示了该模型的整体框架:

性能评估

  • SPACE 能够基于 ST 数据集中的空间信息识别出空间信息具有生物学差异的细胞类型。

  • SPACE 优于目前可用的工具,可用于从 ST 数据中区分空间信息细胞类型。

  • SPACE 在组织模块发现方面优于最先进工具。

清华大学张强锋实验室

张强锋实验室隶属于清华大学生命科学学院,同时也是清华-北大生命科学联合中心、北京结构生物学高精尖创新中心的重要组成部分。

实验室的研究侧重于结构生物学、基因组学、机器学习和大数据分析等交叉学科领域,主要研究方向是结合结构生物学和系统生物学,开发并使用计算与实验相结合的方法,解读生物大分子(如蛋白质、RNA、DNA)的结构与功能关系,重建其相互作用网络,发现与蛋白质和 RNA 结构变化,以及大分子相互作用异常相关的复杂疾病(包括癌症和传染性疾病)的发病机制和可能的治疗方法。

实验室拥有独特的蛋白质和 RNA 结构建模、基于新一代测序的 RNA 结构测量、高通量 RNA 蛋白相互作用检测技术,以及强大的计算和实验平台,以推进研究人员的前沿研究。

Meet AI4S 系列直播

HyperAI超神经 (hyper.ai) 是中国最⼤的数据科学领域搜索引擎,聚焦 AI for Science 的最新科研成果,实时追踪 Nature、Science 等顶级刊物的学术论文,至今已完成百余篇 AI for Science 论文的解读。

此外,我们还运营了国内唯一 AI for Science 开源项目 awesome-ai4s。

  • 项目地址:

https://github.com/hyperai/awesome-ai4s

为了进一步推进 AI4S 的普适化,将学术机构的科研成果进一步降低传播壁垒,分享给更广泛的行业学者、科技爱好者及产业单位,HyperAI超神经策划了「Meet AI4S」视频栏目,邀请深耕 AI for Science 领域的科研人员或相关单位,以视频的形式分享研究成果、方法思路,共同探讨 AI for Science 在科研进展及推进落地过程中面临的机遇和挑战,促进 AI for Science 的科学普及和传播。

欢迎高效课题组及研究机构共同参与到我们的直播活动中!

相关推荐
HyperAI超神经1 小时前
NeurIPS 2024 有效投稿达 15,671 篇,数据集版块内容丰富
人工智能·开源·自动驾驶·数据集·多模态·化学光谱·neurips 2024
uhakadotcom1 小时前
AI搜索引擎的尽头是电商?从perplexity开始卖货说起...
前端·人工智能·后端
KeKe_L1 小时前
深度学习—参数初始化及激活函数Day35
人工智能·深度学习
我感觉。2 小时前
【机器学习chp8】统计学习理论
机器学习·过拟合·欠拟合·模型复杂度·统计学习理论·结构风险最小化
virtaitech2 小时前
探索 GAN 的演变之路
人工智能·神经网络·生成对抗网络
黑色叉腰丶大魔王2 小时前
《掩码语言模型(Masked Language Model, MLM)》
人工智能·语言模型·自然语言处理
Elastic 中国社区官方博客2 小时前
从 App Search 到 Elasticsearch — 挖掘搜索的未来
大数据·人工智能·elasticsearch·搜索引擎·ai·全文检索·数据库开发
Jurio.2 小时前
【IEEE独立出版 | 厦门大学主办】第四届人工智能、机器人和通信国际会议(ICAIRC 2024,12月27-29日)
人工智能·深度学习·神经网络·机器学习·自然语言处理·数据挖掘·机器人
新智元2 小时前
AI卷翻科研!DeepMind 36页报告:全球实验室被「AI科学家」指数级接管
人工智能·后端
m0_742848883 小时前
机器学习3
人工智能·深度学习·机器学习