Robust disease module mining via enumeration of diverse prize-collecting Steiner trees
通过枚举多样的奖励收集斯坦纳树进行鲁棒的疾病模块挖掘
疾病模块挖掘方法(DMMM)已被开发出来,将基因表达谱的分析与蛋白质-蛋白质相互作用(PPI)和其他网络中编码的先验知识的挖掘相结合。
问题:现有的DMMM缺乏稳健性,并且容易受到随机偏差的影响。
为了解决这个问题,作者提出了一种新的DMMM,称为ROBUST。与扰乱的方法不同,ROBUST通过枚举成对的多样性而不仅仅是成对的不相同的疾病模块来确保稳健性。
方法:
第一个问题:输入的类型 对于ROBUST,作者选择种子基因集作为输入,原因如下:
1、种子基因集是非常用户友好的输入。它们可以通过差异基因表达分析计算获得,也可以从公共数据库中获得。
2、Levi等人已经表明,使用种子集作为输入的DMMM往往优于在非二进制输入数据上操作的DMMM
第二个问题:对模块挖掘进行数学建模
本文采用广义最小权重斯坦纳树(generalized minimum-weight Steiner tree)。
斯坦纳树:给定一个加权网络G=(V, E, w)和一个种子节点集合S ⊆V,一棵斯坦纳树T=(VT, ET)需满足S⊆VT⊆V, ET⊆E,且边权重和∑e∈ETw(e)最小。计算MWST是NP困难问题,但存在近似算法。
从生物学的角度来看,使用MWST对疾病模块挖掘问题进行建模是有前景的。在分子相互作用网络中,功能相关的基因或蛋白质往往彼此接近。可以表明,与随机期望相比,已知疾病基因的成对最短路径在分布上表现出相当大的左移。因此,一个合理的假设是,这些疾病基因之间的最短路径与因果分子通路重叠。由于MWST可以被视为最短路径到具有两个以上终点的泛化,因此使用MWST构建的疾病模块可以覆盖很大一部分与疾病相关的分子通路。
基于邻域粗糙集和K-NN理论的特定于类特征选择和分类方法
Learning from Rankings for No-reference Image Quality Assessment