基因集(模块)活性量化:R语言+Java原生

动机

整合组学分析通过探究性状、组学测量值、遗传变异与流行病学因素之间的关联,有助于深入理解疾病机制及生物标志物。从统计学角度而言,这类分析面临诸多挑战------组学数据维度高、分布非标准,且可能存在复杂的非线性混杂效应,因此需要稳健、灵活的分析方法。

结果

本文提出ROMY框架及对应的R包(romy)。该工具可实现3大功能:

(a)在灵活调整协变量的同时,对2个目标变量进行稳健关联检验;

(b)分析变量对测量方差和协方差的影响(如共表达、共丰度);

(c)开展严格的交互效应检验。

ROMY基于统计学理论和双重机器学习的最新进展构建,确保分析的稳健性和统计有效性。通过模拟研究验证了该框架的性能。

romy是款基于GNU GPLv3许可证的R包,已在GitHub开源。

Java版本:https://github.com/sysbio-curie/roma

R版本(rRoma):https://github.com/Albluca/rRoma

图1 ROMY-CIT的I类错误模拟,含与标准回归方法"LR"的对比

图2 ROMY-CIT的检验效能模拟,含与标准回归方法"LR"的对比

图3 ROMY-COV的I类错误模拟,含与标准回归方法"LR"的对比

图4 ROMY-COV的检验效能模拟,含与标准回归方法"LR"的对比

图5 ROMY-INTER的I类错误模拟,含与标准回归方法"LR"的对比

图6 ROMY-INTER的检验效能模拟,含与标准回归方法"LR"的对比

详细总结

思维导图

核心功能与技术细节

双版本特性对比

参考

bioRxivPreprint. 2025 Dec 8:2025.12.04.691622. doi: 10.64898/2025.12.04.691622. Analyzing associations and higher-order effects in multi-omics data with double machine learning

251208ROMY.pdf

注:AI辅助创作,如有错误欢迎指出。内容仅供参考,不构成任何建议。

相关推荐
xieliyu.6 小时前
Java算法精讲:双指针(二)
java·开发语言·算法
素材积累6 小时前
博士后出站来深可申请的项目补贴等
数据库
云水一下7 小时前
TypeScript 从零基础到精通(五):高级类型与泛型
前端·javascript·typescript
何以解忧,唯有..7 小时前
Python包管理工具pip:从入门到精通
开发语言·python·pip
counterxing7 小时前
vibe coding 之后,我更不想打字了
前端·agent·ai编程
雪的季节7 小时前
RabbitMQ详解
开发语言
云水一下7 小时前
TypeScript 从零基础到精通(六):类型声明与模块化
javascript·typescript
copyer_xyf7 小时前
Python 模块与包的导入导出
前端·后端·python
研☆香7 小时前
es6新特性功能介绍(四)
前端·ecmascript·es6
微扬嘴角8 小时前
React篇1--JSX语法规则、组件、组件实例的3大特性
前端·react.js·前端框架