基因集（模块）活性量化：R语言+Java原生

Omics Pro2026-04-02 9:49

动机

整合组学分析通过探究性状、组学测量值、遗传变异与流行病学因素之间的关联，有助于深入理解疾病机制及生物标志物。从统计学角度而言，这类分析面临诸多挑战------组学数据维度高、分布非标准，且可能存在复杂的非线性混杂效应，因此需要稳健、灵活的分析方法。

结果

本文提出ROMY框架及对应的R包（romy）。该工具可实现３大功能：

（a）在灵活调整协变量的同时，对２个目标变量进行稳健关联检验；

（b）分析变量对测量方差和协方差的影响（如共表达、共丰度）；

（c）开展严格的交互效应检验。

ROMY基于统计学理论和双重机器学习的最新进展构建，确保分析的稳健性和统计有效性。通过模拟研究验证了该框架的性能。

romy是款基于GNU GPLv3许可证的R包，已在GitHub开源。

Java版本：https://github.com/sysbio-curie/roma

R版本（rRoma）：https://github.com/Albluca/rRoma

图1 ROMY-CIT的I类错误模拟，含与标准回归方法"LR"的对比

图2 ROMY-CIT的检验效能模拟，含与标准回归方法"LR"的对比

图3 ROMY-COV的I类错误模拟，含与标准回归方法"LR"的对比

图4 ROMY-COV的检验效能模拟，含与标准回归方法"LR"的对比

图5 ROMY-INTER的I类错误模拟，含与标准回归方法"LR"的对比

图6 ROMY-INTER的检验效能模拟，含与标准回归方法"LR"的对比

详细总结

思维导图

核心功能与技术细节

双版本特性对比

参考

bioRxiv $Preprint$ . 2025 Dec 8:2025.12.04.691622. doi: 10.64898/2025.12.04.691622. Analyzing associations and higher-order effects in multi-omics data with double machine learning

251208ROMY.pdf

注：AI辅助创作，如有错误欢迎指出。内容仅供参考，不构成任何建议。