基因集(模块)活性量化:R语言+Java原生

动机

整合组学分析通过探究性状、组学测量值、遗传变异与流行病学因素之间的关联,有助于深入理解疾病机制及生物标志物。从统计学角度而言,这类分析面临诸多挑战------组学数据维度高、分布非标准,且可能存在复杂的非线性混杂效应,因此需要稳健、灵活的分析方法。

结果

本文提出ROMY框架及对应的R包(romy)。该工具可实现3大功能:

(a)在灵活调整协变量的同时,对2个目标变量进行稳健关联检验;

(b)分析变量对测量方差和协方差的影响(如共表达、共丰度);

(c)开展严格的交互效应检验。

ROMY基于统计学理论和双重机器学习的最新进展构建,确保分析的稳健性和统计有效性。通过模拟研究验证了该框架的性能。

romy是款基于GNU GPLv3许可证的R包,已在GitHub开源。

Java版本:https://github.com/sysbio-curie/roma

R版本(rRoma):https://github.com/Albluca/rRoma

图1 ROMY-CIT的I类错误模拟,含与标准回归方法"LR"的对比

图2 ROMY-CIT的检验效能模拟,含与标准回归方法"LR"的对比

图3 ROMY-COV的I类错误模拟,含与标准回归方法"LR"的对比

图4 ROMY-COV的检验效能模拟,含与标准回归方法"LR"的对比

图5 ROMY-INTER的I类错误模拟,含与标准回归方法"LR"的对比

图6 ROMY-INTER的检验效能模拟,含与标准回归方法"LR"的对比

详细总结

思维导图

核心功能与技术细节

双版本特性对比

参考

bioRxiv[Preprint]. 2025 Dec 8:2025.12.04.691622. doi: 10.64898/2025.12.04.691622. Analyzing associations and higher-order effects in multi-omics data with double machine learning

251208ROMY.pdf

注:AI辅助创作,如有错误欢迎指出。内容仅供参考,不构成任何建议。

相关推荐
RDCJM2 小时前
index.php 和 php
开发语言·php
chushiyunen2 小时前
llama-index 数据清洗示例、数据清洗等
java·大数据·llama
sycmancia2 小时前
C++——Qt中的消息处理
开发语言·qt
wdfk_prog2 小时前
MCU内核电压不稳导致程序跑飞的现象、原因与影响
数据库·单片机·嵌入式硬件
biter down2 小时前
深入浅出 C++ string 类:从原理到实战
开发语言·c++
晓13132 小时前
React篇——第六章 React进阶特性与状态管理
前端·react.js·性能优化
okiseethenwhat2 小时前
反射在 JVM 层面的实现原理
开发语言·jvm·python
-Da-2 小时前
【ai应用开发日记】通用未注入Bean AI提示词
java·数据库·人工智能·spring boot·sqlserver
StackNoOverflow2 小时前
Redis 核心知识梳理:主从复制、集群搭建与数据类型详解(二)
数据库·redis·缓存