【工具】IntelliGenes使用多基因组图谱进行生物标志物发现和预测分析的新型机器学习管道

文章目录

介绍

在本文中,我们提出了一种新的机器学习(ML)管道,用于多基因组学探索,以发现高精度疾病预测中重要的生物标志物。智能是基于一种新颖的方法,它包括传统的统计技术和使用多基因组、临床和人口统计数据的尖端机器学习算法的联系。智能基因引入了一种新的度量,即智能基因(I-Gene)评分来衡量个体生物标志物对复杂性状预测的重要性。I-Gene评分可用于生成个体的I-Gene谱,以理解用于疾病预测的ML的复杂性。智能手机是一个用户友好的、可移植的、跨平台的应用程序,与微软的Windows、macOS和UNIX操作系统兼容。智能不仅具有个性化早期检测个体常见和罕见疾病的潜力,而且还为使用新的ML方法进行更广泛的研究开辟了道路,最终导致个性化干预和新的治疗目标。

Abstract

In this article, we present IntelliGenes, a novel machine learning (ML) pipeline for the multi-genomics exploration to discover biomarkers significant in disease prediction with high accuracy. IntelliGenes is based on a novel approach, which consists of nexus of conventional statistical techniques and cutting-edge ML algorithms using multi-genomic, clinical, and demographic data. IntelliGenes introduces a new metric, i.e. Intelligent Gene (I-Gene) score to measure the importance of individual biomarkers for prediction of complex traits. I-Gene scores can be utilized to generate I-Gene profiles of individuals to comprehend the intricacies of ML used in disease prediction. IntelliGenes is user-friendly, portable, and a cross-platform application, compatible with Microsoft Windows, macOS, and UNIX operating systems. IntelliGenes not only holds the potential for personalized early detection of common and rare diseases in individuals, but also opens avenues for broader research using novel ML methodologies, ultimately leading to personalized interventions and novel treatment targets.

代码

bash 复制代码
# Clone IntelliGenes' GitHub Repository
git clone https://github.com/drzeeshanahmed/intelligenes.git

# Navigate to IntelliGenes
cd intelligenes/

# Install IntelliGenes
pip install .

案例

bash 复制代码
# Clone IntelliGenes' GitHub Repository
git clone https://github.com/drzeeshanahmed/intelligenes.git

# Navigate to IntelliGenes
cd intelligenes/

# Install IntelliGenes
pip install .


# Discover Biomarkers
igenes_select -i data/cigt_file.csv -o results/

# Disease Prediction & I-Genes Scores 
igenes_predict -i data/cigt_file.csv -f features_file.csv -o results/

# IntelliGenes (Discovering Biomarkers & Predicting Disease) 
igenes -i data/cigt_file.csv -o results/

参考

  • IntelliGenes: a novel machine learning pipeline for biomarker discovery and predictive analysis using multi-genomic profiles
相关推荐
编程界一哥14 小时前
使命召唤20 msvcp140.dll缺失怎么修复 2026官方安全解决方法
数据挖掘
好家伙VCC14 小时前
**发散创新:基于Rust的轻量级权限管理库设计与开源许可证实践**在现代分布式系统中,**权限控制(RBAC
java·开发语言·python·rust·开源
芯智工坊14 小时前
第19章 Mosquitto完整项目实战
网络·人工智能·mqtt·开源
moers14 小时前
从自建模型迁移到调API,省了480万,但踩了这些坑
人工智能
skilllite作者14 小时前
Spec + Task 作为「开发协议层」:Rust 大模型辅助的标准化、harness 化与可回滚
开发语言·人工智能·后端·安全·架构·rust·rust沙箱
Dxy123931021614 小时前
Python序列标注模型上下文纠错详解
开发语言·python
ZhengEnCi14 小时前
P2H-Python字符串格式化完全指南-format和f-string的Python编程利器
python
HaiXCoder14 小时前
python从入门到精通-第5章: 函数式编程 — Python的函数式风格
python
程序员猫哥_14 小时前
AI建站工具从0到1全流程攻略:如何用AI生成一个专业品牌官网
数据挖掘
何陋轩14 小时前
GitHub Copilot深度使用指南:手把手教你在IDEA中榨干AI生产力
人工智能·后端