【工具】IntelliGenes使用多基因组图谱进行生物标志物发现和预测分析的新型机器学习管道

文章目录

介绍

在本文中,我们提出了一种新的机器学习(ML)管道,用于多基因组学探索,以发现高精度疾病预测中重要的生物标志物。智能是基于一种新颖的方法,它包括传统的统计技术和使用多基因组、临床和人口统计数据的尖端机器学习算法的联系。智能基因引入了一种新的度量,即智能基因(I-Gene)评分来衡量个体生物标志物对复杂性状预测的重要性。I-Gene评分可用于生成个体的I-Gene谱,以理解用于疾病预测的ML的复杂性。智能手机是一个用户友好的、可移植的、跨平台的应用程序,与微软的Windows、macOS和UNIX操作系统兼容。智能不仅具有个性化早期检测个体常见和罕见疾病的潜力,而且还为使用新的ML方法进行更广泛的研究开辟了道路,最终导致个性化干预和新的治疗目标。

Abstract

In this article, we present IntelliGenes, a novel machine learning (ML) pipeline for the multi-genomics exploration to discover biomarkers significant in disease prediction with high accuracy. IntelliGenes is based on a novel approach, which consists of nexus of conventional statistical techniques and cutting-edge ML algorithms using multi-genomic, clinical, and demographic data. IntelliGenes introduces a new metric, i.e. Intelligent Gene (I-Gene) score to measure the importance of individual biomarkers for prediction of complex traits. I-Gene scores can be utilized to generate I-Gene profiles of individuals to comprehend the intricacies of ML used in disease prediction. IntelliGenes is user-friendly, portable, and a cross-platform application, compatible with Microsoft Windows, macOS, and UNIX operating systems. IntelliGenes not only holds the potential for personalized early detection of common and rare diseases in individuals, but also opens avenues for broader research using novel ML methodologies, ultimately leading to personalized interventions and novel treatment targets.

代码

bash 复制代码
# Clone IntelliGenes' GitHub Repository
git clone https://github.com/drzeeshanahmed/intelligenes.git

# Navigate to IntelliGenes
cd intelligenes/

# Install IntelliGenes
pip install .

案例

bash 复制代码
# Clone IntelliGenes' GitHub Repository
git clone https://github.com/drzeeshanahmed/intelligenes.git

# Navigate to IntelliGenes
cd intelligenes/

# Install IntelliGenes
pip install .


# Discover Biomarkers
igenes_select -i data/cigt_file.csv -o results/

# Disease Prediction & I-Genes Scores 
igenes_predict -i data/cigt_file.csv -f features_file.csv -o results/

# IntelliGenes (Discovering Biomarkers & Predicting Disease) 
igenes -i data/cigt_file.csv -o results/

参考

  • IntelliGenes: a novel machine learning pipeline for biomarker discovery and predictive analysis using multi-genomic profiles
相关推荐
冷雨夜中漫步1 小时前
Python快速入门(6)——for/if/while语句
开发语言·经验分享·笔记·python
33三 三like2 小时前
《基于知识图谱和智能推荐的养老志愿服务系统》开发日志
人工智能·知识图谱
芝士爱知识a2 小时前
【工具推荐】2026公考App横向评测:粉笔、华图与智蛙面试App功能对比
人工智能·软件推荐·ai教育·结构化面试·公考app·智蛙面试app·公考上岸
郝学胜-神的一滴2 小时前
深入解析Python字典的继承关系:从abc模块看设计之美
网络·数据结构·python·程序人生
百锦再2 小时前
Reactive编程入门:Project Reactor 深度指南
前端·javascript·python·react.js·django·前端框架·reactjs
李慕婉学姐2 小时前
【开题答辩过程】以《基于社交网络用户兴趣大数据分析》为例,不知道这个选题怎么做的,不知道这个选题怎么开题答辩的可以进来看看
数据挖掘·数据分析
腾讯云开发者3 小时前
港科大熊辉|AI时代的职场新坐标——为什么你应该去“数据稀疏“的地方?
人工智能
工程师老罗3 小时前
YoloV1数据集格式转换,VOC XML→YOLOv1张量
xml·人工智能·yolo
喵手3 小时前
Python爬虫实战:旅游数据采集实战 - 携程&去哪儿酒店机票价格监控完整方案(附CSV导出 + SQLite持久化存储)!
爬虫·python·爬虫实战·零基础python爬虫教学·采集结果csv导出·旅游数据采集·携程/去哪儿酒店机票价格监控