【工具】IntelliGenes使用多基因组图谱进行生物标志物发现和预测分析的新型机器学习管道

文章目录

介绍

在本文中,我们提出了一种新的机器学习(ML)管道,用于多基因组学探索,以发现高精度疾病预测中重要的生物标志物。智能是基于一种新颖的方法,它包括传统的统计技术和使用多基因组、临床和人口统计数据的尖端机器学习算法的联系。智能基因引入了一种新的度量,即智能基因(I-Gene)评分来衡量个体生物标志物对复杂性状预测的重要性。I-Gene评分可用于生成个体的I-Gene谱,以理解用于疾病预测的ML的复杂性。智能手机是一个用户友好的、可移植的、跨平台的应用程序,与微软的Windows、macOS和UNIX操作系统兼容。智能不仅具有个性化早期检测个体常见和罕见疾病的潜力,而且还为使用新的ML方法进行更广泛的研究开辟了道路,最终导致个性化干预和新的治疗目标。

Abstract

In this article, we present IntelliGenes, a novel machine learning (ML) pipeline for the multi-genomics exploration to discover biomarkers significant in disease prediction with high accuracy. IntelliGenes is based on a novel approach, which consists of nexus of conventional statistical techniques and cutting-edge ML algorithms using multi-genomic, clinical, and demographic data. IntelliGenes introduces a new metric, i.e. Intelligent Gene (I-Gene) score to measure the importance of individual biomarkers for prediction of complex traits. I-Gene scores can be utilized to generate I-Gene profiles of individuals to comprehend the intricacies of ML used in disease prediction. IntelliGenes is user-friendly, portable, and a cross-platform application, compatible with Microsoft Windows, macOS, and UNIX operating systems. IntelliGenes not only holds the potential for personalized early detection of common and rare diseases in individuals, but also opens avenues for broader research using novel ML methodologies, ultimately leading to personalized interventions and novel treatment targets.

代码

bash 复制代码
# Clone IntelliGenes' GitHub Repository
git clone https://github.com/drzeeshanahmed/intelligenes.git

# Navigate to IntelliGenes
cd intelligenes/

# Install IntelliGenes
pip install .

案例

bash 复制代码
# Clone IntelliGenes' GitHub Repository
git clone https://github.com/drzeeshanahmed/intelligenes.git

# Navigate to IntelliGenes
cd intelligenes/

# Install IntelliGenes
pip install .


# Discover Biomarkers
igenes_select -i data/cigt_file.csv -o results/

# Disease Prediction & I-Genes Scores 
igenes_predict -i data/cigt_file.csv -f features_file.csv -o results/

# IntelliGenes (Discovering Biomarkers & Predicting Disease) 
igenes -i data/cigt_file.csv -o results/

参考

  • IntelliGenes: a novel machine learning pipeline for biomarker discovery and predictive analysis using multi-genomic profiles
相关推荐
TS的美梦2 分钟前
scanpy单细胞转录组python教程(四):单样本数据分析之降维聚类及细胞注释
python·数据分析·聚类·单细胞转录组·scanpy
lll4823313 分钟前
数字图像处理4
人工智能·计算机视觉
大海的John25 分钟前
FinQ4Cn: 基于 MCP 协议的中国 A 股量化分析
人工智能
霍格沃兹测试开发学社测试人社区27 分钟前
Dify入门指南(2):5 分钟部署 Dify:云服务 vs 本地 Docker
人工智能·低代码
西猫雷婶29 分钟前
scikit-learn/sklearn学习|岭回归解读
开发语言·人工智能·机器学习·支持向量机·回归·scikit-learn·sklearn
一涯37 分钟前
用python写一个抓取股市关键词的程序
前端·python
AI导航猿1 小时前
能和MJ掰手腕?免费开源的Krea Dev,我用日常场景实测了一整天|AI导航猿
人工智能
CoderLiu1 小时前
AI提示词工程优化指南:8个技巧,释放大语言模型的全部潜力
前端·人工智能·ai编程
机器之心1 小时前
是「福尔摩斯」,也是「列文虎克」,智谱把OpenAI藏着掖着的视觉推理能力开源了
人工智能·openai
gaosushexiangji1 小时前
一种基于空间聚类的低特征场景下多目标跟踪技术
图像处理·人工智能·计算机视觉