资料总结分享:临床重要数据库

目录

RefSeqGene数据库

UCSC基因组数据库

[gnomAD(全称:Genome Aggregation Database)](#gnomAD(全称:Genome Aggregation Database))

[dbSNP(Single Nucleotide Polymorphism Database)](#dbSNP(Single Nucleotide Polymorphism Database))

[ExAC数据库(Exome Aggregation Consortium)](#ExAC数据库(Exome Aggregation Consortium))

[1000 Genomes](#1000 Genomes)

[HGMD(Human Gene Mutation Database)](#HGMD(Human Gene Mutation Database))

[OMIM(Online Mendelian Inheritance in Man)数据库](#OMIM(Online Mendelian Inheritance in Man)数据库)

ClinVar数据库

InterVar数据库

ClinGen数据库

OncoKB

[COSMIC(Catalogue Of Somatic Mutations In Cancer)](#COSMIC(Catalogue Of Somatic Mutations In Cancer))

[TCGA(The Cancer Genome Atlas)](#TCGA(The Cancer Genome Atlas))

[PharmGKB(Pharmacogenomics Knowledge Base,药理基因组知识库)](#PharmGKB(Pharmacogenomics Knowledge Base,药理基因组知识库))


RefSeqGene数据库

是由美国国家生物技术信息中心(NCBI)维护的一个基因序列数据库,旨在提供高质量的参考基因组序列和注释信息。

数据库内容: RefSeqGene数据库收集整理了多种生物物种的参考基因组序列和相关注释信息,包括人类、小鼠、果蝇、斑马鱼等。每个物种的参考基因组都被组织成一个个体参考序列,其中包含了该物种已知的基因、外显子、UTR、内含子等注释信息。

数据来源: RefSeqGene数据库的数据主要来源于NCBI的参考序列数据库(RefSeq),以及其他公共基因组数据资源。NCBI的RefSeq数据库是一个包含了已知生物物种的基因组、转录本和蛋白质序列的资源,具有高质量的注释信息。

数据库构建: RefSeqGene数据库通过整合已有的基因组序列和注释信息,构建了每个物种的个体参考序列。这些序列经过了精细的筛选和校对,确保其质量和准确性。同时,RefSeqGene还包括了对于基因组重要区域(如编码基因、转录因子结合位点等)的详细注释信息。

数据库更新: RefSeqGene数据库会定期更新,以反映最新的研究成果和基因组数据。更新内容包括新增基因、修正注释信息、更新序列版本等。用户可以通过NCBI网站或FTP服务器获取最新的RefSeqGene数据。

应用领域: RefSeqGene数据库在基因组学、生物信息学、遗传学等领域具有广泛的应用价值。研究人员可以利用RefSeqGene数据库进行基因注释、基因表达分析、基因功能预测等研究工作,为生物学研究提供重要的参考信息。

UCSC基因组数据库

是一个广泛使用的在线基因组注释和浏览工具,由加州大学圣克鲁兹分校(UCSC)的基因组生物学研究所开发和维护。该浏览器提供了丰富的基因组信息,包括基因组序列、基因结构、转录本、调控元件、基因组变异等,支持用户在基因组水平上进行高效的数据查询、可视化和分析。

数据内容: UCSC基因组浏览器包含了多种生物物种的基因组序列和相关注释信息,涵盖了哺乳动物、植物、昆虫、微生物等多个领域。用户可以浏览染色体水平的基因组序列,查看基因、外显子、UTR、内含子等注释信息,同时还可以查看转录本、启动子、转录因子结合位点等调控元件的位置和特征。

界面特点: UCSC基因组浏览器的界面直观易用,提供了丰富的功能和工具,包括缩放、滚动、搜索、标记、比较等功能,用户可以根据需求自定义浏览器的显示设置和数据视图。同时,浏览器支持多种数据类型的叠加显示,如基因组序列、RNA-seq数据、ChIP-seq数据等,便于用户进行综合分析。

数据源: UCSC基因组浏览器的数据主要来源于公共数据库和研究项目,包括NCBI的RefSeq数据库、ENSEMBL数据库、GENCODE数据库等,以及一些基因组计划和合作项目的数据资源。这些数据经过整合和标准化处理,为用户提供了一站式的基因组注释服务。

工具和功能: UCSC基因组浏览器提供了丰富的工具和功能,包括搜索工具、比较工具、下载工具、基因组编辑工具等,满足用户对基因组数据的不同需求。用户可以通过浏览器进行基因注释、基因组比较、SNP查询、序列下载等操作,支持用户在基因组水平上进行高效的数据分析和挖掘。

应用领域: UCSC基因组浏览器在生物学研究、医学基因组学、进化生物学等领域具有广泛的应用价值。研究人员可以利用该浏览器进行基因组数据的查找、注释、比较和分析,为基因功能研究、疾病诊断和药物开发等提供重要的支持和参考信息。

gnomAD(全称:Genome Aggregation Database)

是一个广泛使用的基因组数据库,旨在提供大规模人类基因组变异数据的综合资源。以下是gnomAD数据库的详细介绍:

数据来源: gnomAD数据库整合了来自多个独立研究项目和合作组织的大规模人类基因组测序数据,包括全基因组测序(WGS)和外显子组测序(WES)数据。这些数据源覆盖了多个人群和种族,涵盖了丰富的人类遗传变异信息。

数据内容: gnomAD数据库提供了详尽的人类基因组变异数据,包括单核苷酸多态性(SNP)、插入缺失突变(Indel)、结构变异(SV)等多种类型的遗传变异。该数据库还提供了变异的注释信息,如功能影响、频率分布、临床相关性等,为研究人员提供了全面的变异数据资源。

数据质量: gnomAD数据库致力于提供高质量的基因组数据资源,采用严格的数据过滤和质量控制流程,包括对序列质量、覆盖度、杂合性、变异类型等进行筛选和标准化,确保数据的可靠性和准确性。

数据库访问: gnomAD数据库提供了在线浏览和数据下载服务,用户可以通过官方网站访问数据库,并进行数据查询、浏览和下载。此外,该数据库还提供了API接口,方便开发者通过编程方式获取和利用数据库中的数据。

应用领域: gnomAD数据库在人类遗传学、疾病研究、药物开发等领域具有重要的应用价值。研究人员可以利用该数据库进行基因组变异的注释和分析,发现与疾病相关的候选基因和变异位点,为疾病的诊断、治疗和预防提供重要的参考信息。

dbSNP(Single Nucleotide Polymorphism Database)

是由美国国家生物技术信息中心(NCBI)维护的一个广泛使用的人类单核苷酸多态性(SNP)数据库。

数据来源: dbSNP数据库收集了全球范围内的人类单核苷酸多态性(SNP)数据,来源包括科学研究、遗传调查、基因组计划等多个渠道。这些数据覆盖了多个人群和种族,涵盖了丰富的人类遗传变异信息。

数据内容: dbSNP数据库提供了丰富的人类SNP数据,包括单核苷酸多态性(SNP)、插入缺失突变(Indel)、结构变异(SV)等多种类型的遗传变异。此外,数据库还包含了变异的注释信息,如基因组坐标、功能影响、频率分布、临床相关性等,为研究人员提供了全面的变异数据资源。

数据质量: dbSNP数据库致力于提供高质量的人类SNP数据资源,采用严格的数据过滤和质量控制流程,包括对数据来源、实验方法、数据质量等进行筛选和标准化,确保数据的可靠性和准确性。

数据库结构: dbSNP数据库采用分层的数据库结构,包括核心数据库(core database)、外显子数据库(exon database)、综合数据库(integrated database)等多个子数据库,每个子数据库都针对特定的数据类型或应用场景进行了优化和整合。

数据库访问: dbSNP数据库提供了在线浏览和数据下载服务,用户可以通过NCBI网站访问数据库,并进行数据查询、浏览和下载。此外,该数据库还提供了API接口,方便开发者通过编程方式获取和利用数据库中的数据。

应用领域: dbSNP数据库在人类遗传学、疾病研究、药物开发等领域具有重要的应用价值。研究人员可以利用该数据库进行基因组变异的注释和分析,发现与疾病相关的候选基因和变异位点,为疾病的诊断、治疗和预防提供重要的参考信息。

ExAC数据库(Exome Aggregation Consortium)

是一个由布罗德研究所(Broad Institute)发起的项目,旨在提供大规模外显子组测序数据的综合资源。ExAC数据库已经合并到gnomAD(Genome Aggregation Database)中,网址为http://gnomad.broadinstitute.org

数据来源: ExAC数据库整合了来自多个独立研究项目和合作组织的大规模外显子组测序数据,覆盖了全球范围内多个人群和种族。这些数据来源包括科学研究、人类遗传调查、疾病研究等多个渠道,提供了丰富的人类外显子组变异信息。

数据内容: ExAC数据库提供了详尽的外显子组变异数据,包括单核苷酸多态性(SNP)、插入缺失突变(Indel)、结构变异(SV)等多种类型的遗传变异。该数据库还提供了变异的注释信息,如功能影响、频率分布、临床相关性等,为研究人员提供了全面的外显子组变异数据资源。

数据质量: ExAC数据库采用严格的数据过滤和质量控制流程,对外显子组测序数据进行了质量评估和数据清洗,确保数据的可靠性和准确性。该数据库还提供了多个质量指标和过滤标准,帮助用户评估和筛选变异数据。

数据库访问: ExAC数据库(现在是gnomAD)提供了在线浏览和数据下载服务,用户可以通过gnomAD网站访问数据库,并进行数据查询、浏览和下载。该数据库还提供了交互式数据浏览工具和可视化分析功能,方便用户对变异数据进行探索和分析。

应用领域: ExAC数据库(gnomAD)在人类遗传学、疾病研究、药物开发等领域具有重要的应用价值。研究人员可以利用该数据库进行外显子组变异的注释和分析,发现与疾病相关的候选基因和变异位点,为疾病的诊断、治疗和预防提供重要的参考信息。

1000 Genomes

计划是一个旨在建立人类基因组变异图谱的国际合作项目,旨在全面了解人类基因组的多样性和变异。该项目于2008年启动,是由国际基因组组织(IGC)主导的大规模合作项目之一。

项目目标: 1000 Genomes计划的主要目标是通过对全球多个人群的基因组测序,建立一个全面的人类基因组变异图谱,包括单核苷酸多态性(SNP)、插入缺失突变(Indel)、结构变异(SV)等多种类型的遗传变异。通过这一图谱,可以深入了解人类遗传多样性和变异的模式、频率以及与疾病相关的遗传变异。

数据来源: 1000 Genomes计划整合了来自全球多个人群和种族的基因组测序数据,包括欧洲人、非洲人、亚洲人、美洲原住民等多个人群。这些数据来源包括科学研究、人类遗传调查、疾病研究等多个渠道,覆盖了全球范围内的人类遗传变异信息。

数据内容: 1000 Genomes计划提供了详尽的人类基因组变异数据,包括SNP、Indel、SV等多种类型的遗传变异。该项目还提供了变异的注释信息,如基因组坐标、功能影响、频率分布、临床相关性等,为研究人员提供了全面的基因组变异数据资源。

数据质量: 1000 Genomes计划采用严格的数据质量控制流程,对基因组测序数据进行了质量评估和数据清洗,确保数据的可靠性和准确性。该项目还提供了多个质量指标和过滤标准,帮助用户评估和筛选变异数据。

数据库访问: 1000 Genomes计划提供了在线浏览和数据下载服务,用户可以通过该项目网站访问数据库,并进行数据查询、浏览和下载。此外,该项目还提供了API接口和数据分析工具,方便研究人员对基因组变异数据进行探索和分析。

应用领域: 1000 Genomes计划在人类遗传学、疾病研究、进化生物学等领域具有重要的应用价值。研究人员可以利用该项目提供的基因组变异数据进行基因组注释和分析,发现与疾病相关的候选基因和变异位点,深入探索人类遗传多样性和进化历史。

HGMD(Human Gene Mutation Database)

是一个专注于人类遗传变异的数据库,旨在收集和整理人类基因突变和相关的遗传变异信息。以下是对HGMD数据库的详细介绍:

数据库背景: HGMD数据库由英国剑桥大学的Anthony Brookes教授创建于1996年,是一个长期致力于收集和整理人类遗传变异信息的权威数据库之一。该数据库通过系统地收集和注释与人类遗传病相关的基因突变和变异信息,为遗传学、临床基因学等领域的研究提供了重要的数据资源。

数据来源: HGMD数据库主要收集来自科学文献、遗传疾病数据库、临床病例报告等多个来源的人类遗传变异信息。通过文献挖掘和手工注释的方式,该数据库持续更新并添加新的变异数据,确保数据的全面性和准确性。

数据内容: HGMD数据库主要包括以下内容:

基因突变信息: 收集和记录与人类遗传疾病相关的基因突变信息,包括单核苷酸变异(SNV)、插入缺失变异(Indel)、复杂结构变异等多种类型的遗传变异。

临床相关性: 注释基因突变的临床相关信息,如与遗传疾病的关联、临床表型描述等,帮助研究人员理解变异的临床意义和影响。

功能影响: 提供基因突变对基因功能的影响和预测信息,如影响蛋白质结构、功能变异、剪接位点等。

变异频率: 提供基因突变在人群中的频率信息,包括总体频率和特定人群频率,帮助研究人员评估变异的罕见性和常见性。

数据质量: HGMD数据库对收集的数据进行严格的质量控制和验证,包括文献信息核实、变异注释一致性检查、数据交叉验证等多个环节,确保数据的可靠性和准确性。

应用领域: HGMD数据库在遗传疾病研究、临床诊断、基因治疗等领域具有重要的应用价值。研究人员和临床医生可以利用该数据库提供的遗传变异信息,辅助遗传疾病的诊断、基因风险评估和治疗策略制定。

OMIM(Online Mendelian Inheritance in Man)数据库

是一个专注于遗传性疾病和相关基因的综合性数据库,旨在收集和整理与人类遗传疾病相关的遗传信息。

数据库背景: OMIM数据库由美国国立卫生研究院(NIH)的国家生物技术信息中心(NCBI)维护和管理,由博士Victor A. McKusick于1966年创建。OMIM最初是一本印刷的书籍,后来逐渐发展成为一个在线数据库,成为了遗传学研究和临床诊断的重要资源之一。

数据来源: OMIM数据库主要收集来自科学文献、遗传疾病数据库、临床病例报告等多个来源的遗传信息。通过文献挖掘、专家审查和手工注释的方式,该数据库持续更新并添加新的遗传信息,确保数据的全面性和准确性。

数据内容: OMIM数据库主要包括以下内容:

遗传性疾病信息: 收集和记录与人类遗传疾病相关的详细信息,包括疾病名称、临床表型描述、遗传模式、基因突变信息等。

相关基因信息: 注释与遗传疾病相关的基因信息,包括基因名称、基因功能、基因突变、蛋白质结构等。

遗传模式: 提供遗传疾病的遗传模式信息,如常染色体显性遗传、常染色体隐性遗传、X连锁遗传等。

文献引用: 提供引用来源文献的详细信息,帮助用户查找原始文献和进一步阅读相关研究内容。

数据质量: OMIM数据库对收集的数据进行严格的质量控制和验证,包括文献信息核实、专家审查、数据交叉验证等多个环节,确保数据的可靠性和准确性。

应用领域: OMIM数据库在遗传疾病研究、临床诊断、基因治疗等领域具有广泛的应用价值。研究人员和临床医生可以利用该数据库提供的遗传信息,辅助遗传疾病的诊断、基因风险评估和治疗策略制定。

ClinVar数据库

是一个重要的医学遗传学数据库,由美国国家生物技术信息中心(NCBI)维护和管理。该数据库收集和整理了与人类遗传变异相关的临床信息,旨在为遗传疾病的诊断、研究和治疗提供支持。

数据库背景: ClinVar数据库成立于2013年,旨在集成来自不同研究机构、临床实验室和文献报道的遗传变异信息,为临床医生、遗传学家和研究人员提供一个统一的平台来查找和分享与遗传变异相关的临床信息。

数据来源: ClinVar数据库主要收集来自临床实验室的遗传变异检测结果、科学文献报道的遗传变异信息以及临床医生和研究人员提交的遗传变异数据。通过多种渠道收集数据,并经过严格的质量控制和验证,确保数据的准确性和可靠性。

数据内容: ClinVar数据库主要包括以下内容:

遗传变异信息: 提供与人类基因组中已知的遗传变异相关的详细信息,包括单核苷酸多态性(SNP)、插入/缺失突变、复合杂突变等。

临床意义: 注释遗传变异的临床意义,包括致病性评估、疾病关联性、药物反应性等。

基因突变: 提供遗传变异所在的基因信息,包括基因名称、基因功能、突变类型等。

文献引用: 提供引用来源文献的详细信息,帮助用户查找原始文献和进一步阅读相关研究内容。

数据质量: ClinVar数据库对收集的数据进行严格的质量控制和验证,包括数据交叉验证、专家审查和标准化处理等多个环节,确保数据的可靠性和准确性。

应用领域: ClinVar数据库在临床诊断、遗传咨询、基因组学研究等领域具有广泛的应用价值。临床医生和遗传学家可以利用该数据库提供的临床信息,辅助遗传变异的解读、疾病的诊断和治疗策略的制定。

InterVar数据库

是一个用于解释人类遗传变异临床意义的工具,旨在帮助临床医生和遗传学家对患者的遗传变异结果进行解读和评估。

数据库背景: InterVar(Interpretation of genetic VARiants)数据库由中国武汉大学基因组医学实验室(WGlab)开发和维护,是一个在线工具,提供了对人类遗传变异的临床意义进行评估和解释的功能。

数据来源: InterVar数据库主要利用公开的遗传变异信息和临床数据库(如ClinVar、HGMD等)中的数据,结合临床指南和专家共识,对遗传变异的临床意义进行系统评估和分类。

功能特点: InterVar数据库具有以下主要功能特点:

遗传变异解释: 提供对遗传变异的致病性评估,包括致病性分类(致病、可能致病、良性等)、临床意义(致病性程度)、疾病关联性等。

标准化流程: 根据国际遗传学会(American College of Medical Genetics and Genomics, ACMG)的指南和标准,提供遗传变异解释的标准化流程和评估标准。

综合评估: 结合多种证据,如突变类型、功能影响、进化保守性、表型相关性等,对遗传变异进行综合评估和分类。

应用领域: InterVar数据库主要应用于临床遗传诊断、遗传咨询、基因组学研究等领域,帮助临床医生和遗传学家对患者的遗传变异结果进行解读、诊断和治疗策略的制定。

ClinGen数据库

是一个由美国国家人类基因组研究所(NHGRI)资助的国际性项目,旨在提高临床遗传测试的准确性和可靠性,促进遗传变异的标准化解释和分类。

项目背景: ClinGen(Clinical Genome Resource)项目于2013年启动,是一个由临床医生、遗传学家、生物信息学家等专业人士组成的国际性合作项目,旨在建立一个共享的遗传变异信息资源,提供对遗传变异的标准化解释和分类。

数据来源: ClinGen数据库主要整合来自临床实验室、研究机构、临床试验和文献报道的遗传变异信息,以及专家共识和临床指南等信息,通过多种渠道收集数据,并进行严格的质量控制和验证。

功能特点: ClinGen数据库具有以下主要功能特点:

遗传变异标准化: 提供对遗传变异的标准化解释和分类,包括致病性评估、临床意义、疾病关联性等。

专家共识: 基于专家共识和临床指南,对遗传变异进行综合评估和分类,提供权威的遗传变异解释结果。

知识库: 构建了包括基因、突变、疾病等在内的全面的遗传变异知识库,为临床医生、遗传学家和研究人员提供参考和查询。

应用领域: ClinGen数据库主要应用于临床遗传诊断、遗传咨询、基因组学研究等领域,帮助临床医生和遗传学家对患者的遗传变异结果进行解读、诊断和治疗策略的制定。

OncoKB

是一个综合的肿瘤知识库,致力于提供基于肿瘤基因组信息的个体化癌症治疗建议。

项目背景: OncoKB项目由美国斯隆凯特琳癌症中心(MSKCC)的医生和研究人员共同创建,旨在为临床医生、研究人员和患者提供准确、可靠的肿瘤基因组信息和治疗建议。

数据来源: OncoKB整合了来自临床试验、临床研究、文献报道以及专家共识的肿瘤基因组信息,包括肿瘤相关基因的突变、致病性、药物反应等数据,通过多种渠道收集和验证数据的准确性和可靠性。

功能特点: OncoKB具有以下主要功能特点:

基因突变解释: 提供对肿瘤相关基因突变的解释和分类,包括致病性评估、临床意义、药物反应等信息。

治疗建议: 基于基因突变信息,提供个体化的癌症治疗建议,包括药物选择、治疗方案、临床试验等推荐。

专家共识: 基于专家共识和最新的临床指南,对肿瘤基因组信息进行综合评估和解释,提供权威的治疗建议。

数据更新: 不断更新和维护数据库内容,及时反映最新的临床试验结果、研究进展和专家共识。

用户反馈: 支持用户反馈和贡献数据,促进数据库内容的完善和更新。

应用领域: OncoKB主要应用于肿瘤个体化治疗、临床试验设计、基因组学研究等领域,帮助临床医生和研究人员根据患者的肿瘤基因组信息制定个性化的治疗方案,提高治疗效果和生存率。

COSMIC(Catalogue Of Somatic Mutations In Cancer)

是一个全球性的癌症基因组数据库,由英国剑桥大学Sanger研究所的癌症基因组团队创建和维护。它旨在收集、整合和分析全球范围内癌症患者的肿瘤基因组信息,为研究人员、临床医生和生物信息学家提供有关癌症基因突变的丰富资源。

以下是COSMIC数据库的详细介绍:

项目背景: COSMIC项目始于2004年,是一个长期致力于收集和整理全球癌症样本中的突变信息的数据库。它提供了一种系统性的方式来理解肿瘤的遗传变异,并促进了癌症基因组学领域的研究和临床应用。

数据内容: COSMIC数据库包含了来自各种癌症类型的肿瘤样本中的遗传变异数据,主要包括以下内容:

突变数据: COSMIC收集了不同癌症类型中的突变数据,包括单核苷酸变异(SNV)、插入/缺失(indels)、染色体结构变异等,以及与这些突变相关的详细信息,如变异类型、位置、频率等。

基因信息: 提供了肿瘤相关基因的详细信息,包括基因名称、功能、通路参与等。

表型数据: COSMIC还收集了与突变相关的临床表型信息,如肿瘤类型、临床分期、治疗历史等。

数据来源: COSMIC数据库的数据来源包括临床研究、癌症基因组学项目、科学文献报道等多种渠道,确保数据的全面性和准确性。

应用领域: COSMIC数据库在癌症研究、肿瘤基因组学、临床诊断和个体化治疗等领域有着广泛的应用。研究人员可以利用COSMIC的数据来发现肿瘤相关基因的突变模式、预测突变的功能影响、寻找治疗靶点等,为癌症的诊断和治疗提供重要参考。

TCGA(The Cancer Genome Atlas)

是一个由美国国家癌症研究所(NCI)和国立人类基因组研究所(NHGRI)合作创建的大型癌症基因组学项目。该项目旨在通过全面的癌症基因组学分析来加深对各种癌症类型的理解,并为癌症的预防、诊断和治疗提供重要信息:

项目目标: TCGA项目的主要目标是通过对多种癌症类型的肿瘤样本进行高通量基因组学分析,揭示癌症发生和发展的分子机制,并为个体化医学提供基础。通过这些努力,TCGA旨在为未来的癌症治疗和管理提供更精准、更有效的方法。

样本收集: TCGA项目从全美各地收集了成千上万个癌症患者的肿瘤样本,涵盖了多种癌症类型,包括但不限于乳腺癌、肺癌、结直肠癌、子宫内膜癌等。这些样本来自临床医院、癌症研究中心等机构,经过严格的质量控制和标准化处理。

高通量数据生成: TCGA项目使用各种高通量技术对肿瘤样本进行全面的分子特征分析,包括基因组测序、转录组测序、表观基因组学(如甲基化分析)、蛋白质组学等。这些数据能够揭示肿瘤细胞中的基因变异、基因表达模式、表观遗传学特征等重要信息。

数据整合与分析: TCGA项目将生成的高通量数据与临床数据(如患者病史、治疗记录等)整合在一起,为研究人员提供了一个全面的癌症数据库。研究人员可以利用这些数据来研究不同癌症类型的分子特征、发现潜在的治疗靶点、预测治疗反应等。

数据共享与开放获取: TCGA项目秉持开放共享的原则,将生成的数据公开提供给全球科研机构和学术界使用。研究人员可以通过TCGA官方网站(https://www.cancer.gov/tcga)免费获取数据,并利用这些数据进行自己的研究。

TCGA存储的数据包括SNV、转录组分析、生物样本信息、原始测序数据、CNV、DNA甲基化、临床信息等。这些数据可分为三个级别:

Level 1: 原始的测序数据(fasta,fastq等)

Level 2:比对好的bam文件

Level 3:为经过处理及标准化的数据

PharmGKB(Pharmacogenomics Knowledge Base,药理基因组知识库)

是一个专注于药物基因组学的在线资源,旨在帮助医生、研究人员和药物开发者理解个体之间基因变异对药物反应的影响。

数据库概述: PharmGKB是一个由斯坦福大学主持的在线资源,致力于整合和分享药物与基因之间相互作用的信息。它提供了关于基因-药物相互作用、基因多态性、药物代谢途径等方面的数据和注释。

数据内容: PharmGKB数据库包含了大量的数据,包括但不限于以下几个方面:

基因药物相互作用: 数据库中包含了基因与药物之间相互作用的信息,包括基因变异对药物代谢、药效和不良反应的影响。

基因多态性: PharmGKB收集了基因多态性(如单核苷酸多态性,SNP)的信息,并对其与药物反应之间的关联进行注释和解释。

药物代谢途径: 数据库中提供了药物代谢途径的详细信息,包括药物的代谢酶、代谢产物等。

药物剂量指南: PharmGKB还提供了药物剂量指南,帮助医生根据患者的基因型个体化地确定药物剂量。

数据来源: PharmGKB数据库整合了来自文献、临床试验、药物标签等多个来源的数据,并对这些数据进行了标准化和注释。它还定期更新数据,以反映最新的研究进展和临床实践。

应用: PharmGKB数据库的数据可用于多个领域,包括临床医学、药物研发和个体化医学等。医生可以利用数据库提供的信息来指导药物治疗方案的选择和优化,研究人员可以利用数据库中的数据进行药物基因组学研究,药物开发者可以利用数据库中的信息来设计更安全、更有效的药物。

这是我收集到了临床重要的数据库,只介绍了基础信息,大家可以参考一下。

相关推荐
时差95335 分钟前
【面试题】Hive 查询:如何查找用户连续三天登录的记录
大数据·数据库·hive·sql·面试·database
让学习成为一种生活方式37 分钟前
R包下载太慢安装中止的解决策略-R语言003
java·数据库·r语言
秋意钟1 小时前
MySQL日期类型选择建议
数据库·mysql
Dxy12393102162 小时前
python下载pdf
数据库·python·pdf
桀桀桀桀桀桀3 小时前
数据库中的用户管理和权限管理
数据库·mysql
superman超哥4 小时前
04 深入 Oracle 并发世界:MVCC、锁、闩锁、事务隔离与并发性能优化的探索
数据库·oracle·性能优化·dba
用户8007165452004 小时前
HTAP数据库国产化改造技术可行性方案分析
数据库
engchina4 小时前
Neo4j 和 Python 初学者指南:如何使用可选关系匹配优化 Cypher 查询
数据库·python·neo4j
engchina4 小时前
使用 Cypher 查询语言在 Neo4j 中查找最短路径
数据库·neo4j
尘浮生5 小时前
Java项目实战II基于Spring Boot的光影视频平台(开发文档+数据库+源码)
java·开发语言·数据库·spring boot·后端·maven·intellij-idea