重测序关系矩阵构建方式汇总

样本间亲缘关系矩阵(kinship matrix)和同源性矩阵(IBS matrix)构建的方式

1. 可以使用plink的--make-rel计算个体之间的亲缘关系(强调个体之间的遗传相似性)

bash 复制代码
/opt/software/plink --bfile vcf_bfile--make-rel --out relatedness_matrix # 得到亲缘关系距离矩阵:
# relatedness_matrix.rel

2. kinship

bash 复制代码
# 利用tassel计算
run_pipeline.pl -Xmx1536m-Xms512m -SortGenotypeFilePlugin -inputFile 你的vcf文件 -outputFile outvcf -fileType VCF
run_pipeline.pl-Xmx1536m -Xms512m -importGuess outvcf -KinshipPlugin -methodCentered_IBS -endPlugin -export tassel_kinship.txt -exportType SqrMatrix
# 利用gcta计算
使用 --make-grm-alg 1 或 --make-grm 0
gcta --make-grm --make-grm-alg 1 --out snp.gcta --bfile vcf_bfile snp --autosome-num 90

3. IBS

bash 复制代码
/opt/software/plink --bfile  vcf_bfile --make-bed --out IBS_matrix --maf 0.05 --recode --double-id --allow-extra-chr --chr-set 90  --distance square ibs
要计算遗传距离,使用1-ibs

群体关系矩阵如何构建?

转换方法:平均IBS(个体对间均值)

计算所有个体两两之间的IBS均值,反映群体内遗传相似性。

python 复制代码
#算法示例
import numpy as np

def pairwise_ibs(genotype_matrix):
    n_individuals = genotype_matrix.shape[0]
    ibs_matrix = np.zeros((n_individuals, n_individuals))
    
    for i in range(n_individuals):
        for j in range(i+1, n_individuals):
            ibs_sum = 0
            for snp in range(genotype_matrix.shape[1]):
                ibs_sum += calculate_ibs(
                    genotype_matrix[i, snp, 0], genotype_matrix[i, snp, 1],
                    genotype_matrix[j, snp, 0], genotype_matrix[j, snp, 1]
                )
            ibs_matrix[i, j] = ibs_sum / genotype_matrix.shape[1]
            ibs_matrix[j, i] = ibs_matrix[i, j]  # 对称矩阵
    return ibs_matrix

# 示例基因型矩阵(个体数×SNP数×2等位基因)
genotype_data = np.array([
    [['A', 'A'], ['G', 'G']],  # 个体1
    [['A', 'G'], ['G', 'G']],  # 个体2
    [['T', 'T'], ['A', 'G']]   # 个体3
])
ibs_matrix = pairwise_ibs(genotype_data)
print("群体IBS矩阵:\n", ibs_matrix)
相关推荐
lbb 小魔仙2 小时前
面向 NPU 的高性能矩阵乘法:CANN ops-nn 算子库架构与优化技术
线性代数·矩阵·架构
空白诗2 小时前
CANN ops-nn 算子解读:大语言模型推理中的 MatMul 矩阵乘实现
人工智能·语言模型·矩阵
池央5 小时前
ops-nn 算子库中的数据布局与混合精度策略:卷积、矩阵乘法与 RNN 的优化实践
rnn·线性代数·矩阵
深鱼~8 小时前
大模型底层算力支撑:ops-math在矩阵乘法上的优化
人工智能·线性代数·矩阵·cann
Zfox_8 小时前
CANN PyPTO 编程范式深度解析:并行张量与 Tile 分块操作的架构原理、内存控制与流水线调度机制
线性代数·矩阵·架构
TechWJ8 小时前
catlass深度解析:Ascend平台的高性能矩阵运算模板库
线性代数·矩阵·ascend·cann·catlass
deep_drink1 天前
【基础知识一】线性代数的核心:从矩阵变换到 SVD 终极奥义
线性代数·机器学习·矩阵
数智工坊1 天前
【数据结构-特殊矩阵】3.5 特殊矩阵-压缩存储
数据结构·线性代数·矩阵
AI科技星1 天前
张祥前统一场论核心场方程的经典验证-基于电子与质子的求导溯源及力的精确计算
线性代数·算法·机器学习·矩阵·概率论
deep_drink1 天前
【基础知识二】彻底读懂拉普拉斯矩阵 (Laplacian)
人工智能·深度学习·线性代数·矩阵