R package:blupADC-功能6

最近更新于 May 16, 2022 2 分钟阅读时长 Relationship matrix

简述

🙉在动植物育种中，亲缘关系矩阵的构建是其中的关键步骤。在本章，我们将主要介绍如何利用blupADC中的cal_kinship函数完成各种亲缘关系矩阵的构建，包括：加性亲缘关系矩阵(系谱，基因组，一步法)及显性亲缘关系矩阵(系谱，基因组，一步法)等。此外，cal_kinship函数还能方便的计算各种类型的近交系数，包括：系谱近交系数，基因组近交系数(Homozygous,Digonal)及一步法近交系数(Digonal)。

在构建基因组亲缘关系矩阵及一步法亲缘关系矩阵的时候，我们必须要事先提供基因型数据，这部分的参数与geno_format函数中的参数用法一致。具体大家可参阅之前的介绍:基因型数据间的格式转换。

示例

😾 构建系谱亲缘关系矩阵

library(blupADC)
kinship_result=cal_kinship(
                input_pedigree=example_ped3,          #provided hapmap data object
                kinship_type=c("P_A"),      #type of  kinship matrix
                inbred_type=c("Pedigree"),      #type of inbreeding coefficients
                return_result=TRUE)               #return result

🤡 构建基因组亲缘关系矩阵

library(blupADC)
kinship_result=cal_kinship(
                input_data_hmp=example_data_hmp,          #provided hapmap data object
                kinship_type=c("G_A","G_D"),      #type of  kinship matrix
                dominance_type=c("genotypic"),    #type of dominance effect
                inbred_type=c("Homozygous"),      #type of inbreeding coefficients
                return_result=TRUE)               #return result

💨构建一步法亲缘关系矩阵

library(blupADC)
kinship_result=cal_kinship(
                input_data_hmp=example_data_hmp,          #provided hapmap data object
                input_pedigree=example_ped3,
                kinship_type=c("H_A"),      #type of  kinship matrix
                inbred_type=c("H_diag"),      #type of inbreeding coefficients
                return_result=TRUE)               #return result

💨构建一步法亲缘关系矩阵(via bigmemory method)

library(blupADC)
phased_kinship_result=cal_kinship(
                input_data_hmp=example_data_hmp,          #provided hapmap data object
                input_pedigree=example_ped3,
                bigmemory_cal=TRUE,
                bigmemory_data_path=getwd(),
                bigmemory_data_name="blupADC",
                kinship_type=c("H_A"),      #type of  kinship matrix
                inbred_type=c("H_diag"),      #type of inbreeding coefficients
                return_result=TRUE)               #return result

参数详解

💪基础参数

参数1：kinship_type
指定构建亲缘关系矩阵的类型，character类型。可选关系矩阵类型：
- “G_A” :基因组加性亲缘关系矩阵"
- “G_Ainv” :基因组加性亲缘关系逆矩阵"
- “G_D” :基因组显性亲缘关系矩阵
- “G_Dinv” :基因组显性亲缘关系逆矩阵"
- “P_A” :系谱加性亲缘关系矩阵
- “P_Ainv” :系谱加性亲缘关系逆矩阵
- “P_D” :系谱显性亲缘关系矩阵
- “P_Dinv” :系谱显性亲缘关系逆矩阵
- “H_A” :一步法加性亲缘关系矩阵
- “H_Ainv” :一步法加性亲缘关系逆矩阵
- “H_D” :一步法显性亲缘关系矩阵
- “H_Dinv” :一步法显性亲缘关系逆矩阵

Note:如果计算系谱及一步法亲缘关系矩阵，必须要提供系谱数据。关于如何提供系谱数据，我们会在后面进行讲解。

参数2：dominance_type
指定计算的显性亲缘关系矩阵的类型，character类型，可选类型包括:
- “genotypic” : 按照($0-2pq$,$1-2pq$,$0-2pq$)方式编码方式构建显性亲缘关系矩阵
- “classical” : 按照($-2q^2$,$2pq$,$-2p^2$)方式编码方式构建显性亲缘关系矩阵

关于二者的区别，具体可阅读该文献：On the Additive and Dominant Variance and Covariance of Individuals Within the Genomic Selection Scope

参数3：inbred_type
指定计算的近交系数的类型，character类型。可选近交系数类型包括:
- “Homozygous” :根据纯合子位点计算
- “G_Diag” :G矩阵对角线-1
- “H_diag” :H矩阵对角线-1
- “Pedigree” :A矩阵对角线-1
参数4：input_pedigree

用户提供的系谱数据，data.frame或 matrix类型。具体的系谱数据格式可以参阅之前的介绍：系谱追溯、重命名及纠错。

参数5：IND_rename

是否根据系谱的重命名结果对基因型数据中的个体进行重命名，logical类型，默认为FALSE(不进行重命名)。

参数6:bigmemory_cal

是否使用bigmemory方式进行计算. logical 类型. 默认为 FALSE.

参数7:bigmemory_data_path

bigmemory数据保存的路径 . character 类型.

参数8:bigmemory_data_name

bigmemory数据保存的文件名称 . character 类型.

参数9：output_matrix_type

输出亲缘关系矩阵的格式，character类型。可选参数包括：

“col_all” :按照n*n的格式输出亲缘关系矩阵
“col_three” : 按照3列矩阵的格式输出亲缘关系矩阵，第1列和第2列为个体号，第3列为亲缘系数。DMU和BLUPf90软件均需提供这种格式的亲缘关系矩阵。形如：
1001 1001 0.989
1001 1002 0.421
1001 1003 0.567

1001	1001	0.989
1001	1002	0.421
1001	1003	0.567

默认参数为 “col_all”

参数10：output_matrix_path

亲缘关系矩阵保存到本地的路径, character类型。

参数11：output_matrix_name

亲缘关系矩阵保存到本地的名称，character类型。

🦶进阶参数

参数12：cpu_cores

调用的cpu个数，numeric类型，默认为1。

参数13：kinship_base

是否按照基础群的方式构建基因组亲缘关系矩阵(p=q=0.5)，logical类型，默认为FALSE。

参数14：kinship_trace

是否按照矩阵迹和的方式对基因组亲缘关系矩阵进行标准化，logical类型，默认为FALSE。

参数15：Metafounder_algorithm

是否按照metafounder的方法计算一步法亲缘关系矩阵，logical类型，默认为FALSE。

参数16：APY_algorithm

是否按照APY的方法计算亲缘关系矩阵的逆矩阵，logical类型，默认为FALSE。

参数17：APY_eigen_threshold

特征值所能解释的遗传变异的比例的阈值 , numeric 类型. 默认为 0.95.

参数18：APY_n_core

核心个体数, numeric 类型. 默认为 NULL.

参数19：SSBLUP_omega

构建一步法亲缘关系矩阵时G矩阵和A矩阵的比例，numeric类型，默认为0.05。

参数20：gene_dropping

是否使用 gene dropping 的方法构建系谱显性亲缘关系矩阵，logical类型，默认为FALSE。

参数21：gene_dropping_iteration

gene dropping方法的迭代次数，numeric类型，默认为1000。