R package:blupADC-功能5

最近更新于 Apr 18, 2021 1 分钟阅读时长 Relationship matrix

简述

🙉在动植物育种中，亲缘关系矩阵的构建是其中的关键步骤。在本章，我们将主要介绍如何利用blupADC中的cal_kinship函数完成各种亲缘关系矩阵的构建，包括：加性亲缘关系矩阵(系谱，基因组，一步法)及显性亲缘关系矩阵(系谱，基因组，一步法)等。此外，cal_kinship函数还能方便的计算各种类型的近交系数，包括：系谱近交系数，基因组近交系数(Homozygous,Digonal)及一步法近交系数(Digonal)。

示例

😾首先，我们还是通过一个小例子来看该函数的用法:

library(blupADC)
kinship_result=cal_kinship(
                input_data_hmp=data_hmp,          #provided hapmap data object
                kinship_type=c("G_A","G_D"),      #type of  kinship matrix
                dominance_type=c("genotypic"),    #type of dominance effect
                inbred_type=c("Homozygous"),      #type of inbreeding coefficients
                return_result=TRUE)               #return result

在构建基因组亲缘关系矩阵及一步法亲缘关系矩阵的时候，我们必须要事先提供基因型数据，这部分的参数与genotype_data_format_conversion函数中的参数用法一致。具体大家可参阅之前的介绍:基因型数据间的格式转换。

完成了基因型数据的提供后，我们可以通过以下几个参数来指定构建亲缘关系矩阵类型及近交系数的类型。

参数详解

💪基础参数

参数1：kinship_type

指定构建亲缘关系矩阵的类型，character类型。可选关系矩阵类型：
- “G_A” :基因组加性亲缘关系矩阵"
- “G_Ainv” :基因组加性亲缘关系逆矩阵"
- “G_D” :基因组显性亲缘关系矩阵
- “G_Dinv” :基因组显性亲缘关系逆矩阵"
- “P_A” :系谱加性亲缘关系矩阵
- “P_Ainv” :系谱加性亲缘关系逆矩阵
- “P_D” :系谱显性亲缘关系矩阵
- “P_Dinv” :系谱显性亲缘关系逆矩阵
- “H_A” :一步法加性亲缘关系矩阵
- “H_Ainv” :一步法加性亲缘关系逆矩阵
- “H_D” :一步法显性亲缘关系矩阵
- “H_Dinv” :一步法显性亲缘关系逆矩阵

Note:如果计算系谱及一步法亲缘关系矩阵，必须要提供系谱数据。关于如何提供系谱数据，我们会在后面进行讲解。

参数2：dominance_type

指定计算的显性亲缘关系矩阵的类型，character类型，可选类型包括:
- “genotypic” : 按照($0-2pq$,$1-2pq$,$0-2pq$)方式编码方式构建显性亲缘关系矩阵
- “classical” : 按照($-2q^2$,$2pq$,$-2p^2$)方式编码方式构建显性亲缘关系矩阵

关于二者的区别，具体可阅读该文献：On the Additive and Dominant Variance and Covariance of Individuals Within the Genomic Selection Scope

参数3：inbred_type

指定计算的近交系数的类型，character类型。可选近交系数类型包括:
- “Homozygous” :根据纯合子位点计算
- “G_Diag” :G矩阵对角线-1
- “H_diag” :H矩阵对角线-1
- “Pedigree” :A矩阵对角线-1
参数4：input_pedigree

用户提供的系谱数据，data.frame或 matrix类型。具体的系谱数据格式可以参阅之前的介绍：系谱追溯、重命名及纠错。

参数5：pedigree_rename

是否对系谱数据进行重命名,logical类型，默认为TRUE(对系谱进行重命名)。

参数6：IND_geno_rename

是否根据系谱的重命名结果对基因型数据中的个体进行重命名，logical类型，默认为FALSE(不进行重命名)。

参数7：rename_to_origin

将亲缘关系矩阵中重命名的个体号转换回原始的个体号，logical类型，默认为FALSE(不进行转换)。

参数8：output_matrix_type

输出亲缘关系矩阵的格式，character类型。可选参数包括：

“col_all” :按照n*n的格式输出亲缘关系矩阵
“col_three” : 按照3列矩阵的格式输出亲缘关系矩阵，第1列和第2列为个体号，第3列为亲缘系数。DMU和BLUPf90软件均需提供这种格式的亲缘关系矩阵。形如：

1001 1001 0.989

1001 1002 0.421

1001 1003 0.567


1001	1001	0.989
1001	1002	0.421
1001	1003	0.567

默认参数为 “col_three”

参数9：output_matrix_path

亲缘关系矩阵保存到本地的路径, character类型。

参数10：output_matrix_name

亲缘关系矩阵保存到本地的名称，character类型。

🦶进阶参数

参数11：cpu_cores

调用的cpu个数，numeric类型，默认为1。

参数12：kinship_base

是否按照基础群的方式构建基因组亲缘关系矩阵(p=q=0.5)，logical类型，默认为FALSE。

参数13：kinship_trace

是否按照矩阵迹和的方式对基因组亲缘关系矩阵进行标准化，logical类型，默认为FALSE。

参数14：kinship_metafounder

是否按照metafounder的方法计算一步法亲缘关系矩阵，logical类型，默认为FALSE。

参数15：SSBLUP_omega

构建一步法亲缘关系矩阵时G矩阵和A矩阵的比例，numeric类型，默认为0.05。

参数16：gene_dropping

是否使用 gene dropping 的方法构建系谱显性亲缘关系矩阵，logical类型，默认为FALSE。

参数17：gene_dropping_iteration

gene dropping方法的迭代次数，numeric类型，默认为1000。

参数18：memory_save

是否使用省内存的方式进行上述所有的计算，logical类型，默认为FALSE。该方法非常节省内存，但是会极大的占据本地存储空间。

梅全顺

动物遗传育种-博士

My research interests include genomic selection and machine learning in animal breeding.