Principal Component Analysis and Cluster Analysis of 39 Spring Soybean Germplasm Resources
-
摘要: 对39份春大豆种质的7个主要农艺性状进行主成分分析,获得2个主成分因子,其中:第一主成分(MF1)与株高、底荚高度、主茎节数呈正相关;第二主成分(MF2)与单株粒数和单株粒重呈正相关、与百粒重和有效分枝数呈负相关。用SPSS 22.0软件对39份大豆种质分别基于综合主成分值和基于性状数据的聚类分析,前者将参试种质分成3个大类2个亚类,后者将参试种质分成3个大类4个亚类,两种聚类方法的分析结果基本一致。Abstract: 7 major agronomic traits of 39 soybean germplasm resources were analyzed with the method of principal component analysis(PCA), and two principal component factors were obtained. The first principal component(MF1) was positively correlated with plant height, bottom pod height and the number of main stem segments. The second principal component(MF2) was positively correlated with the number of grains per plant and the grain weight per plant, and negatively correlated with the number of 100-grain weight and effective branches. The cluster analysis were studied through the integrated principal component values and the agronomic trait normalization data. 39 germplasms were divided into 3 major categories and 2 sub-categories through the former method, and divided into 3 major categories and 4 sub-categories through the latter method. By comparison, the analysis results of the two clustering methods were generally consistent.
-
Key words:
- spring soybean /
- principal component analysis /
- cluster analysis
-
表 1 参试39份春大豆种质材料名称及来源
Table 1. Name and sources of 39 soybean germplasms
序号 名称 来源 1 中黄302 中国农科院作物所 2 中黄306 中国农科院作物所 3 中黄320 中国农科院作物所 4 中黄325 中国农科院作物所 5 冀豆23 河北农林科学院粮油作物所 6 冀1514 河北农林科学院粮油作物所 7 郑1307 河南省农科院经作所 8 苏豆28号 江苏省农科院作物所 9 苏豆29号 江苏省农科院作物所 10 成豆17 四川省农科院作物所 11 成豆18 四川省农科院作物所 12 贡1245 四川省自贡市农科所 13 贡7183 四川省自贡市农科所 14 南春豆31 四川省南充市农科院 15 赣豆10号 江西省农科院作物所 16 福豆12号 福建省农科院作物所 17 福豆13号 福建省农科院作物所 18 福豆14号 福建省农科院作物所 19 福豆234 福建省农科院作物所 20 莆豆610 福建省莆田市农科所 21 莆豆704 福建省莆田市农科所 22 泉豆17 福建省泉州市农科所 23 泉豆20 福建省泉州市农科所 24 泉豆22 福建省泉州市农科所 25 泉豆23 福建省泉州市农科所 26 泉豆24 福建省泉州市农科所 27 泉豆25 福建省泉州市农科所 28 桂春豆121 广西农科院经作所 29 桂春1016 广西农科院经作所 30 桂春1602 广西农科院经作所 31 桂春1603 广西农科院经作所 32 桂春1805 广西农科院经作所 33 桂春1806 广西农科院经作所 34 华春2号 华南农业大学农学院 35 华春7号 华南农业大学农学院 36 华春11号 华南农业大学农学院 37 粤春2016-1 华南农业大学农学院 38 粤春2016-2 华南农业大学农学院 39 粤春2017-1 华南农业大学农学院 表 2 7个农艺性状指标代号及名称
Table 2. Number and name of 7 agronomic traits indicator
代号 性状名称 x1 株高/cm x2 底荚高度/cm x3 主茎节数/节 x4 有效分枝数/个 x5 单株粒数/粒 x6 单株粒重/g x7 百粒重/g 表 3 9个主要性状的统计分析结果
Table 3. Statistical analysis table of 9 agronomic traits of 39 soybean germplasm materials
(单位/%) 性状 平均值 标准偏差 变异系数 株高x1 49.53 9.22 18.62 底荚高度x2 9.58 2.28 23.79 主茎节数x3 11.14 1.73 15.55 有效分枝数x4 3.31 0.73 22.12 单株粒数x5 54.46 15.05 27.63 单株粒重x6 10.35 2.29 22.15 百粒重x7 21.06 2.42 11.49 粗蛋白含量x8 44.50 1.94 4.36 粗脂肪含量x9 21.56 0.97 4.51 表 4 KMO和Bartlett的球形度检验
Table 4. KMO and Bartlett's sphericity test
KMO取样适切性量数 0.527 Bartlett的球形度检验 上次读取的卡方 110.094 自由度 21 显著性 0.000 表 5 7个农艺性状间的相关系数矩阵
Table 5. Correlation coefficient matrix of 7 agronomic traits
性状
代号x1 x2 x3 x4 x5 x6 x2 0.556** x3 0.515** 0.565** x4 0.239 0.017 0.601** x5 0.332* -0.038 -0.046 -0.014 x6 0.124 -0.172 -0.194 -0.101 0.736** x7 -0.348* -0.135 -0.098 0.008 -0.522** -0.174 表 6 主成分因子的方差贡献率
Table 6. Variance contribution rate of principal component factors
主成分 初始特征值 提取载荷平方和 特征值 方差百分比/% 累积总方差贡献率/% 特征值 方差百分比/% 累积总方差贡献率/% 1(MF1) 2.415 34.499 34.499 2.415 34.499 34.499 2(MF2) 2.082 29.747 64.246 2.082 29.747 64.247 3(MF3) 1.063 15.187 79.433 1.063 15.187 79.434 4 0.735 10.501 89.935 5 0.356 5.086 95.022 6 0.182 2.595 97.617 表 7 初始因子载荷矩阵
Table 7. Matrix of initial factor load
性状因子 主成分 MF1 MF2 MF3 株高x1 0.851 0.068 -0.161 主茎节数x3 0.785 -0.454 0.198 底荚高度x2 0.675 -0.308 -0.539 单株粒数x5 0.389 0.857 0.125 单株粒重x6 0.113 0.830 0.221 百粒重x7 -0.483 -0.492 0.195 有效分枝数x4 0.471 -0.334 0.778 表 8 因子特征向量矩阵
Table 8. Matrix of factor eigenvector
性状因子 主成分特征向量 MF11 MF22 株高x1 0.548 0.047 主茎节数x3 0.505 -0.315 底荚高度x2 0.434 -0.213 单株粒数x5 0.250 0.594 单株粒重x6 0.073 0.575 百粒重x7 -0.311 -0.341 有效分枝数x4 0.303 -0.231 表 9 39份大豆种质各主成分值及其排名
Table 9. The main component values and ranking of 39 soybean germplasms
种质材料 第一主成分(F1) 排名 第二主成分(F2) 排名 综合主成分(F) 排名 中黄302 -1.269 31 -0.508 28 -0.917 35 中黄306 -1.694 36 0.256 16 -0.791 34 中黄320 -0.616 28 1.507 2 0.365 12 中黄325 -1.361 33 0.954 6 -0.291 27 冀豆23 -3.427 39 -0.279 25 -1.969 39 冀1514 -1.418 35 0.255 17 -0.644 32 郑1307 0.650 12 -0.141 23 0.283 13 苏豆28号 0.424 16 0.306 13 0.369 11 苏豆29号 -0.428 23 -0.675 32 -0.542 31 成豆17 -1.354 32 -2.151 39 -1.720 38 成豆18 -1.841 37 -1.350 38 -1.613 37 贡1245 -0.140 21 1.496 3 0.615 9 贡7183 0.377 17 0.079 18 0.239 15 南春豆31 -2.242 38 -0.192 24 -1.292 36 赣豆10号 -1.390 34 0.816 8 -0.370 30 福豆12号 0.709 11 -0.514 29 0.144 19 福豆13号 -0.485 26 0.626 9 0.029 23 福豆14号 1.353 6 -1.103 36 0.217 17 福豆234 1.477 4 -0.138 22 0.730 7 莆豆610 0.339 18 -0.326 26 0.032 22 莆豆704 -0.108 20 -1.312 37 -0.664 33 泉豆17 0.760 10 -0.957 35 -0.034 24 泉豆20 1.358 5 0.524 10 0.971 4 泉豆22 1.975 3 0.268 14 1.185 2 泉豆23 2.060 2 -0.802 33 0.735 6 泉豆24 0.486 15 0.025 20 0.272 14 泉豆25 -0.484 25 -0.111 21 -0.312 28 桂春豆121 4.027 1 -0.436 27 1.961 1 桂春1016 0.596 14 -0.816 34 -0.057 26 桂春1602 0.608 13 -0.528 30 0.082 21 桂春1603 0.233 19 1.189 4 0.675 8 桂春1805 1.193 8 0.257 15 0.759 5 桂春1806 1.308 7 0.819 7 1.081 3 华春2号 -0.646 29 1.584 1 0.386 10 华春7号 0.951 9 -0.624 31 0.222 16 华春11号 -0.689 30 0.053 19 -0.346 29 粤春2016-1 -0.473 24 0.443 12 -0.049 25 粤春2016-2 -0.552 27 1.014 5 0.173 18 粤春2017-1 -0.266 22 0.492 11 0.084 20 -
[1] 胡润芳, 张广庆, 滕振勇, 等.不同蛋白质含量大豆品种氮素积累、分配和运转规律研究[J].大豆科学, 2012, 31(1):76-80. doi: 10.3969/j.issn.1000-9841.2012.01.017 [2] 张振宇, 韩旭东, 郭泰, 等.东北优质大豆品种的遗传多样性分析[J].农学学报, 2015, 5(6):15-20. http://d.old.wanfangdata.com.cn/Periodical/zgncxkkj201506004 [3] 蒲艳艳, 宫永超, 李娜娜, 等.中国大豆种质资源遗传多样性研究进展[J].大豆科学, 2018, 37(2):315-321. http://d.old.wanfangdata.com.cn/Periodical/ddkx201802023 [4] 赵团结, 盖钧镒.栽培大豆起源与演化研究进展[J].中国农业科学, 2004, 37(7):954-962. doi: 10.3321/j.issn:0578-1752.2004.07.004 [5] 张文霖.主成分分析在SPSS中的操作应用[J].理论与方法, 2005(12):30-34. http://d.old.wanfangdata.com.cn/Periodical/shicyj200512009 [6] 林海明, 张文霖.主成分分析与因子分析的异同和SPSS软件[J].统计研究, 2005(3):65-69. doi: 10.3969/j.issn.1002-4565.2005.03.015 [7] 刘永志.主成分分析和聚类在科学技术数据分析中的应用[D].长春: 吉林大学, 2016. http://cdmd.cnki.com.cn/Article/CDMD-10183-1016185037.htm [8] 陈佩.主成分分析法研究及其在特征提取中的应用[D].西安: 陕西师范大学, 2014. http://cdmd.cnki.com.cn/Article/CDMD-10718-1014400060.htm [9] 李明松, 吕美琴, 康蓉蓉, 等.福建省春大豆种质资源的形态多样性研究[J].福建农业学报, 2014, 29(3):214-219. doi: 10.3969/j.issn.1008-0384.2014.03.004 [10] 李清华. 34份菜用大豆品种主要农艺性状的主成分分析及遗传距离测定[J].福建农业学报, 2018, 33(2):136-143. http://d.old.wanfangdata.com.cn/Periodical/fjnyxb201802006 [11] 贺礼英, 尹成杰, 黄守程, 等.菜用大豆主要农艺性状的相关性、聚类及主成分分析[J].浙江农业学报, 2018, 30(1):50-57. doi: 10.3969/j.issn.1004-1524.2018.01.07 [12] 赵银月, 耿智德, 保丽萍, 等.云南省大豆地方品种资源的主成分分析及聚类分析[J].湖南农业大学学报(自然科学版), 2007, 33(8):120-122. http://d.old.wanfangdata.com.cn/Conference/6530194 [13] 徐传富, 杨栋承, 王树林, 等.菜用大豆鲜粒荚性状的主成分评价[J].黑龙江农业科学, 2009(4):30-32. doi: 10.3969/j.issn.1002-2767.2009.04.010 [14] 张恒斌, 刘胜利, 战勇, 等.新疆大豆品种资源遗传多样性分析[J].新疆农业科学, 2010, 47(7):1387-1390. http://d.old.wanfangdata.com.cn/Periodical/xjnykx201007021 [15] 张玉革, 胡绪彬.基于主成分和聚类分析的大豆品种生物学性状的比较研究[J].大豆科学, 2004, 23(3):178-183. doi: 10.3969/j.issn.1000-9841.2004.03.005 [16] 李向华, 常汝镇.中国春大豆品种聚类分析及主成分分析[J].作物学报, 1998, 24(3):325-332. doi: 10.3321/j.issn:0496-3490.1998.03.011