稀疏主成分分析是一种用于降维和特征选择的无监督方法。由于计算多个主成分时主载荷向量间不具有相同的稀疏模式,导致难以从原始特征空间中确定出对主成分贡献最大的小部分变量,为解决此问题,提出一种自适应稀疏主成分分析(Adaptive sp...稀疏主成分分析是一种用于降维和特征选择的无监督方法。由于计算多个主成分时主载荷向量间不具有相同的稀疏模式,导致难以从原始特征空间中确定出对主成分贡献最大的小部分变量,为解决此问题,提出一种自适应稀疏主成分分析(Adaptive sparse principal component analysis,ASPCA)算法。首先使用组套索模型,通过在载荷向量上施加块稀疏约束得出自适应稀疏主成分分析公式,随后对稀疏矩阵的不同列使用不同的调整参数获得自适应惩罚,最后运用块坐标下降法对自适应稀疏主成分分析公式进行两阶段优化,从而找到稀疏载荷矩阵和正交矩阵,实现降维的最优化。对稀疏主成分分析(Sparse principal component analysis,SPCA)算法、结构化且稀疏的主成分分析(Structured and sparse principal component analysis,SSPCA)算法和ASPCA算法进行仿真比较,结果表明ASPCA算法的降维性能更优,能提取更有价值的特征,从而显著提高了分类模型的平均分类准确率。展开更多
【目的】对我国收集保存的咖啡种质资源进行遗传多样性分析,为咖啡种质资源的收集、保存、鉴定、创新及有效利用提供理论参考。【方法】从哥伦比亚大学(UBC Primer Set#9)公布的100个ISSR引物序列中筛选出多态性好、扩增条带清晰且重复...【目的】对我国收集保存的咖啡种质资源进行遗传多样性分析,为咖啡种质资源的收集、保存、鉴定、创新及有效利用提供理论参考。【方法】从哥伦比亚大学(UBC Primer Set#9)公布的100个ISSR引物序列中筛选出多态性好、扩增条带清晰且重复性好的引物,利用其对72份咖啡种质材料进行扩增,对电泳图谱进行统计分析,并利用NTSYSpc 2.1计算遗传相似系数和遗传距离。根据非加权算术平均法(UPGMA)进行聚类分析,并进行主坐标分析。【结果】筛选出的19条引物共扩增出153条条带,其中多态性条带数为128条,占总条带数的83.7%;72份咖啡种质材料间的遗传相似系数为0.4531~0.9609,平均为0.6567;遗传距离为0.0351~1.0951,平均为0.4081。其中,大粒种种内遗传相似系数最大(0.9297~0.9531),遗传距离最小(0.0445~0.0669);中粒种种内遗传相似系数最小(0.5781~0.8750),遗传距离最大(0.1210~0.5363)。主坐标分析与聚类分析结果一致,均显示72份咖啡种质材料可分为三大类,其中3份大粒种、3份查理种及1份中粒种巴布亚新几内亚-2聚为Ⅰ类群;32份小粒种聚为聚为Ⅱ类群;除巴布亚新几内亚-2外的其他31份中粒种及1份中小粒杂交种Arabusta和1份福建咖啡共33份聚为Ⅲ类群。聚类分析结果与种质地理来源无明显相关性。【结论】咖啡种质资源各种间存在较大的遗传差异,以中粒种种内遗传多样性较丰富,以大粒种种内遗传多样性较低。利用ISSR分子标记可准确分析咖啡资源遗传多样性。展开更多
文摘稀疏主成分分析是一种用于降维和特征选择的无监督方法。由于计算多个主成分时主载荷向量间不具有相同的稀疏模式,导致难以从原始特征空间中确定出对主成分贡献最大的小部分变量,为解决此问题,提出一种自适应稀疏主成分分析(Adaptive sparse principal component analysis,ASPCA)算法。首先使用组套索模型,通过在载荷向量上施加块稀疏约束得出自适应稀疏主成分分析公式,随后对稀疏矩阵的不同列使用不同的调整参数获得自适应惩罚,最后运用块坐标下降法对自适应稀疏主成分分析公式进行两阶段优化,从而找到稀疏载荷矩阵和正交矩阵,实现降维的最优化。对稀疏主成分分析(Sparse principal component analysis,SPCA)算法、结构化且稀疏的主成分分析(Structured and sparse principal component analysis,SSPCA)算法和ASPCA算法进行仿真比较,结果表明ASPCA算法的降维性能更优,能提取更有价值的特征,从而显著提高了分类模型的平均分类准确率。
文摘【目的】对我国收集保存的咖啡种质资源进行遗传多样性分析,为咖啡种质资源的收集、保存、鉴定、创新及有效利用提供理论参考。【方法】从哥伦比亚大学(UBC Primer Set#9)公布的100个ISSR引物序列中筛选出多态性好、扩增条带清晰且重复性好的引物,利用其对72份咖啡种质材料进行扩增,对电泳图谱进行统计分析,并利用NTSYSpc 2.1计算遗传相似系数和遗传距离。根据非加权算术平均法(UPGMA)进行聚类分析,并进行主坐标分析。【结果】筛选出的19条引物共扩增出153条条带,其中多态性条带数为128条,占总条带数的83.7%;72份咖啡种质材料间的遗传相似系数为0.4531~0.9609,平均为0.6567;遗传距离为0.0351~1.0951,平均为0.4081。其中,大粒种种内遗传相似系数最大(0.9297~0.9531),遗传距离最小(0.0445~0.0669);中粒种种内遗传相似系数最小(0.5781~0.8750),遗传距离最大(0.1210~0.5363)。主坐标分析与聚类分析结果一致,均显示72份咖啡种质材料可分为三大类,其中3份大粒种、3份查理种及1份中粒种巴布亚新几内亚-2聚为Ⅰ类群;32份小粒种聚为聚为Ⅱ类群;除巴布亚新几内亚-2外的其他31份中粒种及1份中小粒杂交种Arabusta和1份福建咖啡共33份聚为Ⅲ类群。聚类分析结果与种质地理来源无明显相关性。【结论】咖啡种质资源各种间存在较大的遗传差异,以中粒种种内遗传多样性较丰富,以大粒种种内遗传多样性较低。利用ISSR分子标记可准确分析咖啡资源遗传多样性。