首页 | 官方网站   微博 | 高级检索  
     

基于随机森林算法和SRAP分子标记的桂花品种鉴定方法
引用本文:邱帅,沈柏春,李婷婷,郭娟,王霁,孙丽娜,陈徐平,胡绍庆.基于随机森林算法和SRAP分子标记的桂花品种鉴定方法[J].林业科学,2018(1).
作者姓名:邱帅  沈柏春  李婷婷  郭娟  王霁  孙丽娜  陈徐平  胡绍庆
作者单位:杭州市园林绿化股份有限公司;浙江省林业科学研究院;浙江理工大学;
摘    要:【目的】为了解决桂花品种难以鉴定以及苗木生产和园林应用中品种混杂、以次充好和常规DNA指纹图谱无法很好地应用于品种鉴定的问题,提出一种基于随机森林算法和SRAP分子标记的桂花品种鉴定方法,以实现桂花品种简便、快速和准确的鉴定。【方法】以45个桂花品种或变异类型为材料,提取DNA,使用90对SRAP引物进行PCR扩增,以毛细管电泳技术采集扩增信息,筛选出多态性强、扩增结果稳定的引物,计算单对引物的多态信息含量(PIC)、带型数、有效带型数、分辨能力(D)、带型分布的卡方值(χ2)和无法区分的样品对数(x)。筛选出能够完全区分所有品种的引物对组合位点数据作为训练集,用于构建基于随机森林算法的分类模型,并根据模型的泛化能力和分类效果选择最优的分类模型。【结果】筛选出10对SRAP引物,平均PIC为0.26,平均带型数为33.9,平均有效带型数为26.6,平均D为0.97,平均χ2为21.07,平均x为28.2。构建了8个分类模型rf1-rf8,每个分类模型均含有2对SRAP引物。所有分类模型都能完全区分所有桂花品种,模型的袋外数据(OOB)误差估计在0.004 4~0.013 9之间,rf5和rf3泛化能力最强,rf8最弱。rf1分类效果最优,rf3、rf4、rf5和rf7其次,rf2、rf6和rf8最差。【结论】分类模型rf1、rf3、rf4、rf5和rf7的分类能力最佳,所用SRAP引物对分别为me1/em3+me9/em6、me4/em5+me9/em6、me4/em8+me9/em6、me6/em9+me9/em6和me5/em5+me9/em6。除引物对的分辨能力外,所选引物对之间的相关性也显著影响模型的分类能力,相关性越弱,模型的分类能力越强。本研究提出的基于随机森林算法和SRAP分子标记的桂花品种鉴定方法,能够实现桂花品种简便、快速、准确的鉴定,满足桂花苗木生产、推广应用和种质资源保护对于品种鉴定的要求。

本文献已被 CNKI 等数据库收录!
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司    京ICP备09084417号-23

京公网安备 11010802026262号