首页 | 官方网站   微博 | 高级检索  
     

基于分类的加速EM缺失数据填充算法
引用本文:孙华艳,李业丽,字云飞,韩旭.基于分类的加速EM缺失数据填充算法[J].北京印刷学院学报,2019,27(2).
作者姓名:孙华艳  李业丽  字云飞  韩旭
作者单位:北京印刷学院信息工程学院,北京,102600;北京印刷学院信息工程学院,北京,102600;北京印刷学院信息工程学院,北京,102600;北京印刷学院信息工程学院,北京,102600
基金项目:北京市科技创新服务能力协调创新项目
摘    要:在数据挖掘的整个过程中,EM算法因其数值计算的稳定性、实现上的简单性,可靠的全局收敛性,被广泛应用于处理数据不完整问题。针对EM算法收敛速度慢,算法高度依赖初始值的选择,使用KNN算法的分类结果作为EM算法的初始使用范围,KNN算法根据挖掘目的的不同选择不同的特性,然后利用增量式EM(IEM)算法按E步M步迭代反复求精,快速有效地得出填充缺失数据的最优值;该算法大大加快了收敛速度,加强了聚类的稳定性,数据填充效果显著。

关 键 词:KNN分类  EM算法  增量式EM算法  收敛速度  稳定聚类  缺失数据填充
本文献已被 CNKI 万方数据 等数据库收录!
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司    京ICP备09084417号-23

京公网安备 11010802026262号