基于马氏距离和H-K聚类的空值估计研究 |
| |
作者姓名: | 陈睿进 张聪 毛宇光 |
| |
作者单位: | 1. 南京航空航天大学 计算机科学与技术学院,南京,211106 2. 南京航空航天大学 计算机科学与技术学院,南京 211106; 计算机软件新技术国家重点实验室 南京大学,南京 210093 |
| |
摘 要: | 传统的基于欧氏距离和K-means聚类算法的空值估计算法容易因为欧氏距离对量纲的敏感性和初始聚类中心对K-means聚类效果的影响产生估值误差。将层次聚类算法和K-means聚类算法有机结合起来的H-K聚类算法克服了K-means算法对初始聚类中心的敏感性,从而改善了聚类效果。与欧氏距离不同,马氏距离可以避免量纲的影响。为此提出一种改进的空值估计算法,将H-K聚类应用到空值估计算法中进行聚类,在聚类时采用马氏距离代替欧氏距离,在聚类后使用多元线性回归法计算样本中的空值。实验结果表明改进后的空值估计算法使得估计值的绝对误差率(MAER)得到降低。
|
关 键 词: | K-means算法 层次聚类 H-K聚类算法 马氏距离 空值估计 |
本文献已被 CNKI 万方数据 等数据库收录! |
|