共查询到19条相似文献,搜索用时 463 毫秒
1.
聚类集成比单个聚类方法具有更高的鲁棒性和精确性,它主要由两部分组成,即个体成员的产生和结果的融合。针对聚类集成,首先用k-means聚类算法得到个体成员,然后使用层次聚类中的单连接法、全连接法与平均连接法进行融合。为了评价聚类集成方法的性能,实验中使用了ARI(Adjusted Rand Index)。实验结果表明,平均连接法的聚类集成性能优于单连接法和全连接法。研究并讨论了融合方法的聚类正确率和集成规模的关系。 相似文献
2.
《模式识别与人工智能》2014,(5)
层次聚类算法在数据挖掘领域有着广泛应用,现有的层次聚类算法都依赖于对称距离定义.针对聚类对象的非对称距离下的层次聚类展开研究,提出完整的非对称距离下的层次聚类算法,给出聚类对象选择因子,并定义相应的计算方法.文中提出不同簇之间的合并方法,形成非对称距离下的单连接、全连接等算法.采集社会化书签系统中的热点标签,基于共现次数定义非对称距离,对所提出的算法进行大量实验,实验结果表明聚类结果与实际结果具有较高的一致性.对算法进行量化指标分析的结果也表明非对称层次聚类算法具有良好性能. 相似文献
3.
中药方剂的数据挖掘是在中国传统中药方剂中,应用数据挖掘方法,在中医理论指导下,探寻药物之间的相互联系和整体用药规律。对中药方剂的数据预处理研究,是将药物的四气五味、功效、归经、有无毒性等信息转化为数字信息,从而在进行中药方剂数据挖掘中更为精确,为中药方剂研究和临床实践研究提供理论参考。 相似文献
4.
大型数据库中基于邻域连接的层次聚类算法 总被引:3,自引:2,他引:3
董一鸿 《计算机工程与应用》2003,39(32):194-197,225
提出了一种基于邻域连接的层次聚类算法HANL,该算法首先采用分割的方法将数据集划分为若干个子簇,通过对子簇间的连接的分析,建立子簇间的连接构成图,图中带权的边代表了子簇间的连接紧密度。合并连接紧密度高的结点,得到最后的聚类结果。该算法适用于高维数据集,能够对任意形状的簇进行聚类,无论对于数值属性的数据库还是分类属性的数据库都是一个有效的聚类方法。同时这种方法聚类速度快,效率高,具有良好的伸缩性。 相似文献
5.
提出了一种基于人工免疫系统重要模型aiNet模型的层次聚类算法aiNHA。该算法首先采用aiNet的方法生成抗体的记忆细胞矩体和相似性矩阵,这样就将数据集划分为若干子簇。再按照层次聚类的方法,合并连接相似度高的子簇,得到最终的聚类结果。该算法适用于发现任意形状的聚类簇,并且继承了免疫算法搜索速度快、效率高的优点。 相似文献
6.
7.
建筑物空间聚类是实现居民地地图自动综合的有效方法。基于图论和Gestalt原理,发展了一种层次的建筑物聚类方法。该方法可以深层次地挖掘建筑物图形的视觉特性,将面状地物信息充分合理地表达在聚类结果中。依据视觉感知原理,借助Dealaunay三角网构建方法,分析了地图上建筑物的自身形状特性和相互间的邻接关系,并依据建筑物间的可视区域均值距离建立了加权邻近结构图,确定了建筑物的邻近关系(定性约束)。根据Gestalt准则将邻近性、方向性和几何特征等量化为旋转卡壳距离约束和几何相似度约束。通过实例验证了层次聚类方法得到更加符合人类认知的建筑物聚类结果。 相似文献
8.
9.
10.
11.
针对中药药效与其性味归经之间复杂的、不确定的关系,运用人工神经网络的理论和方法,建立中药抗衰老药效的BP神经网络模型,通过实例对抗衰老指标进行评价分析。经验证,用BP神经网络方法评价中药抗衰老药效是一种快速、可靠的方法。 相似文献
12.
13.
14.
15.
The linkage methods are mostly used in hierarchical clustering. In this paper, we integrate Ordered Weighted Averaging (OWA) operator with hierarchical clustering in order to find distances between clusters. In case of using OWA operator in order to find distance between clusters, OWA acts as a generalized case of single linkage, complete linkage, and average linkage methods. In order to illustrate the proposed method, we handle a phylogenetic tree constructed by hierarchical clustering of protein sequences. To illustrate the efficiency of the method, we use 2D-data set. We obtain graphs demonstrating the relationships of the clusters and we calculate the root-mean-square standard deviation (RMSSDT) and R-squared (RS) validity indices, respectively, which are frequently used to evaluate results of the hierarchical clustering algorithms. 相似文献
16.
17.
18.
由于进行关联规则挖掘过程中会产生大量规则,给关联规则的后期分析与利用带来了巨大障碍.针对关联规则的特点,提出了一种新的规则相似性度量方法,通过相似性度量方法推出新的规则距离度量方法,运用系统聚类中的类平均法进行聚类.实验结果表明,该距离度量方法考虑了关联规则的整体信息,依据聚类谱系图和规则散点图,确定了类和类的个数,有利于规则的分类处理. 相似文献