共查询到17条相似文献,搜索用时 109 毫秒
1.
2.
3.
在模糊聚类分析的基础上,提出一种适用于多项空气污染物的汽车车内空气质量评价的分类与评价方法。选取8种不同的汽车,测试其车内空气质量相关数据作为统计指标,利用最大最小法建立相似矩阵,用闭包法做出聚类分析,并分析聚类结果。结果表明:该方法对评价汽车车内空气质量具有实用性和普适性。 相似文献
4.
LU Qiu-gen 《数字社区&智能家居》2008,(27)
聚类就是按照事物间的相似性进行区分和分类的过程,传统的聚类分析是一种硬划分,它把每个待辨识的对象严格地划分到某个类中,具有非此即彼的性质,因此这种分类的类别界限是分明的。而实际上大多数对象并没有严格的属性,它们在形态和类属方面存在着中介性,适合进行软划分。1965年,模糊理论的创始人Zadeh提出的模糊集理论为这种软划分提供了有力的分析工具,人们开始用模糊的方法来处理聚类问题,并称之为模糊聚类。该文主要内容是研究和实现基于等价关系的模糊聚类算法,该算法以隶属度作为聚类的出发点,以模糊等价矩阵作为启发规则。首先根据给出的样本,通过数据标准化求得数据矩阵;其次根据数量积法对数据矩阵进行标定即建立模糊相似矩阵;再次通过传递闭包法把模糊相似矩阵转换成模糊等价矩阵,在模糊等价矩阵中取不同的元素作为阈值λ,再根据λ截矩阵的定义把模糊等价矩阵转换成只有0和1的矩阵;最后,把该矩阵中元素相同的列聚为同一类。通过实例分析运用基于等价关系的模糊聚类算法进行聚类结果是正确的。 相似文献
5.
基于二阶模糊聚类算法的雷达目标距离像识别 总被引:1,自引:0,他引:1
针对于模糊C-均值(FCM)算法敏感于聚类中心初始值的缺点,提出一种基于二阶模糊聚类方法。该方法利用传递闭包(TC)算法无初始化的优点,先对样本集按一定分类水平进行划分,选取若干类,求得这些类的样本均值作为FCM算法的初始聚类中心。一方面能够获得理想的聚类中心初始值,同时还能通过分类水平值来优化聚类中心数和聚类中心,避免局部最优,克服一致性聚类。利用该算法对三类飞机目标的实测一维距离像数据进行了识别实验,实验结果表明,基于二阶模糊聚类方法的识别率比FCM有了明显的改善。 相似文献
6.
传统的模糊连接点FJP聚类算法采用基于欧氏距离的最大 最小合成运算法生成传递闭包,该方法所生成的传递闭包存在失真问题,即包含有较多错误的数据关联信息,最终造成算法聚类精度低且计算时间长。针对以上问题,提出一种改进的模糊连接点聚类算法:先用组合核函数计算数据集的模糊相似度矩阵,提高算法对数据非线性特征的辨识能力,并用大顶堆存储之;然后遍历传递闭包矩阵中的空元素,用堆顶的桥元素填充传递闭包的空元素,直至生成传递闭包。在测试数据集上的实验结果表明,本文算法的平均聚类精度较传统FJP算法有20%以上的提升,显著改善了传递闭包的失真问题;另外,在大型数据集上的计算效率亦优于传统FJP算法的,说明本文改进FJP算法的思路是有效的、可行的。 相似文献
7.
改进编网法聚类及其实现 总被引:4,自引:0,他引:4
本文基于分级聚类算法的思路,对编网法进行了改进。文中首先简述改进编网法有关的概念、定义和定理,并进行了详细的证明,然后给出了该算法的具体描述和计算机实现的有关数据结构,最后给出了一个演示例子。 相似文献
8.
9.
一种新的基于模糊聚类的镜头检索方法 总被引:1,自引:0,他引:1
镜头检索是基于内容的视频检索的重要内容,而镜头内部内容往往是变化的,这给镜头检索带来了很大的困难。为了描述这种镜头内部的不一致性,这里首次使用模糊聚类的方法,把镜头分为多个等价类,等价类内部内容是一致的,这些等价类客观全面地描述了镜头内部内容的变化。把这些等价类用于镜头检索,获得了良好的检索结果。实验对比结果也证实了该方法的有效性。 相似文献
10.
混合模糊聚类法在故障诊断中的应用 总被引:1,自引:1,他引:1
在汽轮发电机纽的振动故障诊断中,传统的基于模糊等价关系的传递闭包法和基于模糊划分的模糊C-均值(FCM)聚类法分别存在着"传递偏差"和初始化敏感问题.混合模糊聚类分析方法将上述两种方法结合起来进行故障诊断,实例表明,该方法得到的诊断结果更符合实际情况,且该方法不仅能对单一故障进行诊断,对多故障也能进行诊断. 相似文献
11.
基于向量内积不等式的分布式k均值聚类算法 总被引:13,自引:2,他引:11
聚类分析是数据挖掘领域的一项重要研究课题.随着数据量的急剧增加,针对大数据集的聚类分析成为一个难点.虽然k均值算法具有易实现、复杂度与数据集大小成线性关系的优点,将其应用于大数据集时仍然存在效率低的问题.分布式聚类是解决这一问题的有效方法.在已有分布式聚类算法k—DMeans基础上,结合向量内积不等式关系对算法加以优化,提出分布式聚类算法k—DCBIP.理论分析和实验结果表明,算法k—DCBIP优于k-DMeans,可以有效地解决大数据集聚类问题,算法是有效可行的. 相似文献
12.
13.
基于模糊聚类分析的交通状态识别方法 总被引:5,自引:0,他引:5
针对城市道路交通状态识别的问题,提出了一种改进的模糊C-均值(FCM)算法。首先,该算法要解决聚类数目和模糊指数的选取问题。本文在对交通状态基本特征的分析基础上,结合交通工程理论知识,将城市道路交通状态分为四个等级,从而解决了聚类数目的选取问题;采用启发式方法来确定模糊指数,使隶属函数尽量覆盖整个输入空间;其次,在对上海市某交叉路口的实际交通数据进行实证研究和仿真分析基础上,结合交通的实际情况以及饱和度与交通状态相关性分析,得出了饱和度的辅助判定依据;最后,以饱和度为辅助判定依据,结合实际交通数据重新进行判定。仿真研究表明该方法能够有效地对道路交通状态进行识别。 相似文献
14.
在分析现有交通状态辨识理论的局限性的基础上,提出了一种新的交通状态辨识模型。此模型针对每种交通状态样本数据都具有一定的相似性,不同状态之间的样本具有相异性的性质,采用数据挖掘方法中的聚类算法对不同状态的交通流数据进行聚类。所提出的模型避免了目前模型中只采用单个交通流参数进行状态识别的缺点,为交通状态的辨识提供了一种新的思路。 相似文献
15.
传递闭包聚类中的模糊性分析 总被引:7,自引:0,他引:7
传递闭包聚类是根据其相似矩阵的传递闭包生成一个聚类图(模式空间的若干个精确划分),聚类过程的模糊性主要体现在相似矩阵上,并可以通过模糊信息熵函数度量。聚类过程中模糊性的大小是衡量聚类效果好坏的一个重要指标。降低聚类的模糊性,有利于最终的决策(指定一个精确的划分)。论文引入了交叉熵的概念,通过学习权重,极小化交叉熵,可以有效地降低聚类的模糊性。 相似文献
16.
17.
基于集成聚类的流量分类架构 总被引:1,自引:0,他引:1
流量分类是优化网络服务质量的基础与关键.机器学习算法利用数据流统计特征分类流量,对于识别加密私有协议流量具有重要意义.然而,特征偏置和类别不平衡是基于机器学习的流量分类研究所面临的两大挑战.特征偏置是指一些数据流统计特征在提高部分应用识别准确率的同时也降低了另外一部分应用识别的准确率.类别不平衡是指机器学习流量分类器对样本数较少的应用识别的准确率较低.为解决上述问题,提出了基于集成聚类的流量分类架构(traffic classification framework based on ensemble clustering,简称TCFEC).TCFEC由多个基于不同特征子空间聚类的基分类器和一个最优决策部件构成,能够提高流量分类的准确率.具体而言,与传统的机器学习流量分类器相比,TCFEC的平均流准确率最高提升5%,字节准确率最高提升6%. 相似文献