期刊界 All Journals 搜尽天下杂志传播学术成果专业期刊搜索期刊信息化学术搜索

1.

周涛《计算机工程与应用》2010,46(26):7-10

粗糙聚类是不确定聚类算法中一种有效的聚类算法,这里通过分析粗糙k-means算法,指出了其中3个参数w_l,w_u和ε设置时存在的缺点,提出了一种自适应粗糙k-means聚类算法,该算法能进一步优化粗糙k-means的聚类效果,降低对“噪声”的敏感程度,最后通过实验验证了算法的有效性。相似文献

2.

新的K-均值算法最佳聚类数确定方法 总被引：8，自引：0，他引：8

下载免费PDF全文

周世兵徐振源唐旭清《计算机工程与应用》2010,46(16):27-31

K-均值聚类算法是以确定的类数k和随机选定的初始聚类中心为前提对数据集进行聚类的。通常聚类数k事先无法确定,随机选定的初始聚类中心容易使聚类结果不稳定。提出了一种新的确定K-均值聚类算法的最佳聚类数方法,通过设定AP算法的参数,将AP算法产生的聚类数作为聚类数搜索范围的上界kmax,并通过选择合适的有效性指标Silhouette指标,以及基于最大最小距离算法思想设定初始聚类中心,分析聚类效果,确定最佳聚类数。仿真实验和分析验证了以上算法方案的可行性。相似文献

3.

一种新的聚类有效性函数 总被引：3，自引：1，他引：2

下载免费PDF全文

彭勇吴友情《计算机工程与应用》2010,46(6):124-126

聚类有效性函数是用于评价聚类结果优劣的指标,准确地给出初始聚类类别数将使得聚类结果趋于合理化。根据模糊不确定性理论及聚类问题的基本特性,引入了新的紧密度度量指标D_i（U;c）,在此基础上提出了一个旨在寻求最优聚类类别数的有效性函数。该函数基于数据集的紧密度与分离度特征,综合考虑了数据成员的隶属度及数据集的几何结构。实验结果表明该有效性函数能够发现最优的聚类类别数,对于分类结构较为明确的数据集表现出良好的性能,并且对于权重系数具有良好的鲁棒性。相似文献

4.

粗糙Vague集（值）间k步相似度量新方法

下载免费PDF全文

张阿红王治和杜鹏吴鹏《计算机工程与应用》2009,45(2):140-143

对粗糙集、Vague集及粗糙Vague集的概念、知识表示方法进行了讨论,描述了粗糙Vague集的相关概念,在研究了粗糙Vague集相似性度量方法的基础上,提出了一种对踌躇度п_v（x）k步细化的k步相似度量新方法,并且研究了该方法的相关性质。进一步对k步相似度量在k趋向无穷时求极限,得出粗糙Vague集退化为模糊集的特例情况。相似文献

5.

K-means聚类和支持向量机结合的文本分类研究

下载免费PDF全文

贾燕花徐蔚鸿《计算机工程与应用》2010,46(22):172-174

针对数据挖掘中文本自动分类问题,提出了一种基于k-means聚类算法和支持向量机相结合的文本分类方法。该方法先将文本大致聚为k类,然后对每一类用支持向量机进行细分。构造了可用于多个模式类识别的多层SVM模型,该模型可完成对多个模式的分类识别。给出了该模型的构造及应用的方法,并验证了该方法的有效性。相似文献

6.

客户行为的有效聚类 总被引：1，自引：0，他引：1

下载免费PDF全文

刘慧婷倪志伟《计算机工程与应用》2010,46(4):12-14

对客户的交易数据进行聚类是客户行为分析的一个重要手段。针对客户交易数据维数高的特点,提出了基于EMD和K-means的顾客行为聚类算法。首先利用EMD和自底向上分段算法实现交易数据序列维度的约简,再利用K-means算法完成降维后序列的聚类,最后利用每个类别中购买率较高的商品作为该类的描述,为商家提供促销依据。该聚类算法一方面可以有效实现客户行为的聚类,另一方面,由于算法对交易数据序列进行了降维处理,节约了一定的存储空间。相似文献

7.

故障广义4元n方体中不同长度的路嵌入 总被引：1，自引：1，他引：0

下载免费PDF全文

张淑蓉王世英《计算机工程与应用》2010,46(14):81-83

k元n方体是传输信息的一种重要网络,研究含有故障点的广义4元n方体。证明了当其故障点数f≤n-1时,对每个整数l∈{2n-1,2n,…,4ⁿ-f-1},任意两个非故障点之间存在长度为l的无故障路。相似文献

8.

可拓K近邻算法在数据聚类分析中的应用

下载免费PDF全文

杨仪向长城魏代俊《计算机工程与应用》2010,46(21):156-159

针对区间值数据的数据聚类问题,根据可拓学关联函数的定义,提出可拓距离的概念来度量数据之间的距离,利用K近邻的思想,根据可拓距离的大小对数据集的目标属性进行投票选择进行分类,设计了可拓K近邻算法（Extension K Nearest Neighbor,EKNN）。最后利用UCI的两个基准数据集Iris植物样本数据和糖尿病数据库PIDD进行验证,首先通过免疫网络约简算法对条件属性进行最小属性约简,然后利用EKNN算法分析和比较不同最小约简属性下的分类准确率。相似文献

9.

结合可信度的k_m-means算法

熊君竹何振峰《计算机系统应用》2022,31(6):175-181

以K-means为代表的聚类算法被广泛地应用在许多领域, 但是K-means不能直接处理不完整数据集. k_m-means是一种处理不完整数据集的聚类算法, 通过调整局部距离计算方式, 减少不完整数据对聚类过程的影响. 然而k_m-means初始化阶段选取的聚类中心存在较大的不可靠性, 容易陷入局部最优解. 针对此问题, 本文引入可信度, 提出了结合可信度的k_m-means聚类算法, 通过可信度调整距离计算, 增大初始化过程中选取聚类中心的可靠性, 提高聚类算法的准确度. 最后, 通过UCI和UCR数据集验证算法的有效性. 相似文献

10.

基于自适应马氏距离的模糊c均值算法

下载免费PDF全文

蔡静颖谢福鼎张永《计算机工程与应用》2010,46(34):174-176

经典的模糊c均值（FCM）算法是基于欧氏距离的,它只适用于球型结构的聚类,且在处理高维的数据集时,分错率增加。针对以上两个问题,提出了一种新的聚类算法（FCM-M）,它将马氏距离与模糊c均值相结合,并在目标函数中引进一个协方差矩阵的调节因子,利用马氏距离的优点,有效地解决了FCM算法中的缺陷,并利用特征值、特征矢量及伪逆运算来解决马氏距离中遇到的奇异问题。通过数据聚类和图像分割两组实验,证实了该方法的可行性和有效性。相似文献

11.

一种新的k-means聚类中心选取算法 总被引：1，自引：0，他引：1

下载免费PDF全文

黄敏何中市邢欣来陈英《计算机工程与应用》2011,35(35):132-134

在2010年提出已有的k-means聚类中心选取算法的基础上进行改进。通过计算样本间的距离求出每个样本的密度参数,选取最大密度参数值所对应的样本作为初始聚类中心。当最大密度参数值不惟一时,提出合理选取最大密度参数值的解决方案,依次求出k个初始聚类中心点,由此提出了一种新的k-means聚类中心选取算法。实验证明,提出的算法与对比算法相比具有更高的准确率。相似文献

12.

启发式初始化独立的k-均值算法研究

王会青陈俊杰郭凯《计算机工程与应用》2012,48(11):129-132,160

针对传统k-均值算法对初始聚类中心敏感的问题,提出了启发式初始化独立的k-均值算法。该算法引入prim算法选择k个初始聚类中心,且通过设置阈值参数θ,避免同一类中的多个数据对象同时作为初始聚类中心,否则将导致聚类迭代次数增加,并得到错误的聚类结果。与传统的k-均值算法和基于遗传算法的k-均值聚类算法相比,实验结果表明改进的算法不仅降低了初始聚类中心选取的随机性对聚类性能产生的影响,有效减少了聚类迭代次数,而且降低了离群点对聚类性能的影响,从而验证了算法的可行性和有效性。相似文献

13.

基于平均密度优化初始聚类中心的k-means算法

邢长征谷浩《计算机工程与应用》2014,50(20):135-138

现有的基于密度优化初始聚类中心的k-means算法存在聚类中心的搜索范围大、消耗时间久以及聚类结果对孤立点敏感等问题,针对这些问题,提出了一种基于平均密度优化初始聚类中心的k-means算法adk-means。该算法将数据集中的孤立点划分出来,计算出剩余数据集样本的平均密度,孤立点不参与聚类过程中各类所含样本均值的计算;在大于平均密度的密度参数集合中选择聚类中心,根据最小距离原则将孤立点分配给离它最近的聚类中心,直至将数据集完整分类。实验结果表明,这种基于平均密度优化初始聚类中心的k-means算法比现有的基于密度的k-means算法有更快的收敛速度,更强的稳定性及更高的聚类精度,消除了聚类结果对孤立点的敏感性。相似文献

14.

一种基于改进k-means的RBF神经网络学习方法 总被引：1，自引：0，他引：1

庞振徐蔚鸿《计算机工程与应用》2012,48(11):161-163,184

针对传统RBF神经网络学习算法构造的网络分类精度不高,传统的k-means算法对初始聚类中心的敏感,聚类结果随不同的初始输入而波动。为了解决以上问题,提出一种基于改进k-means的RBF神经网络学习算法。先用减聚类算法优化k-means算法,消除聚类的敏感性,再用优化后的k-means算法构造RBF神经网络。仿真结果表明了该学习算法的实用性和有效性。相似文献

15.

基于双重遗传的聚类分析算法研究

文静曹妍张琳牟向伟《计算机工程与科学》2017,39(12):2320-2325

针对影响k-means聚类效果的聚类数目和初始中心点两大因素,提出了基于双重遗传的kmeans算法。它用外层遗传算法控制聚类数目,用内层遗传算法控制聚类的初始中心点,并采用类间距离和类内距离以及二者之间的比值来评价聚类结果的好坏,在算法终止后,可同时求得较优的聚类数目和某聚类数目下的较优初始中心点。此外,根据内外层遗传算法的特殊性,采用不同的编码策略适应算法需求,为保留优质个体,采用精英个体保留策略。通过UCI数据集测试实例证明此算法有很好的实用性,对数据挖掘技术有一定参考价值。相似文献

16.

基于粗糙集的混合属性数据聚类算法 总被引：2，自引：0，他引：2

范黎林王娟《计算机应用》2010,30(12):3377-3379

传统聚类方法将对象严格地划分到某一类,但是很多时候边界对象不能被严格地划分。基于粗糙集的k-means聚类算法和基于粗糙集的leader聚类算法,利用粗糙集理论将数据对象划分到一个簇的上近似集或下近似集当中,提供了一种新的处理不确定性的视角,很好地解决了这种边界不确定问题。但其缺点是不能处理混合属性数据,聚类结果对初值有明显的依赖性。针对这些算法存在的不足,给出了一种适用于混合属性数据的距离定义,对初始值的选取提出了改进办法,提出了一种基于粗糙集的混合属性数据聚类算法。仿真实验证明,在不确定聚类簇数的情况下,该算法的聚类准确率比传统k-means算法明显提高。相似文献

17.

一种基于密度的K—means算法

乔小妮张明新史变霞《电脑开发与应用》2008,21(10):9-11

基于密度聚类的思想,提出了一种改进的K—means算法。算法吸取密度聚类算法的优点,利用对象的t-邻域密度作为选择初始聚类中心点的条件．选出较优的初始中心点,从而得到较好的聚类效果。通过实验表明,此方法相对于随机选取初始聚类中心点准确率较高、稳定性强、可伸缩性好。相似文献

18.

基于支持向量机的海量电力数据智能分类方法

单婧婧刘海林《自动化与仪器仪表》2021,(2):216-220

针对电力公司海量数据分类问题,提出一种改进的k-means数据分类方法。在k-means算法的基础上,应用PCA对k-means算法进行降维处理,用canopy算法优化最佳簇集数、初始聚类中心。然后,应用改进的k-means算法对居民用户用电进行聚类;最后以该聚类结果为基础,建立LSTM预测模型。通过LSTM预测模型对某小区90户居民用电数据进行仿真实验,并对比分析了传统聚类、改进聚类和不适用聚类下LSTM三种模型的预测结果。结果表明,未使用任何聚类算法构建的LSTM模型在进行电力负荷预测时,预测结果的精度最低;应用改进的k-means算法构建的LSTM模型预测结果精度最佳。相似文献

19.

一种改进的k-均值聚类算法 总被引：4，自引：0，他引：4

徐义峰陈春明徐云青《计算机应用与软件》2008,25(3):275-277

针对k-均值(k-means)聚类算法中随机选取初始聚类中心的缺陷,提出了一种新的基于数据样本分布选取初始聚类中心的方法.实验结果表明,改进后的算法能改善其聚类性能,并能取得较高的分类准确率. 相似文献

20.

基于离散量优化初始聚类中心的k-means算法

刘美玲黄名选汤卫东《计算机工程与科学》2017,39(6):1164-1170

传统k-means算法由于初始聚类中心的选择是随机的,因此会使聚类结果不稳定。针对这个问题,提出一种基于离散量改进k-means初始聚类中心选择的算法。算法首先将所有对象作为一个大类,然后不断从对象数目最多的聚类中选择离散量最大与最小的两个对象作为初始聚类中心,再根据最近距离将这个大聚类中的其他对象划分到与之最近的初始聚类中,直到聚类个数等于指定的k值。最后将这k个聚类作为初始聚类应用到k-means算法中。将提出的算法与传统k-means算法、最大最小距离聚类算法应用到多个数据集进行实验。实验结果表明,改进后的k-means算法选取的初始聚类中心唯一,聚类过程的迭代次数也减少了,聚类结果稳定且准确率较高。相似文献