首页 | 官方网站   微博 | 高级检索  
相似文献
 共查询到10条相似文献,搜索用时 31 毫秒
1.
电力负荷聚类分析研究是负荷特性模拟、需求侧管理等应用的基础。针对负荷数据日趋多样性、随机性,传统K-means算法无法有效处理高维数据,且存在人工给定聚类数目K值及随机选取初始聚类中心易收敛至局部最优的问题,本文提出一种基于自编码器(Auto-Encoder,AE)降维的电力负荷聚类方法。首先利用自编码器网络对采集的负荷数据提取特征,降低数据维度,然后通过密度权值Canopy算法对降维后的数据预聚类,得到初始聚类中心和最优聚类数目K值,将预聚类结果结合K-means算法进行聚类。算例结果表明,该方法能够有效对负荷数据进行特征提取,并减少聚类过程中的复杂度,提高了聚类结果准确度和聚类效率。  相似文献   

2.
为解决高多元时间序列聚类算法的问题,采用了一种基于主元分析方法的多元时间序列聚类分析方法,利用MTS序列的前z个主元与每个簇的代表元素之间的Eros距离,将原有的复杂数据降维.在此基础上通过改进K-means算法对选取的多元时间序列的主元进行聚类分析,最后得到K个MTS聚类.理论分析和实验结果表明该算法能有效解决聚类问题.  相似文献   

3.
为了提高电力负荷曲线聚类精度,文中提出了一种基于核主成分分析(KPCA)和改进K-means算法的电力负荷曲线聚类方法。该方法首先在划分聚类算法K-means基础上融入密度聚类思想,提出了融合密度思想的K-means算法(DK-means算法),并在电力负荷曲线实验集上对比分析其聚类效果;接着在实验集上比较各种降维算法的降维聚类精度和降维速度;最后分析KPCA+DK-means组合算法的降维聚类能力。结果表明,戴维森堡丁指数(DBI)更适合作为电力负荷曲线聚类评价指标;以DBI为评价指标,与K-means、BIRCH、DBSCAN和EnsClust 4种聚类算法相比,DK-means的聚类精度更高;与LLE、MDS、ISOMAP 3种非线性降维算法相比,KPCA的降维速度更快;KPCA+DK-means组合算法有良好的降维聚类能力,较DK-means在聚类精度和聚类效率上均有提升。KPCA+DK-means组合算法可以实现电力负荷曲线的高效降维、精确聚类,对用电行为模式的准确提取起关键技术支持作用。  相似文献   

4.
对不平衡数据进行聚类分析时,K-means聚类方法可能会错误地将分布在较小区域类别中的样本划分到大区域类别中;谱聚类算法,虽然可以有效优化数据结构,并很好地识别不同形状的样本,但却难以处理大规模数据.针对这些问题,提出一种改进地标点采样的不平衡数据聚类算法.该算法首先对不平衡数据进行预聚类以获得初始类标签,然后基于数据密度对数据进行采样.在此基础上,通过对采样数据执行K-means聚类,并将聚类中心作为地标点,对数据进行谱聚类分析.实验结果显示,该方法在处理不平衡数据时,不仅能够有效提高样本的聚类准确率,而且能够保证聚类结果的稳定性和精度.  相似文献   

5.
针对全国100家电子商务示范企业的相关数据, 先采用因子分析法对高维数据进行降维处理; 再通过改进DBSCAN(density based spatial clustering of applications with noise)算法对降维后的密度不均数据进行聚类分析, 得到了更合理的聚类结果; 最后根据聚类结果对相关示范企业提出改进建议.  相似文献   

6.
高维数据受冗余数据和噪声数据的影响,聚类效率和准确率低,基于拉普拉斯矩阵的特征值和特征向量的特点,介绍了一种适用于高维数据的新的聚类中心选择算法,算法将拉普拉斯矩阵用于候选聚类中心选择前的数据降维处理,经过对数据进行降维处理,提高了候选聚类中心的准确性,增大了聚类准确率,扩大了聚类数据的种类范围.在10个包含不同数量样本、维度、类别数的数据集上进行了聚类分析,实验结果表明了基于拉普拉斯降维的新聚类中心选择方法的有效性.  相似文献   

7.
针对K-means算法因随机选取聚类中心而易造成聚类结果不稳定的问题,提出PCA-KDKM算法。该算法使用主成分分析法对数据集的属性降维,提取主属性;利用k′dist曲线自动获取k值;计算平缓曲线上所含数据对象的均值并选取其中一值,作为首个初始聚类中心;利用基于密度和最大最小距离的算法思想进行聚类;结合类间距离和类内聚类提出聚类质量评价函数。将该算法与K-means、KNE-KM、QMC-KM、CFSFDP-KM在UCI数据集上进行聚类比较,结果表明该算法聚类结果稳定,聚类准确率高。将PCA-KDKM算法应用在微博舆情分析中,抓取不同类别的数万条数据进行聚类分析。实验结果表明,PCA-KDKM算法在微博舆情分析中有更高的准确性和稳定性,有利于及时发现热点舆情。  相似文献   

8.
针对临床路径决策分析聚类算法中聚类效果依赖于样本数据分布且处理数据效率低的问题,提出基于均衡分配方法的模糊K-means算法的临床路径决策方法.该算法利用文字数字化处理与加权计算来建立数据格式统一且关键属性突出的样本特征值矩阵;利用基于均衡分配方法的模糊K-means算法对上述样本进行聚类分析,得到最终的聚类中心与聚类结果,以此辅助医生进行临床路径决策.采用ECLIPSE编程进行仿真,与传统模糊K-means算法和基于减法聚类的FCM算法相比,采用该算法的迭代时间分别降低了26%与70%,迭代次数分别减少了33%和82%,平均目标函数最小值分别减小了32%和28%.实验表明,该算法能够有效降低聚类效果对于样本数据分布的依赖,同时数据聚类效率与质量也有显著的提高.  相似文献   

9.
对电子商务顾客忠诚度影响因素进行了全面的分析,以经典RFM客户忠诚度模型为基础,建立RFMSA电子商务客户忠诚度划分模型.通过聚类分析算法对顾客忠诚度进行划分.以经典聚类分析算法K-means为基础,提出分段确定初始聚类中心的改进算法对顾客忠诚度进行划.通过对经典样本数据进行分析,实验结果表明,改进的粗糙集K-means聚类算法能够有效的提高聚类的准确率.  相似文献   

10.
针对基于聚类的离群点检测算法在处理高维数据流时效率和精确度低的问题,提出一种高维数据流的聚类离群点检测(CODHD-Stream)算法。该算法首先采用滑动窗口技术对数据流划分,然后通过属性约简算法对高维数据集降维;其次运用基于距离的信息熵过滤机制的 K-means 聚类算法将数据集划分成微聚类,并检测微聚类的离群点。通过实验结果分析表明:该算法可以有效提高高维数据流中离群点检测的效率和准确度。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司    京ICP备09084417号-23

京公网安备 11010802026262号