首页 | 官方网站   微博 | 高级检索  
相似文献
 共查询到19条相似文献,搜索用时 62 毫秒
1.
基于SOM算法的文本聚类实现   总被引:2,自引:0,他引:2  
以自组织映射(Self-organizing Map,SOM)算法作为理论基础,实现对文本聚类,并采用U矩阵进行可视化表示。通过对聚类结果的分析,表明SOM算法具有较好的聚类效果。  相似文献   

2.
刘芳 《计算机应用研究》2012,29(4):1300-1303
提出了用无监督的自组织映射方法对金融数据进行聚类,并用平行坐标和交互式的圆形平行坐标方法在二维平面上表示出来。用这种方法形成清晰的可视化聚类结果,不仅有效地总结了数据特征,还提高了聚类的可视效果,从而便于发现数据的变化趋势。  相似文献   

3.
平行坐标技术是信息可视化中重要的分析手段,可以实现多维数据在二维空间上的可视化.为了给用户提供一种快捷、方便的金融数据可视化及分析工具,提出一种基于引力场聚类的金融数据可视化方法.首先利用自组织映射(SOM)对初始金融数据进行分类,使每类数据都含有特定的经济意义;然后进行视觉聚类,利用引力场原理对每个类中的折线进行聚拢,对类与类之间进行排斥,再通过设置不透明度以及交互操作等手段对可视化结果进行增强.实验结果表明,该方法可以形成清晰的可视化聚类结果,便于发现数据的变化规律.  相似文献   

4.
基于SOM聚类的数据挖掘方法及其应用研究   总被引:4,自引:0,他引:4       下载免费PDF全文
传统的聚类算法如Kmeans等,往往需要事先定义聚类数目。在实际应用中,多基于经验知识来确定类别个数,而且一般需要多次尝试,这种方法具有很大的盲目性。本文提出一种基于SOM的聚类算法,利用SOM的可视化功能和人眼在低维情况下对模式的快速识别能力来避免传统聚类算法确定聚类数目的盲目性。将提出的方法应用于某电信公司客户分群的实际问题当中,来刻画客户组的个性行为特征,以便销售人员制定针对性的营销策略,具有重要的实际意义。  相似文献   

5.
周欢  黄立平 《计算机应用》2007,27(B06):51-52
针对C-均值算法存在的缺点,提出了一种基于SOM神经网络的C-均值聚类算法。算法首先根据SOM神经网络自动聚类的优点给出聚类数目和各类中心点,然后将结果作为C-均值算法的初始输入进行进一步聚类,从而得到精确的聚类信息。最后通过试验说明该方法比单独的SOM神经网络和C-均值算法有效。  相似文献   

6.
为了解决多维数据的维数过高、数据量过大带来的平行坐标可视化图形线条密集交叠以及数据规律特征不易获取的问题,提出基于主成分分析和K-means聚类的平行坐标(PCAKP,principal component analysis and k-means clustering parallel coordinate)可视化方法。该方法首先对多维数据采用主成分分析方法进行降维处理,其次对降维后的数据采用K-means聚类处理,最后对聚类得到的数据采用平行坐标可视化技术进行可视化展示。以统计局网站发布的数据为测试数据,对PCAKP可视化方法进行测试,与传统平行坐标可视化图形进行对比,验证了PCAKP可视化方法的实用性和有效性。  相似文献   

7.
已有的二维流场可视化中,鞍点等临界点是最重要的特征之一.文中从一个新的角度提出一种基于流线聚类的二维向量场可视化方法.首先生成采样流线集合,然后将流线聚类,最后引入共轭法向量场和流线密度矩阵对同一个类的流线进行加速排序.在此基础上,提出3种可视化应用:抽取每一类的代表流线进行向量场的流线简洁表达;根据流线之间距离进行多分辨率均匀流线表达;生成权值图,增强基于纹理的向量场可视化.实验结果表明,该方法具有良好的鲁棒性,可视化效果优于已有的方法.  相似文献   

8.
利用SOM网络模型进行聚类研究   总被引:2,自引:0,他引:2  
自组织特征映射(SOM)是Kohonen提出的一种人工神经网络模型,其整个学习过程是在输入样本空间内进行.并以欧氏距离为度量。本文先介绍了SOM网络模型的来源,接着对SOM网络的结构与学习过程进行了介绍,最后给出了一个SOM网络模型在聚类中的程序实例。  相似文献   

9.
在数据挖掘中,K均值聚类算法作为最典型、最常见、实用度最广的一种聚类算法,具有简单易操作等优点。但K均值聚类算法也存在部分缺点,其在训练前需要提前设定聚类中心个数,在训练过程中容易陷入局部最优,面对多维数据样本其效果不佳,得到的聚类结果受初始聚类中心个数的设定影响较大。对k均值聚类算法的优化方案较多,本文主要针对前人提出的基于BP神经网络的K均值聚类算法和基于SOM网络改进的K均值聚类算法效果进行分析,为后续的进一步改进提供基础。  相似文献   

10.
经过摄像机摄入的图像会发生倾斜,给车牌的准确识别带来了困难.针对此问题,利用SOM神经网络良好的聚类性能,在水平倾斜校正时,把车牌号码图像中的像素坐标聚成两类,拟合成一条直线,计算出该直线倾斜角,完成水平校正;按照以上同样方法进行垂直倾斜校正.实验结果表明,该方法能准确获取车牌号码的倾斜角,算法结构简单,抗干扰能力较强,符合汽车牌照图像的特点,具有较好的处理效果.  相似文献   

11.
基于SOM算法实现的文本聚类   总被引:14,自引:0,他引:14  
张毓敏  谢康林 《计算机工程》2004,30(1):75-76,157
以自组织特征映射(Self-organizing map,SOM)算法作为理论基础,实现了对 文本文档的聚类,并且给出了相应的类别标注,同时对聚类的准确度进行了评价,由于准确 度较低而后提出了把tf·idf计算词权重的方法应用到SOM算法的输入文本向量中去,因此提 高了聚类的平均准确度。  相似文献   

12.
本文利用粗糙集与布尔逻辑离散约简算法改进了粗糙自组织映射算法,并应用于基因表达数据的分析中.算法改进了传统自组织映射收敛慢、网络规模难以确定的缺点,减小了网络规模不确定对分类效果的影响.使用酵母茵基因表达数据进行实验,得到了较好的网络质量、网络规模和分类效果,相比传统自组织映射使分类正确率提高了10.15%.  相似文献   

13.
聚类方法在图像识别中的应用   总被引:2,自引:0,他引:2  
文中将聚类方法应用于图像识别系统中。由于光照、几何形变、摄像头角度等原因,在对拍摄得到的图像进行模板匹配的过程中发现图形的几何中心不唯一。为了解决这一问题,利用改进的聚类方法,对匹配中心进行聚类,从而得到图形唯一的几何中心。  相似文献   

14.
基于潜在语义索引和自组织映射网的检索结果聚类方法   总被引:1,自引:0,他引:1  
随着互联网的不断发展和数据量的不断增加,搜索引擎的作用日益明显,用户更多地依靠搜索引擎来查找需要的信息.利用潜在语义索引(LSI)理论和自组织映射神经网络(SOM)理论.提出了一种文本聚类的新方法——LSOM.该方法应用SOM网络来实现检索结果文本聚类,不必预先给定类别个数,具有聚类灵活和精度高等特点;同时,该方法应用LSI理论来建立向量空间模型.在词条的权重中引入了语义关系.对于高维的文本特征向量,消减原词条矩阵中包含的噪声,提高聚类速度.LSOM使用一种新的类别标签提取方法.并将提取的标签用于解决SOM基本类划分问题,算法在类别标签和聚类效果评价指标上都比已有的算法有所提高.  相似文献   

15.
平行坐标及其在聚类分析中的应用   总被引:4,自引:0,他引:4  
平行坐标对多维数据的表达是数据可视化的重要方法之一。它实现了多维数据在二维平面上的表示。利用平行坐标对数据进行分析处理的技术已经取得了很大的进展,如刷(Brushing)技术、交换坐标轴、抽象等。这些分析技术已经应用到数据挖掘的很多领域,尤其在聚类分析中,平行坐标对数据集的定性分析使聚类结果的合理性得到证明。  相似文献   

16.
谱聚类算法受到度量中尺度因子的影响,同时传统谱聚类算法通过欧氏距离度量样本间相似性也不准确。针对上述问题,提出一种基于传递距离的谱聚类算法。算法首先通过改进传统谱聚类中的度量方式,用基于传递距离的度量方式度量样本间相似性,并构建传递矩阵,接着用传递矩阵做相似度变换构建拉普拉斯矩阵,最终通过求特征值和特征向量完成聚类。基于传递距离的谱聚类算法在人工数据集及UCI数据集上均取得了良好的聚类结果,具有较好的鲁棒性和有效性。  相似文献   

17.
现有的径向布局可视化方法无法有效捕获高维数据的非线性结构.因此,文中提出基于维度扩展和重排的类圆映射可视化聚类方法.利用近邻传播聚类算法和多目标聚类可视化评价指标对高维数据进行维度扩展,然后对扩展后的高维数据进行维度相关性重排,最后利用类圆映射机制降维至二维可视化空间,实现高维数据有效可视化聚类.实验表明,文中提出的维度扩展和重排策略能有效提高类圆映射可视化方法聚类效果,其中的维度扩展策略也能显著提高其它径向布局可视化方法聚类效果,泛化性能较好.此外,相比同类方法,文中方法在可视化聚类准确度、拓扑保持、Dunn指数及效果上优势明显  相似文献   

18.
基于平行坐标的可视化多维数据挖掘的研究   总被引:1,自引:0,他引:1  
路燕梅 《现代计算机》2011,(25):16-19,29
可视化数据挖掘是将数据可视化与数据挖掘两个技术相结合,在其实现的多种方法中,平行坐标法是其中一种最直接同时也是研究最早的一项技术,它是在二维空间中以平行坐标的形式来表示N维数据从而实现把数据仓库中数据挖掘的结果或过程以图形呈现出来。通过对其实现方式上的研究,结合C#编程技术,提出一个初步的模型,分析平行坐标法相比其他方法的优缺点。  相似文献   

19.
可视化数据挖掘是将数据可视化与数据挖掘两个技术相结合.在其实现的多种方法中.平行坐标法是其中一种最直接同时也是研究最早的一项技术.它是在二维空间中以平行坐标的形式来表示N维数据从而实现把数据仓库中数据挖掘的结果或过程以图形呈现出来。通过对其实现方式上的研究,结合C#编程技术,提出一个初步的模型,分析平行坐标法相比其他方法的优缺点。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司    京ICP备09084417号-23

京公网安备 11010802026262号