首页 | 官方网站   微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 140 毫秒
1.
对于基于距离的聚类算法,数据变换是实现成功挖掘的重要保证。实验结果表明,改变变量值域区间跨度的大小对数据对象分布形态有明显的影响,从而也改变了聚类结果;数据变换能够提高聚类结果的有效性和准确率。  相似文献   

2.
针对标准谱聚类算法中,基于欧氏距离的相似性度量不能完全反映数据聚类复杂的空间分布特性的问题,提出了一种基于流形距离核的谱聚类算法.它能充分挖掘数据集中的内在结构信息,较好地反映局部和全局一致性,并且可以很好地防止"桥"噪声点的影响,提高算法的聚类性能.与传统的聚类算法和常见谱聚类算法进行了比较,在人工数据集和UCI数据集上的实验都验证了本算法能够获得更好的聚类效果.  相似文献   

3.
批量构建M+-tree   总被引:1,自引:0,他引:1  
提出了一种新的M^+-tree构造策略一通过批量装载数据静态构造M^+-tree.这种建树方法能够极大地降低索引的构建代价并加快建树速度:又能保证高雏数据良好的聚类特性.同时又提出了一种有效的聚类算法一多步聚类,基于这种聚类构造M^+-tree.实验结果表明,这种建树算法能够保证索引空间的最大利用率.降低建树的代价,同时又能够保证索引的查询效率.  相似文献   

4.
随着多媒体技术的发展,许多领域产生大量的高维数据集。为了有效地检索这些高维数据,高维索引成为人们研究的热点。聚类树是一种有效地支持高维数据检索的索引结构。提出了一种基于子空间聚类的聚类树结构,该索引结构基于一种改进的CLIQUE聚类算法,利用小波变换的多尺度特性对图像特征分布曲线进行不同尺度的小波变换,去除一些小的分类和可能的噪声干扰,从而得到不同粒度下的层次聚类。在层次聚类的基础上,建立起分层索引结构。由于改进的聚类算法使用爬山法确定子空间聚类,因而有效地避免了用户参数的定义。实验结果证明,该方法在不需要用户设定聚类参数下能够进行有效聚类,在不同尺度下构建的聚类结构能够有效地组织图像关系,大大提高图像的检索效率。  相似文献   

5.
聚类方法在基因表达数据分析中发挥着非常重要的作用,但基因表达数据相对其他领域的数据具有自身的特性,因此传统的数据距离定义和聚类方法已不能完全满足研究者对生物数据的分析要求。提出一种基于泊松分布的数据距离度量方式TransChisq,它以一种全新的视角定义了基因数据之间的距离,鉴于模糊聚类算法能够更加深刻地描述复杂的基因作用关系,将TransChisq距离与模糊聚类方法相结合对模糊C均值算法进行改进,并应用于真实基因表达数据分析。实验结果表明,该方法能够按照生物学的真实分类将基因表达数据聚类,并且可以发现更多的共调控基因,更加满足了基因表达数据分析的需要。  相似文献   

6.
Kmeans是最典型的聚类算法,因其简洁、快速而被广泛使用。针对传统Kmeans算法对初始聚类中心敏感和聚类参数k难以确定的问题,提出了一种基于关联图划分的Kmeans算法。该算法能够有效地根据数据的分布特性选取初始聚类中心,能够在指定的数据密集程度下自适应确定聚类数目。有效性实验表明上述改进的Kmeans算法具有较高的准确率和稳定性。  相似文献   

7.
流数据聚类是数据挖掘研究中一个热点问题.基于Agent方法的流数据聚类算法AGCluStream采用双层结构,在线层采用格簇存储数据信息,利用Agent操作完成对数据的处理,离线层采用了结合时间框架的窗口分析技术.算法鲁棒性高,能够更好地适应流数据的动态特性,维护数据全局分布的完整性,时间开销适应流数据的高速性.  相似文献   

8.
一种新的聚类有效性函数   总被引:3,自引:1,他引:2       下载免费PDF全文
聚类有效性函数是用于评价聚类结果优劣的指标,准确地给出初始聚类类别数将使得聚类结果趋于合理化。根据模糊不确定性理论及聚类问题的基本特性,引入了新的紧密度度量指标DiU;c),在此基础上提出了一个旨在寻求最优聚类类别数的有效性函数。该函数基于数据集的紧密度与分离度特征,综合考虑了数据成员的隶属度及数据集的几何结构。实验结果表明该有效性函数能够发现最优的聚类类别数,对于分类结构较为明确的数据集表现出良好的性能,并且对于权重系数具有良好的鲁棒性。  相似文献   

9.
潘章明 《计算机应用》2011,31(6):1660-1663
当数据集聚类边界不清晰或存在噪声干扰时,人工免疫网络聚类算法通常无法获得有效的聚类划分。受抗体免疫差异性的启发,提出一种基于抗体亲和度累积的人工免疫网络聚类算法。该算法在抗体中引入亲和度累积及有效的更新策略,使用记忆网络中抗体的亲和度累积强度分布表达数据集的空间密度变化趋势,从而在记忆网络中通过二次免疫抑制,使网络中抗体的聚类结构更加清晰。实验结果表明,该算法对聚类边界不清晰的数据集可获得较精确的聚类划分,同时具有很强的噪声抑制能力。  相似文献   

10.
DNA微阵列技术的应用产生了大量的基因表达时序数据,对这些数据进行聚类是获取其中隐含的生物分子信息的一种重要方法。提出了一种基于隐马尔可夫模型(HMM)的层次聚类方法,根据基因表达时序数据的统计特性对其进行标准化和离散化等预处理,用HMM对经过预处理的数据建模以利用基因表达时序数据不同时间点之间的相关性,用层次聚类方法对建立的模型进行聚类。实验结果表明该方法不仅能够产生好的聚类,而且能够确定最优的聚类数。  相似文献   

11.
异质信息网络能够对真实世界的诸多复杂应用场景进行建模,其表示学习研究也得到了众多学者的广泛关注.现有的异质网络表示学习方法大多基于元路径来捕获网络中的结构和语义信息,已经在后续的网络分析任务中取得很好的效果.然而,此类方法忽略了元路径的内部节点信息和不同元路径实例的重要性;仅能捕捉到节点的局部信息.因此,提出互信息与多条元路径融合的异质网络表示学习方法.首先,利用一种称为关系旋转编码的元路径内部编码方式,基于相邻节点和元路径上下文节点捕获异质信息网络的结构和语义信息,采用注意力机制来建模各元路径实例的重要性;然后,提出一种互信息最大化与多条元路径融合的无监督异质网络表示学习方法,使用互信息捕获全局信息以及全局信息和局部信息之间的联系.最后,在两个真实数据集上进行实验,并与当前主流的算法进行比较分析.结果表明,所提方法在节点分类和聚类任务上性能都有提升,甚至和一些半监督算法相比也表现出强劲性能.  相似文献   

12.
提出了一个从同构数据集中学习贝叶斯网络结构的分布式算法。该算法首先使用搜索评分的方法学习每个局部贝叶斯网络结构,然后取节点对互信息变量和条件互信息变量的数学期望作为全局学习的评价标准,融合所有局部结构得到全局结构。由于只使用了数据集中变量间的互信息和条件互信息,没有直接获取局部个体数据信息,从而可以实现有效的隐私保护。该算法在Alarm数据集上进行测试,边的误差率小于6%,运行时间比集中学习的算法的运行时间短,验证了算法的有效性。  相似文献   

13.
In this paper, a reactive immune network (RIN) is proposed and employed for mobile robot navigation within unknown environments. Rather than building a detailed mathematical model of artificial immune systems, this study tries to explore the principle in an immune network focusing on its self-organization, adaptive learning capability, and immune feedback. In addition, an adaptive virtual target method is integrated to solve the local minima problem in navigation. Several trapping situations designed by the early researchers are adopted to evaluate the performance of the proposed architecture. Simulation results show that the mobile robot is capable of avoiding obstacles, escaping traps, and reaching the goal efficiently and effectively.  相似文献   

14.
模块化免疫神经网络模型的研究与实现   总被引:1,自引:0,他引:1  
侯家利  朱梅阶  熊金志 《计算机工程》2006,32(5):195-197,234
提出了一种新的安全模型——模块化免疫神经网络模型。同时根椐模型中两大网络的作用机理,给出了它们之间的作用算法,最终形成了一个动态平衡的、白适应的、分布式的网络模型。实验表明模型有较高的安全数据识别率。  相似文献   

15.
图神经网络在学习节点表示中展现了其突出的能力,然而在社团检测方面,大多数图神经网络模型仍然使用K-means来定位社团中心,为了克服K-means不适用于高维空间下聚类的缺点,提出了联合图的全局和局部互信息的重叠社团检测算法(overlapping community detection algorithm using global and local mutual information of graph,overDGI),这是一种用于处理重叠社团检测问题的图神经网络。首先,采用最大化图互信息和社团互信息使得隶属于同一社团的节点间的向量表示距离更近、更接近社团中心;然后,设计了一个目标分布来帮助模型更好地解决重叠社团检测任务。综合实验表明,overDGI在重叠社团划分上的表现对比现有的几种基准算法都有很强的竞争力。  相似文献   

16.
入侵检测作为一种主动的信息安全保障措施,已成为计算机安全特别是网络安全领域的研究热点。基于免疫Agent的网络入侵检测模型是应用生物免疫代理原理构建,该模型具有很好的可扩充性,模型采用没有控制中心的并行ImA检测模式,且各自独立、相互协作并合作完成检测任务。与其它网络入侵检测模型相比,具有较强的伸缩性、自治性、健壮性和可扩展性等。  相似文献   

17.
This paper presents a self-organizing transient chaotic neural network to solve the channel assignment problem, one of NP-complete problems. The proposed neural network consists of two parts. The first part is the self-organizing evolution stage, which based on the mutual inhibition mechanisms of bristle differentiation and the problem's heuristic information. The second part is the transient chaotic neural network executing stage. A significant property of the TCNN model is that the chaotic neurodynamics is temporarily generated for searching and self-organizing in order to escape the local minima. In the proposed neural network, the first part is used to improve the quality of the obtained solutions. The simulating results have shown that the self-organizing transient chaotic neural network improves greatly performance through solving the well-known benchmark problems, especially for the Sivarajan's and Kunz's benchmark problems, while the performance is comparable with existing algorithms.  相似文献   

18.
信息网络结构特征作为影响关系生成与演化的主要因素在信息网络关系分类与推断领域占据重要地位。现有的关系分类与推断算法在处理网络结构特征的过程中,无法达到令人满意的效果。为此,结合互信息的定义,提出一种基于互信息特征选择的关系分类与推断算法。通过定义CN、AA、Katz等相似度指标充分抽取局部和全局(半全局)两类网络结构特征,利用基于密度比函数的最大似然估计来计算特征之间的近似互信息。该密度函数有效地解决了特征选择中全局最优解的过程,同时筛选出更具判别性的特征。通过多个真实信息网络数据集上的实验结果表明,无论是经典分类算法还是新近提出的基于学习理论的关系分类算法,经过互信息特征选择步骤的算法在Accuracy、AUC、Precision等评价指标上均比基准算法要优。  相似文献   

19.
基于免疫网络的入侵检测模型构建   总被引:2,自引:1,他引:1       下载免费PDF全文
张志丽  孙敏 《计算机工程》2009,35(8):161-163
基于群体人工免疫的入侵检测模型主要由一些离散的元素组成,这些元素之间没有直接的交互。针对该问题提出一种基于人工免疫网络的入侵检测模型。该模型通过免疫网络中各元素之间的相互刺激作用而构成一个动态的平衡系统,以适应不断更新换代的网络攻击。实验结果表明,该模型可以较好地检测异常的网络数据包,具有较好的自适应性。  相似文献   

20.
设计了一种免疫神经网络故障诊断方法,将神经网络权值进行编码作为抗体,将网络误差作为抗原,算法首先利用免疫算法的全局收敛特性,对网络权值进行全局搜索,然后再利用BP算法的局部搜索性能对网络权值进行局部搜索;以抽油机井为对象进行了仿真研究,并与BP神经网络故障诊断方法进行比较分析,表明免疫神经网络故障诊断方法能够有效避免陷入局部极小值的现象,并且在一定程度上加快了算法的运行速度。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司    京ICP备09084417号-23

京公网安备 11010802026262号