共查询到20条相似文献,搜索用时 140 毫秒
1.
2.
3.
批量构建M+-tree 总被引:1,自引:0,他引:1
提出了一种新的M^+-tree构造策略一通过批量装载数据静态构造M^+-tree.这种建树方法能够极大地降低索引的构建代价并加快建树速度:又能保证高雏数据良好的聚类特性.同时又提出了一种有效的聚类算法一多步聚类,基于这种聚类构造M^+-tree.实验结果表明,这种建树算法能够保证索引空间的最大利用率.降低建树的代价,同时又能够保证索引的查询效率. 相似文献
4.
随着多媒体技术的发展,许多领域产生大量的高维数据集。为了有效地检索这些高维数据,高维索引成为人们研究的热点。聚类树是一种有效地支持高维数据检索的索引结构。提出了一种基于子空间聚类的聚类树结构,该索引结构基于一种改进的CLIQUE聚类算法,利用小波变换的多尺度特性对图像特征分布曲线进行不同尺度的小波变换,去除一些小的分类和可能的噪声干扰,从而得到不同粒度下的层次聚类。在层次聚类的基础上,建立起分层索引结构。由于改进的聚类算法使用爬山法确定子空间聚类,因而有效地避免了用户参数的定义。实验结果证明,该方法在不需要用户设定聚类参数下能够进行有效聚类,在不同尺度下构建的聚类结构能够有效地组织图像关系,大大提高图像的检索效率。 相似文献
5.
聚类方法在基因表达数据分析中发挥着非常重要的作用,但基因表达数据相对其他领域的数据具有自身的特性,因此传统的数据距离定义和聚类方法已不能完全满足研究者对生物数据的分析要求。提出一种基于泊松分布的数据距离度量方式TransChisq,它以一种全新的视角定义了基因数据之间的距离,鉴于模糊聚类算法能够更加深刻地描述复杂的基因作用关系,将TransChisq距离与模糊聚类方法相结合对模糊C均值算法进行改进,并应用于真实基因表达数据分析。实验结果表明,该方法能够按照生物学的真实分类将基因表达数据聚类,并且可以发现更多的共调控基因,更加满足了基因表达数据分析的需要。 相似文献
6.
Kmeans是最典型的聚类算法,因其简洁、快速而被广泛使用。针对传统Kmeans算法对初始聚类中心敏感和聚类参数k难以确定的问题,提出了一种基于关联图划分的Kmeans算法。该算法能够有效地根据数据的分布特性选取初始聚类中心,能够在指定的数据密集程度下自适应确定聚类数目。有效性实验表明上述改进的Kmeans算法具有较高的准确率和稳定性。 相似文献
7.
流数据聚类是数据挖掘研究中一个热点问题.基于Agent方法的流数据聚类算法AGCluStream采用双层结构,在线层采用格簇存储数据信息,利用Agent操作完成对数据的处理,离线层采用了结合时间框架的窗口分析技术.算法鲁棒性高,能够更好地适应流数据的动态特性,维护数据全局分布的完整性,时间开销适应流数据的高速性. 相似文献
8.
聚类有效性函数是用于评价聚类结果优劣的指标,准确地给出初始聚类类别数将使得聚类结果趋于合理化。根据模糊不确定性理论及聚类问题的基本特性,引入了新的紧密度度量指标Di(U;c),在此基础上提出了一个旨在寻求最优聚类类别数的有效性函数。该函数基于数据集的紧密度与分离度特征,综合考虑了数据成员的隶属度及数据集的几何结构。实验结果表明该有效性函数能够发现最优的聚类类别数,对于分类结构较为明确的数据集表现出良好的性能,并且对于权重系数具有良好的鲁棒性。 相似文献
9.
当数据集聚类边界不清晰或存在噪声干扰时,人工免疫网络聚类算法通常无法获得有效的聚类划分。受抗体免疫差异性的启发,提出一种基于抗体亲和度累积的人工免疫网络聚类算法。该算法在抗体中引入亲和度累积及有效的更新策略,使用记忆网络中抗体的亲和度累积强度分布表达数据集的空间密度变化趋势,从而在记忆网络中通过二次免疫抑制,使网络中抗体的聚类结构更加清晰。实验结果表明,该算法对聚类边界不清晰的数据集可获得较精确的聚类划分,同时具有很强的噪声抑制能力。 相似文献
10.
DNA微阵列技术的应用产生了大量的基因表达时序数据,对这些数据进行聚类是获取其中隐含的生物分子信息的一种重要方法。提出了一种基于隐马尔可夫模型(HMM)的层次聚类方法,根据基因表达时序数据的统计特性对其进行标准化和离散化等预处理,用HMM对经过预处理的数据建模以利用基因表达时序数据不同时间点之间的相关性,用层次聚类方法对建立的模型进行聚类。实验结果表明该方法不仅能够产生好的聚类,而且能够确定最优的聚类数。 相似文献
11.
异质信息网络能够对真实世界的诸多复杂应用场景进行建模,其表示学习研究也得到了众多学者的广泛关注.现有的异质网络表示学习方法大多基于元路径来捕获网络中的结构和语义信息,已经在后续的网络分析任务中取得很好的效果.然而,此类方法忽略了元路径的内部节点信息和不同元路径实例的重要性;仅能捕捉到节点的局部信息.因此,提出互信息与多条元路径融合的异质网络表示学习方法.首先,利用一种称为关系旋转编码的元路径内部编码方式,基于相邻节点和元路径上下文节点捕获异质信息网络的结构和语义信息,采用注意力机制来建模各元路径实例的重要性;然后,提出一种互信息最大化与多条元路径融合的无监督异质网络表示学习方法,使用互信息捕获全局信息以及全局信息和局部信息之间的联系.最后,在两个真实数据集上进行实验,并与当前主流的算法进行比较分析.结果表明,所提方法在节点分类和聚类任务上性能都有提升,甚至和一些半监督算法相比也表现出强劲性能. 相似文献
12.
13.
《Applied Soft Computing》2008,8(1):30-45
In this paper, a reactive immune network (RIN) is proposed and employed for mobile robot navigation within unknown environments. Rather than building a detailed mathematical model of artificial immune systems, this study tries to explore the principle in an immune network focusing on its self-organization, adaptive learning capability, and immune feedback. In addition, an adaptive virtual target method is integrated to solve the local minima problem in navigation. Several trapping situations designed by the early researchers are adopted to evaluate the performance of the proposed architecture. Simulation results show that the mobile robot is capable of avoiding obstacles, escaping traps, and reaching the goal efficiently and effectively. 相似文献
14.
15.
图神经网络在学习节点表示中展现了其突出的能力,然而在社团检测方面,大多数图神经网络模型仍然使用K-means来定位社团中心,为了克服K-means不适用于高维空间下聚类的缺点,提出了联合图的全局和局部互信息的重叠社团检测算法(overlapping community detection algorithm using global and local mutual information of graph,overDGI),这是一种用于处理重叠社团检测问题的图神经网络。首先,采用最大化图互信息和社团互信息使得隶属于同一社团的节点间的向量表示距离更近、更接近社团中心;然后,设计了一个目标分布来帮助模型更好地解决重叠社团检测任务。综合实验表明,overDGI在重叠社团划分上的表现对比现有的几种基准算法都有很强的竞争力。 相似文献
16.
17.
This paper presents a self-organizing transient chaotic neural network to solve the channel assignment problem, one of NP-complete problems. The proposed neural network consists of two parts. The first part is the self-organizing evolution stage, which based on the mutual inhibition mechanisms of bristle differentiation and the problem's heuristic information. The second part is the transient chaotic neural network executing stage. A significant property of the TCNN model is that the chaotic neurodynamics is temporarily generated for searching and self-organizing in order to escape the local minima. In the proposed neural network, the first part is used to improve the quality of the obtained solutions. The simulating results have shown that the self-organizing transient chaotic neural network improves greatly performance through solving the well-known benchmark problems, especially for the Sivarajan's and Kunz's benchmark problems, while the performance is comparable with existing algorithms. 相似文献
18.
信息网络结构特征作为影响关系生成与演化的主要因素在信息网络关系分类与推断领域占据重要地位。现有的关系分类与推断算法在处理网络结构特征的过程中,无法达到令人满意的效果。为此,结合互信息的定义,提出一种基于互信息特征选择的关系分类与推断算法。通过定义CN、AA、Katz等相似度指标充分抽取局部和全局(半全局)两类网络结构特征,利用基于密度比函数的最大似然估计来计算特征之间的近似互信息。该密度函数有效地解决了特征选择中全局最优解的过程,同时筛选出更具判别性的特征。通过多个真实信息网络数据集上的实验结果表明,无论是经典分类算法还是新近提出的基于学习理论的关系分类算法,经过互信息特征选择步骤的算法在Accuracy、AUC、Precision等评价指标上均比基准算法要优。 相似文献
19.
20.
设计了一种免疫神经网络故障诊断方法,将神经网络权值进行编码作为抗体,将网络误差作为抗原,算法首先利用免疫算法的全局收敛特性,对网络权值进行全局搜索,然后再利用BP算法的局部搜索性能对网络权值进行局部搜索;以抽油机井为对象进行了仿真研究,并与BP神经网络故障诊断方法进行比较分析,表明免疫神经网络故障诊断方法能够有效避免陷入局部极小值的现象,并且在一定程度上加快了算法的运行速度。 相似文献