共查询到18条相似文献,搜索用时 62 毫秒
1.
挖掘复杂网络的重叠社区结构对研究复杂系统具有重要的理论和实践意义。提出一种基于局部扩展优化的重叠社区识别算法。
首先基于网络节点的聚集系数筛选种子节点,选取不相关的、局部聚集系数大的种子作为初始社区;然后采用贪心策略扩展初始社区,得到局部连接紧密的自然社区;最后检测并合并相似的社区,获得高覆盖率的重叠社区结构。在人工生成网络和真实网络数据集上的实验结果表明,与现有的基于局部扩展的代表性重叠社区发现算法相比,所提算法能在稀疏程度不同的网络上发现更高质量的重叠社区。 相似文献
2.
3.
传统的重叠社区发现算法SLPA虽然具有时间复杂度和性能上的优势,但标签传播算法内在的随机策略使得算法结果并不稳定。针对SLPA的缺点,提出一种高效稳定的重叠社区发现算法L-SLPA。先对网络进行非重叠划分,减少不同标签分配的数量,同时加入边界节点的考虑进行剪枝,以提高运行速度。实验结果表明,相比于SLPA,该算法在降低运行时间和随机性的同时保证了结果的准确性。 相似文献
4.
5.
重叠网络的社区发现是复杂网络研究中的重要问题。为了提高网络中重叠社区发现的时间效率,提出一种基于边图的线性流重叠社区发现算法LBSA。算法首先对于边图网络中的边进行随机的依次处理,完成节点的初步社区划分,再将其中重叠小社区合并到相似度最大的其他大社区中得到最终的社区。通过以上步骤,算法能够以接近线性的时间复杂度得到网络的重叠结构。从最终的实验结果来看,与其他算法相比,该算法能够在更短的时间有质量地发现网络中的重叠社区。 相似文献
6.
7.
重叠社区发现是复杂网络分析的主要任务之一。针对现有的基于局部扩展和优化的重叠社区发现方法受初始种子节点选择影响较大、适应度函数无法度量节点间多样的连接方式等问题,提出了一种基于局部路径信息的重叠社区发现算法(Local Path Information-based Overlapping Community Detection Algorithm, LPIO)。首先选取局部极大度点作为初始种子节点,并根据社区内节点邻域标签一致性更新社区的种子节点集,避免初始种子节点对算法性能的影响;然后为度量稀疏网络中节点间多样的连接方式,给出了基于局部路径信息的社区适应度函数,扩展种子节点集得到社区结构;最后计算未聚类节点与社区种子集之间的点不重复路径数量,得到未聚类节点与已有社区间的距离,为未聚类节点分配社区。在4个有标签网络和8个无标签网络上,与7个经典重叠社区发现算法进行对比,实验结果表明,所提算法在重叠标准互信息(ONMI)、F1分数、扩展模块度(EQ)等方面表现良好。 相似文献
8.
重叠社区发现算法对于理解复杂系统、发现复杂网络中隐藏的规律等具有很强的应用价值,而评价指标是算法发现高质量重叠社区的一个关键要素,算法的进步常常依赖于评价指标的进步。现有研究对非重叠社区发现算法的评价指标有较多的总结,而没有对重叠社区发现算法的评价指标进行总结。对重叠社区发现算法的评价指标进行了系统的总结和回顾,将指标分为事先知道社区结构、事先不知道社区结构和其它三大类。事先知道社区结构的评价指标包括基于混淆矩阵、基于ARI、基于NMI三个子类评价指标,事先不知道社区结构的评价指标包括基于模块度、基于密度、基于元数据三个子类评价指标,其它类主要介绍算法可扩展性评价指标。深入理解各种评价指标对于开发和优化重叠社区发现算法、在实际应用中发现高质量社区具有重要价值。 相似文献
9.
为了有效地发现复杂网络中的重叠社区结构,引入了密度峰值聚类算法,但将此算法应用于社区发现还存在如何度量节点间距离、如何产生重叠划分结果等问题。为此提出了一种基于节点局部相似性的两阶段密度峰值重叠社区发现方法(Node Local Similarity Based Two-stage Density Peaks Algorithm for Overlapping Community Detection, LSDPC)。该方法结合大度节点有利指标和连接贡献度定义了一种新的节点局部相似性指标,首先通过节点局部相似性度量节点距离;然后通过节点的局部密度和最小距离计算节点中心值,利用切比雪夫不等式筛选出社区中心节点;最后经过初次划分与重叠划分两阶段得到最终的重叠社区划分结果。在真实网络数据集与合成网络数据集上的实验结果表明,所提算法可以有效发现重叠社区结构,且结果优于其他对比算法。 相似文献
10.
处理海量级数据的有效途径之一是将算法分解为一系列互不依赖的任务,然后利用开源工具并行地执行算法。而在重叠社区发现算法中,基于局部拓展的方法在拓展阶段往往仅需要局部社区及其相应的邻居结点的信息,因而具备可并行执行的可能性。提出了一种可并行化执行的局部拓展算法,并借助开源工具Spark将其实现。算法分为4个阶段。首先,挑选出一组不相关的中心结点并使用其对应的局部网络作为种子;其次,通过删除本身连接不是很紧密的局部网络来过滤选出的种子;然后,采用一种批量式的拓展策略来拓展种子,即一次向局部社区中添加一批邻居结点或从社区中删除一批结点;最后,融合相似的社区。在人工生成的网络以及真实世界中的网络上的实验结果显示 ,所提算法既准确又高效。 相似文献
11.
目前大部分社团发现方法都是针对无向无权图,但实际的社会媒体中的社团内部个体交互过程可以抽象为一个有向加权图,并且权重中含有大量的噪声.为解决有向加权社团的划分问题,本文提出一种基于非负矩阵分解(Nonnegative matrix factorization,NMF)可去噪声的社团发现方法.该方法通过小波阈值去噪对社会网络数据进行去噪处理,结合有向加权的非负矩阵分解算法对去噪后的数据集进行社团发现,准确找出社团结构.在社会媒体的实验数据集和标准数据集上的实验结果表明,该算法针对带噪声的有向加权图社团发现问题具有良好划分性能,SNR为15时,在Lesmis数据集上的社团划分准确率达到96%,划分模块度值提高了29%.本文为解决带噪的有向加权的社会网络数据提供了切实有效的处理方法. 相似文献
12.
重叠社区发现是近年来复杂网络领域的研究热点之一.提出一种半监督的局部扩展式重叠社区发现方法SLEM(semi-supervised local expansion method).该方法借鉴了带约束的半监督聚类的思想,不仅利用网络的拓扑结构信息,还充分地利用网络节点的属性信息.首先将网络节点的属性信息转化为成对约束,并根据成对约束修正网络的拓扑结构,使网络中的社区结构更加明显;然后基于网络节点的度中心性选取种子节点,得到分散的、局部节点度大的种子作为初始社区;再采用贪心策略将初始社区向邻居节点扩展,得到局部连接紧密的社区;最后检测并合并冗余社区,得到高覆盖率的社区发现结果.在模拟网络数据和真实网络数据上与当前有代表性的基于局部扩展的重叠社区发现算法进行了对比实验,结果表明SLEM方法在稀疏程度不同的网络上均能发现较高质量的重叠社区结构. 相似文献
13.
14.
近些年来,网络中的重叠社区检测应用越来越广泛,这极大引起了人们的兴趣。通常重叠社区检测只考虑节点的拓扑结构信息,忽略了节点的属性信息,这可能会遗漏数据间的重要结构。本文提出了一种基于节点拓扑结构和属性相似度的局部社区检测算法。首先,计算出节点与社区之间属性相似度。其次,为挖掘内部紧耦合的社区,计算出能够表示耦合性的模块度增量。最后,通过融合多个已检测到局部社区,计算出隶属矩阵从而获取全局重叠社区结构。在三个有真实社区的数据集上的实验结果从内部指标模块度和与真实社区的比较验证了基于节点拓扑结构和属性相似度的重叠社区检测算法比目前基于节点结构的社区检测算法在效率和有效性上有所提升。 相似文献
15.
Balanced Multi-Label Propagation for Overlapping Community Detection in Social Networks 总被引:1,自引:1,他引:1 下载免费PDF全文
武志昊 林友芳 Steve Gregory 万怀宇School of Computer Information Technology Beijing Jiaotong University 田盛丰 《计算机科学技术学报》2012,27(3):468-479
In this paper,we propose a balanced multi-label propagation algorithm(BMLPA) for overlapping community detection in social networks.As well as its fast speed,another important advantage of our method is good stability,which other multi-label propagation algorithms,such as COPRA,lack.In BMLPA,we propose a new update strategy,which requires that community identifiers of one vertex should have balanced belonging coefficients.The advantage of this strategy is that it allows vertices to belong to any number of communities without a global limit on the largest number of community memberships,which is needed for COPRA.Also,we propose a fast method to generate "rough cores",which can be used to initialize labels for multi-label propagation algorithms,and are able to improve the quality and stability of results.Experimental results on synthetic and real social networks show that BMLPA is very efficient and effective for uncovering overlapping communities. 相似文献
16.
17.
针对基于多标签传播重叠社团挖掘算法COPRA因随机更新策略带来的不稳定性以及需要预先输入参数的局限性等问题,提出一种基于LeaderRank和节点相似性的多标签传播重叠社团挖掘算法.该算法首先利用LeaderRank算法对网络中的节点进行重要性排序从而确定节点的更新顺序,减少标签不必要的更新.在标签传播过程中,根据节点相似性重新设计标签的更新策略,提高算法的稳定性.将算法应用于人工网络和真实网络中进行实验,实验结果表明该算法在挖掘重叠社团上具有较高的准确性和稳定性. 相似文献
18.
为了能够更加有效地发现社会网络中具有重叠性的社区结构,提出一种基于链接密度聚类的重叠社区发现算法DBLINK.该算法首先以网络中的边集为对象,将其划分为若干个互不相连的链接社区,再将所得到的链接社区转化为最终的节点社区,隶属于不同链接社区边的交点即为网络中的重叠节点.由于DBLINK采用基于密度的算法对边集进行聚类,将不满足一定条件的边孤立出来,使其不隶属于任何链接社区,因此可以避免社区结构过度重叠的现象发生,从而提高了重叠社区发现的质量.实验结果表明,DBLINK不仅具有较好的时间效率,而且在社区发现的质量方面也优于其他几种代表性的重叠社区发现算法. 相似文献