首页 | 官方网站   微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 31 毫秒
1.
基于标签传播的社区挖掘算法研究综述   总被引:1,自引:0,他引:1  
社会网络由于其流行程度已经成为众多学者的研究热点。通过社区挖掘算法可以发现存在于社会网络中的潜在社区,而重叠社区挖掘则可以挖掘出更具有现实意义的社区结构。但是在研究中社会网络所包含的庞大数据量又会为之带来种种不便,因此快速的社区挖掘算法就受到了越来越多的重视。基于标签传播的社区挖掘算法具有近乎线性的时间复杂度。文中将从多方面研究目前基于标签传播的社区挖掘算法的优劣,并且详细分析基于标签传播算法在以后研究中的改进思路。  相似文献   

2.
标签传播算法是一种被广泛应用的社区发现算法,该算法为网络中的每个节点分配一个初始标签,然后通过传播标签来发现复杂网络中的潜在社区,具有时间复杂度低的特点。当前基于标签传播的重叠社区发现算法存在忽略节点重要性差异、需要人为设置参数等不足。针对该类算法在重叠社区发现方面的缺陷,提出一种基于多标签传播的重叠社区发现优化算法。该算法使用K-核分解方法找出若干个社区核心节点,以这些节点为种子节点,逐层向外传播标签;在进行标签选择的时候以邻居节点标签的种类来决定重叠节点的标签个数。实验表明,该算法明显改善了社区发现的性能,提高了划分结果的稳定性和准确性。  相似文献   

3.
重叠社区结构挖掘旨在发现复杂网络中多个独立社区之间的重叠部分,其在社交、交通、舆情乃至反恐等领域具有广泛的应用。然而,目前基于标签传播的重叠社区挖掘算法在社区结构模糊的网络中表现出较强的随机性,导致准确度不高。针对重叠社区模糊边界导致的不确定性和低准确度问题,提出一种融合特征向量中心性与标签熵的标签传播算法ECLE-LPA。ECLE-LPA通过融合节点的K-核迭代因子与特征向量中心性来计算节点影响力并初始化节点标签,在标签传播过程中,通过节点标签熵和节点间亲密度更新节点标签列表及其标签隶属度,从而较好地克服了社区模糊边界的识别问题。实验结果表明:在Les Miserables、Polbooks、Football、Polblogs和Netscience等真实网络中,ECLE-LPA划分结果的EQ值普遍比对比算法提高了1%~3%;在社区结构模糊的人工网络中,ECLE-LPA划分结果的NMI值比其他标签传播算法提高了10%以上。  相似文献   

4.
邓琨  李文平  陈丽  刘星妍 《控制与决策》2020,35(11):2733-2742
针对现有基于标签传播的复杂网络重叠社区识别方法所存在的社区识别精度不稳定,以及随机性较强等缺陷,提出一种新的基于标签传播的复杂网络重叠社区识别算法NOCDLP(a novel algorithm for overlapping community detection based on label propagation).该算法首先搜索网络中若干以度较高节点为中心的完全子图,并以这些完全子图为起点进行标签传播;其次通过分析节点与社区连接强度以及社区接纳某节点后的社区内部连接紧密度情况给出节点归属社区强度函数,以此作为标签传播的依据提高社区的识别精度;再次,在标签传播过程中,NOCDLP算法设置标签传播控制标记,以避免标签传播算法随机性较强的缺陷;最后,在已形成的社区中通过整理重叠节点获得更准确的重叠社区结构.算法在人工网络与真实网络中完成测试,同时与多个经典算法进行对比分析,实验结果验证了NOCDLP算法是有效的、可行的.  相似文献   

5.
高维数据的聚类特性通常难以直接观测. 将其构建为复杂网络, 节点间的拓扑结构可以反映样本之间的关系. 对网络中的节点进行社区发现, 可实现对数据更直观的聚类. 提出一种基于网络社区发现的低随机性标签传播聚类算法. 首先, 用半径和最近邻方法将数据集构建为稀疏的全连通网络. 之后, 根据节点相似度进行节点标签预处理, 使得相似的节点具有相同的标签. 用节点的影响力值改进标签传播过程, 降低标签选择的随机性. 最后, 基于内聚度进行社区的优化合并, 提高社区的质量. 在真实数据集和人工数据集上的实验结果表明, 该算法对各种类型的数据都具有较好的适应性.  相似文献   

6.
基于标签传播的社区发现算法(LPA)以其简单高效得到了广泛的研究,然而当社区结构模糊时,LPA得到的是一个单一的社区,这是无意义的.模块化标签传播算法(LPAm)则倾向于将网络划分为度数相近的社区且存在解极限问题.为此提出基于模块密度的标签传播(LPAd)算法,该算法通过对模块密度优化进行标签标记和传播,以避免过大社区的形成,且生成的社区满足Radicchi等人提出的弱社区定义.多个真实数据集和人工网络数据的实验结果表明,本文算法在不改变算法复杂度的情况下提高了所发现社区的质量,与现有的若干基于标签传播的社区发现算法相比,取得了改进的效果.  相似文献   

7.
郑文萍  岳香豆  杨贵 《计算机应用》2020,40(12):3423-3429
社区发现是挖掘社交网络隐藏信息的一个有用的工具,而标签传播算法(LPA)是社区发现算法中的一种常见算法,不需要任何的先验知识,且运行速度快。针对标签传播算法有很强的随机性而导致的社区发现算法结果不稳定的问题,提出了一种基于随机游走的改进标签传播算法(LPARW)。首先,根据在网络上进行随机游走确定了节点重要性的排序,从而得到节点的更新顺序;然后,遍历节点的更新序列,对每个节点将其与排序在其之前的节点进行相似性计算,若该节点与排序在其之前的节点是邻居节点且它们之间的相似性大于阈值,则将排序在其之前的节点选为种子节点;最后,将种子节点的标签传播给其余的节点,得到社区的最终划分结果。将所提算法与一些经典的标签传播算法在4个有标签的网络和5个无标签的真实网络上进行比较分析,实验结果表明所提算法在标准互信息(NMI)、调整兰德系数(ARI)和模块度等经典的评价指标上的性能均优于其余对比算法,可见该算法具有很好的社区划分效果。  相似文献   

8.
郑文萍  岳香豆  杨贵 《计算机应用》2005,40(12):3423-3429
社区发现是挖掘社交网络隐藏信息的一个有用的工具,而标签传播算法(LPA)是社区发现算法中的一种常见算法,不需要任何的先验知识,且运行速度快。针对标签传播算法有很强的随机性而导致的社区发现算法结果不稳定的问题,提出了一种基于随机游走的改进标签传播算法(LPARW)。首先,根据在网络上进行随机游走确定了节点重要性的排序,从而得到节点的更新顺序;然后,遍历节点的更新序列,对每个节点将其与排序在其之前的节点进行相似性计算,若该节点与排序在其之前的节点是邻居节点且它们之间的相似性大于阈值,则将排序在其之前的节点选为种子节点;最后,将种子节点的标签传播给其余的节点,得到社区的最终划分结果。将所提算法与一些经典的标签传播算法在4个有标签的网络和5个无标签的真实网络上进行比较分析,实验结果表明所提算法在标准互信息(NMI)、调整兰德系数(ARI)和模块度等经典的评价指标上的性能均优于其余对比算法,可见该算法具有很好的社区划分效果。  相似文献   

9.
陈晶  刘江川  魏娜娜 《计算机应用》2022,42(4):1162-1169
针对标签传播算法稳定性不足、准确性较差的问题,提出了融合K-shell和标签熵的标签传播重叠社区发现算法OCKELP。首先,采用K-shell算法减少了标签初始化时间,并利用标签熵的更新序列提高了算法的稳定性;其次,引入综合影响力进行标签选择,并将社区层次信息和节点局部信息融合提高了算法的准确性。在真实网络数据集上,OCKELP相较于重叠社区发现算法(COPRA)、基于多核心标签传播的重叠社区识别方法(OMKLP)、SLPA的模块度最大提升分别约68.64%、53.99%、42.29%,在人工网络数据集的归一化互信息(NMI)值上,OCKELP相较于其他三种算法也有着明显优势,且随着重叠节点隶属社区数量的增加可以挖掘出社区的真实结构。  相似文献   

10.
针对基于标签传播的复杂网络重叠社区发现算法中预先输入参数在真实网络中的局限性以及标签冗余等问题,提出一种基于标签传播的面向大规模学术社交网络的社区发现模型。该模型通过寻找网络中互不相交的最大极大团(UMC)并对每个UMC中的节点赋予唯一标签来减少冗余标签,提高社区发现的效率以及稳定性。标签更新时以UMC作为核心单位采用亲密度的方式由中心向四周更新UMC邻接节点的标签及权重,以权重最大值的方式更新网络中非UMC邻接节点的权重。后期处理阶段采用自适应阈值方式去除节点标签中的噪声,有效克服了预先输入重叠社区个数在真实网络中的局限性。通过在学术社交网络平台——学者网数据集上的实验表明,该模型能够将具有一定共性的节点划分到同一个社区中,并为学术社交网络平台进一步的好友推荐、论文分享等精确的个性化服务提供了支持。  相似文献   

11.
社区发现能够揭示真实社会网络的拓扑结构和重要节点.由于具有线性时间复杂度,无需定义目标函数及目标参数,标签传播算法(LPA)作为经典社区发现算法被广泛应用在学术和实践领域.针对LPA算法更新顺序的无序性和标签选择的随机性,提出基于节点影响力的理性节点标签传播算法(RLPBNI).将节点影响力排序作为更新顺序,引入理性节...  相似文献   

12.
传统社区挖掘算法根据静态的网络拓扑结构进行分析,忽视了个体能动性对网络的影响。针对社会网络中的特殊节点进行研究,引入社区种子和联系者的概念,从个体主义和结构主义两个方面分析社会网络的形成与演化机制,提出了一种基于角色划分的动态社区挖掘算法。在人工网络和真实世界网络上进行了多次测试,并与G-N、快速G-N、Polish等算法进行了比较,结果表明,该算法明显优于G-N算法,且其挖掘到的社区都是强连通社区,具有较好的适应性和可扩展性。  相似文献   

13.
针对基于社区划分的潜在好友推荐算法FRCD运行速度慢的问题,提出了一种基于社区划分的多线程潜在好友推荐算法MTFRCD。该算法在网络拓扑图上利用多线程技术寻找核心关系子网,以核心关系子网作为标签种子节点,使用多线程并发传播标签来发现网络拓扑图上的社区结构,利用社区发现结果在社区内部推荐潜在好友。人工网络的实验结果表明,MTFRCD相比于传统的FRCD,在性能近似的前提下具有明显的速度增长。因此,将该算法应用于真实社交网络(学者网)平台的潜在好友挖掘和推荐,根据推荐结果的评测,验证了算法具有良好的推荐效果。  相似文献   

14.
基于标签传播的社区发现算法因其时间效率高而得到广泛关注。针对该算法因标签传播的随机性导致其社区划分准确度难以保证的问题,提出一种基于随机游走的改进算法。首先,引入随机游走思想,计算得到一种衡量网络节点间相似度的矩阵;其次,在标签传播过程中,当邻居节点中标签出现频率存在多个最高时,不是随机选择一个,而是选择相似度最高的邻居节点所拥有的标签来更新,避免了标签在社区之间的任意传播;最后,用不同的真实网络进行测试,结果表明在社区发现中该算法比原始标签传播算法取得更好的表现。  相似文献   

15.
多标签传播算法具有接近线性的时间复杂度,但用于重叠社区发现时存在精度低、稳定性差的问题。文中基于重叠节点更可能出现在社区边缘的思想,提出基于节点层级与标签传播增益的重叠社区发现算法。该算法首先利用改进的基于节点中心度与社区分布约束的单标签传播方法发现非重叠社区,并在标签传播过程中利用局部信息同步计算节点中心度。然后根据节点中心度定义节点层级函数,标记节点在所属社区中的层级。最后基于节点间的标签传播增益,利用新的多标签更新规则,获得重叠社区结构。实验表明该算法能有效提高精度和稳定性。  相似文献   

16.
在大规模数据量分析研究中,复杂网络的社区发现已成为国内外众多学者的研究热点.深入研究社区发现算法有助于揭示网络不同层次结构及功能,挖掘出具有现实意义的社区结构.本文综述了较为经典的社区发现算法以及有关于社区质量评价的方法,阐述了基于标签传播的社区发现算法优劣性以及国内外研究人员的思路与改进.  相似文献   

17.
在真实的社交网络结构中常常存在着社区相互重叠的现象,发现社交网络中的重叠社区有利于研究网络特性,反映网络中的真实情况。针对多标签传播重叠社区发现算法COPRA存在的随机性,导致社区发现结果稳定性差等问题,提出一种结合节点重要性的标签传播算法。该算法首先采用LeaderRank计算出网络中各个节点的重要性,选择重要性高的节点进行团扩展作为标签初始阶段的预处理,采用合理的标签更新顺序以防止抵消预处理阶段的工作,后期引入贡献度来弱化标签选择阶段的随机性,在基准网络和真实网络上的实验结果表明本文算法提高了社区发现结果的质量。  相似文献   

18.
社区结构可以为网络的其他分析挖掘提供中观尺度的分析视角,在大规模复杂网络的各项研究中是一项非常重要而基础的工作。社区的重叠是真实世界网络中常见的一种现象,重叠社区结构可以更准确地描述网络中真实的结构信息,因此,复杂网络重叠社区发现具有更加突出的现实意义。在综合对比分析了当前主要的重叠社区发现算法的基础上,结合信息论的相关知识,给出了一种基于信息论的社区定义,并进一步借鉴信息传播理论,从单个节点对关于某种主题的信息的掌握程度的角度出发提出了一种复杂网络重叠社区结构发现算法。基于实际数据集的相关实验表明,与传统的社区定义和社区发现算法相比,本算法发现的重叠社区从内容角度来看具有更加明确的实际意义,并且具有较低的时间复杂度。  相似文献   

19.
社区发现是复杂网络分析领域的重要研究内容。针对标签传播算法中标签传播的随机性问题,提出一种基于局部回路的标签传播改进算法,即当节点邻居中标签出现频率存在多个最高时,不是随机选择一个邻居的标签作为该节点的标签,而是选择与该节点构成最短局部回路的邻居标签作为该节点标签,避免了标签在社区之间的任意传播。最后,用真实网络进行测试,结果表明,与传统的标签算法相比,提出的改进算法使社区划分结果得到了提高。  相似文献   

20.
盛俊  李斌  陈崚 《计算机应用》2020,40(9):2606-2612
针对基于网络信息的商品推荐的问题,提出了在二部网络上基于社区挖掘和标签传递的推荐算法。首先,用带权的二部图来表达用户-项目的评分矩阵,利用标签传递技术对二部网络进行社区挖掘;然后,基于二部网络中的社区结构信息,充分利用用户所在的社区之间的相似性以及项目之间、用户之间的相似性来挖掘用户可能感兴趣的项目;最后,向用户进行项目的推荐。在实际网络上的实验结果表明,与基于双向关联规则项目评分预测的推荐算法(BAR-CF)、基于项目评分预测的推荐算法(IR-CF)、基于网络链接预测的用户偏好预测方法(PLP)和改进的基于用户的协同过滤的方法(MU-CF)相比,该算法的平均绝对差(MAE)低0.1~0.3,准确率高0.2。因此,所提算法可以取得比其他类似方法更高质量的推荐结果。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司    京ICP备09084417号-23

京公网安备 11010802026262号