首页 | 官方网站   微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 15 毫秒
1.
为快速准确地找到复杂网络的社团划分结果,引入相似度指标,提出一种改进的社团划分算法。将网络节点拓扑结构信息作为节点的多维属性,在不改变网络连边的情况下,使输入网络转换为节点多属性网络,并定义节点之间的混合相似度与社团相似度,运用层次聚类思想得到最终的社团划分结果。在真实网络、计算机生成网络上的实验结果表明,该算法能够发现明显的社团结构,并且具有较高的社团划分准确率。  相似文献   

2.
图聚集技术是将一个大规模图用简洁的小规模图来表示,同时保留原始图的结构和属性信息的技术。现有算法未同时考虑节点的属性信息与边的权重信息,导致图聚集后与原始图存在较大差异。因此,提出一种同时考虑节点属性信息与边权重信息的图聚集算法,使得聚集图既保留了节点属性相似度又保留了边权重信息。该算法首先定义了闭邻域结构相似度,通过一种剪枝策略来计算节点之间的结构相似度;其次使用最小哈希(MinHash)技术计算节点之间的属性相似度,并调节结构相似与属性相似所占的比例;最后,根据2方面相似度的大小对加权图进行聚集。实验表明了该算法可行且有效。  相似文献   

3.
属性图用属性向量描述节点,用边描述节点间的关系。为了把节点划分为具有紧密联系的社团,一种有效的方法是对属性图进行聚类。聚类方法有不同的标准,如节点连接度和属性相似度。虽然社团一般是围绕紧密的连边和相似的属性值的节点形成,但是目前的方法都只关注了这两种数据形式中的一种。通过给每个节点赋予一个自治域,提出一个准确且可延展的多节点系统用于提取属性图中的重叠社团。首先,引入带有可调带宽因子的核函数用于测度每个节点的影响力,具有最高局部影响力的节点可以被看作领导节点。其次,提出一种新颖的局部扩展策略,使每一个领导节点能够吸收属性图中相关性最强的跟随者。接着,设计了多节点社团意识系统,该系统为节点之间的充分沟通提供了必要的条件,从而能够得出最优的重叠社团结构。社团中的节点不仅互相联系紧密,而且也有相似的属性。该算法的计算复杂度在特定带宽条件下近似于连边数目的线性函数。最后,基于标准属性图和真实属性图的实验验证了该系统的有效性和高效性。  相似文献   

4.
图概要技术是管理、分析和可视化大规模图的关键技术之一。如何综合结构和属性信息进行图概要是一个挑战。大部分现有的图概要方法或者只考虑结构或属性某一方面的信息,或者要求属性的表现形式是一致的。结合信息论中最小描述长度原则,对属性图概要问题建模,将其转化为求解最小表示代价问题,以实现图压缩和图概要的双重目标。提出了一种计算节点属性相似性的方法,该属性度量方法对节点属性的限制较小,并且将节点间的相似性统一为存储代价,实现了节点结构相似和属性相似的协同考虑。提出了两种求解最小代价表示的图概要算法。在真实和合成的数据集上实验,验证了提出算法的有效性。  相似文献   

5.
属性图各节点附有的节点属性标签,为节点提供了更加丰富的信息,在数据挖掘应用,特别是数据聚类问题中如何有效利用这些丰富的信息,已经成为开展此类研究的研究目的.不同于传统图聚类,属性图上的聚类要同时考虑图的结构信息和节点的属性信息,因此如何平衡两者之间的关系,这是属性图聚类主要关注所在.目前已提出的属性图聚类算法,部分算法的效率很高,然而聚类质量较差,同时一些算法可以得到较好的聚类结构,然而算法消耗大量的系统资源,效率也较低.这些算法均没有考虑簇之间存在重叠的情况,这导致无法得到更高精度的聚类结构.因而提出一种属性图上的重叠聚类挖掘算法,实验表明,提出的算法可以得到更高的聚类精度,特别是可以提升聚类内部节点的属性相似度.  相似文献   

6.
当前层次划分社团算法难以选取合适的初始节点,导致社团结构划分结果较差。为此,提出一种基于节点相异度的层次社团划分算法。给出度和接近度的评估标准,根据评估标准筛选网络的初始核心节点。为克服相异性指数在度量社团内节点相似度时的不足,引入节点的相异度评价准则,计算初始核心节点间的相似度,得到具有较高相似度的初始节点集。采用全局优化模块度的策略,从而实现对复杂网络的社团划分。应用于标准数据集的实验结果表明,与GN算法、FN算法相比,该算法划分效果更好,时间复杂度更低。  相似文献   

7.
基于节点相似度的网络社团检测算法研究   总被引:1,自引:0,他引:1  
社团结构是众多复杂网络的统计特性之一,挖掘网络中存在的社团结构日益受到人们的普遍关注。网络中的社团结构检测本质上类似于传统机器学习领域的聚类分析,其关键问题在于如何定义网络中节点间的相似度。首先提出了基于节点相似度的节点分裂算法SUN,相比传统的基于边界数(betweenness)的节点分裂算法GN, SGN在速度和精度上都有明显改善;接着,在利用各种节点相似度计算方法得到节点间的相似度之后,采用几种经典的聚类分析算法对网络进行社团划分,在模拟数据和真实数据上的实验表明:基于网络拓扑结构信息的signal和regular方法优于基于网络节点局部信息的Jaccard方法,而且对于复杂网络社团划分问题,如果选择好的网络节点相似度构造方法,已有的基于相似度矩阵的聚类分析算法都能快速有效地对网络社团进行划分。  相似文献   

8.
陆亿红  张振宁  杨雄 《计算机科学》2017,44(Z6):419-423
社团结构是复杂网络的一种很普遍且非常重要的拓扑特征,社团的发现有助于了解复杂网络的结构和功能。节点间相似度的评价指标对于社团发现的结果起着至关重要的作用,传统算法中使用的相似度指标存在着时间复杂度过高和不够精确的缺陷。为了弥补这两个缺陷,在信息传递理论的基础上将网络中的节点抽象成了多维数据集,结合传统聚类算法K-means提出了一种社团发现的新算法。基于Zachary Karate Club网络、Jazz Musician网络和Facebook网络的实验结果表明,该算法是高效且准确的。  相似文献   

9.
针对传统Slope One推荐算法在稀疏数据集上预测准确率较低的问题,提出一种基于图嵌入的加权Slope One算法。本文算法首先以融合时间信息的用户相似度为边权建立用户关联图,对该图进行图嵌入得到用户特征向量,然后基于Canopy聚类对用户进行类内加权Slope One推荐。另外,为优化算法性能,本文算法基于Spark计算框架实现。实验结果表明,对比传统的加权Slope One,本文算法在稀疏数据集和显式、隐式评分数据集上的推荐效果和评分预测准确率都更优。  相似文献   

10.
邹兆年  高宏  李建中  张硕 《软件学报》2010,21(5):1007-1019
探讨演变图(即随时间变化的图)的挖掘,重点研究在演变图中挖掘连接子图的演变模式集合.提出一种连接子图的相似度函数及其快速计算算法.基于该相似度函数,提出一种发现演变模式集合的多项式时间复杂度的动态规划算法.模拟数据集上的实验结果表明,该算法具有较低的误差率和较高的效率.真实数据集上的实验结果表明,挖掘结果在真实应用中具有实际意义.  相似文献   

11.
近些年来,网络中的重叠社区检测应用越来越广泛,这极大引起了人们的兴趣。通常重叠社区检测只考虑节点的拓扑结构信息,忽略了节点的属性信息,这可能会遗漏数据间的重要结构。本文提出了一种基于节点拓扑结构和属性相似度的局部社区检测算法。首先,计算出节点与社区之间属性相似度。其次,为挖掘内部紧耦合的社区,计算出能够表示耦合性的模块度增量。最后,通过融合多个已检测到局部社区,计算出隶属矩阵从而获取全局重叠社区结构。在三个有真实社区的数据集上的实验结果从内部指标模块度和与真实社区的比较验证了基于节点拓扑结构和属性相似度的重叠社区检测算法比目前基于节点结构的社区检测算法在效率和有效性上有所提升。  相似文献   

12.
图数据中Top-k属性差异q-clique查询   总被引:2,自引:0,他引:2  
孙焕良  卢智  刘俊岭  于戈 《计算机学报》2012,35(11):2265-2274
紧密子图发现在许多现实世界网络应用中具有重要的研究意义.提出一种新的紧密子图发现问题——Top-k属性差异q-clique查询,找出图中k个节点间属性具有最大差异的q-clique.属性差异q-clique是一种结合图的结构特征和节点属性的紧密子图,在作者合作关系图数据中,该查询可以发现属性(如研究领域或所属单位)上不同的具有紧密合作关系的团队.给出了q-clique的属性差异度量,证明了该问题为NP难问题.采用分支限界策略,提出一种有效求解问题的算法AD-Qclique,同时依照best-first排序思想优化节点访问次序进一步提高算法性能.ACM作者信息数据集上的实验表明,算法AD-Qclique效率远优于基本算法BSL,并且结果中作者皆具有较高的H-index值及广泛的研究领域.  相似文献   

13.
属性图中的社区搜索是一种局部社区发现方法,本质是基于用户提供的查询节点返回包含查询节点且在结构内聚的同时属性与查询属性相似的个性化子图.该任务有助于用户更好地理解社区是如何形成的以及社区形成的原因.提出了一种融合结构-属性交互二部图随机游走机制,有效地支持属性图中的社区搜索.具体地,首先基于网络拓扑结构构建结构概率转移矩阵;其次探索结构与属性交互形成的二部图定义2阶段的节点-属性-节点概率转移矩阵,将其与结构概率转移矩阵有效融合得到属性图的概率转移矩阵;最后设计重启随机游走方法,基于融合结构和属性的并行电导值精准查询社区.在真实数据集和人工数据集上的实验表明了本文方法的有效性.  相似文献   

14.
寻找网络中连接紧密的、稳定的社区,对网络大数据的挖掘和分析具有重要的意义和价值.节点属性和网络拓扑对社区发现都有重要的影响,由于真实网络中的节点属性维度大,找寻重要属性困难,而且和深层次的结构信息又不易进行高效整合以进行社区划分.为了有效地提取节点的重要属性信息,并和局部链接拓扑信息深入融合,根据矩阵分解,提出了基于特征选择和属性网络嵌入的社区发现算法.首先采用节点的联合相似度潜在表征指导特征选择,筛选出重要的属性后与原拓扑组成新网络,然后将新网络通过融合邻居信息的属性网络表征学习映射成节点低维向量,最后对该嵌入向量进行聚类从而实现社区划分.在真实网络数据集上与其他代表性算法进行比较,实验结果表明所提算法具有良好的特征选择性能和社团划分性能.  相似文献   

15.
针对目前社团结构检测算法计算量大以及不稳定的问题,在经典的Newman快速与LPAm的基础上提出了一种基于局部信息的社团发现新算法。算法利用节点度和共享邻居数定义节点相似度,并结合两个预设参数,逐步优化社团结构。性能分析证明,该算法不仅具有线性阶时间复杂度,而且是一种稳定的算法。实验结果表明,该算法在准确度上优于Newman快速和LPAm,且可行与有效。  相似文献   

16.
社交网络中积累的海量信息构成一类图大数据,为防范隐私泄露,一般在发布此类数据时需要做匿名化处理.针对现有匿名方案难以防范同时以结构和属性信息为背景知识的攻击的不足,研究一种基于节点连接结构和属性值的属性图聚类匿名化方法,利用属性图表示社交网络数据,综合根据节点间的结构和属性相似度,将图中所有节点聚类成一些包含节点个数不小于k的超点,特别针对各超点进行匿名化处理.该方法中,超点的子图隐匿和属性概化可以分别防范一切基于结构和属性背景知识的识别攻击.另外,聚类过程平衡了节点间的连接紧密性和属性值相近性,有利于减小结构和属性的总体信息损失值,较好地维持数据的可用性.实验结果表明了该方法在实现算法功能和减少信息损失方面的有效性.  相似文献   

17.
复杂网络的一种快速局部社团划分算法   总被引:1,自引:0,他引:1  
解  汪小帆 《计算机仿真》2007,24(11):82-85,230
为了快速准确地寻找大规模复杂网络的社团结构,文中基于节点度优先的思想,提出了一种新的寻找复杂网络中的局部社团结构的启发式算法.该算法的基本思想是从待求节点出发,基于节点的度有选择性的进行广度优先搜索,从而得到该节点所在的局部社团结构.由于该算法仅需要利用到节点的局部信息,因此时间复杂度很低,达到了线性的时间复杂度.将该算法应用于社会学中经典的Zachary网络,获得了满意的结果.最后,还分析了如何对该算法加以改进以进一步提高准确度.  相似文献   

18.
属性网络社区发现是网络数据分析中的一项重要研究内容。为了提高社区发现的准确性,现有算法大多通过融合拓扑信息和属性信息对属性网络进行低维表示,然后基于低维特征进行社区发现。然而,这类算法通常基于深度模型进行表示学习,缺乏一定的可解释性。因此,文中提出了一种基于二部图表示的属性网络社区发现算法,以提高社区发现结果的准确性和可解释性。首先,分别基于属性网络的拓扑信息和属性信息计算网络中各个节点作为代表点的概率,通过两类信息融合选出一定比例的节点作为代表点;其次,基于拓扑结构和节点属性计算各个节点到代表点的距离,构建二部图;最后,基于二部图利用谱聚类算法进行社区发现,得到最终结果。在人造属性网络和真实属性网络上与已有的属性网络社区发现算法进行实验比较分析。实验结果表明,所提算法在标准化互信息、调整兰德指数等评价指标上均优于已有算法。  相似文献   

19.
邹兆年  高宏  李建中  张硕 《软件学报》2010,21(4):1007-1019
探讨演变图(即随时间变化的图)的挖掘,重点研究在演变图中挖掘连接子图的演变模式集合.提出一种连 接子图的相似度函数及其快速计算算法.基于该相似度函数,提出一种发现演变模式集合的多项式时间复杂度的动 态规划算法.模拟数据集上的实验结果表明,该算法具有较低的误差率和较高的效率.真实数据集上的实验结果表 明,挖掘结果在真实应用中具有实际意义.  相似文献   

20.
《微型机与应用》2017,(7):15-18
针对层次聚类算法存在复杂度高、准确度低等问题,提出了一种基于最大生成树的社团划分算法。该算法重新定义了节点间相似度,并利用最大生成树进行初始聚类,然后根据社团相似度合并局部社团得到最终划分结果。算法不仅降低了时间复杂度,而且在划分社团的准确度方面有所提高。将该方法在真实网络与人工网络上进行验证和比对,实验结果表明基于最大生成树的社团划分算法能够快速、准确地划分出网络中的社团结构。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司    京ICP备09084417号-23

京公网安备 11010802026262号