首页 | 官方网站   微博 | 高级检索  
相似文献
 共查询到17条相似文献,搜索用时 153 毫秒
1.
社区发现是一个基础性的且被广泛研究的问题。现有的社区发现方法大多聚焦于网络拓扑结构,然而随着真实网络中实体可用属性的激增,捕获图中结构和属性的丰富交互关系来进行社区发现变得尤为必要。据此面向属性图提出了一种基于染色随机游走的可重叠社区发现算法OCDC,该算法解决了传统的基于随机游走的社区发现算法利用结构转移矩阵造成社区发现效果不佳的问题。具体地,首先利用经典的初始种子策略选出网络中差异度较大的节点,在此基础上设计种子替换策略,挖掘网络中质量更佳的种子替换路径集合对初始种子集合进行替换;其次构建结构-属性交互节点转移矩阵并执行染色随机游走过程得到高质量种子节点的染色分布向量;最后基于融合结构和属性的并行电导值对社区进行扩展。在人工网络和现实网络上的实验表明,本文提出的算法能够准确地识别属性社区并显著优于基准算法。  相似文献   

2.
在图结构数据上开展推理计算是一项重大的任务,该任务的主要挑战是如何表示图结构知识使机器可以快速理解并利用图数据。对比现有表示学习模型发现,基于随机游走方法的表示学习模型容易忽略属性对节点关联关系的特殊作用,因此提出一种基于节点邻接关系与属性关联关系的混合随机游走方法。首先通过邻接节点间的共同属性分布计算属性权重,并获取节点到每个属性的采样概率;然后分别从邻接节点与含有共有属性的非邻接节点中提取网络信息;最后构建基于节点-属性二部图的网络表示学习模型,并通过上述采样序列学习得到节点向量表达。在Flickr、BlogCatalog、Cora公开数据集上,用所提模型得到的节点向量表达进行节点分类的Micro-F1平均准确率为89.38%,比GraphRNA(Graph Recurrent Networks with Attributed random walks)高出了2.02个百分点,比经典工作DeepWalk高出了21.12个百分点;同时,对比不同随机游走方法发现,提高对节点关联有促进作用的属性的采样概率可以增加采样序列所含信息。  相似文献   

3.
SMART:一种面向电商平台快速消费品的图推荐算法   总被引:1,自引:0,他引:1  
卿勇  刘梦娟  银盈  李杨曦 《计算机科学》2017,44(Z11):464-469
提出一种针对电商平台快速消费品的图推荐算法SMART。该算法在传统二部图推荐算法的基础上增加商品种类节点及其与用户和商品两类节点的关联边,且利用每个用户对商品种类和单个商品的兴趣倾向设置无向边的权重,通过节点间转移概率的差异实现有倾向性的随机游走;经过多次迭代,用户节点到所有节点的游走概率会收敛到稳定值,收敛后的游走概率能够在一定程度上体现用户对商品的购买概率;最后考虑每个用户对商品所属商家的兴趣偏好,对用户节点到各商品节点的游走概率进行调整,并根据调整后的游走概率计算每个用户的TOP-N推荐列表。在京东生鲜类商品的评论数据集上对所提出的推荐算法进行性能评价,实验结果表明该算法的确能够提供高质量的推荐,与基本二部图推荐算法相比,准确率提高了1.32%,召回率提高了1.48%。  相似文献   

4.
链接预测旨在推荐网络中潜在的链接,是理解和研究社会网络特征的重要一步。随着社会网络的发展,许多网络中包含了大量的节点属性信息。研究集中在结合网络结构和节点属性信息来进行链接预测。网络中的两个节点既可能因为结构上相邻形成新链接,也可能因为属性相似产生联系,基于此假设提出了一种新的融合网络结构和节点属性的随机游走模型用于链接预测。首先建立了两个不同的网络图以及转移概率矩阵用于新的迭代规则,而后再简化该模型用于计算并提出了一种近似的快速算法。在两个标准数据集上进行的实验表明该方法较同类方法有明显的效果提升,同时进一步分析了随机游走粒子在两个网络图中游走的概率对预测结果的影响,分析结果显示节点属性可有效提高模型的预测能力。  相似文献   

5.
社区搜索旨在信息网络中寻找与用户指定的查询节点高度相关的稠密连通子图,是社会网络分析的重要研究内容。现有的社区搜索方法大多是针对同质网络,但现实中的信息网络通常是包含多种节点类型和多种关系类型的属性异质网络。提出了异质网络中基于元路径P和元结构S的P-距离和S-距离及(k,d,P)-truss和(k,d,S)-truss社区模型以度量子图的结构内聚性,同时提出了关键词属性得分函数用于度量不同子图的关键词属性相关性,最后提出了搜索具有最高关键词属性得分的(k,d,P)-truss和(k,d,S)-truss的社区搜索算法。搜索算法能够找到同时具有结构内聚性和关键词属性相关性的个性化社区,并且支持限制查询节点与社区内任意节点的最大距离d来控制社区搜索的范围。在真实数据集上与相关的社区搜索算法进行了实验对比,结果证明了所提算法的有效性和可行性。  相似文献   

6.
现实生活中的网络通常存在社区结构,社区查询是图数据挖掘的基本任务.现有研究工作提出了多种模型来识别网络中的社区,如基于k-核的模型和基于k-truss的模型.然而,这些模型通常只限制社区内节点或边的邻居数量,忽略了邻居之间的关系,即节点的邻域结构,从而导致社区内节点的局部稠密性较低.针对这一问题,本文将节点的邻域结构信息融入k-核稠密子图中,提出一种新的基于邻域连通k-核的社区模型,并定义了社区的稠密度.基于这一新模型,研究了最稠密单社区搜索问题,即返回包含查询节点集且具有最高稠密度的社区.在现实生活图数据中,一组查询节点可能会分布在多个不相交的社区中.为此,本文进一步研究了基于稠密度阈值的多社区搜索问题,即返回包含查询节点集的多个社区,且每个社区的稠密度不低于用户指定的阈值.针对最稠密单社区搜索和基于稠密度阈值的多社区搜索问题,首先定义了边稠密度的概念,并提出了基于边稠密度的基线算法.为了提高搜索效率,设计了索引树和改进索引树结构,能够支持在多项式时间内返回查询结果.通过与基线算法在多组数据集上的对比,验证了基于邻域连通k-核的社区模型的有效性和所提出查询算法的效率.  相似文献   

7.
针对移动社交网络的动态性、用户不同重要性和信息交互有向性,基于4种初始网络提出能准确描述移动社交网络结构的拓扑模型。采用随机游走理论和改进的PageRank算法,引入过渡概率使每两时步之间的网络拓扑结构相互联系。通过PageRank算法得到节点的势,进而求出概率过渡矩阵,利用随机游走理论由上一时步边存在概率矩阵和概率过渡矩阵得到当前时步边存在概率矩阵,每一时步动态地增加一个节点并检验是否有离开的节点。仿真结果显示,该模型在4种初始网络下得到的网络拓扑结构,入度、出度、势分布以及度-势相关性均具有明显幂律特性,表明随机游走理论和改进的PageRank算法能较准确描述移动社交网络,具有一定的实践意义。  相似文献   

8.
推荐是促进诸如社交网络等应用活跃度的重要模式,但 庞大 的节点规模以及复杂的节点间关系给社交网络的推荐问题带来了挑战。随机游走是一种能够有效解决这类推荐问题的策略,但传统的随机游走算法没有充分考虑相邻节点间影响力的差异。提出一种基于FP-Growth的图上随机游走推荐方法,其基于社交网络的图结构,引入FP-Growth算法来挖掘相邻节点之间的频繁度,在此基础上构造转移概率矩阵来进行随机游走计算,最后得到好友重要程度排名并做出推荐。该方法既保留了随机游走方法能有效缓解数据稀疏性等特性,又权衡了不同节点连接关系的差异性。实验结果表明,提出的方法比传统随机游走算法的推荐性能更佳。  相似文献   

9.
协同过滤是推荐系统中应用最为广泛的方法.提出一类基于二部图一维投影与排序相结合的协同过滤算法,文中采用结构相似进行二部图投影并利用随机游走对节点排序.该方法不仅可以防止冷启动,具有较高准确度,且可扩展性良好.另外,该算法可以避免低覆盖率造成的推荐不准确.算法可以有两类不同的实现,分别是基于项协同过滤的项排序算法和基于用户协同过滤的用户排序算法,在标准数据集MovieLens上的测试表明了算法的有效性.  相似文献   

10.
链路预测是数据挖掘主题中的一个重要问题。基于随机游走的相似性方法一般设定游走粒子转移到相邻节点的概率是相等的,忽略了节点度值对转移概率的影响。针对此问题,提出一种基于lowest-degree偏置重启随机游走的链路预测方法。首先引入最低度偏置函数,对游走粒子的转移概率进行重新定义,然后将最低度偏置随机游走策略运用到重启随机游走中,探究粒子在游走过程中最低度偏向策略对节点相似度的影响。在九个真实网络数据集上进行链路预测,结果表明,所提方法具有良好的预测精度,且挖掘了更多网络拓扑结构信息,证明该算法在节点相似性的评估上具有一定的优势。  相似文献   

11.
结构-属性平衡图节点相似度测量算法   总被引:1,自引:0,他引:1       下载免费PDF全文
摘  要:节点相似度是图聚类算法的重要基础,在基于结构-属性图聚类现有方法中,由于传统图模型的限制,需要多次矩阵相乘来调整属性边的权值,算法执行效率低。为解决这一问题,提出了结构-属性平衡图的概念,并采用随机游走模型策略统一度量结构-属性平衡图GB中顶点间的相似度。与现有方法相比,该方法不但能测量直接相连的顶点之间的相似度,还可测量不直接相连而存在不同长度的路径的顶点之间的相似度,且没有增加原相似度矩阵的规模,节省了大量存储空间,提高了算法执行效率。  相似文献   

12.
信息检索的效果很大程度上取决于用户能否输入恰当的查询来描述自身信息需求。很多查询通常简短而模糊,甚至包含噪音。查询推荐技术可以帮助用户提炼查询、准确描述信息需求。为了获得高质量的查询推荐,在大规模“查询-链接”二部图上采用随机漫步方法产生候选集合。利用摘要点击信息对候选列表进行重排序,使得体现用户意图的查询排在比较高的位置。最终采用基于学习的算法对推荐查询中可能存在的噪声进行过滤。基于真实用户行为数据的实验表明该方法取得了较好的效果。  相似文献   

13.
使用图表示RDF数据可以保持数据间的关联信息和语义信息,越来越多的关键词查询方法基于图结构实现RDF数据的查询处理。将二分图与RDF数据图相结合,定义RDF二分图模型,并提出一种基于二分图的RDF关键词扩展查询方法KERBG。该方法将文本信息封装在二分图顶点标签上,以支持对关系的查询;利用关键词同义词扩展技术对查询关键词进行语义扩展,有效解决同一对象的描述用词的多样性问题,进而提高查准率;利用RDF二分图的反对称邻接矩阵及其幂矩阵构造包含关键顶点的查询结果子图,实现关键词查询处理,并降低查询响应时间。实验结果表明,在查准率和查询响应时间方面,提出的KERBG方法优于当前主流方法。  相似文献   

14.
Community detection methods based on random walks are widely adopted in various network analysis tasks. It could capture structures and attributed information while alleviating the issues of noises. Though random walks on plain networks have been studied before, in real-world networks, nodes are often not pure vertices, but own different characteristics, described by the rich set of data associated with them. These node attributes contain plentiful information that often complements the network, and bring opportunities to the random-walk-based analysis. However, node attributes make the node interactions more complicated and are heterogeneous with respect to topological structures. Accordingly, attributed community detection based on random walk is challenging as it requires joint modelling of graph structures and node attributes. To bridge this gap, we propose a Community detection with Attributed random walk via Seed replacement (CAS). Our model is able to conquer the limitation of directly utilize the original network topology and ignore the attribute information. In particular, the algorithm consists of four stages to better identify communities. (1) Select initial seed nodes in the network; (2) Capture the better-quality seed replacement path set; (3) Generate the structure-attribute interaction transition matrix and perform the colored random walk; (4) Utilize the parallel conductance to expand the communities. Experiments on synthetic and real-world networks demonstrate the effectiveness of CAS.  相似文献   

15.
时序动态网络在静态网络基础上综合了时间属性的概念,包含了网络结构的复杂性、动态性等内涵,是研究复杂网络链路预测问题的较优思维对象,因在现实世界中具有较高应用价值而备受关注。目前大部分传统方法研究对象仍局限于静态网络,存在对网络时域演化信息利用不充分、时间复杂度较高等问题。结合社会学理论,提出一种基于社团多特征融合嵌入表示的时序链路预测方法,该方法的核心思想是通过分析网络动态演化特性,在社团范围内学习节点的嵌入表示向量,融合多特征以衡量节点间连边的生成概率。利用网络集体影响力的方法对节点和连边的权值进行计算,基于集体影响的连边权值进行社团划分,将网络划分为若干个社团子图,得到基于集体影响的相似性指标。在社团范围内,利用有偏的随机游走,结合梯度优化的Skip-gram方法获取所有节点的嵌入表示向量,得到基于社团范围游走的相似性指标。融合节点的集体影响、社团范围节点的多个中心性特征和学习到的节点表示向量,得到多特征融合的相似性指标,3 种新指标都可以用于衡量节点之间形成连边的概率。对比基于移动平均、嵌入表示、图神经网络等经典时序链路预测方法,在 6 个真实数据集上的实验结果表明,所提基于社团多特征融合的方法在 AUC评价标准下取得更优的预测性能。  相似文献   

16.
现有的网络表示学习算法主要是针对同质网络或异质网络设计的,而忽略了在推荐系统、搜索引擎和问答系统等领域出现的二分网络的特殊特征以及这类网络所携带着的非常丰富的属性信息。为了解决上述问题,提出了一种结合属性信息的二分网络表示学习方法(ABNE)。该方法首先将连边分解成邻居节点间的间接关系集,嵌入显式关系,接着通过余弦相似性引入并定义节点的属性相似度矩阵,并将其作为权重矩阵的一部分指导有偏随机游走,从而嵌入隐式关系和属性信息。最后通过一个联合优化框架得到同时携带网络结构信息和属性信息的节点表示向量。在四个真实公开数据集上进行了推荐任务,并与其他现有方法进行比较,实验结果表明该算法的优越性和合理性。  相似文献   

17.
When searching for a marked vertex in a graph, Szegedy’s usual search operator is defined by using the transition probability matrix of the random walk with absorbing barriers at the marked vertices. Instead of using this operator, we analyze searching with Szegedy’s quantum walk by using reflections around the marked vertices, that is, the standard form of quantum query. We show we can boost the probability to 1 of finding a marked vertex in the complete graph. Numerical simulations suggest that the success probability can be improved for other graphs, like the two-dimensional grid. We also prove that, for a certain class of graphs, we can express Szegedy’s search operator, obtained from the absorbing walk, using the standard query model.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司    京ICP备09084417号-23

京公网安备 11010802026262号