首页 | 官方网站   微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 234 毫秒
1.
蔡彪  李蕊岑  吴媛媛 《计算机应用》2021,41(9):2569-2577
链路预测的主要任务是设计一个能够更加准确地描述给定网络机制的预测算法,从而得到更准确的预测结果。在分析现有研究成果基础上发现,网络的相似性特征对采用的链路预测方法有较大的影响:在节点间标签相似性较低的网络中,提高标签的相似性可以提高预测的准确性;而在节点间标签相似性较高的网络中,则应更加关注结构信息对于链路预测的贡献来提高预测的准确性。随后,通过对标签进行加权处理,提出带权值的标签相似性算法,在低相似性网络中能够提高链路预测的准确性。同时,在较高相似性网络中,将网络的结构信息引入到节点的相似性计算中,并通过偏好链接机制来提升链路预测的准确性。在四个真实网络上的实验结果表明,所提算法相对于标签系统间的余弦相似性(CSTS)算法、偏好链接(PA)等算法取得了最高的准确率。根据网络相似性特征,采用所提出的对应算法进行链路预测能够得到更准确的预测结果。  相似文献   

2.
孟军  刁印 《计算机应用》2014,34(12):3433-3437
针对多源异构蛋白质相互作用网络信息量大、数据冗余导致预测结果不能充分反映数据分布信息的问题,将功能类别网络和蛋白质相互作用网络相结合,提出基于有向双关系图和多核融合的多标记学习算法。首先,构建基于含有损失函数的目标方程和最大期望算法的自适应模型;然后,利用图优化策略融合功能类别和蛋白质相互作用网络构成的多个关联矩阵;最后,将融合后的关联矩阵代入模型中预测蛋白质功能。在Yeast和Mouse的蛋白质多源异构数据上的实验结果表明,提出的方法具有预测准确率高、标签损失率低等优势。  相似文献   

3.
由于旅客-航班异构网络仅有高度稀疏的民航旅客同行记录,现有子图抽取方法难以从旅客-航班异构网络中获得旅客同行子图.对此提出基于旅客-航班异构网络的旅客同行子图抽取算法.将旅客-航班异构网络转换为旅客-旅客同构网络,通过随机游走方法得到旅客间的潜在同行关系,使用标签传播算法进行子图抽取.在国内某航空公司的旅客订票数据集上...  相似文献   

4.
在异构社会网络中,合著关系的预测是具有代表性的一类关系预测,与同构网络的链接预测方法在节点表示、网络构造等方面存在较大差异。综合考虑异构社会网络特有的元路径信息和节点属性特征,提出了节点的复合向量化表示:将节点的TF-IDF特征与基于Metapath2vec算法的向量化表示相结合;在元路径的表示上采取元路径中同类型节点归并重构的方法,以提取元路径中同类型节点间的隐含信息;并通过卷积神经网络(CNN)实现学术网络的合著关系预测。实验结果表明,节点的复合向量化表示及重构元路径方法可以更好地表征异构社会网络,与其他方法对比中均获得更好的预测评价指标。  相似文献   

5.
针对基于多标签传播重叠社团挖掘算法COPRA因随机更新策略带来的不稳定性以及需要预先输入参数的局限性等问题,提出一种基于LeaderRank和节点相似性的多标签传播重叠社团挖掘算法.该算法首先利用LeaderRank算法对网络中的节点进行重要性排序从而确定节点的更新顺序,减少标签不必要的更新.在标签传播过程中,根据节点相似性重新设计标签的更新策略,提高算法的稳定性.将算法应用于人工网络和真实网络中进行实验,实验结果表明该算法在挖掘重叠社团上具有较高的准确性和稳定性.  相似文献   

6.
现实世界中存在着大量包含多种类型的对象和联系的异构信息网络,从中挖掘信息获取知识已成为当前的研究热点之一.基于图正则化的半监督学习在近年来得到了广泛的研究,然而,现有的半监督学习算法大都只能应用于同构网络.基于同构节点和异构节点的一致性假设,提出了任意结构的异构信息网络上的半监督学习的正则化分类函数,并得到分类函数的闭式解,以此预测未标记节点的类别.提出了异构信息网络上的半监督学习的迭代框架,标记节点的信息可以在邻近的节点上迭代传播,直至达到稳定状态,并证明了迭代算法将收敛于正则化分类函数的闭式解.DBL P数据集上的实验表明该方法优于经典的半监督学习算法.  相似文献   

7.
针对传统推荐算法忽略用户社交影响、研究角度不全面和缺乏物理解释等问题,提出一个融合社交行为和标签行为的推荐算法。首先用引力模型计算社交网络中用户节点之间的吸引力来度量用户社交行为的相似性;其次通过标签信息构建用户喜好物体模型,并使用引力公式计算喜好物体之间的引力来度量标签行为的相似性。最后,引入变量融合两方面信息,获取近邻用户,产生推荐。采用Last.fm数据集进行实验研究,结果说明推荐算法的准确率和召回率更高。  相似文献   

8.
针对传统社区发现算法多数是基于单一关系的同构学术社会网络,而包含多种关系的异构学术网络社区发现算法还不多的情况,提出一种基于FCM(Fuzzy c-means)和结构洞的学术社区发现算法—HAFCD算法。从构建基于DBWorld邮件数据的异构学术网络出发,通过分析异构网络中的多种关联关系和节点内容的相似性,提出改进的语义路径模型,计算评审人间的相似度。基于此,该算法根据结构洞越少,网络闭合性越高这一事实,将结构洞理论融入FCM算法,进行异构学术社区发现。通过与现有的谱聚类和路径选择聚类算法进行实验比较表明,本算法具有较好的计算效果。  相似文献   

9.
针对传统离线哈希算法训练模型耗时、占用内存大和不易更新模型的问题,以及现实图像集的标签存在大量损失的现象,提出了一种能够平衡标签预测的在线哈希算法(BLPOH)。BLPOH通过标签预测模块生成预测标签,并融合残缺的真实标签,能够有效缓解因标签损失导致的模型性能下降。观察到标签存在分布不平衡现象,提出标签类别相似性平衡算法并应用于标签预测模块,提升标签预测的准确性。将旧数据的信息加入哈希函数的在线更新过程,提升模型对旧数据的兼容性。通过在两个广泛使用的数据集上进行实验,并和一些当前先进的算法进行对比,结果证实了BLPOH的优越性。  相似文献   

10.
标签传播算法(LPA)是一种高效地处理大规模网络的社区发现算法,由于其近乎线性的时间复杂度而受到广泛关注。然而,该算法每个节点的标签依赖于其邻居节点,其迭代速度和聚类有效性对标签信息的更新顺序非常敏感,影响了社区发现结果的准确性和稳定性。基于该问题,提出了一种基于加权聚类集成的标签传播算法。该算法利用多次标签传播算法的结果作为基聚类集,并用模块度评估每个基聚类的重要性,使其作为节点相似性度量的权值形成加权相似性矩阵,最后通过层次聚类得出最终的社区划分结果。在实验分析中,该算法和其他5个具有代表性的标签传播算法的改进算法在真实数据集上进行了比较,展示了新算法能有效地提高标签传播算法的社区发现精度。  相似文献   

11.
吕亚丽  苗钧重  胡玮昕 《计算机应用》2020,40(12):3430-3436
大多基于图的半监督学习方法,在样本间相似性度量时没有用到已有的和标签传播过程中得到的标签信息,同时,其度量方式相对固定,不能有效度量出分布结构复杂多样的数据样本间的相似性。针对上述问题,提出了基于标签进行度量学习的图半监督学习算法。首先,给定样本间相似性的度量方式,从而构建相似度矩阵。然后,基于相似度矩阵进行标签传播,筛选出k个低熵样本作为新确定的标签信息。最后,充分利用所有标签信息更新相似性度量方式,重复迭代优化直至学出所有标签信息。所提算法不仅利用标签信息改进了样本间相似性的度量方式,而且充分利用中间结果降低了半监督学习对标签数据的需求量。在6个真实数据集上的实验结果表明,该算法在超过95%的情况下相较三种传统的基于图的半监督学习算法取得了更高的分类准确率。  相似文献   

12.
吕亚丽  苗钧重  胡玮昕 《计算机应用》2005,40(12):3430-3436
大多基于图的半监督学习方法,在样本间相似性度量时没有用到已有的和标签传播过程中得到的标签信息,同时,其度量方式相对固定,不能有效度量出分布结构复杂多样的数据样本间的相似性。针对上述问题,提出了基于标签进行度量学习的图半监督学习算法。首先,给定样本间相似性的度量方式,从而构建相似度矩阵。然后,基于相似度矩阵进行标签传播,筛选出k个低熵样本作为新确定的标签信息。最后,充分利用所有标签信息更新相似性度量方式,重复迭代优化直至学出所有标签信息。所提算法不仅利用标签信息改进了样本间相似性的度量方式,而且充分利用中间结果降低了半监督学习对标签数据的需求量。在6个真实数据集上的实验结果表明,该算法在超过95%的情况下相较三种传统的基于图的半监督学习算法取得了更高的分类准确率。  相似文献   

13.
盛俊  李斌  陈崚 《计算机应用》2020,40(9):2606-2612
针对基于网络信息的商品推荐的问题,提出了在二部网络上基于社区挖掘和标签传递的推荐算法。首先,用带权的二部图来表达用户-项目的评分矩阵,利用标签传递技术对二部网络进行社区挖掘;然后,基于二部网络中的社区结构信息,充分利用用户所在的社区之间的相似性以及项目之间、用户之间的相似性来挖掘用户可能感兴趣的项目;最后,向用户进行项目的推荐。在实际网络上的实验结果表明,与基于双向关联规则项目评分预测的推荐算法(BAR-CF)、基于项目评分预测的推荐算法(IR-CF)、基于网络链接预测的用户偏好预测方法(PLP)和改进的基于用户的协同过滤的方法(MU-CF)相比,该算法的平均绝对差(MAE)低0.1~0.3,准确率高0.2。因此,所提算法可以取得比其他类似方法更高质量的推荐结果。  相似文献   

14.
盛俊  李斌  陈崚 《计算机应用》2005,40(9):2606-2612
针对基于网络信息的商品推荐的问题,提出了在二部网络上基于社区挖掘和标签传递的推荐算法。首先,用带权的二部图来表达用户-项目的评分矩阵,利用标签传递技术对二部网络进行社区挖掘;然后,基于二部网络中的社区结构信息,充分利用用户所在的社区之间的相似性以及项目之间、用户之间的相似性来挖掘用户可能感兴趣的项目;最后,向用户进行项目的推荐。在实际网络上的实验结果表明,与基于双向关联规则项目评分预测的推荐算法(BAR-CF)、基于项目评分预测的推荐算法(IR-CF)、基于网络链接预测的用户偏好预测方法(PLP)和改进的基于用户的协同过滤的方法(MU-CF)相比,该算法的平均绝对差(MAE)低0.1~0.3,准确率高0.2。因此,所提算法可以取得比其他类似方法更高质量的推荐结果。  相似文献   

15.
近年来,社会网络簇结构挖掘取得了长足的进展,广泛应用在社会网、生物网和万维网等领域中。针对当前研究社会网络簇结构挖掘的热点问题,重点研究基于局部信息的聚类算法,并进行分析总结;对标签传播算法(LPA)进行深入研究与分析,针对该算法中由于随机策略而导致网络划分并非最优的缺陷,引入节点属性相似度的概念,提出LPA-SNA算法;采用美国大学足球赛程网络、科学家合著网络作为数据集,分别实现LPA算法与LPA-SNA算法,并对它们的性能进行比较。实验结果表明LPA-SNA较之原始的LPA算法,提高了网络聚类的质量,优化了聚类效果,同时降低了算法的时间开销,提高了算法聚类速度。  相似文献   

16.
针对半监督聚类算法性能受到成对约束数量多寡的限制问题,现有的研究大都依赖于原始成对约束的数量。因此,首先提出了基于灰关联分析的成对约束初始化算法(initialization algorithm of pair constraints based on grey relational analysis,PCIG)。该算法通过均衡接近度计算数据对象间的相似度,并根据相似度的取值来确定可信区间,然后借鉴网络结构初始化方法来扩充数据对象间的成对关系。最后,将其应用于标签传播聚类算法。通过在五个基准数据集上进行实验,基于改进成对约束扩充的标签传播聚类算法与其他方法相比NMI值和ARI值有所提升。实验结果证明了改进成对约束扩充可以有效改善标签传播算法的聚类效果。  相似文献   

17.
郑文萍  岳香豆  杨贵 《计算机应用》2020,40(12):3423-3429
社区发现是挖掘社交网络隐藏信息的一个有用的工具,而标签传播算法(LPA)是社区发现算法中的一种常见算法,不需要任何的先验知识,且运行速度快。针对标签传播算法有很强的随机性而导致的社区发现算法结果不稳定的问题,提出了一种基于随机游走的改进标签传播算法(LPARW)。首先,根据在网络上进行随机游走确定了节点重要性的排序,从而得到节点的更新顺序;然后,遍历节点的更新序列,对每个节点将其与排序在其之前的节点进行相似性计算,若该节点与排序在其之前的节点是邻居节点且它们之间的相似性大于阈值,则将排序在其之前的节点选为种子节点;最后,将种子节点的标签传播给其余的节点,得到社区的最终划分结果。将所提算法与一些经典的标签传播算法在4个有标签的网络和5个无标签的真实网络上进行比较分析,实验结果表明所提算法在标准互信息(NMI)、调整兰德系数(ARI)和模块度等经典的评价指标上的性能均优于其余对比算法,可见该算法具有很好的社区划分效果。  相似文献   

18.
郑文萍  岳香豆  杨贵 《计算机应用》2005,40(12):3423-3429
社区发现是挖掘社交网络隐藏信息的一个有用的工具,而标签传播算法(LPA)是社区发现算法中的一种常见算法,不需要任何的先验知识,且运行速度快。针对标签传播算法有很强的随机性而导致的社区发现算法结果不稳定的问题,提出了一种基于随机游走的改进标签传播算法(LPARW)。首先,根据在网络上进行随机游走确定了节点重要性的排序,从而得到节点的更新顺序;然后,遍历节点的更新序列,对每个节点将其与排序在其之前的节点进行相似性计算,若该节点与排序在其之前的节点是邻居节点且它们之间的相似性大于阈值,则将排序在其之前的节点选为种子节点;最后,将种子节点的标签传播给其余的节点,得到社区的最终划分结果。将所提算法与一些经典的标签传播算法在4个有标签的网络和5个无标签的真实网络上进行比较分析,实验结果表明所提算法在标准互信息(NMI)、调整兰德系数(ARI)和模块度等经典的评价指标上的性能均优于其余对比算法,可见该算法具有很好的社区划分效果。  相似文献   

19.
高维数据的聚类特性通常难以直接观测. 将其构建为复杂网络, 节点间的拓扑结构可以反映样本之间的关系. 对网络中的节点进行社区发现, 可实现对数据更直观的聚类. 提出一种基于网络社区发现的低随机性标签传播聚类算法. 首先, 用半径和最近邻方法将数据集构建为稀疏的全连通网络. 之后, 根据节点相似度进行节点标签预处理, 使得相似的节点具有相同的标签. 用节点的影响力值改进标签传播过程, 降低标签选择的随机性. 最后, 基于内聚度进行社区的优化合并, 提高社区的质量. 在真实数据集和人工数据集上的实验结果表明, 该算法对各种类型的数据都具有较好的适应性.  相似文献   

20.
The paper presents an approach to mining heterogeneous information networks by decomposing them into homogeneous networks. The proposed HINMINE methodology is based on previous work that classifies nodes in a heterogeneous network in two steps. In the first step the heterogeneous network is decomposed into one or more homogeneous networks using different connecting nodes. We improve this step by using new methods inspired by weighting of bag-of-words vectors mostly used in information retrieval. The methods assign larger weights to nodes which are more informative and characteristic for a specific class of nodes. In the second step, the resulting homogeneous networks are used to classify data either by network propositionalization or label propagation. We propose an adaptation of the label propagation algorithm to handle imbalanced data and test several classification algorithms in propositionalization. The new methodology is tested on three data sets with different properties. For each data set, we perform a series of experiments and compare different heuristics used in the first step of the methodology. We also use different classifiers which can be used in the second step of the methodology when performing network propositionalization. Our results show that HINMINE, using different network decomposition methods, can significantly improve the performance of the resulting classifiers, and also that using a modified label propagation algorithm is beneficial when the data set is imbalanced.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司    京ICP备09084417号-23

京公网安备 11010802026262号