首页 | 官方网站   微博 | 高级检索  
相似文献
 共查询到17条相似文献,搜索用时 62 毫秒
1.
PageRank是Web主题检索最成功的算法之一,但它同时也存在一些问题。PageRank算法仅仅考虑了Web的链接结构,并没有考虑链接所携带的内容信息。针对这种情况,本文提出了根据链接临近文本信息对PageRank进行主题矫正计算的方案,最终使用PageRank与主题矫正值的和替换整最初的PageRank。模拟实验结果表明,改进后的算法可以提高PageRank算法的查全率。  相似文献   

2.
dPageRank--一种改进的分布式PageRank算法   总被引:3,自引:0,他引:3  
陈再良  凌力  周强 《计算机应用》2006,26(1):21-0024
回顾了传统的PageRank计算方式,分析了等级泄漏和悬挂页面问题的解决方法。介绍了分布式PageRank的计算原理和评价原则,在分析两种现有分布式PageRank算法的基础上,提出了一种改进的分布式PageRank算法,通过实验对该算法的性能进行分析评价。  相似文献   

3.
研究了现有的基于链接结构的PageRank算法。结合网页链接分析和网页内容相关性分析提出了一种改进的PageRank算法,从分析网页内容相关性的角度解决相关性需求,从网页链接分析的角度解决权威性需求,并且实验证明,改进的PageRank算法优于传统的PageRank算法的排序结果。  相似文献   

4.
通过分析PageRank算法存在的偏重旧网页问题、主题偏移问题及网页欺骗问题,提出一种基于用户反馈的PageRank改进算法,该算法在原算法的基础上添加用户点击次数反馈和点击时间反馈及反馈权重,并结合基于网页内容的排序算法思想,加入网页内容权重,对PR值的计算公式进行改进,从而克服PageRank算法中存在的问题。  相似文献   

5.
基于PageRank的Web挖掘改进算法   总被引:1,自引:0,他引:1       下载免费PDF全文
焦金涛 《计算机工程》2009,35(15):284-284
针对Google使用的PageRank算法,提出一种改进的Web挖掘算法。实现该算法时,将网页使用信息和网页添加日期信息做成点击向量和日期向量,2个向量加权后标准化得到的一个向量作为常数加入到改进的迭代算法。实验结果证明,改进算法可以提高网页重要性判断的准确度。  相似文献   

6.
基于网页链接与用户反馈的PageRank算法改进研究   总被引:1,自引:0,他引:1  
曹姗姗  王冲 《计算机科学》2014,41(12):179-182
在网页链接结构的排序算法PageRank的基础上,提出了一种改进的Bias PageRank(BPR)算法。为了提高用户对网页排序结果的满意度,该算法结合网页链接结构与用户反馈信息(点击率、最近一次点击时间等)进行综合分析,从而从网页设计与用户角度共同对网页PR值进行合理分配,以在一定程度上达到高质量网页尽量排序靠前、信息价值低的网页尽量下沉的目的。仿真实验表明,BPR算法在一定程度上改善了排序效果,提升了用户信息检索满意度。  相似文献   

7.
基于网页链接和内容分析的改进PageRank算法   总被引:9,自引:0,他引:9       下载免费PDF全文
结合网页链接分析和网页内容相关性分析提出一种改进的PageRank算法EPR(Extended PageRank),从分析网页内容相似性的角度解决相关性需求,从网页链接分析的角度解决权威性需求。算法为扩展PageRank提供了广阔的空间,并且实验证明,通过选择合适的参数EPR算法可以获得优于传统PageRank算法的排序结果。  相似文献   

8.
PageRank算法的分析及其改进   总被引:2,自引:0,他引:2       下载免费PDF全文
王德广  周志刚  梁旭 《计算机工程》2010,36(22):291-292
在分析PageRank算法存在偏重旧网页、主题漂移、网页权值均分、忽视用户浏览兴趣现象的基础上,对其进行改进,考虑网页修改日期、网页文本信息、网站权威度、用户兴趣度等重要因素,重新计算网页PR值。实验结果表明,改进算法可提高搜索引擎对网页排序的准确度,以及用户对检索结果的满意度。  相似文献   

9.
搜索引擎PageRank算法研究   总被引:5,自引:0,他引:5  
在研究搜索引擎关键技术的基础上,深入细致地剖析了著名搜索引擎Google的链接分析排名算法PageRank算法,解说其运行原理并给出改进算法.在此基础上指出PageRank算法存在的缺陷,从而针对性地提出了优化方案,实验结果表明,改进的算法有利于提高算法的运行效率,提高用户对检索结果的查准率.  相似文献   

10.
为了克服搜索引擎在搜索过程中经常重复性地把当前受欢迎的网页放在搜索结果的首要位置,而忽略那些不受大多数用户欢迎的网页的问题,文中提出一个采用改进受欢迎度的PageRank优化算法.该改进算法首先通过建立网页的真实质量函数来纠正搜索引擎的上述问题,然后再采用一个新的网页受欢迎度来消除内在的网页质量问题从而避免该问题.实验...  相似文献   

11.
随着网络的不断发展,电子邮件已成为人们生活中较为普及的通信手段,相应地垃圾邮件也成为了困扰E-mail用户的主要问题,因此研究如何更好的抑制垃圾邮件的滥发变得愈发紧迫.在基于朴素贝叶斯算法的基础上提出了带有损失因子k的最小风险贝叶斯算法,该算法通过调整k值,来改善正常邮件的误判问题,最大程度上减少用户的损失.最后实验结果表明,最小风险贝叶斯算法可以使垃圾邮件有着更好的过滤效果.  相似文献   

12.
搜索引擎技术的发展是随着电子技术不断进步而形成的信息数字化和数据网络化的必然产物。Google搜索引擎依靠其PageRank机制及收敛算法一直处于该领域的领先地位。本文介绍了PageR- ank算法的起源和发展。对其概念与方法进行了阐述,并讨论了它的应用情况。  相似文献   

13.
计算机技术和网络的迅速发展,使人们获取信息和投放信息的方式发生了翻天地覆的改变,开放式、全球化的互联网络使得当今社会进入了信息大爆炸的社会,如何将种类繁多数量巨大的数据转化为有用的信息和知识变得极为重要。本文对数据挖掘中常用的PageRank算法的应用进行了研究,提出了PageRank算法的优化改进策略。  相似文献   

14.
本文首先提出链接分析法中存在的垃圾页面问题并将其形式化描述出来;再从两个角度分别介绍了挑选种子页面集的思想;然后在改进现有PageRank算法的基础上提出了垃圾页面检测算法;同时给出了几个表征检测算法效率的性能指标,最后简要阐述了基于信任指数的对抗web垃圾页面方案。  相似文献   

15.
基于JavaScript的网页重定向作弊技术研究   总被引:1,自引:0,他引:1  
  相似文献   

16.
针对PageRank算法存在主题漂移以及偏重旧网页的问题,结合锚文本相似度和时间反馈因子提出了一种PageRank改进算法STPR,并对STPR算法进行实验分析。先比较了传统PageRank算法与加入锚文本相似度的PageR-ank算法,结果表明加入锚文本相似度的PageRank算法有利于减少主题漂移现象的发生;其次比较了加入锚文本相似度的PageRank算法与STPR算法,结果表明STPR算法不但减少了主题漂移现象,而且还弥补了新网页的PageRank值。  相似文献   

17.
针对有向赋权水网的特点以及复杂网络中节点评价的片面性,提出了一种基于改进PageRank的多属性水网节点重要性综合评价方法。首先,阐述水系网络的特点,提出了与互联网络的不同之处,同时在网络拓扑结构上从四个方面对节点进行了描述;其次,将PageRank算法应用到水网节点的重要性评价中,针对该算法在水网中的两个不适用性做出改进,再结合网络节点的综合属性进行重要性评价;然后,通过Krackhardt设计的数据集合“风筝网络”验证了该方法的一般性和有效性;最后,将该评价方法应用到某省的复杂水网重要性排序的工程中。该方法综合考虑了网络的拓扑属性和水网实际情况,较为全面地评价了水网节点的重要性程度,对于水网调度和安全管理具有重要的借鉴意义。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司    京ICP备09084417号-23

京公网安备 11010802026262号