首页 | 官方网站   微博 | 高级检索  
相似文献
 共查询到16条相似文献,搜索用时 218 毫秒
1.
针对现今个性化搜索中用户兴趣模型隐私的保护需要,提出一种基于服务器和客户端协作的用户兴趣模型两段式排序方法.利用基于上下层次结构的树状用户兴趣模型,对其分段在服务器与客户端对搜索结果进行排序,不仅提高了个性化搜索服务质量,而且通过用户可控的开放隐私程度调节,有效地达到了隐私保护的目的;此外,该模型采用动态目录结构,实现了用户兴趣数据的反馈更新,从而使得用户兴趣模型的信息更加精确.实验结果表明:该模型的个性化搜索质量优于Google原始排序结果,这种差距随着用户隐私开放控制程度的提升逐渐变小;在服务器两段排序对中间排序结果的裁剪过程中,只要恰当地选择数据的范围,不仅不会影响个性化搜索服务质量,而且能提高系统运行效率.  相似文献   

2.
传统的PageRank算法容易导致主题漂移、偏重旧网页、用户对搜索结果的主观选择被忽略等问题。针对PageRank算法存在的上述缺陷,提出了一种基于用户兴趣度的网页排序算法——PRUI算法。该算法主要从网页自身的客观特性和用户兴趣的主观特性两方面对网页的PR值进行重新估算,并依据估算后的网页PR值对网页做重排序。相比传统的PageRank算法,改进的PRUI算法进一步提高了系统检索的准确率和首页命中率。  相似文献   

3.
针对某一主题或学科的垂直搜索引擎是搜索引擎的延伸和细分,面向特定用户提供垂直搜索。网页排序算法是搜索引擎好坏的关键,搜索引擎网页排序算法的目的是从海量搜索结果中将主题相关和权威的网页排在前列,帮助用户查找所需的资源。 Nutch搜索引擎只实现了一个基本的综合排序模型,为了使Nutch更好地满足专业用户的需求,该文设计一个综合考虑主题相关性和网页权威性的综合排序模型,将主题相关度因子和改进后的PageRank算法因子融入到Nutch网页评分计算公式中。实验表明,改进的排序算法可以提高信息的查准率,具有明显的主题倾向性,在实际应用中发挥作用。  相似文献   

4.
为提高搜索引擎的查准率,提出了一种基于群用户兴趣模型的加权全局相关度查询排序算法。算法综合考虑了用户搜索意图与搜索结果的全局相关度,改进了搜索引擎的排序结果,为用户提供了准确的搜索服务。实验结果表明,与用户意图相关的搜索结果能够排在最前面,搜索准确率明显提高。  相似文献   

5.
深入讨论了基于向量空间模型以及基于潜在语义分析的微博搜索排序算法,以新浪微博为例,通过建立实验系统,利用新浪微博公共开放平台提供的API获取实验数据,通过一个实验样例阐述向量空间模型和潜在语义分析的处理过程。新浪微博现有排序方法通常不能提供按照相关性排序的满意结果。利用向量空间模型以及潜在语义分析方法,构建"索引词-博文"矩阵,对博文进行分词和向量化。衡量博文和查询的相关度转化成计算博文向量和查询向量之间的相似度。把对博文和查询的处理简化为向量空间中向量的运算。由实验得知基于潜在语义分析的微博搜索排序算法有效地提高了博文的检索效率。  相似文献   

6.
在分析用户浏览行为获取用户兴趣的基础上,提出一种树状结构模型与向量空间模型相结合来表示用户兴趣模型的方法,基于此用户兴趣模型,把遗忘机制引入模型的更新。这种兴趣模型不但具有加权矢量模型的加权关键词的特点和层次模型的层次性,并且还结合向量空间模型的特点,将用户的兴趣与浏览页面的特征向量结合起来。实验证明,建立用户兴趣模型的方法是合理和有效的。  相似文献   

7.
智能化搜索是当今制作搜索引擎的一个流行发展方向 ,它能够根据用户所输入的一系列关键词 ,发现他们的兴趣所在 ,从而找到那些能使用户感兴趣的网页。粗糙集理论这一处理含糊问题的新型数学工具 ,为此提供了一个完备的理论基础。首先对 Rough集理论中的基本概念进行了描述 ,然后引用了 Rough集中的上、下近似集及其近似精度的理论 ,利用简化的 WWW模型 ,将所搜索到的网页形成一棵用户兴趣树 ,再对此棵树上的网页结点进行约简 ,从而能够使呈现在用户面前的网页页面尽量准确  相似文献   

8.
将工艺设计属性关键词分类,制成工艺知识Web网页。应用粗糙集相关理论,可以通过上、下近似集以及近似精度对工艺知识网页进行智能搜索,并且根据搜索得到的工艺网页创建用户工艺知识网页兴趣树,提供给工艺规划人员。调整近似精度的阈值,可以控制搜索得到的网页多少和工艺网页的搜索树状结构。  相似文献   

9.
基于Agent的个性化信息检索技术的研究   总被引:2,自引:0,他引:2  
提出一种基于Agent的Internet信息检索系统模型.该系统由用户Agent、信息搜索Agent、信息过滤Agent三个模块构成.通过用户信息需求的表达和信息反馈,形成并训练用户Agent;信息搜索Agent与Internet搜索引擎连接,采用有限深度-广度优先的搜索算法,减少搜索范围,加快搜索速度;信息过滤Agent根据用户已有的信息资源分析用户喜好,采用向量空间法进行信息过滤.三个模块密切协作,实现网上信息的个性化、主动性、智能性检索.  相似文献   

10.
为了定量研究网页信息过载对视觉搜索的影响,利用眼动技术调查研究了用户在网页信息过载下的视觉搜索行为.实验结果表明:无论网页信息是否过载,用户视觉搜索都是以图为导向的,并且都呈现周边特性;网页信息过载显著延长了视觉搜索时间,造成获取信息的时间成本增加或时间损失;网页信息过载时,用户更倾向于采用减少平行加工、增加系列加工的信息加工方式来提高视觉搜索效率.  相似文献   

11.
为改善用户的Web页面访问行为、提高访问效率, 设计了一种基于贝叶斯网络的网页推荐模型及推荐算法。通过收集和分析服务器中的描述文件和日志文件,利用Bayesian网络分析页面间的依赖关系,构建了基于贝叶斯网络的网页推荐模型并产生推荐集。通过在Microsoft公司提供的网络日志数据集上做的实验,可以获得超过80%的准确率和覆盖率。理论分析和实验结果表明,算法能够在线实时向用户做出个性化的推荐,与已有的推荐算法相比,算法能较快地给出推荐集,并且可以获得更高的准确率和覆盖率。  相似文献   

12.
针对传统网页分类中存在的准确率和查全率不高、分类效率低的情况,提出一种基于朴素贝叶斯分类的网页预分类算法.算法根据用户的网上活动情况提取相关网址,分析网页内容和网页关键词,利用朴素贝叶斯分类算法进行分类,根据用户对各类网页的浏览情况分析用户的行为特征.采用改进的文本权值计算方法,并引进网址预分类机制,提高数据的处理效率以及分类的准确率.结果表明,网址分类算法准确,能够充分发掘用户的兴趣喜好,可以作为用户行为分析的数据算法进行商业推广和司法取证.  相似文献   

13.
具有时间反馈的PageRank改进算法   总被引:12,自引:0,他引:12  
针对某一类网页(比如新闻网页)在互联网上发布时间越长,其信息的重要性将随之下降这一事实,在传统的PageRank算法中加入时间反馈因子,实现网页因发布时间的长短,其PageRank值也随之上下浮动.并采用Seidel迭代算法加速迭代收敛过程.实验结果表明,改进后的算法在计算这类与发布时间相关的网页的PageRank值时,符合人们的一般期望,是有效的.Seidel迭代算法有利于提高算法效率.  相似文献   

14.
为了在浩如烟海的Web信息中更快地找到用户关心的信息,提出了一种主题爬行方法——MatchLink,它通过文档向量模型来评估网页链接的主题相关度,通过朴素贝叶斯算法和多层分类的方法计算链接所在网页的主题相关度,并根据这2个相关度优先下载主题相关的页面,实验表明其结果好于BestFirst和BreadthFirst。  相似文献   

15.
由于网络资源的复杂性,通用搜索引擎已经不能满足用户信息检索的准确性需要;为了满足并针对特定领域或特定主题查询的特定用户群的要求,专业搜索引擎技术成为目前信息检索领域内一个具有实用价值的研究热点。针对专业搜索引擎,在分析了网页评测的基本问题和方法的前提下,提出了一种基于H ITS“综合价值”评价的改进算法。  相似文献   

16.
基于页面分块模型的PageRank算法研究   总被引:2,自引:1,他引:1  
提出了一个基于页面分块重要性模型的PageRank改进算法。该算法考虑同一页面内属于不同分块的出链接有着不同的重要性,故对不同分块的出链接赋予相应的权重,从而更合理、更公正、更有效地计算页面的PageRank值。与以往的PageRank算法及其改进算法相比,该算法以基于视觉特征的页  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司    京ICP备09084417号-23

京公网安备 11010802026262号