首页 | 官方网站   微博 | 高级检索  
相似文献
 共查询到10条相似文献,搜索用时 31 毫秒
1.
基于搜索引擎日志发现相近Web查询   总被引:3,自引:0,他引:3  
提出了一种利用搜索引擎日志发现高质量相近Web查询的新方法.对一个给定的查询,从日志中抽取候选查询的一些量化指标,如被查询的不同用户量、被查询的次数、用户在反馈结果中的点击次数、与给定查询间的共有词项个数、点击相同URL的个数及其分布等,用手工标记部分训练数据,进而建立一个发现有较好反馈结果的相近查询的回归模型.实验显示用该方法可得到较高的结果精度.  相似文献   

2.
为在查询前预取用户可能访问的数据,提出了一种利用查询日志的数据空间预取方法。该方法从查询日志中提取意图特征,并采用聚类技术对其进行聚类,识别用户查询意图,并基于该意图预取查询结果。实验结果表明:该方法在预取准确率和查询效率方面均显著优于已有方法。  相似文献   

3.
一种基于语义关联的查询优化方法   总被引:7,自引:2,他引:5  
提出了一种综合词法关系和语义分析的查询优化方法。通过对查询关键字词法特性和本体实例之间语义关联强弱的分析,提高了查询关键字到本体概念映射的完整性和准确率,帮助搜索引擎对用户的意图做出有效推测,解决了传统搜索引擎不能很好理解用户意图的问题。设计实现了相应的查询优化系统,实验表明该系统可以有效提高搜索的准确率。  相似文献   

4.
基于用户行为分析的搜索引擎模型   总被引:4,自引:0,他引:4  
介绍了目前搜索引擎技术发展的进展和研究热点.给出一种从用户点击的反馈信息中提取用户智能的搜索引擎算法.此算法首先给页面设置不同的内容相关度,再实测网页在不同内容相关度下的用户点击率,根据这组相关度和相应的用户点击率数据,可以由差商法或拟合直线法求得最佳的网页内容相关度,这样就可求出最终的索引相关度.实验表明该算法对提高搜索的稳定性和搜索精度有明显作用.  相似文献   

5.
为提高用户的使用效率,提出基于连续查询模式挖掘(CQPM)算法的联机分析处理(OLAP)查询日志挖掘及推荐方法.CQPM算法在双向扩展频繁闭合序列模式挖掘算法(BIDE)的基础上加入查询之间的间隔约束,确保查询模式的连续性.提出方法通过基于查询后缀树的模糊查询模式匹配(AQPM)算法预测用户下一步有效查询,并将预测结果按概率大小排序后推荐给用户.通过8名OLAP分析人员在Mondrian OLAP服务器上的查询日志对提出方法进行性能评价,结果表明,相较基于prefixspan的改进算法,采用CQPM算法能够去除数量庞大的冗余的查询模式,相较基本的前缀匹配算法,AQPM算法能够提高推荐的准确率.  相似文献   

6.
为提高搜索引擎的查准率,提出了一种基于群用户兴趣模型的加权全局相关度查询排序算法。算法综合考虑了用户搜索意图与搜索结果的全局相关度,改进了搜索引擎的排序结果,为用户提供了准确的搜索服务。实验结果表明,与用户意图相关的搜索结果能够排在最前面,搜索准确率明显提高。  相似文献   

7.
提出了一种用户兴趣扩展的方法以便应用于个性化推荐系统,对用户的搜索点击日志和浏览器的浏览日志进行统计,粗略对用户兴趣建模,从文本相似度、语言模型相关度、潜在的语义关联关系三个方面充分分析用户兴趣方向之间的关联关系,应用社区发现思想挖掘关联关系紧密的兴趣群组,并对用户兴趣在同一群组内进行适当扩展。通过试验结果分析,可以看出用户兴趣扩展对个性化推荐点击率的影响,并使点击率有近一倍的增长。  相似文献   

8.
本文全面介绍了一种基于无线路由器的广告发布的方法,对基于无线路由器的广告发布系统的设计与实现进行了具体的说明。现有的互联网广告系统都是针对某个站点或者某些联盟的站点来发布,而基于无线路由器的广告系统可以对所有的页面进行广告投放,而且由于通过路由器可以精确定位用户的位置,进而可以大大提高广告投放的精准性。  相似文献   

9.
针对以往的搜索引擎日志分析都主要集中在用户行为分析、查询推荐及搜索引擎评价等方面,采用社会网络分析法对搜索引擎进行日志分析。以不确定图的方式逻辑表示搜索引擎的日志中查询词和网页的链接关系,通过基于不确定图的SimRank算法,计算查询词与网页的相似度,最终以相似度和查询词的加权方式建立网页描述库。针对概率抽样的3点基本要求,提出一种渐进式的抽样策略,从而保证采用抽样技术对于不确定图中SimRank值计算的准确性。实验表明该算法具有较好的准确率和可行性。  相似文献   

10.
针对实时垂直搜索引擎搜索对象热门度多变和数据抓取由查询驱动等问题,提出一种全新的实时垂直搜索引擎对象缓存优化策略.基于对象及属性间的关联设计热门对象预测模型,预测热门对象的变化趋势;基于用户查询及对象变化符合泊松过程的特点,推导最大化数据新鲜度的计算方法,从理论上给出资源分配和动态平衡的最优策略.大量的对比实验验证了新的缓存优化策略在较少开销增长的前提下,用户查询结果平均新鲜度和准确率均明显优于传统固定频率的缓存策略.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司    京ICP备09084417号-23

京公网安备 11010802026262号