首页 | 官方网站   微博 | 高级检索  
     

基于链接的方法进行Web信息检索的TREC实验研究
引用本文:张敏,马少平,高剑锋.基于链接的方法进行Web信息检索的TREC实验研究[J].中文信息学报,2003,17(1):20-24,31.
作者姓名:张敏  马少平  高剑锋
作者单位:1.清华大学计算机系,智能技术与系统国家重点实验室2.微软亚洲研究院
基金项目:国家重点基础研究资助项目 (973) (G19980 30 5 0 9),自然科学基金资助项目 (6 9836 0 4 0 )
摘    要:本文通过TREC实验研究基于链接信息的检索对Web信息检索的影响,包括使用链接描述文本,链接结构以及将基于链接的方法和传统基于内容检索的方法合并。得到如下结论:首先,链接描述文档对网页主题的概括有高度的精确性,但是对网页内容的描述有极大的不完全性;其次,与传统检索方法相比,使用链接文本在网页定位的任务上能够使系统性能提高96% ,但是在信息查询任务上没有帮助;最后,将基于链 接信息的检索与传统的基于内容检索技术合并,在网页入口定位任务上总能将系统性能提高48%到124.8% ,而对特定信息查询任务也能在一定程度上改善检索效果。

关 键 词:计算机应用  中文信息处理  基于链接检索  基于链接的方法  Web信息检索  信息查询  网页定位  
文章编号:1003-0077(2003)01-0020-05

Study on Link-based Approaches for Web IR in TREC Experiments
ZHANG Min ,MA Shao-ping ,GAO Jian-feng.Study on Link-based Approaches for Web IR in TREC Experiments[J].Journal of Chinese Information Processing,2003,17(1):20-24,31.
Authors:ZHANG Min  MA Shao-ping  GAO Jian-feng
Affiliation:1.State Key Lab. of Intelligent Tech. and Sys. ,CST Dept. Tsinghua University2.Microsoft Research Asia
Abstract:This paper studied the effects of using of link information for Web IR in TREC experiment,including link anchor text,link structure and the combination of link-based retrieval and traditional content-based retrieval.Several conclusions are drawn:Firstly,anchor text can represent precisely the topic of Web page,but insufficient in describing the Web page content.Secondly,comparing with traditional content-based IR technique,using link-based approach on homepage finding task can get more than 96% improvement,while it is not helpful on ad hoc task.Finally,combining link-based and content-based techniques makes consistent 48% to 124.8% improvement on homepage finding task and some progress on ad hoc task.
Keywords:computer application  Chinese information processing  link-based retrieval  link approach  Web IR  ad hoc  homepage finding  
本文献已被 CNKI 维普 万方数据 等数据库收录!
点击此处可从《中文信息学报》浏览原始摘要信息
点击此处可从《中文信息学报》下载全文
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司    京ICP备09084417号-23

京公网安备 11010802026262号