首页 | 官方网站   微博 | 高级检索  
     

基于本体的主题爬虫的研究
作者姓名:吴聪聪  赵建立
作者单位:石家庄经济学院信息工程学院
摘    要:主题网络爬虫是专业搜索引擎的重要组成部分,设计了一种基于本体的主题爬虫框架,使用领域本体来描述爬行主题,采用关键词提取技术确定网页主题,提出了基于领域本体的网页相关度计算的公式,实践证明基于本体的主题爬虫对网页提取的准确率大大提高。

关 键 词:主题爬虫  领域本体  相关度  主题描述  关键词提取
本文献已被 维普 等数据库收录!
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司    京ICP备09084417号-23

京公网安备 11010802026262号