首页 | 官方网站   微博 | 高级检索  
     

一种基于语义本体的网络爬虫模型
引用本文:张红云,刘炜,熊前兴.一种基于语义本体的网络爬虫模型[J].计算机应用与软件,2009,26(11):101-103.
作者姓名:张红云  刘炜  熊前兴
作者单位:武汉理工大学计算机科学与技术系,湖北,武汉,430063
摘    要:针对传统通用网络爬虫的自身固有的缺陷,结合本体的相关理论,提出了一种基于语义本体的网络爬虫的相关模型。该模型以本体构建领域知识概念集,结合知网,从语义的角度,利用扩展的元数据,在词的语义层次,对抓取的页面链接进行语义相关性计算,预测与主题相关的URL,提高采集的网络资源信息与设定主题的相关度。实验结果表明,该模型同其它通用网络爬虫模型相比具有较高的信息抓取准确率。

关 键 词:领域本体  网络爬虫  扩展元数据  知网

A WEB CRAWLER MODEL BASED ON SEMANTIC ONTOLOGY
Zhang Hongyun,Liu Wei,Xiong Qianxing.A WEB CRAWLER MODEL BASED ON SEMANTIC ONTOLOGY[J].Computer Applications and Software,2009,26(11):101-103.
Authors:Zhang Hongyun  Liu Wei  Xiong Qianxing
Abstract:
Keywords:
本文献已被 维普 万方数据 等数据库收录!
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司    京ICP备09084417号-23

京公网安备 11010802026262号