首页 | 官方网站   微博 | 高级检索  
     

基于本体的Web生物信息抽取方法研究
引用本文:何源.基于本体的Web生物信息抽取方法研究[J].计算机与现代化,2013(5):172-175.
作者姓名:何源
作者单位:湖南农业大学信息科学技术学院
基金项目:湖南农业大学青年科学基金资助项目(11QN23);湖南省科技厅科技计划项目(2011NK3060)
摘    要:针对传统的基于关键词的搜索与数据检索存在的弊端,本文提出基于本体的Web信息抽取框架。该框架首先获取Web页面,将其转换为格式良好的HTML文档,然后利用HTML解析器将该文档转化为DOM树,再根据XPath表达式获取用户感兴趣的数据块,由此生成抽取规则,最后通过OntPMatch算法实现数据的抽取,并以RDF数据格式储存信息。本文以棉花信息为研究对象加以实证研究,实现Web生物信息数据抽取原型系统,为方便用户发现有价值的Web生物信息资源提供一个有效的工具。

关 键 词:本体  Web  信息抽取
本文献已被 CNKI 等数据库收录!
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司    京ICP备09084417号-23

京公网安备 11010802026262号