首页 | 官方网站   微博 | 高级检索  
     

时态信息的语义抽取与排序方法研究及系统实现
引用本文:舒忠梅,左亚尧,张祖传.时态信息的语义抽取与排序方法研究及系统实现[J].计算机工程与科学,2014,36(8):1609-1614.
作者姓名:舒忠梅  左亚尧  张祖传
基金项目:国家自然科学基金资助项目(60970044);广东省自然科学基金资助项目(S2011040004281)
摘    要:针对通用搜索引擎缺乏对网页内容的时态表达式的准确抽取及语义查询支持,提出时态语义相关度算法(TSRR)。在通用搜索引擎基础上添加了时态信息抽取和时态信息排序功能,通过引入时态正则表达式规则,抽取查询关键词和网页文档中的时态点或时态区间等时态表达式,综合计算网页内容的文本相关度和时态语义相关度,从而得到网页的最终排序评分。实验表明,应用TSRR算法可以准确而有效地匹配与时态表达式相关的关键词查询。

关 键 词:时态语义  信息抽取  排序  搜索引擎  
收稿时间:2013-05-28
修稿时间:2014-08-25

Study on extraction and ranking of temporal semantics and system implementation
SHU Zhong mei,ZUO Ya yao,ZHANG Zu chuan.Study on extraction and ranking of temporal semantics and system implementation[J].Computer Engineering & Science,2014,36(8):1609-1614.
Authors:SHU Zhong mei  ZUO Ya yao  ZHANG Zu chuan
Affiliation:(1.School of Education,Sun Yat Sen University,Guangzhou 510275; 2.Faculty of Computer,Guangdong University of Technology,Guangzhou 510006,China)
Abstract:General search engine lacks of extraction and retrieval of temporal semantic from the text content of the Web pages. To address the temporal query problem, the Temporal Semantic Relevancy Ranking (TSRR) algorithm is proposed by integrating the temporal information extraction and ranking functions. Firstly, the rule of the temporal regular expression is introduced to extract the temporal points or temporal intervals from the query keywords and the text content of the web pages. Secondly, the scores of web pages are re evaluated and the returned results are ranked according to the text relevancy and the temporal semantic relevancy. Experiments show that the TSRR algorithm precisely and effectively matches the keywords queries related to the temporal expression.
Keywords:temporal semantic  information extraction  ranking  search engine  
本文献已被 CNKI 等数据库收录!
点击此处可从《计算机工程与科学》浏览原始摘要信息
点击此处可从《计算机工程与科学》下载全文
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司    京ICP备09084417号-23

京公网安备 11010802026262号