首页 | 官方网站   微博 | 高级检索  
     

异构信息空间中时间感知的查询时实体识别与数据融合
引用本文:杨丹,陈默,王刚,孙良旭. 异构信息空间中时间感知的查询时实体识别与数据融合[J]. 计算机科学, 2017, 44(3): 215-219
作者姓名:杨丹  陈默  王刚  孙良旭
作者单位:辽宁科技大学软件学院 鞍山114051,东北大学计算中心 沈阳110004,辽宁科技大学软件学院 鞍山114051,辽宁科技大学软件学院 鞍山114051
基金项目:本文受国家自然科学基金项目(61402213,61402093)资助
摘    要:已有的传统的实体识别技术大多是以线下、非实时的方式,在静态数据集上进行,对于大数据集的执行通常需要大量的时间和系统资源。对于异构信息空间中具有时间信息、不断演化的异构实体来说,时间感知的查询时实体识别与数据融合越来越成为一种保证数据质量和满足用户需求的发展趋势。针对异构信息空间中使用时间上下文的关键字查询进行的实体搜索,提出一种时间感知的查询时实体识别与数据融合方法TQ-ER,以给用户提供准确的实体概貌(entity profile);提出一种迭代式时间感知的实体候选集生成算法。TQ-ER充分利用查询的时间上下文和实体的时间信息给正确的回答一个给定查询所需要的、最少的实体数据,以进行识别与数据融合。在真实数据集上的大量实验结果表明了TQ-ER的有效性和正确性。

关 键 词:时间感知  查询时实体识别  数据融合  异构信息空间
收稿时间:2015-10-11
修稿时间:2015-12-31

Time-aware Query-time Entity Resolution and Data Fusion in Heterogeneous Information Spaces
YANG Dan,CHEN Mo,WANG Gang and SUN Liang-xu. Time-aware Query-time Entity Resolution and Data Fusion in Heterogeneous Information Spaces[J]. Computer Science, 2017, 44(3): 215-219
Authors:YANG Dan  CHEN Mo  WANG Gang  SUN Liang-xu
Affiliation:School of Software,University of Science and Technology Liaoning,Anshan 114051,China,Computing Center,Northeastern University,Shenyang 110004,China,School of Software,University of Science and Technology Liaoning,Anshan 114051,China and School of Software,University of Science and Technology Liaoning,Anshan 114051,China
Abstract:Most of existing traditional entity resolution (ER) techniques mainly deal with static data sets by offline,non real-time methods.For large data sets,it usually requires a lot of time and system resources.In the face of evolved,hete-rogeneous entities with time information in heterogeneous information spaces,time-aware query-time ER and data fusion become a necessary trend to ensure data quality and user requirements.Aiming at entity search based on keyword query with temporal context in heterogeneous information spaces,this paper proposed a time-aware query-time ER approach TQ-ER to provide more accurate entity profiles to users.A time-aware iterative query expansion algorithm was proposed.TQ-ER leverags temporal context of query and temporal information of entities,which can identify the minimum entities to do ER and data fusion for a given query to be correctly answered.Extensive experimental results on real data sets show the effectiveness and correctness of TQ-ER.
Keywords:Time-aware  Query-time entity resolution  Data fusion  Heterogeneous information spaces
点击此处可从《计算机科学》下载全文
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司    京ICP备09084417号-23

京公网安备 11010802026262号