首页 | 官方网站   微博 | 高级检索  
     

一种基于概率主题模型的命名实体链接方法
引用本文:怀宝兴,宝腾飞,祝恒书,刘淇.一种基于概率主题模型的命名实体链接方法[J].软件学报,2014,25(9):2076-2087.
作者姓名:怀宝兴  宝腾飞  祝恒书  刘淇
作者单位:中国科学技术大学 计算机科学与技术学院, 安徽 合肥 230027;中国科学技术大学 计算机科学与技术学院, 安徽 合肥 230027;中国科学技术大学 计算机科学与技术学院, 安徽 合肥 230027;中国科学技术大学 计算机科学与技术学院, 安徽 合肥 230027
基金项目:国家杰出青年科学基金(61325010); 国家高技术研究发展计划(863)(2014AA015203); 安徽省科技专项资金(13Z02008-5); 安徽省国际科技合作计划(1303063008); 安徽省科技攻关计划(1301022064); 安徽省自然科学基金(1408085QF110)
摘    要:命名实体链接(named entity linking,简称NEL)是把文档中给定的命名实体链接到知识库中一个无歧义实体的过程,包括同义实体的合并、歧义实体的消歧等.该技术可以提升在线推荐系统、互联网搜索引擎等实际应用的信息过滤能力.然而,实体数量的激增给实体消歧等带来了巨大挑战,使得当前的命名实体链接技术越来越难以满足人们对链接准确率的要求.考虑到文档中的词和实体往往具有不同的语义主题(如“苹果”既能表示水果又可以是某电子品牌),而同一文档中的词与实体应当具有相似的主题,因此提出在语义层面对文档进行建模和实体消歧的思想.基于此设计一种完整的、基于概率主题模型的命名实体链接方法.首先,利用维基百科(Wikipedia)构建知识库;然后,利用概率主题模型将词和命名实体映射到同一个主题空间,并根据实体在主题空间中的位置向量,把给定文本中的命名实体链接到知识库中一个无歧义的命名实体;最后,在真实的数据集上进行大量实验,并与标准方法进行对比.实验结果表明:所提出的框架能够较好地解决了实体歧义问题,取得了更高的实体链接准确度.

关 键 词:命名实体链接  概率主题模型  维基百科
收稿时间:4/5/2014 12:00:00 AM
修稿时间:2014/5/14 0:00:00

Topic Modeling Approach to Named Entity Linking
HUAI Bao-Xing,BAO Teng-Fei,ZHU Heng-Shu and LIU Qi.Topic Modeling Approach to Named Entity Linking[J].Journal of Software,2014,25(9):2076-2087.
Authors:HUAI Bao-Xing  BAO Teng-Fei  ZHU Heng-Shu and LIU Qi
Affiliation:School of Computer Science and Technology, University of Science and Technology of China, Hefei 230027, China;School of Computer Science and Technology, University of Science and Technology of China, Hefei 230027, China;School of Computer Science and Technology, University of Science and Technology of China, Hefei 230027, China;School of Computer Science and Technology, University of Science and Technology of China, Hefei 230027, China
Abstract:
Keywords:named entity linking  probabilistic topic models  Wikipedia
点击此处可从《软件学报》浏览原始摘要信息
点击此处可从《软件学报》下载全文
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司    京ICP备09084417号-23

京公网安备 11010802026262号