首页 | 官方网站   微博 | 高级检索  
     

基于语义的关键词提取算法
引用本文:方俊,郭雷,王晓东.基于语义的关键词提取算法[J].计算机科学,2008,35(6):148-151.
作者姓名:方俊  郭雷  王晓东
作者单位:西北工业大学自动化学院,西安,710072
摘    要:关键词1提供了文档内容的概要信息,它们被使用在很多数据挖掘的应用中,在目前的关键词提取算法中,我们发现词汇层面(代表意思的词)和概念层面(意思本身)的差别导致了关键字提取的不准确,比如不同语法的词可能有着相同的意思,而相同语法的词在不同的上下文有着不同的意思.为了解决这个问题,这篇文章提出使用词义代替词并且通过考虑关键候选词的语义信息来提高关键词提取算法性能的方法.与现有的关键词提取方法不同,该方法首先通过使用消歧算法,通过上下文得到候选词的词义;然后在后面的词合并、特征提取和评估的步骤中,候选词义之间的语义相关度被用来提高算法的性能.在评估算法时,我们采用一种更为有效的基于语义的评估方法与著名的Kea系统作比较.在不同领域间的实验中可以发现,当考虑语义信息后,关键词提取算法的性能能够得到很大的提高.在同领域的实验中,我们的算法的性能与Kea 算法的相近.我们的算法没有领域的限制性,因此具有更好的应用前景.

关 键 词:关键词提取  语义相关度  消歧

Semantically Improved Automatic Keyphrase Extraction
FANG Jun,GUO Lei,WANG Xiao-dong.Semantically Improved Automatic Keyphrase Extraction[J].Computer Science,2008,35(6):148-151.
Authors:FANG Jun  GUO Lei  WANG Xiao-dong
Affiliation:FANG Jun GUO Lei WANG Xiao-dong(College of Automation,Northwestern Polytechnical University,Xi\'an 710072,China)
Abstract:Keyphrases provide semantic metadata producing an overview of the content of a document, they are used in many text-mining applications. In the process of keyphrases generation, we notice that the distinction between lexical level (term for meaning) and conceptual level (the meaning itself) can result in inaccuracy. In order to solve this problem, this paper proposes a new method that improves automatic keyphrase extraction by using semantic information of candidate keyphrases. Our keyphrases extraction met...
Keywords:Keyphrae extraction  Semantic relatedness  Word sense disambiguation  
本文献已被 CNKI 维普 万方数据 等数据库收录!
点击此处可从《计算机科学》下载全文
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司    京ICP备09084417号-23

京公网安备 11010802026262号