首页 | 官方网站   微博 | 高级检索  
     

特定领域本体自动构造方法
引用本文:何婷婷,张小鹏.特定领域本体自动构造方法[J].计算机工程,2007,33(22):235-237.
作者姓名:何婷婷  张小鹏
作者单位:华中师范大学计算机科学系,武汉,430079
基金项目:国家自然科学基金 , 教育部科学技术基金
摘    要:提出了一种自动构造特定领域本体的方法,该方法应用术语抽取和多重聚类技术。在术语抽取阶段,通过术语在专业语料与背景语料中出现概率的对比,采用LLR公式对术语进行评分,取得了更好的抽取效果。在层级关系发现过程中,采用上下文共现信息结合HowNet中词语的语义相似度,进行术语间相似度度量,力求获得术语间最合理的相关状况。同时改进了k-medoids聚类算法,更准确地发现术语的层级关系,进而构造出特定领域的本体。

关 键 词:本体  LLR  术语抽取  聚类  k-medoids
文章编号:1000-3428(2007)22-0235-03
修稿时间:2006-11-23

Approach to Automatical Construction of Domain Ontology
HE Ting-ting,ZHANG Xiao-peng.Approach to Automatical Construction of Domain Ontology[J].Computer Engineering,2007,33(22):235-237.
Authors:HE Ting-ting  ZHANG Xiao-peng
Affiliation:Department of Computer Science, Huazhong Normal University, Wuhan 430079
Abstract:This paper presents an approach to mining domain-dependent ontologies using term extraction and relationship discovery technology.There are two main innovations in the approach.One is extracting terms using log-likelihood ratio,which is based on the contrastive probability of term occurrence in domain corpus and background corpus.The other is fusing together information from multiple knowledge sources as evidences for discovering particular semantic relationships among terms.In the experiment,traditional k-mediods algorithm is improved for multi-level clustering.The approach to produce an ontology for the domain of computer science is applied and promising results are obtained.
Keywords:ontology  LLR  term extraction  cluster  k-mediods
本文献已被 CNKI 维普 万方数据 等数据库收录!
点击此处可从《计算机工程》浏览原始摘要信息
点击此处可从《计算机工程》下载全文
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司    京ICP备09084417号-23

京公网安备 11010802026262号