首页 | 官方网站   微博 | 高级检索  
     

HowNet与CCD映射方法研究
引用本文:向春丞,穗志方,詹卫东.HowNet与CCD映射方法研究[J].中文信息学报,2015,29(3):44-51.
作者姓名:向春丞  穗志方  詹卫东
作者单位:1. 北京大学 计算语言学教育部重点实验室,北京 100871;
2. 语言能力协同创新中心,江苏 徐州 221009
基金项目:国家重点基础研究发展计划,国家自然科学基金
摘    要:本体映射是解决本体异构问题的关键方案。该文以HowNet和CCD中的名词性概念为例,首先利用机器学习技术发现初始映射关系,主要包括特征选择、样本集合划分、分类器选择等步骤;然后考虑本体的整体结构信息,利用相似度传播算法,对初始映射关系进行全局调整。实验表明,最终的一对一和一对多映射关系的准确率分别达到了94%和87.5%。

关 键 词:本体映射  机器学习  分层抽样  相似度传播算法  

On Mapping between HowNet and CCD
XIANG Chuncheng,SUI Zhifang,ZHAN Weidong.On Mapping between HowNet and CCD[J].Journal of Chinese Information Processing,2015,29(3):44-51.
Authors:XIANG Chuncheng  SUI Zhifang  ZHAN Weidong
Affiliation:1. Key Laboratory of Computational Linguistics(Peking University), Ministry of Edacation, Peking University, Beijing 100871, China;
2. Collaborative Innovation Center for Language Ability, Xuzhou, Jiangsu 221009, China
Abstract:Ontology matching is the key solution to the semantic heterogeneity problem.Focusing on the Noun concept of HowNet and CCD, this paper applies machine learning to identify the initial mapping relationships, disicussing the the feature selection, sample collections division and classifier selection. Further, employing the overall structure of the ontology, the similarity propagation algorithm is introduced to adjust the initial mapping globally. Experiment result shows that the precision of 1:1 and 1:n mapping relationships reaches 94% and 87.5%, respectively.
Keywords:ontology matching  machine learning  stratified cross sampling  similarity propagation algorithm
点击此处可从《中文信息学报》浏览原始摘要信息
点击此处可从《中文信息学报》下载全文
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司    京ICP备09084417号-23

京公网安备 11010802026262号