首页 | 官方网站   微博 | 高级检索  
     

基于统计信息的未登录词的扩展识别方法
引用本文:韩艳,林煜熙,姚建民.基于统计信息的未登录词的扩展识别方法[J].中文信息学报,2009,23(3):24-31.
作者姓名:韩艳  林煜熙  姚建民
作者单位:苏州大学 江苏省计算机信息处理重点实验室,江苏 苏州 215006
基金项目:江苏省自然科学基金,江苏省高校自然科学基础研究项目 
摘    要:该文提出一种基于网络资源的未登录词的扩展识别方法。该方法以左右邻信息判断未登录词边界为基础对已识别出的二元候选未登录词种子进行扩展,从而得到不限长度的语义更完整的未登录词。实验证明该文方法可行有效。

关 键 词:计算机应用  中文信息处理  未登录词识别  左右邻信息  最频繁左邻比  最频繁右邻比  候选OOV扩展
  

Study on Chinese OOV Identification Based on Extension
HAN Yan,LIN Yuxi,YAO Jianmin.Study on Chinese OOV Identification Based on Extension[J].Journal of Chinese Information Processing,2009,23(3):24-31.
Authors:HAN Yan  LIN Yuxi  YAO Jianmin
Affiliation:Provincial Key Laboratory of Computer Information Processing Technology,
Suzhou University, Suzhou, Jiangsu 215006, China
Abstract:This paper proposes an approach to Chinese OOV identification based on extension according to statistics form Web resources.We extend the bigram OOV seeds by the left and right(LR) neighbors on the basis of OOV border judgment.It helps to identify OOV with integrated meaning without length restriction.Experimental results show that the approach is effective and feasible.
Keywords:computer application  Chinese information processing  OOV identification  lr_neighbor  MFLNR  MFRNR  candidate OOV extension  
本文献已被 CNKI 维普 万方数据 等数据库收录!
点击此处可从《中文信息学报》浏览原始摘要信息
点击此处可从《中文信息学报》下载全文
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司    京ICP备09084417号-23

京公网安备 11010802026262号