首页 | 官方网站   微博 | 高级检索  
     

基于类语言模型的中文机构名称自动识别
引用本文:尹继豪,樊孝忠,于江德.基于类语言模型的中文机构名称自动识别[J].计算机科学,2006,33(11):212-214.
作者姓名:尹继豪  樊孝忠  于江德
作者单位:北京理工大学计算机科学技术学院,北京,100081;北京理工大学计算机科学技术学院,北京,100081;安阳师范学院计算机科学系,安阳,455000
基金项目:高等学校博士学科点专项科研项目
摘    要:提出了一种基于类语言模型的中文机构名称自动识别方法,将分词和机构名称自动识别有机地结合起来。在机构名称识别的类语言模型中采用等级结构,使得嵌套有人名、地名等实体的机构名称能够较好地识别出来。在实验过程中,逐步增加实验条件,依次加入启发信息、缓存模型和机构名缩写处理,使得实验结果显著提高。在开放测试中,中文机构名称最终识别的查准率和查全率分别为85.47%和72.81%。

关 键 词:类语言模型  中文机构名称识别  启发信息  Viterbi算法

Chinese Organization Name Automatic Recognition Using Class-based Language Model
YIN Ji-Hao,FAN Xiao-Zhong,YU Jiang-De.Chinese Organization Name Automatic Recognition Using Class-based Language Model[J].Computer Science,2006,33(11):212-214.
Authors:YIN Ji-Hao  FAN Xiao-Zhong  YU Jiang-De
Abstract:An approach based on class language model is put forward about Chinese organization automatic recognition. Word segmentation and organization recognition can be combined. We adopted a hierarchical structure in organization model so that the organization names including nested entities can be identified. In the experiments, we integrate heuristic information, cache model and organization abbreviation processing into the class-based language model. The precision and recall of Chinese organization recognition are 85.47 and 72.81 in the opened-test.
Keywords:Class-based language model  Chinese organization name recognition  Heuristic information  Viterbi search
本文献已被 CNKI 维普 万方数据 等数据库收录!
点击此处可从《计算机科学》浏览原始摘要信息
点击此处可从《计算机科学》下载全文
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司    京ICP备09084417号-23

京公网安备 11010802026262号