首页 | 官方网站   微博 | 高级检索  
     

面向工艺文本的命名实体识别方法研究
引用本文:贾猛,王裴岩,张桂平,蔡东风.面向工艺文本的命名实体识别方法研究[J].中文信息学报,2022,36(3):54-63.
作者姓名:贾猛  王裴岩  张桂平  蔡东风
作者单位:沈阳航空航天大学 人机智能研究中心,辽宁 沈阳 110136
基金项目:辽宁省重点研发计划(2019JH2/10100020);辽宁省自然科学基金(20170540705);沈阳市重大科技创新研发计划(Y19-1-011)
摘    要:面向工艺文本中的命名实体,该文提出一种融入领域知识的神经网络命名实体识别方法,旨在对零件、工程图纸、参考标准、属性等12类命名实体进行识别。该方法针对工艺实体的特点,利用领域词典及规则预识别出部分实体,形成预识别实体特征,将预识别实体特征加入CNN-BiLSTM-CRF神经网络模型,指导训练与预测。实验结果表明,该方法在工艺文本中能较好地完成命名实体识别任务,在提高词典及规则覆盖的实体识别效果的同时,还能够提高其他类实体的识别效果,通过加入预识别实体特征,使得F1值从90.99%提升到93.03%,验证了该文方法的有效性。

关 键 词:工艺文本  命名实体识别  领域词典及规则  CNN-BiLSTM-CRF  

Named Entity Recognition for Process Text
JIA Meng,WANG Peiyan,ZHANG Guiping,CAI Dongfeng.Named Entity Recognition for Process Text[J].Journal of Chinese Information Processing,2022,36(3):54-63.
Authors:JIA Meng  WANG Peiyan  ZHANG Guiping  CAI Dongfeng
Affiliation:Human-Computer Intelligence Research Center, Shenyang Aerospace University, Shenyang, Liaoning 110136, China
Abstract:This paper proposes, a method of identifying named entities based on neural network with domain knowledge to identify 12 types of process entities including parts, engineering drawings, reference standards and attributes. According to the characteristics of process entities, this method uses domain dictionaries and rules to pre-identify candidate entities to form pre-recognition features, which are then fed to the CNN-BiLSTM-CRF neural network model. The experimental results show that, by adding pre-recognition entity features, the F1 value is increased from 90.99% to 93.03%.
Keywords:process text  named entity recognition  domain dictionaries and rules  CNN-BiLSTM-CRF  
点击此处可从《中文信息学报》浏览原始摘要信息
点击此处可从《中文信息学报》下载全文
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司    京ICP备09084417号-23

京公网安备 11010802026262号