多粒度融合嵌入的中文实体识别模型 |
| |
作者姓名: | 袁健 章海波 |
| |
作者单位: | 上海理工大学光电信息与计算机工程学院 |
| |
基金项目: | 国家自然科学基金项目(61775139)资助; |
| |
摘 要: | 中文由于词边界模糊,字符信息获取不足等问题,使得中文实体识别较为困难.论文针对汉字的象形文字特点,提出一种结合字形特征的增强字符信息算法,该算法利用卷积神经网络和BERT模型得到增强字符向量;同时提出多粒度融合嵌入算法,利用注意力机制将增强字符向量与词向量融合,最终构建出多粒度融合嵌入的中文实体识别模型.实验表明,该模...
|
关 键 词: | 卷积神经网络 BERT 注意力机制 命名实体识别 |
|
|