首页 | 官方网站   微博 | 高级检索  
     

基于ERNIE-BiGRU-CRF模型的煤矿安全隐患命名实体智能识别研究
引用本文:刘飞翔,李泽荃,赵嘉良,李靖.基于ERNIE-BiGRU-CRF模型的煤矿安全隐患命名实体智能识别研究[J].煤炭工程,2024(2):206-212.
作者姓名:刘飞翔  李泽荃  赵嘉良  李靖
作者单位:1. 华北科技学院矿山安全学院;2. 华北科技学院经济管理学院;3. 中国矿业大学(北京)能源与矿业学院
基金项目:中央高校基本科研业务费资助项目(3142017107);
摘    要:为充分挖掘煤矿安全隐患文本关键知识,帮助煤矿企业安全管理人员更好的开展隐患排查治理工作,提出一种基于预训练语言模型的命名实体识别方法。首先定义煤矿安全隐患实体类别,并采用BIO标注策略构建了7个实体类别和15个实体标签;然后将收集到的煤矿隐患排查数据进行预处理,由煤矿安全领域专家人工标注相关实体,得到1500条煤矿安全隐患命名实体标准数据集;最后采用ERNIE预训练模型对煤矿安全隐患文本词向量进行表征、同时利用BiGRU结构进行上下文语义特征提取以及CRF模型进行实体标签解码,完成煤矿安全隐患命名实体识别研究。实验结果表明:ERNIE-BiGRU-CRF模型在序列标注任务上的精确率、召回率和F1值分别为56.69%、69.23%和62.34%,较于BiLSTM-CRF基线模型分别提高了6.85%、13.74%和9.83%,并且实体抽取结果与实际标注结果相差不大。另外,消融实验也验证了BiGRU层能够更好的捕捉煤矿安全隐患文本上下文语义依赖关系以及CRF层能够进一步优化标签序列的有效性。

关 键 词:煤矿安全隐患  ERNIE-BiGRU-CRF算法模型  命名实体识别  信息抽取
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司    京ICP备09084417号-23

京公网安备 11010802026262号