基于ERNIE-BiGRU-CRF模型的煤矿安全隐患命名实体智能识别研究 |
| |
引用本文: | 刘飞翔,李泽荃,赵嘉良,李靖.基于ERNIE-BiGRU-CRF模型的煤矿安全隐患命名实体智能识别研究[J].煤炭工程,2024(2):206-212. |
| |
作者姓名: | 刘飞翔 李泽荃 赵嘉良 李靖 |
| |
作者单位: | 1. 华北科技学院矿山安全学院;2. 华北科技学院经济管理学院;3. 中国矿业大学(北京)能源与矿业学院 |
| |
基金项目: | 中央高校基本科研业务费资助项目(3142017107); |
| |
摘 要: | 为充分挖掘煤矿安全隐患文本关键知识,帮助煤矿企业安全管理人员更好的开展隐患排查治理工作,提出一种基于预训练语言模型的命名实体识别方法。首先定义煤矿安全隐患实体类别,并采用BIO标注策略构建了7个实体类别和15个实体标签;然后将收集到的煤矿隐患排查数据进行预处理,由煤矿安全领域专家人工标注相关实体,得到1500条煤矿安全隐患命名实体标准数据集;最后采用ERNIE预训练模型对煤矿安全隐患文本词向量进行表征、同时利用BiGRU结构进行上下文语义特征提取以及CRF模型进行实体标签解码,完成煤矿安全隐患命名实体识别研究。实验结果表明:ERNIE-BiGRU-CRF模型在序列标注任务上的精确率、召回率和F1值分别为56.69%、69.23%和62.34%,较于BiLSTM-CRF基线模型分别提高了6.85%、13.74%和9.83%,并且实体抽取结果与实际标注结果相差不大。另外,消融实验也验证了BiGRU层能够更好的捕捉煤矿安全隐患文本上下文语义依赖关系以及CRF层能够进一步优化标签序列的有效性。
|
关 键 词: | 煤矿安全隐患 ERNIE-BiGRU-CRF算法模型 命名实体识别 信息抽取 |
|