一种面向开源异构数据的网络安全威胁情报挖掘算法 |
| |
作者姓名: | 魏涛 李志华 王长杰 程顺航 |
| |
作者单位: | 江南大学人工智能与计算机学院 |
| |
基金项目: | 中央高校基本科研业务费专项资金(JUSRP211A41,JUSRP42003)~~; |
| |
摘 要: | 针对如何从开源网络安全报告中高效挖掘威胁情报的问题,提出了一种基于威胁情报命名实体识别(Threat Intelligence Named Entity Recognition, TI-NER)算法的威胁情报挖掘(TI-NER-based Intelligence Mining, TI-NER-IM)方法。首先,收集了近10年的物联网安全报告并进行标注,构建威胁情报实体识别数据集;其次,针对传统实体识别模型在威胁情报IoC攻击指示器挖掘领域的不足,提出了基于自注意力机制和字符嵌入的威胁情报实体识别(Threat Intelligence Entity Identification based on Self-attention Mechanism and Character Embedding, TIEI-SMCE)模型,该模型融合字符嵌入信息,再通过自注意力机制捕获单词间潜在的依赖权重、语境等特征,从而准确地识别威胁情报IoC实体;然后,基于TIEI-SMCE模型,提出了一种威胁情报命名实体识别算法;最后,集成上述模型和算法,进一步提出了一种新的威胁情报挖掘方法。TI-NER-IM方...
|
关 键 词: | 威胁情报挖掘 自然语言处理 实体抽取 攻击指示器(IoC) |
|
|