基于神经机器翻译的二进制函数相似性检测方法 |
| |
引用本文: | 陈斌,刘胜利,胡安祥,杨启超.基于神经机器翻译的二进制函数相似性检测方法[J].信息工程大学学报,2021,22(6):675-682. |
| |
作者姓名: | 陈斌 刘胜利 胡安祥 杨启超 |
| |
作者单位: | 数字工程与先进计算国家重点实验室 |
| |
基金项目: | 国家重点研发计划资助项目(2019QY1300);科技委基础加强资助项目(2019-JCJQ-ZD-113); |
| |
摘 要: | 二进制函数相似性检测是检测软件中已知安全漏洞的一种重要手段,随着物联网设备急剧增长,越来越多的软件被编译到不同指令集架构的平台上运行,因此基于二进制的跨平台相似性检测方法更具通用性。针对目前基于深度神经网络的跨平台相似性检测方法只能在基本块粒度进行相似性比对的不足,基于神经机器翻译的思想,提出一个通用的跨指令集架构的二进制函数相似性检测框架BFS,在函数粒度上通过无监督学习的方法自动捕获二进制函数的语义信息,生成二进制函数的嵌入向量。实验结果表明,BFS的P@10评价指标在88.0%以上,相较于现有方法提升了10.6百分点,并且能够有效检测出路由器固件中的已知真实漏洞。充分说明BFS检测框架在对二进制函数进行嵌入时,不仅能够保留较多原始语义信息,同时能够消除不同指令集架构以及编译优化选项的影响。
|
关 键 词: | 二进制代码 相似性检测 跨平台 漏洞搜索 神经机器翻译 |
收稿时间: | 2021/4/19 0:00:00 |
修稿时间: | 2021/9/30 0:00:00 |
|
| 点击此处可从《信息工程大学学报》浏览原始摘要信息 |
|
点击此处可从《信息工程大学学报》下载全文 |
|