首页 | 官方网站   微博 | 高级检索  
     

源代码变量名的自动语义标注
引用本文:陈凯,沈备军,王永剑,金波.源代码变量名的自动语义标注[J].计算机应用研究,2016,33(11).
作者姓名:陈凯  沈备军  王永剑  金波
作者单位:上海交通大学 软件学院,上海交通大学 软件学院,公安部第三研究所,公安部第三研究所
基金项目:国家自然科学基金资助项目(61472242);信息网络安全公安部重点实验室开放课题(C14609)
摘    要:大规模开源代码社区为开发者提供了丰富的软件资产,但要理解和利用这些代码却十分耗时耗力。为寻求代码理解、分析和挖掘的语义支撑,本文针对源代码变量名进行了研究,提出了一种基于字段相似度与语义关联度的自动语义标注方法,并实现了相应的工具。该方法首先建立英文、中文、拼音语料库,并构建字段相似度模型生成多种候选标注方案,然后利用马尔科夫转移矩阵和语义网WordNet构建概率模型评选出最优的标注方案,从而实现源代码变量名的自动语义识别。该方法通过积累用户的标注采纳反馈,能够不断提高标注准确度。本文使用GitHub开源项目代码进行标注准确度实验,结果表明初次标注准确度达到68.1%,随着用户反馈增加逐步提升到73.3%。

关 键 词:源代码    变量名    语义识别    自动标注
收稿时间:2015/12/15 0:00:00
修稿时间:2016/9/12 0:00:00

Automatic Semantic Annotation for Source Code Variable Names*
CHEN Kai,SHEN Bei-Jun,WANG Yong-Jian and JIN Bo.Automatic Semantic Annotation for Source Code Variable Names*[J].Application Research of Computers,2016,33(11).
Authors:CHEN Kai  SHEN Bei-Jun  WANG Yong-Jian and JIN Bo
Affiliation:School of Software,Shanghai Jiao Tong University,School of Software,Shanghai Jiao Tong University,The Third Research Institute of Ministry of Public Security,
Abstract:
Keywords:source code  variable names  semantic recognition  automatic annotation
点击此处可从《计算机应用研究》浏览原始摘要信息
点击此处可从《计算机应用研究》下载全文
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司    京ICP备09084417号-23

京公网安备 11010802026262号