首页 | 官方网站   微博 | 高级检索  
     

利用信息检索和概率有限自动机的程序理解
引用本文:陈华,王灿,陈纯,唐文彬,钱剑飞. 利用信息检索和概率有限自动机的程序理解[J]. 浙江大学学报(工学版), 2008, 42(12): 2108-2111
作者姓名:陈华  王灿  陈纯  唐文彬  钱剑飞
作者单位:1. 浙江大学 计算机科学与技术学院, 浙江 杭州 310027; 2.中国计量学院 信息分院, 浙江 杭州310018;3. 上海理工大学 计算机工程学院, 上海 200093
基金项目:国家自然科学基金资助项目 , 国家"973"重点基础研究发展规划资助项目 , 浙江省重大科技专项资助项目 , 国家发改委高技术产业化资助项目  
摘    要:为提高基于信息检索的程序理解方法的准确性,提出了一种结合信息检索和概率状态机的两阶段程序理解方法.在该方法中使用概率有限自动机(probabilistic finite state automata,PFA)解决了信息检索结果在程序理解中的不确定性,同时采用信息检索构建了多个简单的PFA,而不是单个复杂的PFA,提高了PFA分析的伸缩性.训练阶段先采用隐式语义分析对源代码进行聚类,然后在聚类结果上生成PFA.在识别阶段以词法处理后的程序作为检索项在程序模板库中进行信息检索,取检索结果中的最相关的n项作为候选模板,由候选模板对应得到相应的PFA,通过分析找到最大概率的PFA,完成对源码内容的语义标注.

关 键 词:程序理解  概率有限自动机  信息检索  软件工程

Program comprehension using information retrieval and probabilistic finite-state automata
CHEN Hua,WANG Can,CHEN Chun,TANG Wen-bin,QIAN Jian-fei. Program comprehension using information retrieval and probabilistic finite-state automata[J]. Journal of Zhejiang University(Engineering Science), 2008, 42(12): 2108-2111
Authors:CHEN Hua  WANG Can  CHEN Chun  TANG Wen-bin  QIAN Jian-fei
Affiliation:CHEN Hua1,WANG Can1,CHEN Chun1,TANG Wen-bin2,QIAN Jian-fei3
Abstract:To improve the accuracy of information retrieval(IR) based program comprehension method,a new two stages method was proposed,which consists of IR stage and probabilistic finite-state automata(PFA) recognition stage.This method uses, PFAs to address the problem of imprecise in applying IR in program comprehension directly.Meanwhile,applying IR makes it possible to construct many simple PFAs rather than a big complex one to greatly improve the scalability of recognition.PFAs are learned from clusters generated by latent semantic analysis(LSA) in training state.In recognition state,source code segment is processed in lexical,and then it is used as an IR query to retrieve n candidate plans.After that,the corresponding PFAs of the plans are found,and the PFA with maximum probability is chosen.Finally,the code segment is marked with the same semantic as the result PFA.
Keywords:program comprehension  probabilistic finite-state automata  information retrieval  software engineering
本文献已被 CNKI 维普 万方数据 等数据库收录!
点击此处可从《浙江大学学报(工学版)》浏览原始摘要信息
点击此处可从《浙江大学学报(工学版)》下载全文
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司    京ICP备09084417号-23

京公网安备 11010802026262号