首页 | 官方网站   微博 | 高级检索  
相似文献
 共查询到15条相似文献,搜索用时 125 毫秒
1.
程序代码相似度的自动度量不仅可以检测程序代码的抄袭问题.还可以辅助实现作业批改的自动化或试卷评阅的自动化.介绍了程序代码相似度自动度量技术.以及国外的几个程序抄袭检测系统的设计与实现方法.  相似文献   

2.
针对代码抄袭及软件盗版现象, 研究了3种传统基于程序结构相似性检测方法, 并提出一种基于语法树的程序相似度检测方法。该方法先对源程序进行语法分析得到其语法树, 然后基于语法树重点分析源程序的语法结构并计算其相似度, 从语法结构的角度消除高级抄袭手段所带来的干扰。实验结果表明, 基于语法树的程序相似度检测方法可以较好地检测增加冗余语句、 控制结构的等价替换等10种抄袭手段。  相似文献   

3.
谷春英  张顺利 《科学技术与工程》2013,(10):2871-2874,2879
恶意程序代码的相似度估计是恶意程序代码分析和检测的重要研究内容。现有的方法主要是对恶意程序代码进行属性计算或结构度量,但由于恶意程序代码结构的灵活性和恶意程序代码的伪装、恶意程序代码的相似度较难度量。提出了改进指纹和LSC加权的恶意程序代码相似度估计算法。该算法首先对恶意程序代码进行函数作用域划分和标准化预处理,然后对其进行字串序列化,利用改进的指纹相似度来对恶意程序代码的相似度进行度量;同时结合最大公共字串匹配算法进行结构度量,并对其相似度计算结果进行加权,对恶意程序代码结构的相似度进行综合估计。实验以C语言结构的程序代码为例,利用折半查找算法生成恶意程序代码测试数据集进行算法有效性验证。仿真证明该算法具有较好的恶意程序代码相似度估算精度。  相似文献   

4.
阐述了最长公共子序列算法在程序代码结构相似度度量中的应用,列举了两种计算最优值和一种获取最长公共标识符子序列的算法.根据最优值得到结构相似度值,进而可以查找出结构相似程序对.最后探讨了程序代码相似度的实际应用.  相似文献   

5.
在软件开发过程中绝大多数克隆代码集中在函数内部,为了更加快速有效地检测出克隆代码,提出了一种基于函数内部特征矩阵的代码克隆检测算法。该算法通过提取函数内部特征,从而达到将具体代码的比较转化为对特征矩阵进行相似度计算。实验结果表明,该算法可以检测出所有克隆函数,并与基于字符串代码克隆检测算法和基于串匹配的程序代码相似性识别方法相比,该算法在运行时间及精度上均优于基于字符串代码克隆检测算法和基于串匹配的程序代码相似性识别方法。其次,通过使用N-grams算法对函数名进行相似度检测,使得该算法在运行效率上得到了显著提升。  相似文献   

6.
基于本体粗糙集的程序代码相似度度量方法   总被引:2,自引:0,他引:2  
结合本体粗糙集理论,融合粗糙集理论分类处理能力与本体论数据描述能力,提出了一种基于本体粗糙集的个体相似度计算方法,并将其应用于程序代码相似度上。实验结果显示该方法在程序代码相似度度量上具备较好的实际效果,同时也揭示了属性度量和结构度量方法应用上的关系。  相似文献   

7.
提出了一种应用本体层次树和向量空间模型生成服务间相似性的度量方法,该方法能够在语义层次上获取更加符合人类直观认识的不同服务间的相似度,通过与传统相似度度量方法的对比,验证了该方法的有效性.  相似文献   

8.
对程序代码抄袭检测中多种字符串匹配算法的实现原理进行了描述,给出匹配算法计算相似度的公式以及相对应的时间复杂度。由于字符串匹配算法在程序代码抄袭检测中应用较为广泛,对其中的B-F(Brute-Force)朴素算法、LCS(Longest Common Subsequence)最长公共字串算法、GST(Greedy String Tiling)贪心字符串匹配算法等经典算法的总结比较是一件有意义的研究工作。  相似文献   

9.
针对非局部均值(non local mean,NLM)相似性度量不够准确的问题,提出一种基于模糊度量的视觉特征相似度的改进非局部均值图像去噪算法.利用模糊度量理论构建视觉特征度量相似性函数作为衡量图像像素点相似性;将平滑核函数代替高斯加权核函数,提高运算速度和避免滤波参数的设置;利用构建视觉特征相似性度量生成的平滑核函数,对图像进行去噪.由于改进方法考虑图像视觉结构特征,更加完善了非局部均值结构相似的特点.在高斯噪声和椒盐噪声下,用峰值信噪比(peak signal to noise ratio,PSNR)和结构相似性(structural similarity index,SSIM)评价指标分别对比分析提出方法与几种优秀的改进NLM方法的降噪性能.实验结果表明,改进的新方法在去噪性能方面得到较高的提升,同时降低了相似度计算的复杂度和减少了参数设置问题.  相似文献   

10.
协同过滤推荐系统的核心是用户的相似性度量.在杰卡德相似性度量基础上,提出一种修正的杰卡德相似性度量.该方法将用户评分差异的数目融入相似度计算,并综合杰卡德相似度建立神经网络学习模型,选取Movielens数据作为训练集,得到合适的权重.实验结果表明,与pearson相似性度量相比,该方法在用户评价较少时给出相对可靠的推荐,在推荐的精度、平均绝对误差等方面具有一定的优越性.  相似文献   

11.
使用FTP服务器收集考生上传的VB源码时,由于不能限制用户下载,容易导致被动抄袭现象发生,影响了考试的公平性。使用PHP语言设计了一种基于LAMP环境的VB程序语言源代码采集系统,可以有效保护考生上传源码的安全,同时具备了文件分类存放和初步雷同检测功能。  相似文献   

12.
系统相似性度量中的非平权距离系数法   总被引:6,自引:0,他引:6  
文章基于系统相似性,指出传统距离系数法在相似度量中的局限性,提出非平权距离系数法,通过对现有的权重值确定方法进行分析与比较,提出了一种更易精确计算的权重值确定方法,建立相似度量的计算公式,通过相似分析实例详述该方法的计算步骤,比较客观地反映出系统间的相似程度,从而提高系统相似性度量的准确性和可靠性,同时也提高了相似性度量在工程应用中的实用性。  相似文献   

13.
为了辅助教师对学生实验代码抄袭检测。根据已有的检测算法,提出一种以多行为单位,对代码进行标准化、数字化、预处理,并使用基于指纹的方式进行比较的方案。该方案不仅能够检测代码的相似度,同时能够给出抄袭的行数。经过实验教学应用,该方法能够检测大部分学生抄袭的情况,能够实际应用。  相似文献   

14.
基于Vague集的双向近似推理   总被引:4,自引:0,他引:4  
给出了一种新的Vague集间的上似度量方法,提出了Vague集间相似方向的概念,可以用它来描述两个相似Vague集中哪个所包含的信息更精确,并给出了一个判定方法,在此基础上给出了一种基于Vague集的双向近似推理方法,该方法更好地利用了Vague集信息的精确性,从而提高了推理的精确性和适用性,为智能系统中的近似推理提供了一个十分有用的工具。  相似文献   

15.
汇编语言程序相似性检测混合算法   总被引:1,自引:0,他引:1       下载免费PDF全文
根据汇编语言自身的特点,提出了结合属性计数和结构度量技术的相似性检测混合算法.在该方法中,将程序段的数目、子程序定义和调用的次数、循环指令loop出现的次数、转移指令出现的次数作为结构信息,73个使用频率较高的关键字作为属性信息.在从汇编语言程序中提取这些信息后,利用卡方检验来判断2个程序的相似性.实验结果表明,从混合...  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司    京ICP备09084417号-23

京公网安备 11010802026262号