首页 | 官方网站   微博 | 高级检索  
相似文献
 共查询到17条相似文献,搜索用时 206 毫秒
1.
针对传统的软件缺陷预测方法难以在单独的项目中利用小规模训练数据的问题,提出了一种基于迁移学习的软件缺陷预测技术,利用已有的项目辅助新项目的预测.该方法在源项目和目标项目之间寻找一个公共特征空间,使得在公共特征空间上2个项目的数据分布距离最小.在这个公共空间进行模型训练,以达到迁移分类的效果.实验结果显示该方法相对传统的缺陷预测算法有更好的预测性能,并且充分利用了原始训练数据,可以更高效地运用于各种软件缺陷预测任务.  相似文献   

2.
针对软件缺陷预测过程中未充分使用源代码语义特征以及训练数据集中的类重叠问题, 提出一种面向类重叠的跨版本软件缺陷深度特征学习方法. 该方法采用混合式最近邻清理策略缓解深度学习语义特征中存在的类重叠问题. 在PROMISE公开数据集上进行测试的结果表明, 该策略能提升基于深度语义学习的软件缺陷预测性能, 分类性能最多在中值上提升14.8%. 实验结果表明, 在跨版本深度缺陷预测问题中可采用混合式最近邻清理策略缓解类重叠问题.  相似文献   

3.
为了避免在变量多重情况下基于PCA的软件缺陷预测出现明显失误,对传统PCA方法的缺陷加以改进,利用UML软件工程组织网站上公布的某中等规模软件公司项目功能点数据,采用改进的PCA方法对项目综合性能进行软件缺陷预测,并与传统PCA方法的预测结果进行了对比.结果表明,改进的PCA方法对软件系统的综合性能有较好的预测能力.  相似文献   

4.
针对当前软件缺陷序列预测算法准确度不高的问题,提出了基于非线性加权的集成学习软件缺陷序列预测算法(NLWEPrediction)。该算法在常见线性集成预测算法的基础上增加了非线性回归项,回归项代表了集成预测算法中基预测算法之间的相互关系,修正了线性集成预测的偏差,并通过梯度下降法求解了模型中的参数。实验表明:NLWEPrediction在14个软件缺陷数据集上的均方误差均小于250,并且平均绝对误差均小于13。通过与基预测算法、集成预测Bagging、Stacking算法和只考虑两个分类器关系的非线性加权集成学习算法进行对比,可以看出,NLWEPrediction预测算法的均方误差和平均绝对误差显著减小,预测精度显著提高,说明在线性集成预测算法基础上增加非线性回归项,能够有效提高集成学习算法的分类效果。  相似文献   

5.
有效的软件缺陷预测能够显著提高软件安全测试的效率,确保软件质量,支持向量机(support vector machine,SVM)具有非线性运算能力,是建立软件缺陷预测模型的较好方法,但其缺少统一有效的参数寻优方法。本文针对该问题提出一种基于遗传优化支持向量机的软件缺陷预测模型,将支持向量机作为软件缺陷预测的分类器,利用遗传算法进行最优度量属性的选择和支持向量机最优参数的计算。实验结果表明,基于遗传优化支持向量机的软件缺陷预测模型具有较高的预测准确度。  相似文献   

6.
即时软件缺陷预测针对项目开发与维护过程中的代码提交来预测是否会引入缺陷。在即时软件缺陷预测研究领域,模型训练依赖于高质量的数据集,然而已有的即时软件缺陷预测方法尚未研究数据集扩充方法对即时软件缺陷预测的影响。为提高即时软件缺陷预测的性能,提出一种基于数据集扩充的即时软件缺陷预测(prediction based on data augmentation,PDA)方法。PDA方法包括特征拼接、样本生成、样本过滤和采样处理4个部分。增强后的数据集样本数量充足、样本质量高且消除了类不平衡问题。将提出的PDA方法与最新的即时软件缺陷预测方法(JIT-Fine)作对比,结果表明:在JIT-Defects4J数据集上,F1指标提升了18.33%;在LLTC4J数据集上,F1指标仍有3.67%的提升,验证了PDA的泛化能力。消融实验证明了所提方法的性能提升主要来源于数据集扩充和筛选机制。  相似文献   

7.
软件缺陷预测数据集在搜集过程中存在标注成本较高的问题,引入主动学习有利于选择有价值的数据样例来快速构建数据集,但是主动学习一般选出不确定度最高的样例进行人工标注,并未考虑低不确定度样例。为了进一步降低数据标注的成本,融合信息熵与相对熵提出一种基于代价敏感的混合式主动学习策略。该策略首先使用基于信息熵的主动学习策略,将信息熵最高的样例交由领域专家进行人工标注;对于信息熵最低的样例,借助查询委员会进行二次分析,若满足阈值则进行伪标注。实证研究表明,在同等标注样例的情形下,该策略的AUC值要优于其他3种经典的主动学习策略。使用基于代价敏感的主动学习查询策略可以有效提高软件缺陷预测领域的标注效率并降低标注成本。  相似文献   

8.
跨项目软件缺陷预测(cross project defect prediction,CPDP)旨在实际的软件开发场景中,需要进行缺陷预测的目标项目可能是一个新启动项目,或这个项目已有的训练数据较为稀缺,需要利用其他项目已经搜集的训练数据来构建缺陷预测模型,其已经成为软件质量保证的一种手段,吸引了国内外研究人员的关注.然...  相似文献   

9.
软件缺陷预测是软件开发过程中的一项重要技术,针对软件缺陷数据集的高维、小采样造成预测精度下降的问题,采用线性局部切空间排列算法对数据集降维处理,选用支持向量机作为基础分类器进行二值分类,建立软件缺陷预测模型,采用二维混淆矩阵评价模型的预测精度.实验结果表明,与其他模型相比,该模型可用较少的邻域点约简至更低的维度,不需要重新学习样本空间的流行几何结构,直接映射新的样本点,且预测时间耗费成本由13. 726 9 s降低至6. 217 s,给定参数区间寻优时间耗费由267. 442 1 s降低至165. 98 s,有效提高了软件缺陷预测的效率.  相似文献   

10.
针对跨项目软件缺陷预测中大量不相关的跨项目数据损害了缺陷预测模型性能的问题,提出了一种基于SSDBSCAN(semi-suppervised density-based clustering)的跨项目缺陷预测数据筛选方法——SSDBSCAN filter.首先,SSDBSCAN filter结合少量带类标号的本项目历史数据、跨项目历史数据和大量不带类标号的本项目数据;然后,利用SSDBSCAN算法对这些数据进行聚类发现子簇;最后,收集子簇中的跨项目数据,不属于任何簇的跨项目数据被作为噪声数据而丢弃.实验使用15个公开的PROMISE数据集,3种分类器和4种性能度量指标.实验结果表明,相比于目前已有的Burak filter和DBSCAN filter方法,SSDBSCAN filter在提高了预测率的同时降低了误报率,且G-measure与AUC度量值更佳.  相似文献   

11.
软件缺陷对软件功能的实现具有不可预知的危险,是软件产品的固有成分,提高软件的可靠性,关键在于降低软件缺陷出现的概率,而如何利用已有缺陷数据构建预测系统框架是研究的重点.针对传统软件测试技术虽然能够有效发现软件缺陷,但需要消耗大量的时间和精力,制约软件开发效率的缺点,提出基于特征选择的软件缺陷预测方法,算法对软件缺陷模型的经验数据集进行多特征选择,进而克服数据集之间的冗余性移除无关特征,得到缺陷模型的分类,最终实现软件缺陷的精确预测.实验表明,基于特征选择的软件缺陷预测方法具有较好的预测效果和较高的应用价值.  相似文献   

12.
基于软件大数据的自动化缺陷检测模型已成为缺陷发现的重要工具.针对软件大数据中,被准确标定的缺陷样本稀少,且漏标、误标率高,导致现有机器学习数据平衡优化方法易使噪声加剧、分类边界模糊等问题,提出一种稳健边界强化GMM-SMOTE软件缺陷检测方法.该方法利用高斯混合聚类将软件集合划分为多簇,基于簇内类别比进行可靠样本筛选并且通过后验概率实现边界识别,用以指导完成加权数据平衡,最后利用平衡优化数据构建软件缺陷检测模型.在NASA多个公开数据集上的实验结果表明,GMM-SMOTE可实现噪声抑制、边界强化的数据平衡,有效提高了软件缺陷识别效果,实际应用价值大.   相似文献   

13.
利用软件缺陷度量技术对软件项目进行评估是现今软件企业常用的评估手段.探讨了软件缺陷的分类技术,给出了利用正交分类法进行软件缺陷度量的一般方法.在此基础上对一个实例系统的缺陷进行度量,实验结果说明了从缺陷数据可以较好的评估软件项目.  相似文献   

14.
The fuzzy measure and fuzzy integral are applied to the classification of software defects in this paper. The fuzzy measure of software attributes and attributes' sets are treated by genetic algorithm, and then software attributes are fused by the Choquet fuzzy integral algorithm. Finally, the class labels of soft- ware modules can be output. Experimental results have shown that there are interactions between characteristic attributes of software modules, and also proved that the fuzzy integral fusing method using Fuzzy Measure based on Genetic Algorithm (GA-FM) can significantly improve the accuracy for software defect prediction.  相似文献   

15.
楔横轧多楔成形汽车半轴有时难以避免出现内部缺陷,如何快速而准确地探测出缺陷位置并实时修正模具是提高产品质量的关键.在分析缺陷产生机理的基础上,采用Normalized C&L破坏准则,使用DEFORM3D软件,对楔横轧多楔成形汽车半轴中轧件可能产生缺陷的位置进行理论上的预测,并对该预测方法进行相应实验验证,结果表明本方法是符合实际的.研究结果为轧制成形汽车半轴产品质量的检测提供了一种较为简便而有效的方式,为快速、实时修正模具、提高产品质量提供了理论依据.  相似文献   

16.
研究考虑缺陷移除失败的软件缺陷预测改进模型,以提高缺陷预测能力.分析了传统Rayleigh模型的不足,在考虑缺陷移除失败因素的基础上,建立缺陷预测改进模型,并使用经验值及最大似然法估计获得模型参数.实例验证表明,改进模型可以有效地提高软件缺陷预测值与实际值的拟合度.  相似文献   

17.
基于组合神经网络的软件可靠性预测研究   总被引:3,自引:1,他引:2  
为了进一步提高神经网络的预测能力,提出了一种前馈神经网络混合学习算法,并将其应用于组合神经网络.该算法由一种模式提取算法(Alopex)和伪逆算法组成.在该混合学习算法中,网络的学习任务被分解为2个部分:隐藏层的权值先随机给定,然后使用Alopex算法不断地对其进行扰动;输出层的权值使用伪逆算法确定.所使用的组合神经网络由多个结构相同的前馈神经网络组成,每个前馈神经网络都使用混合学习算法(采用不同的初值)进行训练.实验结果表明,这种组合神经网络能够显著提高软件可靠性的预测精度.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司    京ICP备09084417号-23

京公网安备 11010802026262号