首页 | 官方网站   微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 78 毫秒
1.
针对软件缺陷预测数据中的数据不平衡、预测精度低以及特征维度高的问题,提出了一种RUS-RSMOTE-PCA-Vote的软件缺陷不平衡数据分类方法。首先通过随机欠采样来减少无缺陷样本的数量;在此基础上进行SMOTE过采样,在过采样中综合总体样本的分布状况引入影响因素posFac指导新样本的合成;对经过RUS-RSMOTE混合采样处理后的数据集进行PCA降维,最后应用Vote组合K最近邻、决策树、支持向量机构造集成分类器。在NASA数据集上的实验结果表明,与现有不平衡数据分类方法相比,所提方法在F-value值、G-mean值和AUC值上更优,有效地改善了软件缺陷预测数据集的分类性能。  相似文献   

2.
针对不平衡数据中类重叠区域易造成分类错误的问题,提出一种引入合成因子改进边界分类的Borderline-SMOTE过采样方法(IBSM).首先根据少数类样本近邻分布情况找出处于边界的少数类样本,然后计算边界样本对应的合成因子,并根据其取值更新该样本需生成的样本数,最后在近邻中根据合成因子挑选距离最近的top-Z少数类样本进行新样本生成.将提出的方法与八种采样方法在KNN和SVM两种分类器、10个KEEL不平衡数据集上进行对比实验,结果表明,提出的方法在大部分数据集上的F1,G-mean,AUC (Area under Curve)均获得最优值,且F1与AUC的Friedman排名最优,证明所提方法和其余采样方法相比,在处理不平衡数据中的边界样本分类问题时有更好的表现,通过合成因子设定一定的约束条件与分配策略,可以为同类研究提供思路.  相似文献   

3.
即时软件缺陷预测针对项目开发与维护过程中的代码提交来预测是否会引入缺陷。在即时软件缺陷预测研究领域,模型训练依赖于高质量的数据集,然而已有的即时软件缺陷预测方法尚未研究数据集扩充方法对即时软件缺陷预测的影响。为提高即时软件缺陷预测的性能,提出一种基于数据集扩充的即时软件缺陷预测(prediction based on data augmentation,PDA)方法。PDA方法包括特征拼接、样本生成、样本过滤和采样处理4个部分。增强后的数据集样本数量充足、样本质量高且消除了类不平衡问题。将提出的PDA方法与最新的即时软件缺陷预测方法(JIT-Fine)作对比,结果表明:在JIT-Defects4J数据集上,F1指标提升了18.33%;在LLTC4J数据集上,F1指标仍有3.67%的提升,验证了PDA的泛化能力。消融实验证明了所提方法的性能提升主要来源于数据集扩充和筛选机制。  相似文献   

4.
高性能的软件缺陷预测模型可为软件自动化测试奠定重要的基础.当前的软件缺陷预测模型主要采用机器学习分类算法进行构建.其中,基于集成学习的软件缺陷预测模型通常可以达到当前最优的性能.然而,基于集成学习的软件缺陷预测模型的性能受到分类器的超参数取值的明显影响.因此,如何优化基分类器中的超参数,是提升基于集成学习的软件缺陷预测...  相似文献   

5.
针对现有非平衡数据处理方法存在的局限性,提出一种考虑边界4稀疏样本的混合采样方法(considering boundary sparse samples-hybrid sampling,CBSS-HS)。通过计算每个样本的边界因子识别边界点,将样本空间划分为边界域和非边界域,对非边界域内的负类样本进行欠采样,而由于边界域上样本的稀疏性,对其上正类样本使用基于最大距离的合成少数类过采样技术(max distance-synthetic minority oversampling technique,MD-SMOTE)进行过采样,最大限度地保留正类样本的信息,最终达到2类样本基本平衡。将Recall,F1-value,G-mean和AUC(area under the curve)值作为评价指标,使用CBSS-HS+支持向量机(support vector machines,SVM)算法在5个不同平衡度的数据集上验证其有效性,并与其他4种组合模型的分类效果做对比。结果表明,提出的CBSS-HS算法在不同数据集上各个评价指标都有良好的表现,平均提高了4.6%。因此,该方法可以作为处理非平衡数据的一种有效手段。  相似文献   

6.
7.
为提高互联网入侵检测方法的准确率,提出一种卷积神经网络与注意力机制结合的入侵检测方法。利用Borderline-SMOTE过采样算法和Min Max归一化对数据进行预处理,有效缓解入侵数据量差异较大问题,提升非平衡数据检测性能;使用卷积神经网络Inception结构多尺度对数据进行特征提取,并配合注意力机制进行维度更新,提高模型处理海量数据时特征表达的准确性。研究结果表明:入侵检测方法的平均准确率为99.57%;相较于SVM方法、CNN方法、RNN方法、BLS-GMM方法,准确率分别提升了4.48%、1.35%、1.62%和0.04%,召回率分别提高了4.48%、1.36%、1.62%和0.14%。  相似文献   

8.
针对不平衡数据集的低分类准确性,提出基于蚁群聚类改进的SMOTE不平衡数据过采样算法ACC-SMOTE.一方面利用改进的蚁群聚类算法将少数类样本划分为不同的子簇,充分考虑类间与类内数据的不平衡,根据子簇所占样本的比例运用SMOTE算法进行过采样,从而降低类内数据的不平衡度;另一方面对过采样后的少数类样本采用Tomek ...  相似文献   

9.
针对传统的SMOTE方法在类别区域重合的数据集应用时,可能产生多个更接近多数类的人工样例,甚至突破类别边界,从而影响整体分类性能的情况,提出了一种最近三角区域的SMOTE方法,使合成的人工样例只出现在少数类样例的最近三角区域内部,并且删除掉距离多数类更近的合成样例,从而使生成的样例更接近少数类,且不突破原始的类别边界。实验分别在人工数据集和改进的UCI数据集上进行,并和原始的SMOTE方法分别在G-mean和F-value的评价指标上进行了对比,实验结果验证了改进的SMOTE方法在类别区域有重合的数据集上要优于原始SMOTE方法。  相似文献   

10.
针对灯光和背景的亮度不同,通过HSI空阃提取亮度信息,使用自动阈值对光源和运动目标进行区分,降低因光源变化而产生的运动目标误检.实验结果表明,该算法可以显著提高运动目标检测在有光源影响下的准确性,减少将背景误判为前景的情况.  相似文献   

11.
研究考虑缺陷移除失败的软件缺陷预测改进模型,以提高缺陷预测能力.分析了传统Rayleigh模型的不足,在考虑缺陷移除失败因素的基础上,建立缺陷预测改进模型,并使用经验值及最大似然法估计获得模型参数.实例验证表明,改进模型可以有效地提高软件缺陷预测值与实际值的拟合度.  相似文献   

12.
软件缺陷对软件功能的实现具有不可预知的危险,是软件产品的固有成分,提高软件的可靠性,关键在于降低软件缺陷出现的概率,而如何利用已有缺陷数据构建预测系统框架是研究的重点.针对传统软件测试技术虽然能够有效发现软件缺陷,但需要消耗大量的时间和精力,制约软件开发效率的缺点,提出基于特征选择的软件缺陷预测方法,算法对软件缺陷模型的经验数据集进行多特征选择,进而克服数据集之间的冗余性移除无关特征,得到缺陷模型的分类,最终实现软件缺陷的精确预测.实验表明,基于特征选择的软件缺陷预测方法具有较好的预测效果和较高的应用价值.  相似文献   

13.
探讨了传统BP神经网络的模型与结构,并针对BP神经网络容易陷入局部最优的缺陷,提出用模拟退火技术代替局部梯度下降法修正网络权值的SA-BP算法,用于构建SA-BP神经网络的软件缺陷预测模型,并通过实验证明了SA-BP神经网络模型应用于软件缺陷预测的有效性.  相似文献   

14.
利用软件缺陷度量技术对软件项目进行评估是现今软件企业常用的评估手段.探讨了软件缺陷的分类技术,给出了利用正交分类法进行软件缺陷度量的一般方法.在此基础上对一个实例系统的缺陷进行度量,实验结果说明了从缺陷数据可以较好的评估软件项目.  相似文献   

15.
针对软件缺陷预测过程中未充分使用源代码语义特征以及训练数据集中的类重叠问题,提出一种面向类重叠的跨版本软件缺陷深度特征学习方法.该方法采用混合式最近邻清理策略缓解深度学习语义特征中存在的类重叠问题.在PROMISE公开数据集上进行测试的结果表明,该策略能提升基于深度语义学习的软件缺陷预测性能,分类性能最多在中值上提升1...  相似文献   

16.
羽毛缺陷复杂多样。一般的图像分割方法很难做到既能适用于多蛀斑分割的复杂情况又能很好地满足工业化羽毛缺陷检测中蛀斑分割的精确性要求。根据毛片特性,提出一种基于机器视觉的羽毛虫蛀缺陷的检测方法;首先采用双边滤波算法对羽毛图像做平滑处理,在有效模糊羽毛自身纹理的同时使得蛀斑边缘信息仍能得到很好地保留,以提高边缘检测的准确性;然后采用一种改进的变分水平集方法进行蛀斑分割,算法的初始轮廓线根据毛片的形状自动生成。实验结果表明这种检测方法分割准确;并能适用于多蛀斑的复杂虫蛀缺陷的检测,较好地满足了工业化检测的需要。  相似文献   

17.
Introduction A welded structure must be inspected to guarantee that the weld quality meets the design requirements to as- sure safety and reliability. However, X-ray image analyses and defect recognition are very complex. Most difficulties lie in finding …  相似文献   

18.
为了避免在变量多重情况下基于PCA的软件缺陷预测出现明显失误,对传统PCA方法的缺陷加以改进,利用UML软件工程组织网站上公布的某中等规模软件公司项目功能点数据,采用改进的PCA方法对项目综合性能进行软件缺陷预测,并与传统PCA方法的预测结果进行了对比.结果表明,改进的PCA方法对软件系统的综合性能有较好的预测能力.  相似文献   

19.
运动视目标检测是视频信息处理的重要研究课题之一.本文提出了一种基于高斯混合模型邻域信息融合的海面运动目标检测算法.该算法融合了背景差分和背景邻域信息差分,充分利用同一幅图像的像素邻域信息得到运动目标的种子点,认为高斯背景差分图像中包含种子点的连通区域为真实前景目标.实验表明,该方法可以避免背景模型在构建或更新阶段对场景的表征不足或错误而造成的误检,对强光下的海杂波也有良好的抑制作用,且对不同的气候环境有较好的鲁棒性.  相似文献   

20.
基于Gabor滤波器的布匹瑕疵自动检测方法   总被引:8,自引:0,他引:8  
给出一种基于多通道Gabor滤波技术实现高速实时布匹瑕疵检测方法.在多分辨率和多方向上分别对图像进行Gabor滤波,建立金字塔图像表示结构,并对滤波后的多幅图像进行融合与重建,把瑕疵区域从布匹背景中提取出来,从而实现对布匹瑕疵的实时检测.实验表明,这种方法的检测准确率可达到95%,而且具有计算量小、稳定性好等优点.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司    京ICP备09084417号-23

京公网安备 11010802026262号