首页 | 官方网站   微博 | 高级检索  
相似文献
 共查询到19条相似文献,搜索用时 77 毫秒
1.
软件缺陷对软件功能的实现具有不可预知的危险,是软件产品的固有成分,提高软件的可靠性,关键在于降低软件缺陷出现的概率,而如何利用已有缺陷数据构建预测系统框架是研究的重点.针对传统软件测试技术虽然能够有效发现软件缺陷,但需要消耗大量的时间和精力,制约软件开发效率的缺点,提出基于特征选择的软件缺陷预测方法,算法对软件缺陷模型的经验数据集进行多特征选择,进而克服数据集之间的冗余性移除无关特征,得到缺陷模型的分类,最终实现软件缺陷的精确预测.实验表明,基于特征选择的软件缺陷预测方法具有较好的预测效果和较高的应用价值.  相似文献   

2.
针对软件缺陷预测数据中的数据不平衡、预测精度低以及特征维度高的问题,提出了一种RUS-RSMOTE-PCA-Vote的软件缺陷不平衡数据分类方法。首先通过随机欠采样来减少无缺陷样本的数量;在此基础上进行SMOTE过采样,在过采样中综合总体样本的分布状况引入影响因素posFac指导新样本的合成;对经过RUS-RSMOTE混合采样处理后的数据集进行PCA降维,最后应用Vote组合K最近邻、决策树、支持向量机构造集成分类器。在NASA数据集上的实验结果表明,与现有不平衡数据分类方法相比,所提方法在F-value值、G-mean值和AUC值上更优,有效地改善了软件缺陷预测数据集的分类性能。  相似文献   

3.
即时软件缺陷预测针对项目开发与维护过程中的代码提交来预测是否会引入缺陷。在即时软件缺陷预测研究领域,模型训练依赖于高质量的数据集,然而已有的即时软件缺陷预测方法尚未研究数据集扩充方法对即时软件缺陷预测的影响。为提高即时软件缺陷预测的性能,提出一种基于数据集扩充的即时软件缺陷预测(prediction based on data augmentation,PDA)方法。PDA方法包括特征拼接、样本生成、样本过滤和采样处理4个部分。增强后的数据集样本数量充足、样本质量高且消除了类不平衡问题。将提出的PDA方法与最新的即时软件缺陷预测方法(JIT-Fine)作对比,结果表明:在JIT-Defects4J数据集上,F1指标提升了18.33%;在LLTC4J数据集上,F1指标仍有3.67%的提升,验证了PDA的泛化能力。消融实验证明了所提方法的性能提升主要来源于数据集扩充和筛选机制。  相似文献   

4.
准确宽范围多步预测在时间序列预测应用中带来了巨大挑战.提出了一种基于最小二乘支持向量回归(LSSVR)和无迹卡尔曼滤波(UKF)的在线多步预测方法,利用时间滑动窗口减小算法的计算负荷,UKF方法实现LSSVR模型参数更新以提高预测精度.当预测范围达到预定步长p时,由核宽度σ、支持值参数{α_k}_k~L_(=1)以及偏移项b所构成的模型参数通过新的测量值和UKF进行在线更新.提出的方法不仅以较少的训练数据建立在线预测模型(所需训练数据集大小为相空间维数与滑动窗口长度之和),且多步预测值的精度相比于传统方法得到进一步提高.最后,通过几个实验研究论证了提出方法的有效性和优越性.  相似文献   

5.
线性/非线性时间序列模型一般表达式及其工程应用   总被引:1,自引:0,他引:1  
提出一种线性/非线性时间序列模型的一般表达式(GNAR),论述其线性和非线性特性.对3种典型的非线性、非平稳时间序列进行试验及应用研究.将样本数据分成训练集和测试集,在训练集上建立GNAR模型,采用最小二乘方法以及结合预测误差的修正AIC准则实现其参数估计和模型定阶.在测试集上进行预测,进而验证模型.结果表明该模型对3组数据跟踪性能良好,预测预报精度优于传统时序模型,因此该模型有良好的适应性和有效性,能应用于工程实际.  相似文献   

6.
针对软件缺陷预测过程中未充分使用源代码语义特征以及训练数据集中的类重叠问题, 提出一种面向类重叠的跨版本软件缺陷深度特征学习方法. 该方法采用混合式最近邻清理策略缓解深度学习语义特征中存在的类重叠问题. 在PROMISE公开数据集上进行测试的结果表明, 该策略能提升基于深度语义学习的软件缺陷预测性能, 分类性能最多在中值上提升14.8%. 实验结果表明, 在跨版本深度缺陷预测问题中可采用混合式最近邻清理策略缓解类重叠问题.  相似文献   

7.
以高速公路上路段行程时间历史数据集作为研究对象,以交通数据实际特征作为行程时间历史数据集分类的依据,建立基于数据挖掘的高速公路行程时间预测模型.采用山东高速收费站记录实际数据,以实例数据验证模型并计算平均绝对误差.为对比分析预测强度聚类预测模型的有效性,采用多种算法对测试集行程时间预测,对预测结果误差进行了对比.结果表明:预测强度修正的k-means法可以提高高速公路路段行程时间预测的准确性,模型在降低数据采集成本的同时可为高速信息服务提供可靠的预测行程时间,为出行者提供有力的决策依据.  相似文献   

8.
对于数值求解含随机参数的偏微分方程的问题,本文基于以高斯过程为核心的求解器提出了一种自适应挑选训练数据的求解模型.该模型从极少的初始训练数据集出发训练高斯过程求解器,将参数池中预测方差指示变量最大的参数及其对应的偏微分方程的高精度解加入训练数据集中,然后重复上述过程,直到所训练出来的高斯过程求解器在测试数据集上达到所要求的精度.此外,本文还将该自适应模型在带有二维随机参数的扩散方程上进行测试,结果表明所提出的自适应选点策略有效,模型的预测准确度随着训练数据的增加而迅速提高,最终只需要40个训练数据即可在测试数据集上达到要求的精度.  相似文献   

9.
石油作为"工业芯片",原油价格波动会对全球的经济与政治安全造成影响,准确地预测原油价格未来信息一直备受各方关注。提出基于多尺度主成分分析(MSPCA)的ARIMA原油价格预测方法,考虑原油期货价格与现货价格之间的相关性,采用原油期货价格和现货价格序列组成的二维数据作为原始数据,数据经过MSPCA后利用ARIMA进行预测。该方法利用了小波变换的多尺度分析能力,PCA的降维统计能力和ARIMA模型对非平稳时间序列的预测能力,实验证实该预测方法优于经典ARIMA方法和Holt′s指数平滑法,有效地提高原油价格预测精度。  相似文献   

10.
为了提高短时交通流量预测的精度,构建了基于相空间重构和正则化极端学习机的短时交通流量预测模型.首先采用C-C算法求解交通流量时间序列的最佳时间延迟和嵌入维数,进行相空间重构;然后选用G-P算法计算序列关联维数,判断出短时交通流量序列具有混沌特性.在此基础上,将重构数据作为正则化极端学习机的输入和输出来训练模型,并采用网格搜索法优化模型参数.最后以实测数据为基础,对模型的预测效果进行对比分析.结果表明,新构建模型的预测效果良好,能够有效提高短时交通流量预测精度.  相似文献   

11.
米文博  李勇  陈囿任 《科学技术与工程》2022,22(32):14275-14281
通过软件缺陷预测可以有效地提高软件测试效率,保证软件产品的质量。针对新开发的项目面临训练数据不足,标注代价高以及源项目与目标项目的缺陷模式难以匹配的问题,提出基于主动学习的跨项目软件缺陷预测方法。首先使用主动学习方法对目标项目进行筛选标注,其次将得到的标签集与跨项目数据进行数据融合和模式匹配,最后构建跨项目软件缺陷预测模型。采用真实的软件缺陷数据进行实验,与传统方法比较性能有所提升。结果表明该方法可以通过模式匹配有效提高跨项目软件缺陷预测模型的性能。  相似文献   

12.
基于软件大数据的自动化缺陷检测模型已成为缺陷发现的重要工具.针对软件大数据中,被准确标定的缺陷样本稀少,且漏标、误标率高,导致现有机器学习数据平衡优化方法易使噪声加剧、分类边界模糊等问题,提出一种稳健边界强化GMM-SMOTE软件缺陷检测方法.该方法利用高斯混合聚类将软件集合划分为多簇,基于簇内类别比进行可靠样本筛选并且通过后验概率实现边界识别,用以指导完成加权数据平衡,最后利用平衡优化数据构建软件缺陷检测模型.在NASA多个公开数据集上的实验结果表明,GMM-SMOTE可实现噪声抑制、边界强化的数据平衡,有效提高了软件缺陷识别效果,实际应用价值大.   相似文献   

13.
 客户兴趣点预测是大数据环境下提高电子商务推荐精度的关键,针对现有客户兴趣预测未综合考虑客户多种行为和时序时间的影响问题。为研究一种基于客户Web时空行为轨迹的兴趣点预测方法,构建了包含客户、时间、行为和兴趣点四层子网的客户Web时空行为超网络模型,并引入行为影响因子,提出基于超边相似性的兴趣点预测算法,在建立连通矩阵的基础上,通过邻接矩阵计算、超三角形判定和超边相似度计算,得到相似度最高的超边,该超边对应的兴趣点即为预测结果。实验结果表明,该方法在时间误差允许范围内,兴趣点预测准确度随时间精度的减小而增加,与传统的标签预测方法相比,预测准确度由56.2%提高至74%。  相似文献   

14.
针对时间序列数据样本少、部分信息未知的特点,提出将灰色理论与神经网络相结合构建灰色神经网络,充分利用两种方法的优势对小样本时间序列数据进行有效挖掘.为了提高模型的预测精度,提出利用残差对模型进行有效修正.实验分析表明,残差修正灰色神经网络具有较高的预测精度,适合于小样本时间序列数据的挖掘.  相似文献   

15.
PN学习作为一种新型的二元分类器,对结构化的无标签数据有较好的分类性能.软件模块缺陷预测中对无标签样本数据的分类直接影响着预测结果的准确性和可靠性.提出了基于PN学习方法的软件模块缺陷预测模型,结合灰色关联分析方法对实验样本进行降维处理从而提高模型的运算速度.通过实验和分析,证明了本方法的有效性.  相似文献   

16.
针对组合导航系统软件可靠性长期预测的复杂性,建模时在引入神经网络技术的基础上,提出了滚动式预测方法.该方法考虑了多种不确定因素对预测结果的影响,不断加入新预测的故障数据,克服了单纯依靠神经网络技术预测偏差较大的缺陷.仿真结果表明,该模型预测精度高,可用于实践中指导软件测试.  相似文献   

17.
台区负荷数据不仅作为时序数据呈现自相关性,还易受台区环境因素影响呈现非平稳性,因此预测精度不仅与预测模型结构有关,还与输入数据的时序特征有关。为了提高台区负荷的预测精度,提出一种基于混沌时序分析与核极限学习机的短期负荷多粒度预测模型。针对负荷数据的非平稳特征,通过变分模态分解算法将非平稳的原始信号转换成一系列相对平稳的子信号;针对负荷数据中的自相关特征,通过混沌时序分析方法,求解各个模态输入预测模型时的时间窗大小;构建多粒度核极限学习机预测模型,解决负荷数据中非平稳、自相关性对负荷预测的不利影响,提高模型的预测精度。结果表明,负荷的预测精度受输入数据时间窗大小的影响,不同模态分量的最佳时间窗的大小不同。采用混沌相时序分析的方法评估各个模态分量的最佳时间窗大小,可以有效提升核极限学习机的预测精度。  相似文献   

18.
为了降低建立发动机性能预测模型消耗的实验成本,利用具有强大的非线性问题分析能力的机器学习算法:广义回归神经网络(general regression neural network,GRNN)和支持向量回归(support vector regression,SVR),预测GDI (gasoline direct injection)涡轮增压发动机性能。首先采用田口正交实验法和拉丁超立方算法确定训练数据和测试数据的操作点,然后基于仅包含25个样本的相同训练数据训练模型,使用100组相同的测试数据测试GRNN和SVR的预测性能并进行了对比研究。对比分析表明,在实验数据有限的情况下,GRNN有收敛到局部最小值的风险,而SVR可以找到最优的全局解,并具有良好的预测精度和泛化能力,因此SVR非常适合应用于GDI涡轮增压发动机性能预测,并将显著降低实验成本。  相似文献   

19.
类比估算方法是软件成本估算的常用方法之一,而估算中选择的相似度函数则是估算结果准确有效的关键.由于Vague集可以较好地处理数据中的未知信息与不确定性,因此可使用Vague集来提高软件成本估算的准确性,为项目管理人员提供更加科学的预算保障.为此充分考虑未知度的因素,提出了一个新的基于未知度的Vague集相似度量方法,结合Vague集模糊熵与熵值法来确定不同指标的权重,以获取不同项目之间的相似度.最后将该方法应用在Desharnais数据集进行成本估算,实验结果表明,该相似度量方式较现有方法能够进一步降低估计过程中产生的误差.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司    京ICP备09084417号-23

京公网安备 11010802026262号