首页 | 官方网站   微博 | 高级检索  
相似文献
 共查询到18条相似文献,搜索用时 203 毫秒
1.
该文提出一种基于随机森林的不完整数据集的多功能雷达(MFR)辐射源识别方法,该方法在MFR辐射源波形单元识别框架基础上,首先对参数缺失的先验知识集进行多重划分,得到多个不含缺失参数的样本子集,然后删减冗余子集并利用随机森林算法对各个子集构建弱分类器,最后根据弱分类器对识别结果贡献率的不同,进行权值设定,得到最终的识别模型。仿真实验证实了提出的MDRF-WA方法能够提高少量先验知识条件下波形单元识别的准确率和鲁棒性,降低计算成本。  相似文献   

2.
为统筹安排运输资源、合理制定多式联运计划,针对集装箱多式联运货运量预测准确性不足的问题,基于网格搜索交叉验证改进的随机森林算法,构建一种集装箱多式联运月度货运量预测方法。首先对于原始数据特征中存在数据缺失的问题,采用二次插值法、K邻近插补法进行数据的填补;再利用平均准确度下降法和平均边际贡献法筛选出7个最优特征;最后构建基于网格搜索交叉验证的随机森林预测模型。以营口至武汉的多式联运案例进行验证,证明综合特征筛选与最优参数组合提升了模型预测的准确性以及K邻近插补法在模型中的优越性,并与三次指数平滑法、Xgboost模型进行对比,结果表明,改进的随机森林预测模型准确性和稳定性更高。  相似文献   

3.
《南昌水专学报》2016,(6):99-102
作为人工智能算法的经典算法之一,K最近邻(KNN)在非线性、低维数据时能够取得优越的效果。但是,当维数较高时,现有数据集往往会变得较为稀疏,此时KNN需要大量训练数据才能保证精度。因此,适当的数据降维方法是改进KNN方法的重要手段。先用随机森林对训练数据集的变量进行排序,从而建立一种有效的KNN算法,并采用Boston数据集验证了该模型的有效性。  相似文献   

4.
针对传统K最近邻(KNN)算法没有学习过程,进行分类预测时需要遍历全部学习样本、时效性差且对k值敏感的缺点,本文提出了两种带学习过程的随机KNN算法(RKNN),包括对样本Bootstrap抽样的SRKNN算法和对样本特征Bootstrap抽样的ARKNN算法,均属于Bagging集成学习,学习多个简单KNN后投票输出结果。算法对样本的特征进行组合得到组合特征,简单KNN基于组合特征得到。重点研究了如何选取特征的最优组合系数,得到了取得最好分类精度时的特征最优组合系数选取规则和公式。RKNN算法在构造简单KNN时引入学习,分类时不再遍历全部学习样本而只需要用二分查找法即可,其分类时间复杂度比传统KNN算法分类时间复杂度低一个数量级。RKNN算法的分类精度比传统KNN算法的分类精度有大幅提升,解决了使用KNN算法难以选取k值的问题。理论分析和实验结果均验证了本文RKNN算法的有效性。  相似文献   

5.
简要回顾了DDoS攻击的工作原理和造成的危害,介绍了KNN和XGBoost两种机器学习算法的基本流程,提出了一种结合KNN算法和XGBoost算法的新DDoS攻击检测模型.在新模型中,通过使用KNN算法训练出模型,预测一个评分,作为新的特征加入原数据集中,再放到XGBoost中进行新一轮训练.利用标准数据集KDD CUP99进行了实验.实验数据表明,KNN和XGBoost融合模型训练和攻击检测的速度快,适用于DDoS攻击检测.  相似文献   

6.
针对城市固废焚烧(municipal solid waste incineration, MSWI)过程中存在的随机和连续数据缺失问题,提出了一种基于专家经验和约简特征集成模型的填充方法.首先,将过程数据缺失情况识别为随机分布、时间维度和特征维度缺失3种类型.接着,基于专家经验对前2种类型进行缺失填充后,面向第3种类型基于分布相似性和互信息相关性为缺失特征预测模型选择建模数据集和约简特征,建立具有互补特性的随机森林、梯度提升决策树和反向传播神经网络子模型对缺失值进行初步预测,利用贝叶斯线性回归(Bayesian linear regression, BLR)构建集成模型以获得最终填充值.最后,利用填充后的MSWI数据建立基于跨层全连接深度森林回归的二噁英排放浓度软测量模型.实验结果表明所提方法提高了MSWI过程数据的质量.  相似文献   

7.
电主轴是数控机床中重要的部件之一,其性能的优劣直接影响机床工况和加工零件质量。对电主轴进行故障诊断能很大程度上提高数控机床的加工精度,并且能够有效地增加其可靠性和安全性。在一般诊断过程中,原始数据的高维特征量处理较为困难。为顺应实际应用中对电主轴故障诊断的精度要求,提出一种基于主成分分析(PCA)与K最近邻(KNN)的电主轴故障诊断方法。此方法利用PCA对原始非线性时间序列数据的特征向量进行降维,并选取其中主成分特征向量。将得到的主成分特征向量作为KNN的输入进行故障分类。最后将该方法的预测结果与决策树和随机森林的分类结果进行对比,结果表明, PCA-KNN算法在故障分类精度上相较于其他两种算法有显著提高,是一种有效的电主轴故障分类方法。  相似文献   

8.
提出一种基于ReliefF算法的时频联合特征及随机森林的配电网电缆故障识别方法. 针对零序电压,从时域和频域构造23个故障敏感特征,采用ReliefF算法进行特征选择,得到最具分类能力的特征子集. 将特征子集作为基于随机森林的输入进行训练,得到最终的分类模型,实现了电缆故障类型识别. 所提方法与基于单一特征的方法相比,能够更加充分地挖据数据潜力,同时由于采用ReliefF算法筛除了无关特征,提高了算法效率. 最后采用Matlab软件进行仿真,并与决策树、KNN、SVM等算法进行比较,仿真结果验证了所提方法的可行性和高准确性.  相似文献   

9.
特征选择和分类算法是文本分类中的两个关键技术,提出了基于主成分分析和KNN相结合的文本分类方法。该方法利用主成分分析对文本向量的高维空间进行特征选择,为克服因类别特征选择不当带来的不利影响,使用KNN算法进行分类可以最大程度地减少分类过程中的误差。为了验证方法的有效性,针对UCI标准数据集进行仿真实验。实验结果显示,PCA-KNN方法优于主成分分析和随机森林相结合的方法,能在一定程度上提高文本分类的精度。  相似文献   

10.
为提高民航运输的高效性和安全性,利用随机森林模型,结合多普勒激光雷达技术,提出一种基于径向速度极差特征和边缘轮廓特征融合的方法,实现对飞机尾流的准确识别。将在双流机场采集的数据样本进行速度极差特征提取,同时将样本数据映射成灰度图,通过形态学梯度提取图像轮廓特征,再将二者融合,并以此构建随机森林尾流识别模型,最后进行对比实验。实验结果表明,特征融合后随机森林模型的分类准确率、精确率、召回率、F1-score分别为95.8%、87.3%、89.4%、88.4%,高于单一特征方式和决策树模型识别结果。本文提出的方法能够对具有复杂背景风场中的尾涡进行检测。  相似文献   

11.
交通流数据作为交通系统重要的输入变量,交通流数据采集器所采集的交通流数据质量直接影响着交通系统运行的稳定性;针对交通流数据中所出现的采样数据异常情况,提出一种基于随机森林的缺失值填补及孤立森林算法的交通流异常数据筛选方法,在此基础上通过线性回归模型对数据中缺失值及异常值进行填补构建整体交通流数据有效性处理框架;结果表明经过异常值处理模型修复的数据整体满足有效交通流数据要求,可为交通情况预测及交通系统运行提供数据支撑。  相似文献   

12.
基于差分隐私下包外估计的随机森林算法   总被引:1,自引:0,他引:1  
针对差分隐私随机森林算法在对高维数据进行分类时准确率不理想的问题,本文通过引入差分隐私下的包外估计来计算决策树权重以及特征权重,从而提出一种基于差分隐私下包外估计的随机森林算法(random forest under differential privacy based on the out-of-bag estimate, RFDP_OOB).本算法首先在差分隐私保护下生成一部分的随机森林,利用差分隐私下包外估计的特性对决策树和特征的重要性进行评估,从而计算出决策树权重以及特征权重,然后通过特征权重对特征进行划分,得到非重要特征集.接着在生成剩下的一部分随机森林的过程中,对最佳特征为非重要特征的结点进行预剪枝操作,使其成为叶子结点,从而减小噪声、提高决策树分类准确率,并具有较好的执行效率.最后在预测分类结果时,取所对应的决策树权重最大的分类结果作为随机森林算法的分类结果,从而提高随机森林算法的分类准确率.本文还对算法的有效性和隐私性进行了理论分析,并通过实验结果验证了本算法的有效性,本算法可以在保护数据隐私性的同时提高算法的分类准确率.  相似文献   

13.
针对支持向量数据描述多分类中模糊数据域的误判问题,提出了一种改进的加权小波支持向量数据描述(WWSVDD)多分类方法,并应用于遥感图像病害松树识别.利用无人机搭载双光谱相机获取高分辨率遥感图像,提取地物特征,构建特征向量.用WWSVDD模型描述每类样本,根据待测样本在特征空间中的不同分布,分别采用最小相对距离法和隶属度函数法进行决策分类,从而实现病害松树的识别.实验结果表明,与传统的K近邻和支持向量数据描述多分类方法相比,所提方法在识别病害松树方面准确性更高.  相似文献   

14.
In wireless sensor networks,data missing is a common problem due to sensor faults,time synchronization,malicious attacks,and communication malfunctions,which may degrade the network' s performance or l...  相似文献   

15.
基于Sentinel-2数据,以盐城国家级珍禽自然保护区核心区为研究区,采用基于面向对象的随机森林模型对研究区内的湿地信息进行分类研究. 首先,对影像进行分割处理,计算光谱特征、纹理特征、水体指数、植被指数与纹理特征,并对特征重要性进行排序筛选. 其次,基于此构建5种特征组合方案,并对研究区进行分类,比较不同组合的分类精度找出研究区最优的特征组合方案. 最后,实验表明:通过特征优选后的随机森林算法进行分类效果最好,总体精度达到87.07%,Kappa系数为0.84. 其中互花米草在3种植被中分类精度最高,为97.73%. 证明此方法能够有效提高滨海湿地的分类精度,可用作该区域湿地变化研究.  相似文献   

16.
对三维重建结果的表面特征进行提取和误差分析,是提高三维目标测量精度的关键步骤. 提出了对三维重建表面几何特征进行提取,并对其进行参数测量计算的方法. 首先利用STL文件对三维重建得到的目标点云数据进行读取、导出并筛选,得到三维重建目标的点云数据,通过迭代计算生成CAD模型表面点云数据. 再提取重建目标与CAD模型的几何特征,计算粗糙度、平行度和平面度等几何参数特征值,进行误差比较和分析,最后将该结果反馈至三维目标重建过程中. 实验结果表明,提出的方法能有效地提取三维重建结果表面几何特征及对表面进行测量计算.  相似文献   

17.
针对目前内部威胁人物检测准确率低及高维数据特征信息利用不全的问题,提出全特征信息均衡建模的内部威胁人物检测方法. 该方法对组织内部产生的多源数据进行特征提取和构建,通过对所有特征进行交叉分组,利用交叉分组后的特征进行孤立森林模型构建,提高模型构建过程中对数据特征信息利用的均衡性,利用生成的孤立森林模型进行内部威胁人物检测. 实验结果表明,该方法在CERT-IT(v4.2)内部威胁人物数据集上具有较高F1,且算法效率高,能够有效地用于内部威胁人物检测.  相似文献   

18.
提出一个新的抽样评估方法,通过对评估样本的KNN分析,选出特定网页.因大规模网站抽样结果稀疏,KNN算法会导致高检测误差,应用一个局部回归模型提升KNN评估质量.首先在网站中随机选择一些网页进行评估,得到该网站初始无障碍得分.在此基础上,将每一个评估网页作为一个标记样例,其他网页根据KNN局部回归模型进行无障碍评估得分预测.实验结果证明:所提方法相比随机抽样算法的效果上有着显著性提升.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司    京ICP备09084417号-23

京公网安备 11010802026262号