首页 | 官方网站   微博 | 高级检索  
相似文献
 共查询到10条相似文献,搜索用时 46 毫秒
1.
在对未知应用静态分析的基础上,提取AndroidManifest.xml中申请的权限为特征,采用信息增益算法优化选择分类特征,再采用拉普拉斯校准、乘数取自然对数改进的朴素贝叶斯算法创建恶意应用分类器.通过十折交叉试验验证改进的朴素贝叶斯分类器的准度和精度较高,且通过信息增益优化选择的分类特征在保障准确率的情况下能有效提高检测效率.与k最近邻和k-Means分类器相比,改进的朴素贝叶斯分类器具有较好的分类效果.  相似文献   

2.
针对可探测新颖类别的数据流分类算法不能处理混合属性且新颖类别探测准确率不高,引入VFDTc算法作为基分类器学习算法,并改进新颖类别探测方法以处理混合属性数据和提高新颖类别的探测准确率。实验结果表明,改进后的算法具有较高的分类模型学习效率、数据流分类精度和处理速率。  相似文献   

3.
数据高维且不平衡时,产生的分类器易过度拟合且倾向于牺牲少数类准确率.为降低分类器复杂度且提高少数类识别率,提出了一种代价敏感随机森林算法.以随机森林算法框架为基础,利用Bagging平衡数据,并在基分类器属性分裂度量以及评价函数中引入误分类和测试双重代价,其中测试代价由分裂属性与少数类的相关度决定,使得基决策树在建模过程中向少数类倾斜.与随机森林和仅引入误分类代价的随机森林相比,引入双重代价的随机森林的分类准确率较高,尤其在少数类识别上具有较大优势.  相似文献   

4.
针对有监督检测方法在检测托攻击时准确率不高的问题,提出一种基于项目流行度和新颖度分类特征的托攻击检测算法。首先,根据真实概貌和攻击概貌在选择评分项目方式上不同,从流行度和新颖度角度,提出有效区分正常用户和攻击用户的特征;然后,基于这些特征提出一种集成检测框架,通过Boosting提升技术产生多个差异较大的基分类器,并且通过融合带有权重的基分类器的预测值得到最终的检测结果。实验结果表明,基于项目流行度和新颖度分类特征的托攻击检测算法能够提高攻击检测的准确率和召回率。  相似文献   

5.
针对现有的大多数数据流集成分类算法对分类器的评估时未考虑历史数据的重要性,同时忽略对无关属性和噪声属性干扰的处理等问题,提出一种基于深度属性加权的数据流自适应集成分类算法,旨在有效组合多个基于深度属性加权的朴素贝叶斯模型。通过在不同数据块中深入分析不同属性取值对类属性归属的贡献,并将学习到的局部属性权重作用于不同的属性取值,以降低噪声数据干扰。在评价基分类器时,权衡历史数据和当前最新数据的重要性;采用基于测试实例的分类器置信度和分类正确率权重的组合投票策略进行子分类器组合以提高整体分类性能。通过在多个基准数据集上与经典算法对比试验,本研究算法在分类正确率和概念漂移适应性上具有一定优势。  相似文献   

6.
基于信息增益的属性约简算法   总被引:1,自引:0,他引:1  
以信息增益作为属性重要性的度量方法,提出了一种基于信息增益的属性约简算法.该算法总是优先考虑对于决策更为重要的属性,用条件属性对决策属性的信息增益作为条件属性的属性重要性度量,并以此度量作为启发式信息,算法从空集开始逐步将重要的属性加入到选择属性集,直到决策表达到一致分类时结束.并通过实例分析验证了该算法能有效地对属性进行约简,同时可以得到简单规则集.  相似文献   

7.
本文对数据成时间序列的动态决策表 ,用增量式算法提取决策表的规则模型。增量式算法的关键点是在分类正确率和相容度下对属性集进行优级排序 ,算法的特点是随着数据的增加逐次推导规则。随着计算轮次的增加 ,比较运算的次数按多项式增加。由于大型静态数据库可转化为动态数据库 ,所以 ,增量式算法是大型决策表规则提取的有效算法  相似文献   

8.
针对以信息增益为划分标准的ID3算法中存在偏向属性取值多的属性等问题,提出了一种融合GINI指数的ID3改进算法。计算每个属性的信息增益和对应的GINI指数值,并计算所有属性的GINI指数算术平均值,筛选GINI指数低于算术平均值的属性记为候选属性集;从候选属性集中选择信息增益最大的属性建立分支,用递归方法构建决策树。实验使用6组UCI数据集进行验证。结果表明:该决策树的准确率均有所提高,对多值偏向问题有很好的克服作用。  相似文献   

9.
以信息增益作为属性重要性的度量方法,提出了一种基于信息增益的属性约简算法.该算法总是优先考虑对于决策更为重要的属性,用条件属性对决策属性的信息增益作为条件属性的属性重要性度量,并以此度量作为启发式信息,算法从空集开始逐步将重要的属性加入到选择属性集,直到决策表达到一致分类时结束.并通过实例分析验证了该算法能有效地对属性进行约简,同时可以得到简单规则集.  相似文献   

10.
粗集中规则提取的一种增量式算法   总被引:7,自引:2,他引:5  
本文对数据成时间序列的动态决策表,用增量式算法提取决策表的规则模型。增量式算法的关键点是在分类正确率和相容度下对属性集进行优级排序,算法的特点是随着数据的增加逐次推导规则。随着计算软次的增加,比较运算的次数按多项式增加,由于大型静态数据库可转化为动态数据库。所以,增量式算法是大型决策表规则提取的有效算法。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司    京ICP备09084417号-23

京公网安备 11010802026262号