首页 | 官方网站   微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 31 毫秒
1.
剪枝过程是决策树分类学习中的重要环节,能够简化决策树并提高决策树的泛化能力,避免对训练数据集的过适应。在PEP算法的基础上,本文提出了一种改进的决策树剪枝算法IPEP,实验结果表明,该算法剪枝效果较PEP算法更好。  相似文献   

2.
决策树剪枝是将已生成的决策树进行简化的过程,包括预剪枝和后剪枝。为了提高后剪枝算法MEP的剪枝精度,防止因MEP影响因子选取不当造成决策树修剪过度而丢失特征信息的问题,提出一种改进的MEP算法即IMEP方法。首先引入k-折交叉验证(k-Fold Cross-Validation)方法用于选取最优的影响因子m,然后将m带入到MEP算法,再对原始决策树进行剪枝,可以得到最精确的决策树,并保持决策树的影响特征。其次,通过k次交叉验证,可以避免产生过拟合问题,和单独测试集方法相比,经过k次交叉验证后,已经减弱了随机性,防止出现"欠学习"问题。经过验证IMEP方法不仅提高了MEP的精度,能更精准简化决策树,并且保持决策树的影响特征。相比于PEP算法,在数据集较小时有更好的适用性,表现更加稳定。  相似文献   

3.
基于互信息规则剪枝的关联文本分类   总被引:1,自引:0,他引:1  
传统的关联文本分类算法产生的规则数量巨大,若不对规则剪枝会影响分类效率,而采用以前的剪枝方法又会使分类精度出现不同程度的下降.为此提出以互信息的方法对每个类的规则进行剪枝,挑选出分类能力强的规则构成分类器,对待分类文本进行分类.经过这个方法剪枝后的规则数量大幅减少,且能取得比规则集未修剪过的分类器和采用以前剪枝方法的ARC-BC算法更好的分类效果,大量的实验表明此方法是有效的.  相似文献   

4.
在进行并行关联规则挖掘时,数据偏斜和工作量平衡这两个数据分布特征影响着剪枝的有效性.本文提出了用定量的方式对数据偏斜和工作量平衡进行度量,并对不同值的组合进行了分析,以便在以后研究算法时可以有效地调整这两个特征值以提高剪枝的性能.  相似文献   

5.
对事务数据库增加记录时的关联规则维护问题进行了研究,在分析现有算法的基础上,提出了一个高效的增量式更新算法EUAR。与同类算法相比,算法EUAR通过减少对已有数据库的扫描次数和采用有效的候选集剪枝算法,提高其执行效率。测试结果表明,算法EUAR是可行且有效的。  相似文献   

6.
为了提高Eclat算法的效率,从剪枝、项集连接和交叉计数3方面对Eclat算法进行优化.将后缀相同的项集归为一个等价类,使剪枝更充分,剪枝时引入双层哈希表加快搜索候选项集子集的速度;提出项集集合划分链表,以减少项集连接过程中比较判断的环节;提出事务标识(Tid)失去阈值,以加快交叉计数的速度.在此基础上提出一种优化的Eclat_opt算法(ZAKI),把它与Eclat原算法以及其他2种Eclat改进算法Diffset (ZAKI), hEclat(熊忠阳)进行对比实验的结果表明,Eclat_opt算法的效率在稀疏数据集上最高,总体时间性能最好.  相似文献   

7.
提出了排序树的概念以及用排序树存储频繁项集的思想,证明了末项剪枝性质,以O(1)的时间实现了与Apriori算法同样的连接和剪枝操作,采用祖先兄弟表示法存储排序树,在某事务不包含祖先时跳过具有共同祖先的所有兄弟结点,提高了计算支持度的时间性能。理论分析和实验结果均表明,在时间性能方面本文算法与Apriori算法相比有较大提高。  相似文献   

8.
一种挖掘关联规则的高效增量式更新算法   总被引:1,自引:0,他引:1  
对事务数据库增加记录时的关联规则维护问题进行了研究,在分析现有算法的基础上,提出了一个高效的增量式更新算法EUAR.与同类算法相比,算法EUAR通过减少对已有数据库的扫描次数和采用有效的侯选集剪枝算法,提高其执行效率.测试结果表明,算法EUAR是可行且有效的.  相似文献   

9.
在离散事件系统的基于模型诊断中,提出了一种增量的可诊断性判定方法,用于提高可诊断性判定的效率。通过在状态上反向传播故障标签的方法,建立预诊断器。在预诊断器模型上,结合虚拟在线的观测窗口,增量进行可诊断性判断,决定是否对当前状态剪枝。提出增量算法,并证明该算法的正确性。实验验证增量可诊断性算法的效率,并实验研究了增量窗口大小对增量可诊断性判定效率的影响。  相似文献   

10.
为了提高计算机博弈水平,以西洋跳棋为研究对象设计博弈程序.采用Min-Max搜索算法实现对博弈树的搜索,根据α-β剪枝算法研究博弈树的估值深度,设计了搜索深度可以剪枝的博弈模型.该博弈模型解决了博弈程序布局方式、估值深度和搜索耗时等问题,提高了程序搜索效率和博弈性能.博弈程序在全国大学生博弈比赛中获得二等奖,在实际中得到了检验和应用,比赛结果表明了该博弈模型是可行和有效的.  相似文献   

11.
针对博弈树迭代加深搜索和向前剪枝搜索中误剪最佳分支的弱点,利用向前剪枝搜索与预评估搜索间的双重迭代调用,提出了一种新的博弈树迭代向前剪枝搜索方法.预评估搜索通过节点排序及调整剪枝比率可以更加准确地选取排序在前的最佳分支,进而使迭代向前剪枝搜索实现在预评估所保留的最佳分支方向进行深度搜索,二者迭代相互调用以提高向前剪枝搜索的有效性及效率.定性分析与中国象棋计算机博弈实验结果表明,迭代向前剪枝搜索提高了实时行棋决策的效率和效果,与α-β剪枝搜索相比,提高的搜索效率超过160倍,同时取得了胜负比近7倍的博弈效果.  相似文献   

12.
以往大多告警分析研究都是假设通信网络中所有告警是平等的,考虑此假设的不合理性,提出了一种加权告警分析方法。首先,根据告警对网络的影响程度,采用熵值法为不同的告警分配不同的权值,并将其转换成适合于数据挖掘的序列数据集;然后,设计了一种加权告警序列模式挖掘算法,并采用了一种新颖的剪枝策略来缩减需要挖掘的数据集大小以提高算法的效率;最后,利用该算法挖掘告警数据中的时序关系。实验结果表明,这种加权告警分析方法在剪枝效果、挖掘重要告警序列模式和执行效率方面具有很好的性能。  相似文献   

13.
C5.0算法是一种直观、效率高的分类方法,但该算法存在信息增益率计算复杂、容易出现过拟合和决策树偏倚的问题。针对这些问题,通过公式的转换简化信息增益率的计算过程,在剪枝过程采用了损失矩阵和置信区间的结合进行剪枝判断,以及对建立的多个模型的权重进行调整,提出了一种新的C5.0改进算法,并将其应用于信贷逾期预测上。使用借款人的历史还款数据进行实验,并与其他算法进行比较,结果表明:C5.0改进算法相比其他算法具有更高的准确率和效率。  相似文献   

14.
提出了一个基于最小完美哈希函数的关联规则的数据挖掘算法。基于Apriori的算法,在综合了传统哈希剪枝技术的同时,利用最小完美哈希函数的优点,保证了静态数据库关联规则挖掘,可以对关联规则的哈希结构数据进行动态的调整。该算法提高了挖掘效率,通过抑制哈希地址冲突提高了算法的稳定性和可用性。  相似文献   

15.
针对网络优化设计中一类基本的、具有重要研究价值的问题——具有流量约束的最小生成树(CMST)问题进行了研究,提出了一种联合启发式搜索和分支定界方法的混合优化算法.通过应用邻域搜索策略,初始解有了极大的改进.提出的高效算法提高了遍历搜索树的效率,加快剪枝,并通过实验验证了该算法的性能.在阐述搜索最优解的过程中说明了该算法的优势.计算结果表明,新提出的高效分支定界算法极大地改进了原有的基于边的分支定界算法的效率.  相似文献   

16.
针对深度神经网络模型在终端设备上部署时面临计算和存储等资源不足的问题,模型剪枝是一种有效的模型压缩方案,在保证模型精度的前提下减少模型的参数量并降低计算复杂度。传统的剪枝方案对于剪枝率及剪枝标准的设置大多依据先验知识,忽略了深度模型中不同层的剪枝敏感度和参数分布差异,缺乏细粒度的优化。对此,提出了一种基于强化学习的滤波器剪枝方案,在满足目标稀疏度的基础上最小化模型剪枝后的精度损失,并采用参数化深度Q学习算法求解构建混合变量的非线性优化问题。实验结果表明,所提方案能够为深度模型每一层选择合适的剪枝标准与剪枝率,减小了模型剪枝后的精度损失。  相似文献   

17.
提出了一种利用多功能地磁传感器采集道路环境磁场数据,并基于决策树模型实现车型的在线分类方法。文中提取8种与车速无关的车辆波形时域特征作为模型输入,基于最优最小划分样本数的CART算法对决策树模型进行训练。对训练得到的决策树,基于最小误差剪枝原则进行剪枝,得到具有更高样本鲁棒性的最佳剪枝树。通过在北京市某道路上布设地磁传感器获取了两种车型数据,正、反向测试的平均准确率分别为88.9%和94.4%。与现有多个分类方法进行了对比实验,结果表明:本文方法能够进行在线车型分类,并在分类准确率、样本鲁棒性和算法执行时间等方面更具优势,能够应用于实际城市道路现场进行车型分类。  相似文献   

18.
提出了一种求解破损平面k-L形覆盖问题的剪枝搜索算法.该算法先将k-L形分解为顶格和底格的组合,并将整个平面做相应分解构成候选集合,再利用剪枝搜索算法对平面进行搜索,找到相匹配的组合,通过逐步求精的方法以得到接近于最优解的覆盖方案.实验结果表明,该算法在处理小规模破损平面k-L形的覆盖问题上是有效的.  相似文献   

19.
社团划分在生物化学、社会学、生态系统等方面有广泛的应用. 划分结果的可靠性和算法效率是研究的重点. Louvain算法是一个划分结果相对可靠、算法效率较高的算法. 该文针对Louvain算法在处理叶节点方面进行了改进. 通过研究叶节点的特性和Louvain算法的不足之处, 在改进算法中基于叶节点特性进行提前剪枝, 以避免多余运算. 用改进算法和Louvain算法分别对18组人工数据和一组某个机构的实际邮件数据进行处理, 将结果进行对比发现改进算法在保持划分结果准确度不变的情况下, 有效地提高了处理速度.  相似文献   

20.
随着视频行业的不断发展,受损视频帧检测应用越来越广泛。为了满足视频帧检测中的低资源消耗要求,对卷积神经网络中参数量的来源进行分析,提出了新的卷积神经网络剪枝算法以实现卷积神经网络的压缩。首先,结合卷积神经网络权重和数据传播过程,提出了基于数据流动的节点重要性评估算法;然后,引入记忆力机制避免可能由于评估样本较少而造成的误剪枝;最后,基于节点重要性评估结果,提出了基于重要性采样的软剪枝策略,进一步增加剪枝的稳定性。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司    京ICP备09084417号-23

京公网安备 11010802026262号