共查询到19条相似文献,搜索用时 78 毫秒
1.
用实数编码的遗传算法构造斜决策树 总被引:5,自引:0,他引:5
决策树方法是一种通过构造决策树来发现训练集中分类知识的数据采掘方法,其核心是如何构造决策树,构造决策树的关键是找出表示内部节点的最佳扩展属性。扩展属性有单属性和联合属性,由单属性形成的扩展属性集小,可以容易地找出最佳扩展属性,构造单元树的速度快,但是生成的单元树规模大,并可导致子树复制、一个属性的多次测试等;用联合属性作为扩展属性,生成的多元树规模小,能有效地克服单元树 相似文献
2.
用遗传算法构造决策树 总被引:20,自引:1,他引:20
C4.5是一种归纳学习算法,它通过对一组事例的学习形成决策树形式的规则。由于C4.5采用的是局部探索的策略,它得到的决策树不一定是最优的。遗传算法是模拟自然进化的通用全局搜索算法。文中讨论了利用遗传算法的构造决策树的方法。 相似文献
3.
4.
用遗传算法构造二元决策树 总被引:3,自引:0,他引:3
决策树的方法是一种优化的过程,遗传算法是模拟自然进化的通用全局搜索算法,文中将遗传算法应用到做到决策树,提出了采用遗传算法求解二元决策树的非叶结点的权值矢量,进而构造二元决策松的方法,并讨论了遗传算法的评介函数构造和编码方法,重点说明了如何对遗传算法进行改进,提高算法效率,然后分析了影响二元决策树错误分类率的因素,并用实例验证该方法构造的二元决策树对样本分类具有很高的辨识率。 相似文献
5.
DNA编码优化问题是DNA计算中的核心问题。分析DNA编码优化的约束条件,在单链DNA序列集合上引入h距离,将聚类小生境技术应用于小种群遗传算法的构造,对DNA编码优化问题进行求解。基于h距离定义DNA序列间的相似函数,将碱基字母编码为4进制整数、DNA编码序列作为个体编码为4进制整数向量、种群编码为4进制整数矩阵,基于模4算术运算,构造相应的遗传算子,并给出DNA编码序列的具体计算结果。实验结果表明,与现有DNA编码序列优化结果相比,该算法可得到更好的DNA编码序列且计算效率较高。 相似文献
6.
7.
基于决策树的遗传算法在数据挖掘领域的应用 总被引:2,自引:0,他引:2
论文详细阐述了基于决策树的改进的遗传算法的编码技术和相关遗传算子的操作;同时强调说明了相对于当前数据挖掘领域的数据分类算法,论文中的新分类方法在从海量数据库中全局优化搜索分类规则集所显示出它的优越性。最后,通过实例比较结果,证实论文中算法切实可行,有较高搜索效率。 相似文献
8.
《计算机应用与软件》2015,(10)
针对DNA计算中的DNA序列设计问题,基于6个DNA序列设计约束条件,将DNA序列设计问题转化为多目标优化问题,提出小生境遗传算法进行求解。算法利用DNA序列设计中的相似性约束与H-测度约束,在单链DNA序列集合上定义共享函数,利用两种类型的编码等价变换以及模4算术运算,构造了5个遗传算子,并给出具体的DNA序列设计结果。通过比较,算法可以得到质量更好的DNA序列,且在种群规模与进化代数方面具有更高的计算效率。 相似文献
9.
DNA编码问题是DNA计算的关键,然而,它已被证明为NP困难问题,通常采用优化算法求解。针对传统遗传算法缺乏有效指导,容易陷入局部极值的缺点,结合文化算法采用种群空间和信念空间的双层进化结构进行寻优,提出了一种基于遗传算法和文化算法的混合优化算法用于解决DNA编码问题。仿真结果表明该混合算法能有效地用于DNA编码序列设计。 相似文献
10.
11.
在分析C4.5算法原理的基础上,进一步讨论了C4.5算法在决策树的规模控制、属性选择、滤躁和去除不相关属性等方面的不足,讨论了决策树挖掘中对训练数据进行属性约简的必要性。从实用的角度提出了一种利用遗传算法进行寻优的、基于属性约简的决策树构建模型,并为此模型设计了一个适应度函数。该模型具有自适应的特点,通过调整适应度函数的参数,可以约束遗传算法的寻优方向,实现对决策树的优化。实验表明,决策树寻优后,在所用训练集属性减少的同时,分类精度却有一定程度的提高,而分类规则的规模却降低了,因此,该模型具有一定的实用价值。 相似文献
12.
13.
14.
谢芬 《数字社区&智能家居》2010,6(10):2493-2495
基于多类别肿瘤基因表达谱数据集,从研究肿瘤与正常组织的分类入手,对肿瘤分类特征基因选取问题进行分析和研究。将决策树算法应用到肿瘤基因表达谱分类研究中,尝试引入遗传算法,对决策树分类规则进行优化。试验结果表明,在样本有限的情况下,该方法比单个决策树具有更高的分类精度。 相似文献
15.
16.
17.
18.