排序方式: 共有5条查询结果,搜索用时 0 毫秒
1
1.
将数据挖掘集成到关系数据库中,可以使数据挖掘技术直接利用关系数据库中的数据生成挖掘模型.以决策树技术为研究实例,通过把决策树算法重新设计为基于SQL的汇总和查询分析操作,提出一种新的基于SQL的决策树算法.同时,通过理论分析表明,在L/O性能方面,文中算法比SPRINT算法要好. 相似文献
2.
基于SPRINT方法的并行决策树分类研究 总被引:9,自引:0,他引:9
决策树技术的最大问题之一就是它的计算复杂性和训练数据的规模成正比,导致在大的数据集上构造决策树的计算时间太长。并行构造决策树是解决这个问题的一种有效方法。文中基于同步构造决策树的思想,对SPRINT方法的并行性做了详细分析和研究,并提出了进一步研究的方向。 相似文献
3.
针对分布式环境中数据自治、异构和私有的特点,提出将现有数据挖掘算法分解为分布式统计信息获取和模型生成两部分.以决策树为研究对象,分析了分布式信息需求并设计了分布式挖掘算法步骤.通过性能分析,文中算法在数据自治和通信费用上比集中式算法有优势. 相似文献
4.
叙述了决策树方法的基本原理,对SPRINT算法的主要特点作了详细分析讨论.在此基础上,提出了两种有效的用于SPRINT算法的数据存储方法. 相似文献
5.
分析SPRINT方法的磁盘I/O,提出用读优化、写优化和磁盘文件搜索优化来减少SPRINT方法的磁盘I/O时间.读优化可使SPRINT方法省去一次读操作,写优化可以使SPRINT方法在交替层省去一次写操作,磁盘文件搜索优化可使SPRINT方法的磁盘文件搜索时间复杂性只和决策树的节点个数相关.这三种方法可单独使用,也可结合起来使用. 相似文献
1