排序方式: 共有108条查询结果,搜索用时 0 毫秒
81.
从大规模数据库中挖掘关联规则是数据挖掘研究的一个重要问题.基于内存共享的对称多处理器系统SMP是目前广泛应用的并行计算系统,在关联规则串行挖掘算法Apriori的基础上,针对SMP系统设计一种基于Hash树的并行算法.理论分析和实验表明算法是有效的,具有良好的加速比. 相似文献
82.
83.
关联挖掘在耕地流失原因分析上的应用研究 总被引:1,自引:0,他引:1
在传统算法的基础上,针对耕地流失原因分析时关心的规则后件只包含一个主要因素的特点,提出了改进的基于约束的频繁谓词集和关联规则生成算法,从而大大减少谓词集元素和无趣规则的数量,为该类问题提供了一个有效解决方法。实验证明该方法具有较好的有效性。 相似文献
84.
给出解决海量数据库序列模式的挖掘问题的算法.首先采用分布式概念格的思想对数据进行划分,根据子全概念生成相应的子形式背景,选择最优的算法对子形式背景上建格(即子格),所有子格建好后,再对子格进行序列模式的挖掘,合并后得到整个数据库的序列模式. 相似文献
85.
文章介绍了在小样本空间中,采用动态调整样本空间数据的手段来提高预测精度;在调整样本数据时,以基于时间相关误差的参数为判断依据,并给出了一个实际算法用例;通过动态改变样本域中数据,提高在小样本空间条件下回归预测的精度,从而能更好地判断数据是否合理,以达到控制数据风险的目的。 相似文献
86.
一种基于粗集的决策表属性值约简改进算法 总被引:1,自引:1,他引:1
属性约简和值约简是粗糙集理论中的重要内容.文章提出一种适用于决策表的属性值约简改进算法AVRIMC,对分辨矩阵中的每一行,直接利用吸收率和求得的值核信息,优化该行后续元素的构造;最后用UCI数据集进行实验,并与文献中算法相比较,结果表明本算法在保持正确性的基础上,时间性能有一定程度的改进. 相似文献
87.
发现频繁项集是关联规则挖掘的关键步骤。然而,大多数频繁项集求解算法因需要产生大量候选集而降低了效率。该文在研究概念格和频繁项集关系的基础上,将剪枝概念格PCL模型引入数据库中频繁项集的表示,利用概念间的关系性质,在不丢失信息的同时能有效压缩频繁项集的规模,并提出基于PCL模型的频繁项集求解算法。该算法基于Apriori性质,在构造过程中及时、动态地剪枝,删除与频繁项集求解无关的概念,从而有效地改善了频集挖掘算法的时空性能;实验证实了算法良好的性能。 相似文献
88.
基于粗集的混合变量决策树构造算法研究 总被引:1,自引:1,他引:1
文章提出混合变量决策树结构,并在此基础上提出基于粗集理论的混合变量决策树构造算法RSH2,算法在每个结点选择尽可能少的属性明确划分尽可能多的实例,减小了决策树规模,且易于理解。将RSH2算法与ID3算法及基于粗集的单变量决策树算法HACRs进行实验比较,结果表明该算法有良好性能。 相似文献
89.
Web日志挖掘中数据预处理技术研究 总被引:2,自引:0,他引:2
Web日志挖掘的基本思想是将数据挖掘技术应用于Web日志数据源。在数据挖掘研究领域中,数据预处理起着至关重要的作用。Web日志挖掘的数据源最主要的是Web日志,根据Web日志的特点,在预处理过程中的会话识别阶段给出一种基于过滤框架网页与页面访问时间阈值相结合的会话识别方法,实验数据验证说明该方法可以显著地提高Web日志挖掘结果的兴趣性。 相似文献
90.
文章针对具有多重多层次的属性泛化问题构建了MRML泛化模型,并应用于分类规则的学习,提出一种基于MRML泛化关系的分类规则泛化学习方法(CG-DK);该方法根据具体发现任务的需求和当前实际数据库的内容,通过误分类率的控制,在挖掘的过程中选择最紧凑的泛化层次和路径对属性进行泛化,以得到符合用户个性化要求的优化的分类规则;实验表明了该方法的有效性. 相似文献