排序方式: 共有154条查询结果,搜索用时 0 毫秒
1.
挖掘大型数据库中的Apriori算法及其改进 总被引:11,自引:2,他引:11
宋中山 《中南民族大学学报(自然科学版)》2003,22(1):54-57
指出了Apriori算法是一种有效的关联规则挖掘算法,分析和探讨了Apriori算法,并给出了该算法的实现思想,通过实例说明了算法的执行过程,提出了对Apriori算法进行改进的一些方法:散列、事务压缩、划分、选样及动态项集计数。使用这些技术提高了算法的效率。 相似文献
2.
研究了联机数据挖掘系统中的并行和增量聚类算法,并给出了算法伪码。实验表明,联机增量聚类算法相对于传统的Apriori算法具有较大优势,同时证明了增量聚类算法及其联机数据挖掘系统的实用性。 相似文献
3.
4.
提出了满足DTD结构情况下XML查询语句中频繁路径的选择算法,即从大量的XML查询路径表达式中找出最频繁出现的路径.首先对XML查询语句进行离散化处理,然后基于不产生候选集的频繁模式挖掘算法,实现了XML频繁查询路径的选择,最后基于DTD结构重构包含频繁路径的XML查询.实验研究表明,所提出方法具有一定的有效性及合理性. 相似文献
5.
基于多源数据融合,利用关联规则分析中的Apriori算法研究天气条件、路面条件、养护作业等因素与车速变化的关联性,通过速度降低与回复现象有效评估冬季道路养护的效益.结果表明:车速变化与能见度、路面条件和降雪量具有较强关联性,与湿度、风向、工作日、节假日和流量没有相关性.通过数据挖掘技术将存储的多源数据转化为有效的知识和信息,从而可为冬季道路养护提供有效的决策支持. 相似文献
6.
针对Apriori算法的不足,提出了一种新的优化算法——IApriori.该算法应用散列技术优化产生频繁-2项集,优化连接操作减少连接判断的次数,通过对候选项集编码来减少扫描数据库的次数,优化逻辑"与"运算减少不必要的"与"操作次数,缩短生成频繁项集的时间.IApriori算法仅需3次扫描数据库.研究结果表明,该算法具有快速、直观、节省内存等优点. 相似文献
7.
在分析当前Apriori算法及其改进算法的基础上,提出了一种将Apriori算法与物流信息挖掘相结合的Apriori改进算法.通过Apriori改进算法与原Apriori算法挖掘结果的比较,说明了Apriori改进算法不仅缩小了剪枝扫描数据库的规模而且减少了生成频繁项目集的候选项目集. 相似文献
8.
Apriori是挖掘关联规则最经典的算法之一,针对该算法存在的瓶颈问题研究了基于MapReduce编程框架的简单Apriori并行算法;并在简单Apriori并行算法的基础上提出一种采用固定多阶段结合挖掘策略的改进算法——多阶段并行算法。实验结果表明,改进算法能缩短挖掘时间,提高执行的效率。 相似文献
9.
传统方法对学生综合素质测评比较单一,管理者常以测评分值来衡量学生的素质,而未对影响因子进行深入研究.在某高职院校学生成绩基础上,针对加权平均传统方法的不足,采用K-means算法对学生成绩进行聚类以此确定出优良等级,再运用Apriori算法对综合素质测评中思想素质、社会工作实践与文体活动创新素质、专业属性及学生成绩等影响因子蕴含知识进行挖掘.研究结果表明,思想素质在影响因子中起引领作用,且教学管理与学生管理相互依赖,这一算法的应用为管理者决策提供了依据. 相似文献