首页 | 官方网站   微博 | 高级检索  
相似文献
 共查询到17条相似文献,搜索用时 87 毫秒
1.
一种基于事务压缩的关联规则优化算法   总被引:10,自引:0,他引:10  
通过对Apriori算法挖掘过程进行分析,提出了一种基于事务压缩的关联规则挖掘算法.该算法充分利用Apriori性质,通过减少候选集的组合和减少数据库的扫描来提高挖掘的速度和减少数据库的I/O操作时间的开销,有效提高了关联规则的挖掘效率.并在Apriori算法的基础上设计了Apriori改进算法.  相似文献   

2.
结合模糊集和不确定性推理等理论,对数据挖掘诸多问题进行了系统的描述,尤其注重详细介绍关联规则问题。在研究现有算法的基础之上,提出自己的基于变换矩阵形式的相似度量基础上的多维事务间及事务间关联规则的挖掘算法及模型,从而使得挖掘效率得到提高。  相似文献   

3.
在Apriori算法善础上.提出一种基于事务矩阵的改进算法.  相似文献   

4.
关联规则挖掘搜索给定数据集中反复出现的数据模式,找到它们之间的相关性。分析了经典Apriori算法存在的时空效率低的缺点和数据形式对算法效率的影响。提出一种基于动态散列和事务压缩技术的改进,动态应用散列技术减小候选频繁项集的规模和数据库扫描次数,应用事务压缩技术缩小数据库中事务量的长度和总数,从而提高了算法的时间空间效率。与Apriori算法进行的比较验证了新算法的正确性与效率。  相似文献   

5.
为了能有效地分析高校体能测试数据且快速地反馈影响学生体测成绩的因素,本文以我校体能测试数据为样本,先进行数据预处理转换成适用于数据挖掘的数据集,考虑到体测数据特征有限并且长度一致的特点,采用事务压缩技术与hash技术相结合的Apriori算法进行数据分析,减少了遍历数据库的次数和生成的候选项集的规模,在保证挖掘精度的同...  相似文献   

6.
Apriori算法是数据挖掘领域挖掘关联规则频繁项目集的经典算法,但该算法存在产生大量的候选项目集及需要多次扫描数据库的缺陷。为此提出一种新的挖掘关联规则频繁项目集算法( CApriori算法):利用分解事务矩阵来压缩存放数据库的相关信息,进而对分解事务矩阵进行关联规则挖掘;优化了由频繁k -1项目集生成频繁k项目集的连接过程;提出了一种不需要扫描数据库,利用行集“与运算”快速计算支持数的方法,改进算法挖掘所有的频繁项目集只需扫描数据库两次。实验结果表明,改进算法在最小支持度较小时效率高于Apriori算法。  相似文献   

7.
8.
针对在关联规则中的Apriori算法进行了深入研究的基础上,提出了一种基于压缩矩阵的关联规则挖掘算法(CMApriori算法)。该算法只需扫描一次数据库,在矩阵上采用事务压缩和项目压缩技术,节省了数据占用的内存空间。在对建立好的压缩矩阵上只需进行简单的计数运算即可得到频繁项集。仿真实验证明:该算法与Apriori算法相比,运算效率大大提高。  相似文献   

9.
王琼  曹奎 《福建电脑》2012,28(12):84-86
关联规则的提取是数据挖掘中重要的研究课题,目的在于挖掘事务数据库中有趣的关联,Apriori算法是挖掘关联规则的经典算法。该文对Apriori算法进行研究,发现该算法存在着一些缺点,并对其进行改进,用实例说明这些改进能够正确有效的实现该算法。  相似文献   

10.
陈晓春 《福建电脑》2012,28(4):92-93
对关联规则经典算法中的Apriori算法进行了深入研究与分析,针对其需要反复扫描事务数据库,造成大量I/O开销,影响关联规则挖掘效率这一不足之处,提出了改进,并通过测试程序验证了算法改进的可行性。  相似文献   

11.
Apriori挖掘频繁项目集算法的改进   总被引:2,自引:0,他引:2       下载免费PDF全文
针对Apriori算法的不足,提出了一种新的优化算法Napriori。算法从优化产生2-项目集、事务压缩、项目压缩、优化连接等几个方面对Apriori算法进行优化,将散列技术应用于产生1-项目集和2-项目集,将压缩优化和连接优化应用于k-项目集。实验结果表明,Napriori算法运行速度比Apriori算法有了明显的提高。  相似文献   

12.
针对关联规则中Apriori算法存在的缺点,提出了一种基于布尔矩阵约简的Apriori改进算法。在该算法中,将事务数据库转换为布尔矩阵,并在矩阵最后增加1行2列,用来记录相同事务的个数和矩阵行与列中"1"的个数。将矩阵各列元素按支持数升序排列,使得算法在压缩过程中减少了扫描矩阵各列的次数,缩短了算法的运行时间。另外,为了提高算法的存储空间利用率,增加了删除非频繁项集的操作。实验结果和性能分析表明,相比现有的算法,改进后的算法具有更好的性能,能够有效地提高算法执行效率。  相似文献   

13.
14.
关联规则挖掘Apriori算法的改进   总被引:3,自引:0,他引:3  
在分析研究关联规则挖掘Apriori算法及其若干改进算法的基础上,对Apriori算法做了进一步地改进,提出一种基于条件判断的新思想.改进后的算法根据条件采用了事务压缩与候选项压缩的相结合的方式,减小了不必要的开销,从而提高了挖掘速度.  相似文献   

15.
一种基于事务修剪的约束关联规则的挖掘算法   总被引:2,自引:0,他引:2  
陈义明  贺勇 《计算机应用》2005,25(11):2627-2629
针对一类常见而简单的规则中有项或缺项的约束,提出了一种基于事务数据修剪的约束关联规则的快速挖掘算法。该算法先扫描一遍数据库对事务进行水平和纵向的修剪,接着在修剪后的数据集上挖掘频繁项集,形成规则的候选头集、体集和规则项集,最后一次扫描后由最小可信度约束得到所要求的关联规则。实验表明,与按简洁约束采取的一般策略相比,该算法的性能有较明显的提高。  相似文献   

16.
介绍了关联规则的常用理论,研究了关联规则中的标准Apriori算法,针对其不足进行了有益的改进,提出了一种新的加权关联规则挖掘算法,并分析了其主要特点。通过把该算法用于电子商务数据挖掘中,并与标准Apriori算法的对比分析,证明了这种新的加权关联规则挖掘算法的有效性。  相似文献   

17.
提出一种基于事务互补的双向挖掘算法,其适合挖掘任何长度的频繁项目集;该算法通过二进制的逻辑操作,用自顶向下策略和事务补集方式双向产生频繁候选项,并在计算支持数时用事务特征减少搜索事务数;通过与其他算法相比,实验表明它是快速而有效的。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司    京ICP备09084417号-23

京公网安备 11010802026262号