共查询到20条相似文献,搜索用时 46 毫秒
1.
关联规则挖掘算法研究 总被引:1,自引:0,他引:1
详细研究了关联规则数据挖掘,分析了存在的问题和不足,提出了一种频繁项集增量算法,用于对Apriori算法进行改进.实验表明,改进算法在运行效率上要比Apriori算法快一个数量级. 相似文献
2.
3.
4.
提出了基于数组的关联规则挖掘算法,该算法只扫描一次数据库,将数据库中的数据存于数组中,提高了内存的利用效率,同时也提高了算法效率. 相似文献
5.
快速关联规则挖掘算法 总被引:1,自引:0,他引:1
提出了一种新颖的关联规则挖掘算法QAIS,与经典两阶段式关联规则挖掘算法不同的是,它只需扫描一遍事务数据库,不需要生成候选集,并且可以方便的应用在增量式关联规则挖掘算法中,该算法经合成数据验证是有效的.同时针对关联规则生成过程中出现大量冗余规则的问题,还讨论了冗余关联规则去除的问题. 相似文献
6.
基于数据库约简的关联规则挖掘算法 总被引:7,自引:0,他引:7
通过对Apriori算法挖掘过程进行分析,提出了一种基于数据库约简的关联规则挖掘算法.该算法利用每趟挖掘中一些非频繁项集的超集、并集,逐步约简事务数据库中的事务,提高了关联规则的挖掘效率.在这些非频繁项集的基础上建立了数据库约简的定理和推论,并在Apriori算法的基础上设计了ApioriNEW算法.经过对算法进行分析和实验,算法ApioriNEW的挖掘效率比较高.一般情况下,平均可将挖掘效率提高约30%.ApioriNEW算法特别适合大型数据库的关联规则挖掘,已应用在网络故障诊断专家系统的知识获取中. 相似文献
7.
频繁项集的挖掘效率是关联规则产生的关键.针对经典Apriori算法的瓶颈,提出一种改进算法,通过数组结构来保存项集信息,只须扫描一遍数据库减少了时间开销.在自连接前进行项目计数,减少参加连接的项集数量,减少了候选项集的数量.通过实例证明,改进算法的效率更高. 相似文献
8.
本文首先介绍了关联规则数据挖掘的概念,分析了关联规则挖掘的核心算法Apriori,将该算法用于教务管理数据的分析处理,得出数据集中隐含的模式,以期对学校教务管理者提供决策支持。 相似文献
9.
传统的正关联规则主要考虑事务中所列举的项目,负关联规则不仅要考虑事务中所包含的项目,还要考虑事务中所不包含的项目,它包含了非常有价值的信息。本文对负关联规则的相关定义、支持度及置信度的计算方法进行了分析讨论,并讨论了对负关联规则挖掘中出现的矛盾规则问题及利用规则相关性解决矛盾规则问题,最后给出了其挖掘算法及其实现。 相似文献
10.
从大型事务数据库中发现关联规则是数据挖掘中的一个重要课题,其核心问题是挖掘频繁项集.经典Apriori算法是有效的挖掘频繁项目集的算法.在分析Apriori算法的基础上,提出了一种利用二维数组来代替算法中的哈希树的方法,可以迅速产生二阶频繁项目集,改善了Apriori算法的效率瓶颈,大大提高了算法的执行效率. 相似文献
11.
通过分析Web日志记录来发现用户访问行为等,进而识别电子商务中的潜在客户,提高网络信息服务的质量,优化站点结构以及得到对于个性化系统有用的信息.提出一个Web使用挖掘系统的设计方案,包括系统的体系结构、功能结构及每个功能点的详细设计.为Web使用系统开发人员提供有价值的参考信息. 相似文献
12.
提出了一种在Windows平台下检测变形病毒及未知病毒的新方法——以PE文件调用的WinAPI序列为特征,采用数据挖掘技术(OOA挖掘)来检测变形病毒及未知病毒.实验结果表明,本文所实现DMAV系统具有很好的鲁棒性和智能性,其中OOA规则生成器有效地解决了特征提取的优化问题。 相似文献
13.
多层关联规则涉及多个抽象层中的项,它是通过有概念分层的关联规则挖掘而产生的.传统的方法仅考察每个概念层次内是否有用户感兴趣的规则,而忽略了不同概念之间的规则.另外,很多挖掘出的规则并不是用户感兴趣的.提出的关联规则的下钻操作沿袭了OLAP中下钻的概念,它是通过对已经挖掘得到的用户感兴趣的规则进行再分析,挖掘出用户感兴趣的子关联规则,从而达高效挖掘多层关联规则的目的,且这种规则不局限于同一概念层次内. 相似文献
14.
15.
利用蛋白质的一级结构信息,采用三肽频数方法刻画蛋白质序列,将关联规则(association rule,AR)挖掘应用于蛋白质相互作用(protein-protein interactions,PPIs)的预测.计算结果表明,提出的方法在半胱氨酸不同分类的情况下都能够准确地预测蛋白质相互作用.最后,比较半胱氨酸的不同分类对预测结果的影响. 相似文献
16.
挖掘关联规则Apriori算法的一种改进 总被引:1,自引:0,他引:1
本研究在对Apriori算法分析的基础上,提出了改进的Apriori算法。改进后的算法采用矩阵表示数据库,减少了扫描事物数据库的次数;利用向量运算来实现频繁项集的计数,同时及时地去掉不必要的数据,减少了数据运算,从而提高了算法的运行效率。 相似文献
17.
李顺安 《西安联合大学学报》2004,7(2):73-76
讨论了对分类规则的挖掘采用基于关联的分类方法.关联分类规则挖掘方法主要包括两大处理步骤:第一步利用分类关联规则挖掘算法挖掘出有关的分类关联规则;第二步就是基于所挖掘出的分类关联规则构造一个分类器.详细介绍了该方法的实现算法和部分数据结构. 相似文献
18.
分析稀少数据的相关性是一种重要的、有价值的数据挖掘任务。运用面向关联规则的FP树构造方法,提出了一种特异关联规则挖掘算法RSFPA。该算法将包含特异模式的数据集压缩成一棵FP树,通过挖掘FP树来提取特异模式集,从而进一步提高了特异模式的挖掘效率。最后,利用恒星光谱作为数据集,实验验证了RSFPA算法的正确性和有效性。 相似文献
19.
传统的关联规则挖掘技术是从包含一组事务记录的数据库中发现一些事务项目间关系的信息。本文的工作,是致力于将关联规则的概念引入到Web日志挖掘系统中,将用户的访问路径以关联规则的形式表现出来,其目的在于从用户访问超文本系统的行为中发现用户的访问模式。将超文本系统看成是一种有向加权图,经过对可信度和支持度的重新定义,使之适合于用来表示用户的访问路径,并引出复合关联规则挖掘算法。 相似文献
20.
提出了一种基于权函数的改进型关联规则算法——CWA priori算法。该算法利用决策属性在挖掘中的作用,归约数据源中无价值或价值较小的记录,从而缩短程序运行时间和节约数据存储空间,较好地改进了算法性能。实验结果证明CWA priori算法的效率明显高于A priori算法。 相似文献