首页 | 官方网站   微博 | 高级检索  
相似文献
 共查询到18条相似文献,搜索用时 140 毫秒
1.
一种多重最小支持度关联规则挖掘算法   总被引:5,自引:0,他引:5  
针对单一最小支持度挖掘关联规则不能反应不同数据项出现频度与性质的问题,提出了一个基于频繁模式树的多重支持度关联规则挖掘算法MSDMFIA(Multiple minimum Supports for Discover Maximum Fre-quent Item sets Algorithm),根据不同数据项的特点定义多重支持度,通过挖掘数据库中的最大频繁项目集,计算最大频繁候选项目集在数据库中的支持度来发现关联规则.该算法可以解决关联规则挖掘中经常出现的稀少数据项问题,并解决了传统的关联规则挖掘算法中的生成频繁候选集和多次扫描数据库的性能瓶颈.实验结果表明,本文提出的算法在功能和性能方面均优于已有算法.  相似文献   

2.
传统的基于支持度—置信度框架的关联规则挖掘方法可能会产生大量不相关的、甚至是误导的关联规则,同时也不能区分正负关联规则。在充分考虑用户感兴趣模式的基础上,采用一阶谓词逻辑作为用户感兴趣的背景知识表示技术,提出了一种基于背景知识的包含正负项目集的频繁模式树,给出了针对正负项目集的约束频繁模式树的构造算法NCFP-Construct,从而提高了关联规则挖掘的效率和针对性,实验结果显示该方法是有效的。  相似文献   

3.
给出了页面兴趣度的定义,并针对传统的Apriori关联规则算法必须经过大量反复扫描数据库才能产生候选项集的问题,提出了一种改进算法.此算法将数据库经过预处理后,对事务数据库进行分段,比较时可不针对所有事务记录,从而减少比较时间.最后将页面兴趣度应用于改进的Apriori算法中,形成一种基于页面兴趣度的关联规则算法--I_NEW_AR算法.实验结果表明,该算法不仅提高了挖掘效率,而且应用于网上推荐系统具有较好的准确率.  相似文献   

4.
发现最大频繁项目集是关联规则挖掘的重要步骤,针对关联规则挖掘中最小支持度发生变化的增量式更新问题,提出了高效发现最大频繁项目集的更新算法.该算法在FP树的基础上增加了记录各项目支持数的表,在头表中增加了域,从而减少了访问事务数据库和FP树的时间,提高了发现最大频繁项目集的效率.  相似文献   

5.
对Apriori算法加以改进,提出了一种更高效的关联规则挖掘算法,在扫描数据库的同时把支持每个项目的事务都标记出来,采用一种新的方法来计算候选项目集的支持度.该算法只需对源数据库进行一次扫描,就可以找出所有的频繁集,具有很高的效率.  相似文献   

6.
发现最大频繁项目集是关联规则挖掘的重要步骤,针对关联规则挖掘中最小支持度发生变化的增量式更新问题,提出了高效发现最大频繁项目集的更新算法.该算法在FP树的基础上增加了记录各项目支持数的表,在头表中增加了域,从而减少了访问事务数据库和FP树的时间,提高了发现最大频繁项目集的效率.  相似文献   

7.
针对传统协同过滤推荐算法在用户评分数据极端稀疏情况下无法取得令人满意的推荐质量问题,结合User-based 和Item-based 协同过滤算法思想,提出了一种基于选择性预测策略的协同过滤推荐算法,算法利用高相似度阈值来计算用户相似性和项目相似性,并通过形成用户最近邻居集和项目最近邻居集来预测填充评分矩阵。基于Movielens数据集的实验表明,改进的算法有效改善了传统协同过滤推荐算法的数据稀疏性和扩展性问题,明显提高了系统的推荐质量。  相似文献   

8.
作为推荐系统的一种模式,购物篮分析不同于基于用户的和基于项目的协同过滤推荐,而是根据商品在购物篮中的组合进行聚类分析,使用关联规则挖掘算法得到关联规则集并用于推荐商品。利用提升度公式可推导出两种关联规则的等价关系,对Apriori算法得到的关联规则集作冗余精简处理,实验表明精简率可达到60%以上。  相似文献   

9.
提出了一种基于支持度计数矩阵(Support Count Matrix)和事务布尔矩阵(Transaction Bool Matrix)的关联规则挖掘算法TB-SCM,此算法只需要扫描一次数据库来生成支持度计数矩阵和事务布尔矩阵,通过扫描这两个矩阵就可以得到频繁模式的完全集,并产生满足最小支持度和最小置信度的强关联规则.并把该算法用来分析教学效果与教师的性别、年龄、职称、学位等因素关联,为教学部门提供决策支持信息,更好地提高教学质量.  相似文献   

10.
针对传统协同过滤推荐算法模型过于粗糙和推荐精度较低的问题,提出了一种新的基于用户量化属性的多维相似度的协同过滤推荐算法.该算法考虑到个别项目对相似度计算的影响,利用最大差值特性进一步描述用户评分相似度,并结合用户量化属性,构建用户兴趣偏好模型,依此阐明了新的相似度计算方法,利用该方法获取目标用户的近邻用户和预测评分,最终实施推荐.实验结果表明该算法可以有效的提高推荐质量.  相似文献   

11.
敏感性关联规则的隐藏是最大程度地保持原始数据集的其他特征,保证敏感规则不被挖掘出来.针对已有的基于对原始数据集中事务修改的方法产生大量I/O操作的问题,提出了基于频繁模式树(FP-tree)的敏感性关联规则隐藏的方法.该方法首先利用FP-tree存储了与事务数据库相关的全部信息,减少了产生和测试候选集耗费的大量时间;再利用改进的频繁模式树(IFP-tree)是单向的,快速挖掘出最大频繁项目集,确定敏感性关联规则;然后删除敏感关联规则对应的频繁项目集,更新IFP-tree项目集节点和相应的项目头表的计数,对更新的IFP-tree反向挖掘生成新的不包含敏感关联规则的事务数据库.实例和理论分析表明,该方法是正确和高效的.  相似文献   

12.
针对Apriori算法需要频繁扫描事务数据库并且会产生大量候选项集的不足,提出一种改进的Apriori算法。采用矩阵压缩的思想,增加了3个向量,分别表示事务矩阵中各行各列1的个数,即事务项目数和项目支持数,以及重复的事务出现次数,从而减小矩阵规模,避免多次扫描数据库。在矩阵运算过程中,对矩阵中事务项目数和项目支持数进行排序并删除不满足条件的项集和非频繁项集,形成新的矩阵结构,提高空间效率。对改进后的算法进行性能分析和试验分析发现,该算法相对于Apriori算法具有更高的效率,同时可以更有效的挖掘出频繁项集。  相似文献   

13.
为进一步解决对大型数据库进行关联规则挖掘时产生的CPU时间开销大和I/O操作频繁问题,给出一种改进的关联规则挖掘算法(ARMAC).该算法引入有向无环图和tidlist结构用以提高频繁项目集的计算效率,并将数据库划分为内存可以满足要求的若干部分,解决了对大型数据库挖掘时磁盘操作频繁的问题,从而有效地适用于大型数据库的关联规则挖掘.该算法吸取连续关联规则挖掘(CARMA)算法的优势,只需扫描两次数据库便可完成挖掘过程.实验结果表明:该算法在大型事务数据库中具有更高的执行效率.  相似文献   

14.
Apriori算法的改进   总被引:2,自引:0,他引:2  
针对Apriori算法要多次扫描事务数据库以及生成大量候选集缺陷,在候选集C_1中增加事务标识符列表Tid_list实现只扫描一遍事务数据库,利用频繁项目集的性质来减少生成候选集的数量,提高了算法效率.  相似文献   

15.
随着数据库规模的日益增大,关联规则挖掘需要在挖掘效率、可用性、隐私性及精确性等方面得到提升,需要对传统的关联规则挖掘算法进行更新和改进。在传统的Apriori算法基础上,提出了一种新的在关系数据库中挖掘关联规则的算法。该算法只需扫描一次数据库即可得到频繁项集,并通过非频繁项集来减少候选项集的生成,从而提高了算法的运算效率;此外,该算法将包含敏感数据事务做相关的处理,以达到隐藏包含敏感数据的关联规则。理论分析和实验结果表明,新算法不仅提高了关联规则挖掘的效率,而且还达到了隐藏包含敏感规则的目的。  相似文献   

16.
对Web日志数据进行收集、预处理、划分事务并产生具备分类关联规则挖掘条件事务集,然后采用矩阵算法挖掘事务集中的关联规则,并利用关联规则构造分类器来对Web用户进行分类,同时对矩阵算法进行了改进.实验表明此方法是有效的.  相似文献   

17.
提出一种基于强关联规则的可行动分簇算法(AC_SAR)。AC_SAR算法为每一个对象寻找关联性最强的对象,并通过反对称原则和可连接原则删除和合并相应规则,最终挖掘出涉及事务数据库中所有对象的多个连通子图(簇)。与传统算法相比,新算法无需设置阈值,没有冗余知识,算法的中间挖掘结果及最终生成的簇,能有效地解决诸多领域的实际问题。大量试验结果表明,该新算法具有较高的效率、准确性以及较强的可行动性。  相似文献   

18.
本研究在对Apriori算法分析的基础上,提出了改进的Apriori算法。改进后的算法采用矩阵表示数据库,减少了扫描事物数据库的次数;利用向量运算来实现频繁项集的计数,同时及时地去掉不必要的数据,减少了数据运算,从而提高了算法的运行效率。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司    京ICP备09084417号-23

京公网安备 11010802026262号