首页 | 官方网站   微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 640 毫秒
1.
关联规则的挖掘是数据挖掘领域的重要研究内容之一.关联规则的挖掘算法大都在用户设置的支持度阈值的限制条件下,挖掘出数据属性之间的关系.但是没有相关领域的专门知识,用户很难设置合适的支持度阈值得到合适的结果.本文在Apriori算法的基础上,提出一种无支持度的关联规则挖掘方法.  相似文献   

2.
基于记录对比的关联规则挖掘算法设计   总被引:2,自引:0,他引:2  
介绍了数据挖掘及关联规则的基本概念、数据挖掘算法设计的基本方法、现在流行的基于“支持-可信度”的经典关联规则挖掘算法,有针对性地指出了基于“支持度-可信度”的关联规则挖掘算法的诸多不足之处,在此基础上提出了基于记录对比的关联规则算法设计思想。该算法不再认为数据源中的备条记录是独立的,而认为可以通过记录对比,从记录与记录的差异中,找出某种潜在的关系。最后对基于记录对比的关联规则挖掘算法和基于“支持度-可信度”的关联规则挖掘算法进行了对比分析。  相似文献   

3.
关联规则挖掘是数据挖掘的主要技术之一,现有的关联规则挖掘算法均基于支持度-置信度框架,当用户调整阈值时存在多次遍历数据库和重复计算问题。该文针对支持度阈值变化时的关联规则维护问题,提出了关联规则交互挖掘算法HIUA,该算法改进了原始IUA算法的剪枝过程,并通过Hash结构提高算法运行效率。在UCI数据集及企业实际财务数据集中的实验结果表明:在支持度阈值发生变化的过程中HIUA算法进一步利用已有挖掘结果,有效提高了关联规则挖掘的效率。  相似文献   

4.
一种基于关联规则的属性值约简算法   总被引:3,自引:1,他引:3  
数据约简是数据挖掘中的一个重要领域.将属性值约简和关联规则挖掘相结合.给出了支持度、置信度、属性值重要性的定义.在此基础上.提出一种新的用来进行数据挖掘的算法——基于关联规则的属性值约简算法.  相似文献   

5.
提高频繁项集挖掘算法的效率一直是数据挖掘领域中关联规则挖掘研究的一个重点。Apriori算法是一种经典的最有影响的挖掘关联规则的算法,该算法虽然能有效地挖掘出关联规则,但是产生的冗余规则多,效率低下。针对数据挖掘的现状及关联规则算法的瓶颈问题,提出一种基于串与运算的关联规则挖掘算法,并对关联规则挖掘的未来研究方向进行了展望。  相似文献   

6.
关联规则挖掘是目前数据挖掘的研究难点之一,介绍了关联规则的划分情况,对频集算法进行了改进,提出了处理数值型字段的基本方法,展望了关联规则挖掘的未来研究方向.  相似文献   

7.
针对使用传统关联规则算法挖掘大数据集时,挖掘过程中效率不高,挖掘出大量冗余规则的问题,提出了基于关联规则和相似度的数据挖掘算法(U-APR):首先,一次性读入数据并构建矩阵,并利用关联规则支持度度量的特性来增加判断属性,以加快结束迭代过程,从而改进了Apriori算法频繁扫描数据库问题;然后,使用相似度算法去除冗余的关联规则;最后,结合置信度、支持度和用户目标匹配度对挖掘结果进行排序输出,从而得到用户感兴趣的关联规则. 同时,应用该算法与目前常用的2种关联规则算法对广东某高校学生财务数据进行数据挖掘. 实验结果表明:与2种常用的关联规则算法相比,U-APR算法缩短了运算时间和提高了存储空间利用率,对用户分析挖掘结果有较好的优化效果.  相似文献   

8.
基于多支持度的挖掘加权关联规则算法   总被引:6,自引:0,他引:6  
关联规则挖掘是数据挖掘中一个重要的模型.在其挖掘算法中,如果最小支持度很高,则出现频率比较低的规则就不能发现;如果最小支持度太低,因为频繁项的相互关联,则会出现组合爆炸.为此,提出了允许用户设定多个最小支持度、给定数据各项的权重来解决这一问题.理论、实验数据和实际应用证明,该新算法可行且符合实际情况,比同类算法用时更少,对大型数据库的关联规则挖掘非常有效.  相似文献   

9.
关联规则挖掘是数据挖掘技术的一种简单又很实用的方法,有着广泛的应用。该文利用部分支持度树的结构提出了对关联规则的增量式更新算法,用于解决向数据库中添加新的数据而最小支持度不发生变化时的关联规则更新问题。该算法有效地利用已挖掘的关联规则和保留的部分支持度树来改善性能,并且只需对新增数据库部分进行一遍扫描,从而进一步提高算法的效率。实验结果表明,该算法能有效地解决关联规则的更新问题,提升挖掘效率。  相似文献   

10.
王娟 《科技信息》2011,(33):56-56,45
关联规则是数据挖掘的重要手段,它基于支持度、置信度等对规则进行筛选,生成有用的规则。关联规则反映了大量数据中项集之间的相互依存性和关联性。Apriori算法和FP-Growth算法是关联规则挖掘中的两个典型算法。本文阐述了这两种算法的基本思想、数据挖掘步骤,并讨论了它们的优缺点及差异。  相似文献   

11.
多层次规则挖掘的约略集方法   总被引:1,自引:0,他引:1  
约略集理论是一种能处理数据中不确定和噪音的有效数学工具,是数据挖掘的重要方法.结合数据分类层次,提出了利用约略集理论挖掘多层次规则的方法,挖掘过程包含约减的求解、等价类的构造、差别矩阵的建立、规则的挖掘4个阶段,并举例说明了多层次规则的挖掘过程.  相似文献   

12.
王现君  高莉 《河南科学》2007,25(6):988-991
通过加权平均算法(ML_TWA)发现多层关联规则.该算法针对现有多层关联规则挖掘中存在阈值定义不合理的情况,依据多层数据的特点,提出了一种加权平均阈值估计方法,来提高挖掘效率和结果的准确性.实验结果证明这种算法是有效的.  相似文献   

13.
关联规则挖掘是数据挖掘研究领域中的一个重要任务,旨在挖掘事务数据库中有意义的关联。随着大量数据不停的收集和存储,从数据库中挖掘关联规则显得越来越有必要性,关联规则挖掘的Apriori算法是数据库挖掘的最经典算法并得到广泛应用,在介绍关联规则挖掘和Apriori算法的基础上,发现Apriori算法存在着产生候选项目集效率低和频繁扫描数据等缺点。综述了Apriori算法的主要优化方法,并指出了Apriori算法在实际中的应用领域,提出了未来Apriori算法的研究方向和应用发展趋势。  相似文献   

14.
一个适用于地理信息系统的数据挖掘工具——GISMiner   总被引:6,自引:1,他引:6  
论文将常用于关系型、事务型数据库的面向属性归纳的方法和关联规则挖掘方法扩展至空间数据库,开发了适用于地理信息系统(GIS)的空间数据挖掘工具-GISMiner,并将其应用于从农田GIS中挖掘农田使用情况的空间特征规则,以及从农产品市场GIS中挖掘农产品价格与铁路、国道和河流间的空间关联规则实验。结果表明,GISMiner是一个实用的、能适应于GIS且能挖掘多种知识类型的数据挖掘工具。  相似文献   

15.
关联规则的研究是近几年研究较多的数据挖掘方法,在数据挖掘的各种方法中应用也最为广泛。在生产性企业的营销决策支持系统中应用关联规则挖掘数据,通过优化原有的算法可以提高算法效率,有效地得出有价值的规则,从而有力地支持了营销管理者的决策。  相似文献   

16.
属性约简和属性值约简是利用粗糙集理论从决策表中挖掘决策规则的基础,挖掘决策规则是粗糙集理论的重要研究领域之一。本文根据属性的重要度和条件差别矩阵来进行条件属性约简,找出有效约简。同时定义了决策表的不一致度,并根据属性重要度来进行属性值约简,在保持决策表不一致度不增加的前提下挖掘出决策规则,该决策规则集满足独立性、覆盖全域性、可接受性和一致性,即决策规则集为决策算法,最后运用实例对该方法的有效性进行说明。  相似文献   

17.
关联规则挖掘是数据挖掘研究的一个重要领域,传统的关联规则仅反映了正项之间的关联关系,无法反映出数据之间隐藏的负关联关系.从以下方面对含负项的关联规则挖掘进行了综述:引入负项的原因,包含正、负项的关联规则概念及相关术语,最新的含负项关联规则研究情况,经典算法的讨论.最后,展望了含负项关联规则领域未来的研究方向.  相似文献   

18.
数据挖掘关联规则Apriori算法的优化   总被引:3,自引:0,他引:3  
关联规则挖掘研究是数据挖掘研究的一项重要的内容.Apriori算法是挖掘关联规则的经典算法,但存在一些不足之处.本文在Apriori算法基础上,提出了基于链表数据结构的关联规则改进算法.由于该算法只需对交易数据库进行一次检索,故能大量减少所需的I/O次数,提高了系统的性能.  相似文献   

19.
对归纳逻辑思想在数据挖掘中的应用研究进行了综述。国外的研究主要集中在人工智能方面,重点是高阶归纳逻辑研究,通过多态归纳逻辑、机器学习等方面发展了归纳逻辑理论。国内的研究集中在知识发现方面,例如通过研究关联规则等探讨知识发现的内在机理。相对来说,国外的发展更偏重于应用领域,而国内也在不断扩展归纳逻辑的理论应用,但在数据挖掘领域研究仍然偏少。  相似文献   

20.
关联规则是数据挖掘中的一个重要研究方向.经典的Apriori算法是一种最有影响的挖掘布尔型关联规则频繁项集的算法,但其并不适合挖掘近年来兴起的多维数据模型.在改进Apriori算法的基础上,提出了一种"二次剪枝"的算法,此算法适用于挖掘多维关联规则,并且在一定程度上提高了算法效率.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司    京ICP备09084417号-23

京公网安备 11010802026262号