首页 | 官方网站   微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 80 毫秒
1.
佟强  周园春  吴开超    阎保平 《计算机工程》2007,33(10):34-35,6
提出了一种新的挖掘量化关联规则的方法。该方法使用聚类算法把数据库中的交易记录分成若干个簇,把簇投影到数值型属性所在的域,形成重叠的、有意义的区间。实验结果显示,这种方法能够有效地挖掘量化关联规则,并且能够发现以前的算法可能遗漏的重要的规则。  相似文献   

2.
本文提供了在数据挖掘中的关联规则的分类方式,对一些典型算法进行了分析,最后提出了广义的关联规则挖掘算法AR_SET,利用集合“或”、“与”运算求解频集(FrequentItemset),提高了挖掘的效率和速度。  相似文献   

3.
关联规则是数据挖掘的重要研究内容之一.传统的关联规则挖掘算法仅适于处理二元属性与分类属性.为更好地处理数量属性,提出了一种自适应的基于模糊概念的量化关联规则挖掘算法.该算法克服了传统的离散分区法的不足,改进了已有模糊关联规则支持度的计算方法.引入了一种基于聚类的隶属函数自动生成方法,使得模糊关联规则的发现不依赖于人类专家给出的隶属函数,使得关联规则的表示自然、简明,有利于专家理解.实验表明该算法是有效的.  相似文献   

4.
量化关联规则挖掘及算法   总被引:2,自引:0,他引:2  
提出了一种新的量化关联规则挖掘算法QAR及其增量式更新算法IUQAR.算法以模糊集理论为基础,利用模糊概念表示量化属性属性间的关联关系,克服了传统的离散分区方法的不足,使得规则的表示自然、简明,有利于专家理解。同时,给出的算法IUQAR,有效地解决了规则的维护问题。  相似文献   

5.
提出利用模糊属性集和关联规则的支持度获得高效率的关联规则增量更新挖掘的方法。首先对输入数据集进行模糊离散化,确定相应的模糊属性集,模糊支持数和各属性原先的模糊聚类中心;然后检查是否满足最小支持度条件,将其添加到更新后的模糊频繁属性集集合中;最后比较模糊频繁属性集和负边界的变化,得到最终更新后的模糊频繁属性集和相应的关联规则。采用实际飞行数据验证了该算法可以避免反复和多层扫描数据库的时间消耗问题,模糊关联规则挖掘算法可以高效和准确提取增量关联规则。  相似文献   

6.
为了保证用户信息不被有意或无意地泄漏,根据数据库中量化属性值和分类属性值数量的不同,分别提出了基于布尔关联规则、基于部分变换机制和基于概率变换的量化关联规则隐私保持挖掘方法.对于每一种方法都进行了隐私度和正确度分析,并通过实验验证其正确性和可行性.  相似文献   

7.
提出了一种基于聚类的挖掘关联规则Apriori改进算法,该算法只需扫描一次事务数据库,直接按事务项数生成聚类表,每次只需扫描部分聚类表就可生成频繁项集,减少了扫描数据库的次数和计算成本,从而有效提高挖掘关联规则的效率。  相似文献   

8.
胡和平  刘冰 《计算机工程》2000,26(12):97-98,172
量化关联规则的挖掘是数据挖掘的一项重要任务。该文介绍了一种高效的算法,用于挖掘特定形式的量化关联规则。该算法不仅效率高而且很好地解决了区间分隔引起的规则冗余等一系列问题。最后对能够挖掘的规则形式进行了扩展。  相似文献   

9.
时态关联规则挖掘是针对在一段时间范围内的关联挖掘,在现实中有较多的应用。现有的大多数时态关联挖掘算法或者需要多次扫描数据库,或者没有考虑各个项在数据集上出现或结束时间上的不同,因而挖掘性能受到较大的制约。为此,本文提出一种增量式的面向具有不同时间出现与结束的项的时态关联规则挖掘算法。为减少存储方面的开销,只需保存已挖掘过的历史数据集中的频繁1项集。为了减少数据的扫描量,通过有效的剪枝策略,有选择性地扫描相关事务项,至多只需扫描一次完整的数据库。实验证明,该算法具有较好的挖掘性能。  相似文献   

10.
关联规则的发现是数据挖掘的一个重要方面,而数量关联规则的发现不同于传统的布尔型关联规则。属性值的离散映射是挖掘定量关联规则的一个重要环节,离散映射中属性值区间的划分粒度是影响数据挖掘质量的一个重要因素。该文介绍几种发现大型事务数据库中数量关联规则的算法,并对他们加以比较。  相似文献   

11.
用模糊方法挖掘量化关联规则   总被引:9,自引:0,他引:9  
量化关联规则挖掘的一个关键问题是对连续数量值属性的划分,论文采用模糊划分来解决这个问题,实现了数据的平滑过渡,并在此基础上给出了模糊量化关联规则的形式化定义和挖掘算法。  相似文献   

12.
根据数据库中量化属性值和分类属性值数量的不同,分别提出了基于布尔关联规则的量化关联规则隐私保持挖掘方法和基于部分变换机制的量化关联规则隐私保持挖掘方法。对于每一种方法都进行了隐私度和正确度分析,并通过实验证明了其正确性和可行性。  相似文献   

13.
一种新的多值属性关联规则挖掘算法   总被引:1,自引:0,他引:1       下载免费PDF全文
为解决多值属性的关联规则挖掘问题给出相似属性集合矩阵的概念,提出一种新的多值关联规则挖掘算法——Qarmasm算法。该算法无须扩展事务属性,约简效率高,能够直接生成候选频繁项集,求出其支持度,有效地发现频繁项。给出算法的描述及其复杂性分析。与经典算法的对比表明,该算法具有明显的优势。  相似文献   

14.
正负关联规则挖掘算法研究   总被引:6,自引:0,他引:6  
本文提出了一种快速有效的正、负关联规则挖掘算法 MPNAR。另外,针对关联规則挖掘算法中支持数计算的复杂性,提出了一种基于二进制形式的支持数计算方法。实验结果表明算法 MPNAR 是有效和可行的。  相似文献   

15.
Mining Fuzzy Multiple-Level Association Rules from Quantitative Data   总被引:2,自引:0,他引:2  
Machine-learning and data-mining techniques have been developed to turn data into useful task-oriented knowledge. Most algorithms for mining association rules identify relationships among transactions using binary values and find rules at a single-concept level. Transactions with quantitative values and items with hierarchical relationships are, however, commonly seen in real-world applications. This paper proposes a fuzzy multiple-level mining algorithm for extracting knowledge implicit in transactions stored as quantitative values. The proposed algorithm adopts a top-down progressively deepening approach to finding large itemsets. It integrates fuzzy-set concepts, data-mining technologies and multiple-level taxonomy to find fuzzy association rules from transaction data sets. Each item uses only the linguistic term with the maximum cardinality in later mining processes, thus making the number of fuzzy regions to be processed the same as the number of original items. The algorithm therefore focuses on the most important linguistic terms for reduced time complexity.  相似文献   

16.
发掘多值属性的关联规则   总被引:45,自引:1,他引:45  
张朝晖  陆玉昌  张钹 《软件学报》1998,9(11):801-805
属性值可以取布尔量或多值量.从以布尔量描述的数据中发掘关联规则已经有比较成熟的系统和方法,而对于多值量则不然.将多值量的数据转化为布尔型的数据是一条方便、有效的途径.提出一种算法,根据数据本身的情况决定多值量的划分,进而将划分后的区段映射为布尔量,在此基础上可发掘容易理解且具有概括性的、有效的关联规则.  相似文献   

17.
加权关联规则的并行挖掘算法   总被引:4,自引:1,他引:4  
关联规则是数据挖掘的重要研究内容之一,而传统的算法均为串行算法且将数据库项目按平等一致方式加以处理。文章提出了加权关联规则的并行挖掘算法,探讨了相关的数据结构,并对算法进行了定性分析。  相似文献   

18.
马慧  汤庸  潘炎 《计算机工程》2006,32(17):132-134
随着各种形式的数据的迅速增长,业务数据中的时态信息挖掘问题受到人们普遍关注。该文提出了一种带有效时间区间的时态关联规则,给出了一种基于FP-树的挖掘方法。该方法利用分区挖掘的思想,以分区为单位表示项集的有效时间区间,并为每个分区构建FP-树,大大简化了对某个项集在其有效时间区间中的出现次数的计算,从而更有效地计算时态置信度。最后用一个例子对该方法的执行过程进行了阐述。  相似文献   

19.
关联规则的发现是整个数据挖掘课题中的重要组成部分。在归纳现有关联规则研究的基础上提出了事务间数值型关联规则的数据挖掘问题,并对该问题进行了定义。应用模糊理论和相关的数据挖掘技术,提出了解决该问题的E—QA算法,并以实例对算法可行性进行验证,指出了算法存在的一些问题以及今后解决这些问题的思路。  相似文献   

20.
刘均  李人厚  郑庆华 《计算机工程》2005,31(9):17-18,33
针对基于区间划分的数值型关联规则分析方法存在的问题,提出了一种基于进制转换的分析方法.此方法将十进制的属性值转换为二进制,并将二进制数值的每一位映射为二个布尔型属性,在此基础上,再采用布尔型关联规则分析方法.相对于基于区间划分的方法,此方法的优点是转化过程不存在失真,且能有效地降低后续分析过程的时间复杂度.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司    京ICP备09084417号-23

京公网安备 11010802026262号