首页 | 官方网站   微博 | 高级检索  
相似文献
 共查询到18条相似文献,搜索用时 187 毫秒
1.
基于关联规则挖掘技术,结合销售数据特征,提出了一个基于SQL的多层关联规则挖掘算法,允许用户自定义概念层次.实验结果表明,该算法可行且有效,有良好的用户交互性,能够支持品类管理中高效陈列和促销的应用.  相似文献   

2.
基于概念的关联规则的挖掘   总被引:2,自引:0,他引:2  
关联规则是数据挖掘研究的重要内容。本文提出的基于概念的关联规则的挖掘算法AR_concept是对基于分类的挖掘算法的拓搌 ,提高了挖掘的效率和结果的有趣性。实验结果表明算法是有效的。  相似文献   

3.
针对传统的关联规则在试卷评估中应用出现的问题:由于试题的难易程度不同,被答对的概率也不一样,即数据集中数据项发生的概率不一样,数据项具有倾斜支持度分布的特征,选择合适的支持度阈值挖掘这样的数据集相当棘手。文章提出了基于试题难度系数加权的关联规则挖掘算法,从而解决因试题难度不同而导致数据项出现的概率不均的问题,发现更多有趣的关联规则,并且理论上证明了基于难度系数的加权关联规则算法保持频繁项集向下封闭的重要特性。  相似文献   

4.
对挖掘关联规则中的FUP算法的关键思想以及性能进行了研究,针对挖掘关联规则中FUP算法的不足,提出了一种基于临时表的改进算法MFUP.该算法通过建立临时表,充分利用原数据库挖掘的结果,从而大大减少了对数据的重复扫描,提高了数据挖掘算法的效率.通过实例分析,说明了MFUP算法的优越性.  相似文献   

5.
针对使用传统关联规则算法挖掘大数据集时,挖掘过程中效率不高,挖掘出大量冗余规则的问题,提出了基于关联规则和相似度的数据挖掘算法(U-APR):首先,一次性读入数据并构建矩阵,并利用关联规则支持度度量的特性来增加判断属性,以加快结束迭代过程,从而改进了Apriori算法频繁扫描数据库问题;然后,使用相似度算法去除冗余的关联规则;最后,结合置信度、支持度和用户目标匹配度对挖掘结果进行排序输出,从而得到用户感兴趣的关联规则. 同时,应用该算法与目前常用的2种关联规则算法对广东某高校学生财务数据进行数据挖掘. 实验结果表明:与2种常用的关联规则算法相比,U-APR算法缩短了运算时间和提高了存储空间利用率,对用户分析挖掘结果有较好的优化效果.  相似文献   

6.
孙序 《科技信息》2011,(27):I0045-I0047
最频繁项集挖掘是文本关联规则挖掘中研究的重点和难点,它直接决定了文本关联规则挖掘算法的效率。本文首先分析了当前在最频繁项集挖掘方面的不足,然后给出了几个命题和推论,紧接着结合最小支持度阈值动态调整策略,提出了一个基于倒排表和集合的TOP-N最频繁项集挖掘IntvSet算法,最后对所提算法进行验证。实验结果表明,该算法的规则有效率和时间性能比常用的两个TOP-N最频繁项集挖掘算法:NApriori算法,IntvMatrix算法都好。  相似文献   

7.
约束关联规则挖掘是根据用户提出的各种约束条件从交易数据库中挖掘出用户感兴趣的关联规则。该文针对目前提出的诸多约束关联挖掘算法只适应于静态数据库的情况,且挖掘出的约束关联规则存在效率低等缺点,提出一种基于倒排索引树的增量更新约束关联规则挖掘算法UPC-IITree,该算法将树型结构与倒排索引相结合,以实现无需扫描原始数据库和不产生候选项集的情况下,解决原始DB新增数据集时能高效地维护满足用户给定约束条件的关联规则。通过实验与其他相关算法进行对比,实验结果表明,UPC-IITree算法减少了算法的执行时间,节约了内存空间,提高了挖掘效率。  相似文献   

8.
在挖掘关联规则和序列模式过程中,用户往往需要多次调整最小支持度,才能获得有趣的关联规则和序列模式.现给出基于已存信息的知识发现更新方法———PSI算法和大PSI-seq算法,以提高挖掘知识的效率.  相似文献   

9.
基于规则的推荐技术在数据集上挖掘项目关联和用户关联为当前用户做推荐.用户关联挖掘是使用用户关联进行推荐的关键.首先证明在整个数据集上挖掘到的关于当前用户的用户关联集是只在包含当前用户评价的数据集上挖掘到的关于当前用户的用户关联集的子集,提出基于两阶段计数的用户关联挖掘框架,然后应用概念格技术实现了基于两阶段计数的用户关联挖掘算法,并通过实验表明该算法具有更好的性能.  相似文献   

10.
关联规则挖掘算法是数据挖掘中非常重要的部分。通过对有趣度参数和列联表规整化的研究,进一步改进了对关联规则挖掘算法。并指出文献[1]中存在的对稳健统计概念的曲解。  相似文献   

11.
一种高效关联规则挖掘算法   总被引:1,自引:0,他引:1  
为了提高关联规则挖掘算法处理数据库的效率,在研究AprioriTid算法的基础上提出一种高效的关联规则挖掘算法AprioriTidD,在计算数据库中的频繁项集时依靠有效的裁剪减少无效项集的产生,并且可减少产生候选项集,从而有效地提高算法的效率.选取程序模拟超市购物产生的3个试验数据集,应用AprioriTidD算法对该...  相似文献   

12.
基于遗传算法和粗糙集理论的增量式规则获取方法   总被引:1,自引:0,他引:1  
规则获取的增量式算法是数据挖掘领域的一个热点问题.基于粗糙集理论,从规则获取和优化两方面研究了基于遗传算法的增量式规则挖掘方法,它具有结构简单、搜索效率高、求解速度快等优点.通过研究决策表和决策规则系数,建立基于粗糙集表示和度量的知识,并且将遗传算法和规则挖掘算法相结合,建立了新的优化方法,提出了一种基于遗传算法的增量式规则挖掘的方法.在原有规则集的基础上进行规则和规则参数的增量式更新,避免了为更新规则而重新运行规则获取算法.试验结果表明,执行增量式GA的能够有效地获取最优规则.  相似文献   

13.
提出了推荐模型中的关联规则挖掘方法的改进,给出了自定义的页面权值的定义,并改进了基于关联图的关联规则挖掘算法,将页面权值应用于关联规则的挖掘中。此算法是利用Web日志中经过预处理后得到的数据进行规则挖掘,将处理后的数据应用正态分布函数来得到页面权值。用页面权值重新计算支持度,最后将得到的支持度应用于改进的规则挖掘算法中,形成一种基于权值的关联图的关联规则算法。  相似文献   

14.
一种基于关联模式的完全决策规则的提取方法   总被引:1,自引:1,他引:1  
针对基于粗糙集理论提取完全的决策规则是NP难问题,提出一种获取统计意义下的完全的简化规则的算法.该算法结合关联规则挖掘方法和粗糙集方法的优点,从决策表中提取出具有一定支持度和可信度阈值的决策规则,具有实际的应用意义.通过实例验证了算法的有效性.  相似文献   

15.
为了解决缺省关联规则的增量挖掘问题,在算法DRMBAR的基础上,结合粗糙集理论及频繁模式树结构,提出了一种基于关联规则的缺省规则更新算法IADRBAR,该算法主要考虑最小支持度发生变化时缺省规则的更新问题,即在新的最小支持度下,如何高效地生成新的关联规则. IADRBAR在最坏的情况下仅须扫描决策表一遍,并利用上一次已经挖掘出的频繁项目集及关联规则,有效地提高缺省规则的更新效率.理论分析和实验结果表明算法是有效可行的.  相似文献   

16.
一种基于闭项集的无冗余关联规则挖掘方法   总被引:1,自引:0,他引:1  
针对关联规则挖掘中存在的规则数量过多,难于理解和应用的问题,提出了一种基于闭项集的无冗余关联规则挖掘算法.首先,给出了无冗余关联规则的定义,并基于规则信任度的概念说明了该定义的合理性;其次,在生成子、闭项集和无冗余关联规则的基础上,给出了无冗余最小-最大精确规则基和无冗余最小-最大近似规则基的定义,并讨论了它们的剪枝策略.最后,讨论了生成子的性质及连接策略,并在包含索引的基础上,给出了一种宽度优先的无冗余关联规则挖掘算法.实验结果表明,本文提出的算法不仅可以发现规模较小的无冗余关联规则,提高了挖掘结果的可理解性,而且具有较高的挖掘效率.  相似文献   

17.
In data mining from transaction DB, the relationships between the attributes have been focused, but the relationships between the tuples have not been taken into account. In spatial database, there are relationships between the attributes and the tuples, and most of the associations occur between the tuples, such as adjacent, intersection, overlap and other topological relationships. So the tasks of spatial data association rules mining include mining the relationships between attributes of spatial objects, which are called as vertical direction DM, and the relationships between the tuples, which are called as horizontal direction DM. This paper analyzes the storage models of spatial data, uses for reference the technologies of data mining in transaction DB, defines the spatial data association rule, including vertical direction association rule, horizontal direction association rule and twodirection association rule, discusses the measurement of spatial association rule interestingness, and puts forward the work flows of spatial association rule data mining. During twodirection spatial association rules mining, an algorithm is proposed to get nonspatial itemsets. By virtue of spatial analysis, the spatial relations were transferred into nonspatial associations and the nonspatial itemsets were gotten. Based on the nonspatial itemsets, the Apriori algorithm or other algorithms could be used to get the frequent itemsets and then the spatial association rules come into being. Using spatial DB, the spatial association rules were gotten to validate the algorithm, and the test results show that this algorithm is efficient and can mine the interesting spatial rules.  相似文献   

18.
In data mining from transaction DB, the relationships between the attributes have been focused, but the relationships between the tuples have not been taken into account. In spatial database, there are relationships between the attributes and the tuples, and most of the associations occur between the tuples, such as adjacent, intersection, overlap and other topological relationships. So the tasks of spatial data association rules mining include mining the relationships between attributes of spatial objects, which are called as vertical direction DM, and the relationships between the tuples, which are called as horizontal direction DM. This paper analyzes the storage models of spatial data, uses for reference the technologies of data mining in transaction DB, defines the spatial data association rule, including vertical direction association rule, horizontal direction association rule and two-direction association rule, discusses the measurement of spatial association rule interestingness, and puts forward the work flows of spatial association rule data mining. During two-direction spatial association rules mining, an algorithm is proposed to get non-spatial itemsets. By virtue of spatial analysis, the spatial relations were transferred into non-spatial associations and the non-spatial itemsets were gotten. Based on the non-spatial itemsets, the Apriori algorithm or other algorithms could be used to get the frequent itemsets and then the spatial association rules come into being. Using spatial DB, the spatial association rules were gotten to validate the algorithm, and the test results show that this algorithm is efficient and can mine the interesting spatial rules.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司    京ICP备09084417号-23

京公网安备 11010802026262号