首页 | 官方网站   微博 | 高级检索  
相似文献
 共查询到18条相似文献,搜索用时 953 毫秒
1.
基于多支持度的挖掘加权关联规则算法   总被引:6,自引:0,他引:6  
关联规则挖掘是数据挖掘中一个重要的模型.在其挖掘算法中,如果最小支持度很高,则出现频率比较低的规则就不能发现;如果最小支持度太低,因为频繁项的相互关联,则会出现组合爆炸.为此,提出了允许用户设定多个最小支持度、给定数据各项的权重来解决这一问题.理论、实验数据和实际应用证明,该新算法可行且符合实际情况,比同类算法用时更少,对大型数据库的关联规则挖掘非常有效.  相似文献   

2.
在关联规则挖掘中,大量的数据是多维的,且带有时态特性,所以往往需要在时态约束的前提下挖掘多维关联规则.本文从一个实际问题出发,在单维Apriori算法和已有的工作基础上,提出了一种新的多维时态关联规则挖掘算法,并与类似算法进行了比较.  相似文献   

3.
传统方法实现过程复杂、历史复杂时态数据的片面性,导致其无法全面地描述时态数据;且相似性计算无法准确匹配具有动态性与复杂性的时态数据,造成提取精度低。为此,提出一种新的分布式多空间数据库复杂时态数据提取技术。设计动态RBF神经网络,对分布式多空间数据库中未知动态进行识别和建模;通过建模结果完成对复杂时态数据的描述。依据加权关联规则与时态关联规则对支持度和置信度的定义,获取T-FS-tree加权时态关联规则中支持度和置信度。将复杂时态数据描述序列、最小支持度、最小置信度作为输入,将加权时态关联规则作为输出,建立T-FS-tree加权时态关联规则挖掘算法。按照向量计算获取加权时态频繁1项集以及频繁2项集,依据获取的加权时态频繁项集建立初始频繁项集树;依据初始频繁项集树获取全部时态频繁项集;通过获取的频繁项集产生加权时态关联规则。从所有关联规则中选择优先度高的规则,构建的复杂时态数据提取器,实现复杂时态数据提取。实验结果表明,所提方法复杂性低,提取结果更加全面、可靠,有很高的准确性。  相似文献   

4.
时态关联规则研究与应用   总被引:4,自引:0,他引:4  
传统关联规则挖掘很少考虑关联规则的时间适用性.时态关联规则是指带有时态约束的关联规则,每个关联规则都有着其成立的时间区域.结合其他算法的特点,提出了基于Fisher聚类的时态关联规则挖掘算法(TApriori算法),它能够动态地发现关联规则以及关联规则有效的时间区域.实验结果证明该算法是合理有效的.最后,结合具体CRM项目的特点,讨论了在CRM引入数据挖掘的体系结构,给出了一个应用.  相似文献   

5.
基于规则的推荐技术在数据集上挖掘项目关联和用户关联为当前用户做推荐.用户关联挖掘是使用用户关联进行推荐的关键.首先证明在整个数据集上挖掘到的关于当前用户的用户关联集是只在包含当前用户评价的数据集上挖掘到的关于当前用户的用户关联集的子集,提出基于两阶段计数的用户关联挖掘框架,然后应用概念格技术实现了基于两阶段计数的用户关联挖掘算法,并通过实验表明该算法具有更好的性能.  相似文献   

6.
传统试卷分析系统一般只是对考试成绩做简单的整体统计,如平均分、等级、不及格率等,用户缺乏对试题知识点掌握情况关联程度的准确了解。针对该问题提出一种基于用户反馈的关联规则挖掘算法。首先对原始数据进行预处理,得到试卷知识点评分权重表和二进制的学生得分率表。然后建立一个根据用户选择层数输出关联规则,以及查询与选定知识点相关的规则的新方案。最后,提出了一个考虑用户反馈、支持度和置信度阈值的关联规则挖掘算法,以过滤无用规则,提高挖掘效率。对VB试卷数据应用该算法,发现了基于用户反馈的有趣关联规则。实验结果表明基于用户反馈的关联规则挖掘优于其他关联规则挖掘算法,更易获得有趣的关联规则。  相似文献   

7.
提出了一个基于最小完美哈希函数的关联规则的数据挖掘算法.基于Apriori 的算法,在综合了传统哈希剪枝技术的同时,利用最小完美哈希函数的优点,保证了静态数据库关联规则挖掘,可以对关联规则的哈希结构数据进行动态的调整.该算法提高了挖掘效率,通过抑制哈希地址冲突提高了算法的稳定性和可用性.  相似文献   

8.
随着市场竞争的日趋激烈和业务环境的不断变化,企业数据中的时间信息的管理问题受到人们普遍关注。时态数据挖掘成为数据挖掘研究的一个热点。考虑到用户的时态需求常常是非确定和非精确的,在采用模糊时态代数来表达时态需求的基础上,提出了一种带有效时间的模糊关联规则,并给出了一种基于FP-树的挖掘方法。最后用一个例子对该方法的执行过程进行解释。  相似文献   

9.
针对使用传统关联规则算法挖掘大数据集时,挖掘过程中效率不高,挖掘出大量冗余规则的问题,提出了基于关联规则和相似度的数据挖掘算法(U-APR):首先,一次性读入数据并构建矩阵,并利用关联规则支持度度量的特性来增加判断属性,以加快结束迭代过程,从而改进了Apriori算法频繁扫描数据库问题;然后,使用相似度算法去除冗余的关联规则;最后,结合置信度、支持度和用户目标匹配度对挖掘结果进行排序输出,从而得到用户感兴趣的关联规则. 同时,应用该算法与目前常用的2种关联规则算法对广东某高校学生财务数据进行数据挖掘. 实验结果表明:与2种常用的关联规则算法相比,U-APR算法缩短了运算时间和提高了存储空间利用率,对用户分析挖掘结果有较好的优化效果.  相似文献   

10.
通过给定的最小支持率和最小信任度来挖掘语言值关联规则往往会得到很多规则,因此用户很难获得真正关注的语言值关联规则.本文提出一种挖掘典型语言值关联规则的算法,此算法将挖掘得到的语言值关联规则按照相同的后件进行分组,然后对每个分组中的语言值关联规则根据规则之间的不相似性进行聚类.最后从每个类中挑选出代表类原型的语言值关联规则作为典型的语言值关联规则.典型的语言值关联规则是语言值关联规则集合中最具有代表意义的规则.  相似文献   

11.
基于相似性的关联规则启发式发现   总被引:3,自引:0,他引:3  
找出众多关联规则中用户感兴趣的关联规则,除靠最小支持度和最小可信度外,把相似性计算融合到通过剪枝选出用户感兴趣规则的模板理论中.提出一种基于相似性的关联规则启发式发现方法.该方法有效地解决了模板理论中的由于描述模糊而导致的不合理剪枝的问题.  相似文献   

12.
提出了一种基于最小完美哈希函数的关联规则的挖掘算法.这一基于Apriori的算法在综合了传统哈希剪枝技术的同时,充分利用了最小完美哈希函数的优点,从而在保证静态数据库关联规则挖掘的同时,使对关联规则的哈希结构数据进行动态调整成为可能.这一算法不仅提高了挖掘效率,而且通过抑制哈希地址冲突提高了算法的稳定性和可用性.  相似文献   

13.
基于概念格提取简洁关联规则   总被引:1,自引:0,他引:1  
从量化封闭项集格所提取的所有最小无冗余规则,虽满足最小前件最大后件的要求,但并不是满足用户设定支持度和置信度的最小规则集.本文提出了一种全局简洁关联规则,使所提取的规则集最小,并给出了基于量化封闭项集格提取全局简洁规则的算法.  相似文献   

14.
针对Apriori算法在实际应用中无法发现关联规则变化趋势的问题,该文根据增量挖掘算法的优点对Apriori算法进行了改进。改进的Apriori算法能够在原算法的基础上,通过关联规则统计量的变化确定强规则与候选规则之间的转换,从而进一步发现关联规则的变化趋势,提高了依靠Apriori算法得到的关联规则对决策分析支持的可靠性。将改进算法应用于冷轧生产过程预测中,试验结果表明,改进算法相对于传统的Apriori算法对产量预测的精度提高了30%。  相似文献   

15.
针对不完备决策系统的规则提取问题,提出一种基于极大团的不完备系统规则获取方法.引入图中极大团概念定义相容块构造范式,将其等价转换为极小析取范式后得到不完备系统全体极大相容块,收集每一相容块最全描述即可生成极大相容块最全描述系统,进而为最全描述系统中的每一对象构造决策分辨范式得到与该对象对应的全体可信关联规则.该方法具有2个特点:针对系统中每一基本信息粒自动生成基准置信参数,避免了预设固定参数而遗漏置信度小于此参数的部分有用规则;将决策分辨范式等价变换为其极小析取范式,避免了采用特定顺序选择属性而遗漏部分有用规则.将该算法应用于某保险公司私家车客户车险数据和UCI不完备数据集,实验结果与数据分析说明了该算法的分类预测性能.  相似文献   

16.
针对云计算环境下由于数据缺失导致关联规则发现误差较高的问题,提出一种基于张量分解的缺失关联规则分布式发现算法,从而建模关联规则、缺失数据并近似它们的置信度.利用Apriori算法进行局部数据相关以获得频繁项集,通过CANDECOMP/PARAFAC (CP)分解方法分解张量置信度,使用共轭梯度算法进行迭代以最小化近似张量的成本,当存在缺失数据的情况下,利用分布式算法将局部相关与全局相关结合发现缺失关联规则.仿真结果显示,算法的平均误差仅为5.55%,最大误差不超过10%,低于其他几种较新的缺失关联规则算法,相比基于聚类的关联规则算法,平均执行时间减少了16.5%.结果表明,所提基于张量分解的分布式算法在缺失数据的情况下,性能优于其他的关联规则算法,能更加有效地提供缺失规则置信度的近似解.  相似文献   

17.
关联知识挖掘算法中一种广为人知的算法就是Aprior算法,之后所有关联规则挖掘算法的基本思想都是基于频繁项目集发现算法的基础上进行了改进.为了提高关联规则挖掘效率,首先回顾了基于图的关联规则挖掘算法;然后,在此基础上进行了改进,把关联规则挖掘中寻找频繁项集的问题转换为图中寻找完全子图的问题,通过在图中查找完全子图来寻找频繁项集.提出了一种基于图的关联规则挖掘改进算法,并且对原算法和改进的算法从时间和空间的性能进行了比较分析,得出改进的算法是有效可行的.最后从实验结果得出结论GenerateItemsets算法比DGBFIG算法优.  相似文献   

18.
挖掘关注的语言值关联规则   总被引:1,自引:0,他引:1       下载免费PDF全文
为了解决利用RFCM算法划分数量型属性,并通过组合语言值进行语言关联规则挖掘中出现的规则数量太多,以及难于获得用户真正关注的规则等问题,提出了一种改进的语言值关联规则挖掘算法。通过最大隶属原则将记录在数量型属性上的取值转换为语言值,然后转换成布尔型属性关联规则挖掘问题。同时,给出一个能够度量语言值关联则简洁性和新奇性关注程度(兴趣度)的计算函数,用于减少选取关注语言值关联规则的工作量。采用本文提出的方法对一组实例数据进行实验,得到了关注程度较高的语言值关联规则。所采用的方法能适用于含有大量数量型属性的数据库,并能有效地获取用户关注的规则。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司    京ICP备09084417号-23

京公网安备 11010802026262号