首页 | 官方网站   微博 | 高级检索  
相似文献
 共查询到18条相似文献,搜索用时 218 毫秒
1.
张争龙 《科学技术与工程》2013,13(19):5687-5691
针对实际交易数据库中,不同项目的重要性和出现概率各不相同的两个问题,提出一种基于等价类和多最小支持度的加权关联规则算法,从而挖掘出那些覆盖较少数据但却有意义、用户可能更感兴趣的关联规则。算法按照项目的最小支持度升序对交易记录进行等价类划分,然后按照项目的最小支持度降序依次求出每一等价类内的加权频繁项集。算法采用垂直数据库的数据表示形式,挖掘过程中避免了对数据库的重复扫描。对比实验结果证明,改进算法具有良好的挖掘性能。  相似文献   

2.
利用公安系统建立的各类信息库,针对犯罪预防领域研究了关联规则的挖掘技术.系统的实现首先是根据已有的公安系统数据库,通过提取相关信息,找出所有支持度大于最小支持度的项集,产生用户感兴趣的频繁项集.其次,根据频集产生所期望的规则,设计支持度函数,进行设定规则的犯罪行为的数据挖掘研究,得到与之关联的犯罪特征,揭示潜在的犯罪规律,从而对犯罪预防提供数据支持.  相似文献   

3.
关联规则挖掘主要用来发现数据库中存在的频繁项集.利用权值标识项目的重要程度,提出一种新的关联规则——加权关联规则的挖掘.由于项目权值的引入,Apriori性质不再成立,频繁项集的子集不再一定是频繁的.为此,提出k-最小支持数的概念,对原有Apriori算法进行改进.该算法能够挖掘出现频率小但是带来更大利润的项目,使得挖掘出的关联规则更加满足决策者的需求,也更加符合实际需要.  相似文献   

4.
针对云计算环境下由于数据缺失导致关联规则发现误差较高的问题,提出一种基于张量分解的缺失关联规则分布式发现算法,从而建模关联规则、缺失数据并近似它们的置信度.利用Apriori算法进行局部数据相关以获得频繁项集,通过CANDECOMP/PARAFAC (CP)分解方法分解张量置信度,使用共轭梯度算法进行迭代以最小化近似张量的成本,当存在缺失数据的情况下,利用分布式算法将局部相关与全局相关结合发现缺失关联规则.仿真结果显示,算法的平均误差仅为5.55%,最大误差不超过10%,低于其他几种较新的缺失关联规则算法,相比基于聚类的关联规则算法,平均执行时间减少了16.5%.结果表明,所提基于张量分解的分布式算法在缺失数据的情况下,性能优于其他的关联规则算法,能更加有效地提供缺失规则置信度的近似解.  相似文献   

5.
在商业、医疗等数据分析中,不知道存在或不存在的一些项目事件组成的数据叫做不确定数据,它的特点是离散型随机变量的概率分布,不确定数据中的挖掘算法研究是当前大数据分析中的重要方向.针对不确定数据的随机变量性特征,有效提高挖掘结果的置信度和提高算法运行时间,本文提出一种挖掘析取关联规则的算法DRUD,利用模糊集的方法选取2元频繁项集,对比最小支持度,完成有效的析取规则提取.经过在大量不同不确定数据库中仿真表明,对比类似算法UApriori和PFCIM,本文所提出的DRUD算法产生的规则置信度得到提高,算法效率有较好改进,新的算法更加适用于不确定数据中的大数据挖掘应用.  相似文献   

6.
朱文婕  窦祥国 《科技资讯》2007,(28):142-143
关联规则的挖掘就是要发现所有支持度和可信度分别大于用户给定的最小支持度和最小可信度的关联规则.最常用的关联规则评价方法就是支持度-可信度评价.本文提出频繁项集的新颖性概念,并对新颖性评价方法进行阐述.  相似文献   

7.
高职院校的人才培养方案中,课程设置是最关键的元素,课程结构的合理与否会直接影响到人才培养的质量。使用关联规则中的Apriori算法,对学生成绩样本数据进行挖掘,利用给定的最小支持度和最小置信度,挖掘出频繁项集,进行课程相关性分析,得到课程的关联规则,有利于在课程设置过程中优化课程结构,提高教学质量。  相似文献   

8.
传统漏洞挖掘方法无法研究Android设备驱动与内核间的交互,且需使相关硬件处于工作状态,很难实现Android驱动未知漏洞挖掘。为此,提出基于关联规则的Android驱动未知安全漏洞挖掘方法。对关联规则漏洞挖掘问题进行形式化描述。依据Apriori法对频繁项集进行初寻找。采用RDARF规则筛选器对规则进行进一步筛选,获取强规则。建立待挖掘驱动样本库,对Android驱动进行自动化分析,考虑Android设备驱动与内核间的交互;针对各Android驱动对各自申请的权限信息进行提取,建立权限特征集合,完成格式化操作;挖掘出所有Android驱动漏洞数据的极大频繁项集,建立权限关系特征库,获取关联规则无需执行驱动;针对待挖掘驱动匹配权限关系特征库,实现未知Android驱动安全漏洞的挖掘。实验结果表明,所提方法挖掘准确性高,CPU占用少。  相似文献   

9.
关联规则挖掘的一种多剪枝概念格方法   总被引:1,自引:0,他引:1  
多数据源上关联规则挖掘方法,由于各数据节点间相互通信的候选项集数目过于庞大或者挖掘过程需要对数据库进行多次扫描,导致挖掘算法效率不高。研究剪枝概念格(pruned con-cept laffice,PCL)中概念与频繁项集表示关系,定义剪枝格上的导出频繁项集,设计了一个利用多剪枝概念格从多数据源上挖掘近似所有关联规则的算法UMPCL(union algorithm of multiplepruned concept lattice)。利用一个频繁概念表示一些频繁项集以减少挖掘过程中产生的侯选项集数,使用与全局支持度相等的局部支持度对各子概念格进行剪枝,最后融合、剪枝各子剪枝格并提取全局关联规则。理论分析和实验验证表明该算法是有效的。  相似文献   

10.
本文将所有基于事务和非基于事务的关联分析称为广义的关联分析.基于事务的关联分析主要依托支持度-置信度框架进行数据挖掘,而非基于事务的关联分析常采用参与度-条件概率框架.首先,在讨论强关联规则的正确性、可靠性和有趣性的基础上,提出了蕴涵-约束框架.其次,提出并论证了最小支持度mni_sup和最小置信度min_conf的合理取值范围,从而将最小置信度由支持度-置信度框架下的(0,1] 缩小为蕴涵-约束框架下的(0.5,1],最小支持度由(0,1] 缩小为(0,min_conf].第三,提出随机顶点极大团划分法,它能将非基于事务的关联分析转化为基于事务的关联分析,从而使广义关联分析问题整合成为基于事务的关联分析问题.第四,基于映射的概念,将约束划分为事前、事中和事后约束,从而形式化地解决了约束的应用及方法.第五,利用稠密维和稀疏维,提出了一种multi-knowledge tree 的树形存储结构,能在无论频繁项集是否满足向下闭合性质时都有效降低算法的空间复杂度;同时,在数据增加、删除、修改后能快速获取新的强关联规则.最后,大量实验验证了所提出理论和算法的效果和效率.  相似文献   

11.
为解决在挖掘频繁项集过程中,因忽略不同项目间的重要程度而导致的挖掘有效性低以及忽略数据的动态更新而造成的挖掘效率低的问题,通过引入新的加权规则,从权值与频数两方面去体现项目间的重要性差异,并通过引入树形结构与关系矩阵提高数据动态变化时频繁项集的挖掘效率。创新性地提出基于动态数据的加权频繁项集挖掘算法weighted dynamic date mining (WDDM)。实验结果表明,WDDM算法较以往算法挖掘效率与有效性显著提高,有利于发现更多有研究价值的信息。  相似文献   

12.
基于PSO的加权关联规则挖掘算法   总被引:1,自引:0,他引:1  
简要描述了加权关联规则问题及离散粒子群优化算法,提出了一种基于粒子群优化(PSO)算法的加权关联规则挖掘算法(PSO-WMAR).实验证明,本算法运行时间更省,产生的规则数更少且更有效.该算法具有以下特点:1)把关联规则挖掘的两个阶段结合在一起,无须先挖掘出全部频繁项目集然后再提取规则;2)只需要扫描一次数据库;3)把兴趣度引入适合度函数之中,挖掘出的规则数量更少、更有效;4)求加权频繁项目集无须查找所有候选加权频繁项目集,或者求频繁项目集的高序子集或非频繁项目集的低序超集.  相似文献   

13.
概念格递增修正关联规则挖掘方法   总被引:1,自引:0,他引:1  
研究了一种知识发现与数据挖掘中关联规则的发现方法 .关联规则是数据挖掘的重要方法之一 ,其核心是各大项目集的获取 .针对货篮关联规则挖掘方法 ,提出了一种改进的概念格递增修正方法 .该方法适应于数据库的动态数据递增或递减更新 ,通过记录项目集 (即概念格中的结点 )在数据库中出现的频率值 ,不需要构造完整的格即可求得项目集的支持度值和可信度值 ,以获取大项目集 ,进而求得关联规则 .同时 ,该方法运用 Hasse图解进行可视化操作 ,降低了算法的时间复杂度  相似文献   

14.
有效地进行频繁项挖掘一直以来都是数据挖掘任务中最为重要的组成部分。已有的大部分频繁项挖掘算法在数据项多及支持度低的情况下,算法的效率急剧下降。为了有效地解决此类问题,提出了一种采用双向十字链表结构的频繁项挖掘算法(two-way crossed list for frequent itemsets mining,TCLFI)。极大地降低了搜索空间,加快了频繁项的筛选过程,减少了所需保存的数据项个数,从而降低了时间复杂度,提高了频繁项的挖掘效率。实验通过真实数据集和合成数据集验证了算法的有效性和扩展性。  相似文献   

15.
在分析Apriori算法的基础上,介绍了该算法的C语言实现,包括频繁集的发现和关联规则的生成,为进一步研究关联规则提供了基础。  相似文献   

16.
本文从减少I/O时间的角度出发,结合云计算Hadoop平台的Map Reduce模型,提出了一种基于Map Reduce的关联规则挖掘算法.算法采用幂集计算候选项集,采用Map Reduce模型在多个节点上并行找出所有频繁项集,只需要扫描事务数据库1次.实验结果表明:在事务的平均项长较小的情况下,算法具有很好的加速比和数据规模增长性.  相似文献   

17.
产生频繁项目集是关联规则挖掘中的一个关键步骤.在对Apriori算法分析的基础上,提出了一种基于集合和位运算的频繁项目集挖掘算法.该算法用位视图表示使用了每个项目的事务,通过对位视图进行位运算来计算每个项目集的支持数,避免了Apriori算法中多次扫描数据库的问题.  相似文献   

18.
在挖掘关联规则的过程中,关键步骤是产生频繁项集.基于频繁项集支持矩阵的思想,提出一种有效的频繁项集挖掘算法-FIMA,并给出了算法的基本设计思想和算法描述.本算法利用矩阵挖掘频繁项集,不需要产生候选项集,且只需扫描数据库一次。所以此算法是非常有效的.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司    京ICP备09084417号-23

京公网安备 11010802026262号