首页 | 官方网站   微博 | 高级检索  
相似文献
 共查询到15条相似文献,搜索用时 156 毫秒
1.
针对序列模式挖掘中的增量挖掘问题,提出一种序列模式更新算法ISPBP.算法引入序列数据库结构来存储从原始数据库中挖掘出的所有项、最大频繁模式以及它们的支持数,采用间接拼接方法,只需处理增量数据库,避免了对更新后数据库的重新计算.对于因增量数据库新产生的频繁模式,利用了在增量数据库中出现的频繁项集来减小投影数据库,进一步提高了算法的效率.理论分析和实验表明,算法是有效可行的,并且增量数据库越大,算法在效率上的优越性越明显,算法ISPBP优于传统增量式更新算法.  相似文献   

2.
大型数据库中的高效序列模式增量式更新算法   总被引:7,自引:1,他引:7  
提出一种称为FIMS(fast incremental mining of sequential patterns)的序列模式增量式更新算法,处理因数据库的更新而引起的序列模式的维护问题。主要思想是利用原先的序列模式挖掘结果,通过建立一个投影数据库来减少对整个数据库的扫描次数和侯选序列的生成,从而提高挖掘的效率。实验结果显示在更新数据量远小于整个数据库的大小时,FIMS算法的性能优于GSP算法4-7倍。  相似文献   

3.
基于模式矩阵的FP-growth改进算法   总被引:10,自引:0,他引:10  
数据挖掘中关联挖掘算法比较典型的有Apriori和FP—growth算法.实验和研究证明FP—growth算法优于Apriori算法.但是针对大型数据库这两种算法都存在着较大缺陷,不仅要两次或多次扫描数据库,而且很难处理支持度和数据变化等关联规则更新问题.作者提出了基于模式矩阵的FP—growth改进算法,它至多扫描数据库一次,特别在更新问题上不用重新扫描数据库.通过实验结果分析,验证了这种改进算法相对于原有FP—growth算法的优势,特别在大数据集下,大大降低了挖掘的时间复杂度.  相似文献   

4.
针对原始数据库中增加数据时如何更新规则的问题,提出并应用了一种基于权值的序列模式更新算法UW IUA。该算法利用权值来归约子序列集和利用知识数据库中保留的最小非大序列集产生新的候选序列集,避免了重复遍历原始信息库而造成数据量太大的问题,从而缩短程序运行时间和节约数据存储空间,较好地改进了算法性能。实验结果证明UW IUA算法的效率高于IUA算法。  相似文献   

5.
讨论了当从序列数据库中删除某些信息时,序列模式的更新维护问题。提出了一种新的算法MA_D(Maintaining Algorithm while Deleting information), 处理因数据库更新而引起的序列模式的维护问题。该算法充分利用在前次模式挖掘过程中得到的信息,降低了挖掘新的序列模式的开销。实验分析表明,该算法对于序列模式的维护是十分有效的。  相似文献   

6.
一种基于分布式数据库的全局频繁项目集更新算法   总被引:4,自引:0,他引:4  
在算法FMAGF的基础上,提出了一种基于分布式数据库的全局频繁项目集更新算法-UAGFI,该算法主要考虑最小支持度发生变化时全局频繁项目集的更新情况。UAGFI在最坏的情况下仅须扫描各局部数据库一遍,并利用已挖掘的结果,可避免传送某些原全局频繁项目对应的条件频繁模式树,从而降低网络通讯代价,实验结果表明,UAGFI算法是有效可行的。  相似文献   

7.
敬会 《科技资讯》2007,(26):162
本文提出以AprioriTid为基础的关联规则增量式更新算法.利用AprioriTid算法只需扫描一次事务数据库的优良性,考虑在事务数据库D不变时,而最小支持度和最小可信度发生变化时关联规则更新问题.  相似文献   

8.
关联规则挖掘是数据挖掘技术的一种简单又很实用的方法,有着广泛的应用。该文利用部分支持度树的结构提出了对关联规则的增量式更新算法,用于解决向数据库中添加新的数据而最小支持度不发生变化时的关联规则更新问题。该算法有效地利用已挖掘的关联规则和保留的部分支持度树来改善性能,并且只需对新增数据库部分进行一遍扫描,从而进一步提高算法的效率。实验结果表明,该算法能有效地解决关联规则的更新问题,提升挖掘效率。  相似文献   

9.
敬会 《科技资讯》2007,(28):184
本文提出以AprioriTid为基础的关联规则增量式更新算法.利用AprioriTid算法只需扫描一次事务数据库的优良性,考虑在事务数据库D不变时,而最小支持度和最小可信度发生变化时关联规则更新问题.  相似文献   

10.
直接采用MD5算法对数据库中的敏感数据加密时,合法用户进行查询、更新等操作需要还原数据,MD5算法无法解密数据.可逆的加密算法都需要保存密钥,数据库增加了数据的冗余.本文提出一种基于MD5算法的可逆无冗余算法,实现对数据库中敏感数据进行加密、解密,而且不需要保存密钥.  相似文献   

11.
智能诊断中诊断知识的实时自学习方法   总被引:1,自引:1,他引:0  
模拟人类专家诊断知识积累过程,提出一种基于模式比较和更新的诊断知识实时自学习模型,以实现智能诊断系统知识库知识的实时积累和更新。用非正态分布假设检验算法实现待确定知识故障模式与正常模式的实时比较,用样本含量估计算法作为有效模式比较所需故障样本量确定的理论依据,用实时模式更新算法实现诊断知识模式与设备的实际运行情况一致。实际测试数据分析表明该模型有利于实现新知识的积累和诊断知识贴近实际设备的实际情况。  相似文献   

12.
针对在关联规则的实际挖掘中,由数据快速增加所造成的大数据问题和增量更新问题?在快速更新频繁模式树算法(fast updated frequent pattern tree,FUFP - tree)的基础上,引入MapReduce 编程模型,提出了一个面向大数据的并行的关联规则增量更新算法(parallel fast updated frequent pattern tree,PFUFP - tree)?该算法通过构建原始事务数据的分块索引,从而使得在每次增量更新时,能够最小化地扫描原始事务数据库,提高了挖掘效率;同时采用动态负载均衡的项目分组策略来优化并行计算过程中的项集分组问题,从而保证分布式集群中节点之间的负载均衡;实验结果证明,提出 的算法是有效的和高效的,适用于动态增长的大数据环境?  相似文献   

13.
在分析了频繁序列模式更新算法关键技术的基础上,提出了一种快速的增量式更新频繁序列模式挖掘算法FUFSPA,该算法将充分利用先前挖掘过程中所产生的信息来减少本次挖掘过程中的时闻开销.另外,针对频繁序列模式挖掘中支持数计算的复杂性,提出了一种基于二进制形式的支持数计算方法,该方法只需进行一些“或”逻辑运算操作,将该方法用于序列模式挖掘中支持度(数)的计算,可以进一步提高算法的执行效率.实验结果表明算法FUFSPA是可行和有效的.  相似文献   

14.
一种基于本体的工作流系统   总被引:1,自引:1,他引:0  
基于本体理论, 提出一种面向典型数据库访问的协同工作系统. 在此系统中, 通过引入本体库, 实现了业务流程、 组织结构、 资源的本体定义, 协作知识可以动态地加入到系统中, 从而使系统可应用到具有相同应用模式的领域中. 系统的扩展与升级可通过更新和扩充系统本体库中的本体定义完成, 使系统具有动态升级和扩展的能力. 通过系统的本体库, 不同的工作流系统之间以及工作流系统与其他应用程序之间可 以交互作用, 使得系统间的合作成为可能.  相似文献   

15.
提出在匹配度模型下频繁序列模式精简基的概念,精简基由相对于一系列匹配度阈值的最大序列模式组成,它是频繁序列模式的一个子集,可以用它来估计任一频繁序列模式的匹配度,并能将误差控制在确定范围内.还开发了一个从有噪音的序列数据库中挖掘这种序列模式精简基的算法,该算法采用了一种不需要保留候选序列模式的方法来检查最大序列模式,采用的剪枝技术也比以前的算法更有效率.实验结果显示计算频繁序列模式精简基是很有前途的.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司    京ICP备09084417号-23

京公网安备 11010802026262号