首页 | 官方网站   微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 78 毫秒
1.
基于Apriori改进算法的入侵检测系统的研究   总被引:1,自引:0,他引:1  
采用了关联规则中的Apriroi算法挖掘入侵模式建立了一种基于数据挖掘技术的入侵检测系统,实现规则库的自动更新,提高了系统的整体性能.根据Apriroi算法的不足,提出改进算法,提高了扫描入侵数据库过程中的信息获取率,及时剔除超集不是频繁项集的项集,缩减项集的潜在规模,提高了入侵检测规则生成的效率.  相似文献   

2.
频繁项集挖掘是关联规则挖掘的重要内容,而现有的频繁项集挖掘算法在数据库扫描和复杂数据结构构建方面消耗过多的时间,效率较低。为克服现有频繁项集挖掘算法的不足,提出了基于随机相遇的频繁项集挖掘算法。在随机相遇过程中,不断从原始事务集中随机挑选两条事务,将其交集作为新事务集中的元素,通过计算新事务集中最小支持度与原事务集中最小支持度的关系,将在原事务集上的频繁项集挖掘转化为在新事务集上的频繁项集挖掘,算法的时间复杂度和空间复杂度大大降低。由于随机样本蕴含原始数据集的主要统计特性,新事务集具有原事务集的统计特性,通过调整参数,算法在新事物集上挖掘结果的准确度可以得到保证。并利用一个零售超市的交易数据对该算法的有效性进行了测试。测试结果表明,该算法能将挖掘速度提升数十倍,同时挖掘结果的准确度和其它算法相差不大。  相似文献   

3.
为了进一步提高频繁项集挖掘算法的可扩展性,对频繁项集的搜索空间以及FP-tree的操作方法进行了研究.提出了通过FP-tree的操作实现频繁项集快速挖掘的相关性质和新的搜索策略,在此基础上提出了基于FP-tree的频繁项集挖掘的改进算法.算法运用递增构建候选项集模式树的策略缩小搜索空间,运用FP-tree的部分遍历操作简化搜索过程.在多个标准测试数据集上的实验结果表明,该算法的执行时间比同类算法减少了一个数量级,且占用较少的内存空间,因此该算法对于提高频繁项集和频繁闭项集的挖掘效率具有明显的效果.  相似文献   

4.
针对频繁项集挖掘算法中多次扫描数据库、生成大量无效频繁项集的问题,提出一种基于倒排索引和二维数组的挖掘算法。通过一次扫描数据库建立包含事务的倒排索引,解决多次扫描数据库的问题。在二维数组存储候选频繁项集时,引入标志位约束,避免产生大量无效的频繁项集。与其他算法在不同规模的数据集上进行性能比较,发现算法在数据集超过25万时执行效率优于其他算法。通过实验验证了所提出算法的高效性和可行性。  相似文献   

5.
不确定性数据的频繁项集挖掘的算法—U-apriori算法采用逐层迭代搜索方法,使用候选项集来找频繁项集.分析了U-apriori算法的流程和实现过程,并通过实验对比得出U-apriori算法花费较少时间和空间的优点,最后针对该算法的缺点提出了改进思路.结果表明:U-apriori算法是最佳概率频繁模式挖掘方法之一.  相似文献   

6.
大数据环境下频繁项集挖掘的研究   总被引:1,自引:0,他引:1  
多种频繁项集挖掘(FIM)方法组合用来对大数据进行挖掘会暴露很多问题。针对暴露的问题,在MapReduce平台上对两种频繁项集挖掘算法进行了研究。采用两种新的大数据集挖掘方法:Dist-Eclat和BigFIM,前者侧重于速度,利用基于k-FIs的简易负荷平衡方案来解决问题。而后者通过先验变体对k-FIs进行挖掘后将找出的频繁项集分配给映射程序,通过优化后在真正大的数据集上运行。最后通过实验证明该方法时间复杂度较低,数据量越大优势将越明显,扩展效果越好。  相似文献   

7.
基于MapReduce的频繁项集挖掘方法   总被引:2,自引:0,他引:2  
为了改进关联规则挖掘的经典Apriori算法,设计一种基于Map/Reduce的频繁项集挖掘方法。通过搭建Hadoop平台,可使该方法得以实现,并籍此对该方法与Apriori算法的性能进行比较研究。实验结果表明该方法在对大数据集进行频繁项集挖掘时,可充分利用云计算的优势,从而能获得更好的时效性。  相似文献   

8.
针对k均值算法在文本聚类中由于初始聚类质心随机选择,使得聚类结果陷入局部最优,且孤立点和不确定的聚类个数造成k均值算法准确性低、收敛速度慢的问题,提出了一种改进的k均值文本聚类算法。该算法采用fp-growth算法挖掘文本频繁项集,过滤频繁项集得到核心频繁项集,并利用核心频繁项集指导文本初始聚类质心和聚类个数的生成,最后k均值算法利用初始聚类质心和聚类个数完成文本聚类。在新浪微博数据集上进行文本聚类实验,实验结果表明,改进的k均值算法提高了文本聚类的准确性,加快了收敛速度,具有较强的鲁棒性。  相似文献   

9.
在对Apriori算法的特性进行详细的介绍和总结的基础上,提出一种新的不产生候选项集的,以及只进行少量数据库扫描的挖掘频繁项集的算法SI-tree(Supper-Item Tree),该算法通过搜索数据库和一次性地找出当前项的所有超集来查找频繁项集.最后通过实验对2种算法进行了比较.  相似文献   

10.
关联规则是当前数据挖掘研究最重要的分支之一,目前的关联规则多是在频繁项集的基础上进行挖掘,而没有挖掘非频繁项集的算法。本文在多支持度算法的基础上,提出了一种新的算法模型,在挖掘频繁项集的同时还能够对非频繁项集进行挖掘。  相似文献   

11.
数据库知识发现技术及发应用   总被引:2,自引:0,他引:2  
随着社会信息化进程的飞程发展,各种应用数据库及存储数据量急剧增长,已远远超人类目前的分析和理解能力,因此如何从大量的数据中智能地、自动地提取出有价值的知识和信息的研究,即数据库知识发现KDD(Knowledge Discovery in Dafabase)具有十分重要的现实意义。  相似文献   

12.
智能数据挖掘理论体系研究   总被引:4,自引:0,他引:4  
数据挖掘是数据库系统最重要的前沿课题之一,是数据库技术、人工智能、机器学习等多学科相结合的产物.在这些学科的理论基础上,研究人员提出了许多数据挖掘理论和方法,并取得了许多重要的研究成果,在免疫计算理论的基础上,借鉴生命科学中免疫的概念与理论,围绕免疫进化、神经网络、免疫控制图等智能技术,提出智能数据挖掘理论框架体系.  相似文献   

13.
从信息系统发展的角度综述了知识发现的发展及知识发现过程中数据采掘的方法和应用。  相似文献   

14.
基于双库结构的集成质量管理系统支撑平台研究   总被引:1,自引:0,他引:1  
以飞机型号研制为背景,借鉴企业信息化实践中质量管理信息系统的设计和开发经验,针对飞机研制特点,研究了基于双库结构的集成质量管理系统支撑平台.对该平台的关键技术进行了分析和阐述,给出了一种以统计学原理为基础的质量规则库的维护方法,对质量知识采用实体属性表示,便于从质量数据库抽取知识,同时便于利用本体方法对知识进行集成.  相似文献   

15.
主要讨论基于数据挖掘技术的知识发现在军事决策支持系统中的应用,提出了基于数据挖掘的知识发现方法,建立了知识向量集的拓扑空间概念并提出了基于拓扑空间向量集的不确定性知识表示方法.  相似文献   

16.
A novel method for generating a rolling schedule is presented, which is fundamentally different from the existing ones. KDD (knowledge discovery in database) techniques are applied for discovering association rules between rolling parameters in a large database of rolling operation, and based on these rules, the schedule for the crucial last six finishing passes is generated. Operational evaluation shows that the schedule generated by the new method outperforms that generated by existing methods. It also shows how in this application the human‘s domain knowledge is applied to speed up the KDD process and to ensure the validity of the knowledge discovered.  相似文献   

17.
学习Prote199软件,应以分析了解电路为基础,在此基础上学习排版布线的规则。在对该软件教学方法进行初步探索的基础上,试图通过改变教学方法,使学生较快地掌握软件的使用,并在使用中对PCB板布局布线的要求有所了解。  相似文献   

18.
针对目前一般文本搜索引擎采用的关键词匹配方法导致搜索效率相对低下的问题,在分析语义相关性的度量方案基础上,利用Wikipedia丰富链接结构所蕴涵信息,提出基于链接结构分析的主题搜索策略.设计了词条相关性算法,用以描述词间距离,并对词条进行相关度的重新排序.实验中引入用户评价机制,并与传统策略搜索结果进行对比.结果证明,该策略在扩大主题覆盖度的同时保证了较高的用户意图识别度.  相似文献   

19.
在不同的Protel 99 SE教材中,对于Solder Masks和Paste Masks的理解存在两种截然相反的意见,而且大多数教材对于Masks层没有给出详尽的解释,这些弊端都给初学者带来较大的困惑。通过对印制电路板掩膜层制造工艺的详细描述、单层显示演示以及Protel 99 SE帮助文件的诠注全面而充分地论证了Solder Masks和Paste Masks的实质含意。认为两者的实质是"阻焊膜与防锡膏膜",没有"互补关系"。  相似文献   

20.
电子商务开展过程中产生了大量的数据,数据挖掘是对这些数据进行分析的有效方法。在分析电子商务面临问题的基础上,详细阐述了数据挖掘的基本功能、数据挖掘在电子商务中挖掘的数据资源、基本过程及其在电子商务中的应用。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司    京ICP备09084417号-23

京公网安备 11010802026262号