首页 | 官方网站   微博 | 高级检索  
相似文献
 共查询到17条相似文献,搜索用时 140 毫秒
1.
二进制挖掘算法在空间数据挖掘中的应用   总被引:1,自引:0,他引:1  
现有的传统关联规则挖掘算法构建频繁候选项的方式和修剪技术是其应用于空间数据挖掘的技术难题.针对空间数据挖掘中数据库的属性特点,将基于二进制的挖掘算法应用于空闻数据挖掘中.该算法用二进制的逻辑运算产生频繁候选项和计算支持数,有效地解决了现有挖掘算法在空间数据库中提取关联规则时存在的难题.  相似文献   

2.
基于二进制的长频繁项空间数据挖掘算法   总被引:4,自引:0,他引:4  
提出一种基于二进制的空间关联规则挖掘算法,它适合挖掘长频繁项目集和同一空间关系模式下不同对象之间的关联。算法从搜索策略、修剪策略和存储结构三个方面改进了现有的二进制关联规则挖掘算法,并用数字特征来减少被扫描事务的个数,减少了算法的执行时间;将其用在单一的空间数据挖掘中效率得到了明显提高。  相似文献   

3.
在关联规则数据挖掘中采用二进制系统易于产生冗余模式。该文提出一种基于二进制事务属性层次划分的两级数据挖掘方法,即MLADM算法。该算法通过高层次模式获取最大可能频繁模式集,在低层次模式中对其进行验证,优先获得长频繁模式。实验结果表明,该算法可以在密集数据集中有效挖掘长模式并避免冗余模式。  相似文献   

4.
数据流中一种基于滑动窗口的前K个   总被引:1,自引:1,他引:0  
数据流频繁项集挖掘是当今数据挖掘和知识学习领域重要的研究课题之一。数据流高速性、连续性、无界性、实时性对挖掘算法在时间和空间方面提出了更高的要求。传统的数据挖掘算法由于其存储结构需要频繁地维护,其挖掘方式的精度和速度较低,空间、时间效率不高。在基于粒计算和ECLAT算法的基础上提出一种挖掘数据流滑动窗口中topK频繁项集算法,采用二进制方式存储项,利用位移运算实现增量更新,实施与运算计算项集支持度,同时利用二分查找法插入到项目序表中,输出前K个频繁项。实验结果表明,该算法在K取值不太高时具有较好的时空高  相似文献   

5.
数据流频繁项集挖掘是当今数据挖掘和知识学习领域重要的研究课题之一。数据流高速性、连续性、无界性、实时性对挖掘算法在时间和空间方面提出了更高的要求。传统的数据挖掘算法由于其存储结构需要频繁地维护,其挖掘方式的精度和速度较低,空间、时间效率不高。在基于粒计算和ECLAT算法的基础上提出一种挖掘数据流滑动窗口中top-K频繁项集算法,采用二进制方式存储项,利用位移运算实现增量更新,实施与运算计算项集支持度,同时利用二分查找法插入到项目序表中,输出前K个频繁项。实验结果表明,该算法在K取值不太高时具有较好的时空高效性。  相似文献   

6.
频繁项集挖掘是数据挖掘中的一个经典的问题。然而,大部分算法需要扫描数据库多次,算法效率比较低。该文提出了一个效率比较好的挖掘频繁项集的新算法,在这个算法中,所有的事务都是以二进制的形式表示,所以挖掘极大频繁项集的任务就变成了从二进制集中发现频繁模式。而且,这种算法只需要扫描原始数据库一次。最后,利用试验来证明这种算法的效率和优势。  相似文献   

7.
频繁项集挖掘是数据挖掘中的一个经典的问题。然而,大部分算法需要扫描数据库多次,算法效率比较低。该文提出了一个效率比较好的挖掘频繁项集的新算法,在这个算法中,所有的事务都是以二进制的形式表示,所以挖掘极大频繁项集的任务就变成了从二进制集中发现频繁模式。而且,这种算法只需要扫描原始数据库一次。最后,利用试验来证明这种算法的效率和优势。  相似文献   

8.
一种基于关联规则挖掘的组织数据方法   总被引:3,自引:0,他引:3       下载免费PDF全文
孔令富  王晗  练秋生 《计算机工程》2006,32(21):12-14,5
针对在数据挖掘中采用二进制转换的方法,定义了二进制序列集的相关概念并为此提供依据。分析了事务与关联规则在二进制序列集中的表示方法及其在空间、时间上的复杂度。通过实验验证,在关联规则数据挖掘中采用二进制序列集这一组织数据方法是有效且可行的。  相似文献   

9.
介绍了Web使用挖掘的常用技术。针对Web服务器日志产生数据库的特点,在Web挖掘过程中使用二进制挖掘算法产生关联规则;通过二进制挖掘算法的实例,说明在Web使用挖掘中运用二进制挖掘算法能够提高挖掘效率。  相似文献   

10.
介绍了数据挖掘的基本概念和遗传算法的基本原理,并根据存放在数据库中的商场客户信息,设计遗传算法挖掘最优客户群。算法中采用了整数编码和二进制编码相结合的编码表示方法,杂交算子,变异算子和带有限制条件的适应度函数的构造。最后进行了实例仿真。  相似文献   

11.
介绍了CRM的研究内容和数据挖掘的基本原理,主要讲解如何构建面向CRM的数据挖掘应用,并用一个具体的案例来表示如何用数据挖掘来预测客户的保持.  相似文献   

12.
为了更好地分析购物篮数据,挖掘出潜在客户,序列模式挖掘应运而生。序列模式挖掘是数据挖掘一个重要研究内容,近年来在很多领域得到广泛运用。概述序列模式挖掘的发展现状,研究基本挖掘框架的经典挖掘算法与扩展模型挖掘算法,特别针对近年来出现的新数据形式序列模式挖掘,以及基于零压缩二叉决策图(ZBDD)结构的挖掘算法做了阐述,最后对序列模式挖掘发展趋势进行了展望。  相似文献   

13.
频繁集挖掘是总结二进制数据的重要技术,但如何找到一个二进制数据集与频繁集挖掘结果相一致却十分困难。文中从可计算复杂度的观点研究了频繁集的隐私保持。特别分析了反频繁挖掘问题的可计算复杂度。给出了决定是否存在与一个已知频繁集兼容的数据集是一个NP难度问题;当原始数据集d由6个集合组成时计算与已知频繁集兼容的数据集的数量是一个P类完全问题。  相似文献   

14.
Data Mining and Machine Oriented Modeling: A Granular Computing Approach   总被引:8,自引:0,他引:8  
From the processing point of view, data mining is machine derivation of interesting properties (to human) from the stored data. Hence, the notion of machine oriented data modeling is explored: An attribute value, in a relational model, is a meaningful label (a property) of a set of entities (granule). A model using these granules themselves as attribute values (their bit patterns or lists of members) is called a machine oriented data model. The model provides a good database compaction and data mining environment. For moderate size databases, finding association rules, decision rules, and etc., can be reduced to easy computation of set theoretical operations of granules. In the second part, these notions are extended to real world objects, where the universe is granulated (clustered) into granules by binary relations. Data modeling and mining with such additional semantics are formulated and investigated. In such models, data mining is essentially a machine calculus of granules-granular computing.  相似文献   

15.
黄斐 《计算机科学》2006,33(12):200-202
本文介绍了商务网站数据挖掘基本原理和方法,结合数据仓库研究,论述了多维数据模型,关联规则挖掘算法,商务网站数据挖掘的基本过程,以及联机分析处理。  相似文献   

16.
在目前的图像处理技术发展现状中,图像挖掘技术是其中一项较为突出和新颖的技术分支。而随着日益庞大的图像数据信息处理量的要求增加,却没有一个有效的分析和处理技术,为此,如何解决大量数据的解析和处理问题是目前图像挖掘技术的主要方向。本文将着重研究图像挖掘技术的原理和其在目前社会中的应用情况。利用简析图像挖掘技术的基本原理分析其数据模型,探讨其所具备的基本功能以及在车辆目标识别上的应用和方法。总结出图像挖掘技术对图像中所存在信息的完全解读,挖掘图像中存在的隐形关联,而且随着图像挖掘技术的不断改进,其目标识别的功能可以应用到车辆管理模式当中。通过实验表明,此方法可以对目标图像中车辆数量和种类的辨识度达到80%以上。  相似文献   

17.
Data Mining and Knowledge Discovery - Pattern mining is well established in data mining research, especially for mining binary datasets. Surprisingly, there is much less work about numerical...  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司    京ICP备09084417号-23

京公网安备 11010802026262号