首页 | 官方网站   微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 15 毫秒
1.
针对智能温室大棚系统内局部传感器故障造成其不能及时有效向上推送准确数据的问题,提出将关联规则中的Apriori算法应用于故障传感器数据的预测.以温度传感器发生故障为例,首先将关联规则中传统的Apriori算法进行优化,然后将其运用到故障传感器参数的预测当中去.实验仿真表明,改进的Apriori算法能够快速的发现温室各参数之间的关联规则,从而估计出故障传感器的参数的范围,有一定的应用价值.  相似文献   

2.
吕真  李丹 《数字社区&智能家居》2011,(6):1234-1235,1244
该文通过对Apriori算法的基本思想和性能的研究剖析,认为Apriori算法存在一些不足;并且根据这些不足提出了相应的改进UDApriori算法对经典算法进行优化,从而得到一种改进的Apriori算法,与原算法相比运算效率大大提高.  相似文献   

3.
基于关联规则的Apriori算法的可视化实现方法   总被引:5,自引:0,他引:5  
关联规则的提取是数据挖掘中的重要研究内容,对关联规则提取中的Apriori算法进行了分析与研究,针对该算法的运算效率不高,对该算法进行了优化.该算法以经典的Apriori算法为基础,改进后的算法在运算速度明显好于Apriori算法.同时,还介绍了一种基于Apriori算法的可视化挖掘模型[1],并讨论了该可视化模型的实现方法.  相似文献   

4.
赵少卡 《福建电脑》2007,(12):115-116
本文提出一种面向大规模数据库的综合性数据挖掘技术.鉴于大规模数据库拥有庞大的数据和信息量,本文在传统的数据挖掘算法基础上使用了一些优化算法,如快速Apriori算法、Birch聚类算法等.结合理论结果,将数据挖掘应用于大型系数据库,基于关系数据库的实验表明数据挖掘系统的整体性能得到了有效提高.  相似文献   

5.
针对Apriori算法的不足,提出基于项数布尔矩阵的改进算法MPIN_Apriori。改进算法运用分治思想将数据集分段处理,使用事务项数进行矩阵压缩并利用向量交运算和先验剪枝直接生成局部频繁k-项集,最终合并为全局频繁k-项集。该算法从根本上改进了Apriori算法频繁迭代的流程,避免了连接运算而且极大减轻了内存负担。实验结果表明在进行大型数据库频繁项集挖掘时其效率明显高于Apriori算法,而且对分布式数据挖掘有参考价值。  相似文献   

6.
基于Apriori算法改进的关联规则提取算法   总被引:11,自引:2,他引:9  
通过对Apriori算法的基本思想和性能的研究分析,认为Apriori算法存在一些不足。并且根据这些不足提出了相应的改进算法对Apriori算法进行优化,从而得到一种改进的Apriori算法,与原算法相比运算效率大大提高。  相似文献   

7.
关联规则的提取是数据挖掘中的重要研究内容,对关联规则提取中的Apriori算法进行了分析与研究,针对该算法的运算效率不高,对该算法进行了优化.Partition算法以经典的Apriori算法为基础,通过将数据库分成几个互不相交的块来实现算法效率的提高.同时,还介绍了一种基于Apriori-Partition算法的可视化挖掘模型,并讨论了该可视化模型的实现方法.  相似文献   

8.
由于传统Aprioir算法的运算效率及扩展性较差的缺陷,使得其难以胜任海量数据的挖掘,因此本文提出了一种基于Mapreduce模型的Apriori算法。仿真表明,该算法能够大大地缩短挖掘时间,从而提高了Apriori算法的运算效率。  相似文献   

9.
Apriori算法是关联规则挖掘中最经典的算法之一,其核心问题是频繁项集的获取。针对经典Apriori算法存在的需多次遍历事务数据库及需产生候选项集等问题,首先通过转换存储结构、消除候选集产生过程等方法对Apriori算法进行优化,同时,随着大数据时代的到来,数据量与日俱增,传统算法面临巨大挑战,因此,又将优化的Apriori与Spark相结合,充分利用Spark的内存计算、弹性分布式数据集等优势,提出了IABS(Improved Apriori algorithm based on Spark)。通过与已有的同类算法进行比较,IABS的数据可扩展性和节点可扩展性得以验证,并且在多种数据集上平均获得了23.88%的性能提升,尤其随着数据量的增长,性能提升更加明显。  相似文献   

10.
从大数据的基本特点和医疗大数据研究现状出发,分析处理过程中存在的问题,提出在决策树算法下的医疗大数据填补及分类方法。分析医疗数据的关联规则,采用关联分析(Apriori)算法和频繁模式树(Frequent Pattern Growth,FP-Growth)算法挖掘数据。以挖掘数据为基础填补其中的缺失数据,按照医疗数据特点搭建决策树,并运用ID3和C4.5决策树算法,实现医疗大数据的分类,得出数据分类结果。由仿真得出,与传统方法相比,填补量提高了50%,分类精度提高了11.40%、14.80%,无论从数据的填补方面还是分类方法,上述方法均有较高的应用价值,为医疗大数据体系的构建开辟了新的思路。  相似文献   

11.
针对子宫癌病人住院人数的不断增加和住院期间医生所开药方种类繁多的大数据特点,以及传统关联规则算法存在时间效率低的缺点,采用了结合加权萤火虫优化算法和Apriori算法的关联规则挖掘算法Firefly-Apriorialgorithm(YHC-Apriori算法),萤火虫算法具有快速寻找最优解的特点,可以提升关联规则算法的运行效率.将此算法应用到对子宫癌疾病的用药规律方向进行数据挖掘,使得出的结论更准确并且减少算法运行时间.通过医疗大数据得出的宫颈癌常用药以及用药组合,使医生开的药方更精确,更有效.  相似文献   

12.
随着大数据技术的不断发展,医疗大数据的研究也成为我国医疗建设的重要一环,聚类能够挖掘出医疗大数据中潜在隐藏的信息,协助医生、医疗管理部门、科研所进行有效工作.研究分析聚类算法K-means和K-medoids在医疗大数据的应用,从优化聚类算法降低时间复杂度、对高维医疗大数据进行特征提取降低维度、通过并行处理平台加速医疗数据的处理速度方面出发,阐明聚类算法在医疗大数据的数据预处理、数据分类、疾病预测等方面都广泛的应用.随着并行处理平台的建设,聚类算法在医疗大数据的应用也将越来越广泛.  相似文献   

13.
介绍了从医疗数据中发现关联规则的方法,分析了医疗数据的特点,并以心脏疾病诊断的数据集为例,阐述了把医疗数据转换成事务数据格式的方法,描述了关联规则挖掘在医疗数据分析中应用所遇到的难题,针对这些难题给出了一种改进的Apriori算法,并用数据进行测试.结果表明,此算法优于Apriori算法,它可以减少产生的规则的数量,从而能快速发现有趣的医疗关联规则.  相似文献   

14.
针对数据的复杂多样性以及Apriori算法的低效问题,提出依托Spark计算框架的二阶分段式算法优化模型.基于K-Means方法设计并行聚类分析算法,采用该算法对多维多属性值数据类型进行聚类分析,提高数据差异性,降低数据规模.通过"字典表"化存储模式压缩数据量,采用"与"操作降低I/O和去候选频繁项集优化Apriori算法,利用优化后的Apriori算法挖掘聚类后数据的关联规则.通过算法分析及实验验证,当数据量达到"拐点"时优化后的算法模型相对于原Apriori算法执行效率提高47%以上,且不受数据复杂度和噪声影响,提高了规则的形成效率和鲁棒性.  相似文献   

15.
MapReduce是云计算技术主流的分布式计算模型,它充分利用计算机集群的处理能力;能对大规模数据进行高效的挖掘分析;在研究MapReduce模型架构的基础上,将云计算技术与数据挖掘技术结合在一起,提出了基于MapReduce模型的Apriori算法;该算法对事务集和项集进行双重二进制编码,只需"与"运算和"或"运算,提高了模式匹配和连接的效率;试验结果表明,该算法执行效率比传统集中式Apriori算法有很大幅度的提高。  相似文献   

16.
传统的关联规则挖掘Apriori算法时间开销大,针对Apriori算法的不足之处,基于关系代数理论,利用关系矩阵及相关运算给出了搜索频繁项集的基于关系代数理论的关联规则挖掘(ORAR)算法.利用关系矩阵只需扫描数据库一次,以降低算法运行时间,挖掘频繁项集,最后通过仿真实验比较这两个算法的执行时间,讨论了数据样本量和最小支持度对算法性能的影响.通过大量的仿真实验证明改进的ORAR算法是高效的,减少了挖掘数据集中频繁项集的运行时间.  相似文献   

17.
Apriori算法在挖掘频繁项集时需要多次扫描数据库,这样会因为频繁的IO操作而导致效率低下。为了改进算法的执行效率,提出BE-Apriori(binay encoded Apriori)算法,其充分利用了二进制数相比编程语言中各种数据结构在内存及运算速度上的优势,对事务记录进行二进制编码后加载到内存,然后利用等效的二进制数之间运算代替集合之间的运算。分析了算法性能,并利用UCI数据集中的毒蘑菇数据对BE-Apriori算法进行实验验证。结果表明BE-Apriori可以正确挖掘频繁项集,并且相比Apriori算法有着更好的性能。  相似文献   

18.
大数据时代,人们获取所需信息的困难度提高,而数据挖掘是当下解决此问题的关键技术。Apriori算法作为数据挖掘中的常用算法,通过挖掘数据背后的潜在关联规则。考虑到传统Apriori算法执行过程中,数据扫描频繁、候选集获取繁琐等问题,提出采用加权Apriori算法,即将冗余记录存储一次,并将记录的重复次数占全部记录数的比值作为权重,压缩空间;采用二进制的布尔矩阵替代原有数据集,通过矩阵内部“与运算”,获取最大频繁集,降低时间复杂度。考虑到原始数据冗余性以及粗糙集属性约简的不精确性,在提取关联规则前,提出采用多粒度粗糙集的属性约简算法,通过知识粒度细化属性值来提高约简精度,降低空间复杂度。最后,将所提方法与基于频繁矩阵的Apriori算法以及原始Apriori算法进行比较,验证所提方法的实用性和有效性。  相似文献   

19.
XML以其诸多优点,迅速成为不同领域间信息表示与交换的标准;大量XML数据的出现给数据挖掘带来了新的挑战;挖掘XML数据关联规则的大部分工作都是基于Apriori算法的研究;对Apriori算法的基本方法与效率进行了分析,指出其不足,并提出了改进的XApriori算法,该算法基于新的数据结构,利用Hash表的存储技术以及对Apriori算法的优化来提高查找频繁项集的效率;对Apriori算法和XApriori算法进行了比较,实验结果表明改进的XApriori算法优于Apriori算法。  相似文献   

20.
Apriori算法在图书推荐服务中的应用与研究   总被引:2,自引:1,他引:1  
数据挖掘是近年来数据库领域研究的热点问题之一.当今数字图书馆个性化服务已成为图书馆服务模式的主流,图书推荐服务是其重点之一.关联规则Apriori算法是数据挖掘的关键技术之一,主要是找出数据库中的所有频繁项集,然后由频繁项集产生关联规则.针对传统的Apriori算法存在的缺陷,利用"分割-整合"的思想改进了Apriori算法.将改进后的Apriori算法应用到图书推荐服务应用模型当中,并进行数据挖掘测试,通过与传统Apriori算法进行对比,改进后的Apriori算法的实际运行效果有明显的改进.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司    京ICP备09084417号-23

京公网安备 11010802026262号