共查询到19条相似文献,搜索用时 187 毫秒
1.
将关联规则发现算法引入到中药配方数据库的数据挖掘中,以求发现方剂中单方之间的关联规则及中药中的药对药组,可以为中药中新药的研制提供重要依据。由于常用的关联规则发现算法:Apriori算法存在多次扫描数据库的缺陷,提出了一种基于矩阵的关联规则发现算法:Apriori_Matrix算法,该算法优化了Apriori算法中集合连接过程多次比较所花费的时间,可极大地提高关联规则挖掘的效率。针对中药数据库中单方的种类有限、配伍规则各不相同、同一种病症对应多种方剂的情况,改进算法有助于缩短新药研制的周期。 相似文献
2.
在大型数据库项目之间发现关联规则是一个重要的数据挖掘问题,而挖掘出的关联规则数目常常是巨大的.文中介绍了简单关联规则和原关联规则的概念,而传统算法挖掘出的关联规则集中的任何规则,均可以由原关联规则导出,并且原关联规则的数目远远小于传统算法挖掘出的关联规则数目.对简单关联规则和原关联规则进行了分析比较,给出了挖掘原关联规则算法,并举例说明算法的执行过程. 相似文献
3.
关联规则的几种开采算法及其比较分析 总被引:14,自引:0,他引:14
关联规则的发现是数据开采的一个重要方面,目前有许多人正致力于关联规则的快速开采集法,本文介绍几种开采大型事务数据库中所有关联规则的算法,并比较它们的效率。 相似文献
4.
5.
张颖 《计算机光盘软件与应用》2011,(11)
关联规则是一个应用广泛的数据挖掘算法,本文介绍了关联规则算法的工作原理,如何配置关联规则算法的参数及建立挖掘模型.结合一个高职院校的实例,对关联规则挖掘算法在专业课设置中的应用进行了研究,并对挖掘得到的结果进行了具体分析. 相似文献
6.
关联规则的发现是数据挖掘的一个重要方面,而数量关联规则的发现不同于传统的布尔型关联规则。介绍了数量型关联规则挖掘的方法、步骤以及存在的问题,分析了几种具有代表性的数量型关联规则挖掘算法,提出了IQAM算法,并对数量型关联规则的挖掘进行了展望。 相似文献
7.
关联规则的发现是整个数据挖掘课题中的重要组成部分。在归纳现有关联规则研究的基础上提出了事务间数值型关联规则的数据挖掘问题,并对该问题进行了定义。应用模糊理论和相关的数据挖掘技术,提出了解决该问题的E—QA算法,并以实例对算法可行性进行验证,指出了算法存在的一些问题以及今后解决这些问题的思路。 相似文献
8.
关联规则的发现是数据挖掘的一个重要方面,而数量关联规则的发现不同于传统的布尔型关联规则。属性值的离散映射是挖掘定量关联规则的一个重要环节,离散映射中属性值区间的划分粒度是影响数据挖掘质量的一个重要因素。该文介绍几种发现大型事务数据库中数量关联规则的算法,并对他们加以比较。 相似文献
9.
10.
11.
中医药数据预处理方法的设计与实现 总被引:6,自引:2,他引:4
中药作为一种天然药物,它由我国传统使用的植物、动物和矿物药及其成药组成,由于中药文化的地区差异使得中药中的不确定性较高,因此将关联规则发现算法应用于原始中药专利数据库发现规则,存在一定的难度。阐述了一套规范原始中医药数据的处理方法,改进了数据质量,使得数据挖掘技术可以在预处理后的中药方剂数据库中成功地发现中药单方之间的配伍规律,为研制中药新药提供决策信息。 相似文献
12.
Apriori算法是挖掘关联规则的经典算法.在分析该算法的基础上,在实际项目应用当中,结合SQL的特点,提出Apriori算法在SQL中的改进算法-Apriori_Sql.应用Apriori_Sql算法只需扫描一遍数据库,在数据库临时表中建立原始数据库的压缩数据映射,实验表明该算法是一种高效的关联规则的挖掘算法. 相似文献
13.
介绍了关联规则的常用理论,研究了关联规则中的标准Apriori算法,针对其不足进行了有益的改进,提出了一种新的加权关联规则挖掘算法,并分析了其主要特点。通过把该算法用于电子商务数据挖掘中,并与标准Apriori算法的对比分析,证明了这种新的加权关联规则挖掘算法的有效性。 相似文献
14.
中药化学数据库关联规则的挖掘 总被引:1,自引:1,他引:0
数据挖掘是一种新兴的信息处理技术,本文将其中的关联规则运用到中药化学数据的处理,对其中的中医药效、植物科属、化学成分的活性、中药提取物现代药理等数据进行了维间关联规则的挖掘,找到了一系列的强规则,并对这些规则进行了分析,得到了其中有趣的关联规则,同时该关联规则的结果也说明了中药和西药在药效概念上的差异。该结果对于中药现代化,植物化学等相关的研究提供了一种新的思路。 相似文献
15.
郑继刚 《计算机与数字工程》2010,38(12)
传统的关联规则挖掘Apriori算法时间开销大,针对Apriori算法的不足之处,基于关系代数理论,利用关系矩阵及相关运算给出了搜索频繁项集的基于关系代数理论的关联规则挖掘(ORAR)算法.利用关系矩阵只需扫描数据库一次,以降低算法运行时间,挖掘频繁项集,最后通过仿真实验比较这两个算法的执行时间,讨论了数据样本量和最小支持度对算法性能的影响.通过大量的仿真实验证明改进的ORAR算法是高效的,减少了挖掘数据集中频繁项集的运行时间. 相似文献
16.
本文采用一种基于布尔矩阵的频繁集挖掘算法。该算法直接通过支持矩阵行向量的按位与运算来找出频繁集,而不需要Apriori算法的连接和剪枝,通过不断压缩支持矩阵,不仅节约了存储空间,还提高了算法的效率。 相似文献
17.
在关联规则挖掘算法中,Apriori由于多次对数据库进行扫描会产生较多的候选集,在多次扫描数据库的情况下容易产生I/O开销问题,并引起数据挖掘效率低。矩阵关联规则在数据挖掘过程中没有删除非频繁项集,致使存在较多的无效扫描,对于挖掘效率的提高也不明显。该文提出了一种改进的矩阵和排序索引关联规则数据挖掘算法,首先,删除不需要的事务和项,通过矩阵相乘和查找表获得频繁的二项式集合,结合排序索引得到剩下的频繁k-项集。与矩阵关联规则算法和Apriori算法进行比较,提出的算法可以直接查找频繁项集并对数据库进行扫描,当产生频繁项集比较多或者数据库需要进行动态更新时,该算法具有较好的可行性和执行效率。实验表明,提出的矩阵排序索引算法很好地降低了内存的使用率和I/O的开销,提高了数据挖掘的效率且具有较好的可扩展性。 相似文献
18.
基于双库协同机制的挖掘关联规则算法Maradbcm 总被引:9,自引:1,他引:9
关联规则是数据挖掘中一种重要的模式,Aprori算法是挖掘关联规则的典型算法,而Apriori算法存在一定的缺点:数据库的全局搜索和产生大项集时使用支持度阈值会删除有意义的规则等。Maradbcm算法是在KDD内在机理研究 的基础上提出的一种新的挖掘关联规则算法,它可以克服Apriori算法的上述缺点,在简要地叙述了双库协同机制和Maradbcm算法后,将该算法应用于蘑菇数据库,结果显示该算法是有效的,它充分显示了内在机理研究对KDD主流发展的重要作用与影响,并为整个知识发现系统的研究提供了一条全新的路径。 相似文献
19.
论文先介绍数据挖掘中关联规则理论知识,包括Apriori经典算法、支持度、可信度等概念。以一个超市的销售模型系统为例,建立一个sales数据库系统,由关系数据库管理系统和数据仓库挖掘工具进行单维及多维关联规则挖掘。 相似文献