共查询到18条相似文献,搜索用时 335 毫秒
1.
2.
一种多重最小支持度关联规则挖掘算法 总被引:5,自引:0,他引:5
针对单一最小支持度挖掘关联规则不能反应不同数据项出现频度与性质的问题,提出了一个基于频繁模式树的多重支持度关联规则挖掘算法MSDMFIA(Multiple minimum Supports for Discover Maximum Fre-quent Item sets Algorithm),根据不同数据项的特点定义多重支持度,通过挖掘数据库中的最大频繁项目集,计算最大频繁候选项目集在数据库中的支持度来发现关联规则.该算法可以解决关联规则挖掘中经常出现的稀少数据项问题,并解决了传统的关联规则挖掘算法中的生成频繁候选集和多次扫描数据库的性能瓶颈.实验结果表明,本文提出的算法在功能和性能方面均优于已有算法. 相似文献
3.
针对已有的对低支持度关联规则进行挖掘的算法中没有提出对具有多个相关项的关联规则进行挖掘的有效方法,本文提出一种能够对低支持度关联规则的多个相关项进行有效挖掘的方法。算法基于相似度来衡量各个相关项的关联程度,在已有算法的基础上增加了一次特殊的矩阵转换,从而将对项的相似度衡量方法进行了转换,转换后的矩阵可以基于Apriori性质来拓展多个相似相关项。算法在低支持度情况下具有较高的挖掘效率和良好的挖掘效果,算法还可以用来挖掘多个项之间的排斥规则。 相似文献
4.
高法钦 《河北建筑科技学院学报》2002,19(4):46-50
以前基于支持度一置信度框架的关联规则挖掘算法都是先用支持度做为阈值对搜索结果进行剪枝,产生频繁集,再针对频繁集产生关联规则,这就是频繁关联规则,然而在很多应用,诸如:鉴别相似的Web文件,网络中入侵检测等,有许多有趣的关联规则仅有很少的支持度,在本文中,针对这种情况,提出了一种可以挖掘非频繁项之间有趣规则的算法,此算法先用相似度作为兴趣度度量以算法结果进行剪枝。 相似文献
5.
针对关联规则挖掘过程中定义最小支持度与置信度的阈值具有主观性的问题,提出一种迭代粒子群优化(particle swarm optimization,PSO)的方法挖掘关联规则。通过定义要提取的规则数目(M)的值,采用支持度和置信度定义适应函数,粒子群优化算法迭代,从数据集中提取最优的规则。算法避免了apriori算法需要设定最小支持度和最小置信度阈值等问题。通过对3个不同类型典型数据集挖掘验证算法的有效性,结果表明,使用PSO获得的规则平均支持度和置信度与apriori算法挖掘到的规则相比有明显提高。 相似文献
6.
高法钦 《河北工程大学学报(自然科学版)》2002,19(4):46-50
以前基于支持度一置信度框架的关联规则挖掘算法都是先用支持度做为阈值对搜索结果进行剪枝 ,产生频繁集 ,再针对频繁集产生关联规则 ,这就是频繁关联规则。然而在很多应用中 ,诸如 :鉴别相似的Web文件、网络中入侵检测等 ,有许多有趣的关联规则仅有很少的支持度。在本文中 ,针对这种情况 ,提出了一种可以挖掘非频繁项之间有趣规则的算法 ,此算法先用相似度作为兴趣度度量对算法结果进行剪枝 相似文献
7.
一种基于多层模糊模式的频繁项集剪枝算法的优化 总被引:3,自引:0,他引:3
运用关联规则对分布式数据库进行数据挖掘是一个常见的模式,为进一步提高在分布式挖掘多层关联规则算法的效率,改善内存的使用率,再次引入模糊理论和有效支持度的概念,并充分考虑有效支持度的闽值和有效支持度的支持频度,提出了一种新的产生频繁项集算法的修改方案,在理论上对此进行了分析和论证,实验证明这种算法的优化效果是明显的、是有用的。 相似文献
8.
针对负关联规则挖掘所带来的问题,提出加入最大支持度来控制频繁项集生成规模,改进了相关性的计算公式,并将其用作正负关联规则的兴趣度来剔除无兴趣的关联规则,限制关联规则中的前后件项目个数来保证挖掘出的关联规则的实用性和可理解性.最后,给出一种能够同时挖掘正负关联规则的算法,实验结果表明算法是有效的、可行的. 相似文献
9.
通过实例分析了支持度-置信度模型的缺陷和Apriori算法忽视反面示例的不足.引入了PS改进方法作为兴趣度,并设计了基于该兴趣度的关联规则挖掘算法.后通过实例对挖掘算法进行适当的分析,从而验证了该方法的有效性. 相似文献
10.
针对负关联规则挖掘所带来的问题,提出加入最大支持度来控制频繁项集生成规模,改进了相关性的计算公式,并将其用作正负关联规则的兴趣度来剔除无兴趣的关联规则,限制关联规则中的前后件项目个数来保证挖掘出的关联规则的实用性和可理解性。最后,给出一种能够同时挖掘正负关联规则的算法,实验结果表明算法是有效的、可行的。 相似文献
11.
随着数据库规模的日益增大,关联规则挖掘需要在挖掘效率、可用性、隐私性及精确性等方面得到提升,需要对传统的关联规则挖掘算法进行更新和改进。在传统的Apriori算法基础上,提出了一种新的在关系数据库中挖掘关联规则的算法。该算法只需扫描一次数据库即可得到频繁项集,并通过非频繁项集来减少候选项集的生成,从而提高了算法的运算效率;此外,该算法将包含敏感数据事务做相关的处理,以达到隐藏包含敏感数据的关联规则。理论分析和实验结果表明,新算法不仅提高了关联规则挖掘的效率,而且还达到了隐藏包含敏感规则的目的。 相似文献
12.
遗传算法在关联规则挖掘中的应用研究 总被引:1,自引:0,他引:1
在关联规则中引入遗传算法,并以地区生产总值统计为例尝试用遗传算法挖掘关联规则,阐述了遗传算法、数据挖掘及关联规则的概念和原理,并提出双层循环结构,利用精英重组,一致变异以及自适应参数的手段调整遗传算法进行数据挖掘,最后分析了该过程的收敛特性和时间复杂度. 相似文献
13.
数据挖掘技术作为一种有效的决策工具正为企业做出科学决策提供依据。该文针对关联规则挖掘商品间相关性的不足,提出了一种新的计算方法利用销售商的商品销售数据挖掘商品之间的相关性及影响关系。该方法根据商品销售数据的变化得到所有商品销售数据的时间序列,然后计算测量序列的相似度,从而确定商品间影响关系。实验证明了该方法的有效性,同时得到了一些有价值的结果,可用于指导具体商业实践。 相似文献
14.
增量式更新算法能充分利用已挖掘出的知识来提高挖掘效率,是数据挖掘高效算法中的一个主要方向.分析了典型的关联规则增量式更新算法波折法FUP算法的不足,提出了一种改进的关联规则增量式更新算法,新算法极大地降低了存储空间和挖掘时间需求,从而提高了整个关联规则挖掘的效率. 相似文献
15.
针对垂直分布下的隐私保护关联规则挖掘算法效率低、安全性不高的问题,提出一种隐私保护频繁闭合项集的挖掘算法。算法利用挖掘频繁闭合项集代替频繁项集,IT-Tree作为搜索空间,Diffsets作为压缩结构,采用基于RSA可交换加密算法的隐私保护集合差集协议。实验结果表明,算法具有较好的隐私性、准确性、高效性。 相似文献
16.
高效关联规则数据挖掘算法研究 总被引:4,自引:0,他引:4
关联规则挖掘是数据挖掘领域的一个重要问题,由于关联规则挖掘通常是基于超大型数据库或数据仓库,算法的效率在一定程度上决定挖掘的成败,针对关联规则挖掘中的主要任务--频集发现过程中存在的几个问题,提出了项目树的概念,引出了一种新的控制模式,并设计了相应的高效挖掘算法,大大提高了挖掘效率。 相似文献
17.
分类和关联规则是数据挖掘领域中最流行的两种技术。文章在分析Apriori关联规则算法的原理的基础上,对分类与Apriori两种技术的不同特点进行了比较。根据不同点将Apriori算法作为核心技术引入到分类挖掘中,给出一个新的分类算法,从实例的结果可以知道该算法的正确性和有效性,尤其是它能够很容易的处理带有缺省属性值的记录。 相似文献
18.
基于小波变换的全局能量图像融合算法 总被引:1,自引:0,他引:1
提出了一种基于小波变换的全局能量图像融合算法。对小波分解系数采用基于全局匹配度来选择和加权的融合规则。全局匹配度以区域能量作为测度,包含了小波分解的高频3个方向的匹配度。使得选择策略下融合图像的高频3个方向的小波系数均来自同一源图像,保证了小波重构时融合的一致性。实验结果表明,全局能量法的融合图像具有更好的融合特性。 相似文献