期刊界 All Journals 搜尽天下杂志传播学术成果专业期刊搜索期刊信息化学术搜索

1.

马占欣陆玉昌《清华大学学报(自然科学版)网络.预览》2007,(7)

为了解决负关联规则挖掘中包含负项目的频繁项集数量爆炸问题,引入过频繁项集的概念,证明过频繁项集及其所有超集均不可能产生有趣的关联规则。在频繁项集生成过程中,必须对项集中包含负项目的个数进行限制。使用最小支持度、最大支持度、项集中最多包含负项目的个数2个参数来约束频繁项集生成过程的算法。实验结果表明:所增加的两个参数是必要的,特别是当数据集中所包含的项目个数比较多时,只有恰当地设置两个额外参数,才能够保证挖掘过程的正常进行。相似文献

2.

基于两级多支持度的非频繁项集挖掘方法

李刚王洪国董祥军杨越越郭跃斌《郑州大学学报(理学版)》2007,39(4):94-97

现有关联规则挖掘算法都是在频繁项集基础上进行挖掘,关于非频繁项集的资料很少.特别是在研究负关联规则后,非频繁项集因包含重要的负关联规则而变得非常重要.针对这一问题,在多支持度算法的基础上提出了一种新的算法模型,能够在挖掘频繁项集的同时得到非频繁项集,实验结果表明了该算法的有效性. 相似文献

3.

一种挖掘负关联规则的有效方法 总被引：2，自引：1，他引：1

张雅芬王新《云南民族大学学报(自然科学版)》2011,20(4):301-304

负关联规则表示2个项集之间的互斥或否定关系,往往隐藏在数量庞大的非频繁项集中,有很强的相关性且包含了重要的信息.提出了一种基于相关系数和最小兴趣度的挖掘负关联规则的方法,并给出了相应的算法,实验表明该算法能有效提高挖掘效率. 相似文献

4.

基于倒排表和集合的TOP-N最频繁项集挖掘算法

孙序《科技信息》2011,(27):I0045-I0047

最频繁项集挖掘是文本关联规则挖掘中研究的重点和难点,它直接决定了文本关联规则挖掘算法的效率。本文首先分析了当前在最频繁项集挖掘方面的不足,然后给出了几个命题和推论,紧接着结合最小支持度阈值动态调整策略,提出了一个基于倒排表和集合的TOP-N最频繁项集挖掘IntvSet算法,最后对所提算法进行验证。实验结果表明,该算法的规则有效率和时间性能比常用的两个TOP-N最频繁项集挖掘算法:NApriori算法,IntvMatrix算法都好。相似文献

5.

基于免疫算法的频繁项集挖掘

段季芳梁雪芳别荣芳林定移《北京师范大学学报(自然科学版)》2009,45(2):161-163

设计了一种不同于传统关联规则挖掘算法(如Apriori算法等)频繁项集产生算法.该算法借鉴一般免疫算法思想,并从新的角度来看频繁项集的定义,避免了传统算法中存在的"项集生成瓶颈"问题.通过对mushroom数据的频繁项集挖掘的实验,与传统方法进行了比较,其结果表明,基于免疫算法的频繁项集挖掘算法在大数据集、低支持度情况下平均挖掘时间短. 相似文献

6.

关联规则挖掘的一种多剪枝概念格方法 总被引：1，自引：0，他引：1

徐勇秦小麟《重庆大学学报(自然科学版)》2008,31(4):451-456

多数据源上关联规则挖掘方法,由于各数据节点间相互通信的候选项集数目过于庞大或者挖掘过程需要对数据库进行多次扫描,导致挖掘算法效率不高。研究剪枝概念格(pruned con-cept laffice,PCL)中概念与频繁项集表示关系,定义剪枝格上的导出频繁项集,设计了一个利用多剪枝概念格从多数据源上挖掘近似所有关联规则的算法UMPCL(union algorithm of multiplepruned concept lattice)。利用一个频繁概念表示一些频繁项集以减少挖掘过程中产生的侯选项集数,使用与全局支持度相等的局部支持度对各子概念格进行剪枝,最后融合、剪枝各子剪枝格并提取全局关联规则。理论分析和实验验证表明该算法是有效的。相似文献

7.

分布式多空间数据库复杂时态数据提取技术

李婧《科学技术与工程》2019,19(12)

传统方法实现过程复杂、历史复杂时态数据的片面性,导致其无法全面地描述时态数据;且相似性计算无法准确匹配具有动态性与复杂性的时态数据,造成提取精度低。为此,提出一种新的分布式多空间数据库复杂时态数据提取技术。设计动态RBF神经网络,对分布式多空间数据库中未知动态进行识别和建模;通过建模结果完成对复杂时态数据的描述。依据加权关联规则与时态关联规则对支持度和置信度的定义,获取T-FS-tree加权时态关联规则中支持度和置信度。将复杂时态数据描述序列、最小支持度、最小置信度作为输入,将加权时态关联规则作为输出,建立T-FS-tree加权时态关联规则挖掘算法。按照向量计算获取加权时态频繁1项集以及频繁2项集,依据获取的加权时态频繁项集建立初始频繁项集树;依据初始频繁项集树获取全部时态频繁项集;通过获取的频繁项集产生加权时态关联规则。从所有关联规则中选择优先度高的规则,构建的复杂时态数据提取器,实现复杂时态数据提取。实验结果表明,所提方法复杂性低,提取结果更加全面、可靠,有很高的准确性。相似文献

8.

基于最小支持度阈值动态调整策略的最频繁项集挖掘算法

陈超刘才铭《兰州理工大学学报》2012,38(4):85-88

最频繁项集挖掘是文本关联规则挖掘中研究的重点和难点,它决定了文本关联规则挖掘算法的性能.针对当前在最频繁项集挖掘方面的不足,改进传统的倒排表,并结合最小支持度阈值动态调整策略,提出一个新的基于改进的倒排表和集合理论的最频繁项集挖掘算法.另外,给出几个命题和推论,并把它们用于本文算法以提高性能,最后对所提算法进行实验验证.实验结果表明,该算法的规则有效率和时间性能比常用的两个最频繁项集挖掘算法(NApriori算法,IntvMatrix算法)都好. 相似文献

9.

基于Rough集的单维布尔关联规则的挖掘算法

卓月明覃遵跃胡斌《吉首大学学报(自然科学版)》2006,27(4):64-67

利用Rough集理论中关于等价类的概念，提出了单维布尔关联规则问题挖掘算法，考虑到关联规则设定单一最小支持度阈值的局限性，提出使用多个最小支持度的办法进行频繁项集的发现，利用兴趣度对单维布尔关联规则进行评价. 相似文献

10.

应用个性化推荐的Web日志关联规则挖掘算法研究

邹丽霞《河南科学》2010,28(9):1125-1129

对传统的关联规则挖掘算法FP-Growth方法进行改进,提出FP-Mine算法,并应用该算法对Web日志进行挖掘,探寻用户访问站点页面之间的关联规则,来帮助管理员改善站点的设计和企业改进市场商务决策.实验结果证明FP-Mine算法在生成频繁项集及关联规则的过程中,只需存储i-size和(i+1)-size频繁项集的节点的Freq-Set-Tree,且立即在其之上生成规则,所以缩短规则生成的时间,提高规则生成效率,同时释放i-size项集的节点,有效地节省内存空间. 相似文献

11.

基于PSO的加权关联规则挖掘算法 总被引：1，自引：0，他引：1

李呈林陈水利《集美大学学报(自然科学版)》2007,12(1):52-58

简要描述了加权关联规则问题及离散粒子群优化算法,提出了一种基于粒子群优化(PSO)算法的加权关联规则挖掘算法(PSO-WMAR).实验证明,本算法运行时间更省,产生的规则数更少且更有效.该算法具有以下特点:1)把关联规则挖掘的两个阶段结合在一起,无须先挖掘出全部频繁项目集然后再提取规则;2)只需要扫描一次数据库;3)把兴趣度引入适合度函数之中,挖掘出的规则数量更少、更有效;4)求加权频繁项目集无须查找所有候选加权频繁项目集,或者求频繁项目集的高序子集或非频繁项目集的低序超集. 相似文献

12.

一种不产生候选项集的关联规则挖掘算法

刘晓玲李玉忱《山东师范大学学报(自然科学版)》2006,21(1):46-48

在挖掘关联规则的过程中，关键步骤是产生频繁项集．基于频繁项集支持矩阵的思想，提出一种有效的频繁项集挖掘算法-FIMA，并给出了算法的基本设计思想和算法描述．本算法利用矩阵挖掘频繁项集，不需要产生候选项集，且只需扫描数据库一次。所以此算法是非常有效的．相似文献

13.

关联规则Apriori算法的改进 总被引：7，自引：0，他引：7

杨晓平《浙江海洋学院学报(自然科学版)》2006,25(2):176-182,195

Apriori算法是关联规则提取的经典算法,但存在一些不足之处。关联算法的研究主要集中在提高Apriori算法的效率上。本文分析了该算法并进行了改进,使得频繁集产生的同时精简事务集。这种算法及时去掉了不必要的数据,减少了数据运算,从而使算法更优化。相似文献

14.

一种高效的频集挖掘算法

罗可张学茂《长沙理工大学学报(自然科学版)》2006,3(3):84-90

频集挖掘是关联规则挖掘的关键步骤,它对强规则、相关分析和时间序列有着重要的意义.常用的频集算法包括Apriori和FP-G rowth.为了提高算法效率,提出了一种基于D iffset的混合算法———D iffsetHybrid,该算法根据数据集的稀疏程度决定采用D iffset的某种形式来挖掘频集,减少了存储空间,提高了算法效率.试验表明,该算法对于稀疏数据集和稠密数据集都有良好的计算性能. 相似文献

15.

基于最频繁项提取和候选集剪枝的THIMFUP算法

杨勇张磊曲福恒刘俊杰陈强《吉林大学学报(理学版)》2021,59(3):635-642

针对FBCM(基于矩阵压缩FUP(fast update algorithm))算法在项集挖掘过程中存在频繁扫描原频繁项集库, 并生成大量候选集的问题, 提出一种通过提取数据库中最频繁项的方法, 以降低对原频繁项集库的扫描次数；并通过候选集剪枝思想, 减少算法整体运行过程中的候选集生成, 以提高频繁项集的挖掘速度. 实验结果表明, 在相同实验条件下, 该算法的效率比FBCM算法效率提高15%以上, 最高达60%. 相似文献

16.

基于动态数据的加权频繁项集挖掘算法

杨秋翔王婷《科学技术与工程》2019,19(20):265-272

为解决在挖掘频繁项集过程中,因忽略不同项目间的重要程度而导致的挖掘有效性低以及忽略数据的动态更新而造成的挖掘效率低的问题,通过引入新的加权规则,从权值与频数两方面去体现项目间的重要性差异,并通过引入树形结构与关系矩阵提高数据动态变化时频繁项集的挖掘效率。创新性地提出基于动态数据的加权频繁项集挖掘算法weighted dynamic date mining (WDDM)。实验结果表明,WDDM算法较以往算法挖掘效率与有效性显著提高,有利于发现更多有研究价值的信息。相似文献

17.

项目集的性质研究

李天瑞徐扬马俊《辽宁工程技术大学学报(自然科学版)》2001,20(5):601-603

传统的关联规则挖掘框架产生大量的规则,使得人们很难利用它们。本文主要针对项目集进行研究,提出了项目集的上、下闭集的概念,并得到了上、下闭集及其它们之间的一些性质,为解决规则数量问题提供了理论基础。相似文献

18.

含负项的关联规则挖掘研究综述

冯山游晋峰《四川师范大学学报(自然科学版)》2011,34(5):746-750

关联规则挖掘是数据挖掘研究的一个重要领域,传统的关联规则仅反映了正项之间的关联关系,无法反映出数据之间隐藏的负关联关系.从以下方面对含负项的关联规则挖掘进行了综述:引入负项的原因,包含正、负项的关联规则概念及相关术语,最新的含负项关联规则研究情况,经典算法的讨论.最后,展望了含负项关联规则领域未来的研究方向. 相似文献