首页 | 官方网站   微博 | 高级检索  
相似文献
 共查询到18条相似文献,搜索用时 468 毫秒
1.
挖掘关注的语言值关联规则   总被引:1,自引:0,他引:1       下载免费PDF全文
为了解决利用RFCM算法划分数量型属性,并通过组合语言值进行语言关联规则挖掘中出现的规则数量太多,以及难于获得用户真正关注的规则等问题,提出了一种改进的语言值关联规则挖掘算法。通过最大隶属原则将记录在数量型属性上的取值转换为语言值,然后转换成布尔型属性关联规则挖掘问题。同时,给出一个能够度量语言值关联则简洁性和新奇性关注程度(兴趣度)的计算函数,用于减少选取关注语言值关联规则的工作量。采用本文提出的方法对一组实例数据进行实验,得到了关注程度较高的语言值关联规则。所采用的方法能适用于含有大量数量型属性的数据库,并能有效地获取用户关注的规则。  相似文献   

2.
提出了推荐模型中的关联规则挖掘方法的改进,给出了自定义的页面权值的定义,并改进了基于关联图的关联规则挖掘算法,将页面权值应用于关联规则的挖掘中。此算法是利用Web日志中经过预处理后得到的数据进行规则挖掘,将处理后的数据应用正态分布函数来得到页面权值。用页面权值重新计算支持度,最后将得到的支持度应用于改进的规则挖掘算法中,形成一种基于权值的关联图的关联规则算法。  相似文献   

3.
该文主要介绍了关联规则挖掘的FP-tree算法.并基于对FP-tree算法的研究,在Microsoft 2010中用c#语言实现FP-tree算法,并将应用程序应用到某汽车销售企业的汽车销售数据进行关联规则挖掘.根据程序所得到的结果,由lift值判断,证明了所得规则的有效性.  相似文献   

4.
临床数据中挖掘关联规则算法的选用   总被引:2,自引:0,他引:2  
对典型的挖掘关联规则的Apfiori算法和FP-growth算法进行比较分析.然后,结合临床数据的特点,建议在临床数据关联规则挖掘中采用FP-growth算法。  相似文献   

5.
利用Rough集理论中关于等价类的概念,提出了单维布尔关联规则问题挖掘算法,考虑到关联规则设定单一最小支持度阈值的局限性,提出使用多个最小支持度的办法进行频繁项集的发现,利用兴趣度对单维布尔关联规则进行评价.  相似文献   

6.
基于多支持度的挖掘加权关联规则算法   总被引:6,自引:0,他引:6  
关联规则挖掘是数据挖掘中一个重要的模型.在其挖掘算法中,如果最小支持度很高,则出现频率比较低的规则就不能发现;如果最小支持度太低,因为频繁项的相互关联,则会出现组合爆炸.为此,提出了允许用户设定多个最小支持度、给定数据各项的权重来解决这一问题.理论、实验数据和实际应用证明,该新算法可行且符合实际情况,比同类算法用时更少,对大型数据库的关联规则挖掘非常有效.  相似文献   

7.
针对卫星典型件在工艺设计过程中设计任务量大、重复性工作多,且其历史工艺数据未能充分有效利用的问题,进行了工艺知识挖掘的研究,以提高工艺知识的重用性.首先对工艺知识挖掘问题进行了描述,建立了工艺知识的关联规则模型;然后针对海量数据中Apriori算法挖掘效率低的问题引入二进制粒子群优化(BPSO)算法,并构造了基于BPSO的关联规则挖掘算法.最后对卫星结构板这一典型件的历史工艺数据进行挖掘,得到了卫星结构板典型工序序列.基于BPSO的关联规则挖掘算法可以有效提高工艺知识的挖掘效率.  相似文献   

8.
双重区间值聚类挖掘模型   总被引:1,自引:1,他引:0  
提出了双重区间值聚类的数据挖掘模型:首先将每个属性的取值按照领域知识划分为若干类。接着统计每个类在各条“交易”中出现的频率(支持度),最后再按照关联规则挖掘方法进行处理.这种区间值数据挖掘方法与传统的数据挖掘方法相比较,更有实用价值.  相似文献   

9.
关联规则的挖掘是一个重要的数据挖掘问题,在关联规则的挖掘过程中加入约束条件,是实现用户参与挖掘的一种方式,这样得到的规则是用户所真正关心的,而Separate算法便是这类算法的代表.先对Separate算法进行了改进,从而进一步提高其性能,然后用改进后的算法挖掘实际应用中的一个实例,最后对挖掘结果给出相关决策解释.  相似文献   

10.
张争龙 《科学技术与工程》2013,13(19):5687-5691
针对实际交易数据库中,不同项目的重要性和出现概率各不相同的两个问题,提出一种基于等价类和多最小支持度的加权关联规则算法,从而挖掘出那些覆盖较少数据但却有意义、用户可能更感兴趣的关联规则。算法按照项目的最小支持度升序对交易记录进行等价类划分,然后按照项目的最小支持度降序依次求出每一等价类内的加权频繁项集。算法采用垂直数据库的数据表示形式,挖掘过程中避免了对数据库的重复扫描。对比实验结果证明,改进算法具有良好的挖掘性能。  相似文献   

11.
最频繁项集挖掘是文本关联规则挖掘中研究的重点和难点,它决定了文本关联规则挖掘算法的性能.针对当前在最频繁项集挖掘方面的不足,改进传统的倒排表,并结合最小支持度阈值动态调整策略,提出一个新的基于改进的倒排表和集合理论的最频繁项集挖掘算法.另外,给出几个命题和推论,并把它们用于本文算法以提高性能,最后对所提算法进行实验验证.实验结果表明,该算法的规则有效率和时间性能比常用的两个最频繁项集挖掘算法(NApriori算法,IntvMatrix算法)都好.  相似文献   

12.
数据挖掘中并行离散化数据准备优化   总被引:2,自引:0,他引:2  
在海量数据挖掘中,针对元数据的离散化数据准备处理能有效提高数据挖掘效率.本文提出了一种并行比较并获得最优离散化的数据准备算法(AOA),针对不同数据集,先进行数据集的特性检测以获得数据集分布特性,按照分布特性进行数据集的异常值检测和剔除,并行完成与分布特性适配的离散化方法处理,通过比较不同离散化方法的熵、方差指数、稳定性参数的最小欧氏距离,根据三个参数自动化比选,获得最优离散化的预处理成果.仿真表明,对不同样本数据库进行关联规则挖掘结果中,比较四种固定的离散化数据预处理方法,在使用AOA数据准备算法并行比选出最优的离散化来数据预处理后,在不同最小支持度阈值情况下,挖掘得到关联规则数都更少,因此效率得到提高.  相似文献   

13.
基于粗糙集的最小规则提取算法   总被引:1,自引:0,他引:1  
传统的最小规则提取算法计算量非常大,分析了决策规则的约简形式,提出了一种基于粗糙集的最小规则提取算法,该算法对每个决策类分别提取规则,并采用启发式策略选择原子条件逐次添加到规则的因中,最后通过一个实例和实验验证了算法的简洁性和有效性。  相似文献   

14.
一种关系数据库中基于云模型关联规则的提取   总被引:2,自引:1,他引:2  
为了发现有效的关联规则,属性在比较高的水平被范化,允许相邻属性值或者语言项的重量.这种软划分可以映射人类的想法,同时使发现的知识鲁棒.利用云模型的理论与方法求解数量关联问题,给出了一种云关联规则的定义,并提出了基于云模型理论支持度和置信度的计算方法,最后提出了一种提取算法Cloud model A.这种方法较好地软化了数量属性论域的划分边界,从而使得挖掘出的云关联规则更容易被人理解。  相似文献   

15.
基于概念格提取简洁关联规则   总被引:1,自引:0,他引:1  
从量化封闭项集格所提取的所有最小无冗余规则,虽满足最小前件最大后件的要求,但并不是满足用户设定支持度和置信度的最小规则集.本文提出了一种全局简洁关联规则,使所提取的规则集最小,并给出了基于量化封闭项集格提取全局简洁规则的算法.  相似文献   

16.
刘晓蔚 《科学技术与工程》2013,13(26):7667-7674
现实量化交易应用中,传统的模糊数据挖掘算法往往需要针对给定的量化交易设定最小支持度阈值,然而,这些方法中存在的普遍问题是很难找到合适的最小支持度阈值,并且因为推导出的规则通常是常识而没有实际的商业意义。为了解决这个问题,提出了一种无需最小支持度阈值的模糊关联规则(fuzzy coherent rule,FCR)挖掘算法。首先将量化交易转换成模糊集,然后通过收集已经生成的模糊集生成候选模糊关联规则,最后计算出列联表并用其检查这些候选模糊关联规则是否满足四项判断准则。如果满足,则可以确定为模糊关联规则。在Foodmart数据集上的实验验证了所提算法的有效性,相比原始模糊关联规则(fuzzy association rules,FAR)挖掘算法,所提的FCR方法能够推导出更多的规则,并且能够在高置信度时推导出更多有用的规则。  相似文献   

17.
传统方法实现过程复杂、历史复杂时态数据的片面性,导致其无法全面地描述时态数据;且相似性计算无法准确匹配具有动态性与复杂性的时态数据,造成提取精度低。为此,提出一种新的分布式多空间数据库复杂时态数据提取技术。设计动态RBF神经网络,对分布式多空间数据库中未知动态进行识别和建模;通过建模结果完成对复杂时态数据的描述。依据加权关联规则与时态关联规则对支持度和置信度的定义,获取T-FS-tree加权时态关联规则中支持度和置信度。将复杂时态数据描述序列、最小支持度、最小置信度作为输入,将加权时态关联规则作为输出,建立T-FS-tree加权时态关联规则挖掘算法。按照向量计算获取加权时态频繁1项集以及频繁2项集,依据获取的加权时态频繁项集建立初始频繁项集树;依据初始频繁项集树获取全部时态频繁项集;通过获取的频繁项集产生加权时态关联规则。从所有关联规则中选择优先度高的规则,构建的复杂时态数据提取器,实现复杂时态数据提取。实验结果表明,所提方法复杂性低,提取结果更加全面、可靠,有很高的准确性。  相似文献   

18.
在挖掘关联规则和序列模式过程中,用户往往需要多次调整最小支持度,才能获得有趣的关联规则和序列模式.现给出基于已存信息的知识发现更新方法———PSI算法和大PSI-seq算法,以提高挖掘知识的效率.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司    京ICP备09084417号-23

京公网安备 11010802026262号