排序方式: 共有39条查询结果,搜索用时 62 毫秒
1.
张红荣 《郑州轻工业学院学报(自然科学版)》2013,(5):59-61
将频繁项集挖掘算法中的FP-Growth算法应用到毕业生信息管理系统中,算法采用FP树对事务数据集进行压缩存储,然后再利用FP树得到所有的频繁项集.该系统可从大量的毕业生信息出发,找出就业信息与教育信息之间的关系,从而为决策者提供指导或数据支持. 相似文献
2.
3.
入侵检测系统作为一种主动的信息安全防御措施,有效地弥补了传统安全防护技术的不足,利用数据挖掘善于从大量数据中提取有用规则的特点,提出了一种改进的FP-Growth关联分析算法的网络入侵检测防御系统模型,该方法可以极大地提高数据挖掘的速度和节省数据挖掘中数据存储的空间。 相似文献
4.
Apriori和FP-Growth算法是频繁模式挖掘中的经典算法,由于Apriori存在更多缺陷,因此FP-Growth是单机计算环境下比较高效的算法。然而,对于非并行计算在大数据时代遇到的瓶颈,提出一种基于事务中项间联通权重矩阵的负载平衡并行频繁模式增长算法CWBPFP。算法在Spark框架上实现并行计算,数据分组时利用负载均衡策略,存入分组的数据是相应频繁项的编码。每个工作节点将分组数据中每一个事物中项的联通信息存入一个下三角联通权重矩阵中,使用被约束子树来加快每个工作节点挖掘频繁模式时创建条件FP-tree的速度,再用联通权重矩阵避免每次挖掘分组中频繁模式时对条件模式基的第一次扫描。由于联通权重矩阵和被约束子树的结合应用于每一个工作节点的FP-tree挖掘过程,因此提升了并行挖掘FP-tree性能。通过实验表明,所提出的并行算法对大的数据有较高性能和可扩展性。 相似文献
5.
针对中文在线评论中产品属性词的提取,提出了一种基于互自扩展模式的半监督学习方法。利用较少的人工参与,通过FP-Growth算法挖掘频繁项集获得种子属性词,通过增量迭代发现新的属性词,在每一轮迭代中,通过计算提取词与提取模式的置信度,确保了算法的准确性,同时避免了主题偏移。最后通过相似提取模式获得复合提取词,大大减少了因分词及词性标注错误所导致的属性词挖掘错误,以牺牲较少准确率的代价换取了较高的召回率。实验结果表明:本文算法对产品属性提取的F值可以达到78.97%,结果优于文献中其它类似提取算法。 相似文献
6.
OLAP中基于FP-增长的关联规则挖掘 总被引:1,自引:0,他引:1
关联规则挖掘是一种发现属性问关系的方法,主要用于在商务事务记录中挖掘事务问关系。本文将已经广泛使用的FP-增长(frequent-pattern growth,频繁模式增长)算法进行改进,实现了OLAP中的关联规则挖掘。改进算法分别针对单维、多维、混合维三种关联规则,将多维立方体转化成不同的关系表,通过关系表产生关联规则.并利用立方体中的事实值作为进一步约束,生成了更有价值的规则。 相似文献
7.
为提高换流站运维人员面对海量生成事件的分析能力,提出一种考虑换流站海量事件的关联规则挖掘分析方法。首先,利用原始事件元组特性进行记录事件与响应日志的实体特征筛选,并进行换流站实体特征的布尔映射与关联挖掘建模。然后,利用互信息(MI)原理与对称不确定性(SU)理论改进FP-Growth算法。最后,基于改进算法进行换流站事件关联分析,进而基于关联规则结果进行换流站异常反馈。通过挖掘昆柳龙直流换流站调试期间海量生成事件,表明所提出的方法可以有效地从海量事件中提取判断特征与结果特征的强关联规则,及时发现换流站的设备异常动作,并为运维分析提供决策支撑。 相似文献
8.
从数据集中挖掘数据间的相互关系及其关联规则是数据挖掘研究领域的核心内容之一,为了挖掘实体表现出的数据特征与实体具备因素间的关系,提出了一种挖掘方法.先采用聚类分析的方法对实体的数据进行了聚类,再通过关联分析的方法分析聚类簇中实体的因素,继而得出实体具备的因素与实体数据间的相互影响及其关联规则.通过该方法分析了学生具有的因素对学生学习成绩的影响,分析结果表明了方法的可行性. 相似文献
9.
随着移动互联网技术的发展,通过手机进行阅读已经成为人们的一种生活习惯。为了帮助读者在成千上万的“书海”中找到自己喜欢的图书,提出将经典的频繁项集挖掘算法FP-Growth应用到图书推荐系统中。算法根据读者的历史阅读记录,挖掘频繁出现的图书阅读组合,提取满足最小支持度和最小置信度阈值的强关联性规则,并根据关联规则进行图书智能推荐。实例证明该系统能够为读者提供快速、准确的智能推荐服务。 相似文献
10.
基于Hadoop的FP-Growth关联规则并行改进算法 总被引:1,自引:0,他引:1
大数据环境下,传统的串行FP-Growth算法在处理海量数据时,占用内存过大、频繁项多,适用于大数据情况的PFP(Parallel FP-Growth)算法存在数据量增大无法处理的缺陷。针对这些问题,本文提出了基于Hadoop的负载均衡数据分割FP-Growth并行算法。在Hadoop平台下,本文使用负载均衡和数据分割相结合的方式对原始事务数据集分片实现并行化。实验证明基于Hadoop的负载均衡数据分割FP-Growth并行算法在处理数据量和效率上有所提高。 相似文献