排序方式: 共有179条查询结果,搜索用时 62 毫秒
1.
2.
针对频繁项集挖掘存在数据和模式冗余的问题,对数据流最大频繁项集挖掘算法进行了研究。针对目前典型的数据流最大频繁模式挖掘算法DSM-MFI存在消耗大量存储空间及执行效率低等问题,提出了一种挖掘数据流界标窗口内最大频繁项集的算法MMFI-DS,该算法首先采用SEFI-tree存储包含在不断增长的数据流中相关最大频繁项集的重要信息,同时删除SEFI-tree中大量不频繁项目,然后使用自顶向下和自底向上双向搜索策略挖掘界标窗口中一系列的最大频繁项集。理论分析与实验表明,该算法比DSM-MFI算法具有更高的效率,并能节省存储空间。 相似文献
3.
4.
改进遗传算法在试题自动组卷中的应用研究 总被引:14,自引:0,他引:14
针对传统的组卷算法具有组卷速度慢、成功率较低、组卷质量不高等缺点。本文提出了一种用改进的遗传算法来求解试题组卷问题的方法。实验结果表明,新方法的组卷成功率和收敛速度都得到明显提高,并且较好地克服了未成熟收敛现象,取得了较满意的组卷效果。 相似文献
5.
在网络化软件交互过程中,事务产生的行为序列中某些行为的标记(Token)丢失或不可用,导致无法对这些事务进行进一步的分析和处理,比如事务追踪、行为描述、行为模板提取等都难以实现.为了解决这个问题,首先提出了事务处理过程满足马尔科夫性(Markov)的状态转移模型(STM),再将该模型中的状态根据状态划分算法,分割成若干偶图子系统,并分别将这些偶图子系统转化为网络流图,最后采用网络流中最大流(MF)方法对状态转移模型中带部分标记的行为踪迹重新标识,将标识的结果整理成完整的踪迹序列,为后续的行为分析提供便利.实验结果表明,文章提出的方法是有效和可行的. 相似文献
6.
7.
一种轻量级架构的ETL系统设计与实现 总被引:2,自引:2,他引:0
ETL系统是构建数据仓库的关键组件.通过数据抽取、转换和装载工作,完成处理海量数据和构建数据仓库的任务.如何提高数据处理效率和增强系统稳定性是值得研究的问题.根据电信资源数据省级集中分析系统下的实际应用背景,提出了一种轻量级架构的ETL系统,该架构采取的是"化整为零"的思想,把原先核心的抽取和转换的任务部分划分到各个相应的子系统中做初步的处理,这样处理的优点在于应用中减轻了核心ETL引擎的承载负担,各个抽取任务单独进行互不依赖,提高了抽取效率.通过在具体应用环境下系统运行表明采用该架构ETL系统具良好的使用效果. 相似文献
8.
9.
数据流中基于滑动窗口的最大频繁项集挖掘算法* 总被引:2,自引:0,他引:2
挖掘数据流中最大频繁项集是从数据流中获得信息的一种有效手段,是数据流挖掘研究的热点之一。结合数据流的特点,提出了一种新的基于滑动窗口的最大频繁项集挖掘算法。该算法用位图来存储数据流中流动的数据;采用直接覆盖的方法存储和更新数据流上的数据;在深度优先搜索挖掘最大频繁项集时,除采用经典的剪枝策略外,还提出了与父等价原理相对应的子等价剪枝策略;最后将挖掘结果存储在索引链表中以提高超集检测效率,进一步减少挖掘最大频繁项集的时间。理论分析和实验结果证实了该算法在时间和空间上的有效性。 相似文献
10.