共查询到20条相似文献,搜索用时 156 毫秒
1.
数据流是不断变化且难以预测的。因此,在数据流中进行突发检测,是数据流内在的,固有的问题之一。所谓突发,指的是特定时间段内的数据量显著异常于其它时间段。如何实时地相对精确地检测出数据流中的突发并良好地呈现给用户,国内外已展开相关研究,并成为数据流挖掘领域的热点问题之一。论文综述国内外数据流突发检测的研究现状,归纳与分析现有研究工作的适用场景,并给出研究的焦点及热点,最后展望了该领域的前景。 相似文献
2.
水声传感器网络接收到的数据是不连续序列,数据本身具有变化性和不可预测性.数据流突发检测能够及时地定位数据异常.传统的数据流检测技术都是针对单一数据设计突发检测算法,无法适应水下三维异构的检测环境,无法对多个滑动窗口进行检测,很难对不同的三维场景运用对应的数据模型表述,判断数据突发状态准确度不高.提出一种动态小波传感数据流突发判断方法,对小波层次进行监测以及对检测阀值的及时调整,可针对不同三维传感网络中的多个滑动窗口进行检测,大大提高了数据流突发判断的准确率.通过仿真验证,改进方法能够避免三维异构环境对水声传感器的干扰,对突发情况下数据流的检测效率和精度都较高. 相似文献
3.
4.
基于突发特征分析的事件检测* 总被引:2,自引:1,他引:1
针对新闻数据流的事件检测问题,提出了一种基于突发特征分析的事件检测方法。事件由在一定时间窗口内代表它的特征构成,通常它们在事件发生时表现出一定的突发。通过多尺度突发分析算法识别出突发特征,并计算突发特征突发模式的相似性及所在新闻的重合度,对突发特征进行聚类分析以构造事件。在路透社80多万篇新闻数据集中验证上述算法,可准确地识别出突发特征各种跨度上的突发,且能有效地检测出事件。 相似文献
5.
一种基于情感符号的在线突发事件检测方法 总被引:4,自引:0,他引:4
如何快速高效检测出海量数据流中的突发事件是目前的研究热点之一.文中针对微博数据流,提出了一种新颖的基于情感符号的在线突发事件检测算法框架.伴随着事件的发生,文本流中情感符号也存在突发现象.文中通过实时监测情感符号变化态势,及时发现情感符号的突发期,达到挖掘突发事件的目的.首先基于频繁模式挖掘和互信息相结合的算法构建情感符号模型,并通过此模型抽取数据流中的情感符号,采用改进Kleinberg算法检测突发期,通过启发式的近邻传播聚类算法检测突发事件并对事件进行合并.同时,算法设置了离线回收机制,对不含情感符号的博文进行回收利用以保证事件概要抽取的完备性.实验表明,该算法可有效地挖掘出突发事件,无论在速度还是精度上都能保证实时在线处理的要求. 相似文献
6.
复杂数据流中所存在的概念漂移及不平衡问题降低了分类器的性能。传统的批量学习算法需要考虑内存以及运行时间等因素,在快速到达的海量数据流中性能并不突出,并且其中还包含着大量的漂移及类失衡现象,利用在线集成算法处理复杂数据流问题已经成为数据挖掘领域重要的研究课题。从集成策略的角度对bagging、boosting、stacking集成方法的在线版本进行了介绍与总结,并对比了不同模型之间的性能。首次对复杂数据流的在线集成分类算法进行了详细的总结与分析,从主动检测和被动自适应两个方面对概念漂移数据流检测与分类算法进行了介绍,从数据预处理和代价敏感两个方面介绍不平衡数据流,并分析了代表性算法的时空效率,之后对使用相同数据集的算法性能进行了对比。最后,针对复杂数据流在线集成分类研究领域的挑战提出了下一步研究方向。 相似文献
7.
上世纪末,为适应网络监控、入侵检测、情报分析、商业交易管理和分析等应用的要求,数据流技术应运而生。数据流独特的特点,对传统数据的处理方法带来了很大的挑战。介绍了数据流的有关概念及数据流挖掘的特点,讨论了数据流挖掘的研究现状。最后,举例说明了数据流挖掘的应用,并展望了数据流挖掘未来的研究方向。 相似文献
8.
9.
数据流管理和挖掘技术探析 总被引:2,自引:1,他引:1
数据流管理和挖掘技术是数据库领域的新研究方向之一。概述了数据库技术的发展趋势以及数据流的概念、特点、体系结构、应用领域,分析了数据流概要数据结构的构造问题和数据流的连续近似查询技术,最后介绍了数据流挖掘技术。旨在描述数据流管理和挖掘技术的发展概况,为进一步的研究提供有益的借鉴。 相似文献
10.
事件检测是事件处理系统最重要的研究问题之一。异常、变化和突发是三类最典型的数据流事件。本文关注如何在数据流中同时检测多种事件,首先研究了多种事件之间的联系,然后给出了基于网格聚类的统一处理方法,最后为了评估事件的严重程度,给出了打分函数。实验验证了所提方法的正确性与有效性。 相似文献
11.
12.
数据流挖掘分类技术综述 总被引:7,自引:0,他引:7
数据流挖掘作为从连续不断的数据流中挖掘有用信息的技术,近年来正成为数据挖掘领域的研究热点,并有着广泛的应用前景.数据流具有数据持续到达、到达速度快、数据规模巨大等特点,因此需要新颖的算法来解决这些问题.而数据流挖掘的分类技术更是当前的研究热点.综述了当前国际上关于数据流挖掘分类算法的研究现状,并从数据平稳分布和带概念漂移两个方面对这些方法进行了系统的介绍与分析,最后对数据流挖掘分类技术当前所面临的问题和发展趋势进行了总结和展望. 相似文献
13.
基于嵌入二维数组的迁移聚集树的数据流突变检测算法 总被引:1,自引:0,他引:1
数据流突变检测技术由于在金融、医疗服务、电信等重要领域有广泛应用而受到国内外科研学者更多关注。为了能够检测正数据流、负数据流以及正负交错数据流的突变,提出了嵌入二维数组的迁移聚集树的数据流突变检测算法。该算法能够检测单调聚集函数和非单调聚集函数的突变,能够在较少时间内完成数据流突变检测的任务。实验证明本算法有良好的性能和效率,更适合检测突变的数据流。 相似文献
14.
异常点检测技术由于其广泛的应用而得到深入的研究,数据流异常点检测在决策支持和监测等领域有着广泛的应用前景,并成为数据管理与挖掘的研究热点.本文将一种基于数据挖掘的异常检测模型应用在办公室局域网的异常点入侵检测中,针对该问题提出了基于密度的异常点定义及检测模型,该模型建成的系统具有可扩展性、自适应性和准确性等特点. 相似文献
15.
随着信息安全领域研究和应用的深入,网络行为和流量分析等应用对网络流的处理提出了更高的要求。从数据流管理系统的角度重新诠释了网络流分析,设计并实现了一个能够匹配千兆网络的高速数据流管理系统IS—DSMS(Data Stream Management System for Information Security)。系统利用了采样技术、概要技术、滑动窗口等技术对常用的五类聚合查询进行了优化。实验证明,系统具备千兆网络条件下实际使用的性能,可作为网络数据流实时查询和统计分析引擎,为入侵检测、网络监控等系统提供高速有效的支持。 相似文献
16.
针对三维水声传感器网络中数据流突发检测的多源性和异质性,对描述突发异常的特征和属性进行形式化定义和建模;然后,提出一种基于进化博弈论的突发检测算法,通过滑动窗口大小的优化选择与配置提高突发检测模型的处理速度与检测性能。仿真实验结果表明,基于进化博弈论的突发检测算法在数据分布、突发概率或者最大滑动窗口大小相同的情况下,处理时间少于传统的突发检测算法。 相似文献
17.
18.
19.
一种面向周期性概念漂移的数据流分类算法 总被引:1,自引:0,他引:1
数据流挖掘已在许多领域得到应用,概念漂移检测是数据流挖掘研究中的一个重点.目前关于数据流中的概念检测的研究虽然取得了很多成果,却没有充分考虑到数据流概念"周期性"出现的特点.针对周期性概念漂移的特点,提出了当"历史概念"重现时,利用对应的模型来对数据流进行分类的方法,从而减小模型更新的代价,加快分类预测的速度.实验证明这种方法提高了运行效率. 相似文献
20.
1 研究背景及研究意义
深度包检测(DPI: Deep Packet Inspection)技术是防火墙领域中解决应用层防护的重要技术[1].DPI技术对数据流的负载内容进行检测,将负载内容抽取的特征与规则集进行比较,检测是否有恶意性质的数据负载.DPI研究主要从数据包预处理方法和特征匹配算法这两个方面来提高其性能,特征匹配算法是深度包检测的关键. 相似文献