排序方式: 共有17条查询结果,搜索用时 15 毫秒
1.
离群点检测任务通常缺少可用的标注数据,且离群数据只占整个数据集的很小一部分,相较于其他的数据挖掘任务,离群点检测的难度较大,尚没有单一的算法适合于所有的场景。因此,结合多样性模型集成和主动学习思想,提出了一种基于主动学习的离群点集成检测方法OMAL(Outlier Mining based on Active Learning)。在主动学习框架指导下,根据各种基学习器的对比分析,选择了基于统计的、基于相似性的、基于子空间划分的三个无监督模型作为基学习器。将各基学习器评判的处于离群和正常边界的数据整合后呈现给人类专家进行标注,以最大化人类专家反馈的信息量;从标注的数据集和各基学习器投票产生的数据集中抽样,基于GBM(Gradient BoostingMachine)训练一个有监督二元分类模型,并将该模型应用于全数据集,得出最终的挖掘结果。实验表明,提出方法的AUC有了较为明显的提升,且具有良好的运行效率,具备较好的实用价值。 相似文献
3.
4.
当今,人工智能已经广泛应用到各个领域中,并取得了显著的效果。数据归一化是人工智能应用落地中的一个重要环节,它有助于避免神经网络因数据量纲的复杂性对数据进行错误建模。在大数据场景下,相当一部分数据是以流的形式先后到达训练点,所以在流场景下数据归一化研究是当前亟待解决的关键问题。目前关于归一化研究的综述较多,大多仅仅针对于批数据的归一化研究,而缺乏对流数据的归一化方法的总结,不具参考性。在批数据归一化研究基础之上,系统化整理并详尽分析了流数据归一化的相关文献,凝练提出了基于流数据的归一化分类方法,并将数据归一化方法划分为批数据的归一化方法和流数据的归一化方法。同时,对这些方法的原理、优势和可以解决的主要问题进行了对比分析,在不同场景下对数据归一化的未来研究方向进行了展望。 相似文献
5.
6.
基于Hadoop的海量MP3文件存储架构研究 总被引:2,自引:0,他引:2
MP3作为数字音乐时代的事实标准,数量已相当巨大,用户的访问需求也与日俱增,有效存储和管理海量的MP3文件,为用户提供良好的体验,越来越引起人们的关注。Hadoop的出现,提供了一种新的思路。但由于Hadoop自身并不适合海量小文件处理,提出一种基于Hadoop的海量MP3文件存储架构,充分利用MP3文件自身包含的丰富描述信息,通过预处理模块的归类算法,将小文件归并到Sequence File中,同时引入高效的索引机制,很好地解决了小文件过多时NameNode内存瓶颈问题。实验证明,该架构能达到良好的效果。 相似文献
7.
8.
9.
云计算环境下服务组合具有规模大、复杂性高、失效类型多以及资源动态变化等特征,因此安全、可信的服务组合方案是云环境下海量服务资源灵活部署、按需提供的最大挑战。首先对区块链共识机制、智能合约及可编程特征进行深入分析,类比服务组合特征与流程,基于服务层次覆盖网络SON(service overlay networks)理论提出一种可信度和可靠性更为突出的以区块链为底层基础设施的服务组合体系架构;此外,考虑区块链共识机制带来的安全策略,借鉴智能合约的功能与作用,提出了跨服务覆盖层的基于链路预测生存时间及服务强度最优策略的高效服务路径生成算法;进一步地,设计了带有单点信任度及交互紧密度指标的可信服务质量模型ToS(trust of service),以及该ToS驱动下的服务路径选择算法。仿真结果表明,基于区块链机制的服务组合实现策略大大提升了组合服务执行的成功率及可用性。 相似文献
10.
提出柔性工作流中的服务组合可协调性分析方法.给出服务以及服务组合可协调性的定义;在可协调性定义的基础上给出组合服务间可协调性判定算法;最后,以电子商务系统中的物流系统为例,在随机Petri网模型建模的基础上,着重介绍了柔性工作系统中基于服务可协调性判定的服务自动组合方法. 相似文献