排序方式: 共有37条查询结果,搜索用时 46 毫秒
1.
具有QoS保证的服务资源联合分配与管理 总被引:1,自引:0,他引:1
提出一种具有QoS保证的资源管理系统架构,理论分析表明,该系统架构能够较好地适应资源的动态性;其次将服务资源联合分配问题归化为MMKP(multiple-choice multiple-dimension knapsack problem)问题,并提出两种资源联合分配算法:最优解算法RA_BBLP和启发式算法RA_MHEU,实验结果表明,RA_BBLP保证求得最优解,可作为其他算法的参照系,而RA_MHEU收敛速度极快且所求出的解集接近最优,是一种理想的资源联合分配
算法. 相似文献
2.
稠密数据库有趣规则的快速挖掘 总被引:3,自引:0,他引:3
目前,关联规则的挖掘算法主要用于非稠密数据,很少有挖掘稠密数据的算法,而现实世界中有许多数据是稠密的。由于现行的算法不适合稠 密数据的挖掘,本文定义了兴趣度函数,给出了挖掘稠密数据有趣关联的有效算法。该算法与以往不同的是提前过滤掉不满足约束的属性组合,因而提高了速度,同时,使发现的规则更有趣,更易理解。 相似文献
3.
Web挖掘研究综述 总被引:25,自引:0,他引:25
1 引言今天Web已成为信息发布、交互及获取的主要工具,Web上的信息量正以惊人的速度增加着,人们迫切需要能自动地从Web上发现、抽取和过滤信息的工具。同时,近年来,由于电子商务的快速发展,许多公司借助Internet进行在线交易,企业管理者需要分析大量的在线交易数据,从而发现用户的兴趣爱好及购买趋势,为商业决策风险投资等提供依据。具体来讲,当我们与Web交互时,常面临如下问题: 1.查询相关信息。这是查询触发的过程,我们希望从Web上找到关于VC~++编程指南的书,关于申办奥运会的信息,甚至关于爱滋病的报道等等。可以用搜索引擎如Yahoo Sohu等进行关键字查找,然而,今天的搜索引擎都有两个严重问题:低查准率会返回很多不相关的结果;低查全率有很多相关的文档找不到。 相似文献
4.
由于分布式环境下挖掘全局序列模式常常产生过多候选序列,加大了网络通信代价.为此提出一种基于分布式环境下的全局序列模式快速挖掘算法.该算法将各站点得到的局部序列模式压缩到一种语法序列树上,避免了重复的序列前缀传输;基于合并树中节点序列规则和简单的特点,提出一种项扩展和序列扩展剪枝策略,有效地约减了候选序列,减少了网络传输量,从而快速生成全局序列模式.理论和实验表明,在大数据集环境下该算法性能优越,能够有效地挖掘全局序列模式. 相似文献
5.
6.
为有效地存储和管理海量数据,提出了一种基于路径的射频识别技术数据立方体构建方法。该方法不受射频识别技术系统的物理分布影响,只与路径数据库的规模有关;在最小兴趣层和观察层之间,选择物化某些立方体单元,以保证能够快速构建立方体结构和较快响应系统不同用户的路径查询。理论分析和实验结果表明了该方法的有效性。 相似文献
7.
基于QoS的网格资源管理 总被引:15,自引:0,他引:15
资源管理是网格计算研究领域中的一项重要研究点,目前的研究工作大多致力于解决异构性问题,对于在交付无缝QoS(quality of service)前提下提高资源分配性能方面还缺乏深入的研究.而且,目前对网格QoS的研究集中于将多媒体网络QoS的相关成果融入网格体系架构中以提供对网格QoS的支持,而缺少对网格QoS的特性进行系统化的研究与归纳.为此,提出了网格QoS的层次结构模型,并对其中承上启下的虚拟组织层QoS参数进行了新的分类和测量;然后,利用SNAP(service negotiation and acquisition protocol)协议对基于网格QoS层次结构模型的网格QoS参数的映射转换过程进行了分析;最后,设计了网格资源管理仿真系统,并运用相关的网格QoS的研究改进了现有的Min-Min算法.仿真实验结果表明,基于QoS的网格资源管理可以在满足用户QoS需求下,有效地提高网格资源的利用率和服务请求的成功率. 相似文献
8.
Online aggregation is an attractive sampling-based technology to response aggregation queries by an estimate to the final result, with the confidence interval becoming tighter over time. It has been built into a MapReduce-based cloud system for big data analytics, which allows users to monitor the query progress, and save money by killing the computation early once sufficient accuracy has been obtained. However, there are several limitations that restrict the performance of online aggregation generated from the gap between the current mechanism of MapHeduce paradigm and the requirements of online aggregation, such as: 1) the low sampling efficiency due to the lack of consideration of skewed data distribution for online aggregation in MapReduce, and 2) the large redundant I/O cost of online aggregation caused by the independent job execution mechanism of MapReduce. In this paper, we present OLACloud, a MapReduce-based cloud system to well support online aggregation for different data distributions and large-scale concurrent query processing. We propose a content-aware repartition method with a fair-allocation block placement strategy to increase the sampling efficiency and guarantee the storage and computation load balancing simultaneously. We also develop a shared sampling method to share the sampling opportunities among multiple queries to reduce redundant I/O cost. We also implement OLACloud in Hadoop, and conduct an extensive experimental study on the TPC-H benchmark for skewed data distribution. Our results demonstrate the efficiency and effectiveness of OLACloud. 相似文献
9.
10.
基于数据仓库的OLAP系统是当前海量多维数据分析的主要工具。随着信息技术的发展,海量多维数据的规模急剧增长,结构日益复杂,OLAP系统的性能严重下降,已经无法满足人们的数据分析需求。基于分布式计算系统Hadoop给出了新的海量多维数据的存储方法和查询方法。设计了HDFS上的列存储文件格式HCFile,基于HCFile给出了海量多维数据存储方案,该方案能够提高聚集计算效率,并有很好的可扩展性。同时,利用多维数据的层次性语义特征,设计了维层次索引,并给出了利用维层次索引和MapReduce进行聚集计算的方法。通过和Hive的对比实验,表明了数据存储方案和查询方法能够有效提高海量多维数据分析的性能。 相似文献