首页 | 官方网站   微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 328 毫秒
1.
季薇 《福建电脑》2007,(12):56-57
本文对Web环境下的数据仓库进行了研究.首先指出利用Web上的数据决策支持服务的必要性,并针对HTML.XML的数据如何集成到数据仓库,Web环境下的数据仓库体系结构,查询处理以及几种具有代表性的Web数据仓库系统给出了解决方法.最后就相关问题的研究现状做了简要分析并加以展望。  相似文献   

2.
Agent技术在Web数据仓库结构中的应用研究   总被引:1,自引:0,他引:1  
针对基于Web的数据仓库体系结构存在的问题,在该体系结构中引入软件Agent技术,运用移动Agent技术来解决传统方法难以解决的一些主要问题,提出了一种基于Agent的Web数据仓库系统体系结构。文中发挥数据仓库技术和Web技术结合的优势,重点研究了Agent技术在Web服务器端的应用,在把有用的Web数据集成并入到数据仓库中这一目前的研究热点问题中,提出了基于Agent技术将HTML页面转化为XML数据源的解决方案。此外,文章分别研究了应用服务器端和数据仓库系统中的Agent技术的应用,并提出了将Agent技术引入后实现基于Web的数据仓库体系的关键技术。  相似文献   

3.
基于Web的分布式数据仓库体系结构的研究*   总被引:1,自引:1,他引:1  
随着数据仓库技术的发展,人们对数据仓库体系结构研究的兴趣越来越浓厚,数据仓库体系结构选取是否合理,将直接关系到整个数据仓库的成败。在分析客户机、服务器数据仓库体系结构的基础上,将XML、智能Agent技术引入到数据仓库中,提出了一种基于Web的分布式数据仓库体系结构。  相似文献   

4.
杨帆  张虹 《微计算机信息》2007,23(21):192-194
为了节省网络带宽,加快各数据仓库之间互相访问速度,在Web服务器基础上构造了一个支持和应用移动Agent的数据仓库互操作框架.该框架采用中间件技术,能够在有限的网络资源下,避免大量数据的网络传输,提高查询效率,提高在网络连接断续和不稳定情况下互操作的可靠性,便于升级和维护,具有良好的伸缩性和适应性.  相似文献   

5.
数据仓库中的视图选择在很大程度上影响数据仓库的查询效率和维护代价,是数据仓库中研究的重要内容.通过对现有的选择实化视图的价值模型进行研究,提出了一个新的视图价值估算模型和视图选择算法--PBPUS算法.该视图选择方法通过在视图选择前进行预处理和使用新的价值估算模型,降低了视图搜索的时间复杂度和维护代价,有效地提高了实化视图的查询效率.  相似文献   

6.
数据仓库中物化视图的选择   总被引:7,自引:0,他引:7  
物化视图是数据仓库中提高查询效率的有力方法,物化视图的选择一直是数据仓库领域的研究热点。通过对星型模型的研究,根据对数据仓库的常用查询及其执行概率,设计出一个候选视图的算法,并详细介绍了线性代价模型,在该模型和候选视图算法基础上,参照文献[4]提出一个改进的物化视图选择贪心算法。  相似文献   

7.
在数据仓库的联机分析处理的查询处理中,经常会涉及到大量数据的复杂即席查询.用户通过提交联机分析处理查询对数据进行分析和决策支持,这通常需要较快的查询响应速度.因此,提高联机分析处理的查询性能就成为了数据仓库领域的关键问题.为了提高数据仓库的查询性能,结合维表层次结构的特点,提出一种将分段位图索引和位图连接索引有效结合的方法.实验证明,该方法节省了位图索引的储存空间,减少了I/O开销,有效地提高了数据仓库的查询效率.  相似文献   

8.
实时数据仓库是数据仓库技术的重要分支,而实时数据查询和实时数据导入引发的查询竞争问题一直是实时数据仓库技术研究的重点之一。查询竞争问题严重影响查询分析的精度和效率,本文提出一种动态镜像技术,该技术在数据仓库外部构建动态存储区域;同时,本文对传统ETL技术进行了改进。基于TPC-H基准的实时数据仓库测试系统对动态镜像技术下的OLAP性能进行了分析与评估。实验结果显示,实时查询效率提高了50%,平均查询精度达到93%。  相似文献   

9.
Web数据仓库研究综述   总被引:4,自引:0,他引:4  
本文对Web环境下的数据仓库研究现状进行了综述。首先指出利用Web上的数据为决策支持服务的必要性,并针对半结构化数据如何集成到数据仓库、Web环境下的数据仓库体系结构、查询处理及几种具有代表性的Web数据仓库系统给出简要阐述。最后对相关问题的研究现状做了简要分析并加以展望。  相似文献   

10.
数据仓库的可扩展性研究与设计   总被引:1,自引:1,他引:0  
随着海量异构的数据不断进入数据仓库和系统用户的大量增加,在数据质量、可用性和查询等方面的因素将严重影响数据仓库的性能,所以数据仓库必须设计成可扩展的体系结构.文中采用可扩展的软件并行和硬件并行相结合的方法进行数据仓库的性能扩展,在数据仓库初建时采用SMP结构,当数据仓库增长到一定的时候采用高速缓存相关的非一致性内存访问结构,并且较好地利用I/O并行性,取得较好效果.使得当大量异构数据涌入可扩展数据仓库中时系统性能不会下降,很好地满足决策支持.  相似文献   

11.
大型数据仓库实现技术的研究   总被引:2,自引:0,他引:2  
大型数据仓库是实现海量数据存储的有效途径,但在大型数据仓库的实现中存在很多问题。在分析问题的基础上,对大型数据仓库的实现问题提出了一定的解决策略,对其中的几个关键技术即数据立方体的有效计算、增量式更新维护、索引优化、故障恢复、模式设计和查询优化的代价模型及元数据的定义和管理等作了研究。  相似文献   

12.
数据仓库查询处理中的一种多表连接算法   总被引:22,自引:2,他引:20       下载免费PDF全文
蒋旭东  周立柱 《软件学报》2001,12(2):190-195
在进行数据仓库的OLAP(onlineanalyticalprocessing,联机分析处理)查询处理时,经常会涉及到多表连接操作,因此,提高多表连接的性能就成了数据仓库领域的关键性问题.基于数据仓库的星型模式,给出了一种新的多表连接算法(M-Join).与传统关系数据库管理系统的多表连接查询处理相比,该算法充分考虑了数据仓库中的数据本身和多表连接的特点,采用对多个表进行一次性连接的方法,使得查询的性能有明显的改善.同时,还给出了算法的实验结果和分析.  相似文献   

13.
徐强 《计算机科学》2003,30(2):63-65
1 虚拟数据模型概述虚拟数据仓库技术因为其开放灵活的体系结构、以需求为驱动、无限的扩展性等优点而越来越引起人们的关注,相比传统数据仓库以供给为驱动的特点,虚拟数据仓库对有很多不同时期、不同构、复杂的数据源的大公司大企业来说有巨大的吸引力。本文在此技术的基础上,提出了一个基于查询优化的虚拟数据仓库模型,它使用多层次分布式的数据结构,在  相似文献   

14.
超大型压缩数据仓库上的CUBE算法   总被引:9,自引:2,他引:7  
高宏  李建中 《软件学报》2001,12(6):830-839
数据压缩是提高多维数据仓库性能的重要途径,联机分析处理是数据仓库上的主要应用,Cube操作是联机分析处理中最常用的操作之一.压缩多维数据仓库上的Cube算法的研究是数据库界面临的具有挑战性的重要任务.近年来,人们在Cube算法方面开展了大量工作,但却很少涉及多维数据仓库和压缩多维数据仓库.到目前为止,只有一篇论文提出了一种压缩多维数据仓库上的Cube算法.在深入研究压缩数据仓库上的Cube算法的基础上,提出了产生优化Cube计算计划的启发式算法和3个压缩多维数据仓库上的Cube算法.所提出的Cube算法直  相似文献   

15.
数据仓库索引启发式查询优化方法   总被引:1,自引:0,他引:1       下载免费PDF全文
在大型数据仓库查询过程中,经常涉及多事实表的连接操作。传统的查询优化方法是在计算多关系连接时尽可能地减少中间关系的大小,并没有考虑到数据仓库中数据的海量,以读为主且事实表一般建有索引的特点,往往无法取得最优的效果。针对数据仓库查询的特点,提出了一种利用索引加快查询的启发式优化方法。理论分析与实验表明,该方法在查询处理代价和执行时间上都明显减少,方法具有有效性。  相似文献   

16.
数据仓库中的事实数据一般以最小粒度存储。而大量的细粒度数据具有很大的随机性,很少直接进行分析和处理,往往被聚集到一定层次的粗粒度数据。另一方面若采用ROLAP存储数据,则大量的细粒度数据将会影响查询的效率。本文介绍了一种基于时间维层次查询频率的粒度调整模型,它能根据用户在时间维层次的查询频率实现对数据粒度的调整。  相似文献   

17.
电信闭环决策支持系统的研究与实现*   总被引:1,自引:0,他引:1  
针对电信数据的特点,提出了基于数据仓库的电信闭环决策支持系统的实现方案;确定了电信领域的决策分析主题及相关的模型,阐述了采用基于数据仓库的四层结构的电信闭环决策支持系统的系统架构和功能。系统以数据仓库为基础,运用联机分析处理、数据挖掘等分析决策手段实现了对电信数据多角度、多层次的查询、分析及决策功能。  相似文献   

18.
生物数据仓库研究及应用   总被引:4,自引:0,他引:4  
文章通过分析生物数据源和数据处理的特点,提出了采用综合的集成和管理策略的生物数据仓库框架,并在此基础上实现了一个面向疾病的基因数据仓库平台BioWorld,并且为生物数据挖掘、联机查询、统计分析等提供了统一的接口。  相似文献   

19.
针对水利普查数据海量、多维的特点,研究近年来在"大数据"概念下发展迅速的Hadoop与Hive,结合传统数据仓库在多维数据分析方面的成熟技术,提出基于Hive的水利普查数据仓库的构建方法,描述数据仓库系统的架构,并根据Hive的设计特点,通过分桶、消减维度表和冗余事实表的方法来改进传统的多维分析模型,最后搭建集群系统对水利普查数据集进行查询与分析测试。测试结果表明该数据仓库可以满足海量多维水利普查数据的存储与查询要求。  相似文献   

20.
The development of data warehouses begins with the definition of multidimensional models at the conceptual level in order to structure data, which will facilitate decision makers with an easier data analysis. Current proposals for conceptual multidimensional modelling focus on the design of static data warehouse structures, but few approaches model the queries which the data warehouse should support by means of OLAP (on-line analytical processing) tools. OLAP queries are, therefore, only defined once the rest of the data warehouse has been implemented, which prevents designers from verifying from the very beginning of the development whether the decision maker will be able to obtain the required information from the data warehouse. This article presents a solution to this drawback consisting of an extension to the object constraint language (OCL), which has been developed to include a set of predefined OLAP operators. These operators can be used to define platform-independent OLAP queries as a part of the specification of the data warehouse conceptual multidimensional model. Furthermore, OLAP tools require the implementation of queries to assure performance optimisations based on pre-aggregation. It is interesting to note that the OLAP queries defined by our approach can be automatically implemented in the rest of the data warehouse, in a coherent and integrated manner. This implementation is supported by a code-generation architecture aligned with model-driven technologies, in particular the MDA (model-driven architecture) proposal. Finally, our proposal has been validated by means of a set of sample data sets from a well-known case study.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司    京ICP备09084417号-23

京公网安备 11010802026262号