共查询到20条相似文献,搜索用时 328 毫秒
1.
本文对Web环境下的数据仓库进行了研究.首先指出利用Web上的数据决策支持服务的必要性,并针对HTML.XML的数据如何集成到数据仓库,Web环境下的数据仓库体系结构,查询处理以及几种具有代表性的Web数据仓库系统给出了解决方法.最后就相关问题的研究现状做了简要分析并加以展望。 相似文献
2.
Agent技术在Web数据仓库结构中的应用研究 总被引:1,自引:0,他引:1
针对基于Web的数据仓库体系结构存在的问题,在该体系结构中引入软件Agent技术,运用移动Agent技术来解决传统方法难以解决的一些主要问题,提出了一种基于Agent的Web数据仓库系统体系结构。文中发挥数据仓库技术和Web技术结合的优势,重点研究了Agent技术在Web服务器端的应用,在把有用的Web数据集成并入到数据仓库中这一目前的研究热点问题中,提出了基于Agent技术将HTML页面转化为XML数据源的解决方案。此外,文章分别研究了应用服务器端和数据仓库系统中的Agent技术的应用,并提出了将Agent技术引入后实现基于Web的数据仓库体系的关键技术。 相似文献
3.
4.
为了节省网络带宽,加快各数据仓库之间互相访问速度,在Web服务器基础上构造了一个支持和应用移动Agent的数据仓库互操作框架.该框架采用中间件技术,能够在有限的网络资源下,避免大量数据的网络传输,提高查询效率,提高在网络连接断续和不稳定情况下互操作的可靠性,便于升级和维护,具有良好的伸缩性和适应性. 相似文献
5.
数据仓库中的视图选择在很大程度上影响数据仓库的查询效率和维护代价,是数据仓库中研究的重要内容.通过对现有的选择实化视图的价值模型进行研究,提出了一个新的视图价值估算模型和视图选择算法--PBPUS算法.该视图选择方法通过在视图选择前进行预处理和使用新的价值估算模型,降低了视图搜索的时间复杂度和维护代价,有效地提高了实化视图的查询效率. 相似文献
6.
7.
在数据仓库的联机分析处理的查询处理中,经常会涉及到大量数据的复杂即席查询.用户通过提交联机分析处理查询对数据进行分析和决策支持,这通常需要较快的查询响应速度.因此,提高联机分析处理的查询性能就成为了数据仓库领域的关键问题.为了提高数据仓库的查询性能,结合维表层次结构的特点,提出一种将分段位图索引和位图连接索引有效结合的方法.实验证明,该方法节省了位图索引的储存空间,减少了I/O开销,有效地提高了数据仓库的查询效率. 相似文献
8.
9.
Web数据仓库研究综述 总被引:4,自引:0,他引:4
本文对Web环境下的数据仓库研究现状进行了综述。首先指出利用Web上的数据为决策支持服务的必要性,并针对半结构化数据如何集成到数据仓库、Web环境下的数据仓库体系结构、查询处理及几种具有代表性的Web数据仓库系统给出简要阐述。最后对相关问题的研究现状做了简要分析并加以展望。 相似文献
10.
数据仓库的可扩展性研究与设计 总被引:1,自引:1,他引:0
随着海量异构的数据不断进入数据仓库和系统用户的大量增加,在数据质量、可用性和查询等方面的因素将严重影响数据仓库的性能,所以数据仓库必须设计成可扩展的体系结构.文中采用可扩展的软件并行和硬件并行相结合的方法进行数据仓库的性能扩展,在数据仓库初建时采用SMP结构,当数据仓库增长到一定的时候采用高速缓存相关的非一致性内存访问结构,并且较好地利用I/O并行性,取得较好效果.使得当大量异构数据涌入可扩展数据仓库中时系统性能不会下降,很好地满足决策支持. 相似文献
11.
大型数据仓库实现技术的研究 总被引:2,自引:0,他引:2
大型数据仓库是实现海量数据存储的有效途径,但在大型数据仓库的实现中存在很多问题。在分析问题的基础上,对大型数据仓库的实现问题提出了一定的解决策略,对其中的几个关键技术即数据立方体的有效计算、增量式更新维护、索引优化、故障恢复、模式设计和查询优化的代价模型及元数据的定义和管理等作了研究。 相似文献
12.
在进行数据仓库的OLAP(onlineanalyticalprocessing,联机分析处理)查询处理时,经常会涉及到多表连接操作,因此,提高多表连接的性能就成了数据仓库领域的关键性问题.基于数据仓库的星型模式,给出了一种新的多表连接算法(M-Join).与传统关系数据库管理系统的多表连接查询处理相比,该算法充分考虑了数据仓库中的数据本身和多表连接的特点,采用对多个表进行一次性连接的方法,使得查询的性能有明显的改善.同时,还给出了算法的实验结果和分析. 相似文献
13.
1 虚拟数据模型概述虚拟数据仓库技术因为其开放灵活的体系结构、以需求为驱动、无限的扩展性等优点而越来越引起人们的关注,相比传统数据仓库以供给为驱动的特点,虚拟数据仓库对有很多不同时期、不同构、复杂的数据源的大公司大企业来说有巨大的吸引力。本文在此技术的基础上,提出了一个基于查询优化的虚拟数据仓库模型,它使用多层次分布式的数据结构,在 相似文献
14.
超大型压缩数据仓库上的CUBE算法 总被引:9,自引:2,他引:7
数据压缩是提高多维数据仓库性能的重要途径,联机分析处理是数据仓库上的主要应用,Cube操作是联机分析处理中最常用的操作之一.压缩多维数据仓库上的Cube算法的研究是数据库界面临的具有挑战性的重要任务.近年来,人们在Cube算法方面开展了大量工作,但却很少涉及多维数据仓库和压缩多维数据仓库.到目前为止,只有一篇论文提出了一种压缩多维数据仓库上的Cube算法.在深入研究压缩数据仓库上的Cube算法的基础上,提出了产生优化Cube计算计划的启发式算法和3个压缩多维数据仓库上的Cube算法.所提出的Cube算法直 相似文献
15.
在大型数据仓库查询过程中,经常涉及多事实表的连接操作。传统的查询优化方法是在计算多关系连接时尽可能地减少中间关系的大小,并没有考虑到数据仓库中数据的海量,以读为主且事实表一般建有索引的特点,往往无法取得最优的效果。针对数据仓库查询的特点,提出了一种利用索引加快查询的启发式优化方法。理论分析与实验表明,该方法在查询处理代价和执行时间上都明显减少,方法具有有效性。 相似文献
16.
数据仓库中的事实数据一般以最小粒度存储。而大量的细粒度数据具有很大的随机性,很少直接进行分析和处理,往往被聚集到一定层次的粗粒度数据。另一方面若采用ROLAP存储数据,则大量的细粒度数据将会影响查询的效率。本文介绍了一种基于时间维层次查询频率的粒度调整模型,它能根据用户在时间维层次的查询频率实现对数据粒度的调整。 相似文献
17.
18.
生物数据仓库研究及应用 总被引:4,自引:0,他引:4
文章通过分析生物数据源和数据处理的特点,提出了采用综合的集成和管理策略的生物数据仓库框架,并在此基础上实现了一个面向疾病的基因数据仓库平台BioWorld,并且为生物数据挖掘、联机查询、统计分析等提供了统一的接口。 相似文献
19.
20.
The development of data warehouses begins with the definition of multidimensional models at the conceptual level in order to structure data, which will facilitate decision makers with an easier data analysis. Current proposals for conceptual multidimensional modelling focus on the design of static data warehouse structures, but few approaches model the queries which the data warehouse should support by means of OLAP (on-line analytical processing) tools. OLAP queries are, therefore, only defined once the rest of the data warehouse has been implemented, which prevents designers from verifying from the very beginning of the development whether the decision maker will be able to obtain the required information from the data warehouse. This article presents a solution to this drawback consisting of an extension to the object constraint language (OCL), which has been developed to include a set of predefined OLAP operators. These operators can be used to define platform-independent OLAP queries as a part of the specification of the data warehouse conceptual multidimensional model. Furthermore, OLAP tools require the implementation of queries to assure performance optimisations based on pre-aggregation. It is interesting to note that the OLAP queries defined by our approach can be automatically implemented in the rest of the data warehouse, in a coherent and integrated manner. This implementation is supported by a code-generation architecture aligned with model-driven technologies, in particular the MDA (model-driven architecture) proposal. Finally, our proposal has been validated by means of a set of sample data sets from a well-known case study. 相似文献