共查询到20条相似文献,搜索用时 78 毫秒
1.
为提高数据仓库中多表连接的查询处理响应时间,本文结合数据仓库中多表连接的特点,利用面向对象中的消息机制,提出了一种基于ORV(对象关系视图)的并行多表连接查询算法,并对算法的磁盘I/O操作块数进行了分析,与单处理机及传统的多表连接算法进行了比较。 相似文献
2.
数据仓库查询处理中的一种多表连接算法 总被引:22,自引:2,他引:20
在进行数据仓库的OLAP(onlineanalyticalprocessing,联机分析处理)查询处理时,经常会涉及到多表连接操作,因此,提高多表连接的性能就成了数据仓库领域的关键性问题.基于数据仓库的星型模式,给出了一种新的多表连接算法(M-Join).与传统关系数据库管理系统的多表连接查询处理相比,该算法充分考虑了数据仓库中的数据本身和多表连接的特点,采用对多个表进行一次性连接的方法,使得查询的性能有明显的改善.同时,还给出了算法的实验结果和分析. 相似文献
3.
top-k join查询返回用户最感兴趣的k个连接结果.近来top-k join已经成为一个重要的研究课题,且在Web数据库、信息抽取和数据挖掘中均有应用.星型模式的数据仓库在实际应用中也存在top-k join查询,如有时决策者只想查询星型连接结果中他最感兴趣的k个.然而,现有top-k join算法不适合星型模式.... 相似文献
4.
联机分析查询处理中的一种聚集算法 总被引:10,自引:2,他引:10
联机分析处理(online analytical processing,简称OLAP)查询是涉及大量数据的即席复杂查询,从SQL(structured query language)角度来看,这些查询通常都包含多表连接和分组聚集操作.从OLAP查询处理角度出发,提出一种新的基于排序的聚集查询算法MuSA(sort-based aggregation with multi-table join).该方法充分考虑到数据仓库星型模式的特点,将聚集操作和新的多表连接算法MJoin相结合,排序时采用 相似文献
5.
6.
Skyline查询能够有效地实现多目标最优化,而数据仓库中的OLAP也是针对多维数据进行分析,因此,针对Skyline查询在数据仓库中的应用,提出了数据仓库中雪花模式的Skyline-Join查询算法.该算法首先将子维表M-Join父维表,然后渐进选择式地对事实表和父维表进行连接.每次连接之前都对事实表进行分组和组内Skyline计算,删除组内非Skyline元组,这样可以减少许多不必要的连接操作,使得查询效率大大提高.通过实验证明,在事实表元组数量逐渐变大和维表个数逐渐增多的情况下,提出的算法比先Join后Skyline计算的naive算法效率上有明显改善. 相似文献
7.
针对传统数据仓库系统中多维模式进化历史的挥发性问题,提出用版本元数据来记录数据仓库进化过程中的每一种多维模式状态,给出版本元数据结构,设计了跨版本透明查询系统及相应的查询算法。查询分解算法将用户基于一种模式结构提出的查询请求分解为在各个数据仓库版本上计算的子查询,集成算法将子查询结果进行必要的汇总和转换。 相似文献
8.
基于分组序号的聚集算法 总被引:4,自引:0,他引:4
联机分析处理OLAP(online analytical processing)查询作为一种复杂查询,当使用SQL(structured query language)语句来表述时,通常都包含多表连接和分组聚集操作,因此提高多表连接和分组聚集计算的性能就成为ROLAP(relational OLAP)查询处理的关键问题.提出一种基于分组序号的聚集算法MuGA(group number based aggregation with multi-table join),该方法充分考虑数据仓库星型模式的特点,将聚集操作和新的多表连接算法MJoin(multi-table join)相结合,使用分组序号进行分组聚集计算,代替通常的排序或者哈希计算,从而有效地减少CPU运算以及磁盘存取的开销.算法的实验数据表明,提出的MuGA算法与传统的关系数据库聚集查询处理方法以及改进后的基于排序的聚集算法相比,性能都有显著提高. 相似文献
9.
分析了面向先进硬件平台上的数据库优化技术,提出了基于内存存储模型的多表连接查询处理优化技术,采用内存存储模型存储维表并对维表主键进行顺序化,从而使维表的主键与内存维表记录的内存偏移地址相一致,实现对维表记录的内存直接访问。通过列存储技术减少维表记录的访问宽度,进一步优化维表访问的cache性能。与基于SQL Server 2005的查询执行计划的连接算法、join index连接算法以及基于列存储模型的优化连接算法进行了实验比较和性能分析,结果表明:基于内存存储模型的多表连接算法在处理星型结构数据仓库多谓词、多连接的复杂查询时具有很好的性能,与join index相比不需要额外的空间开销,与列存储数据模型相比具有更好的兼容性和性能。 相似文献
10.
数据仓库中维表模式的优化 总被引:1,自引:0,他引:1
针对数据仓库使用雪花模式组织维表而带来的太多连接开销,以查询的时间开销和维表的存储开销作为衡量标准建立代价估算模型,设计基于遗传算法的维表模式优化算法。目的是实现维表模式自动调整,使系统在维表模式方面的维表存储开销和查询时间开销和最小。试验结果表明以较小的空间代价可以较大幅度地提高查询速度。 相似文献
11.
一个通用的OLAP体系结构 总被引:1,自引:0,他引:1
一个成功的OLAP服务系统的体系结构必须具有足够的通用性和可扩展性,它应该能方便地与大型数据仓库系统集成,而不依赖于某个具体的DBMS软件,为此,本文提出了一个通用的、可扩展的、开放的OLAP体系结构。在此结构下,OLAP分析的数据源可以是数据仓库、多雏数据库和OLTP数据库,它们可以建立在不同的DBMS上;通过语义对象的定义对用户屏蔽了不同数据源的差异,用户只需对自己熟悉的语义对象进行操作,就可获得分析结果,达到了良好的通用性。 相似文献
12.
基于SQL Server2000的企业数据仓库设计与应用 总被引:8,自引:0,他引:8
在激烈的市场竞争中,企业纷纷建立了自己的数据库系统,以此来收集、存储、管理业务操作数据,改善办公环境,提高操作人员的工作效率,同时,企业也希望从海量的数据中获得有价值的信息,以支持企业决策。但是,传统的数据库应用系统是面向业务的,无论是查询、统计,还是生成报表,其处理方式都只是对指定的数据进行简单的数字处理,这虽然减轻 相似文献
13.
14.
15.
16.
十进制编码遗传算法的模式定理研究 总被引:6,自引:0,他引:6
根据遗传算法中采用的编码策略,可将遗传算法分为两大类:二进制编码遗传算法和十进制编码遗传算法.二进制遗传算法的数学基本定理是模式定理,但对于十进制编码遗传算法是否也存在其模式定理是待探讨的问题.本文在十进制数编码遗传算法的理论基础上,给出十进制编码遗传算法的相应概念并引入符号基因表和模式不变位的概念,根据十进制编码遗传算法的简单遗传算子对其模式的影响,推导出十进制编码遗传算法的模式定理. 相似文献
17.
搜索问题的代数描述及其算法 总被引:3,自引:0,他引:3
文中给出了搜索问题的一种代数描述方法,在这种描述方法的基础上,给出了一个算法模式。以货郎担问题的动态规划-分支限界法为例,讨论了如何用所给出的算法模式来设计饱含多咱算法设计技术的算法,称这种算法为混合(hybrid)算法。还讨论了如何用面向对象的方法进行程序设计。这种求解问题的方法不仅为算法的自支生成提供了一种有力的工具,如果用面向对象的方法进行程序设计,还能提高代码的利用率。 相似文献
18.
为了满足中央银行各级决策者对支付清算业务进行各种分析的需要,针对中国现代化支付系统的特点,本文提出了在建立数据仓库的基础上应用数据挖掘技术,来达到对支付清算业务进行多层次、多角度分析的目的,为科学决策提供了有效的技术手段。文中讨论了支付系统的一个数据仓库模型,并应用k-means聚类分析算法在支付系统资金源数据挖掘方面作了一些探讨。 相似文献
19.
提出一种强基因模式组织算法,给出了强基因模式、连续模式以及对称模式的定义,使用节约法提取强基因模式.设计了选择、变异和模式重组算子,同时建立了以运输成本为目标、具有时间窗等约束的车辆路径问题模型.将该算法与改进的遗传算法、改进的差分进化算法和节约法对模型进行仿真实验.结果表明,强基因模式的应用及模式重组算子大大缩小了解的搜索空间,提高了算法的收敛速度和解的精度,其性能优于其他3种算法. 相似文献