加载中 ...
浅析对数据仓库的研究论文
(DataBlade)。当一个查询提交客户站点,首先使用元数据字典对查询举行转换,将它转换成响应异种站点上的查询。然后,将这些查询映射和发送到局部查询处置惩罚器。由差别站点返回的效果被集成为全局回覆。这种查询驱动的要领需要庞大的信息过滤和集成处置惩罚,而且与局部数据源上的处置惩罚竞争资源。这种要领是低效的,而且对于频仍的查询,特殊是需要群集操作的查询,开销很大。
对于异种数据库集成的传统要领,数据堆栈提供了一个有趣的替换方案。数据堆栈使用更新驱动的要领,而不是查询驱动的要领。这种要领未来自多个异种源的信息预先集成,并存储在数据堆栈中,供直接查询和剖析。与联机事务处置惩罚数据库差别,数据堆栈不包罗最近的信息。然而,数据堆栈为集成的异种数据库系统带来了高性能,由于数据被拷贝、预处置惩罚、集成、注释、汇总,并重新组织到一个语义一致的数据存储中。在数据堆栈中举行的查询处置惩罚并不影响在局部源上举行的处置惩罚。此外,数据堆栈存储并集成历史信息,支持庞大的多维查询。这样,建设数据堆栈在工业界已很是盛行。
1.操作数据库系统与数据堆栈的区别
由于大多数人都熟悉商品关系数据库系统,将数据堆栈与之比力,就容易明白什么是数据堆栈。
联机操作数据库系统的主要使命是执行联机事务和查询处置惩罚。这种系统称为联机事务处置惩罚(OLTP)系统。它们涵盖了一个组织的大部门一样平常操作,如购置、库存、制造、银行、人为、注册、记帐等。另一方面,数据堆栈系统在数据剖析和决议方面为用户或“知识工人”提供服务。这种系统可以用差别的花样组织和提供数据,以便知足差别用户的形形色色需求。这种系统称为联机剖析处置惩罚(OLAP)系统。
OLTP和OLAP的主要区别概述如下。
(1)、用户和系统的面向性:OLTP是面向主顾的,用于服务员、客户、和信息手艺专业职员的事务和查询处置惩罚。OLAP是面向市场的,用于知识工人(包罗司理、主管、和剖析职员)的数据剖析。
(2)、数据内容:OLTP系统治理当前数据。通常,这种数据太噜苏,难以利便地用于决议。OLAP系统治理大量历史数据,提供汇总和群集机制,并在差别的粒度级别上存储和治理信息。这些特点使得数据容易用于见多识广的决议。
(3)、数据库设计:通常,OLTP系统接纳实体-联系(ER)模子和面向应用的数据库设计。而OLAP系统通常接纳星形或雪花模子和面向主题的数据库设计。
(4)、视图:OLTP系统主要关注一个企业或部门内部的当前数据,而不涉及历史数据或差别组织的数据。相比之下,由于组织的转变,OLAP系统经常跨越数据库模式的多个版本。OLAP系统也处置惩罚来自差别组织的信息,由多个数据存储集成的信息。由于数据量庞大,OLAP数据也存放在多个存储介质上。
(5)、会见模式:OLTP系统的会见主要由短的、原子事务组成。这种系统需要并行控制和恢复机制。然而,对OLAP系统的会见大部门是只读操作(由于大部门数据堆栈存放历史数据,而不是当前数据),只管许多可能是庞大的查询。
OLTP和OLAP的其它区别包罗数据库巨细、操作的频仍水平、性能怀抱等。
2.可是,为什么需要一个分散的数据堆栈
“既然操作数据库存放了大量数据”,你注重到,“为什么不直接在这种数据库上举行联机剖析处置惩罚,而是另外破费时间和资源去结构一个分散的数据堆栈?”
分散的主要缘故原由是提高两个系统的性能。操作数据库是为已知的使命和负载设计的,如使用主要害字索引和散列,检索特定的记载,和优化“罐装的”查询。另一方面,数据堆栈的查询通常是庞大的,涉及大量数据在汇总级的盘算,可能需要特殊的数据组织、存取要领和基于多维视图的实现要领。在操作数据库上处置惩罚OLAP查询,可能会大大降低操作使命的性能app开发。
此外,操作数据库支持多事务的并行处置惩罚,需要加锁和日志等并行控制和恢复机制,以确保一致性和事务的强壮性。通常,OLAP查询只需要对数据记载举行只读会见,以举行汇总和群集。若是将并行控制和恢复机制用于这种OLAP操作,就会危害并行事务的运行,从而大大降低OLTP系统的吞吐量。
“沈阳软件公司”的新闻页面文章、图片、音频、视频等稿件均为自媒体人、第三方机构发布或转载。如稿件涉及版权等问题,请与
我们联系删除或处理,客服QQ:55506560,稿件内容仅为传递更多信息之目的,不代表本网观点,亦不代表本网站赞同
其观点或证实其内容的真实性。
热门文章
分享到微信朋友圈
×
打开微信,点击底部的“发现”,
使用“扫一扫”即可将网页分享至朋友圈。
使用“扫一扫”即可将网页分享至朋友圈。