拓步基于数据仓库技术的制药行业商业智能系统的应用研究解决方案
1.4数据堆栈基本观点先容
“数据堆栈(DataWarehouse)”这个名词首次由号称“数据堆栈之父”的williamH-Inmon提出。他在《构建数据堆栈》一书中指出,“数据堆栈是面向主题的、集成的、稳固的、随时间转变的数据荟萃,用以支持谋划治理中的决议制订历程。”随着人们对数据系统研究治理和维护的不光深入,对数据堆栈有如下几个特点告竣了共识:数据堆栈中的数据是面向主题的、集成的、不行更新的、随时间增添的,建设数据堆栈的目的是为了更好地支持决议剖析。
提起数据堆栈手艺,一定要相识一些基本观点,在此做以下简朴的先容。若是想相识更多信息,请参见关于数据堆栈方面的专著。元数据(MetaData),是关于数据的数据,类似数据库系统中的数据字典,是以观点、主题、团体或条理等形式建设的信息结构并记载数据工具的位置。
数据集市(DataMart),也被称做“小型数据堆栈”。若是说数据堆栈是建设在企业级的数据模子之上的话,那么数据集市就是企业级数据堆栈的一个子集,他主要面向部门级营业,而且只面向某个特定的主题。数据集市可以在一定水平上缓解会见数据堆栈的瓶颈。
维度(Dimension),是多维数据集的结构性特征,是事实数据表中用来形貌数据分门别类的有组织的条理结构。
多维数据集(Multi-DimensionalDataSet),也叫数据立方体,是一个包罗维度和怀抱值的等结构的数据荟萃,通常从数据堆栈的子集结构,通过多维数据集,可实现对数据堆栈中的数据举行快速会见。
OLAP,联机剖析处置惩罚,对多维数据集举行快速、稳固一致和交瓦性的存取,允许治理决议职员对数据举行深入视察的手艺,我们常经常听到的诸如对数据的“钻取(Drill)”和“切片(Slide)”就是OLAP通过手艺实现的。凭据数据存储的方式,OLAP可分为基于多为数据库的MOLAP和基于关系型数据库的ROLAP两种类型。
ETL,抽取(Extract)、转换(Transform)和装载(Load),是实现数据从营业系统向数据堆栈转化的须要历程以及完成转化需要使用的工具和计谋。这个历程往往凭据系统界说好的元数据,凭据原有营业系统和数据堆栈的特点,一次性或者增量地把数据转化到数据堆栈中。现在,很多多少数据堆栈提供商提供了比力完善的ETL工具。
1.5从数据库到数据堆栈的转换
数据堆栈是由数据库进化而来,是以大型数据库系统作为基础,附加在原有系统之上并存储了从企业所有营业数据库中获取的综合数据并能使用这些综合数据为用户提供处置惩罚过的有用的信息的应用系统。
原有传统型数据库提供联机营业处置惩罚功效(OLTP),主要按用户的要求对营业数据举行查询和处置惩罚。由于用户需求的不停提升,将它用于决议支持在功效和性能上都是不够的,必须举行革新和更新,数据库到数据堆栈的转换是必须的。数据库到数据堆栈的转换,除了指系统功效的转换之外,还包罗数据的抽取和转换。数据的转换有时会很庞大,为了提高数据转换的效率和性能,往往在数据堆栈和营业系统之间增添一其中间数据库(StagingTables),用以暂时存储从营业系统中导出的数据,然后再凭据导入计谋准时或一次性将数据导入到数据堆栈中。
1.6数据堆栈的系统化情况和数据组织
传统的数据库手艺是以单一的数据资源为中央,举行营业处置惩罚、批处置惩罚等事情。而数据堆栈手艺具有剖析处置惩罚等特点,它既是一种结构和富有哲理性的要领,也是一种手艺,也是存储数据的一种形式。数据堆栈填补了传统操作型数据库以单一的数据资源为中央的弱点,生长出了一种新的系统化情况。
2、辉瑞制药公司数据堆栈解决方案
辉瑞公司是现在全球压倒一切的医药和保健品生产销售企业。该公司的产物行销全球150多个国家和地域。凭据2011年福布斯全球200强企业统计表名,2011年辉瑞的全球总销售额突破600亿美元,利润150亿美元。
这样一个遍布全球的药品生产和销售企业,天天发生的生产和销售数据的数目庞大可想而知。同时,由于这些数据散布在差别区域中功效各异的营业系统中,数据疏散,倒霉于统计和数据共享,因此,若是没有集成的数据堆栈治理统一治理,很难从营业数据中发现能供决议剖析使用的数据。
为相识决上述问题,早在1996年,辉瑞就最先着手实行数据堆栈。其时,辉瑞建设数据堆栈的总体目的是:
“沈阳软件公司”的新闻页面文章、图片、音频、视频等稿件均为自媒体人、第三方机构发布或转载。如稿件涉及版权等问题,请与
我们联系删除或处理,客服QQ:55506560,稿件内容仅为传递更多信息之目的,不代表本网观点,亦不代表本网站赞同
其观点或证实其内容的真实性。
热门文章
使用“扫一扫”即可将网页分享至朋友圈。