数据仓库和商业智能
从上面的剖析中,我们可以得出结论,若是不能解决OLAP运算效率问题的话,OLAP将是一个毫无适用价值的观点。那么,一个成熟产物是怎样解决这个问题的呢?这涉及到OLAP中一个很是主要的手艺——数据CUBE预运算。
一个OLAP模子中,怀抱数据和维数据我们应该事先确定,一旦两者确定下来,我们可以对数据举行预先的处置惩罚。在正式公布之前,将数据凭据维举行最大限度的聚类运算,运算中会思量到种种维组合情形,运算效果将天生一个数据CUBE,并生存在服务器上。
这样,当最终用户在调阅这个剖析模子的时间,就可以直接使用这个CUBE,在此基础上凭据用户的维选择和维组合举行复运算,从而到达实时响应的效果。
OLAP有多种实现要领,凭据存储数据的方式差别可以分为ROLAP、MOLAP、HOLAP。
ROLAP表现基于关系数据库的OLAP实现(Relational OLAP)。以关系数据库为焦点,以关系型结构举行多维数据的表现和存储。ROLAP将多维数据库的多维结构划分为两类表:一类是事实表,用来存储数据和维要害字;另一类是维表,即对每个维至少使用一个表来存放维的条理、成员种别等维的形貌信息。维表和事实表通过主要害字和外要害字联系在一起,形成了"星型模式"。对于条理庞大的维,为制止冗余数据占用过大的存储空间,可以使用多个表来形貌,这种星型模式的扩展称为"雪花模式"。
MOLAP表现基于多维数据组织的OLAP实现(Multidimensional OLAP)。以多维数据组织方式为焦点,也就是说,MOLAP使用多维数组存储数据。多维数据在存储中将形成"立方块(Cube)"的结构,在MOLAP中对"立方块"的"旋转"、"切块"、"切片"是发生多维数据报表的主要手艺。
HOLAP表现基于混淆数据组织的OLAP实现(Hybrid OLAP)。如低层是关系型的,高层是多维矩阵型的。这种方式具有更好的天真性。
增补-3:数据挖掘Data Mining先容
数据挖掘是从大量的、不完全的、有噪声的、模糊的、随机的数据集中识别有用的、新颖的、潜在有用的,以及最终可明白的模式的非普通历程。它是一门涉及面很广的交织学科,包罗机械学习、数理统计、神经网络、数据库、模式识别、粗拙集、模糊数学等相关手艺。
由于数据挖掘是一门受到来自种种差别领域的研究者关注的交织性学科,因此导致了许多差别的术语名称。其中,最常用的术语是"知识发现"和"数据挖掘"。相对来讲,数据挖掘主要盛行于统计界(最早泛起于统计文献中)、数据剖析、数据库和治理信息系统界;而知识发现则主要盛行于人工智能和机械学习界。
数据挖掘可大略地明白为三部曲:数据准备(data preparation)、数据挖掘,以及效果的诠释评估(interpretation and evaluation)。
凭据数据挖掘的使命分,有如下几种:分类或展望模子数据挖掘、数据总结、数据聚类、关联规则发现、序列模式发现、依赖关系或依赖模子发现、异常和趋势发现等等。
凭据数据挖掘的工具分,有如下若干种数据源:关系数据库、面向工具数据库、空间数据库、时态数据库、文本数据源、多媒体数据、异质数据库、遗留(legacy)数据库,以及Web数据源。
凭据数据挖掘的要领分,可粗分为:统计要领、机械学习要领、神经网络要领和数据库要领。统计要领中,可细分为:回归剖析(多元回归、自回归等)、判别剖析(贝叶斯判别、费歇尔判别、非参数判别等)、聚类剖析(系统聚类、动态聚类等)、探索性剖析(主元剖析法、相关剖析法等)、以及模糊集、粗拙集、支持向量机等。机械学习中,可细分为:归纳学习要领(决议树、规则归纳等)、基于规范的推理CBR、遗传算法、贝叶斯信心网络等。神经网络要领,可细分为:前向神经网络(BP算法等)、自组织神经网络(自组织特征映射、竞争学习等)等。数据库要领主要是基于可视化的多维数据剖析或OLAP要领,另外另有面向属性的归纳要领。
“沈阳软件公司”的新闻页面文章、图片、音频、视频等稿件均为自媒体人、第三方机构发布或转载。如稿件涉及版权等问题,请与
我们联系删除或处理,客服QQ:55506560,稿件内容仅为传递更多信息之目的,不代表本网观点,亦不代表本网站赞同
其观点或证实其内容的真实性。
热门文章
使用“扫一扫”即可将网页分享至朋友圈。