第五章联机分析处理(OLAP)-Read

第五章 联机分析处理(OLAP)

DW是管理决策分析的基础,若要有效地利用DW中的信息资源,必须有强大的工具对信息进行分析、决策,OLAP就是一个得到广泛用的DW技术。

OLAP专门用于支持复杂的决策分析,是支持信息管理和业务管理人员决策活动的一种决策分析工具。它可以根据分析人员的要求,迅速、灵活地对大量数据进行复杂的查询处理,并且以直观的、容易理解的形式将查询结果提供给各种决策人员,使他们迅速、准确地掌握企业的运营情况,了解市场的需求。

OLAP技术主要有两个特点:一是在线(On-Line),表现为对用户请求的快速响应和交互操作,它的实现是由客户机/服务器体系结构完成的;二是多维分析(Multi-Analysis),这也是OLAP技术的核心所在。

§ 5.1 OLAP技术基本概念

一、 OLAP的定义

OLAP是E.F.Codd于1993年提出的。 OLAP理事会的定义:

OLAP是一种软件技术,他使分析人员能够迅速、一致、交互地从各个方面观察信息,以达到深入理解数据的目的,这些信息是从原始数据直接转换过来的,他们以用户容易理解的方式反映企业的真实情况。

OLAP大部分策略都是将关系型的或普通的数据进行多维数据存贮,以便于进行分析,从而达到联机分析处理的目的。这种多维DB也被看作一个超立方体,沿着各个维方向存贮数据,它允许用户沿事物的轴线方便地分析数据,与主流业务型用户相关的分析形式一般有切片和切块以及下钻、挖掘等操作。共享多维信息的快速分析。

二、OLAP的功能特征:

OLAP是一种数据分析技术,其功能特征是: 1、快速性

用户对OLAP的快速反映有很高的要求,一般要求能在5秒内对分析要求有反映。

设计时应考虑:专门的数据存贮格式,大量的事先运算,特别的硬件设计。 2、可分析性

OLAP系统应能处理与应用有关的任何逻辑分析和统计分析。

因为事先编程并不能定义所有的应用,所以,在OLAP分析的过程中,用户无需编程就可以定义新的计算,将成为分析的一部分,且以用户希望的方式给出报告。

实现功能:

(1) 用户可以在OLAP平台上分析;

(2) 可连接到其他外部分析工具上,如时间序列分析工具,成本分析工具,

意外报警,数据挖掘等。

3、多维性

1

多维性是OLAP的关键属性,系统能够提供对数据分析的多维视图和分析,包括对层次维和多重层次维的支持。

多维分析是分析企业数据的最有效的方法,是OLAP的灵魂。 4、信息性

不论数据量有多大,也不管数据存贮在何处,OLAP系统应能及时获得信息,并且管理大容量信息。 5、共享性

在大量用户间实现潜在地共享秘密数据所必需的安全性需求。

三、 几个基本概念

1、维——维是人们观察问题的特定角度,例如:时间维、地理维、产品维。 2、维层次——人们在观察数据的某个特定角度(即某个维)还可以存在细节程度

不同的多个描述方面,我们称这多个描述方面为维的层次。 例 时间维:日期,月份,季度,年不同层次。 3、维成员——维的一个取值成为该维的一个维成员。

如果维已经分成了多层次的,则维成员就是不同维层次取值的组合。例如:某公司销售数据在省、市、县,地理维有三个层次,则“山东省潍坊市昌邑县”就构成地理维的一个维成员。维成员并不一定要在维的每一个层次上都取值,例如:山东省,山东省潍坊市,潍坊市昌邑县都是地理维的维成员。 4、多维数据集——数据立方体或超立方

多维数据集是决策支持的支柱,也是OLAP的核心。 多维数据集可以用一个多维数组表示。 多维数据集的形式化表示: (维1,维2,...,维n,观察变量)。 对于三维数据集可用图5-1表示: 5、 数据单元

多维数据集的取值称为数据单元。当在多维数据集的每个维都选中一个维成员以后,这些维成员的组合就惟一确定了观察变量的值。数据单元也就可以表示为:(维1维成员,维2维成员,维3维成员,观察变量) 例如:在图5-1中,在时间、销售地区、产品维度上分别取‘2002-10-12’、‘上海’、‘服装’,则可以唯一确定观察变量的值10000,因此该数据单元应该为(2002-10-12,上海,服装,10000)。

2

产品

销售 地区

北京

上海 化妆品 山东 玩具 服装 电器 时间 0 1 2 3 4

销售数量 图 5-1 数据立方体

对于超三维的多维数据集,则可由表表示: 时间ID 地理位置ID 产品ID 促销方式ID 销售数据 其他

2002-01-31 320112 A11 ABC 6484 ... ... 320218 A12 BAC 5739 ... ... ... ... ...

6、多维数据集的度量值(测量值)

多维数据集的度量值是基于多维数据集中事实表的一列或多列,数值型数字。

多维数据集的度量值是OLAP分析的核心值,是用户在DW中需要查看的数据,一般是销售量、成本、费用等。

四、OLAP与DW的关系

1、OLAP与DW的关系 如图5-2所示。

在DW中,OLAP和DW是密不可分的,但是两者具有不同的概念。

DW是一个包含企业历史数据的大规模数据库,这些历史数据主要用于对企

3

联系客服:779662525#qq.com(#替换为@) 苏ICP备20003344号-4