微软商务智能基础 之 BI术语讲解 (一)

商务智能基础

1.1 商务智能和数据建模

本文介绍商务智能的一些基本术语,包括OLTP和OLAP。

1.2 商务智能定义

商务智能解决方案包含对关键企业级数据的有效存储和表示, 从而使授权用户能够循序而方便地访问并解读这些数据

SQL Server 中的BI工具允许企业在全新的层次上管理他们的业务, 这样也就能根据对既往数据的分析,了解某项业务为什么取得那样的成果,并就后续行动做出决策,也可以根据历史的数据的分析,准确地预测未来的成果。

  • 应用场景举例
    • 分析师可以研究详细数据
    • 高管可以查看及时的高级汇总
    • 中层管理人员可以要求数据按照自己进行日常业务决策所需的详细程度来呈现
Texte de remplacement généré par une machine :
ACœSSs EXœI. Word* 
1-1

在这个BI解决方案的概念性表述图中,多种类型的数据源被整合到集中数据存储机构中,对于正式实现的BI解决方案来说,最终的目标容器通常称为多维数据集。

其中整合包括两个层次的概念:

  • 物理整合 : 将数据物理地整合到一台或多台服务器上
  • 逻辑整 : 使用视图技术

1.2 OLTP V.S. OLAP

1.2.1 OLTP

是联机事务处理(Online trantional processing)的缩写,用来描述为了事务性活动而设计和优化的关系数据存储

  • 事务性活动指的是在表中插入,更新和删除行。
  • 这类数据存储系统的典型设计是,在一个源数据库中创建大量规范化表。

OLTP存储的规范化工作通常是通过在主表和子表的数据行之间建立主键-外键的关系实现的,采用规范化方式对数据存储进行建模主要是为了减少需要保存的数据总量,提高执行插入、更新和删除操作的效率。

比如,在这个图中,如果要为某个客户插入第二条订单,而这个客户的信息没有变化,那么在customer表中不需要插入任何新信息,只需要在相关的Order表中插入一条或多条订单记录行,并使用客户的标识符(通常是一个键值)将插入的订单信息与具体客户关联起来即可。

虽然这种建模方式,对处理这类活动来说很有效率,但如果需要对这类数据存储执行密集的读取操作时,问题就出现了。

比如,图中这个模型,通常我们需要的业务需求是查看聚合的信息,如果想要查看某个顾客的消费总量,首先必须从多个表中选择符合报表条件的记录行,再对记录进行排序,匹配,之外引擎还必须将结果进行聚合处理。

使用高度规范化的OLTP数据存储也许能够很好地同时支持CRUD(创建,检索,更新,删除)活动和只读活动。但其处理速度就取决于所拥有的软硬件资源,除此之外还要考虑需要并发访问信息的用户数量。

1.2.2 OLAP

是联机分析处理(Online analystical processing)的缩写,它表示为了分析活动而设计和优化的数据结构

  • 分析活动 : 侧重于数据读取方面应用的活动,而不是为了更有效地修改数据而对数据进行的优化活动,所以许多OLAP数据存储在实现时都是只读的。
  • 常用来描述OLAP数据结构的术语还有,决策支持系统、报表数据库、数据仓库和多维数据集。

针对OLAP应用建模的数据存储通常采用一种特定的反规范化建模方式,如星形建模,进行反建模。

在反规范化时,使用的数据表中包含非常宽泛的关系,即包含很多类,其中包含有意为之的重复信息。

采用这种方式,可以减少查询时必须链接的表以及需要建立的索引数量。

实现OLAP的另外一种方式是使用多维数据集 (Cube) 来代替一大堆表。

  • 多维数据集指的是一个能够在单一结构中容纳所有相关数据的巨大存储,包含源表,以及预先聚合的指。

多维数据集到底是什么样的呢?请看下面的概念结构实例。

Texte de remplacement généré par une machine :
5WF2B17 
500 
h FI 
[mtf3h30a 
22 
600 
99*3 
19 
470 
4050 
490 
-..lÉg___ 
s 20 
4360 
30 
315 
21 
780 
410 
5112

一个多维数据集,主要包含两大方面:事实 (fact) 和维度 (Dimension)。

  • 事实通常是数字性和累加性的,但这不是必须的。例如,销售额就是一个事实。
  • 维度则用来给事实赋予意义,可能需要按照时间、产品、客户和员工的分类方式对销售量进行研究,例如”在上半年非洲空运所得的销售量”,所有这些”按xxx”就是维度。
  • 将n维结构转换到二维屏幕上,就会得到一个透视表界面。如图:
DateTool dimension: an alternative Time Intelligence ...

老虎敲重点啦,

商务智能解决方案包含对关键企业级数据的有效存储和表示, 从而使授权用户能够循序而方便地访问并解读这些数据。为企业中各个层次的决策提供数据支持。

OLTP 是联机事务处理(Online trantional processing)的缩写,用来描述为了事务性活动而设计和优化的关系数据存储。采用规范化建模,主要处理CRUD操作。

 OLAP是联机分析处理(Online analystical processing)的缩写,它表示为了分析活动而设计和优化的数据结构。处理查询操作。采用反规范建模,主要处理查询操作。