增进性能的BI架构选择:企业级数据仓库

日期: 2011-01-25 作者:Mark Whitehorn翻译:宋广磊 来源:TechTarget中国 英文

很多商业智能(BI)项目正在扩大并向外扩展以延伸到组织内更多的最终用户。当然,这是BI在公司的重要性日益增长的一个确切信号,当越来越多的人开始使用它时,为确保BI系统性能不受影响从而增加了BI和IT经理的责任。   让我们开始考虑运行世界上最大BI系统的公司如何解决在将商业智能交付到更多用户手上之后应付相应的挑战,维持可接受的性能水平。 许多非常大的组织创建一个企业级数据仓库(EDW),其中在业务系统和其他源系统中提取的操作数据存储在一台机器的一个数据库中,一般由一组关系表组成。

通常,终端用户的所有分析查询也在本系统上完成。   从某种意义上说,这种BI架构将所有鸡蛋放在一个篮子里。但如果单个……

我们一直都在努力坚持原创.......请不要一声不吭,就悄悄拿走。

我原创,你原创,我们的内容世界才会更加精彩!

【所有原创内容版权均属TechTarget,欢迎大家转发分享。但未经授权,严禁任何媒体(平面媒体、网络媒体、自媒体等)以及微信公众号复制、转载、摘编或以其他方式进行使用。】

微信公众号

TechTarget微信公众号二维码

TechTarget

官方微博

TechTarget中国官方微博二维码

TechTarget中国

电子邮件地址不会被公开。 必填项已用*标注

敬请读者发表评论,本站保留删除与本文无关和不雅评论的权力。

很多商业智能(BI)项目正在扩大并向外扩展以延伸到组织内更多的最终用户。当然,这是BI在公司的重要性日益增长的一个确切信号,当越来越多的人开始使用它时,为确保BI系统性能不受影响从而增加了BI和IT经理的责任。

  让我们开始考虑运行世界上最大BI系统的公司如何解决在将商业智能交付到更多用户手上之后应付相应的挑战,维持可接受的性能水平。 许多非常大的组织创建一个企业级数据仓库(EDW),其中在业务系统和其他源系统中提取的操作数据存储在一台机器的一个数据库中,一般由一组关系表组成。通常,终端用户的所有分析查询也在本系统上完成。

  从某种意义上说,这种BI架构将所有鸡蛋放在一个篮子里。但如果单个中心机器的处理功能根据要求增加一倍或三倍,那么它将是扩大使用范围和增强商业智能性能需求规划的完全合理和安全的方式。

  一般来说,这些系统基于大规模并行处理(MPP)架构,如此的“一体机”实际上是一组相互连接的处理节点。更多节点的添加只需连入系统即可简单实现,且最好的情况基本上保证性能的可扩展性。在这种情况下,如果您的系统在四个节点上运行200个用户提供了0.8秒的查询响应时间,你可以肯定的是扩大到8个节点将为400名用户提供0.8秒的响应时间。坏消息则是费用。您的成本基于不同的具体技术和系统设计会有所变化,如此设置的预期费用则达到几百万美元以上。

  因此,我们该怎样做?还有什么其他的选项适用于大多数的BI系统设计者和BI项目团队? 首要的,你可以模块化构建,开始时在你的BI架构中引入可扩展性的层次。在此模型中,数据也保存在一个中央数据仓库,但执行的分析工作在较小的数据集市、OLAP或者立方体,其中的数据是预聚集的并以在线分析处理的形式存储。

  相较于EDW,预聚集数据有几种实现。首先,数据汇总在可用性上引入了延迟,这个过程可能要花上几个小时才能完成。这种延迟不仅为终端用户所厌烦,也意味着提供实时商业智能功能变得非常困难。一些供应商已经尽力将延迟从数小时减少到数分钟,这种办法的问题是他们大大增加了商业智能系统的复杂性。相比之下,一个企业级数据仓库非常昂贵,但概念上简单,能够更好地支持实时的商务智能流程。

  这两种方法虽然在实现上有显著的不同,但针对相同的数据量通常可提供相同的性能水平。

  例如,想象一下,数据仓库中的每个数据集市为一组20名用户提供充分的分析和商业智能性能。然后,一组扩展到30人。在一个简单的模块化方法中,你会复制现在已经超负荷的数据集市并连接15个用户到原有的数据集市,其他15个用户连接到复制的数据集市。从本质上讲,我们如要求的那样在分析层换入了更多的硬件。

  从某种意义上说,这就像在一个基于MPP的企业级数据仓库系统中添加节点,但在这种情况下,服务器比MPP系统的一个节点便宜得多。另一方面,他们更难以安装:您必须仔细计划如何设置服务器,他们失败时会发生什么等等。随着 MPP技术的发展,您只需简单的添加节点和系统软件将确保它们得到有效利用。

相关推荐