商业智能的基础:数据仓库、数据集市和内存分析

日期: 2010-04-01 作者:Don Jones翻译:孙瑞 来源:TechTarget中国 英文

为了让商业智能系统更好地工作,它需要在快速地访问整个企业的数据。传统的事务数据库追求的是读写性能的平衡以及减少数据冗余程度。要从众多数据库中组合数据必然是一件耗时的事情,这意味着用户在浏览报表时需要等上几个小时甚至一天的时间。这样的速度对于决策的制定实在是太慢了。

  商业智能在解决这一问题上,就用到了数据仓库。从本质上来讲,一个数据仓库就是一个大型的数据库,这个数据库在结构设计上是唯一的,可以加速读取操作。这个结构是定制的,以控制数据来付诸表决。   定期的(比如每晚),都会运行自动任务来从的你生产数据库拷贝数据到数据仓库中,并对结构进行调整以便数据可以被非常快速地查询。

报表的生成也从原来的……

我们一直都在努力坚持原创.......请不要一声不吭,就悄悄拿走。

我原创,你原创,我们的内容世界才会更加精彩!

【所有原创内容版权均属TechTarget,欢迎大家转发分享。但未经授权,严禁任何媒体(平面媒体、网络媒体、自媒体等)以及微信公众号复制、转载、摘编或以其他方式进行使用。】

微信公众号

TechTarget微信公众号二维码

TechTarget

官方微博

TechTarget中国官方微博二维码

TechTarget中国

电子邮件地址不会被公开。 必填项已用*标注

敬请读者发表评论,本站保留删除与本文无关和不雅评论的权力。

为了让商业智能系统更好地工作,它需要在快速地访问整个企业的数据。传统的事务数据库追求的是读写性能的平衡以及减少数据冗余程度。要从众多数据库中组合数据必然是一件耗时的事情,这意味着用户在浏览报表时需要等上几个小时甚至一天的时间。这样的速度对于决策的制定实在是太慢了。

  商业智能在解决这一问题上,就用到了数据仓库。从本质上来讲,一个数据仓库就是一个大型的数据库,这个数据库在结构设计上是唯一的,可以加速读取操作。这个结构是定制的,以控制数据来付诸表决。

  定期的(比如每晚),都会运行自动任务来从的你生产数据库拷贝数据到数据仓库中,并对结构进行调整以便数据可以被非常快速地查询。报表的生成也从原来的几小时变成现在的几分钟或几秒钟。整个商业智能系统就是在这个结构基础上构建的。

  数据集市基本上就是一个小型的数据仓库,里面包含了特定部门的数据,比如财务部门、零售部门等。如果你为每一个部门都创建了数据集市,然后将它们连接起来,理论上来说你就已经拥有一个数据仓库了。

  数据仓库有下面两个主要缺点:

  1、从生产数据库抽取数据的过程比较漫长,因此数据仓库中的数据往往是过期数据;

  2、数据仓库的规模非常大。想要真正地了解到业务趋势,你需要大量的新老数据,其结构将有利于重复与冗余数据的堆砌。虽然在访问速度上没问题,但是造成了较大的存储压力。

  随着处理器和服务器内存价格的下降,一种称为“内存分析”的技术更加适合商业智能系统了。利用这一技术,你可以跳过从生产数据库拷贝数据到数据仓库这一步。分析服务器会将数据分配到内存中类似数据仓库的结构上,使用内存结构来对分析进行支持,在完成任务后再将该结构释放。

  这一方法的目的,就是提供更加快速的按需分析能力。虽然你需要许多服务器和内存来实现这一功能,但是它的确可以带来更强劲的特设分析能力。大多数现代商业智能解决方案都是结合了内存分析技术和数据仓库两方面的。

作者

Don Jones
Don Jones

投稿作者

翻译

孙瑞
孙瑞

相关推荐