Gartner:数据仓库设备不是万灵丹

日期: 2010-05-09 作者:Jeff Kelly翻译:孙瑞 来源:TechTarget中国 英文

数据仓库设备模型的概念在近几年来一直是很热门的话题,它对于你的数据仓库性能改善究竟能起到多大的作用,各大厂商可不会告诉你真相。

  Gartner研究机构的分析师Donald Feinberg认为,尽管数据仓库设备的确减少了硬件配置的需求,但是它们并不会自动地解决其他一些问题,比如数据仓库设计和数据仓库性能等。

  而这也是几大数据仓库厂商,比如IBM、Oracle、Netezza等正在宣传的神话,Feinberg说:“这些厂商会向客户声明,如果你的数据仓库遇到了性能问题,那就意味着你没有满足终端用户的服务等级协议(SLA)。如果你使用数据仓库设备,这样的问题就可以得到解决。说实话,这完全是在胡扯。”

  Feinberg表示一个传统的数据仓库如果充斥着不正确的汇总数据,或者缺乏足够的cube来进行数据分析和数据挖掘的话,这不是简单地购买一个数据仓库设备能解决的。他说:“如果我的数据仓库设计得十分糟糕,那我将这个数据仓库迁移到所谓的设备中时,设备不会自动地调整性能问题。”

  换句话说,对于设计糟糕的数据仓库来说,在高度的工作负载压力之下是没有快速解决办法的。而工作负载是在逐步加大的,过去几年的趋势就是这样。

  数据仓库在最早出现的时候,被视为一个报表工具,其中的数据是批量集成的,公司使用数据仓库的频率也不是很高,通常是每周才使用一次。而经过了数年的发展,随着前端商业智能工具的逐步成熟以及实时数据集成需求的增长,企业对数据仓库的性能要求也越来越高。

  Feinberg表示:“我们从之前的只运行几个报表到现在要运行数千个报表,做复杂查询的人也越来越多,甚至达到了一个难以想象的数字,而其中还有的查询会占用极长的时间。于是用户开始关心性能问题了。”

  以数据仓库设备的形式添加更多的硬件是无济于事的。性能问题的改善也只是暂时的,当用户的数量增加的时候,这只会造成更大的性能问题。

  想要解决性能问题的最佳方法,就是分优先级地使用数据仓库。Feinberg认为:“在解决性能问题时,我们不应该这么看,即谁能最快地加载数据和执行查询,而应该是谁能在最小的投入下完成全部的工作负载。那么这就涉及到工作负载管理的问题了。”

  对此,Feinberg指出,目前只有一家厂商提供了全面的工作负载管理工具,那就是Teradata。其竞争对手Oracle、IBM以及微软等都在努力追赶,但是他们想要推出像Teradata一样的工具还需要几年的时间。工作负载管理的空白正在逐渐消失。

  另一个选择就是软件外包,把工作负载工具的开发外包给Kognitio或1010data这样的厂商。这些厂商可以把客户的数据仓库迁移到自己的数据中心当中,而这个数据中心就是设计用来优化数据仓库性能的。

  这对于那些缺乏IT开发人员的公司来说是一个不错的选择,他们往往无法在内部管理好他们的数据仓库。但是这也有它相应的缺点,最大的问题就是成本,没有外包的数据仓库,IT人员可以对用户访问数量和时间进行内部控制,但是在外包环境中,一个人在两天时间里就可以把一个月的预算全部花费掉。

我们一直都在努力坚持原创.......请不要一声不吭,就悄悄拿走。

我原创,你原创,我们的内容世界才会更加精彩!

【所有原创内容版权均属TechTarget,欢迎大家转发分享。但未经授权,严禁任何媒体(平面媒体、网络媒体、自媒体等)以及微信公众号复制、转载、摘编或以其他方式进行使用。】

微信公众号

TechTarget微信公众号二维码

TechTarget

官方微博

TechTarget中国官方微博二维码

TechTarget中国

电子邮件地址不会被公开。 必填项已用*标注

敬请读者发表评论,本站保留删除与本文无关和不雅评论的权力。

翻译

孙瑞
孙瑞

相关推荐