数据仓库设备模型的概念在近几年来一直是很热门的话题,它对于你的数据仓库性能改善究竟能起到多大的作用,各大厂商可不会告诉你真相。
Gartner研究机构的分析师Donald Feinberg认为,尽管数据仓库设备的确减少了硬件配置的需求,但是它们并不会自动地解决其他一些问题,比如数据仓库设计和数据仓库性能等。
而这也是几大数据仓库厂商,比如IBM、Oracle、Netezza等正在宣传的神话,Feinberg说:“这些厂商会向客户声明,如果你的数据仓库遇到了性能问题,那就意味着你没有满足终端用户的服务等级协议(SLA)。如果你使用数据仓库设备,这样的问题就可以得到解决。说实话,这完全是在胡扯。”
Feinberg表示一个传统的数据仓库如果充斥着不正确的汇总数据,或者缺乏足够的cube来进行数据分析和数据挖掘的话,这不是简单地购买一个数据仓库设备能解决的。他说:“如果我的数据仓库设计得十分糟糕,那我将这个数据仓库迁移到所谓的设备中时,设备不会自动地调整性能问题。”
换句话说,对于设计糟糕的数据仓库来说,在高度的工作负载压力之下是没有快速解决办法的。而工作负载是在逐步加大的,过去几年的趋势就是这样。
数据仓库在最早出现的时候,被视为一个报表工具,其中的数据是批量集成的,公司使用数据仓库的频率也不是很高,通常是每周才使用一次。而经过了数年的发展,随着前端商业智能工具的逐步成熟以及实时数据集成需求的增长,企业对数据仓库的性能要求也越来越高。
Feinberg表示:“我们从之前的只运行几个报表到现在要运行数千个报表,做复杂查询的人也越来越多,甚至达到了一个难以想象的数字,而其中还有的查询会占用极长的时间。于是用户开始关心性能问题了。”
以数据仓库设备的形式添加更多的硬件是无济于事的。性能问题的改善也只是暂时的,当用户的数量增加的时候,这只会造成更大的性能问题。
想要解决性能问题的最佳方法,就是分优先级地使用数据仓库。Feinberg认为:“在解决性能问题时,我们不应该这么看,即谁能最快地加载数据和执行查询,而应该是谁能在最小的投入下完成全部的工作负载。那么这就涉及到工作负载管理的问题了。”
对此,Feinberg指出,目前只有一家厂商提供了全面的工作负载管理工具,那就是Teradata。其竞争对手Oracle、IBM以及微软等都在努力追赶,但是他们想要推出像Teradata一样的工具还需要几年的时间。工作负载管理的空白正在逐渐消失。
另一个选择就是软件外包,把工作负载工具的开发外包给Kognitio或1010data这样的厂商。这些厂商可以把客户的数据仓库迁移到自己的数据中心当中,而这个数据中心就是设计用来优化数据仓库性能的。
这对于那些缺乏IT开发人员的公司来说是一个不错的选择,他们往往无法在内部管理好他们的数据仓库。但是这也有它相应的缺点,最大的问题就是成本,没有外包的数据仓库,IT人员可以对用户访问数量和时间进行内部控制,但是在外包环境中,一个人在两天时间里就可以把一个月的预算全部花费掉。
我们一直都在努力坚持原创.......请不要一声不吭,就悄悄拿走。
我原创,你原创,我们的内容世界才会更加精彩!
【所有原创内容版权均属TechTarget,欢迎大家转发分享。但未经授权,严禁任何媒体(平面媒体、网络媒体、自媒体等)以及微信公众号复制、转载、摘编或以其他方式进行使用。】
微信公众号
TechTarget
官方微博
TechTarget中国
作者
翻译
相关推荐
-
专访Teradata首席分析官:是时候迎接分析的变革了
作为Teradata公司的首席分析官,Bill Franks在上一本书出版两年多之后,又携新书中文版《数据分析变革》再度来华,与媒体进行了深入的沟通。
-
Teradata名列2015年Gartner数据仓库魔力象限报告“领导者象限”
Teradata天睿公司宣布名列Gartner公司首次发布的《2015年数据仓库和分析型数据管理解决方案魔力象限报告》中的“领导者象限”。
-
Teradata天睿公司被再度评为 整合数据仓库技术领导者
国际数据管理咨询机构Information Difference再次将Teradata评为全球数据仓库创新技术领导者。
-
Teradata天睿公司收购Appoxee公司
Teradata天睿公司(Teradata Corp.,纽交所:TDC)宣布收购移动营销软件即服务式提供商Appoxee公司。