分析:数据仓库是否适合云计算模型

日期: 2009-10-27 作者:Brendan Cournoyer翻译:孙瑞 来源:TechTarget中国 英文

当云计算相对还是一个新生事物时,外包数据分析服务的概念已经不再是什么新鲜事物了。然而,近期围绕云数据库的争论,已经提升了“数据仓库即服务” (data warehousing as a service)潜在的利益价值。   由于“云模型”的出现,可扩展性在以极快的速度提升着,另外它还可以为中小企业提供更加经济实用的选项,因此数据仓库看上去与云计算的概念十分契合。但事实上是这样的吗?   加州一家商业智能咨询公司Mariner 的首席架构师John Welch这样谈到:“这要具体情况具体分析。

我认为所谓的契合,就是云计算可以为数据仓库的扩容提供一个更加简单的方法。但是从最基本的方面考虑,在云之间……

我们一直都在努力坚持原创.......请不要一声不吭,就悄悄拿走。

我原创,你原创,我们的内容世界才会更加精彩!

【所有原创内容版权均属TechTarget,欢迎大家转发分享。但未经授权,严禁任何媒体(平面媒体、网络媒体、自媒体等)以及微信公众号复制、转载、摘编或以其他方式进行使用。】

微信公众号

TechTarget微信公众号二维码

TechTarget

官方微博

TechTarget中国官方微博二维码

TechTarget中国

电子邮件地址不会被公开。 必填项已用*标注

敬请读者发表评论,本站保留删除与本文无关和不雅评论的权力。

当云计算相对还是一个新生事物时,外包数据分析服务的概念已经不再是什么新鲜事物了。然而,近期围绕云数据库的争论,已经提升了“数据仓库即服务” (data warehousing as a service)潜在的利益价值。

  由于“云模型”的出现,可扩展性在以极快的速度提升着,另外它还可以为中小企业提供更加经济实用的选项,因此数据仓库看上去与云计算的概念十分契合。但事实上是这样的吗?

  加州一家商业智能咨询公司Mariner 的首席架构师John Welch这样谈到:“这要具体情况具体分析。我认为所谓的契合,就是云计算可以为数据仓库的扩容提供一个更加简单的方法。但是从最基本的方面考虑,在云之间进行数据的传输还存在着许多问题,特别是在数据量非常大的时候。因此在考虑数据仓库与云计算模型时,你必须从好坏两个方面进行衡量。”

  Welch将在2009 SQL Server专家峰会(PASS Summit 2009)上进行主题为“云中的商业智能”的演讲,他认为在云中进行数据传输时会降低网络连接速度,而这样的情况在普通的数据传输时不会出现。“当你考虑将数据迁移到网络连接较慢的云服务器上时,包括备份窗在内的各种窗无疑将被延长。因此相比于传统的数据仓库,这的确是一个很大的缺点。”

  Welch还补充道,正是出于这一原因,有些云计算服务商考虑使用“慢速馈送”模型(trickle feed model),这种模型可以将单独的传输送到云服务器上,取代了每日的大批量加载。然而,这样的模型也有缺点。“这样的模型在进行数据处理时显然效率偏低。在一些情况下,数据质量分析技术靠的就是单次的大批量数据导入,否则数据分析的结果就会出现偏差。”

  微软为此也采取了一些措施。最近的SQL Azure Database社区技术预览版(CTP)就包含了对BULK INSERT的支持,旨在加速将数据迁移到云中的进程。Welch对此表示:“我看过的报告中,说使用BULK INSERT可以快上四倍、六倍甚至十倍。但很明显的是,这取决于你的网络连接以及你进行的操作。但是在进行大批量操作时,它的确可以提供极大的速度性能差异。”

  BULK INSERT在微软Azure数据库中只是众多改进中的一个,它对于DBA和开发者来说无疑是一个不错的选项。

  SQL Server专家Brent Ozar说:“对于微软紧贴客户体验,对其产品进行相应改进这一点,我十分赞赏。得知微软将为我们这些应用程序开发者改进Azure数据库时,我认为这一产品将得到极大范围的认可。”

  另外一个SQL Server云数据仓库的阻碍因素,就是SQL Azure Database的可用存储总量。目前,Azure Business Edition中有10GB的数据界限值,Welch认为对于BI应用程序和数据仓库来说,10GB远远不够。“对于小型企业来说,也许足够,但是对于大型项目来说,10GB太有限了。因此,微软应该考虑在未来的产品中,将10GB的限制取消,或大幅提高限制界限。”

  相应地,微软正在考虑在Azure中提高数据存储限制界限。而对于微软来说,这可以大大提升Azure与其它类似产品的竞争力,其中就包括了Greenplum的Enterprise Data Cloud (EDC) initiative和Aster Data Systems的Aster Data Systems。

  Welch说他希望微软在未来的Azure开发中,添加更多的SQL Server功能,比如将SQL Server Analysis Services和Reporting Services添加到云计算模型中。

  目前的SQL Azure Database CTP版本功能已经相对完整。SQL Azure开发团队的高级项目经理David Robinson在他的博客中写道:“在十一月项目正式发布之前,Azure CTP将维持免费。而SQL Azure Database Business Edition的价格将为每月99.99美元。”

翻译

孙瑞
孙瑞

相关推荐