Greenplum将数据仓库带入云世界

日期: 2010-03-14 作者:Jeff Kelly翻译:张峰 来源:TechTarget中国 英文

您不必向Clint Johnson解释数据集市的问题。因为身为Zion Bancorportation公司的副总,Johnson对这个概念再熟悉不过了。   当所谓的Zion超级用户想要做一些复杂的分析,像为客户维持而提供的预测模型。这些分析又不为银行的商业智能应用所支持, Johnson将从多个源系统和数据库中抽取数据,并允许超级用户创建他们自己的数据集市。

  Johnson认为这将导致到处都是部门级的数据集市,在很大程度上超出了技术人员的控制。不但数据集市和硬件管理很困难,而且这些数据集市之间是非连接的,这就意味着不同的组织和部门要经常处理不同的数据集。   但是比起试图停止或降低数据集……

我们一直都在努力坚持原创.......请不要一声不吭,就悄悄拿走。

我原创,你原创,我们的内容世界才会更加精彩!

【所有原创内容版权均属TechTarget,欢迎大家转发分享。但未经授权,严禁任何媒体(平面媒体、网络媒体、自媒体等)以及微信公众号复制、转载、摘编或以其他方式进行使用。】

微信公众号

TechTarget微信公众号二维码

TechTarget

官方微博

TechTarget中国官方微博二维码

TechTarget中国

电子邮件地址不会被公开。 必填项已用*标注

敬请读者发表评论,本站保留删除与本文无关和不雅评论的权力。

您不必向Clint Johnson解释数据集市的问题。因为身为Zion Bancorportation公司的副总,Johnson对这个概念再熟悉不过了。

  当所谓的Zion超级用户想要做一些复杂的分析,像为客户维持而提供的预测模型。这些分析又不为银行的商业智能应用所支持, Johnson将从多个源系统和数据库中抽取数据,并允许超级用户创建他们自己的数据集市。

  Johnson认为这将导致到处都是部门级的数据集市,在很大程度上超出了技术人员的控制。不但数据集市和硬件管理很困难,而且这些数据集市之间是非连接的,这就意味着不同的组织和部门要经常处理不同的数据集。

  但是比起试图停止或降低数据集市的蔓延速度,Johnson还面临着一个被认为是不可能完成的任务。他决定主动采用一个不一样的方法,那就是借助于私有云计算的方法来实现。Zion公司现在正在应用GreenPlum的企业数据云(EDC),此应用本质上是在硬件层面上的一个虚拟架构中,银行可以发布并运行Greenplum公司的数据仓库平台。

  该系统一旦投入使用,Zion公司的工作人员将可以通过自助服务门户网站,并按需求在内部或私有的数据云中创建和拆除数据集市。不考虑他们所在的部门,他们可以在内部数据云中查看相同的数据源,技术部门也将可以对平台进行一站式管理。正如Johnson提出的,将会有越来越多的数据集市被用到。

  Greenplum的产品经理Ben Werther表示:在企业数据云(EDC)之后,还有一个观点就是在企业防火墙内部引入公共云计算的弹性机制,允许数据仓库和数据集市的简易自助式提供,以及集中式管理。

  Werther还认为发布一个按周备份和按月备份数据模型和清洗的大数据仓库对于目前的工作人员来说太严格了,他们希望快速灵活地访问商业智能(BI)数据和其它分析数据。在那种环境下,不需要等着技术人员创建数据集市,用户经常带头创建他们自己的数据集市。这将导致数据集市的增加,这种情况对技术人员来讲非常难处理。

  基于企业数据云(EDC),客户可获得最好的公共云模型,并不会有将公司的敏感数据外泄于防火墙的风险。这从经济学角度来看也是可能的,因为不同于许多竞争者提供的同类产品,Greenplum的数据库运行在更便宜更普通而非专有的硬件上。

  Werther还说道:“硬件现在当相的便宜了,低于100万美元的价格可以购买到1,000核的服务器,这远比购买一台Teradata的服务器要便宜,我们认为在内部数据云上的数据仓库最终将成为未来数据仓库的运作方式”。

  Forrester分析师James Kobielus同意这一观点。他认为在数据云中的数据仓库,或称谓的虚拟数据仓库,是将来的一个发展方向。他表示:“数据仓库渐渐地从一个专注于集中分析的数据库或单物理节点的学科,转化为一个更加虚拟化的数据仓库系统(或数据云),它是一个共同管理多个数据分析实例的又高又厚的平行节点网格”。

  他还补充:“一些节点可以专门用于数据集成功能,如ETL,另一些可以专门用于数据清洗,其它的用于提供新的数据集市,并且这些都很灵活。”

  Kobielus告诉我们,Greenplum在推动云布署模型方面有其优势。另外,要在普通的硬件上运行,Greenplum的数据库使用了大量的并行处理来同时查询大数据集。这也是实现像云一样的环境的虚拟化与分布式的前提条件。他提醒说:“企业数据云(EDC)将不会对技术人员管理内部云有直接的影响。因为客户将不得不遵循Greenplum公司的标准。大多数组织在不同环境下操作多个厂家的数据仓库和数据集市,这是一个现实问题。”

  另外,当Greenplum公司带头进军这个领域,其它数据仓库厂家可能参与到云数据仓库市场中 。例如,不久前IBM宣布其Smart Business云计算服务,这将允许客户在公共云和私有云上使用集成软件和应用,这两者均受Big Blue支持。

  然而IBM新的云服务当前还不支持数据仓库布署,“由于客户的需求增加,我们明确地发现在云中提供此类服务的机会。”身为IBM的自动计算主管的Dennis Quan如是说。

  Microsoft在将投入到云数据仓库市场中。例如,它已经在其自身云平台Azure中提供公共云中的数据仓库,以及SQL数据服务。

  当Forrester的Kobielus谈到数据仓库,他说:“云模型仍然处于起步阶段,并且可能还要一年甚至更长时间才能真正开始成熟。”很少有厂家采取持续的行动来帮助用户将完全云环境下的数据仓库发展到一个更高水平。

  但是这个观点没有阻止Zion公司为所有员工提供统一的方式来查找,访问并分析公司数据。Johnson指望着企业数据云(DEC)来减少由数据集市激增以及消除组织与部门之间的障碍所花费的维护与支持费用。

  基于正在进行中的应用,银行希望在本年年底时完成企业数据云(EDC)的完全部署。Johnson说,到那时,多达50个Zion最具经验的分析师将开始访问内部云中大约4TB的数据,并创建他们自己的可管理的数据集市。

  Johnson还说:“我们即将为终端用户提供数据库的直接访问,上传他们自己的数据并创建他们自己的数据仓库。这是为他们提供一个地方(私有云)来工作,在这里他们可以处理复杂的事情而不需要删除数据。”

翻译

张峰
张峰

相关推荐