编者按:本系列文章将为您解读Oracle大数据策略。本文为第二部分,主要探讨通过对使用一体机和DIY方法进行对比来检视实施大数据的成本。而第一部分主要对比了不同的大数据平台。 在考虑如何解决大数据问题的时候,许多企业会在以下两个选项中进行选择:用廉价硬件和开源软件或是购买一个已经包含必要组件的一体化解决方案建立一个内部系统。
基于商用的廉价系统提供了灵活性并且给出了不错的报价,至少表面上是这样的,但是一台一体机则让实施过程快速而便捷,如果你没有必需的内部资源,那么这无疑是一个不错的选择。而在两套方案中为你的Oracle大数据架构选择其一并非易事。 计算Oracle大数据架构的成本 在规划一个大数……
我们一直都在努力坚持原创.......请不要一声不吭,就悄悄拿走。
我原创,你原创,我们的内容世界才会更加精彩!
【所有原创内容版权均属TechTarget,欢迎大家转发分享。但未经授权,严禁任何媒体(平面媒体、网络媒体、自媒体等)以及微信公众号复制、转载、摘编或以其他方式进行使用。】
微信公众号
TechTarget
官方微博
TechTarget中国
编者按:本系列文章将为您解读Oracle大数据策略。本文为第二部分,主要探讨通过对使用一体机和DIY方法进行对比来检视实施大数据的成本。而第一部分主要对比了不同的大数据平台。
在考虑如何解决大数据问题的时候,许多企业会在以下两个选项中进行选择:用廉价硬件和开源软件或是购买一个已经包含必要组件的一体化解决方案建立一个内部系统。基于商用的廉价系统提供了灵活性并且给出了不错的报价,至少表面上是这样的,但是一台一体机则让实施过程快速而便捷,如果你没有必需的内部资源,那么这无疑是一个不错的选择。而在两套方案中为你的Oracle大数据架构选择其一并非易事。
计算Oracle大数据架构的成本
在规划一个大数据项目的时候成本分析是必要的,而要得出一个精确的结论并不总是一件简单的事。
在一体机方面,你可以从报价作为开始。对于一个18节点的满配Oracle大数据一体机,成本为450000美元,外加每年收取高昂的支持服务费用。而这这还没完,即便已经选择了企业的支持服务,你仍然需要管理和维护设备。也就是说很可能要使用额外的软件,开发客户代码并连入已有系统,例如数据仓库或关系型数据库系统。一体机可能看似是一个完整的平台,但你将仍需要添加一些内部资源。
要对建立一个基于商用系统的Oracle大数据架构做出成本规划很是困难。只要你决定好了要包括哪些必要的网络设施,诸如交换机和带宽,以及其他的外围设施,就能很容易估算出硬件成本。但是你还需要考虑软件和服务的成本。例如,你需要一个用于管理Hadoop集群的工具,可以从MapR、Cloudera或是Hortonworks进行采购,另外还包括进行持续管理和维护所需的资源。
如果你想要将其他开源软件整合进平台,例如R Analytics或是MongoDB NoSQL数据库,你还必须考虑部署和管理这些软件所必需的时间和资源。另外,你还需要资源来设置硬件并将Hadoop连接至其他系统,并且你必须开发客户代码来对数据进行访问和支持各种系统。最为重要的是,你应该通过那些对大数据和如何在Hadoop环境中管理大数据有很好理解的数据科学人员和工程师来做出预算。没有合适的专业人员,你会让自己面临意想不到的成本和风险。
估算上市时间
在所有的可能性中,你会发现基于一体机系统的上市时间要短于基于廉价服务器搭建的系统。对于一台一体机来说,你不必设置服务器并将它们连接起来,不需要安装基础软件,连接系统并尝试让所有的组件协同工作。根据Enterprise Strategy Group代表Oracle的研究显示,你会看到运用一体机可以节省30%的上市时间。
然而,一体机也不是开箱即用,你仍然需要等待系统的搭建和测试,但是这里的等待可以花在追求其他的方面而不是花在建立你自己的系统上。此外,你的系统越快就位,你就可以越快开始分析数据并享受大数据所带来的好处。
押注未来
正如任何大型企业所做的一样,你必须为Oracle大数据架构在将来所要面临的什么样的状况加以考虑。一台一体机似乎符合你当前的需求,但是两年之后又如何呢?五年之后又会怎样呢?
例如,假设在可以预见的将来要处理200TB的数据。你会确定使用一个单一的18节点Oracle大数据一体机或是一个100节点的廉价服务器系统。假设从现在开始的一年之内你发现还需要容纳另外10TB的数据。如果你已经部署了Oracle一体机,那么你就必须购买第二个160000美元(当前报价)的6节点机架。但是,如果你已经建立了一套商用平台,你就只需要以非常低廉的成本增加并配置5台左右的服务器即可。也就是说,如果你需要以适合于成品设备模式的速度扩充你的数据容量,那么你很可能会发现扩展机架要比增加需要进行配置和用复杂软件设置的廉价硬件要来的容易。
基于商用的廉价系统通常可以提供更多的灵活性。而且在灵活性很重要的情形下,不只是更大型的数据集才存有风险。我们对于大数据的理解以及我们处理大数据的方式仍是一个相对不成熟的技术,它还在迅速的改变之中。甚至Google还在不断寻找更新更好的方法来处理其大规模的数据。一台一体机是由特定的配置建造的。如果此配置不再是处理大数据的最佳策略又将如何呢?
云很可能会在大数据的未来发挥更大的作用。无论是对于基于一体机还是基于廉价服务器情况,云服务终将取代内部部署的方式。对于某些企业来说,这样的时代可能已经近在咫尺了。如果你在今天购买一体机,那么当它们将来不再能够满足你的大数据需求的时候你还能有效的对它们加以利用么?有了廉价硬件,你可能会有更多的机会将这些系统用作他途。但即便如此,你也应该尝试着在购买之前为将来做好打算。
自建还是购买
在一个基于一体机的系统和一个基于廉价硬件的系统之间做出选择的时候有诸多因素需要考虑。如果你的企业要求紧急并且不愿付出太多心力,那么一台一体机是不错的选择。当购买一体机的时候,你不只是在购买硬件,同时还是在购买你所需要的服务和专业知识以便在实施和管理的过程中更加顺畅。另外一方面,如果你拥有必要的内部资源,包括高级专业知识,你可能会从自己动手建造所固有的灵活性中获得优势,尤其是如果你身边有着大量的廉价硬件设备。
但是无论哪种选择都不应该掉以轻心。它们都有着高昂的代价和各自的风险,而这些在最初阶段不总是很明显的。无论你选择什么,尽力对总成本和上市时间做出一个实际的估计。并且一定要高屋建瓴,着眼未来。
翻译
相关推荐
-
解读EMC的“数据湖Data Lake”一体机
EMC最近推出了一款一体机来帮助用户建立“数据湖”,并与来自EMC的信息基础架构,Pivotal和VMware的技术进行融合。
-
Oracle集成系统家族再扩军 打破“全数据”壁垒
甲骨文中国董事总经理潘少海表示,集成系统不是简单的软件与硬件集成一体化的产品,它是企业化繁为简并推动IT现代化变革的源动力。
-
发力SQL on Hadoop:甲骨文进一步完善大数据管理解决方案
对于在传统数据库领域占据绝对优势的甲骨文来说,SQL on Hadoop在它的整体大数据战略中也占据了非常重要的位置。
-
大数据一体机如何融入数据仓库架构
随着我们可以访问的数据越来越多,企业已经开始将大数据存储到企业数据仓库(EDW)中。它要求数据库管理员(DBA)和相关支持人员对数据仓库架构进行重新设计。