使用AWS DynamoDB解决大数据难题

日期: 2014-06-24 作者:Cameron McKenzie翻译:孙瑞 来源:TechTarget中国 英文

过去十年中,数据库技术取得了长足的进步,已经完全可以满足大数据时代的需求。而扩展性、可靠性以及速度是传统关系型数据库目前面临的最大挑战,海量数据处理的需求不断被提出,这也使得关系型数据库的短板越来越明显,比如在扩展性上,关系型数据库往往成本较高,而轻量级可扩展的NoSQL数据库能够运行在廉价的通用服务器硬件上,因此非关系型数据库解决方案获得了更多的市场关注。

知名出版社O’Reilly的资深编辑Simon St. Laurent在接受采访时表示:“我认为NoSQL给企业提供了一个契机,能够从不同的角度来看数据架构的问题。与传统关系型数据库相比,NoSQL更‘碎片化’,你可以选择需要的组件和功能,也许这些功能之间是没有打通的,但它的优势在于你不用再重新部署一个数据库,这省去了大量的工作。在关系型系统中创建一个表是很简单的,但如果进行修改却很麻烦。NoSQL在这方面更加灵活。”

AWS的崛起

当然,每当IT遭遇瓶颈的时候,总少不了硅谷的创新公司想出新点子来解决问题,而亚马逊就是其中之一。早在2009年,他们就发布了关系型数据库服务(RDS)来帮助企业应对结构化的海量数据。其实比RDS更早,亚马逊就已经在研发NoSQL相关的数据服务了,那时候Dynamo的概念还没有被普遍接受,SimpleDB服务也只针对小型企业,在大规模扩展方面表现并不好。因此AWS需要推出一个动态的非关系型数据库,同时能够以服务的形式交付给企业。于是在2012年,DynamoDB正式发布,虽然时间点比较滞后,但它获得了巨大的成功。

在AWS峰会2014上,亚马逊的高级副总裁AndyJassy宣布,DynamoDB是公司有史以来增长速度最快的云服务。它提供了低延迟、高吞吐量的能力,同时AWS也根据客户的反馈不断对DynamoDB进行创新和改进。Andy Jassy表示,新增的全局与本地备用索引将进一步提升查询的灵活性,这对于客户来说是非常重要的特性。同时DynamoDB还新增了更细粒度的访问控制功能,使得客户可以在表中任意元素定义访问控制策略。其他的新功能还包括并行扫描、批量写入、地理空间索引库以及一些新的测试工具等。

通过提供可管理的非关系型数据库服务,同时能够对AWS基础设施和网络资源进行全方位的访问,DynamoDB改变了运维工程师对数据库需求的思维方式。Crittercism公司的Dave Albrecht对它做出了如下描述:“当我们考虑数据库的时候,大部分时间都在思考容量规划的问题。你的数据库有多大?是GB级别,还是TB甚至是PB。而通过完整的可调配吞吐模型,亚马逊解决问题的方法是很独特的。他们可以让客户自由地调整两个选项:1、数据库需要多大的容量?2、数据库需要多少的IOPS?你可以根据需求完全独立地进行调整,而且彼此不会影响。”

与此同时,运维团队还可以对数据库性能进行细化和改善,这使得他们能够以全新的级别来支持开发人员和终端用户。但过度微调的控制也会引起其他的问题。作为一名开发人员,TimGross在他的博客中写过一篇名为《 Falling in and out oflove with DynamoDB》的文章,其中提到激增的需求会引起问题,他建议可以使用cronjobs,管理AWS服务并对其进行更仔细的监控。

企业拥有选择权

目前,DynamoDB的目标市场中还有很多NoSQL数据库产品。AWS已经和MongoDB以及Couchbase达成了合作关系,共同帮助客户在EC2和EBS上运行非关系型数据库。然而,对于那些部署多种非关系型数据库来应对不同数据需求的企业,他们需要AWS提供更多的选择。开发人员希望在EC2上运行任意标准化的NoSQL数据库。因此毫无疑问,AWS与非关系型数据库提供商的合作会越来越多,对于DynamoDB来说也将进一步巩固它在大数据时代的地位。

我们一直都在努力坚持原创.......请不要一声不吭,就悄悄拿走。

我原创,你原创,我们的内容世界才会更加精彩!

【所有原创内容版权均属TechTarget,欢迎大家转发分享。但未经授权,严禁任何媒体(平面媒体、网络媒体、自媒体等)以及微信公众号复制、转载、摘编或以其他方式进行使用。】

微信公众号

TechTarget微信公众号二维码

TechTarget

官方微博

TechTarget中国官方微博二维码

TechTarget中国

电子邮件地址不会被公开。 必填项已用*标注

敬请读者发表评论,本站保留删除与本文无关和不雅评论的权力。

翻译

孙瑞
孙瑞

相关推荐