亚马逊扩展云数据库和数据分析

日期: 2019-12-15 作者:Sean Michael Kerner翻译:邹铮 来源:TechTarget中国 英文

Amazon Web Services(AWS)非常明确的是:他们希望各种规模的企业都可在云中运行数据库,包括几乎所有用例。

在拉斯维加斯举行的AWS re:Invent 2019大会上,该云巨头概述了亚马逊云数据库战略,该战略涉及多种针对不同用例的专门构建的产品。

AWS在会议的第一天(12月3日)还发布了新服务,包括Amazon Managed Apache Cassandra Service,这是流行Cassandra NoSQL数据库支持的云版本。该供应商还推出针对Amazon Redshift数据仓库的多项新功能,从而提供了增强的数据管理和分析功能。

IDC公司分析师Carl Olofson说:“很简单,亚马逊希望提供一站式购物服务,以满足AWS上的所有数据管理和分析需求。对于那些全力支持AWS的人来说,这非常好。对于他们的竞争对手,例如Snowflake与Redshift竞争和DataStax与新的Cassandra服务竞争,这将激发更强有力的竞争。”

亚马逊云数据库策略

AWS首席执行官Andy Jassy在其主题演讲中详细介绍了亚马逊云数据库战略背后的原因以及为何不能单靠一台数据库。

Jassy说:“很多公司将关系数据库用于所有工作负载,而这样的日子早已经过去了。”

如果所有工作负载都使用一台关系数据库,这会涉及太多数据、成本和复杂性。根据Jassy所说,这激发了对专用数据库的需求。

例如,Jassy指出,网约车平台Lyft拥有数百万的驾驶员和地理位置坐标数据,这并不适合使用关系数据库。

对于Lyft用例和其他类似用例,需要一种快速且低延迟的键值存储,这就是AWS推出DynamoDB数据库的原因。而对于需要亚微秒级延迟的工作负载,最好是内存数据库,这正是ElastiCache的用武之地。对于那些希望跨多个大数据集连接数据的人来说,图形数据库是不错的选择,则可以选择Amazon Neptune服务。另外,DocumentDB是文档数据库,可供使用文档和JSON的人员使用。

Jassy提到典型的多用途工具时说:“瑞士军刀通常用于最简单的任务,而不是解决任何其他问题的最佳解决方案。如果你想为正确的工作寻找合适的工具,从而为你带来差异化的性能生产力和客户体验,那么,你就需要为该工作提供合适的专门构建的数据库。”

Amazon Apache Managed Cassandra

尽管AWS提供了很多不同的数据库作为Amazon云数据库策略的一部分,但其中并不包含Apache Cassandra,这是一种流行的开源NoSQL数据库。

管理和扩展Cassandra具有挑战性,这就是Jassy说他认为需要将托管版本作为AWS服务运行的原因。 Apache Managed Cassandra于12月3日作为预览发布,预计于2020年某个时候全面推出。

Jassy指出,通过该托管服务,用户将无需管理集群,并且该平台提供个位数毫秒延迟性。他补充说,现有的Cassandra工具和驱动程序都可以使用,从而使用户更容易将本地Cassandra工作负载迁移到云中。

Redshift改进

AWS在会议上还详细介绍了一系列增强Redshift数据仓库平台的举措。Jassy谈到的新功能之一是Lake House,它不仅可以在本地Redshift节点中实现数据查询,而且还可以跨多个数据湖和S3云存储桶进行数据查询。

Jassy说:“毫无疑问的是,随着人们开始跨Redshift和S3进行查询,他们还会希望能够跨运营数据库进行查询,其中包含很多重要数据集。所以现在,我们刚刚发布了一种称为联合查询的功能,该查询现在使用户能够跨Redshift、S3和我们的关系数据库服务进行查询。”

数据仓库的存储和计算密切相关,但是经常需要独立扩展存储和计算。为此,作为亚马逊云数据策略的一部分,AWS推出其具有托管存储的新Redshift RA3实例。Jassy解释说,随着用户耗尽Redshift本地实例中可用的存储量,RA3服务会将访问频率较低的数据移至S3。

Redshift AQUA

由于数据分布在不同的资源中,因此还需要提高查询性能。Jassy推出了新的高级查询加速器(AQUA),以帮助Redshift应对这一挑战。

Jassy说,AQUA提供了一种创新的方式来进行硬件加速缓存,以提高查询性能。借助AQUA,AWS在S3之上构建了高速缓存架构,S3可并行扩展到很多不同的节点。每个节点都托管自定义设计的AWS处理器,以加快操作速度。

Jassy说:“这使你的处理速度变得如此之快,以至于你实际上可以对原始数据进行计算而不必移动它。”

我们一直都在努力坚持原创.......请不要一声不吭,就悄悄拿走。

我原创,你原创,我们的内容世界才会更加精彩!

【所有原创内容版权均属TechTarget,欢迎大家转发分享。但未经授权,严禁任何媒体(平面媒体、网络媒体、自媒体等)以及微信公众号复制、转载、摘编或以其他方式进行使用。】

微信公众号

TechTarget微信公众号二维码

TechTarget

官方微博

TechTarget中国官方微博二维码

TechTarget中国

电子邮件地址不会被公开。 必填项已用*标注

敬请读者发表评论,本站保留删除与本文无关和不雅评论的权力。

翻译

邹铮
邹铮

相关推荐

  • Java、JDBC和Postgres

    现在越来越多的企业开始部署PostgreSQL,为什么呢?当你看到这个许可开源数据库所提供的功能,你就不会对此 […]

  • 5个元数据管理最佳实践

    在数据驱动的环境中,元数据不仅仅是数据的副产品;还是综合数据治理战略的关键组成部分。企业需要适当的元数据管理, […]

  • Cockroach Labs增加矢量搜索,更新定价选项

    Cockroach Labs 近日推出矢量搜索功能,旨在使客户能够访问和操作非结构化数据,以训练生成式人工智能 […]

  • 如何使用数据治理成熟度模型

    如果没有强大的数据治理,数据就无法产生有价值的见解以及改善决策。数据治理成熟度模型可帮助企业评估当前的成就水平 […]