AWS为云数据增加数据质量、可扩展性服务

日期: 2022-12-09 作者:Sean Michael Kerner翻译:邹铮 来源:TechTarget中国 英文

AWS继续发展其云数据功能,他们推出一系列功能来帮助企业扩展其数据库服务并确保数据质量。

在11月29日在其re:Invent 2022 会议上AWS推出一系列更新,包括新的DataZone 数据目录和治理服务,紧接着第二天这家科技巨头发布这些功能。

AWS周三推出的新服务包括Amazon DocumentDB Elastic Clusters服务,旨在帮助文档数据库工作负载根据流量要求更轻松地扩展和缩减。

Amazon Redshift云数据仓库还获得了新的多区域高可用性配置。AWS 还为 AWS Glue 元数据发现服务带来数据质量功能。

AWS主要与Microsoft Azure和Google Cloud Platform竞争。目前这三大公共云供应商都在解决的挑战是帮助用户轻松管理数据库服务的可扩展性。

Constellation Research公司分析师Doug Henschen表示,AWS和云技术本身正在趋于成熟,因此云供应商可以进入的新领域越来越少。该科技巨头转向完善服务并填补现有服务组合中的空白是可以理解的。

Henschen 称:“其中一个差距是数据质量。因此,Glue Data Quality在推出时很受欢迎,它提供生成数据质量规则的自动化方法。”

Henschen 指出,如果企业以前在数据质量方面遇到困难,他们可能已经转向第三方合作伙伴以通过 AWS Marketplace提供数据质量服务。

提高云端的数据质量

企业现在一般使用数据湖(通常通过Amazon S3云对象存储)作为数据分析和商业智能的基础元素。

在其会议的主题演讲中,AWS数据库、分析和机器学习副总裁Swami Sivasubramanian表示,数据湖的挑战在于,如果企业不监控数据质量,湖泊可能会成为“数据沼泽”。

他表示:“客户告诉我们,跨数据湖和数据管道构建数据质量规则非常非常耗时且容易出错。”

AWS Glue 数据质量服务可以为数据集生成自动化的数据质量规则。Sivasubramanian说,这些规则可确保数据湖或数据管道中数据的准确性和新鲜度。

他说:“你可将规则应用于你的数据管道,所以质量差的数据在开始甚至不能进入你的数据湖。”

这个新服务可以连续运行;如果数据质量因任何原因而恶化,则会向企业发出警报。

AWS为云数据带来更高的可扩展性和安全性

Amazon DocumentDB是AWS 基于 JSON 的文档 NoSQL 数据库服务。DocumentDB 可以自动扩展到每个集群 64 TB 的数据,每秒处理数百万个请求。

虽然DocumentDB已经可以扩展单个数据库,但Sivasubramanian表示,用户一直在寻找更简单的方法来管理多个DocumentDB数据库集群的吞吐量。

他表示:“客户告诉我们,在多个数据库实例之间横向扩展或共享数据集非常非常复杂。”

借助 Amazon DocumentDB Elastic Clusters,AWS可帮助用户更轻松地将多个DocumentDB数据库集群扩展到PB级容量。

根据该供应商的说法,AWS服务会自动处理启用可扩展性所需的底层数据库配置,而无需用户手动配置部署。

Sivasubramanian还利用主题演讲阶段推出Amazon Redshift Multi-AZ功能,为云数据仓库服务带来多个可用区。

多可用区配置可在一个可用区中断时自动进行故障转移,从而增强分析应用程序的可用性。该服务允许用户同时在多个可用区上运行。

虽然可用性和可扩展性很重要,但安全性也很重要。为此,AWS将其GuardDuty安全服务扩展到其Amazon Aurora关系数据库。

该服务可以保护 Aurora 数据库部署免受安全威胁。还提供安全报告,以帮助用户跟踪和识别入侵的来源。

我们一直都在努力坚持原创.......请不要一声不吭,就悄悄拿走。

我原创,你原创,我们的内容世界才会更加精彩!

【所有原创内容版权均属TechTarget,欢迎大家转发分享。但未经授权,严禁任何媒体(平面媒体、网络媒体、自媒体等)以及微信公众号复制、转载、摘编或以其他方式进行使用。】

微信公众号

TechTarget微信公众号二维码

TechTarget

官方微博

TechTarget中国官方微博二维码

TechTarget中国

电子邮件地址不会被公开。 必填项已用*标注

敬请读者发表评论,本站保留删除与本文无关和不雅评论的权力。

翻译

邹铮
邹铮

相关推荐

  • Java、JDBC和Postgres

    现在越来越多的企业开始部署PostgreSQL,为什么呢?当你看到这个许可开源数据库所提供的功能,你就不会对此 […]

  • 5个元数据管理最佳实践

    在数据驱动的环境中,元数据不仅仅是数据的副产品;还是综合数据治理战略的关键组成部分。企业需要适当的元数据管理, […]

  • Cockroach Labs增加矢量搜索,更新定价选项

    Cockroach Labs 近日推出矢量搜索功能,旨在使客户能够访问和操作非结构化数据,以训练生成式人工智能 […]

  • 如何使用数据治理成熟度模型

    如果没有强大的数据治理,数据就无法产生有价值的见解以及改善决策。数据治理成熟度模型可帮助企业评估当前的成就水平 […]