2022年数据预测:数据质量和云融合

日期: 2022-01-04 作者:Sean Michael Kerner翻译:邹铮 来源:TechTarget中国 英文

在过去两年,我们都在应对疫情带来的远程工作和资源限制方面的挑战,2022年将是关键的一年,企业需要确定如何继续利用数据优化运营。

数据是企业利用商业智能和数据分析做出决策的基础。数据推动运营,数据是人工智能和机器学习的基础。

然而,在很多企业取得成功和日常运营中,尽管数据发挥着核心作用,但它并没有总是得到应有的重视,但这种情况可能会在2022年发生变化。

2022年,数据质量将成为数据管理的核心

并非所有数据都是平等的。这里可能存在数据沿袭、格式、及时性和准确性的问题,这些都影响数据有用性。这个领域有不同名称,包括数据健康、数据卫生和数据质量。

Enterprise Strategy Group公司的分析师Mike Leone表示:“在未来12到18个月内,最大的关注点(头号数据为中心的领域)且将获得最重要投资的是数据质量。”

数据质量涉及将数据的所有属性结合在一起,并确保数据可信且有用,以增强洞察力和业务成果。

数据集成供应商Talend的首席执行官Christal Belmont主要担忧的是由于潜在的数据质量问题,人们缺乏对数据的信任。

Belmont表示,企业应该将数据视为支持企业的重要资产。Talend在2021年5月进行的一项调查发现,60%的IT高管并不总是信任他们使用的数据。

Belmont 称:“将数据视为可以衡量、信任和采取行动的资产,将为企业提供健康的数据,以做出推动业务成果的关键决策。”

数据碎片化仍将是挑战

与此同时,企业云数据经理Informatica的首席产品官Jitesh Ghai预测,数据碎片化将是明年首席数据官成功实现数字化转型所面临的最大挑战。

12月9日发布的第二次年度Informatica全球CDO调查的结果显示,79%的企业使用100多个数据源,其中30%使用1,000多个数据源。数据碎片化的驱动因素之一是企业正在使用混合和多云基础设施,这一趋势将在2022年继续下去。

Ghai称:“到2022年,云加速将继续,混合云将成为常态,因为公司不再问‘为什么要迁移到云?’而是‘我们能多快迁移?’。至关重要的是,数据领导者必须投资正确的技术,使他们能够在混合和多云环境中有效地管理数据。”

数据湖表格形式的兴起

2021年出现的新兴趋势可能会在2022年演变成一场更大的运动,其中包括将数据库表格式引入云数据湖的想法。

数据编排供应商Alluxio的创始人兼首席执行官Haoyuan Li表示:“数据湖正在崛起,结构化数据正在向新格式转变。到2022年,Apache Iceberg或Apache Hudi等开源项目将取代云原生环境中更传统的Hive仓库,使Presto和Spark工作负载更高效地大规模运行。”

技术融合数据湖库和水力分析数据平台

数据湖的表格式技术有助于实现数据仓库与数据湖的进一步融合。

Ventana Research公司分析师Matt Aslett表示,他预计到2022年,数据仓库、数据湖和数据流技术将继续融合,以创建分析数据平台,使组织能够收集和分析所有类型的运营生成信息。

Aslett称:“这正在推动我们所谓的水力分析数据平台的发展,该平台将以前在数据仓库中发现的结构化数据管理和处理功能应用到存储在低成本云数据湖中的数据。”

Databricks最初创建的数据湖库的概念就是这样一种形式的水力分析数据平台。

总体而言,虽然在2022年,我们可能会看到云端数据技术的持续融合,但仅靠融合并不是应对所有数据挑战的唯一答案。随着数据源数量的激增,企业还需要定义数据质量对他们意味着什么,无论数据存在于何处。

我们一直都在努力坚持原创.......请不要一声不吭,就悄悄拿走。

我原创,你原创,我们的内容世界才会更加精彩!

【所有原创内容版权均属TechTarget,欢迎大家转发分享。但未经授权,严禁任何媒体(平面媒体、网络媒体、自媒体等)以及微信公众号复制、转载、摘编或以其他方式进行使用。】

微信公众号

TechTarget微信公众号二维码

TechTarget

官方微博

TechTarget中国官方微博二维码

TechTarget中国

电子邮件地址不会被公开。 必填项已用*标注

敬请读者发表评论,本站保留删除与本文无关和不雅评论的权力。

翻译

邹铮
邹铮

相关推荐