周四Ascend.io推出与Databricks集成的更新版本,旨在更好地使共同客户能够查看他们的数据以及共享数据,并使用它来进行协作。
这是 Ascend.io 和Databricks之间的第三代集成,其中增加Ascend.io与Databricks的一些新功能之间的连接。
Ascend.io的Data Automation Cloud使用户能够开发数据管道,具有自动摄取、转换、编排和可观测性功能。2022年底,这家创建于2015年的初创公司扩大了与 Databricks 竞争对手云数据供应商 Snowflake 的合作伙伴关系,为 Snowflake 客户提供免费数据摄取服务。
与此同时,Databricks是一家数据湖仓供应商,其平台将数据仓库的结构化数据管理功能与数据湖的非结构化数据管理功能相结合。
在过去的两年中,Databricks的主要推动力是开发其湖仓的行业特定版本,以简化特定垂直领域企业的数据管理和数据科学。最近,该供应商在四月份推出了其Lakehouse for Manufacturing,这是其平台的第五个此类行业特定版本。
集成
Eckerson Group分析师Kevin Petrie表示,尽管Databricks最近努力简化数据管理和数据科学,但该供应商的客户有时难以管理其数据管道中的变更。
作为数据管道专家,Ascend.io提供了解决该确切问题的工具,使 Ascend.io 和 Databricks 成为逻辑合作伙伴。
Petrie 称:“Databricks用户很难管理对管道代码和数据的变化。Ascend.io 通过控制层减轻了这种痛苦,该控制层以受控的方式发现这些变化并将其传播到数据湖中。”
Petrie继续说道,也许更新后的集成带来的最显着的改进是与Databricks Unity Catalog的本机连接。
Unity Catalog于 2022 年 6 月首次正式发布,这是一个数据目录,旨在帮助企业连接其数据、实施数据治理措施并跟踪其数据沿袭。数据目录为企业提供了一种重要方式,以整理和监督其数据,即便他们引入和管理的数据量和复杂性增加。
该集成会自动编目 Unity Catalog中以 Ascend.io 创建的所有数据集。这随后使共同客户能够搜索其湖仓中的数据集,并改善对数据的访问,这些数据可用于为数据项目提供信息。
Petrie 称:“此次公告的一个关键方面是Databricks Unity Catalog中Ascend数据资产的自动集成。数据团队确实希望全面了解其云环境中的所有数据和元数据,而这种集成肯定会有所帮助。”
同样,Ascend.io 创始人兼首席执行官Sean Knapp指出了该供应商的平台与Databricks的Unity Catalog之间连接的重要性。
他表示:“Unity Catalog是 Databricks 产品的重要组成部分,也是他们与客户战略的重要组成部分。因此,我们希望确保我们支持这一点。”
除了 Ascend.io 和Databricks的Unity Catalog之间的本机连接外,更新后的集成还包括对 Databricks的SQL计算平台的支持,以便使用 Ascend.io 的开发人员可以更轻松地利用Databricks在其湖仓的计算能力。
最后,该集成可让共同客户更好地利用 Databricks 数据转换功能,例如作业批处理和在其 Ascend.io 环境中合并数据。
通过在 Ascend.io 而不是Databricks中完成批处理和合并的工作,该集成降低了在不同云平台之间来回移动数据的相关成本,并节省了通常在环境之间发送数据所需的时间。
Petrie 称:“将Databricks转换集成到Ascend平台也是向前迈出的一步。这进一步减少了数据工程师在多个接口之间切换的需求。”
与此同时,Knapp表示,总体而言,更新后的集成旨在比以前的集成迭代更紧密地结合 Ascend.io 和数据砖的功能。
他指出,共同客户要求 Ascend.io 跟上Databricks的最新创新,使他们能够相互配合使用两家供应商的最新功能。这些客户的请求也推动着此次更新的集成。
Knapp 称:“这是更紧密的集成。以前,我们会将大量工作负载发送到Databricks中。但现在我们真正开始深入了解工作模式,以及如何利用我们的基础设施。我们在优化方面做了很多研究。”
后续步骤
除了Databricks之外,Ascend.io 还与Snowflake和Google BigQuery云数据仓库保持深度集成。
它还提供了与 Amazon Redshift 云数据仓库的集成,但该集成仅使共同用户能够来回写入数据,并且不支持下推(消除在环境之间移动数据的需要)。
Ascend.io 尚未提供与Microsoft Azure的集成。但是,根据Knapp的说法,该供应商的下一步可能是集成Azure Synapse云数据仓库和分析服务,现在是微软新Fabric的一部分,其中结合了各种数据工具。
他表示:“当我们看到我们客户构建他们的下一代架构的位置时,大多数是Snowflake或Databricks的用户。但随着时间的推移,我们将看到更多的客户使用原生Synapse。如果我看一下趋势,我认为Synapse正处于部署的上升趋势。”
关于Ascend.io与Databricks集成的下一次迭代,Knapp表示,Ascend.io的规划引擎将连接到Databricks。
在该供应商路线图上,其他项目包括投资帮助客户从旧系统迁移到更自动化的领域,以及添加人工智能和自动化功能,旨在使客户能够加快和简化数据管理。
Knapp 称:“我们的重点是帮助他们自动化更多的重复工作。”
与此同时,Petrie表示,Ascend.io专注于人工智能,使数据管理更容易且更快捷,这对该供应商来说是正确的做法。
自 2022 年 11 月OpenAI 推出 ChatGPT 以来的几个月里,众多数据管理和分析供应商已将 AI 作为主要关注点,这代表了生成 AI 和大型语言模型功能的飞跃。Petrie说,他很想知道Ascend.io整合人工智能的方法是什么。
他指出:“对于大型语言模型如何加速数据管理流程,并使数据工程师能够在数据管道设计方面更具战略性,Knapp有一个有趣的愿景。我期待看到Ascend.io在这方面的战略的发展。”
我们一直都在努力坚持原创.......请不要一声不吭,就悄悄拿走。
我原创,你原创,我们的内容世界才会更加精彩!
【所有原创内容版权均属TechTarget,欢迎大家转发分享。但未经授权,严禁任何媒体(平面媒体、网络媒体、自媒体等)以及微信公众号复制、转载、摘编或以其他方式进行使用。】
微信公众号
TechTarget
官方微博
TechTarget中国
作者
翻译
相关推荐
-
Oracle Exadata更新提升性能以满足AI需求
甲骨文的Exadata平台的最新版本现已普遍可用,此次更新带来性能提升,主要针对AI、分析和在线事务处理工作负 […]
-
人类监督使自动化数据治理成为可能
并非数据治理的所有方面都应该自动化,但你可以部署AI和机器学习,在仔细的人工监督下自动执行重复和耗时的合规检查 […]
-
MySQL与PostgreSQL:两款主流开源数据库对比
MySQL和PostgreSQL是两款最流行的开源SQL数据库,两者都可以很好地作为通用数据库。在这两者之间, […]
-
Java、JDBC和Postgres
现在越来越多的企业开始部署PostgreSQL,为什么呢?当你看到这个许可开源数据库所提供的功能,你就不会对此 […]