NoSQL数据库供应商Aerospike发布了一系列增强功能,以实现更好的数据集成,并加快针对机器学习工作负载的数据分析。
此次Aerospike Connect更新于9月15日发布,其中包括与Apache Spark、Apache Kafka、Java Message Service和Apache Pulsar的增强集成。
该连接器使用户可以更轻松地从Aerospike数据库中获取不同的数据源。该公司于2019年3月发布Aerospike Connect初始版本,其中包含第一个版本的Spark和Kafka连接器。更新的连接器还受益于Aerospike 5.1数据库更新–该更新已于7月正式上市。
S&P Global公司分析师James Curtis表示,借助Aerospike Connect,该供应商可使用户低摩擦进入现有环境。
Curtis说:“Aerospike是更大趋势的一部分,即NoSQL供应商成为分析的推动者,而在过去,大多数NoSQL数据库主要集中于操作/事务工作负载。该公司的Spark连接器(包括其更新)是该战略的重要组成部分。”
Aerospike Connect受益于跨数据中心复制
Aerospike 5.0数据库于2019年5月首次亮相,并在7月发布5.1版。
该增强型连接器利用这个最新Aerospike数据库版本中的更新功能,并帮助改善所有连接器的实时更新和性能。
Aerospike Database 5系列的主要新增功能之一是支持跨数据中心复制(XDR)。除了XDR,Aerospike Database 5系列还引入全球分布式事务。新功能都有助于使用户能够跨多个站点和云端运行Aerospike,并为不同应用(包括财务支付)提供高性能。
Spark改进将有助于AI模型
此次Aerospike Connect更新中的Spark连接器已得到改进,可帮助加速AI模型生成的性能。
Aerospike公司首席产品官兼联合创始人Srini Srinivasan说,当开发人员运行用于生成AI模型的算法时,他们倾向于尝试提供正在内存中分析的所有数据,以便快速生成模型。
在使用新的Spark连接器之前,用户倾向于将数据从Aerospike实时数据库复制到另一个数据库(例如HBase),然后在此之上运行Spark进程。该方案的问题在于用户需要复制数据,这需要时间和计算资源。
Srinivasan说,而通过这个新的连接器,他的公司已经建立了基于数据帧的访问—从Spark到Aerospike数据库。现在,这个新的连接器使Spark的并行执行与Aerospike的并行执行保持一致。最终结果是,由于没有将数据复制到辅助系统,因此用户可以更快地生成AI模型并具有更多实时数据。
Apache Pulsar加入Aerospike Connect,下一个是Presto
虽然Aerospike以前有针对Kafka和Spark的连接器,但Pulsar连接器是全新的。Pulsar是一种事件流技术,通常被视为Apache Kafka的替代方法。
Srinivasan说:“在Pulsar领域有很多活动,我们收到用户的很多要求。我们认为,根据我们在市场上看到的投资情况,Pulsar连接器将被大规模使用。”
除Pulsar外,Aerospike现在还在开发Presto连接器,目前处于测试阶段。Presto是一种日益流行的开源SQL查询引擎,通常被视为Spark的竞争对手。
我们一直都在努力坚持原创.......请不要一声不吭,就悄悄拿走。
我原创,你原创,我们的内容世界才会更加精彩!
【所有原创内容版权均属TechTarget,欢迎大家转发分享。但未经授权,严禁任何媒体(平面媒体、网络媒体、自媒体等)以及微信公众号复制、转载、摘编或以其他方式进行使用。】
微信公众号
TechTarget
官方微博
TechTarget中国
翻译
相关推荐
-
Java、JDBC和Postgres
现在越来越多的企业开始部署PostgreSQL,为什么呢?当你看到这个许可开源数据库所提供的功能,你就不会对此 […]
-
5个元数据管理最佳实践
在数据驱动的环境中,元数据不仅仅是数据的副产品;还是综合数据治理战略的关键组成部分。企业需要适当的元数据管理, […]
-
Cockroach Labs增加矢量搜索,更新定价选项
Cockroach Labs 近日推出矢量搜索功能,旨在使客户能够访问和操作非结构化数据,以训练生成式人工智能 […]
-
如何使用数据治理成熟度模型
如果没有强大的数据治理,数据就无法产生有价值的见解以及改善决策。数据治理成熟度模型可帮助企业评估当前的成就水平 […]