数据访问和分析供应商Starburst公司的使命是,通过利用开源Presto SQL查询技术,帮助在基于Hadoop部署中存储数据的企业快速访问和查询数据。
该公司在周三表示,他们已经对Starburst Enterprise Presto平台进行了更新,该平台是基于开源Presto分布式SQL项目–最初由Facebook开发。
基于Presto的技术市场正在不断发展,这个市场还有其他供应商,其中最知名的是Ahana公司—该公司于6月30日发布其Presto服务。在Presto背后有两个不同的活跃开源开发分支:PrestoSQL和PrestoDB。根据Starburst的说法,他们的计划是在不久的将来,将这两个社区整合在Linux基金会的Presto基金会下。Starburst是基于PrestoSQL项目,而Ahana来自PrestoDB。
Presto本身正受到希望继续使用Hadoop大数据部署以及数据湖的企业的青睐。S&P Global Market Intelligence公司研究总监Matt Aslett表示,虽然很多企业正在将其长期关注点从本地Hadoop部署转移到基于对象存储的基于云的数据湖,但仍有大量现有的大数据处理部署。
Aslett说:“Presto可用于加速分布式数据处理项目—同时基于Hadoop和对象存储,无论它们驻留在本地还是在云端。因此,这提供了一个一致的计算层,可以支持对现有投资的持续使用,并提供迁移路径以增加新云平台的使用。”
Starburst Enterprise Presto增加新功能
Starburst公司联合创始人Matt Fuller表示,Presto使用户能够从各种数据源(包括Hadoop和云端)以及关系和非关系数据库系统中查询数据。Fuller指出,通过Starburst,在Hadoop上进行投资的企业仍然可以继续使用其数据–通过基于Presto的查询方法。
Fuller说:“对于这个版本,我们的产品实际变得更好,以及与Hadoop更高级的集成。”
在这次Starburst更新中,与Hadoop的特定增强集成包括支持Cloudera CDP 7.1–Hadoop数据平台。此外,Starburst增加了对MapR Hadoop平台的支持,该平台于2019年8月被惠与收购。
Presto可帮助查询云数据湖
Presto的关键用例之一是云数据湖,例如Amazon S3,它与Amazon分布式文件系统(HDFS)兼容。Starburst具有连接器模型,可用于不同数据源,包括AWS、Azure和谷歌上的数据湖。
Fuller说:“Presto是从云数据湖查询的非常好的工具。对于迁移中的企业来说,这真的非常好,因为他们现在可以通过Hadoop使用相同的工具,而在过渡到数据湖后不必使用其他工具。”
对于企业而言,使用多个云越来越常见,这是Presto发挥作用的另一个领域。Fuller指出,Presto可以在任何云上运行,并且Starburst看到Presto也可以用来帮助实现多云数据湖查询。
通过Apache Ranger改善Presto安全性
用于保护Hadoop安全的关键开源技术之一是针对数据安全的Apache Ranger框架。
尽管Ranger最初是针对Hadoop的框架,但Fuller指出,近年来,它已更广泛地部署在Hadoop生态系统之外,以保护数据。
Fuller说:“你可以将Apache Ranger视为存储数据湖和其他数据源的所有安全策略的全局位置。”
Starburst已经与Ranger进行了一些集成,并且正在通过附加功能对其进行增强。新功能之一是支持称为SQL授权的功能。通过SQL授权支持,用户可以授予和撤消对Starburst Presto中特定表的访问权限,然后该配置将反映在Apache Ranger中。
Fuller指出,Starburst将继续致力于通过Presto改善对不同类型数据源的访问,并使整个平台更易于使用。
他说:“你可以期望看到更多的连接性和更多性能用于联合访问数据。”
我们一直都在努力坚持原创.......请不要一声不吭,就悄悄拿走。
我原创,你原创,我们的内容世界才会更加精彩!
【所有原创内容版权均属TechTarget,欢迎大家转发分享。但未经授权,严禁任何媒体(平面媒体、网络媒体、自媒体等)以及微信公众号复制、转载、摘编或以其他方式进行使用。】
微信公众号
TechTarget
官方微博
TechTarget中国
翻译
相关推荐
-
MySQL与PostgreSQL:两款主流开源数据库对比
MySQL和PostgreSQL是两款最流行的开源SQL数据库,两者都可以很好地作为通用数据库。在这两者之间, […]
-
Java、JDBC和Postgres
现在越来越多的企业开始部署PostgreSQL,为什么呢?当你看到这个许可开源数据库所提供的功能,你就不会对此 […]
-
5个元数据管理最佳实践
在数据驱动的环境中,元数据不仅仅是数据的副产品;还是综合数据治理战略的关键组成部分。企业需要适当的元数据管理, […]
-
Cockroach Labs增加矢量搜索,更新定价选项
Cockroach Labs 近日推出矢量搜索功能,旨在使客户能够访问和操作非结构化数据,以训练生成式人工智能 […]