数据访问和分析供应商Starburst公司的使命是,通过利用开源Presto SQL查询技术,帮助在基于Hadoop部署中存储数据的企业快速访问和查询数据。
该公司在周三表示,他们已经对Starburst Enterprise Presto平台进行了更新,该平台是基于开源Presto分布式SQL项目–最初由Facebook开发。
基于Presto的技术市场正在不断发展,这个市场还有其他供应商,其中最知名的是Ahana公司—该公司于6月30日发布其Presto服务。在Presto背后有两个不同的活跃开源开发分支:PrestoSQL和PrestoDB。根据Starburst的说法,他们的计划是在不久的将来,将这两个社区整合在Linux基金会的Presto基金会下。Starburst是基于PrestoSQL项目,而Ahana来自PrestoDB。
Presto本身正受到希望继续使用Hadoop大数据部署以及数据湖的企业的青睐。S&P Global Market Intelligence公司研究总监Matt Aslett表示,虽然很多企业正在将其长期关注点从本地Hadoop部署转移到基于对象存储的基于云的数据湖,但仍有大量现有的大数据处理部署。
Aslett说:“Presto可用于加速分布式数据处理项目—同时基于Hadoop和对象存储,无论它们驻留在本地还是在云端。因此,这提供了一个一致的计算层,可以支持对现有投资的持续使用,并提供迁移路径以增加新云平台的使用。”
Starburst Enterprise Presto增加新功能
Starburst公司联合创始人Matt Fuller表示,Presto使用户能够从各种数据源(包括Hadoop和云端)以及关系和非关系数据库系统中查询数据。Fuller指出,通过Starburst,在Hadoop上进行投资的企业仍然可以继续使用其数据–通过基于Presto的查询方法。
Fuller说:“对于这个版本,我们的产品实际变得更好,以及与Hadoop更高级的集成。”
在这次Starburst更新中,与Hadoop的特定增强集成包括支持Cloudera CDP 7.1–Hadoop数据平台。此外,Starburst增加了对MapR Hadoop平台的支持,该平台于2019年8月被惠与收购。
Presto可帮助查询云数据湖
Presto的关键用例之一是云数据湖,例如Amazon S3,它与Amazon分布式文件系统(HDFS)兼容。Starburst具有连接器模型,可用于不同数据源,包括AWS、Azure和谷歌上的数据湖。
Fuller说:“Presto是从云数据湖查询的非常好的工具。对于迁移中的企业来说,这真的非常好,因为他们现在可以通过Hadoop使用相同的工具,而在过渡到数据湖后不必使用其他工具。”
对于企业而言,使用多个云越来越常见,这是Presto发挥作用的另一个领域。Fuller指出,Presto可以在任何云上运行,并且Starburst看到Presto也可以用来帮助实现多云数据湖查询。
通过Apache Ranger改善Presto安全性
用于保护Hadoop安全的关键开源技术之一是针对数据安全的Apache Ranger框架。
尽管Ranger最初是针对Hadoop的框架,但Fuller指出,近年来,它已更广泛地部署在Hadoop生态系统之外,以保护数据。
Fuller说:“你可以将Apache Ranger视为存储数据湖和其他数据源的所有安全策略的全局位置。”
Starburst已经与Ranger进行了一些集成,并且正在通过附加功能对其进行增强。新功能之一是支持称为SQL授权的功能。通过SQL授权支持,用户可以授予和撤消对Starburst Presto中特定表的访问权限,然后该配置将反映在Apache Ranger中。
Fuller指出,Starburst将继续致力于通过Presto改善对不同类型数据源的访问,并使整个平台更易于使用。
他说:“你可以期望看到更多的连接性和更多性能用于联合访问数据。”
我们一直都在努力坚持原创.......请不要一声不吭,就悄悄拿走。
我原创,你原创,我们的内容世界才会更加精彩!
【所有原创内容版权均属TechTarget,欢迎大家转发分享。但未经授权,严禁任何媒体(平面媒体、网络媒体、自媒体等)以及微信公众号复制、转载、摘编或以其他方式进行使用。】
微信公众号

TechTarget
官方微博

TechTarget中国
翻译
相关推荐
-
最新Aerospike数据库更新优先考虑性能
最新Aerospike数据库更新优先考虑性能效率。 近日Aerospike平台8.0版正式上线,其中通过分布式 […]
-
2025年及以后的大数据趋势
全球力量(包括技术和非技术力量)正在重塑大数据格局。例如,后疫情时代的持续经济重新校准,推动企业从数据管理和分 […]
-
Oracle Exadata更新提升性能以满足AI需求
甲骨文的Exadata平台的最新版本现已普遍可用,此次更新带来性能提升,主要针对AI、分析和在线事务处理工作负 […]
-
人类监督使自动化数据治理成为可能
并非数据治理的所有方面都应该自动化,但你可以部署AI和机器学习,在仔细的人工监督下自动执行重复和耗时的合规检查 […]