Hadoop分销商Hortonworks正在扩大与谷歌、微软和IBM的技术合作伙伴关系,以增加用户部署Hortonworks云系统的选择范围。
最值得注意的是,Hortonworks现在可支持谷歌云存储(GCS)服务,可基于存储在GCS的数据运行应用。GCS等基于云的对象存储现在很引人注目,这种存储有时候会取代Hadoop分布式文件系统(HDFS)作为云端基于Hadoop大数据应用的存储库。
对于谷歌而言,6月18日宣布的扩展合作将帮助其进一步缩小与云平台市场领导者亚马逊云计算服务和微软的差距。根据Ovum分析师Tony Baer称,对于Hortonworks而言,此举旨在使其用户可在多个云运行大数据工作负载。
Baer称,对于很多企业来说-特别是那些规模比不上最大型企业的企业,大数据分析主要在云端完成。
Baer指出:“对于刚入门的人来说,即使是通过分销商所做的努力,Hadoop仍然是复杂的平台。设置Hadoop需要很多知识,而大多数企业没有这种技能。”
当转移大数据工作负载到云端时,用户通常会在GCS、亚马逊简单存储服务(S3)和微软的Azure Blob存储等云存储工具中看到省钱的机会。与HDFS相比,这些技术可能提供较慢的性能,但Baer称这种差距会随着时间的推移而改善。目前GCS的用户包括Spotify、可靠可怜、Broad Institute等。
冷数据
Hortonworks公司首席技术官Scott Gnau称,大家对云对象存储的兴趣并不意味着Hortonworks云用户会完全放弃HDFS。
Gnau称:“我们看到客户想要利用不同选项的优势。”对存储在GCS或S3的数据运行应用让用户无需移动数据到HDFS,而且对象存储通常比存储数据在HDFS更便宜。
但是,用户可能会继续使用HDFS来支持需要高性能和复杂数据分析的Hortonworks云应用。对象存储有其优势,但也有困难之处,例如它没有HDFS的高性能。
因此,Gnau称,他看到基于云对象存储的最直接最佳用处是处理“更冷的数据”,即并非分析工作流直接部分的数据。
谷歌云平台产品管理总监Sudhir Hasbe表示,Hortonworks用户现在可通过利用GCS而不是HDFS来分离存储和计算。对于内部部署HDFS用户而言,他们可以更具成本效益的方式来使用Hortonworks云系统来处理大数据工作负载。
IBM和微软云
同时,Hortonworks还更新了与AWS、IBM和微软的云契约。在2018年Hortonworks的DataWorks峰会的第一天,除了GSC支持,该大数据平台供应商还更新了与IBM和微软的合作关系。
Hortonworks称,除了使用基于HDP的Azure HDInsight托管服务,企业现在可在微软Azure云端本地运行其Hortonworks Data Platform(HDP)软件。Hortonworks DataFlow和Hortonworks DataPlane Service现在也可支持在Azure本地部署。
与此同时,IBM Analytics总经理Rob Thomas在博客文章中称,IBM正在其云平台增加一项托管服务,称为 IBM Hosted Analytics with Hortonworks或者IHAH。这个新的服务结合HDP与IBM的Db2 Big SQL查询引擎以及Data Science Experience工作台平台,这进一步扩展了IBM与Hortonwork去年开始的合作关系,去年IBM开始放弃了自己的Hadoop发行版并同意转售HDP。
除了这些扩展云合作外,Hortonworks还详细介绍了HDP 3.0的计划,该版本将允许用户将大数据应用放到Docker容器以加快部署速度,并可更轻松地转移处理工作负载到不同服务器。HDP 3.0计划在第三季度推出,其中还增加了在基于GPU系统运行深度学习应用的功能,并支持Apache Hive 3.0,这是5月份发布的开源SQL查询引擎及数据仓库环境的更新版本。
Hive 3.0可作为分析应用的实时数据库,这些应用需要快速查询响应速度。Gnau称:“这现在真的是一个数据库,虽然Hive历来被视为在Hadoop运行的SQL编程环境。”
我们一直都在努力坚持原创.......请不要一声不吭,就悄悄拿走。
我原创,你原创,我们的内容世界才会更加精彩!
【所有原创内容版权均属TechTarget,欢迎大家转发分享。但未经授权,严禁任何媒体(平面媒体、网络媒体、自媒体等)以及微信公众号复制、转载、摘编或以其他方式进行使用。】
微信公众号
TechTarget
官方微博
TechTarget中国
翻译
相关推荐
-
Java、JDBC和Postgres
现在越来越多的企业开始部署PostgreSQL,为什么呢?当你看到这个许可开源数据库所提供的功能,你就不会对此 […]
-
5个元数据管理最佳实践
在数据驱动的环境中,元数据不仅仅是数据的副产品;还是综合数据治理战略的关键组成部分。企业需要适当的元数据管理, […]
-
Cockroach Labs增加矢量搜索,更新定价选项
Cockroach Labs 近日推出矢量搜索功能,旨在使客户能够访问和操作非结构化数据,以训练生成式人工智能 […]
-
如何使用数据治理成熟度模型
如果没有强大的数据治理,数据就无法产生有价值的见解以及改善决策。数据治理成熟度模型可帮助企业评估当前的成就水平 […]