EMC公司于今天发布了自身的Apache Hadoop发行版——Pivotal HD,同时发布的还有一个名为HAWQ的技术,通过HAWQ能够将Greenplum(2010年被EMC收购的MPP数据库厂商)分析型数据库与Hadoop分布式架构进行紧密地融合。
根据知名科技媒体GigaOM的报道,Pivotal HD对Apache Hadoop进行了全面的“改造”,同其他一些Hadoop发行版(Cloudera、Intel等)相比,其最大的优势就是能够与Greenplum数据库进行整合,而不仅仅是在Hadoop中运行SQL这么简单。TechTarget数据库网站曾经报道过,EMC寄希望于通过Greenplum品牌(Greenplum Database & HD,Greenplum Chorus)打通大数据的“任督二脉”,而本次发布的Pivotal HD和HAWQ让EMC在Hadoop领域更进一步,同时将成为EMC大数据战略中的一个重要里程碑。
EMC发布Hadoop发行版:Pivotal HD(图片来自EMC)
据EMC相关负责人介绍,Pivotal HD可以简单地看做将Greenplum数据库的POSIX文件系统替换成Hadoop分布式文件系统(HDFS),而之前DBA在Greenplum数据库中所能做的所有操作,Pivotal HD都能够提供支持。同业界主流的Hadoop发行版相比,Pivotal HD能够处理更为广泛的大数据工作负载,并在性能方面得到显著的提升,还能够帮助用户节约一半的成本。
HAWQ完全是由EMC和Greenplum团队自主研发的技术,它能够在Hadoop分布式文件系统中提供最纯粹的并行SQL处理。HAWQ也是Pivotal HD中最核心的技术,它的一些特性包括:动态Pipelining,高级数据库查询优化器,纵向扩展功能,SQL兼容功能,交互式查询,深度分析功能以及普遍的Hadoop格式支持等。
据了解,MapR也将继续保持同EMC的合作伙伴关系,在其他Hadoop领域展开合作。而针对Greenplum的Pivotal HD,EMC将完全进行自主研发,有媒体称EMC此举是要挑战Cloudera在Hadoop领域的老大位置,后者不久前也发布了类似的产品Impala(参考链接:Cloudera Impala:将Hadoop变为分析型数据库 )。
关于EMC发布Pivotal HD的更多信息,TechTarget数据库网站也将持续关注,并为您带来最及时的报道,敬请关注!
我们一直都在努力坚持原创.......请不要一声不吭,就悄悄拿走。
我原创,你原创,我们的内容世界才会更加精彩!
【所有原创内容版权均属TechTarget,欢迎大家转发分享。但未经授权,严禁任何媒体(平面媒体、网络媒体、自媒体等)以及微信公众号复制、转载、摘编或以其他方式进行使用。】
微信公众号
TechTarget
官方微博
TechTarget中国
作者
相关推荐
-
如何将大数据集成到数据仓库
在多数情况下,大数据应用的成功与其如何集成到您的企业数据仓库息息相关。本文将介绍几种方法,以便快速有效地完成这项工作。
-
内置库组件推动Spark分析应用发展
Apache Spark不只能做数据处理。它大数据平台的那些软件库支持其适合用于各种分析应用。
-
IBM加入Spark社区 计划培养百万数据科学家
IBM近日宣布,将大力推进Apache Spark项目,并计划培养超过100万名Spark数据科学家和数据工程师。
-
阿森纳卫冕足总杯 其实大数据早有预测
就在今年的足总杯决赛之前,英国的一家数据分析机构通过大数据,已经成功预测了阿森纳的最终夺冠。