近期人气颇高的Cloudera公司在Strata大会上发布了实时SQL查询引擎Impala,一时间引起了业界的广泛关注。Impala将同之前的的MapReduce一起成为Cloudera Hadoop的原生数据处理方式。对此,著名分析师Curt Monash也发表了他的看法,Monash认为Impala将成为Hadoop转向分析型数据库的重要工具,它与Hive之间的异同点包括:
- Impala的查询语言(HQL,相当于SQL)、元数据以及JDBC/ODBC驱动等都与Hive兼容
- Impala无需通过Hadoop MapReduce使用,这点与Hive有所不同
- 同MapReduce+Hive方式相比,Impala不会将中间结果存储到磁盘,能够显著提升性能。但对于运行时间较长的查询则存在单点故障的风险,一旦出现故障将需要重新运行查询
- 在Impala的第一版中将不包含部分Hive语法,如对UDF的支持
总体来说,虽然Impala同Hadapt相比还略显不成熟,但是它还是有很多优势:
- 它是免费的
- 它的可管理性更好
- 它针对一些环境的性能是非常好的
Cloudera公司已经开放了Impala的源代码,用户可以通过Github下载。
我们一直都在努力坚持原创.......请不要一声不吭,就悄悄拿走。
我原创,你原创,我们的内容世界才会更加精彩!
【所有原创内容版权均属TechTarget,欢迎大家转发分享。但未经授权,严禁任何媒体(平面媒体、网络媒体、自媒体等)以及微信公众号复制、转载、摘编或以其他方式进行使用。】
微信公众号
TechTarget
官方微博
TechTarget中国
作者
相关推荐
-
Cloudera-Hortonworks合并或将减少Hadoop用户的选择
近日大数据领域两家顶级供应商达成交易协议,这可能会影响Hadoop和其他开源数据处理框架,并使大数据用户的技术 […]
-
Azure数据湖分析从U-SQL中获得提升
大数据的发展已经让许多精通SQL的数据专业人员不知所措。微软的U-SQL编程语言试图让这些人回归数据查询游戏。
-
进入机器学习时代,数据库何去何从?
Vertica之前就已经能够对Hadoop数据进行访问,但Vertica8.0分析引擎则能够与Hadoop数据适当协作,如此一来就能减少数据迁移。
-
NoSQL——未来数据库家族的一员
NoSQL是对数据库由内而外的全方位改造,从而创造出一个高容量、高速度和高可变性的架构。然而,NoSQL供应商在可变性部分却正在遭遇失败。