伴随大数据话题的持续火热,诸如Apache Hadoop以及MapReduce等开源产品也在不断成长,应用开发者已不再将传统的SQL数据库“奉若神明”。
其实这并不难理解。关于大数据的讨论长期集中在SQL应对非结构化数据方面的力不从心,越来越多开发者开始将目光转向Google以及Facebook这样的大数据技术领导者。然而,一味地追求大数据浪潮有些时候却显得有些不切实际。
如果不相信就去问问Tim O’Brien,他是一名独立咨询顾问同时撰写过大数据的相关书籍。O’Brien在近期举行的O’Reilly Strata Conference上分享了关系型数据库方面的主题,他认为纵观过去多年的IT技术发展,就能够理解为何开发者的态度在一点一点发生转变。
“有不少开发者都喜欢紧跟潮流,而这些技术几乎都来自于Google或者Facebook的工程师,” O’Brien在接受TechTarget记者电话采访的时候表示:“他们最终得出的结论是‘我们绝不使用关系型数据库,因为它们不能扩展’。”
然而,那些有良好资金储备的创业公司和大数据先驱组织(如芝加哥商品交易所、纳斯达克交易所等)虽然都在紧跟Google的技术脚步,但它们依然发现,在可以预见的未来,SQL对于大多数开发项目来说仍然是最佳的选择。
O’Brien认为组织通常无法完全摆脱SQL开发,主要有三个原因。首先,SQL是一个非常有粘性的语言,主流的开发工具和平台,如Ruby on Rails,都在使用SQL。其次,SQL是目前世界上最好的查询语言。最后,SQL是标准化语言,它能够让组织更加轻松地应对来自多个厂商的数据库产品。O’Brien预测,SQL的统一能力在未来的几年中都将持续占据领先的位置。
“大数据社区现在专注在做的事,就是让人们意识到世界正在发生变化,如果你继续使用传统的关系型数据库技术,那么你就会被时代甩在身后。” O’Brien说:“我觉得这种说法是错误的。”
O’Brien建议,未来的几年中,传统SQL数据库将会想着更好更易扩展的方向发展,这无疑会让大数据与SQL技术之间的界限变得更模糊。Google的Spanner数据库就是这个方向。他说:“我觉得Spanner为许多公司指明了未来大数据的发展方向。Spanner之所以重要,是因为它是基于SQL的数据库,提供了交易处理功能而且能够垂直扩展,这是非常大的不同。”
另外一家值得注意的公司是Drawn to Scale,它们的Spire产品是一款“运行在Hadoop上,面向大型用户应用”的数据库。Spire支持SQL和MongoDB查询以及MapReduce,设计用来支撑大型网站、移动开发等应用。
“没有理由不用SQL来查询所有数据,况且这也已经发生了,人们已经开始用SQL来查询Hadoop,” O’Brien说:“即使是20年后,我也不在乎数据库是怎么部署的。我只会执行一条SQL语句,然后得到结果就好了。这就像是基于云的Linux服务器与普通的Linux服务器之间的区别,只是界面决定了体验而已。”
当开发一个大型应用或者网站的时候,我们要避免被广告宣传迷惑,只要选择合适的工具来应对各种工作就好了。尽管目前的趋势是更多偏向于大数据技术而轻视关系型数据库技术,但你一定要衡量好每种方式的利弊,这是非常重要的。分布式系统专家Felix Giguere Villegas表示:“针对日志分析,也许使用Hadoop这样的工具是最佳选择。但对于其他许多用例,SQL能更好地解决问题。特别是你还要考虑自身IT人员技能以及人才市场储备等情况。”
Giguere Villegas表示,他不抵触任何大数据技术,也希望它们能更多地与SQL结合。一些运行在Hadoop上的SQL引擎(如Cloudera Impala)都能提供垂直扩展能力。唯一的问题是,这些产品成熟度方面还远不及现在的关系型数据库。
“SQL是非常好用的工具,况且还有那么多IT从业者都掌握了SQL相关知识,” Giguere Villegas说:“当然如果在大数据平台上能够涌现更多成熟的,交互式可扩展SQL解决方案,那么对用户来说绝对是件好事。”
我们一直都在努力坚持原创.......请不要一声不吭,就悄悄拿走。
我原创,你原创,我们的内容世界才会更加精彩!
【所有原创内容版权均属TechTarget,欢迎大家转发分享。但未经授权,严禁任何媒体(平面媒体、网络媒体、自媒体等)以及微信公众号复制、转载、摘编或以其他方式进行使用。】
微信公众号
TechTarget
官方微博
TechTarget中国
翻译
相关推荐
-
探索Hadoop发行版以管理大数据
Hadoop是一种开源技术,它也是数据管理平台,现在它通常与大数据分布相关联。它的创建者在2006年设计了原始 […]
-
SQL Server 2019改进Linux、容器支持
紧随其SQL Server 2016和2017版本后,微软正在准备发布SQL Server 2019,该公司在 […]
-
Cloudera-Hortonworks合并或将减少Hadoop用户的选择
近日大数据领域两家顶级供应商达成交易协议,这可能会影响Hadoop和其他开源数据处理框架,并使大数据用户的技术 […]
-
SQL Server 2019预览版向DBMS引入Hadoop、Spark和AI
微软本周继续改进其SQL Server数据库平台,从关系数据进一步扩展到各种数据类型。 近日该公司发布SQL […]