平静如水的数据库市场随着IBM新一代数据库DB2 9的正式亮相而重新掀起波澜。在XML入主数据库核心层之后,更多的人开始追问,传统的关系型数据库是否会被颠覆?
7月14日,IBM软件集团发布了其最新一代的数据库产品DB2 9,不同于其他数据库,这款产品结合了层次型数据库与关系型数据库的优点,能够以XML的格式存储数据,XML在这一款数据库产品的地位不再是从属,而是核心之一,由此引发的一系列问题犹如在平静的水面上激起了太多的浪花—关系型数据库会被颠覆吗?这是否会改变数据库市场的传统格局?数据库设计与应用开发设计之间的鸿沟是否就此得以填平?
IBM DB2 9的推出能够引发如此多的重要连锁反应,那么再讨论这款产品是否具有里程碑式意义已经不太重要,因为它本身已经在讲述一段崭新的故事。
XML掀起完美风暴
DB2 9可以提供XML数据的“原生态”存储,而无需将数据转化成行列格式,也不需要将其作为大型对象(LOB)来存储。
近年来,数据库市场实在是一个让人感觉平淡无奇的地方。
从上世纪80年代开始,关系型数据库以其扎实的理论基础得到了快速的发展,其后,各大厂商不遗余力的推动使得关系型数据库的主导地位不可动摇。到了20年后的本世纪初,以Oracle、IBM、微软三大数据库巨头为首的数据库厂商形成了三足鼎立的格局,各自封疆而治,局面变化甚微。同时,有关数据库技术创新的声音渐弱,无非是扩大关系型数据库的处理规模和效率,一直以数据库老大自居的Oracle公司的重心也转向了应用软件,数据库市场近乎一潭死水。
“每当市场特别平静和乏味时,往往会有重大突破,大家都在沉淀”,IBM大中华区软件集团市场总监左洪这样看待数据库市场的演变,“我们发现,其实目前的数据库市场充满了激动人心的一面,XML可能引发技术和应用的多个突破点。”
根据IDC对数据库市场的预测,XML数据库增长速度达到140%,远远超过其他数据库的增长比例。这预示着XML将成为今后数据库市场的主导力量。而各大数据库厂商也都为XML的成长做着准备。
2005年,Sybase与微软各自发布了新一代数据库产品,其中对XML的支持都是主要特色之一,例如,在微软SQL Server 2005中,全面集成了.Net和Web服务技术,并发展出全新的XML数据库以及相关的查询语言XQuery。Sybase ASE15数据库为XML内容提供了灵活的存储和提取方式:将XML文档存储在text或Image列中;将XML映射到新的或已有的关系表中;从关系查询中创建XML格式的结果集;可同时支持 XPath/XQuery和 SQLX两种方式,进一步扩展了XML的功能。
Oracle数据库10g在其小版本升级,即第二版中也增加了对存取XML数据的支持,还增强了对应用程序开发者的支持。
XML并不是新面孔,其最初的使命是负责系统之间的数据交易,但XML并没有马上动摇到数据库的根基。关系型数据库产品纷纷提供了对XML的支持,但并未改变关系型数据库固有的血统,他们提供的产品是一种叫做XML-Enabled的数据库,XML只是附属功能。
但是最近,XML-Enabled的数据库遇到相当大的挑战,这种挑战来自于外部环境。IBM院士王云先生谈到:“数据库面临的挑战就是数据类型的范围比20年前是不知道扩大了多少倍。信息的广度和复杂度都提高了好多。人们现在面临的是一个数量非常巨大、结构非常复杂的信息环境。”
IBM 软件部信息管理中国区技术经理刘晶炜说:“今天大家用结构型的数据表描述这个世界,这种平面型的描述遇到数据少的还能应付,但当数据以一种爆炸式增长时,很多数据的不可理解性增加了,例如,一个ERP应用系统会涉及到上万张表,这么多表本身会导致效率下降,同时它描述业务的能力也非常弱。”
IBM 声称,DB2 9 解放了被禁锢的数据。不同于一般的数据库厂商只是把数据库作为一种储藏室的观点,IBM DB2 9将对数据的存储和应用结合起来,从而将那些被封存的数据解放出来。IBM DB2 9通过将信息从封闭、分离和被动状态转变为可执行特殊业务功能的主动服务状态,帮助客户解密信息,从而取得竞争优势。
多种变数搅动市场
在开放平台的关系型数据库市场上,如果说DB2 v7还落后于竞争对手,到了v8则完成了追赶的过程,DB2 9的出现将是超越的时代。
据IDC最新分析报告显示,2005年全球关系型数据库管理软件 (RDBMS) 市场占有率增幅为 9.4%,金额达 146 亿美元,其中Oracle、IBM、微软分列前三位。
在过去的几年中,IBM DB2已经从重要的大型机产品发展成可在各种服务器平台上运行的产品,如今它已成为分布式计算的核心。今天,近50万台DB2数据库服务器运行在大型机和安装Linux系统的英特尔平台上。
刘晶炜表示:“在开放平台的关系型数据库市场上,如果说DB2 V7还落后于竞争对手,到了v8则完成了追赶的过程,DB2 9的出现将是超越的时代。”
IBM是否能实现超越,现在还不能肯定,但DB2 9的出现一定会打破现有格局,因为IBM正在大举介入一个极有潜力的领域—基于XML的层次型数据库市场。随着这一市场的成长,IBM横跨两个数据库市场的营收将改变现有格局,支持这一转变的是XML本身的高成长性。微软XML架构资深总监Jean Paoli就表示:“今后五年内75%的文件将会以XML格式创立。目前,XML格式的文件只占电子信息的一小部分。如果有数以百万计的XML文件,那么对于软件公司来说可以有很大的商机。”
在对XML前景的看法上,微软的重视程度丝毫不亚于IBM,微软已经宣布Office 12将采用XML做为默认文件格式,计划2006年下半年发布的Office 12中新增的文件格式称作微软Office开放式XML格式,将成为Office 12中各个组件的默认文件格式,Word、Excel、PowerPoint都不例外。微软表示XML格式具有相当大的扩展潜力,可以有效提高工作效率和创造力,同时用户可以很快掌握。新的格式将提供更好的文件、数据管理功能、更好的交互性、开放/免费的文件发布格式,同时也将提供广泛的兼容性。
从微软与IBM等主流厂商的重视程度来看,也就不难理解Gartner的预测—XML文件使用率将在今年翻番,在2007年将达到40%,2008年将占据支配地位。 基于这一背景下的层次型数据库市场肯定是任何一家厂商都无法拒绝的。
开源数据库产品近年来的崛起对原有数据库市场产生了不小的冲击,对此,IBM采取了支持的态度,最为典型的是IBM在今年年初发布了IBM DB2 UDB易捷版本的社区版—DB2 Express-C,从2006年1月24日起,用户可以免费下载。
左洪谈到:“开源产品是一个非常好的补充,对于一些越来越普及的技术,开源会比较好,可以提高用户的应用水平。最近IBM开放了500个专利,其中也包括了数据库技术,例如,IBM把Cloudscape(一款开源数据库)捐赠给Apache 基金组织,就是要在开源这一层面就把XML植入,让XML在更多地方得到应用。”
而在另一方面,IBM也没有放松在Linux平台上的准备,刘晶炜说:“DB2产品在不断扩充对Linux的支持,目前已经能支持大机平台是的Linux,另外,我们的工程题师去年全部通过了Linux的认证,这部分投入很大。”
除了XML之外,也有其他一些决定数据库市场演变的技术,例如,数据库的安全技术、存储压缩技术、混合分区技术等,而这些技术都在DB2 9中得到了充分的体现。
对于数据库产品的发展趋势,左洪认为:“新一代的数据库将能高效地管理更多类型的数据,由关系型数据延伸到XML数据,另一个特点是成本的降低,例如通过自动化让管理成本降低,存储压缩让存储成本降低。”
酷毙了还要用好了
当今的时代不是发明一个很酷的技术就算成功,而是让这个技术用起来,如果用不起来,或者用起来很昂贵、复杂都不行。
虽然IBM推出了混合型数据库产品,并看好XML数据库的前景,但这种想法能否形成业界的趋势仍然需要时间的考验,因为市场对新技术总有一个消化吸收的过程,而应用的力量将决定趋势的最终指向。
Oracle公司大中华区董事总经理李翰璋被记者问及对于新一代XML数据库有何看法时表示:“在数据库的市场占有率上,我们仍然领先。关于数据库的技术发展,Oracle更强调网格技术,通过网格,可以在安全、可靠等方面为用户提供更多的支持。”
Sybase中国公司的技术经理韩谊认为:“数据库的发展趋势有两个方向,一是朝处理规模更大的方向发展,并与数据仓库相融合,另一方面是向更小巧的方向发展,比如嵌入式数据库。”
产品的发展趋势最终是厂商推动与用户接受在合力方向的产物,而刘晶炜认为IBM混合型数据库的推出会引起多层面的转变。“在关系型数据库的主导地位之下,数据库的设计与应用系统的设计之间存在明显的鸿沟,应用系统的开发早就转变为面向对象的模式了,但主流数据库却依然走着老路。IBM DB2 9的出现将大大缩小这道鸿沟,”他强调:“新一代数据库的推出不仅会触动数据库市场,还影响数据建模、应用开发的方式,尤其对于集成商整个方案的设计,都会有不同层次的影响。”
在企业信息系统的整体架构中,数据库不是孤立的,与应用系统配合的默契与否相当重要,招商银行是IBM DB2 9的正式beta客户,招商银行信息中心总经理华敏谈到:“当前数据仓库中数据增量越来越多,随着我行对私、对公、信用卡等业务分析的进一步展开,数据仓库的存储扩容压力更是越来越大。DB2 9的行压缩技术可帮助我们显著地降低存储压力,实验表明,DB2 9在大表上的压缩率大部分超过70%。我行当前数据仓库中若使用DB2的压缩技术,将可望节省超过50%的存储空间。”
华敏说:“通过测试发现,DB2 9可以在XML内容上建立索引,能显著地提高查询性能;同时支持SQL查询和XQuery查询,大大降低应用中的处理难度。可以肯定地说,这将对我行应用XML技术提供有力支持。”
用友软件NC产品本部总经理谢志华告诉记者:“DB2 9能够同时支持XML与关系型数据,而且处理效率与原先相比有很大的提高,我们通常都会推荐我们的用户选择DB2数据库。”
金蝶国际软件集团有限公司副总裁、EAS事业部总经理林峰表示:“对一个ERP系统来说,快速的数据增长一直是我们头痛的问题,它带来性能下降、备份和其他维护时间增加等问题,DB2 9中行压缩技术帮助我们很好地解决了这个问题,测试表明大部分表可节省一半以上存储空间,在我们最大最频繁使用的表上甚至可压缩到原来的五分之一,而且压缩后系统的性能更好。”
产品技术的发展趋势源自应用,而IBM推出新一代数据库其实也是为了更好地满足应用的发展,这一点植根于IBM的信息管理策略,刘晶炜说:“IBM于去年制定了整体的信息管理策略—将‘信息转化为服务’,并在今年年初正式发布。”
作为底蕴悠久的信息管理厂商,IBM将信息服务作为整体策略。IBM DB2 9将所倡导的信息转化为服务的概念落到了实处,从信息资源基础架构的优化到信息资源全生命周期的管理,再到面向综合管理的主数据控制,直到最终的信息分析和获取洞察力,IBM DB2都已形成成熟的解决思路。
左洪谈到:“当今的时代不是发明一个很酷的技术就算成功,而是让这个技术用起来,如果用不起来,或者用起来很昂贵、复杂都不行,IBM不仅要让用户能用起来,而且要降低技术门槛,用得更方便。”
目前,关系型数据库提供的都是XML-Enabled,IBM 从DB2 V7.0开始就提供这种支持,到DB2 V8.2依然如此,但是DB2 9的出场完全改变了这种传统,该软件使用了IBM已注册的商标—“pureXML”冠名的解决方案来管理以XML格式存储的数据。这意味着它可以提供XML数据的“原生态”存储,而无需将数据转化成行列格式,也不需要将其作为大型对象(LOB)来存储。
IBM DB2 9同时支持纯XML文档和传统关系型数据,DB2 9中有两种数据库引擎,一种是关系型数据库的处理引擎,另一种则是纯XML处理引擎,从XML-Enabled到“纯XML+关系型数据库”引擎,这种改变如同科幻电影《暗夜传说》的故事情节那样令人意想不到—将吸血伯爵与狼人两大家族的神奇血统融为一体,IBM用XML引爆了原本平静的数据库市场,这种融合真的能产生更强大的“种族”吗?
混合动力驱动数据库
“混合动力车”的概念早就有,但研发出产品并非一朝之功,IBM为此准备了五年,而技术的积累时间则更长。
在讨论混合型数据库是否更加强大之前,我们需要了解数据库的前世今生。目前流行的关系型数据库在处理大量的非结构化数据时显得力不从心,而在涉及企业之间不同应用系统的数据交易,以及根据多个已存应用系统联合构建新的应用系统时,关系型数据库也显得效率低下,这是否说明在复杂的信息环境下,关系型数据库将被完全颠覆呢?问题的答案不是这么简单。
王云说:“XML是支援我们日益复杂的新时代应用的一个工具,但是传统的应用还是天天都在跑,比如证券交易系统。”
相对而言,关系型数据库解决了固定流程下效率的提高,对于信息简单、处理数量巨大的应用来说,关系型数据库是最好的选择。关系型数据库与层次型数据库面对了两种不同的世界,前者是企业单一信息应用的王者,后者的强项是企业内不同应用之间、不同企业之间的信息处理。
王云认为:“今天的问题是,目前有80%的信息都没有在数据库里面存储,都是以文档的形式存储,两种不同世界的信息处理都是由关系型数据库加上XML-Enabled来执行,效果显然不够理想。”
所以,关系型数据库在新信息环境中的主宰地位虽然有可能被颠覆,但它并不会消失,在支持交易系统、商业智能等领域依然不可缺少,在DB2 9中人们看到的是一款“混合动力车”。
刘晶炜谈到:“IBM首次在DB2 9版本里实现存储模式的结合,既可以用关系型存储,又可以用层次型对象的存储;既可以访问关系型数据,又可以用对象的方式访问。这并不是对传统形式的完全否定。它是一种融合,把新的模型新的选择加进来。”
IBM DB2 9之所以能将关系型数据库与层次型数据库结合起来,这也与IBM的数据库情结密不可分。
早在1966年,IBM就推出了世界第一款名为“ICS”的层次型数据库,以支持美国航空航天局(NASA)的“阿波罗登月计划”。在随后的1970年,IBM提出了关系型数据模型以及SQL标准,1983年DB2 关系型数据库正式发布,到今天IBM DB2 9(代号为Viper)的发布,IBM在数据库领域已走过了四十个春秋。
即使在今天,ICS(后更名为IMS)仍然在一些大型企业中得到使用,其层次型数据库的结构非常适合管理宏大、繁琐的信息,包括中国建设银行在内的国内用户仍然是该产品的使用者。
同时在层次型数据库和关系型数据库中积累了大量经验,这让IBM更能站一个恰当的角度理解信息管理的发展,王云说:“XML的结构就是层次型的,很容易支撑层次型数据库的发展,IBM在IMS上的积累与XML本身成熟的结合,有了今天DB2 9这样的混合型数据库。”
左洪告诉记者:“如果只发展XML数据库也很容易,难的是传承两种数据库的优势。放在一起的好处是可以降低管理成本,也可以让管理员用熟悉的语言来查询、编程。以后我们还会把行业特性的XML标准加入到数据库产品中来。‘混合动力车’的概念早就有,但研发出产品并非一朝之功,IBM为此准备了五年,而技术的积累时间则更长。”
我们一直都在努力坚持原创.......请不要一声不吭,就悄悄拿走。
我原创,你原创,我们的内容世界才会更加精彩!
【所有原创内容版权均属TechTarget,欢迎大家转发分享。但未经授权,严禁任何媒体(平面媒体、网络媒体、自媒体等)以及微信公众号复制、转载、摘编或以其他方式进行使用。】
微信公众号
TechTarget
官方微博
TechTarget中国
作者
相关推荐
-
升级到SQL Server 2016 你需要知道的那些事儿
升级到SQL Server 2016之前,应该检查硬件和软件要求和支持的升级路径,以帮助确保您的数据库部署的顺利进行。
-
SQL Server 2016关系型数据库概览
微软公司的SQL Server 2016提供了新的存储格式,实现了行级数据安全和Transact-SQL针对内存优化表的改进。
-
TT百科:SQL(结构化查询语言)
一般来说,SQL-on-Hadoop仍是一项新兴技术,但随着各个公司寻求获得拥有大数据应用程序编程SQL技能的开发和分析人员,它们正逐渐成为Hadoop部署的固定组件。
-
SQL Server 与 MySQL:关系型数据库领域的“绝代双骄”
SQL服务器和MySQL是当下市场上两个最流行的关系数据库管理系统。虽然它们并没有明显的差距,但在某些情况下,使用微软的RDBMS可能是比使用甲骨文的MySQL更好的选择。