“唯一不变的就是变化”。这句话有其符合IT应用今天的时代特色。在稳步发展了三十多年之后,面对层出不穷的数据应用变化,关系型数据库开始变得僵化而缺乏灵活应变的能力。而在业务需求快速多变的驱动之下,一场数据库技术的革命正在酝酿之中,关系型数据库所主宰的坚固世界正在逼近变革的临界点。
从历史洞悉未来
在我们展望未来之时,总是希望能够从历史中获取线索。回顾过去,诞生于上世纪60年代的数据库技术用近半个世纪的努力成就了今日的辉煌。作为一名数据库应用专家,王翔简单概括了数据库从纯文本数据库到网状数据库,继而从层次型数据库到关系型数据库,乃至目前的面向对象与关系型数据库结合的发展进程。王翔指出,网状数据库和层次型数据库很好地解决了数据集中与共享的问题,但是在数据的独立性和抽象级别上仍有很大欠缺。关系型数据库的出现很好地解决了这些问题。1970年,IBM研究员E.F.Codd提出了关系模型的概念,奠定了关系型数据库的理论基础,而SQL语言的诞生又为关系型数据库的访问、检索与维护提供了一种非常简单的方式。“简单的数据模型+易于使用的语言”终于成就了关系型数据库辉煌的商用之路。
“但是随着应用的深入,关系型数据库的使用也出现了一些问题。90年代后,数据结构复杂程度的加剧使其面临巨大的挑战。”王翔说。他指出,当时业界就曾经争论“后关系型数据库”的问题,面向对象的数据库曾经一度占据技术的主流,但是在市场中,这些数据库的表现并不是很好。其中的关键原因是,查询语言过于复杂,以及数据存储方式等问题。此后,技术演进的脚步从未停歇,面向对象和关系型数据库的结合成为近几年技术创新的热点。
谈到面向对象的数据库没有最终崛起的原因,IBM高级信息工程师王敏表示,导致其未能大规模商用的一个关键原因是,面向对象的数据不具备继承关系型数据库内容的能力。“任何事情都是这样,针对老的事物长期存在的实际状况,彻底的除旧布新是很困难的。面向对象的数据库过于果断地摒弃了老的东西,甚至把关系型数据库的一些优势也抛弃了,自己又无法尽善尽美,所有始终无法进入技术的主流。”王敏说。
王敏指出,从2000年开始,IBM开始考虑将关系型数据库和面向对象的数据库进行整合,从而形成一个更具灵活性、更能适应变化的数据库类型。同期,IBM提出,基于XML数据标准的数据库和关系型数据的融合将是未来数据库技术发展的方向。
XML的行业突破
从1998年XML标准1.0版本出台至今,XML经历了10年的发展,完成了技术理论、应用实践和商业产品的积累。随着XML应用的普及,用户对XML数据库的需求也在不断提升,XML在数据库领域也在扮演着越来越重要的角色。
王翔指出,相比中规中矩的关系模型而言,XML首先打破了第一范式对关系中每一列都是不可分割的要求。“这是一个解放,因为它不仅更符合现实世界对象的内容组织,也更符合我们分析复杂问题的思路,就是分解。”他说。另一方面,互联网应用的激增也驱动人们更多地选择使用XML数据,信息互联的需要、数据内容的丰富,让XML在自描述和基于层级结构的扩展能力方面的优势逐渐显露出来。
“XML采用层次型结构,却与早些的层次型数据库大不相同,这印证了事物螺旋式上升的法则。”王敏说。他指出,XML的层次型结构是基于统一标准的,这就意味着它很容易扩展,这种特性是它非常适合描述复杂的对象,并且能够以接近自然语言的方式进行描述。
有人说,医疗行业拥有世界上最为复杂的业务逻辑。而这块孕育复杂数据的土壤让XML找到了大显身手的舞台。作为多年从事医疗信息化建设的专家,人民医院信息中心研究员何雨生指出,随着XML数据库技术的普及,医疗行业已经明确将其作为医疗信息化,尤其是临床信息化的一个最重要的推广技术。目前,电子病历、医疗知识库的标准都遵循XML语言来定义行业标准。其中典型的例子就是,电子病历的国际标准CDA,就是完全在XML基础上进行内容的医学定义的。
“90年代起步的医疗信息化建设主要以财务管理为主,这些结构化的信息能够以二维表的形式很好地表达。而今天的医疗信息化面对的是庞杂的、包含大量非结构化的临床数据的信息管理,用二维表处理起来会非常困难。”何雨生说。他指出,为了解决电子病历中数据统一存储的问题,医疗行业定义了一种叫半结构化的数据结构,这种结构非常适合采用XML进行描述。“随着XML数据库技术的成熟,它的存储速度有了很大改观,据称其存储速度已经非常接近关系型数据库,这对于临床信息化应用意义重大。”何雨生说。
王敏表示,目前基于IBM pureXML的DB2 9已经能够做到对XML内容的高速结构化检索。而在电子病历应用中,基于树型结构的XML内容组织机制能够完整而清晰地对医疗信息的内容进行呈现。“除了医疗行业的典型性之外,政府、税务、公安等行业也表现出了XML应用的强烈需求。例如,最近提倡建设服务型政府,在IT建设方面首先涉及的就是各个职能部门系统的互连互通。而异构应用之间的数据交换正是XML所擅长的。”王敏说。
混合数据库剑指未来
伴随XML技术的普及,“混合数据库”技术在数据库领域的影响力也在持续放大。王敏指出,混合数据库的核心价值体现在,它将关系性数据库引擎和XML数据库引擎连接起来,使用户能够同时管理好两部分的数据内容。这样既保留了关系型数据库的优势,又融入了XML对复杂数据管理灵活性,做到“鱼与熊掌兼得”。“没有一种技术能够包治百病,混合数据库实际上就是一个平衡的产物。而从某种意义上说,平衡也是一种完美。”王敏说,“我们相信,混合数据库会比原来单纯的某一个数据库更有生命力,这正是混合的本意。”
从实用的角度出发,何雨生指出,目前用户已经逐渐能够清楚地划分出XML和关系型数据库的应用领域,而XML数据库与关系型数据库的结合将为医院信息的管理提供诸多便利。医疗机构在信息的访问、检索、存储等环节将拥有更多的选择,在此过程中,XML对于非结构化数据的处理能力将得到进一步释放。
“混合型数据库赋予用户一个平稳切换的机会,从以往的封闭系统,转换到一个开放的系统。”王翔说。他同时指出,在沿用关系数据库的同时,混合数据库中XML数据可以提供更多的灵活性,同时随着开发平台的升级,应用指令也更趋于XML化。另一方面,当应用体系逐步向SOA迁移,XML的技术无关性、平台无关性和标准化会获得越来越广泛的支持,会更多地应用于项目开发、数据分析、运维体系建设、信息安全等领域。结合企业现有的信息基础,混合数据库将成为下一代IT建设的一个新的核心。
“谁将主宰数据库技术的未来?”在技术快速演进的今天,我们看到,XML对数据库技术走向的影响力正在持续深化。由XML层次化和关系型数据库技术结合而成的“混合型数据库”,成为一个日渐清晰的技术创新方向。
在应对变化的业务需求方面,混合数据库自身的优势正在不断的实践中逐步得以释放。XML在医疗、公安、政府等行业的卓越表现,让其获取了在企业各个层面实现应用普及的强劲动力。与此同时,日益增加的数据复杂性、面向互联网的信息管理进一步刺激了企业用户对于混合数据库的应用需求。
我们看到,在稳步发展了三十余年后,关系型数据库主导的数据库应用世界正在酝酿一次新的变革。围绕应用创新、多元信息处理等问题,XML数据库、混合数据库将为数据库技术领域吹来新风。而展望未来数据库市场的格局,可能呈现出关系型数据库、混合数据库等多元数据库技术共同发展、繁荣的全新局面。
我们一直都在努力坚持原创.......请不要一声不吭,就悄悄拿走。
我原创,你原创,我们的内容世界才会更加精彩!
【所有原创内容版权均属TechTarget,欢迎大家转发分享。但未经授权,严禁任何媒体(平面媒体、网络媒体、自媒体等)以及微信公众号复制、转载、摘编或以其他方式进行使用。】
微信公众号
TechTarget
官方微博
TechTarget中国
作者
相关推荐
-
IBM加入Spark社区 计划培养百万数据科学家
IBM近日宣布,将大力推进Apache Spark项目,并计划培养超过100万名Spark数据科学家和数据工程师。
-
IBM成立物联网部门旨在整合未用数据
IBM准备在未来四年投资30亿美元成立一个专门的物联网(IoT)部门,并由此建立一个基于云的开放平台来帮助客户进行更好的数据整合。
-
ODP项目能否成为Hadoop助推器?
开放数据平台联盟的成立旨在为了推动Hadoop的标准化,但项目能否最终成功,或能否项向着承诺的方向发展,还有很多不确定因素。
-
“开放数据平台”联盟成立 将推动Hadoop技术发展
近日,包括IBM、Pivotal以及Hortonworks在内的一系列IT厂商成立了“开放数据平台”协会,旨在推动大数据技术发展。