地球自诞生到2003年,人类一共创造了5 EB(=5000 PB)的信息,而现在我们每两天就能生成5 EB数据。人们用这样一组描述这个信息爆炸的时代,但还有一点更关键的:这些数据中有80%的数据是非结构化或者半结构化的,更有一大部分是在不断流动变化的数据,这完全符合对“大数据”的定义,即数据量大(Volume)、变化速度快(Velocity)且种类繁多(Variety)。大数据时代已经到来,如果你还没有意识到,那就回想一下我们平时接触到的数据:文本文档、图片、视频还有微博。非结构化数据不断蔓延,这样一个时代我们需要对这些数据进行有效的管理和利用。
信息管理(Information Management)又一次被放到了企业IT部门的重要议事日程上,如何寻求一个针对大数据的管理分析解决方案成为目前急需解决的问题。拿一直以来非常火的云计算来说,无论基础架构的搭建和还是前端应用的交付都是以数据的可靠性、可用性以及可管理性为基础的,在信息管理层面上,我们看到真正能够提供一套完整解决方案的厂商其实寥寥无几,IBM是其中一个。对此,IBM软件集团大中华区信息管理软件总经理卢伟权在IM产品年度发布会上表示,IBM能够为用户提供一套完整的信息管理解决方案,从数据的管理、集成再到分析,并在整个过程中提供对数据的治理,从而对整个数据生命周期进行有效的管理。而IBM在接下来一年中的重点工作,就是大数据。
IBM软件集团大中华区信息管理软件总经理卢伟权先生
大数据时代的信息管理
作为传统的四大数据库软件厂商之一,IBM在数据管理方面的经验和技术储备在业内称得上是数一数二。而DBA最熟悉的关系型数据库概念也是由IBM公司的研究员E.F.Cobb最先提出的。依靠数据库领域的优势,并通过一系列的收购,IBM对信息管理软件产品线进行了最大限度的扩充,其中包括数据库基础软件:DB2、Informix、SolidDB(内存数据库);数据集成:InfoSphere;数据分析与BI:Cognos、SPSS;数据治理:Guardium、Optim;数据仓库一体机:Netezza。
此前TechTarget数据库网站曾对IBM信息管理平台进行过一个比较深入的解读,可以总结为三个方面,即数据库、数据整合以及DSCO(Data Security,Compliance and Optimization)数据治理。其中也曾经提到过大数据平台的相关信息,而从今年IBM IOD大会上所发布的产品来看,包括Hadoop MapReduce以及NoSQL在内的一系列开源技术将更多的融合到产品中来。不难看出,在提供完整的解决方案基础上,IBM IM软件部门的下一步棋将走向大数据。
卢伟权表示:“对更多的数据源进行整合,对非结构化数据进行分析是接下来工作的重中之重。明年我们将会看到IBM在大数据方面有更多创新的应用,目前IBM已经有足够的技术储备来完成这一目标。”
IBM数据库产品更新版本
其实IBM在大数据领域早已经行动了起来,包括数据库以及数据分析软件方面都推出了新的版本。卢伟权向TechTarget数据库记者介绍了IBM IOD 2011大会上发布的几款重要产品,其中包括:
- IMS 12:IMS(Information Management System)是IBM最早的事务和层次数据库管理系统,是主机上的数据库。最新的IBM IMS 12版本在交易处理方面得到了较大的提升,目前一秒钟可以处理61000条交易。
- DB2 10 For z/OS:DB2是IBM的旗舰级数据库产品,在大型系统中应用的较多。目前DB2最新的版本是针对z/OS操作系统的第十版数据库。同上一版9.7相比,成本将节约20%,并提供即插即用的特性。据了解,新的集群功能PureScale也将正式成为DB2 10的一部分,而不再作为额外的功能集。
- Informix 11.7:Informix是IBM收购来的产品,在大型金融机构有着比较广泛的应用。虽然收购之后的Informix在IBM数据库产品中显得有些低调,但是几乎每年都会有新的版本发布。卢伟权介绍,本次的Informix 11.7版本在查询速度方面提升了30倍之多,目前四大银行都有使用。
- InfoSphere Information Server 8.7:Information Server是IBM的重要数据集成平台,在之前的8.5版本中,已经积累了超过1000个客户。而Information Server 8.7可在后台筛选所有类型数据,并按照数据质量级别进行排列,有效维护数据安全,为商业决策提供可靠依据。
- Netezza:作为近期最重要的收购之一,Netezza填补了IBM在集成系统产品上的空白。其实IBM并不是没有能力去这么做,但Netezza一些专利技术的吸引力的确值17亿美元。在此之前,Netezza就同IBM保持了不错的合作关系,这也是它能够这么快速融入IBM的一个重要原因。据了解,IBM已经发布了针对Netezza的DB2 Analytics Accelerator加速器,实现了与DB2进一步集成。
- InfoSphere BigInsights v1.3 & Streams 2.0:这两款产品是IBM发布的专门针对大数据的分析软件,其中用到了Hadoop MapReduce、Jaql等开源技术,提供内存以及磁盘的分析功能。它们是IBM大数据平台中的最重要产品,也是目前业界唯一的针对大数据的分析软件产品。
点击继续阅读:解读InfoSphere大数据分析平台
我们一直都在努力坚持原创.......请不要一声不吭,就悄悄拿走。
我原创,你原创,我们的内容世界才会更加精彩!
【所有原创内容版权均属TechTarget,欢迎大家转发分享。但未经授权,严禁任何媒体(平面媒体、网络媒体、自媒体等)以及微信公众号复制、转载、摘编或以其他方式进行使用。】
微信公众号
TechTarget
官方微博
TechTarget中国
作者
相关推荐
-
探索Hadoop发行版以管理大数据
Hadoop是一种开源技术,它也是数据管理平台,现在它通常与大数据分布相关联。它的创建者在2006年设计了原始 […]
-
SQL Server 2019改进Linux、容器支持
紧随其SQL Server 2016和2017版本后,微软正在准备发布SQL Server 2019,该公司在 […]
-
Cloudera-Hortonworks合并或将减少Hadoop用户的选择
近日大数据领域两家顶级供应商达成交易协议,这可能会影响Hadoop和其他开源数据处理框架,并使大数据用户的技术 […]
-
SQL Server 2019预览版向DBMS引入Hadoop、Spark和AI
微软本周继续改进其SQL Server数据库平台,从关系数据进一步扩展到各种数据类型。 近日该公司发布SQL […]