Inmon vs Kimball:DW 2.0以及非结构化数据的争论

日期: 2011-09-15 作者:Mark Brunelli翻译:孙瑞 来源:TechTarget中国 英文

Bill Inmon,这个名字对DBA来说应该并不陌生,他就是“数据仓库之父”,最早提出DW概念的人。在他之前,另一位响当当的任务Ralph Kimball已经提出了数据仓库的架构,于是在过去的20几年中,Inmon和Kimball成为了数据仓库以及商业智能领域最具影响力的革新者。   近日,TechTarget网站对Bill Inmon进行了专访,在这次采访中,Inmon向我们对比了Inmon和Kimball两种架构,以及关于文本数据仓库的发展趋势。 我最近读到一篇文章,其中说Ralph Kimball方法经过了多年的进化,现在已经跟Bill Inmon的方法非常相似了。

您如何看待这种说法?……

我们一直都在努力坚持原创.......请不要一声不吭,就悄悄拿走。

我原创,你原创,我们的内容世界才会更加精彩!

【所有原创内容版权均属TechTarget,欢迎大家转发分享。但未经授权,严禁任何媒体(平面媒体、网络媒体、自媒体等)以及微信公众号复制、转载、摘编或以其他方式进行使用。】

微信公众号

TechTarget微信公众号二维码

TechTarget

官方微博

TechTarget中国官方微博二维码

TechTarget中国

电子邮件地址不会被公开。 必填项已用*标注

敬请读者发表评论,本站保留删除与本文无关和不雅评论的权力。

Bill Inmon,这个名字对DBA来说应该并不陌生,他就是“数据仓库之父”,最早提出DW概念的人。在他之前,另一位响当当的任务Ralph Kimball已经提出了数据仓库的架构,于是在过去的20几年中,Inmon和Kimball成为了数据仓库以及商业智能领域最具影响力的革新者。

  近日,TechTarget网站对Bill Inmon进行了专访,在这次采访中,Inmon向我们对比了Inmon和Kimball两种架构,以及关于文本数据仓库的发展趋势。

我最近读到一篇文章,其中说Ralph Kimball方法经过了多年的进化,现在已经跟Bill Inmon的方法非常相似了。您如何看待这种说法?

  Bill Inmon:当然,当Kimball在上世纪90年代初的时候就已经开始了,他谈到去构建数据集市。而整个Kimball架构关键的核心就是构建数据集市。在他的书中写道,一个数据仓库是一系列数据集市的集合。Kimball现在也开始讨论企业数据仓库和集成数据了,在几年前,这样的话题他们是绝对不会谈论的,他们的态度发生了180度的转变。

  那您能不能向我们解释一下,现在Inmon和Kimball两种方式的最根本的不同点?

  Inmon:现在Kimball方式是构建企业数据仓库,作为一个集成的数据仓库,其实1990年我就已经开始这种方法的研究了。他们整整落后了我们20年。我现在还在继续加深理解这种架构,而现在最新的进展就是添加了文本非结构化数据。我们现在重点关注如何将文本数据添加到一个数据仓库中去。我预测未来的10年里,Kimball也会意识到这样的趋势,但他们永远会慢我们一步。Kimball的方法应该说是更加封闭,我们则希望更加开放。

  为什么说Kimball是封闭的呢?

  Inmon:其实应该说是思想封闭,不够开放。我们知道,微软公司一直在使用Kimball的方法,这也说得通,因为他们一直以来的方式就是构建数据集市。去年我参加了微软举行的一次活动,在会上我了解到微软现在也要开始做真正的数据仓库业务了,他们还是把十几年前的技术拿出来,宣传说能够顺应时代的潮流。我觉得微软作为一个公司是很成功的,我也喜欢微软公司,但是他们的技术人员思想都是比较封闭的。我一直在跟他们说,文本数据是非常重要的,也是未来的一个发展趋势。但是他们却认为这一点都不重要。时间能证明一切。

  你一直说,同Kimball方法相比,Inmon一直是一个更难销售的方案,为什么这么说?

  Inmon:在十年以前,卖数据集市毫无疑问是比卖企业数据仓库更容易的。我也是第一个提出这种说法的人,Kimball方式应该是比Inmon有更快的投资回报率,可以说,Inmon对于企业来说是一个长期的投入,用户应该把眼光也看的更长远一些。

  请您向我们介绍一下数据仓库2.0有哪些最新进展?比如文本数据非结构化数据

  Inmon:如果你数据Inmon架构,那就应该知道它是以数据仓库起家,然后逐渐演变到所谓的企业信息工厂(Corporate Information Factory,CIF),现在叫做DW 2.0。作为数据仓库2.0的重要组成部分,我们需要将文本信息考虑进来。作为一个咨询师,有很长一段时间我的电话一直像个不停,越来越多的客户已经发现他们的企业内部出现了大量文本数据,而且这部分数据非常重要。

  那么文本数据在现实生活中怎样影响了IT的发展?

  Inmon:举一个简单的例子——公司合同。每个公司都有大量的合同要签署,如果你问一个老板,是否对这些合同进行了良好的管理,那得到的答案一定是yes,因为他们的职责就是管理好这些合同。现在的问题是,在一些大型的企业中,合同有成千上万份,不要说良好的管理,就是光找出来就要花费大把时间。现在我们的DW 2.0能做什么呢?我们把它称为文本ETL,把合同放到关系数据库中,然后跑一个查询。SQL查询的运行速度有多快,找到这些文件的速度就有多快,这只是许多应用中的一种。

  那再介绍更多的例子吧?

  Inmon:那比如说电子邮件。每个公司都会用到Email,而在每一封邮件中,都包含了非常重要的信息。但是如何将电子邮件同企业决策支持联系起来?现在相信没有哪家公司把电子邮件看的那么重要,但事实上它是非常重要的信息来源。同上面说过的合同一样,企业中有着大量的文本信息,这部分信息一直没有被企业重视并充分利用起来。其实,把文本数据放到数据库中去,一个新世界的门就会向你打开。而我认为这个世界将会是非常有趣的。

翻译

孙瑞
孙瑞

相关推荐