数据集成模型开发工具指南

日期: 2011-07-21 作者:Anthony David Giordano翻译:冯昀晖 来源:TechTarget中国 英文

本章节选自《数据集成蓝图和建模》一书,读者将了解到通用组件转换数据集成模型和关于开发数据集成模型的数据集成工具。读者还能得到关于组织是否需要逻辑数据集成模型和物理数据集成模型的答案。此外,在本章结尾处,你还可以测验你的数据集成建模知识。       接上文:通用组件转换数据集成模型   开发数据集成模型的工具   关于数据集成建模的首要问题之一就是:“你将用什么工具构建模型?”尽管可以采用像微软公司的Visio,甚至是微软公司的PowerPoint这类图表工具,但是我们仍然主张使用某一款商业数据集成包来设计和构建数据集成模型。

  像Visio……

我们一直都在努力坚持原创.......请不要一声不吭,就悄悄拿走。

我原创,你原创,我们的内容世界才会更加精彩!

【所有原创内容版权均属TechTarget,欢迎大家转发分享。但未经授权,严禁任何媒体(平面媒体、网络媒体、自媒体等)以及微信公众号复制、转载、摘编或以其他方式进行使用。】

微信公众号

TechTarget微信公众号二维码

TechTarget

官方微博

TechTarget中国官方微博二维码

TechTarget中国

电子邮件地址不会被公开。 必填项已用*标注

敬请读者发表评论,本站保留删除与本文无关和不雅评论的权力。

本章节选自《数据集成蓝图和建模》一书,读者将了解到通用组件转换数据集成模型和关于开发数据集成模型的数据集成工具。读者还能得到关于组织是否需要逻辑数据集成模型和物理数据集成模型的答案。此外,在本章结尾处,你还可以测验你的数据集成建模知识。

      接上文:通用组件转换数据集成模型

  开发数据集成模型的工具

  关于数据集成建模的首要问题之一就是:“你将用什么工具构建模型?”尽管可以采用像微软公司的Visio,甚至是微软公司的PowerPoint这类图表工具,但是我们仍然主张使用某一款商业数据集成包来设计和构建数据集成模型。

  像Visio这类绘制图表的工具需要手工创建和维护,才能确保它们与源代码和Excel电子表格保持同步。维护方面的代价常常会超过手工创建模型的益处。通过利用数据集成包,现存数据集成设计(比如:提取数据集成模型)可以被审查是否在其它数据模型中有重用的可能性,何时利用,对实际数据集成工作的维护也在模型更新时被执行。另外,通过使用像Ab Initio,IBM Data Stage或者Informatica这类数据集成包来创建数据集成模型,组织将能进一步利用到它所做的技术投资。

  图3.16提供了用Ab Initio,IBM Data Stage和Informatica构建的高层次逻辑数据集成模型示例。

图3.16 几个数据集成模型。(点击放大)

  在使用数据集成包进行数据集成建模方面的经验表明,数据集成项目和经验中心已经看到了增加提取,转换和本地代码标准化、以及质量的益处。利用数据集成包的关键益处有以下几点:

  端对端通信。利用数据集成包有利于更快速地从数据集成设计人员到数据集成开发人员之间传递需求,它们利用相同通用的数据集成元数据。在相同的包中利用相同的元数据从逻辑设计到物理设计转移,加速了传递过程,减少了传输问题和错误。例如,源到目标的数据定义和映射规则不是必须在技术之间传递,因而降低了映射错误。在从逻辑数据模型向物理数据模型转换的数据建模工具中也能发现类似益处。

  重点利用企业模型开发。把数据集成需求捕捉为逻辑数据集成模型和物理数据集成模型给组织提供了把这些数据集成模型整合到企业数据集成模型的机会,进一步使信息管理环境变得成熟,增加了整体可复用度。它还提供了重用源提取,目标数据加载和在数据集成软件包元数据引擎中的通用转换的能力。这些物理数据集成任务被保存在相同的元数据引擎中,彼此可以相互链接。他们还可以被链接到其它现存的元数据对象,比如逻辑数据模型和业务功能。

  在流程中更早地捕获导航元数据通过在数据集成软件包中存储逻辑数据集成模型和物理数据集成模型,组织拥有了对单个源或目标任务执行更彻底影响分析的能力。在流程中更早地利用转换需求对源到目标映射元数据的捕获,还增加了在单元测试和系统测试中捕捉映射错误的可能性。此外,由于元数据是被自动捕获的,所以也就更容易捕获和管理。

  基于行业的数据集成模型

  为了降低风险,加快数据仓库项目的设计工作,为数据仓库预构建的数据模型已经由IBM公司,甲骨文公司,微软公司和Teradata公司开发出来了。

  随着数据集成建模概念的成熟,预构建数据集成模型正在那些业界数据仓库数据模型的支持下进行开发。

  预构建数据集成模型把行业数据仓库模型用作目标和知名商业源系统进行提取。有了基于行业的源系统和目标,很容易利用预构建的源到目标映射开发数据集成模型。例如,在银行系统中,就有通用的源系统,比如下面这几种:

  •   商业和零售贷款制度。
  •   活期存款系统。
  •   企业资源系统(比如SAP和Oracle)。

  这些已知的应用可以被重新映射到基于行业的数据仓库数据模型。基于实际的项目经验,对基于行业数据集成模型的利用可以极大地削减数据集成项目的时间和成本。图3.17展示了基于行业数据集成模型的一个示例。

图3.17 基于行业的数据集成模型示例。(点击放大)

  在前面的例子中,行业数据集成模型提供如下内容:

  •   预构建提取来自客户、零售贷款和商业贷款系统的流程。
  •   在目标数据模型中基于已知数据质量需求预构建数据质量流程。
  •   基于目标数据模型主题领域预构建加载流程。
  •   基于已知数据集成架构、源系统以及目标数据模型从现存设计开始,提供加速数据集成应用开发的框架。

  总结

  数据建模是对数据的一种图形化设计技术。在数据集成工作中,数据集成建模是针对数据集成参考架构利用图形化流程建模技术设计数据集成流程的一种技术。

  本系列文章详细介绍了数据集成模型的类型,包括概念建模,逻辑建模和物理建模,还介绍了基于数据集成参考架构流程层细分模型的方法。本章还提供了每种不同逻辑和物理数据集成模型类型的示例。

  它涵盖了从逻辑数据集成模型到物理数据集成模型的转换,最恰当的表述可能是如何从“做什么”转向了“怎么做”。

相关推荐