一步步教您如何创建MDM总线

日期: 2011-10-26 作者:Rajesh Parameswaran翻译:曾少宁 来源:TechTarget中国 英文

遗留数据管理不支持简单或高效的数据访问。数据一旦进入遗留数据管理系统中,组织中各部门和业务单元的用户就无法查看或调用。数据迁移也广泛涉及各种旧式数据知识库和遗留系统应用程序。只有通过建立主数据管理总线(MDM Hub),才能够实现全面的数据浏览功能。

  按照以下手工步骤,可以将遗留数据迁移到一个MDM总线内:   1) 创建环境   在大多数情况中,这是一个分段实施环境;即在生产环境中并行创建的数据采集领域。对于来自各种数据源的整合数据,这种分段实施环境充当存储环境的作用,有利MDM总线活动的执行。   要从遗留源系统收集一些数据,它们表示同一个涉及客户、供应商、产品或库存目录的主信息的多重……

我们一直都在努力坚持原创.......请不要一声不吭,就悄悄拿走。

我原创,你原创,我们的内容世界才会更加精彩!

【所有原创内容版权均属TechTarget,欢迎大家转发分享。但未经授权,严禁任何媒体(平面媒体、网络媒体、自媒体等)以及微信公众号复制、转载、摘编或以其他方式进行使用。】

微信公众号

TechTarget微信公众号二维码

TechTarget

官方微博

TechTarget中国官方微博二维码

TechTarget中国

电子邮件地址不会被公开。 必填项已用*标注

敬请读者发表评论,本站保留删除与本文无关和不雅评论的权力。

遗留数据管理不支持简单或高效的数据访问。数据一旦进入遗留数据管理系统中,组织中各部门和业务单元的用户就无法查看或调用。数据迁移也广泛涉及各种旧式数据知识库和遗留系统应用程序。只有通过建立主数据管理总线(MDM Hub),才能够实现全面的数据浏览功能。

  按照以下手工步骤,可以将遗留数据迁移到一个MDM总线内:

  1) 创建环境

  在大多数情况中,这是一个分段实施环境;即在生产环境中并行创建的数据采集领域。对于来自各种数据源的整合数据,这种分段实施环境充当存储环境的作用,有利MDM总线活动的执行。

  要从遗留源系统收集一些数据,它们表示同一个涉及客户、供应商、产品或库存目录的主信息的多重副本。在分段实施领域中调整和清理遗留数据,并在将MDM数据转移到生产环境之前创建一个最终副本。使用验证框架和反复制算法实现这个操作。

  2) 创建注册表

  在MDM总线注册表中,从一个主实体(例如,‘Customer’)的不同实例提取和清理数据。用企业ID号为每一个客户创建一个中央注册表,并为各个实例的客户代码创建交叉引用。在注册表中保留经常需要的重要数据元素,如姓名、地址、电话号码等。

  定期刷新注册表,以保持更新,直至MDM总线的数据同步完成。这种方法不需要对现有应用程序进行任何修改,并且能够很快实现。

  3) 同步和协调

  在生成注册表之后保证数据同步或相容。使用一个主维护指南,为每一个主数据开发 MDM 总线应用程序,以记录和维护数据。更新分布于各个使用主数据业务应用程序的数据。

  接下来,向一个MDM小组提供中心应用程序的访问权限,禁用各个系统的主数据维护特性。如果在他们的系统中无法看到应用程序的主记录,那么他们可能会向MDM小组发送一个请求。小组将通过一个审批过程来保证它不会重复,并且相应地在总线内创建记录。这个过程能够保证主数据在各个应用程序的一致性,而中央主数据则使用唯一一个主数据视图。一旦反复制完成,MDM总线会为一般标识的记录生成键,这样整个过滤过程就是最优的。

  4) 集中数据

  要完成这一步,需要在中央主数据与访问它的“Web服务”创建之后,禁用各个业务应用程序的主维护特性和主数据表。MDM总线维护将由MDM小组完成,而各个应用程序通过Web服务调用来访问数据。这是一种长期的解决方案,由于它需要对现有业务应用程序进行修改,因此需要大量的投入和良好的实现策略支持。

  5) 分组主数据

  要使用模糊逻辑算法检查同步和清理的数据。在这个过程中,数据会分组。可能会有多个记录具有相似查询姓名域或地址域,而模糊逻辑会直接找出这些记录进行纠正。数据管理员会研究和去掉不需要的记录,纠正错误,得到一份包含相似记录的分组副本。

  6) 生成代理键

  代理键由帮助识别主数据分组的主记录集分配。因此,代理键最终会分配给从整个相似记录分组创建的记录。业务规则规定要根据业务的定义方式创建代理键。要配置一个可靠的算法来创建MDM代理键。这个算法基于键所依赖的主数据类型。

  要始终保证不产生重复的键。将键验证过程自动化,保证生成正确的代理键。将键副本保存在目标MDM总线库和引用源库,这样在报表查询这些整合的主记录时才会得到正确的记录。

  7) 创建消息传输层

  消息传输层是反馈系统,它会通知本地系统:MDM总线有新记录创建或更新。对于异步操作,可以通过专门的配置和本地系统使用消息传输软件,如Java消息服务。

  8) 分段实施环境之外

  a) 在注册表方法中,目标MDM总线会去掉分组的数据,得到最终的黄金记录(来自中心的干净且一致的数据)副本,它们会通过消息传输层复制到源系统中。将最终记录的各个副本复制回源系统,保证不存在重复的MDM。如果组织中没有MDM总线,而且企业范围较小,那么适合使用注册表方法。

  b) 第二种方法使用消息传输系统协调源和MDM总线的最终主记录副本。因为注册表能够处理的接触点有很多,所以建议中等规模的单位创建一个统一的MDM总线。另一个优点是,如果出现处理错误,那么总是有一个参考库可供查找。

  c) 集中式方法只需要在目标库中保存MDM黄金记录副本。MDM总线实际上是所有主数据的唯一参考。对于成熟的组织,建议从数据协调开始,然后再执行集中方法。这是因为在不同的环境和系统中,数据协调无法处理太多的记录项。源系统与MDM总线可能存在不一致性。数据集中方法能够保证不在任何源中创建主数据。

  9) 迁移后处理

  每当有新记录添加到MDM总线时,必须向源部门发送充足的通知,通知新主记录的到达,以及使用工作流模型进行共享的明细。

  如果一个部门希望在MDM总线实现之后,在它的源中添加新记录,那么必须通过一个工作流禁止新的主信息进入源系统,并且只允许在MDM总线创建记录。工作流中必须处理并发更新,保证所有源系统都与MDM总线创建的项目和代理键生成过程保持一致。

翻译

曾少宁
曾少宁

TechTarget中国特约技术编辑,某高校计算机科学专业教师和网络实验室负责人,曾任职某网络国际厂商,关注数据中心、开发运维、数据库及软件开发技术。有多本关于思科数据中心和虚拟化技术的译著,如《思科绿色数据中心建设与管理》和《基于IP的能源管理》等。

相关推荐