数据质量工具选型案例:Informatica Vs. DataFlux

日期: 2010-10-25 作者:Mark Brunelli翻译:吴琳静 来源:TechTarget中国 英文

为找到最合适的数据质量工具,为重要的数据库整合进行设置并完成IT升级,一家芝加哥的媒体研究公司在DataFlux和Informatica两个公司之间做出了艰难的决定。

  Cision Inc.是一家经营了近80年的媒体研究和监测的公司,公司最初提供开放的专业的信息目录,链接媒体相关的消息以及记者们拍摄的新闻剪辑短片。

  根据Cision公司产品管理的高级副总裁Brett Safron介绍,该公司花费了近十年的时间更新硬件和软件,来整合来自全世界各地的数据库,并实现了无缝衔接欧洲同行和Cision欧洲范围的数据信息。

  “我们现在有一个产品叫CisionPoint,它把我们所有的服务都放到一个SaaS模式的在线程序上,”Safron 解释道:“我们现在拥有全球约6500个客户。”

  Cision现在的IT运营主要是运行在微软Windows系统下的基于因特尔处理器的HP“刀锋”服务器上。Cision的高级研发副总裁Greg Stam说,做到现在这个成果是要循序渐进的完成的,部分重要的业务依然要在原有的基于Unix环境的服务器上处理。

  “我们有的客户依然用的是遗留系统。”Stam说。

  “我们迁移客户到CisionPonit的工作还在进行中,要想成功做好迁移工作,就要让客户确切的知道要迁移哪些数据,以及切换的意义。”

  发现需要数据质量工具的需求

  两年前Stam作为公司的IT开发部门的负责人加入Cision的时候,他马上面临的是一个严峻的数据质量的挑战。

  公司已经开始整合不同的服务器,当决定集中全球的业务到北美版的CisionPoint的时候,数据库和媒体监测系统都在美国。也就是说很多基于欧洲乃至整个世界的更多的系统需要更好的整合起来。

  “CisionPoint成为了门户网站,从研究系统,监测系统等诸如此类的系统中获得数据,我们可以围绕企业的各种数据库获得多种数据展示版本。”Stam说道。

  Safron表示,CisionPoint看起来可以实现与用户的无缝衔接了,但是系统要处理全球范围的需求,需要“数百小时”来进行数据的删除,数据的清洗和数据映射。

  Safron还说道:“我们没有找到相应的替代品和技术解决方案来缓解这个问题。我们认为这些都是遗留系统导致的遗留问题,我们目前会继续采用手工解决的方式。但Stam指出会有更好的解决方法。”

  DataFlux vs. Informatica

  通过与团队和IT分析师讨论咨询,Stam肯定公司需要一个可靠的数据质量工具集。他很快就把选择范围缩小到三家软件供应商:Informatica、DataFlux 和 Pervasive Software。

  Stam说Cision的IT部门内部已经在运行Pervasive的软件,用于数据的提取,转换和加载(ETL)。但是Pervasive的使用并不是很理想,所以这家公司在数据质量工具的评选中被淘汰。

  他说:“Pervasive是一个很强大的ETL工具,在这方面它可以完成一些工作,但是有点难用。需要多一点的技术来使用这个工具”

  Informatica的功能范围给Stam留下了很深刻的印象,但是对于全球范围只有80到100个开发人员的小团队的Cision来说过于复杂了。

  Stam表示“Informatica是不同模块的群组,这个群组是非常昂贵的。我们还不能够很快利用和使用Informatica所有的功能。所以我们把关注点主要放在数据质量和能力成长类型上主数据的管理,这块也是我们比较成熟的。”

  最终,在去年的9月份,Cision公司选择了DataFlux,并决定进行数据质量工具的现场测试。

  Stam说DataFlux公司提供了合理功能范围内的模块的基础价格,包括地址校正能力和数据分析模块。数据分析模块可以让IT工作变得更容易些——特别是对于那些遗留系统工作中使用的陈旧的不熟悉的编码技术。

  “我们有一些邮政校正软件是不兼容的,所以我们用DataFlux替换了该软件。我们迅速的就能使用DataFlux的这个功能,没有遇到什么问题。”Stam解释道。

  DataFlux产品包含了这个很实用的地理编码功能,但是为了实现邮政的校正,需要额外设置一个数据集。

  关注完这个意外获得的小成果,Cision公司的IT团队开始把目光集中到数据清洗,数据迁移过程和创建Web服务,Stam相信在这个领域DataFlux的技术是有发展空间的。

  Stam认为用DataFlux创建Web服务,需要用户创建自己的自定义容器——这个过程需要大量的编程知识。

  “我需要配置一个专职的DataFlux人员负责结束对数据的操作,我们必须有专人守在它旁边负责把他关闭,”Stam说:“如果我们不必做任何处理,它就能够很好的处理Web服务,这样的话就非常的理想了。”

  总体而言,Stam和Safron都同意对于Cision公司,DataFlux数据质量工具在处理数据整合上发挥了作用,替代了大量的人工操作。展望未来,他们说过公司计划把最后剩余的遗留系统都转移到CisionPoint上,同时也会继续集成监控系统,获得更丰富的数据,并创建更多的Web服务。

  Stam说:“我认为我们只是不断在的Web服务器上清洗,注入数据。我们正试图利用这个功能,并且现在也在用数据来不断的更新页面。”

我们一直都在努力坚持原创.......请不要一声不吭,就悄悄拿走。

我原创,你原创,我们的内容世界才会更加精彩!

【所有原创内容版权均属TechTarget,欢迎大家转发分享。但未经授权,严禁任何媒体(平面媒体、网络媒体、自媒体等)以及微信公众号复制、转载、摘编或以其他方式进行使用。】

微信公众号

TechTarget微信公众号二维码

TechTarget

官方微博

TechTarget中国官方微博二维码

TechTarget中国

电子邮件地址不会被公开。 必填项已用*标注

敬请读者发表评论,本站保留删除与本文无关和不雅评论的权力。

相关推荐