SQL Server 2008 Integration Services新特征(二)

日期: 2008-11-26 作者:Mark Kromer翻译:April 来源:TechTarget中国 英文

SSIS 2008中一个最具吸引力的新特征就是数据剖析任务。它能让你抽取SQL Server数据并且创建该数据的特性(profile)查询模版、查找NULLs和复制数据以及其他性能。这里第一个微软创建的数据质量工具的主要缺点就是此时唯一适合的数据源就是SQL Server。   数据剖析还有很多种用法,包括从输出结果中分析统计表、确定候选健,但是在本篇中,我们着重的是商业智能情况之下数据运动。

  数据剖析工具就是对于将数据从一个SQL Server数据库映射到另一个数据库这种耗时而又枯燥的工作很有帮助。或者对于你查找主要候选人的时候、如地点、名称或在数据仓库建设层面的产品也很有益处。   在……

我们一直都在努力坚持原创.......请不要一声不吭,就悄悄拿走。

我原创,你原创,我们的内容世界才会更加精彩!

【所有原创内容版权均属TechTarget,欢迎大家转发分享。但未经授权,严禁任何媒体(平面媒体、网络媒体、自媒体等)以及微信公众号复制、转载、摘编或以其他方式进行使用。】

微信公众号

TechTarget微信公众号二维码

TechTarget

官方微博

TechTarget中国官方微博二维码

TechTarget中国

电子邮件地址不会被公开。 必填项已用*标注

敬请读者发表评论,本站保留删除与本文无关和不雅评论的权力。

SSIS 2008中一个最具吸引力的新特征就是数据剖析任务。它能让你抽取SQL Server数据并且创建该数据的特性(profile)查询模版、查找NULLs和复制数据以及其他性能。这里第一个微软创建的数据质量工具的主要缺点就是此时唯一适合的数据源就是SQL Server。

  数据剖析还有很多种用法,包括从输出结果中分析统计表、确定候选健,但是在本篇中,我们着重的是商业智能情况之下数据运动。

  数据剖析工具就是对于将数据从一个SQL Server数据库映射到另一个数据库这种耗时而又枯燥的工作很有帮助。或者对于你查找主要候选人的时候、如地点、名称或在数据仓库建设层面的产品也很有益处。

  在今天市场上一些独立的ETL产品包括类似的功能性,并且它在数据集成专家的工具箱里是必备品。很高兴看到微软SSIS中包括了数据剖析这个特性。但是我们也不要期望将来某天SSIS能成为一种独立的ETL 工具。它还会是SQL Server的一个附属工具、还是SQL Server包全面价值的一部分。

  图二中你所看到的就是对数据库中数据标本进行数据剖析的所有结果。当该任务在SSIS中完成时,你就可以打开浏览器显示结果。包中的输出结果为一份XML文件,最好的浏览及充分利用输出结果的方法就是执行浏览器。该浏览器是带有集成服务并作为客户端工具安装独立应用软件,你们能够在Visual Studio外面访问它。图二中的样本输出结果显示了对列长分类剖析。

  SQL Server 2008 Integration Services新特征

  图二:从SSIS包样本抽取结果

  接下来就是加强现有的功能。微软已经对SSIS数据流缓冲器进行了改良。附加异步数据流组件将会很方便地在SSIS进行过程中提高性能。如果你对SQL Server 2005中的SSIS熟悉并在大型、复杂的包中用过数据流组件的话,那你就毫无疑问进入了这种状态:在进行数据传输时性能就会迅速下降。可能你不得不基于着重平行决定你的传输途径。对SSIS 2008来说好消息就是年不必对这些事情太担心,因为你可以首先就排除杂乱的性能设计。

  我在以前的SSIS程序中见到的大部分的瓶颈发生时间就是在执行太多的行级操作或将组件模块化的时候,如在数据需要复制到缓冲器而不是通过同一个缓冲器再到下一次转换。在SSIS 2008中有缓冲转换,你可以用它穿过数据流保存数据。这样你就不用对SSIS引擎发出每次重新访问缓冲器的请求在多个查找中重复使用缓冲器。图三表示为缓冲器转换设屏,我将它附着在数据源上。

  创建一个新的缓冲管理器并命名

  图3:创建一个新的缓冲管理器并命名

  现在配置你想在存储在缓冲器上的每列元数据

  图4:现在配置你想在存储在缓冲器上的每列元数据

  用这项技术可以节省很多时间,并且数据流组件改良也很重要,但是你仍然要测试性能包。

  微软SQL Server 2008和SSIS 2008这两个版本的变化并不是很大。他们突破并扩展了SQL Server 2005的基础并继续将推动产品走向更完整的企业、工业强度的数据库。随着微软这么多年进一步摆脱Sybase/SQL Server 7.0,对SQL Server的理念进一步改进,数据仓储和商业智能里的那些理念也受益于随着不断增强的功能、SSIS 2008包含的数据集成简易性和性能。SSIS 2008也不是一个独立的ETL选项因为它不包括一些重要的性能,如在今天的市场中为不同种类、多余的数据源管理元数据或高速连接器。

  但是SQL Server管理员和开发者应该注意的另外一个真正的优势就是从SQL Server 20005 SSIS包迁移到SQL Server 2008包远没有从SQL Server 2000迁移到SSIS 2005那么复杂。幸好服务器和引擎的基本原理是一样的。

翻译

April
April

相关推荐