接上文:第三方SQL Server ETL工具推介(上) Pentaho数据集成工具 现在许多组织都转向使用开源技术来满足他们的ETL需求。这类产品中最流行的一款是Community版的Pentaho数据集成工具,也就是众所周知的Kettle。这个产品采用元数据驱动的方法来创建复杂的Job,并在拖拽式的GUI环境中转换。结果,你不必生成客户代码,只需要访问ERP连接器,数据质量插件,有150多个封装好的映射对象支持高级数据仓库组件,如缓慢变化维和废弃维。
Kettle也提供一个可扩展的基于标准架构的统一的ETL、模型和可视化开发环境。注意,Community版本是一个自支持的产品。……
我们一直都在努力坚持原创.......请不要一声不吭,就悄悄拿走。
我原创,你原创,我们的内容世界才会更加精彩!
【所有原创内容版权均属TechTarget,欢迎大家转发分享。但未经授权,严禁任何媒体(平面媒体、网络媒体、自媒体等)以及微信公众号复制、转载、摘编或以其他方式进行使用。】
微信公众号
TechTarget
官方微博
TechTarget中国
Pentaho数据集成工具
现在许多组织都转向使用开源技术来满足他们的ETL需求。这类产品中最流行的一款是Community版的Pentaho数据集成工具,也就是众所周知的Kettle。这个产品采用元数据驱动的方法来创建复杂的Job,并在拖拽式的GUI环境中转换。结果,你不必生成客户代码,只需要访问ERP连接器,数据质量插件,有150多个封装好的映射对象支持高级数据仓库组件,如缓慢变化维和废弃维。
Kettle也提供一个可扩展的基于标准架构的统一的ETL、模型和可视化开发环境。注意,Community版本是一个自支持的产品。如果想要得到技术支持、管理升级和企业特性,必须要升级到企业版才可。
Talend Open Studio
另外一个流行的开源ETL产品是Talend Open Studio。象Kettle一样,Open Studio也是一个元数据驱动的Solution,支持数据迁移、集成和同步。Open Studio采用自顶向下的方法来进行业务建模,让业务线的干系人参与集成过程设计并监控这些过程的开发。
开发环境提供了集成过程的图形和功能视图,包括处理各种类型的任务和操作的开源组件和连接器的图形化的工具箱。用户也可以跟踪整个转换流程的数据,自动地生成技术参考文档。此外,Open Studio也对打包应用提供全面的连通性支持,如ERP和CRM等,还有数据仓库和在线事务处理(OLAP)应用。
选择第三方ETL工具
如你所看到的,除了我这里提到的以外,还有很多第三方ETL工具可选。如果你已经在组织中实施了SQL Server,花些工夫配置好SSIS并将它用起来是值得的。然后,如果你的数据管理需求超过了SSIS所能提供的ETL功能,可能就需要考虑从众多的产品中选择一个适合的了。
在选择工具之前,你需要评估要从中抽取数据的业务系统的类型,分析数据的特征。也需要决定除了在系统实施所需要的ETL需求以外你还需要什么功能。例如,你可能需要合并ERP和CRM的能力。要决定你的组织是否愿意使用开源软件。有些干系人并不满意采用开源技术。最后,你还要负责评估采用最好的ETL工具对组织的必要性。
相关推荐
-
Talend加速推进大数据“平民化”
Talend与今日宣布其大数据平台Talend Open Studio for Big Data通过了MapR的Hadoop发行版认证。
-
Talend与Hortonworks将携手发展Hadoop功能
在本周O’Reilly举办的Strata大会上,Talend与Hortonworks达成协议,将合作把Talend开源数据集成工具带入Apache Hadoop社区。
-
Gartner发布最新数据质量软件魔力象限报告
Gartner于近日发布了一年一度的数据质量软件魔力象限报告,在今年的报告中我们看到了一些新的面孔,其中包括了善于收购的巨头Oracle。
-
第三方SQL Server ETL工具推介(上)
如果你的数据大部分都存在于SQL Server数据库中,而且源数据很容易访问到,那么使用SSIS执行ETL是很好的,但是对第三方工具也要有一定的了解。