解决分析型数据库难题:列式数据库

日期: 2011-01-23 作者:Rick Sherman翻译:包春霞 来源:TechTarget中国 英文

从数据管理的观点看,过去的十年想要从运营和收集信息的不同企业应用中集成数据,通常是通过建设数据仓库来实现。为了使来自不同数据源的数据一致,企业在抽取和清洗数据方面已做出了巨大的投入。通过安装BI工具,用来提供自动报表和数据分析。而在此之前,这些报表都是通过企业应用或扩展的表格,或者其他“数据展现系统”中实现的。

    想要了解更多关于列式数据库的信息?敬请关注TT数据库网站     ParAccel:列式数据库选型案例     最新列式数据库选型案例     分析列式数据库……

我们一直都在努力坚持原创.......请不要一声不吭,就悄悄拿走。

我原创,你原创,我们的内容世界才会更加精彩!

【所有原创内容版权均属TechTarget,欢迎大家转发分享。但未经授权,严禁任何媒体(平面媒体、网络媒体、自媒体等)以及微信公众号复制、转载、摘编或以其他方式进行使用。】

微信公众号

TechTarget微信公众号二维码

TechTarget

官方微博

TechTarget中国官方微博二维码

TechTarget中国

电子邮件地址不会被公开。 必填项已用*标注

敬请读者发表评论,本站保留删除与本文无关和不雅评论的权力。

从数据管理的观点看,过去的十年想要从运营和收集信息的不同企业应用中集成数据,通常是通过建设数据仓库来实现。为了使来自不同数据源的数据一致,企业在抽取和清洗数据方面已做出了巨大的投入。通过安装BI工具,用来提供自动报表和数据分析。而在此之前,这些报表都是通过企业应用或扩展的表格,或者其他“数据展现系统”中实现的。

    想要了解更多关于列式数据库的信息?敬请关注TT数据库网站

    ParAccel:列式数据库选型案例

    最新列式数据库选型案例

    分析列式数据库技术竞争格局

  许多组织在初步使用了数据仓库和BI工具后,他们又开始寻求使用更加高级的分析技术以帮助企业增加销售和提高赢利。高级的分析程序包括预测分析、统计分析、数据挖掘和数据可视化软件等工具。但是,无论使用什么技术,高级分析的基础必须是完整的、干净的和一致的数据。此外,对业务用户真实的综合分析应用来说,性能一定要快,这也是同样很关键的。

  一般地,数据仓库环境的建设是基于关系数据库之上,经过抽取、转换、加载(ETL)过程,设计多个数据集市来支持特定类型的数据分析。这种架构对于企业实施BI系统的第一阶段,在基本的报表和分析能力方面能做得很好,但如果需要做更加高级的分析还是存在障碍。

  例如,构建和调整数据集市成本很高,也很花时间。甚至在调整工作完成之后,数据集市的查询性能也很可能不能满足需要,这个事实常常使开发者不会在数据集市中放足够多的数据来支持高负荷的分析应用。此外,即便关系型数据库能承载数据仓库和BI系统的负载,他们也不是专为分析设计的,需要有很多技能来支持这种应用。

  结果是,要想使用高级分析,其关键是开发一个专为此目的而设计的分析数据库。最初的此类工具是在线分析处理(OLAP)数据库,它不同于关系型数据集市,OLAP数据库专门为业务用户如何做实际的数据分析定制了易于理解的最佳实践和功能。如今,分析数据库的相应技术有很多,如列数据库、大规模并行处理、shared-nothing架构、分区以及适用于分析负载的查询优化等。

  用列数据库技术做垂直跳跃

  目前,最常见的分析数据库的形式是列软件。 列数据库打开了基于行的关系数据库, 代替以用列垂直地存储数据。列存储的方法是自动地以所有数据的分析使用模型和基本索引为基础的。这就减少了调整关系型数据库以便在数据集市中运行特定查询所需要的劳动,也降低了数据库管理员需要做调整工作的技能。事实上,许多企业发现他们可以将多个不同的关系型数据集市集成成一个列数据。

  注意,列数据库 可以用与访问关系型数据库同样的方式被BI和高级分析工具访问,这很重要。这意味着转换到列数据库技术或者其他类型的分析数据库平台一般并不需要企业改变他们目前在用的报表、查询和分析软件。

  也有其他几种选择可以考虑用来支持分析型应用。对于在数据库内的分析, 可以将计算密集的BI功能直接移植到数据仓库中,这是建立在分析数据库之上,而不必将数据转换到单独的分析系统。数据库内分析的方式可以减少构建和数据检索的时间,最终可以有更快的分析性能。

作者

Rick Sherman
Rick Sherman

咨询公司Athena IT Solutions的创始人,具有二十多年数据仓库和决策支持系统经验。他曾于1987年建立自己的第一个数据仓库和数据中心。

相关推荐