企业级数据仓库管理理念的变化

日期: 2012-01-04 作者:Srinivasan Rengarajan翻译:沈宏 来源:TechTarget中国 英文

经过多年的发展,企业级数据仓库的概念和功能已经大大改变。现在的数据仓库设备内置有分析能力。十年前,企业级数据仓库只用于作为一个集中化的信息管理存储库。例如,当时某家银行的客户端作为一个独立的部分;而今天的客户端已被视为一个整体,具备进行整体分析的价值。

以这样的方式,使得感知的数据被认为已经改变。数据集成以新的方式进行,主数据管理促进一个数据集中源的建立,商业智能系统、分析工具和仪表盘建立在这个企业级数据仓库平台之上。   问题众多   随着非结构化数据的蔓延,待分析的数据范围也随着增长。早期的企业级数据仓库管理涉及到的主要是内部数据和通过市场调研收集的一些外部数据。

存储在企业级数据仓库中的数据……

我们一直都在努力坚持原创.......请不要一声不吭,就悄悄拿走。

我原创,你原创,我们的内容世界才会更加精彩!

【所有原创内容版权均属TechTarget,欢迎大家转发分享。但未经授权,严禁任何媒体(平面媒体、网络媒体、自媒体等)以及微信公众号复制、转载、摘编或以其他方式进行使用。】

微信公众号

TechTarget微信公众号二维码

TechTarget

官方微博

TechTarget中国官方微博二维码

TechTarget中国

电子邮件地址不会被公开。 必填项已用*标注

敬请读者发表评论,本站保留删除与本文无关和不雅评论的权力。

经过多年的发展,企业级数据仓库的概念和功能已经大大改变。现在的数据仓库设备内置有分析能力。十年前,企业级数据仓库只用于作为一个集中化的信息管理存储库。例如,当时某家银行的客户端作为一个独立的部分;而今天的客户端已被视为一个整体,具备进行整体分析的价值。以这样的方式,使得感知的数据被认为已经改变。数据集成以新的方式进行,主数据管理促进一个数据集中源的建立,商业智能系统、分析工具和仪表盘建立在这个企业级数据仓库平台之上。

  问题众多

  随着非结构化数据的蔓延,待分析的数据范围也随着增长。早期的企业级数据仓库管理涉及到的主要是内部数据和通过市场调研收集的一些外部数据。存储在企业级数据仓库中的数据来自ERP等系统的结构化数据。现在,非结构化数据也有被捕获和分析。社交媒体以及客户关系管理(CRM)应用软件也添加到包含电话数据和嵌入图片的电子邮件数据的范围。

  用户已变得很难满足。早些时候,用户利用数据仓库中的数据生成报表,并尝试从中获得战略洞察力。现在,用户期望从他们的报表中得到分析见解,这又给数据仓库管理增加了一个压力点。现在数据被要求是准确的、最新的,以满足需求产生信任。报表要在重获速度和数据稳定性之间取得一个平衡点。企业级数据仓库不得在这两方面下功夫。

  数据质量

  企业级数据仓库不再是一个产品而是一个不断调整和满足定制需求的过程。为了确保数据质量,依靠获取数据之后清洗累积数据的方法是不恰当的。相反,企业级数据仓库的数据质量管理是一个持续的过程。虽然有数据质量管理产品,但对于一个没有到位的数据质量战略帮助不大。数据质量工具并不能阻止坏数据进入系统。问题的原因可能是多种多样的:有些时候问题出在数据源捕获的时候;有些是由于数据集成过程设置了不正确的转换规则所导致的;有些问题可能出在迁移过程中。因此,整个数据仓库管理过程中必须解决这些问题。

  变更管理

  实施变更管理的三个理由是:

  • 技术变革
  • 新的业务计划
  • 新的数据类型

  例如,考虑一个并购交易。在这种情况下,数据仓库的变更管理更加复杂,而且变更也不能一蹴而就。为企业级数据仓库定义的体系结构是渐进的,是相互联系的组成部分,而不是紧耦合的。

  仓库模型要随硬件以及平台的扩展而扩展,以便吸收变化满足未来的需求,如可移动性、社交媒体和其他新兴的趋势。该体系结构必须具有足够的灵活性以应对数据的变化。

  当涉及到数据模型的改变,从整体的角度看企业级数据仓库是比较可行的。异想天开不断变化的数据模型可以搞砸一切,想象一个“垃圾进,垃圾出”情景。人们可以选择一个特定行业的模型,然后修改它以满足需求。如果出现问题,最有用的方法是:退后一步,冷静地评估一切,专注于数据仓库管理过程的目标,明确变更的原因。有可能改变模型并不是正确的摆在首位的解决方案。在这种情况下,一个企业级数据仓库的360度审计将是有帮助的。

  对用户的影响

  对于企业级数据仓库的数据,可以考虑源数据层、数据仓库层(集成层)和表示层。就用户印象而言,所有这些变化都可以在表现层看到。企业级数据仓库的数据格式就是报表系统可以理解的格式;报表系统的变化也将带来企业级数据仓库的数据变化。用户将有一个他们如何构建自己数据的指标集。基本元数据层不会改变,但其中的格式和系统数据会改变。用户不会自己去运行复杂的算法老生成报表,而是通过几个参数去运行报表。因此,数据仓库的改变对他们影响很小。

  与数据仓库的管理和变更相比,避免超越自身是最大的挑战。一个公司采用何种技术,只是因为它是新的或提供迷人的功能则是一个大错误。基于云的企业级数据仓库、集成Hadoop、购买数据仓库设备以及其他这类行动都需要在冒险尝试之前进行详细地分析;他们不能仅仅因为该技术是流行的“东西”,就采用它。

翻译

沈宏
沈宏

相关推荐