归档数据 这些数据库都为开发人员提供了一种方式来从操作系统中导入数据,操作数据,以确保它没有错误,然后再构建报告或者为用户的使用进行数据摘要。从性能的角度来说,把这些数据库分散到不同的磁盘驱动器上是有好处的。这可以防止I/O冲突导致的对系统间性能的限制。 从前在的数据库设计角度来说,支持数据装载的数据库可能会与操作系统匹配。
经过清洁的行数据可以在空间上或者关系设计上满足数据仓库的需求。最后,数据库的合计/摘要设计可能会结合空间或者关系设计。对于单个的报告,它还可以简化为一个表来提供数据支持。 下一部分我将会解释一下归档数据。
数据管理 基于数据库对于数据类型的设计,要时刻注……
我们一直都在努力坚持原创.......请不要一声不吭,就悄悄拿走。
我原创,你原创,我们的内容世界才会更加精彩!
【所有原创内容版权均属TechTarget,欢迎大家转发分享。但未经授权,严禁任何媒体(平面媒体、网络媒体、自媒体等)以及微信公众号复制、转载、摘编或以其他方式进行使用。】
微信公众号
TechTarget
官方微博
TechTarget中国
归档数据
这些数据库都为开发人员提供了一种方式来从操作系统中导入数据,操作数据,以确保它没有错误,然后再构建报告或者为用户的使用进行数据摘要。从性能的角度来说,把这些数据库分散到不同的磁盘驱动器上是有好处的。这可以防止I/O冲突导致的对系统间性能的限制。
从前在的数据库设计角度来说,支持数据装载的数据库可能会与操作系统匹配。经过清洁的行数据可以在空间上或者关系设计上满足数据仓库的需求。最后,数据库的合计/摘要设计可能会结合空间或者关系设计。对于单个的报告,它还可以简化为一个表来提供数据支持。
下一部分我将会解释一下归档数据。
数据管理
基于数据库对于数据类型的设计,要时刻注意数据集增长的速度。例如,考虑将数据根据日期在逻辑上划分到小一点的表上去,例如每季度或者每月一张表。如果你可以在功能上划分数据,判断它是否具有意义。例如,如果你有电话数据,那么将所有的表放到同一张表上有意义吗,还是把它们分散到手机电话数据、家庭电话数据、公司电话数据、长途、本地等更有意义?
另外一个考虑就是与你的用户协商归档数据的频率。根据数据或者行业,你可能有一些法定的限制。数据量会对性能产生最大的影响。判断你的原始数据库是否可以支持有限时间长度,然后移动老一些的数据到归档数据库中,以同样的数据库设计。如果需要研究和报告的话,这个数据仍然可以接受访问,但是它不会影响主数据库支持99%的查询。
SQL Server特性和配置
这篇文章中列出的很多项目实际上都与SQL Server无关,并且潜在地会被支持数据仓库的任何数据库平台使用到。现在我么跳到特别为SQL Server准备的内容上去,看看它如何提高一个新的或者现有的数据仓库的性能。这些项目包括:
SQL Server 2005分区
分区是一个新的SQL Server 2005特性。在分区上,可以预先判断的基础文件群的数量内,水平分割表的数之范围之外再选中一卷或者多个卷。一个常见的分区卷就是日期卷或者对标进行的逻辑分组,例如区域、时区等。这会潜移默化地为大表上的查询提高性能,这在数据仓库中是很常见的,因为文件组都可以划分在多个基础的物理磁盘上,这可以提高I/O速度。你还可以为索引创建分区,同样也会提高性能。要获得有关分区的额外信息,请参考计划分区表和索引的指导。
如果分区表对你来说是个新事物的话,那么考虑使用Database Engine Tuning Advisor作为了解你的系统和分区特性的一种方式。数据库引擎调整指导为你提供一些性能改善的建议,其中就包括分区。只要保存SQL Server Profile会话的结果,数据库引擎调整指导可以分析这些结果,并且提供潜在的分区建议。要采纳这些结果要非常谨慎,并且充分计算了与分区建议有关的性能测量参数。接下来,用现有的配置和推荐的配置来测试性能测量标准以判断优势。
SQL Server2000 本地和分散分区视图
沿着同一条线,分区特性也是本地和分散的分区视图。本地视图包括了同一个服务器上的表和分散在可以认为是一组服务器联合的多个服务器的视图。这些视图对于查询位于多个地点的静态数据非常有好处。视图作为一种可以结合存储在潜在表中的水平数据的方式提供服务。要获得有关分区视图的更多信息,请参考创建分区视图。此外,查看联合数据库服务器。
最大并发程度是一项SQL Server配置,它可以让数据库管理员良好地调整优化器如何使用CPU。当激活最大并发数的时候,在SQL Server下是默认情况,所有的CPU都可以在并行处理中使用,余下的被非并行处理使用。这个配置可以改善CPU的能力,以获得更高的并发程度。要限制查询使用并发查询计划,根据查看你环境中的代表性查询的查询计划成本来设置并发配置的Cost Threshold。要获得更多有关并行最大数的信息,请参考并发选项最大数.
SQL Server数据库维护
数据仓库需要维护,就像是其他的关系型数据库引擎应用程序。当你开始这个项目的时候,确保列个时间表为每个负载规律地打开维护窗口,每周或者每月。小量的维护,例如索引重建和更新统计数字,长期进行都可以带来性能的提高。后台表的设计可以决定维护的时间。你可以在短期的维护窗口中与一些当前的维护处理一起执行处理,或者你需要更多的时间在非常大的表和索引上执行。你可以在SQL Server综合服务:简化数据库维护中的SQL Server 2005数据库维护中找到更多有用的信息
结论
提高你的数据仓库的性能在项目的任何阶段都是可能的。你可以通过在系统的生命周期中首先收集需求,然后构建一个满足用户需求的系统来获得最大的收益。SQL Server 2005提供了额外的优势来提高当前实现的系统,所以要确保找到这些功能来帮助你的应用程序。编码快乐……
相关推荐
-
云端SQL Server高可用性最佳做法
与内部部署相比,在云端运行SQL Server可为数据库软件用户提供更多的灵活性和可扩展性,也可能更省钱。但云 […]
-
超越RDBMS:数据仓库与数据湖、数据集市
现在企业从各种来源收集的大量数据已经远远超出传统关系学数据库可处理的范畴。这引发数据仓库与数据湖的问题:何时使 […]
-
对SAP HANA数据库涉嫌知识产权盗窃的指控存疑
Enterprise Applications Consultin公司负责人Joshua Greenbaum表 […]
-
数据货币将决定企业成败
在2017年3月McKinsey公司对500多名高管的调查显示,越来越多的企业使用数据和分析来推动增长,但目前 […]