真正重要的东西是I/O吞吐量。运行备份和恢复的会话是你在你的SQL Server上执行的I/O最密集的活动之一。那是因为当你运行备份和(或者)恢复时,你要读取整个数据库的内容,然后把数据库的整个内容写一遍,反之亦然(对恢复而言)。它与执行查询的最大差异在于,备份和恢复时系统是在顺序地读数据库文件,而不是以随机方式访问,随机方式才是使访问效率更高的做法。
因为这么大的数据量需要被访问然后再做写操作,所以最好的方法是尽可能分离你的I/O活动。 从数据库的角度来看,在这一点上你基本上也无能为力。数据库文件已经被分成了文件组,已经保存在你系统的某个驱动器或磁盘上。如往常一样,你仍然可以修改和移动你的……
我们一直都在努力坚持原创.......请不要一声不吭,就悄悄拿走。
我原创,你原创,我们的内容世界才会更加精彩!
【所有原创内容版权均属TechTarget,欢迎大家转发分享。但未经授权,严禁任何媒体(平面媒体、网络媒体、自媒体等)以及微信公众号复制、转载、摘编或以其他方式进行使用。】
微信公众号
TechTarget
官方微博
TechTarget中国
真正重要的东西是I/O吞吐量。运行备份和恢复的会话是你在你的SQL Server上执行的I/O最密集的活动之一。那是因为当你运行备份和(或者)恢复时,你要读取整个数据库的内容,然后把数据库的整个内容写一遍,反之亦然(对恢复而言)。它与执行查询的最大差异在于,备份和恢复时系统是在顺序地读数据库文件,而不是以随机方式访问,随机方式才是使访问效率更高的做法。因为这么大的数据量需要被访问然后再做写操作,所以最好的方法是尽可能分离你的I/O活动。
从数据库的角度来看,在这一点上你基本上也无能为力。数据库文件已经被分成了文件组,已经保存在你系统的某个驱动器或磁盘上。如往常一样,你仍然可以修改和移动你的数据到其他驱动器或者磁盘,或者移动到其他文件组,但是你应该是不会经常定期做这种操作的。既然我们在讨论备份和恢复,我们会保持数据库现有的布局以便讨论另一个技巧。
大部分你必须做的事都是很明显的。你能分离的磁盘活动越多,你的备份吞吐量就会越大。例如,有几个测试是利用第三方SQL Server备份工具执行的,几个TB大小的数据库可以在一个小时内备份完成。要达到这种速度,需要有许多想法和计划融入到硬件配置中。
正如我早期提到的,优化备份过程中的读操作和写操作都很重要。在上面的例子中,供应商有充足到奢侈的数据库布局设计和磁盘子系统来保存备份文件。既然你已经让你的数据库保持正常运行了,那让我们来看看在接收端能够做些什么。
在配置你的数据库服务器时,要考虑类似这样的事情:是否你应该采用本地连接的,或者利用存储区域网络(SAN),还是网络附加存储(NAS)。此外,要考虑将采用什么类型的控制器以及使用多少SCSI,iSCSI或者光纤通道。在决定了这些因素以后,再考虑你将应用于数据库服务器的RAID级别。
理解RAID
RAID(独立磁盘冗余阵列)级别有很多种变化情况。最常见的如下:
还有更多种可行的RAID配置。其中一些比较实用,而有的则不然。一些RAID配置只存在于某些供应商的产品中。
现在,我们来讨论下上面提到的四种RAID级别。既然备份过程是一个读过程(读取你已经存在的数据库文件)和写过程(写你的备份文件)的结合,我们将看看写操作方面,看看哪种RAID级别最适合你的环境。
翻译
相关推荐
-
表征数据库性能问题的三个指标
即使数据库结构定义和SQL代码编写非常完美,应用程序性能都可能下降。如果性能问题不能得到及时纠正,那么就可能为公司带来很大的损失。
-
SAP HANA数据存储:传统硬盘的瓶颈问题
本文选自《Implementing SAP HANA》,主要探讨了基于传统磁盘的数据库性能问题,以及我们如何解决这一问题。
-
大数据查询怎样才能避免越来越慢?
随着积累的数据越来越多,内部用户和分析师会执行更多的报表和预报。这些都会导致额外的查询、分析及报表。
-
大数据时代我们是否还需要数据库设计?
良好的数据库设计是系统和应用程序设计的一部分。很多的业务需求,如数据可用性,清理处理,还有应用性能都可以利用特定的数据库设计加以解决。