云端SQL Server高可用性最佳做法

日期: 2018-09-04 作者:Lindsay Moore翻译:邹铮 来源:TechTarget中国 英文

与内部部署相比,在云端运行SQL Server可为数据库软件用户提供更多的灵活性和可扩展性,也可能更省钱。但云系统经常会出现问题,因此必须关注高可用性和灾难恢复。

这是SIOS技术公司高级技术推广人员David Bermingham在该公司的网络研讨会表达的观点,该公司是一家SQL Server集群管理软件公司。在该研讨会中,Bermingham详细介绍了针对云用户的SQL Server高可用性最佳做法,同时还比较了微软Azure、AWS和谷歌云提供的高可用性功能。

Bermingham称,可靠的高可用性策略可为基于云的SQL Server系统创建高效的工作流程、可靠的正常运行时间和有效的灾难恢复程序。而替代方案通常不太令人愉快:数据库停机、数据丢失和其他可能导致SQL Server数据库管理员(DBA)头痛的问题。

下面是Bermingham建议的SQL Server高可用性最佳做法:

在使用云平台前仔细阅读细则

Azure的服务水平协议(SLA)承诺每月只有22分钟的数据库停机时间。但是根据Bermingham的说法,这只有当两个或多个SQL Server实例组合在可用性集(由多个虚拟机(VM)组成)中时才适用。如果你只设置了一个实例,你可能最终得到的只是“拨号音”,他表示:“它是可以ping的,也在线,但并不能保证存储可用。”

Bermingham表示,在针对SQL Server系统的SLA中,AWS承诺每月只有4.5分钟的停机时间 – 或99.99%的正常运行时间。但与Azure的SLA类似,这种正常运行时间保证仅适用于两个或多个彼此配对的数据库实例。

Bermingham称,谷歌云平台同样承诺每月只有4.5分钟的数据库停机时间。但他指出,谷歌SLA中停机时间的定义是指:所有正在运行的实例均失去外部连接或者持续磁盘访问,并且实例位于相同计算区域中的两个或多个区中。

为系统中断做好准备

虽然云计算是有用的资源,但重要的是要认识到云服务有时候可能会出现故障。由于云服务并非绝对可靠,Bermingham概述的SQL Server高可用性最佳做法还包括制定系统中断时的应急计划。

Bermingham称:“你必须确保你有冗余的互联网接入,你需要计划应用程序如何连接到SQL Server以及客户端如何连接到应用程序。”

他补充说,互联网服务意外中断是单点故障,用户需要找到应对方法或解决方案。

另一件需要考虑的事情是在云端部署SQL Server时使用多个可用区。由于可用区完全可能会故障,Bermingham建议跨区域部署数据库以应对一个区域中断的情况。

他还强调部署灾难恢复计划的重要性,因为云端数据可能会以各种方式丢失。例如火灾和洪水等自然灾害可能会破坏储存重要数据的物理服务器,但其实我们看到的大部分中断都是由于某种人为错误所导致。

利用高可用性工具

在为基于云的系统部署SQL Server高可用性最佳做法时,企业必须采取措施确保无论如何重要数据始终可用。

Bermingham指出:“如果你在云端运行SQL Server,那么你仍然在管理它,你需要确保它保持在线状态。”他提到SQL Server的高可用性功能可帮助数据库管理员在内部和云端实现高可用性,例如Always On Availability Groups和Always On Failover Cluster Instances。

Always On Availability Groups在SQL Server 2012中开始出现,该功能将一组主数据库绑定到多达八个对应的辅助数据库集,这些辅助数据库配置为在发生中断时同时进行故障转移。由于SQL Server在每个实例上运行,因此该技术可以实现非常快速的故障转移。

他补充说,页面修复可以在不使用第三方产品的情况下自动完成,并且数据库管理员能够在辅助系统上进行备份和运行报告。然而,Always On Availability Groups仅保护用户数据库,而不是用于管理和维护SQL Server的系统数据库。

Always On Failover Cluster Instances利用微软的Windows Server故障转移群集(WSFC)功能为整个SQL Server实例提供高可用性保护。故障转移群集实例跨多个WSFC节点部署,以便在出现故障时提供冗余。 因此,数据库管理员不需要跨多个实例管理可用性或维护密码和用户名。

每个云平台提供商都有提供功能来管理SQL Server系统中存储可用性,例如,Microsoft提供的Azure Managed Disks,这是该公司在2017年发布的软件程序。Azure Managed Disks通过在不同存储单元传播数据,它可减少可用性集中Azure VM的潜在存储中断的情况。

我们一直都在努力坚持原创.......请不要一声不吭,就悄悄拿走。

我原创,你原创,我们的内容世界才会更加精彩!

【所有原创内容版权均属TechTarget,欢迎大家转发分享。但未经授权,严禁任何媒体(平面媒体、网络媒体、自媒体等)以及微信公众号复制、转载、摘编或以其他方式进行使用。】

微信公众号

TechTarget微信公众号二维码

TechTarget

官方微博

TechTarget中国官方微博二维码

TechTarget中国

电子邮件地址不会被公开。 必填项已用*标注

敬请读者发表评论,本站保留删除与本文无关和不雅评论的权力。

翻译

邹铮
邹铮

相关推荐