如何维护SQL Server索引以实现查询优化（一）

维护SQL Server索引是一个不寻常的实践。如果查询不使用索引，那么往往会有一个新的非聚簇索引被创建，它只是包含一个不同的或是相同的字段组合。但现在并没有发布一个关于为什么SQL Server会忽略这些索引的详细分析。　　让我们来看看是如何选择聚簇索引和非聚簇索引，以及为何查询优化器可能选择扫描一个表而不是非聚簇索引。

在本文中，我们将学习页拆分、碎裂索引、表分区和统计更新是如何影响索引使用的。最后，我们还将学习如何维护SQL Server索引以便查询优化器能使用这些索引，以及这些索引能够被快速查询。　　索引选择　　在索引选择中，聚簇索引是目前最容易理解的。聚簇索引基本上是唯一指向每行……

查看全文

我们一直都在努力坚持原创.......请不要一声不吭，就悄悄拿走。

我原创，你原创，我们的内容世界才会更加精彩！

【所有原创内容版权均属TechTarget，欢迎大家转发分享。但未经授权，严禁任何媒体（平面媒体、网络媒体、自媒体等）以及微信公众号复制、转载、摘编或以其他方式进行使用。】

微信公众号

TechTarget

官方微博

TechTarget中国

取消回复

维护SQL Server索引是一个不寻常的实践。如果查询不使用索引，那么往往会有一个新的非聚簇索引被创建，它只是包含一个不同的或是相同的字段组合。但现在并没有发布一个关于为什么SQL Server会忽略这些索引的详细分析。

　　让我们来看看是如何选择聚簇索引和非聚簇索引，以及为何查询优化器可能选择扫描一个表而不是非聚簇索引。在本文中，我们将学习页拆分、碎裂索引、表分区和统计更新是如何影响索引使用的。最后，我们还将学习如何维护SQL Server索引以便查询优化器能使用这些索引，以及这些索引能够被快速查询。

　　索引选择

　　在索引选择中，聚簇索引是目前最容易理解的。聚簇索引基本上是唯一指向每行记录的键。即使定义一个聚簇索引而未声明它为唯一的，SQL Server仍然通过添加一个4字节的“唯一符”到聚簇索引来使它实际上是唯一的。附加的“唯一符”将增加聚簇索引的宽度，从而导致维护时间增加和查找速度减慢。由于聚簇索引是一个标识每个记录行的键，因此它们被应用在每个查询中。

　　对于非聚簇索引来说，情况会有一点复杂。由于以下原因，查询会忽略非聚簇索引：

　　1、高碎片率——当索引有超过40%的碎片时，优化器可能会忽略该索引，因为查找一个碎裂索引比扫描一个表的开销要高。

　　2、唯一性——如果优化器确定一个非聚簇索引不是唯一的，那么它会认为扫描表会比使用非聚簇索引要效率高些。比如：如果一个查询引用一个比特字段（这里的bit=1）而且字段的统计显示75%的记录行都是1，那么优化器可能认为表扫描比非聚簇索引扫描更快获得结果。

　　3、过时的统计——如果字段的统计过期了，那么SQL Server会对聚簇索引的好处作出错误的判断。自动更新统计不仅减缓数据修改脚本，而且随着时间的推移，它还会变得与实际的记录统计不同步。有时，最好运行一下sp_updatestats或UPDATE STATISTICS。

　　4、方法使用——当查询条件带有一个方法时，SQL Server就无法使用索引。如果我们引用了一个非聚簇索引字段，但又使用一个方法，如convert(varchar, Col1_Year) = 2004，那么SQL Server也无法使用Col1_Year上的索引。

　　5、错误字段——如果一个非聚簇索引是定义在(col1, col2, col3)，而我们的查询中有一个WHERE子句，如“where col2 = 'somevalue”，那么就不会使用索引。只有当索引中的第一个字段有在WHERE子句中引用时，才会使用该索引。对于这样的WHERE子句，如“where col3 = 'someval”，将不会使用索引中，但是，如“where col1 = 'someval”或“where col1='someval and col3 = 'someval2”的WHERE子句则会使用索引。

　　索引不会在查询中使用col3，因为这个字段在索引定义中不并在col1之后。如果想要在类似的这种情况下使用col3来查找，那么最佳的方法就是定义两个单独的非聚簇索引，一个在col1，另一个在col3。

　　页拆分

　　为了存储数据，SQL Server使用有8kb数据块的页。而填充到页中的数据量则被称为填充因数，并且填充因数越高，8kb页面就越满。越高的填充因数就意味着需要越少的页，从而IO/CPU/RAM使用也就越少。因此，我们可能会想将索引设置为100%填充因数；然而，这里有个问题：一旦页面填满了，而又有在已填充的索引范围内的新值到达时，SQL Server将通过“页拆分”来为索引提供空间。本质上，SQL Server是将把填满的页拆分成两个页，这样就会有更多的存储空间了。我们可以通过设置填充因数为70%左右来解决这个问题。这样就总是有30%的可用空间预留给将输入的值。这个方法的问题是我们必须不断的“重建”索引，才可以维持30%的可用空间。

作者

: Matthew Schroeder

Matt在SQL Server和Oracle这两个领域具有12年的经验。他获得微软MCITP认证、是一名数据库开发人员，他还获得了计算机科学专业硕士学位是SQL Server数据库系统高级软件工程师，范围从2 GB到3+ TB、2k和40+ktrans/sec之间。目前他任职于IGT公司，同样是一名独立的咨询师、专攻覆盖自动化、电子商务、娱乐和银行业的SQL Server、Oracle以及.NET方面。Matt擅长OLTP/OLAP数据库管理系统以及用.NET语言写可升级的处理系统。

翻译

: 曾少宁

TechTarget中国特约技术编辑，某高校计算机科学专业教师和网络实验室负责人，曾任职某网络国际厂商，关注数据中心、开发运维、数据库及软件开发技术。有多本关于思科数据中心和虚拟化技术的译著，如《思科绿色数据中心建设与管理》和《基于IP的能源管理》等。

如何维护SQL Server索引以实现查询优化（一）

取消回复

作者

Matthew Schroeder

翻译

曾少宁

相关推荐

发现那些未被使用的数据库索引

介绍SQL Server聚集索引指示

权衡SQL Server索引对性能的影响

SQL Server 全文索引的硬伤