SQL Server 查询处理中的各个阶段

日期: 2009-07-29 作者:侯垒 来源:TechTarget中国 英文

  SQL 不同于与其他编程语言的最明显特征是处理代码的顺序。在大数编程语言中,代码按编码顺序被处理,但是在SQL语言中,第一个被处理的子句是FROM子句,尽管SELECT语句第一个出现,但是几乎总是最后被处理。

  每个步骤都会产生一个虚拟表,该虚拟表被用作下一个步骤的输入。这些虚拟表对调用者(客户端应用程序或者外部查询)不可用。只是最后一步生成的表才会返回给调用者。如果没有在查询中指定某一子句,将跳过相应的步骤。下面是对应用于SQL server 2000和SQL Server 2005的各个逻辑步骤的简单描述。

  逻辑查询处理阶段简介

  FROM:对FROM子句中的前两个表执行笛卡尔积(Cartesian product)(交叉联接),生成虚拟表VT1

  ON:对VT1应用ON筛选器。只有那些使为真的行才被插入VT2。

  OUTER(JOIN):如果指定了OUTER JOIN(相对于CROSS JOIN 或(INNER JOIN),保留表(preserved table:左外部联接把左表标记为保留表,右外部联接把右表标记为保留表,完全外部联接把两个表都标记为保留表)中未找到匹配的行将作为外部行添加到VT2,生成VT3.如果FROM子句包含两个以上的表,则对上一个联接生成的结果表和下一个表重复执行步骤1到步骤3,直到处理完所有的表为止。

  WHERE:对VT3应用WHERE筛选器。只有使为true的行才被插入VT4.

  GROUP BY:按GROUP BY子句中的列列表对VT4中的行分组,生成VT5.

  CUBE|ROLLUP:把超组(Suppergroups)插入VT5,生成VT6.

  HAVING:对VT6应用HAVING筛选器。只有使为true的组才会被插入VT7.

  SELECT:处理SELECT列表,产生VT8.

  DISTINCT:将重复的行从VT8中移除,产生VT9.

  ORDER BY:将VT9中的行按ORDER BY 子句中的列列表排序,生成游标(VC10).

  TOP:从VC10的开始处选择指定数量或比例的行,生成表VT11,并返回调用者。

  注:步骤10,按ORDER BY子句中的列列表排序上步返回的行,返回游标VC10.这一步是第一步也是唯一一步可以使用SELECT列表中的列别名的步骤。这一步不同于其它步骤的是,它不返回有效的表,而是返回一个游标。SQL是基于集合理论的。集合不会预先对它的行排序,它只是成员的逻辑集合,成员的顺序无关紧要。对表进行排序的查询可以返回一个对象,包含按特定物理顺序组织的行。ANSI把这种对象称为游标。理解这一步是正确理解SQL的基础。

  因为这一步不返回表(而是返回游标),使用了ORDER BY子句的查询不能用作表表达式。表表达式包括:视图、内联表值函数、子查询、派生表和共用表达式。它的结果必须返回给期望得到物理记录的客户端应用程序。例如,下面的派生表查询无效,并产生一个错误:

  select *
  from(select orderid,customerid from orders order by orderid)
  as d
  下面的视图也会产生错误

  create view my_view
  as
  select *
  from orders
  order by orderid

  在SQL中,表表达式中不允许使用带有ORDER BY子句的查询,而在T—SQL中却有一个例外(应用TOP选项)。

  所以要记住,不要为表中的行假设任何特定的顺序。换句话说,除非你确定要有序行,否则不要指定ORDER BY 子句。排序是需要成本的,SQL Server需要执行有序索引扫描或使用排序运行符。

  推荐一段SQL代码:行列转置

  问题:假设有张学生成绩表(tb)如下:

  姓名 课程 分数

  张三 语文 74

  张三 数学 83

  张三 物理 93

  李四 语文 74

  李四 数学 84

  李四 物理 94

  想变成(得到如下结果):

  姓名 语文 数学 物理

  李四 74 84 94

  张三 74 83 93

 create table tb(姓名 varchar(10),课程 varchar(10),分数 int)
  insert into tb values(’张三’ , ‘语文’ , 74)
  insert into tb values(’张三’ , ‘数学’ , 83)
  insert into tb values(’张三’ , ‘物理’ , 93)
  insert into tb values(’李四’ , ‘语文’ , 74)
  insert into tb values(’李四’ , ‘数学’ , 84)
  insert into tb values(’李四’ , ‘物理’ , 94)
  go
  

  –SQL SERVER 2000 静态SQL,指课程只有语文、数学、物理这三门课程。(以下同)
  select 姓名 as 姓名 ,
  max(case 课程 when ‘语文’ then 分数 else 0 end) 语文,
  max(case 课程 when ‘数学’ then 分数 else 0 end) 数学,
  max(case 课程 when ‘物理’ then 分数 else 0 end) 物理
  from tb
  group by 姓名

我们一直都在努力坚持原创.......请不要一声不吭,就悄悄拿走。

我原创,你原创,我们的内容世界才会更加精彩!

【所有原创内容版权均属TechTarget,欢迎大家转发分享。但未经授权,严禁任何媒体(平面媒体、网络媒体、自媒体等)以及微信公众号复制、转载、摘编或以其他方式进行使用。】

微信公众号

TechTarget微信公众号二维码

TechTarget

官方微博

TechTarget中国官方微博二维码

TechTarget中国

电子邮件地址不会被公开。 必填项已用*标注

敬请读者发表评论,本站保留删除与本文无关和不雅评论的权力。

作者

侯垒
侯垒

相关推荐