SQL Server2005/2008中的CTE应用

日期: 2009-10-27 作者:邀月工作室 来源:TechTarget中国 英文

  微软从SQl2005起引入了CTE(Common Table Expression)以强化T-SQL。这是一个类似于非持久视图的好东东。

  按照MSDN介绍

  1、公用表表达式 (CTE) 可以认为是在单个 SELECT、INSERT、UPDATE、DELETE 或 CREATE VIEW 语句的执行范围内定义的临时结果集。CTE 与派生表类似,具体表现在不存储为对象,并且只在查询期间有效。与派生表的不同之处在于,CTE 可自引用,还可在同一查询中引用多次。

  CTE 可用于:

  创建递归查询。有关详细信息,请参阅使用公用表表达式的递归查询。

  在不需要常规使用视图时替换视图,也就是说,不必将定义存储在元数据中。

  启用按从标量嵌套 select 语句派生的列进行分组,或者按不确定性函数或有外部访问的函数进行分组。

  在同一语句中多次引用生成的表。

  使用 CTE 可以获得提高可读性和轻松维护复杂查询的优点。查询可以分为单独块、简单块、逻辑生成块。之后,这些简单块可用于生成更复杂的临时 CTE,直到生成最终结果集。可以在用户定义的例程(如函数、存储过程、触发器或视图)中定义 CTE。

  2、公用表表达式 (CTE) 具有一个重要的优点,那就是能够引用其自身,从而创建递归 CTE。递归 CTE 是一个重复执行初始 CTE 以返回数据子集直到获取完整结果集的公用表表达式。当某个查询引用递归 CTE 时,它即被称为递归查询。递归查询通常用于返回分层数据,例如:显示某个组织图中的雇员或物料清单方案(其中父级产品有一个或多个组件,而那些组件可能还有子组件,或者是其他父级产品的组件)中的数据。

  递 归 CTE 可以极大地简化在 SELECT、INSERT、UPDATE、DELETE 或 CREATE VIEW 语句中运行递归查询所需的代码。在 SQL Server 的早期版本中,递归查询通常需要使用临时表、游标和逻辑来控制递归步骤流。有关公用表表达式的详细信息,请参阅使用公用表表达式。

  这里举例说明如下:

  为了描述方便,邀月特地列举了一个常见的自关联Table

  表结构如下:

  CREATE TABLE [dbo].[CategorySelf](
  [PKID] [int] IDENTITY(1,1) NOT NULL,
  [C_Name] [nvarchar](50) NOT NULL,
  [C_Level] [int] NOT NULL,
  [C_Code] [nvarchar](255) NULL,
  [C_Parent] [int] NOT NULL,
  [InsertTime] [datetime] NOT NULL,
  [InsertUser] [nvarchar](50) NULL,
  [UpdateTime] [datetime] NOT NULL,
  [UpdateUser] [nvarchar](50) NULL,
  [SortLevel] [int] NOT NULL,
  [CurrState] [smallint] NOT NULL,
  [F1] [int] NOT NULL,
  [F2] [nvarchar](255) NULL
  CONSTRAINT [PK_OBJECTCATEGORYSELF] PRIMARY KEY CLUSTERED
  (
  [PKID] ASC
  )WITH (PAD_INDEX = OFF, STATISTICS_NORECOMPUTE = OFF, IGNORE_DUP_KEY = OFF, ALLOW_ROW_LOCKS = ON, ALLOW_PAGE_LOCKS = ON) ON [PRIMARY]
  ) ON [PRIMARY]
  GO

  再插入一些测试数据

   

 INSERT INTO [CategorySelf]([C_Name],[C_Level] ,[C_Code],[C_Parent] ,[InsertTime] ,[InsertUser] ,[UpdateTime] ,[UpdateUser] ,[SortLevel] ,[CurrState] ,[F1] ,[F2])
  select ‘分类1′,1,’0′,0,GETDATE(),’testUser’,DATEADD(dd,1,getdate()),’CrackUser’,13,0,1,’邀月备注’ union all
  select ‘分类2′,1,’0′,0,GETDATE(),’testUser’,DATEADD(dd,78,getdate()),’CrackUser’,12,0,1,’邀月备注’ union all
  select ‘分类3′,1,’0′,0,GETDATE(),’testUser’,DATEADD(dd,6,getdate()),’CrackUser’,10,0,1,’邀月备注’ union all
  select ‘分类4′,2,’1′,1,GETDATE(),’testUser’,DATEADD(dd,75,getdate()),’CrackUser’,19,0,1,’邀月备注’ union all
  select ‘分类5′,2,’2′,2,GETDATE(),’testUser’,DATEADD(dd,3,getdate()),’CrackUser’,17,0,1,’邀月备注’ union all
  select ‘分类6′,3,’1/4′,4,GETDATE(),’testUser’,DATEADD(dd,4,getdate()),’CrackUser’,16,0,1,’邀月备注’ union all
  select ‘分类7′,3,’1/4′,4,GETDATE(),’testUser’,DATEADD(dd,5,getdate()),’CrackUser’,4,0,1,’邀月备注’ union all
  select ‘分类8′,3,’2/5′,5,GETDATE(),’testUser’,DATEADD(dd,6,getdate()),’CrackUser’,3,0,1,’邀月备注’ union all
  select ‘分类9′,4,’1/4/6′,6,GETDATE(),’testUser’,DATEADD(dd,7,getdate()),’CrackUser’,5,0,1,’邀月备注’ union all
  select ‘分类10′,4,’1/4/6′,6,GETDATE(),’testUser’,DATEADD(dd,7,getdate()),’CrackUser’,63,0,1,’邀月备注’ union all
  select ‘分类11′,4,’1/4/6′,6,GETDATE(),’testUser’,DATEADD(dd,8,getdate()),’CrackUser’,83,0,1,’邀月备注’ union all
  select ‘分类12′,4,’2/5/8′,8,GETDATE(),’testUser’,DATEADD(dd,10,getdate()),’CrackUser’,3,0,1,’邀月备注’ union all
  select ‘分类13′,4,’2/5/8′,8,GETDATE(),’testUser’,DATEADD(dd,15,getdate()),’CrackUser’,1,0,1,’邀月备注’
  一个典型的应用场景是:在这个自关联的表中,查询以PKID为2的分类包含所有子分类。也许很多情况下,我们不得不用临时表表变量游标等。现在我们有了CTE,就简单多了。

  WITH SimpleRecursive(C_Name, PKID, C_Code,C_Parent)
  AS
  (SELECT C_Name, PKID, C_Code,C_Parent FROM CategorySelf WHERE PKID = 2
  UNION ALL
  SELECT p.C_Name, p.PKID, p.C_Code,p.C_parent
  FROM CategorySelf P INNER JOIN
  SimpleRecursive A ON A.PKID = P.C_Parent
  )
  SELECT sr.C_Name as C_Name, c.C_Name as C_ParentName,sr.C_Code as C_ParentCode
  FROM SimpleRecursive sr inner join CategorySelf c
  on sr.C_Parent=c.PKID

  查询结果如下:

C_NameC_ParentName C_ParentCode
分类5分类22
分类8分类52/5
分类12分类82/5/8
分类13分类82/5/8

  感觉怎么样?如果我只想查询第二层,而不是默认的无限查询下去,可以在上面的SQL后加一个选项 Option(MAXRECURSION 5),注意5表示到第5层就不往下找了。如果只想找第二层,但实际结果有三层,此时会出错:

  Msg 530, Level 16, State 1, Line 1

  The statement terminated. The maximum recursion 1 has been exhausted before statement completion.

  此时可以通过where条件来解决,而保证不出错,看如下SQL语句:

  WITH SimpleRecursive(C_Name, PKID, C_Code,C_Parent,Sublevel)
  AS
  (SELECT C_Name, PKID, C_Code,C_Parent,0 FROM CategorySelf WHERE PKID = 2
  UNION ALL
  SELECT p.C_Name, p.PKID, p.C_Code,p.C_parent,Sublevel+1
  FROM CategorySelf P INNER JOIN
  SimpleRecursive A ON A.PKID = P.C_Parent
  )
  SELECT sr.C_Name as C_Name, c.C_Name as C_ParentName,sr.C_Code as C_ParentCode
  FROM SimpleRecursive sr inner join CategorySelf c
  on sr.C_Parent=c.PKID
  where SubLevel<=2

  查询结果:

C_Name

C_ParentName

C_ParentCode

分类5

分类2

2

分类8

分类5

2/5

  当然,我们不是说CTE就是万能的。通过好的表设计也可以某种程度上解决特定的问题。下面用常规的SQL实现上面这个需求。

  注意:上面表中有一个字段很重要,就是C_Code,编码 ,格式如”1/2″,“2/5/8″表示该分类的上级分类是1/2,2/5/8

  这样,我们查询就简单多,查询以PKID为2的分类包含所有子分类:

SELECT C_Name as C_Name, (Select top 1 C_Name from CategorySelf s where c.C_Parent=s.PKID) as C_ParentName,C_Code as C_ParentCode
  from CategorySelf c where C_Code like ‘2/%’

  查询以PKID为2的分类包含所有子分类,且级别不大于3。

SELECT C_Name as C_Name, (Select top 1 C_Name from CategorySelf s where c.C_Parent=s.PKID) as C_ParentName,C_Code as C_ParentCode
  from CategorySelf c where C_Code like ‘2/%’ and C_Level<=3

  查询结果同上,略去。这里我们看出,有时候,好的表结构设计相当重要。

  有人很关心性能问题。目前没有测试过。稍后会附上百万级测试报告。不过,有两点理解邀月忘了补充:

  一、CTE其实是面向对象的,运行的基础是CLR。一个很好的说明是With查询语句中是区分字段的大小写的。即”C_Code”和”c_Code”是不一样的,后者会报错。这与普通的SQL语句不同。

  二、 这个应用示例重在简化业务逻辑,即便是性能不佳,但对临时表表变量游标等传统处理方式是一种业务层次上的简化或者说是优化。

我们一直都在努力坚持原创.......请不要一声不吭,就悄悄拿走。

我原创,你原创,我们的内容世界才会更加精彩!

【所有原创内容版权均属TechTarget,欢迎大家转发分享。但未经授权,严禁任何媒体(平面媒体、网络媒体、自媒体等)以及微信公众号复制、转载、摘编或以其他方式进行使用。】

微信公众号

TechTarget微信公众号二维码

TechTarget

官方微博

TechTarget中国官方微博二维码

TechTarget中国

电子邮件地址不会被公开。 必填项已用*标注

敬请读者发表评论,本站保留删除与本文无关和不雅评论的权力。

相关推荐