SQL Server 2008中使用数据挖掘模型(一)

日期: 2009-02-08 来源:TechTarget中国 英文

  为一个数据挖掘模型定型后,可以通过使用SQL Server Management Studio或Business Intelligence Development Studio中提供的自定义查看器来浏览此模型。但是,如果您希望进行预测或者从模型中获取更深入的或更具体的信息,则必须依据此数据挖掘模型创建一个查询。在以下情况下,查询可帮助您更好地理解和处理模型中的信息:

  • 进行单个预测和批预测。
  • 了解有关模型发现的模式的更多信息。
  • 查看有关模型的特定模式或子集的详细信息或定型事例。
  • 在挖掘模型中钻取到事例的详细信息。
  • 提取有关全部或部分模型和数据的公式、规则或统计信息。

  SQL Server Analysis Services提供用于创建查询的图形设计界面,以及一种称为数据挖掘扩展插件(DMX)的查询语言,这种语言对于创建自定义预测和复杂查询很有用。若要生成DMX预测查询,可以使用SQL Server Management Studio和Business Intelligence Development Studio中均提供的查询生成器。SQL Server Management Studio中还提供了一组DMX查询模板。

  • 有关如何使用查询生成器的详细信息,请参阅使用预测查询生成器创建DMX预测查询。
  • 有关如何使用DMX查询模板的详细信息,请参阅在 SQL Server Management Studio中创建DMX查询或如何在SQL Server Management Studio中使用模板。

  预测查询

  许多数据挖掘项目的主要目标是使用挖掘模型来进行预测。例如,您可能要在十二月期间预测公司明年销售的产品数量,或者可能要预测在某个广告活动后潜在客户是否会购买产品。

  创建预测时,通常会提供一些新数据,并要求模型基于新数据生成一个预测。可以通过在“预测联接”中将模型映射到一个外部数据源来以批方式进行预测。或者,可以通过创建一个“单独”查询一次提供一个值。

  单独预测查询和批预测查询都使用PREDICTION JOIN语法来定义新数据:不同之处在于预测联接输入端的指定方式。在单独查询中,数据是作为查询的一部分内联提供的。在批查询中,数据来自使用OPENQUERY语法指定的外部数据源。有关详细信息,请参阅OPENQUERY (DMX)。

  此外,使用时序模型可以仅仅基于模型来进行预测,即不需要提供任何新数据,而仅仅基于现有序列来请求预测。

  下面提供有关如何创建上述每一类查询的信息:

  • 查询类型 
  • 查询选项
  • 单独预测查询:针对在查询中键入的单个新事例或者多个新事例进行预测。
  • 批预测:将外部数据源中的新事例映射到模型并进行预测。
  • 时序预测:基于现有模型预测指定数目的将来步骤。

  通过添加新数据来扩展现有模型,并基于组合序列来进行预测。

  通过使用REPLACE_MODEL_CASES选项向新数据序列应用现有模型。
 
  除了预测特定值,例如,下个月的销售额,或者要向客户建议的产品,您还可以自定义预测查询,以返回与预测有关的各种类型的信息。例如,知道预测正确的概率可能很有帮助,这样您就可以决定是否向用户提出建议。

  若要自定义预测查询所返回的信息,应向查询中添加“预测函数”。每个模型或查询类型都支持特定的函数。例如,聚类分析模型支持特殊预测函数,这些函数提供有关模型创建的分组的额外详细信息。时序模型支持计算随时间的变化的预测函数。还有可处理几乎所有模型类型的通用预测函数。有关不同查询类型支持的预测函数的列表,请参阅将函数映射到查询类型(DMX)。有关预测函数的完整列表,请参阅数据挖掘扩展插件 (DMX) 函数参考。

  单独查询

  如果要实时创建简单预测,则单独查询很有用。例如,您可能通过使用网站从客户那里获取信息,然后使用这些数据返回预测,这些预测以特定于该客户的建议信息的形式呈现。或者,您也可能分析电子邮件的内容,然后使用现有分类模型来对电子邮件进行分类,并相应地传送邮件。

  单独查询不需要包含输入的单独表。只需将一行数据传递给模型,便会实时地返回一个预测。您还可以将单独查询扩展为进行多个预测,方法是键入包含单个事例的 SELECT 语句,再添加UNION运算符,然后键入另一个SELECT语句以指定另一个事例。

  可以通过以下方式基于现有模型创建单独查询:

  • 使用数据挖掘设计器。
  • 使用单独查询模板。

  以编程方式或者在另一个Analysis Services客户端中创建DMX语句。

  创建单独查询时,必须以PREDICTION JOIN的形式向模型提供新数据。这意味着即使不映射到实际表,也必须确保新数据与挖掘模型中的现有列匹配。如果新数据列与新数据完全匹配,则Analysis Services将自动映射列。这称为“NATURAL PREDICTION JOIN”。但是,如果列不匹配,或者新数据在类型和量上与模型所包含的数据并不相同,则必须指定模型映射中的哪些列映射到新数据,或者指定缺少的值。

我们一直都在努力坚持原创.......请不要一声不吭,就悄悄拿走。

我原创,你原创,我们的内容世界才会更加精彩!

【所有原创内容版权均属TechTarget,欢迎大家转发分享。但未经授权,严禁任何媒体(平面媒体、网络媒体、自媒体等)以及微信公众号复制、转载、摘编或以其他方式进行使用。】

微信公众号

TechTarget微信公众号二维码

TechTarget

官方微博

TechTarget中国官方微博二维码

TechTarget中国

电子邮件地址不会被公开。 必填项已用*标注

敬请读者发表评论,本站保留删除与本文无关和不雅评论的权力。

相关推荐