接上文:微软数据挖掘开发:创建挖掘模型 验证数据挖掘模型 通常情况下,针对某个特定案例,我们不能准确定位哪个挖掘算法是最准确的,所以我们会在一个挖掘结构中定义多个挖掘模型;通过对多个挖掘模型的验证,得出最准确的那个。 DMX(Data Mining Extension) DMX是用来从数据挖掘模型中查询数据的语言,看起来和SQL很相似,不过这种语言学习起来很不容易(目前国内还买不到任何关于DMX的学习资料),可能微软也意识到DMX写起来很困难推出了很多编写DMX的模板,主要针对Model Content,Model Management,Prediction Queries 和……
我们一直都在努力坚持原创.......请不要一声不吭,就悄悄拿走。
我原创,你原创,我们的内容世界才会更加精彩!
【所有原创内容版权均属TechTarget,欢迎大家转发分享。但未经授权,严禁任何媒体(平面媒体、网络媒体、自媒体等)以及微信公众号复制、转载、摘编或以其他方式进行使用。】
微信公众号
TechTarget
官方微博
TechTarget中国
接上文:微软数据挖掘开发:创建挖掘模型
验证数据挖掘模型
通常情况下,针对某个特定案例,我们不能准确定位哪个挖掘算法是最准确的,所以我们会在一个挖掘结构中定义多个挖掘模型;通过对多个挖掘模型的验证,得出最准确的那个。
DMX(Data Mining Extension)
DMX是用来从数据挖掘模型中查询数据的语言,看起来和SQL很相似,不过这种语言学习起来很不容易(目前国内还买不到任何关于DMX的学习资料),可能微软也意识到DMX写起来很困难推出了很多编写DMX的模板,主要针对Model Content,Model Management,Prediction Queries 和Structure Content,依据下图读者可以到SQL Server Mangement Studio中感受DMX。
点击放大
从编程的角度来说,Prediction Queries 应该使用最多的,分享一下我自己在写Prediction Queries的一些经验。 微软商业智能平台,SQL Server Reporting Services 是主要的报表展示平台,我们可以利用SSRS 里面提供的一些UI界面帮助我们更好的编写DMX。现在我们需要查询哪些客户可能会买自行车,可能购买的百分比是多少。关于怎么使用SSRS常见报表是属于这部分的内容,因此这里直接进入 查询编辑器,如下图:
点击放大
我们在选择了Case table之后,挖掘模型中的列会和case table中的列自动关联起来,之后我们可以通过简单的拖拽,将需要显示的Mining Model Columns 或者Case Table Columns 拖到下面的Matrix中,这个时候我们点击按钮(Switch DMX code and UI)可以切换到DMX的代码界面。目前我就得到了一个标准DMX Prediction Query,
SELECT t.FirstName, t.LastName, (Predict ([Bike Buyer])) as [PredictedValue], (PredictProbability([Bike Buyer])) as [Probability] From [TM Decision Tree] PREDICTION JOIN OPENQUERY([Adventure Works DW], 'SELECT [FirstName], [LastName], [CustomerKey], [MaritalStatus], [Gender], [YearlyIncome], [TotalChildren], [NumberChildrenAtHome], [HouseOwnerFlag], [NumberCarsOwned], [CommuteDistance] FROM [dbo].[DimCustomer] ') AS t ON [TM Decision Tree].[Marital Status] = t.[MaritalStatus] AND [TM Decision Tree].[Gender] = t.[Gender] AND [TM Decision Tree].[Yearly Income] = t.[YearlyIncome] AND [TM Decision Tree].[Total Children] = t.[TotalChildren] AND [TM Decision Tree].[Number Children At Home] = t.[NumberChildrenAtHome] AND [TM Decision Tree].[House Owner Flag] = t.[HouseOwnerFlag] AND [TM Decision Tree].[Number Cars Owned] = t.[NumberCarsOwned] AND [TM Decision Tree].[Commute Distance] = t.[CommuteDistance] |
在上面代码的基础上,我们可以编辑,如我们需要利用输入参数控制显示数据;定义参数@Buyer ,@Possible,这个时候我们可以通过添加一些简单的WHERE 条件即可完成,如:
WHERE (Predict ([Bike Buyer]))=@Buyer AND PredictProbability([Bike Buyer]) > @Possible |
当然通过改变PREDICTION JOIN,我们也可以去掉一些对Predictable column 影响不大的 attributes。
是不是感觉比从零开始写起DMX容易了很多?
挖掘结果展示
上面提到SQL Server Reporting Services 是微软商业智能平台首选报表展示平台,但是并不意味我们必须使用它来展示报表,我们也可以利用asp.net(C#/VB.net + ADOMD.net + DMX ),甚至是Excel(SQL Server 2005/2008 插件) 连接数据挖掘模型所在的SQL Server实例进行挖掘结果的展示。
此外,微软也将数据挖掘作为其云计算平台上的一项服务推出(http://www.microsoft.com/bi/en-us/Community/BILabs/Pages/DataMiningInTheCloud.aspx)。
作者
相关推荐
-
OpenWorld18大会:Ellison宣布数据库的搜寻和破坏任务
在旧金山举行的甲骨文OpenWorld 2018大会中,甲骨文首席技术官(CTO)兼创始人Larry Elli […]
-
云端SQL Server高可用性最佳做法
与内部部署相比,在云端运行SQL Server可为数据库软件用户提供更多的灵活性和可扩展性,也可能更省钱。但云 […]
-
ObjectRocket着力发展Azure MongoDB服务
MongoDB吸引了微软公司的注意力,微软公司计划针对运行于该公司2017年发布的Azure Cosmos D […]
-
绘制数据关系图的利器:SQL Server 图像数据库工具
SQL Server 2017新增了图形数据库功能,你可以使用图结构来表示不同数据元素之间的关系。