SQL_Server_2008之ETL技术详解

第 章 4使用SQL Server进行数据挖掘 本章将回顾Analysis Services工具集,同时介绍有效创建挖掘模型和分析挖掘模型的技巧。在学习本章之前,读者应该已经熟悉了第3章介绍的模型构建的概念,而且对挖掘结构、挖掘模型、挖掘模型列、事例表和嵌套表的概念也有了较深入的理解。

对于初学者来说,本章可以帮助他们入门,对于有一定SQL Server数据挖掘经验的用户来说,本章可以为他们提供一些技术,以帮助他们最有效地发挥该工具集的作用。但是这并不意味着本章可以取代产品的帮助文档中优秀的帮助和教程。更确切地说,本章讲述如何使用Analysis Services提供的通用工具,特别是用于数据挖掘的工具。

本章将通过用户界面来讲述如何使用Analysis Services的功能,并提供详细的操作步骤来示范如何创建一组挖掘模型。本章还将穿插介绍相关的一些概念。如果您偏离这些操作太远,则可以重新开始操作,也可以从本书的Web站点(www.wiley.com/go/ data_mining_SQL_2008)上获得完整的项目文件,以便随时使用。

本章将会使用附录A描述的MovieClick数据库来举例说明工具的用法。 本章将学习:

● 使用Business Intelligence Development Studio(BI Dev Studio) ● 理解即时模式和脱机模式

● 创建及修改数据源、数据源视图和数据挖掘对象 ● 浏览数据和评估模型

4.1 BI Dev Studio介绍

在使用SQL Server数据挖掘功能的过程中,大部分时间将会花费在商业智能应用程序开发工具集(Business Intelligence Development Studio,BI Dev Studio)上。BI Dev Studio环境已经集成到Microsoft Visual Studio(VS)框架中,为商业智能操作提供了完整的开发环境。在使用Visual Studio时,数据挖掘项目是一组项目中的一部分,这组项目也称为解决方案。数据挖掘项目与应用程序所要求的其他项目可以组合到一个解决方案中。

例如,数据库管理员(Database Administrator,DBA)可能创建一个Integration Services项目,这个项目从联机事务处理(OLTP)系统中提取数据,并且把这些数据转换为适合于数

数据挖掘原理与应用(第2版)——SQL Server 2008数据库

据挖掘的形式。然后,分析员可以创建一个Analysis Services项目,这个项目包含浏览事务数据和分析事务数据的模型。最后,应用程序开发人员可以创建一个Web服务和Web站点,在终端用户应用程序和商业化的服务中嵌入这些模型。

所有这些项目都可以包含在一个解决方案中,这个解决方案包含所有相互合作完成的工作。而且,这些工作的所有方面都可以通过源控制系统中完整的版本历史来获得。

4.1.1 用户界面

BI Dev Studio主要是为应用程序开发人员设计的,有一个实现解决方案的非结构化方法,该方法与传统的数据挖掘工具完全不一样。该方法和BI Dev Studio开发环境的复杂性,使得那些熟悉其他数据挖掘工具集的用户感到害怕。然而,开始使用这个工具时,要处理Visual Studio中内置的无数选项和窗口,一旦经历这一段的磨练之后,要创建和分析一个挖掘模型就是非常简单的事。

熟悉BI Dev Studio的第一步是理解用户界面各个部分中哪些部分是重要的,并且理解各个部分的作用。图4-1列出了BI Dev Studio的典型窗口布局,其中对各个重要的元素做了标注。

设计选项卡 解决方案资源管理器 窗口选项卡 BI菜单 输出窗口 设计窗口 属性窗口

图4-1 BI Dev Studio

100

第4章 使用SQL Server进行数据挖掘

BI Dev Studio最重要的部分如下所示。

● 解决方案资源管理器:解决方案资源管理器窗口用于管理解决方案和项目。在这

个窗口中可以创建和管理所有的对象。要在项目中增加一个对象,可以右击项目名,然后选择“添加新项”,或者右击一个特定文件夹,然后选择“新建”。进行上述操作之后,将会启动一个对话框或向导,创建特定的对象了。

● 窗口选项卡:通过窗口选项卡可以在设计器窗口之间快速切换。每一个当前打开

的文件或者对象都有一个选项卡。如果打开的对象的数目超过了选项卡区域能够容纳的数目,则可以使用选项卡右边的滑动条来浏览其他的窗口。

● 设计窗口:设计窗口是编辑和分析对象的地方。创建一个新的对象或者在解决方

案资源管理器中双击一个对象,将会打开该对象的特定设计窗口,以修改该对象,与该对象交互。

● 设计选项卡:许多对象都有不同的方面,可以对它们进行编辑或者与它们交互。

这些方面在设计器窗口中是通过选项卡来给出的。

● 属性窗口:属性窗口是一个上下文相关的窗口,它显示当前选择项的属性。属性

窗口在Visual Studio中很常见,适用于该开发环境中所执行的任何类型的操作。例如,如果在解决方案资源管理器中选择一个对象,则在属性窗口中将会显示所选对象的属性(比如对象ID、文件名等等)。如果在数据挖掘设计器窗口中选择某一列,则在属性窗口中将会显示列的属性(比如名称和数据类型)。如果所选的项没有属性,则属性窗口将是空的。

● BI菜单:BI菜单位于主菜单栏的“调试”菜单和“工具”菜单之间,从中可以找

到特定于Analysis Services对象的上下文相关的菜单。例如,如果打开数据源视图(Data Source View,DSV)编辑器,则“格式”菜单和DSV菜单将会在这个区域中显示。

● 输出窗口:当构建和部署项目时,输出窗口将显示相关的信息。如果项目有错误,

则可以在输出窗口中查看关于该错误的描述。 注意:

要使操作环境更适合自己的数据挖掘任务,可以按照所喜欢的形式重新组织工作空间。单击并且拖动任何窗口的标题栏,可以显示窗口悬浮的图标,以帮助悬浮和停靠窗口。甚至可以将这些窗口彼此叠放,这样,可选择的选项卡将会显示在窗口的下面。

在集成开发环境中选择不同的选项时,可能会显示额外的窗口。可以关掉当前不再使用的窗口——不要担心,如果需要它们,总是可以从视图菜单中打开它们。如果想使那些窗口易于使用,而且在屏幕空间上运行短暂时间,则可以在窗口的标题栏中单击图钉图标,这样,当不使用这个窗口时,该窗口将会自动隐藏。

101

联系客服:779662525#qq.com(#替换为@) 苏ICP备20003344号-4