SQL_Server_2008之ETL技术详解

第 章 4使用SQL Server进行数据挖掘 本章将回顾Analysis Services工具集,同时介绍有效创建挖掘模型和分析挖掘模型的技巧。在学习本章之前,读者应该已经熟悉了第3章介绍的模型构建的概念,而且对挖掘结构、挖掘模型、挖掘模型列、事例表和嵌套表的概念也有了较深入的理解。

对于初学者来说,本章可以帮助他们入门,对于有一定SQL Server数据挖掘经验的用户来说,本章可以为他们提供一些技术,以帮助他们最有效地发挥该工具集的作用。但是这并不意味着本章可以取代产品的帮助文档中优秀的帮助和教程。更确切地说,本章讲述如何使用Analysis Services提供的通用工具,特别是用于数据挖掘的工具。

本章将通过用户界面来讲述如何使用Analysis Services的功能,并提供详细的操作步骤来示范如何创建一组挖掘模型。本章还将穿插介绍相关的一些概念。如果您偏离这些操作太远,则可以重新开始操作,也可以从本书的Web站点(www.wiley.com/go/ data_mining_SQL_2008)上获得完整的项目文件,以便随时使用。

本章将会使用附录A描述的MovieClick数据库来举例说明工具的用法。 本章将学习:

● 使用Business Intelligence Development Studio(BI Dev Studio) ● 理解即时模式和脱机模式

● 创建及修改数据源、数据源视图和数据挖掘对象 ● 浏览数据和评估模型

4.1 BI Dev Studio介绍

在使用SQL Server数据挖掘功能的过程中,大部分时间将会花费在商业智能应用程序开发工具集(Business Intelligence Development Studio,BI Dev Studio)上。BI Dev Studio环境已经集成到Microsoft Visual Studio(VS)框架中,为商业智能操作提供了完整的开发环境。在使用Visual Studio时,数据挖掘项目是一组项目中的一部分,这组项目也称为解决方案。数据挖掘项目与应用程序所要求的其他项目可以组合到一个解决方案中。

例如,数据库管理员(Database Administrator,DBA)可能创建一个Integration Services项目,这个项目从联机事务处理(OLTP)系统中提取数据,并且把这些数据转换为适合于数

数据挖掘原理与应用(第2版)——SQL Server 2008数据库

据挖掘的形式。然后,分析员可以创建一个Analysis Services项目,这个项目包含浏览事务数据和分析事务数据的模型。最后,应用程序开发人员可以创建一个Web服务和Web站点,在终端用户应用程序和商业化的服务中嵌入这些模型。

所有这些项目都可以包含在一个解决方案中,这个解决方案包含所有相互合作完成的工作。而且,这些工作的所有方面都可以通过源控制系统中完整的版本历史来获得。

4.1.1 用户界面

BI Dev Studio主要是为应用程序开发人员设计的,有一个实现解决方案的非结构化方法,该方法与传统的数据挖掘工具完全不一样。该方法和BI Dev Studio开发环境的复杂性,使得那些熟悉其他数据挖掘工具集的用户感到害怕。然而,开始使用这个工具时,要处理Visual Studio中内置的无数选项和窗口,一旦经历这一段的磨练之后,要创建和分析一个挖掘模型就是非常简单的事。

熟悉BI Dev Studio的第一步是理解用户界面各个部分中哪些部分是重要的,并且理解各个部分的作用。图4-1列出了BI Dev Studio的典型窗口布局,其中对各个重要的元素做了标注。

设计选项卡 解决方案资源管理器 窗口选项卡 BI菜单 输出窗口 设计窗口 属性窗口

图4-1 BI Dev Studio

100

第4章 使用SQL Server进行数据挖掘

BI Dev Stu

>>闂備浇顕х换鎺楀磻閻愯娲冀椤愶綆娼熼梺纭呮彧缁犳垹绮堥崒鐐寸厪濠电姴绻樺顕€鏌f惔顖涘<<
12@gma联系客服:779662525#qq.com(#替换为@) 苏ICP备20003344号-4