2.2 全面的开发环境
2007 Office 对于信息工作者来说是一个理想的桌面工具,但是对于要在整个企业中部署解决方案的商业智能开发人员来说,SQL Server 商业智能开发套件是最佳的选择,因为它具有一个基于项目的环境,并与调试和源控制完全集成,你可以用它来创建端对端的商业智能解决方案。
当然,要在公司内渗入数据挖掘功能,只有当开发人员可以建立快速并轻松地满足商业需求的数据挖掘解决方案时。SQL Server商业智能开发套件提供了一个全面的开发环境,它是基于Microsoft Visual Studio?开发系统的。有了商业智能开发套件,开发人员就可以创建数据挖掘结构,它辨别表和字段是否包含在分析中了,并添加多个将数据挖掘算法应用到这些表中的数据上的数据挖掘模型。在商业智能开发套件中的分析服务项目模板,如图2所示,包含了一个直接的用于创建和查看数据挖掘模型的数据挖掘设计器,并提供了交叉验证、提升图、以及利润图来可视化地比较和对照模型的质量,并在部署之前统计错误数和准确性。
图2:在商业智能开发套件中的数据挖掘设计器
SQL Server 2008在SQL Server 2005已经很全面的开发环境基础上,推出了一些改进之处,包括:
· 更有效地将数据分割为训练和测试分区。分区在创建数据挖掘模型的过程中可用。开发人员可以将一部分训练数据集标识为可随意选择用于测试。
· 对过滤的数据建立模型。数据过滤使得可以创建在挖掘结构中使用数据子集的挖掘模型。过滤提供了设计挖掘结构和数据源的灵活性,因为开发人员可以创建一个单独的挖掘结构,基于一个全面的数据源视图,然后应用过滤器只使用一部分数据用于训练和测试大量的模型,而不是为每一个子集建立一个不同的结构和相关的模型。例如,一个开发人员可以对Customers表和相关表定义数据源视图,建立一个单独的挖掘结构,它包含所有必需的字段,然后创建一个过滤了某个特定客户属性(例如Region)的模型。这个开发人员然后就可以轻松地拷贝这个模型,并更改过滤条件以生成一个基于不同region的新模型。通过对数据模型应用过滤器,你可以:
o 为离散值创建各自的模型。例如,一个衣服存储可以使用客户统计来根据性别建立各自的模型,即使销售数据是从用于所有客户的单一数据源获得的。
o 用模型做试验——创建、然后测试相同数据的多个分组,例如年龄20-30与年龄20-40与年龄20-25相比较。
o 对嵌套的数据表内容指定复杂的过滤器,例如要求只有当客户购买了两个或两个以上的某特定项目后才在模型中包括进这个情况。

