书签 分享 收藏 举报 版权申诉 / 18
上传文档赚钱

类型(商务智能-精)第5章-数据预处理技术案例课件.pptx

  • 上传人(卖家):三亚风情
  • 文档编号:2942355
  • 上传时间:2022-06-13
  • 格式:PPTX
  • 页数:18
  • 大小:2.21MB
  • 【下载声明】
    1. 本站全部试题类文档,若标题没写含答案,则无答案;标题注明含答案的文档,主观题也可能无答案。请谨慎下单,一旦售出,不予退换。
    2. 本站全部PPT文档均不含视频和音频,PPT中出现的音频或视频标识(或文字)仅表示流程,实际无音频或视频文件。请谨慎下单,一旦售出,不予退换。
    3. 本页资料《(商务智能-精)第5章-数据预处理技术案例课件.pptx》由用户(三亚风情)主动上传,其收益全归该用户。163文库仅提供信息存储空间,仅对该用户上传内容的表现方式做保护处理,对上传内容本身不做任何修改或编辑。 若此文所含内容侵犯了您的版权或隐私,请立即通知163文库(点击联系客服),我们立即给予删除!
    4. 请根据预览情况,自愿下载本文。本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
    5. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007及以上版本和PDF阅读器,压缩文件请下载最新的WinRAR软件解压。
    配套讲稿:

    如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。

    特殊限制:

    部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。

    关 键  词:
    商务智能-精 商务 智能 数据 预处理 技术 案例 课件
    资源描述:

    1、商务智能 第五章第五章 数据预处理技术案例数据预处理技术案例 数据预处理的方法 数据清洗 去掉噪声和无关数据 数据集成 将多个数据源中的数据结合起来存放在一个一致的数据存储中 数据变换 把原始数据转换成为适合数据挖掘的形式 数据归约 主要方法包括:数据立方体聚集,维归约,数据压缩,数值归约,离散化和概念分层等 数据预处理工具Microsoft SQL Server SSISSQL Server 集成服务(SSIS)被定位成一个能生成高性能数据集成解决方案(包括数据仓库中数据的提取、转换和加载(ETL)的平台。其集成的含义主要就是指把ETL集成在一起。SSIS通过一个统一的环境向用户提供了数据转

    2、换服务(DTS)所能提供的所有功能,并且大大减少了用户花在编写程序和脚本上的精力和时间。集成服务(Integration Services) SSIS的基本功能包括: 合并来自异类数据源中的数据 填充数据仓库和数据集市 整理数据和将数据标准化 精确和模糊的查找功能 将商业智能置入数据转换过程 使管理功能和数据加载自动化案例1:数据的集成、导入 使用使用SSIS工具工具 1)新建Integration Services 项目Integration Sales,并在此项目中新建一个SSIS包Integration Sales.dtsx,在此包中进行数据的抽取,整合等操作。 2)创建数据源。 在在I

    3、ntegraton Service项目下的数据源文件夹中添加两个项目下的数据源文件夹中添加两个新的数据源连接,一个连接新的数据源连接,一个连接AdeventurWorksLT2008,一一个连接目标数据库个连接目标数据库AdeventurWorksLT_DW2008 设计SSIS包Integration Sales.dtsx。 设计包的方法是从工具箱中将需要使用的容器、任务、可执行体等工具拖拽到包的SSIS设计器窗口中,再对这些对象进行设计。 由于主要执行的是数据抽取工作,因此数据流任务是我们主要设置的任务。l数据抽取中所涉及的表主要有:l事实表FactSales,l产品信息表DimProdu

    4、ct,l产品类别信息表DimCategory,l订购时间表DimTimel客户信息表DimCustmer。 抽取事实表FactSales的数据流任务的过程 1)选中SSIS设计器的【控制流】标签,将工具箱中的【数据流任务】对象拖拽到SSIS设计器中,并重命名为DimCustmer 2)双击【数据流任务】 DimCustmer打开【数据流】标签,将【OLE DB源】拖至SSIS设计器上。 3)打开【OLE DB源编辑器】进行【OLE DB源】对象的设置。在上述设计中需选中数据源AdventureWorksLT2008,并选择数据访问模式为【SQL 命令】,在【SQL 命令文本】中输入进行数据抽取

    5、的SQL语句。 4)完成【OLE DB源】对象设置后,从工具箱中将【SQL Server目标】对象拖至SSIS设计器上,并选中【OLE DB源】对象,将其绿色连线拖拽至新添的【SQL Server目标】对象上。打开【SQL目标编辑器】,选中数据源AdeventurWorksLT_DW2008。案例2:为数据挖掘算法准备数据 以AdventureWorksDW2008数据仓库为例,进行购物篮数据挖掘,数据源对象是顾客购买的商品和顾客年龄、收入状况,但这些数据散布在数据仓库不同的事实表和维表中的。如何进行? 视图vDMPrep就是为关联规则挖掘、经过预处理生成的数据表。 vDMPrep will

    6、be used as a data source by the other data mining views. Uses DW data at customer, product, day, etc. granularity and gets region, model, year, month, etc. 关联规则挖掘的数据源为: vAssocSeqOrders supports assocation and sequence clustering data mmining models. vAssocSeqLineItems CREATE VIEW dbo.vAssocSeqOrders AS SELECT DISTINCT OrderNumber ,CustomerKey ,Region ,IncomeGroup FROM dbo.vDMPrep WHERE FiscalYear = 2004 CREATE VIEW dbo.vAssocSeqLineItems AS SELECT OrderNumber ,LineNumber ,Model FROM dbo.vDMPrep WHERE FiscalYear = 2004 ;

    展开阅读全文
    提示  163文库所有资源均是用户自行上传分享,仅供网友学习交流,未经上传用户书面授权,请勿作他用。
    关于本文
    本文标题:(商务智能-精)第5章-数据预处理技术案例课件.pptx
    链接地址:https://www.163wenku.com/p-2942355.html

    Copyright@ 2017-2037 Www.163WenKu.Com  网站版权所有  |  资源地图   
    IPC备案号:蜀ICP备2021032737号  | 川公网安备 51099002000191号


    侵权投诉QQ:3464097650  资料上传QQ:3464097650
       


    【声明】本站为“文档C2C交易模式”,即用户上传的文档直接卖给(下载)用户,本站只是网络空间服务平台,本站所有原创文档下载所得归上传人所有,如您发现上传作品侵犯了您的版权,请立刻联系我们并提供证据,我们将在3个工作日内予以改正。

    163文库