审计数据预处理课件.ppt
- 【下载声明】
1. 本站全部试题类文档,若标题没写含答案,则无答案;标题注明含答案的文档,主观题也可能无答案。请谨慎下单,一旦售出,不予退换。
2. 本站全部PPT文档均不含视频和音频,PPT中出现的音频或视频标识(或文字)仅表示流程,实际无音频或视频文件。请谨慎下单,一旦售出,不予退换。
3. 本页资料《审计数据预处理课件.ppt》由用户(晟晟文业)主动上传,其收益全归该用户。163文库仅提供信息存储空间,仅对该用户上传内容的表现方式做保护处理,对上传内容本身不做任何修改或编辑。 若此文所含内容侵犯了您的版权或隐私,请立即通知163文库(点击联系客服),我们立即给予删除!
4. 请根据预览情况,自愿下载本文。本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
5. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007及以上版本和PDF阅读器,压缩文件请下载最新的WinRAR软件解压。
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 审计 数据 预处理 课件
- 资源描述:
-
1、2023-1-28审计数据预处理审计数据预处理审计数据预处理审计数据预处理本章学习目标本章学习目标q理解审计数据预处理的重要性理解审计数据预处理的重要性q理解数据质量、审计数据质量问题;掌握审计数理解数据质量、审计数据质量问题;掌握审计数据预处理的意义以及审计数据预处理的内容据预处理的意义以及审计数据预处理的内容 q结合应用实例熟悉审计数据预处理的基本方法结合应用实例熟悉审计数据预处理的基本方法q理解审计数据预处理阶段数据验证的重要性、熟理解审计数据预处理阶段数据验证的重要性、熟悉审计数据预处理阶段数据验证的内容和方法悉审计数据预处理阶段数据验证的内容和方法q了解其它一些数据预处理方法了解其它
2、一些数据预处理方法 审计数据预处理q概述概述q审计数据预处理理论分析审计数据预处理理论分析q审计数据预处理应用实例审计数据预处理应用实例q审计数据预处理阶段的数据验证审计数据预处理阶段的数据验证q其它数据预处理方法介绍其它数据预处理方法介绍本章主要内容本章主要内容审计数据预处理q数据质量数据质量q单数据源数据质量问题单数据源数据质量问题q多数据源集成时数据质量问题多数据源集成时数据质量问题q审计数据质量实例审计数据质量实例q审计数据预处理的意义审计数据预处理的意义q审计数据预处理的内容审计数据预处理的内容审计数据预处理理论分析审计数据预处理理论分析审计数据预处理什么是数据质量呢?数据质量问题并
3、不仅仅是指数据错误。有的文献把数据质量定义为数据的一致性(consistency)、正确性(correctness)、完整性(completeness)和最小性(minimality)这4个指标在信息系统中得到满足的程度,有的文献则把“适合使用”作为衡量数据质量的初步标准。数据质量数据质量审计数据预处理准确性(准确性(AccuracyAccuracy)准确性是指数据源中实际数据值与假定正确数据值的一致程度;完整性(完整性(CompletenessCompleteness)完整性是指数据源中需要数值的字段中无值缺失的程度;一致性(一致性(ConsistencyConsistency)一致性是指数
4、据源中数据对一组约束的满足程度;唯一性(唯一性(UniquenessUniqueness)唯一性是指数据源中记录以及编码是否唯一;适时性(适时性(TimelinessTimeliness)适时性是指在所要求的或指定的时间提供一个或多个数据项的程度;有效性(有效性(ValidityValidity)有效性是指维护的数据足够严格以满足分类准则的接受要求。数据质量的评价指标数据质量的评价指标审计数据预处理重复的数据重复的数据 不完整的数据不完整的数据 不正确的数据不正确的数据 无法理解的数据值无法理解的数据值 不一致的数据不一致的数据 可能存在的数据质量问题可能存在的数据质量问题 审计数据预处理数据
5、质量问题分类数据质量问题分类审计数据预处理单数据源数据质量问题单数据源数据质量问题审计数据预处理单数据源数据质量问题单数据源数据质量问题审计数据预处理当多个数据源集成时,发生在单数据源中的这些问题会更加严重。这是因为每个数据源都是为了特定应用,单独开发、部署和维护的,这就很大程度上导致数据管理系统、数据模型、模式设计和实际数据的不同。每个数据源都可能含有脏数据,多数据源中的数据可能会出现不同表示、重复、冲突等现象。在模式级,模式设计的主要问题是命名冲突和结构冲突。命名冲突主要表现为不同的对象可能使用同一个命名,而同一对象可能使用不同的命名;结构冲突存在很多种不同的情况,一般是指在不同数据源中同
展开阅读全文