国家审计署数据司:大数据技术及应用探索课件.pptx
- 【下载声明】
1. 本站全部试题类文档,若标题没写含答案,则无答案;标题注明含答案的文档,主观题也可能无答案。请谨慎下单,一旦售出,不予退换。
2. 本站全部PPT文档均不含视频和音频,PPT中出现的音频或视频标识(或文字)仅表示流程,实际无音频或视频文件。请谨慎下单,一旦售出,不予退换。
3. 本页资料《国家审计署数据司:大数据技术及应用探索课件.pptx》由用户(晟晟文业)主动上传,其收益全归该用户。163文库仅提供信息存储空间,仅对该用户上传内容的表现方式做保护处理,对上传内容本身不做任何修改或编辑。 若此文所含内容侵犯了您的版权或隐私,请立即通知163文库(点击联系客服),我们立即给予删除!
4. 请根据预览情况,自愿下载本文。本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
5. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007及以上版本和PDF阅读器,压缩文件请下载最新的WinRAR软件解压。
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 国家审计署 数据 技术 应用 探索 课件
- 资源描述:
-
1、大数据技术及应用探索CNAO审计署数据司 目录Contents1审计大数据价值(3个引例)2从数据分析走向大数据分析3创新审计技术方法4践行数字化审计方式01审计大数据的价值央企供应商分析 全国土地矿产资源分析全国小微企业分析n 利用分词技术,对十九大报告等76篇习近平同志重要讲话文本进行深度学习n 初步定量识别出较有代表性的53组高频词高频词坚决维护习近平总书记在党中央和全党的核心地位坚决维护党中央权威和集中统一领导围绕“五位一体”总体布局 -从八个方面开展数据分析“四化四化”一手抓发现问题-重大违法违纪问题的重点领域和关键环节1重大物资采购和招标投标2土地和矿产资源交易3贷款发放和证券交易
2、4国有资产和股权转让5财政资金分配6重大投资决策和项目审批坚持问题导向一手抓促进体制机制完善,促进政策完善着力维护经济安全密切关注经济社会运行中的薄弱环节,关注财政、政府债务、金融、能源、矿产资源、水资源、粮食、生态环保等方面的风险隐患,防范系统性和区域性风险经济安全政策落实深化改革着力推动政策落实要围绕国家重大政策措施和宏观调控部署的贯彻落实,始终关注重大项目落地、重点资金保障、重大政策落实等情况,促进去产能、去库存、去杠杆、降成本、补短板,促进经济结构转型升级,推动协调发展完善着力推动深化改革全面深化改革的重大部署,始终关注改革部署的推进情况和创新探索,关注发展中的新情况、新问题,关注体制
3、性机制性问题,积极提出解决突出问题和推动长远发展的建议,促进形成有利于创新的体制机制,推动创新发展。引例1 -供应商分析 数据资源:企业名单 一家企业的名字 国税增值税专用发票数据 购货方、销售方、发票金额、发票税额、开票日期 足不出户,掌握全国主要商品流通的情况 工商登记数据 登记状态、登记时间、投资人、工商变更 足不出户,掌握全国企业设立的情况 分析方案:递归提取该企业下属子公司名单 提取供应商名录 目标企业及子公司作为购货方的记录汇总 供应商实力分析 供应商异常特征检测供应商异常特征检测 依存度分析 集群分析集群分析引例1 -供应商分析民营企业 工商数据:企业性质注册资本金小于100万元
4、 工商数据:注册资本及实缴资本成立时间较短 工商数据:成立时间 特别是成立不到一年即获得大量订单的企业已注销 工商数据:企业状态 合同签订时实力值得怀疑等等引例1 -供应商分析供货来源异常复杂 购货来源各种公司,疑似采购掮客突现的中间环节 在老供应商之间插进的第三者循环开票 贸易背景虚假的融资行为(假贸易,真融资)贸易背景虚假的融资行为(假贸易,真融资)利随人走(供应规模激增)等等供应商异常特征检测离散点检测-供应规模激增异常离散点检测-可视化结果依存度分析-集中数据分析的优势 依存度=某供应商向被审计单位供货金额/同一时间该供应商全部供货金额 行业垄断程度越高,供应商平均依存度越高 越高的依
5、存度,意味着供应商通过关系人获取订单的可能性越大、被审计单位对供应商的话语权越大、索贿的可能性越大依存度分析集群分析集群分析利用全国工商数据-上追供应商三级股东,形成投资关系网,利用社会网络分析技术识别出供应商集群优点:从群体的视角看供应商 不遗漏依存度低的供应商 可视化大数据 更好的洞察力该例子的特点 没有内部数据的大要案分析 国税、工商、社保、个税、户籍等外部数据 利用大数据分析技术增强信息洞察力 异常点检测 可视化 集群分析 一家/多家集团企业,一次性全覆盖引例2:谁控制着中国的土地矿产资源?引例3:政策跟踪审计 清洗整理国地税、海关、货运、电力、金融、工商等数据,利用企业名称,纳税识别
6、号关联分析,真实反映各企业的运行情况从产业政策、财政政策、金融政策等方面提出建议小微企业大众产业、万众创新-小微企业政策落实情况 梳理小微企业的税收优惠、财政政策,金融政策,明确审计思路第一步:从各省国税、地税系统中提取小微企业名单、小微企业纳税情况,按统一格式生成全国的标准表。“小微企业你还好吗?”第二步:将小微企业名单与财政、海关、电力、货运、银行的数据相关联。根据生成的数据结果,提炼每一类经济数据所代表的小微企业特点,从规模、行业、地域、趋势等多个视角分析小微企业的状况。此外,我们还做过02从数据分析走向大数据分析大数据的基本概念与特征 对大数据分析局限性的认识 大数据分析的发展路径26
7、审计数据分析的发展路径大数据分析阶段数据分析割据阶段大数据+查询分析数据分析割据大数据+大分析大数据+小分析持续发展今天,审计事业发展对审计数据分析工作提出了更高要求拓展大数据技术运用,.大幅提高审计的精准度和时效性;从宏观层面加强大数据关联分析,提高研判宏观经济发展趋势、感知经济社会运行风险、发现违纪违法问题线索的能力。-审计署2016年工作要点目前,审计署已经归集了相当规模的数据信息,但我们推进审计技术方法和手段创新还不够,对数据的深度挖掘、综合分析和运用还很不充分。-刘审,各单位和省级审计机关主要负责人专题研究班五年来,审计方式方法实现新突破。-刘审,全审工作会议,2015.12。审计署
8、办公厅关于进一步提高审计工作质量和效率的几点措施 2017年2月统筹整合数据资源。各业务司、各派出机构要严格落实数据定期采集制度,同时根据年度审计项目需要,及时补充采集有关数据,送数据司统一集中管理。数据司要紧密结合宏观经济形势和社会热点,以维护国家安全、服务宏观决策为重点,组织持续对已收集的各类数据开展跨领域、跨层级、跨系统、多维度的贯通分析,对分析发现的疑点按规定组织核查后,及时向党中央、国务院报送相关情况。各业务司、各派出机构组织实施各类审计中,都要坚持数据先行,组建数据分析组开展数据综合分析,确定审计重点和锁定疑点线索,为编制审计工作方案、实施方案和现场审计提供引领支撑。“四化四化”二
9、、大数据是什么1.VolumeVolume2.VarietyVariety3.value4.VelocityVelocity结构化数据、半结构化数据和非结构化数据非结构化数据的超大规模和增长,占总数据量的8090%,比结构化数据增长快10倍到50倍,是传统数据仓库的10倍到50倍价值高,价值密度低大量的不相关信息,不经过处理则价值较低,属于价值密度底的数据要求实时获取数据大数据区分于传统数据最显著的特征。如今已是ZB时代,在如此海量的数据面前,处理数据的效率就是企业的生命数据量巨大全球在2010 年正式进入ZB 时代,IDC预计到2020 年,全球将总共拥有35ZB 的数据量大数据是一种战略资
10、产,是战略资产意味着它是可以产生巨大价值的,而且它的价值要发挥出来还需要新处理模式,这点很重要;然后才是它具有海量的、高速增长的和多样化这些特征。大数据的“大”Normally,big data is scaled by PBEBZBYB.32byteKBMBGB/TBPB/EBZB/YB大数据的“数据”?大数据的大数据的“数据数据”,是非结构化数据与结构数据的融合。,是非结构化数据与结构数据的融合。我们的审计大数据是所有涉及国民经济运行的主要数据,虽然当前我们审计大数据主要基于结构化数据但非结构化文档、互联网网页、社交数据对审计的价值也是毋庸置疑的,甚至将来随着我国物联网行业的发展,来自传感
11、器数据也会成为审计大数据的来源。在审计实践中,其实我们还遇到过结构化数据中的文本信息处理的障碍,比如全国工商数据中的工商变更信息不能结构化,就无法精确掌握企业历史股权变动信息?再比如全国海关数据中的商品规格型号不能结构化,我们也无法精确指向具体报关商品?汽车一直以来就是四个轮子、一个方向盘、两排沙发你和汽车相关的每一个行动都数字化,包括每一次维修、每一次驾驶路线、每一次事故的 录像、每一天汽车关键部件的状态,甚至你的每一个驾驶习惯(如每一次的刹车和加速)都记录在案。车辆保险业:一共分为四种客户,第一种是连续两年没有出车祸的,第二种过去一年没有出车祸,第三种过去一年出了一次车祸,第四种是过去一年
12、出了两次及以上车祸的,就四种类型。通过大数据,我们可能有全新的视角来发现通过大数据,我们可能有全新的视角来发现新的商业机会和重构新的商业模式。新的商业机会和重构新的商业模式。新智慧生物的诞生?新智慧生物的诞生?大数据带来的三个思维转变1、样本=总体在大数据时代,可以分析更多的数据,甚至可以处理和某个特别现象相关的所有数据,而不再依赖于随机采样。传统数据时代大数据时代2、容忍混杂性数据如此之多,以至于我们不再执着于追求精确度。3、因果到相关不再热衷于寻找因果关系,而是转而寻找事物之间的相关关系。19 世纪以来,当面临大量数据时,都依赖于采样分析。但是采样分析是信息缺乏和信息流通受限制的模拟数据时
13、代的产物。传统数据处理追求“精确度”,这种思维方式适用于掌握“小数据量”的情况,因为需要分析的数据很少,所以我们必须尽可能精准地量化我们的记录。寻找因果关系是人类长久以来的习惯。即使确定因果关系很困难而且用途不大,人类还是习惯性地寻找缘由。高性能数字技术的发展突破了这种限制。与局限在小数据范围相比,使用一切数据为我们带来了更高的精确性,也让我们看到了一些以前无法发现的细节大数据让我们更清楚地看到了样本无法揭示的细节信息。大数据纷繁多样,优劣掺杂,分布广泛。拥有了大数据,我们不再需要对一个现象刨根究底,只要掌握大体的发展方向即可,适当忽略微观层面上的精确度会让我们在宏观层面拥有更好的洞察力。在大
展开阅读全文