大数据支撑下的税收治理解决方案.pptx
- 【下载声明】
1. 本站全部试题类文档,若标题没写含答案,则无答案;标题注明含答案的文档,主观题也可能无答案。请谨慎下单,一旦售出,不予退换。
2. 本站全部PPT文档均不含视频和音频,PPT中出现的音频或视频标识(或文字)仅表示流程,实际无音频或视频文件。请谨慎下单,一旦售出,不予退换。
3. 本页资料《大数据支撑下的税收治理解决方案.pptx》由用户(晟晟文业)主动上传,其收益全归该用户。163文库仅提供信息存储空间,仅对该用户上传内容的表现方式做保护处理,对上传内容本身不做任何修改或编辑。 若此文所含内容侵犯了您的版权或隐私,请立即通知163文库(点击联系客服),我们立即给予删除!
4. 请根据预览情况,自愿下载本文。本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
5. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007及以上版本和PDF阅读器,压缩文件请下载最新的WinRAR软件解压。
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 数据 支撑 税收 治理 解决方案
- 资源描述:
-
1、大数据支撑下的税收治理大数据支撑下的税收治理 治理两字,字典上解释为:整治,调理,整修,改造。这是什么意思呢?就是说,治理一定是对已经存在的事物,已经构建并正在运行的事物进行修补、改造、调理、整治,完全没有推倒重来的意思。把握好这个尺度,就不会出现偏差。至于税收治理,它是指国家在立法、行政和司法机关之间、中央与地方之间,以及政府、社会组织和公民之间对税收权力的配置和运用,通过彼此之间的合作和互动,以达到引导、控制、管理、协调和服务税收目标的活动。我们沿着这个定义,看看当前税收中有哪些需要治理的呢?第一,立法方面。第二,政策方面。第三,执法方面。第四,司法方面。第一,立法方面。上面列举了税收治理
2、需要做的一些事情,这只是税收治理中很少的一部分,我们换个角度,在下图税收管理的诸方面恐怕能找出更多的需要治理的内容。那么,大数据支撑下的税收治理应该怎么做呢?第一,要把税收治理当作国家治理体系和治理能力的重要组成部分,治理的根本目的是“降低征纳成本,提高征管效率,增强税法遵从度和纳税人满意度,提高中国税务在国际上的影响力,确保税收职能作用充分有效发挥,促进经济健康发展和社会公平正义。”这是王军局长的话。第二,鉴于大数据及其应用渗透到税收工作的各个环节和方面,建议成立大数据管理与协调领导小组,统辖大数据战略与全局。进行大数据顶层设计和规划。建立大数据相关制度、机制和工作方法。税收治理仅仅是大数据
3、支撑下整个税收工作的一个方面,要统筹大数据支撑下的各项税收工作的目标、任务、分工和进度。第三,数据是首要问题。首先要清楚你心里想要的是什么样的大数据。在此基础上,进一步深入研究并建立大数据的采集、传输、存储、校验、分配、使用和发布的标准及规范体系。根据我们的经验,一项大数据分析,数据整备占60%时间。由此可见,改善税收数据质量是信息管税,加强征管,优化服务与实现大数据分析应用的基本前提和必要准备。第四,分析方法是大数据应用的核心。一把钥匙开一把锁,当税务系统内部的数据与外部其他政府部门数据、电商数据、社区数据、银行数据、自然人数据形成跨界数据时,分析方法成了重中之重。对于指标法,我们的基本判断
4、是,它是眼下税务系统正在使用的主流方法,简答明了,易于理解,它依然可以继续使用,但是你心里要明白,众多定量化的指标只能从某个角度、某个视角反映纳税人的特征,当出现10万家企业,每家企业过筛出100个以上的指标偏离可信区间时,你将如何作出取舍?哪家是你的关注重点?尤其在纳税遵从风险识别任务中,指标法难以全面刻画量化风险。对于传统统计计量方法,我们指的是使用数学模型的方法,包括因子分析、主成分分析、数据包络分析(DEA)、随机前沿分析、判别分析与多元线性回归分析等等。一是不能接受全指标变量,而大数据变量远远超出它的承载能力;二是每一种数学模型都有严格的假设条件,而大数据哪儿去找那么多符合正态分布的
5、数据呢?所以,它的使用会越来越受到大数据及其复杂分析主题的挤压。我们最终认定,机器学习法正是面向复杂数据和大数据分析的最优方法。它是在概率论、统计学、逼近论、凸分析等诸多算法的基础上利用计算机强大的解析能力而发展起来的。一是完全不受指标变量约束,自变量100个也行,1万个也行;二是模型完全从数据出发,用一个地区、一个行业、一类客户、一种事务的数据训练出可以反映其内在规律的模型,然后再对新的同类数据做测算。如果训练的数据样本足够丰富,训练的频度足够密集,算法模型就是在不断进化、不断优化、不断逼近真相的过程中。第五,要深入研究并建立强大有效的大数据技术体系。税务大数据应用是难以想象的复杂工程,它是
6、硬件、软件、网络、应用系统、标准、安全、运维、工程、制度、业务、技术、流程、组织、管理、资金、人员的有机结合与团队的联合作战。对此要有足够的思想准备。一定要落实大数据应用的责任主体。这张图是国家税务总局数据资源建设项目云平台数据管理子项目的结构图。我们充分注意到,在规划书中提到,这个平台将提供应用基础,为各司局、省局自行开发应用项目提供基础数据和工具,鼓励多样性应用开发,并体现“众包协助”要求,以提供基础数据服务为主,形成数据统一加工和应用多样开发结合的格局。规划书中还表示,这个平台为全国各省局数据开发利用提供从硬件建设、数据治理和应用开发的示范性模板,推进全国税收数据利用水平提升。这些提法为
7、各省自行开发应用项目铺平了道路。第六,要高度关注并追踪大数据税收法律法规体系的进展,包括上位法的进展。要把握好大数据的采集权和使用权的边界。要尊重大数据应用中的争议解决、仲裁和维权保障的国家法律与规章制度,包括对弱势一方的纳税人的隐私保护和社会公众对税收大数据的知情权和使用权的保护。第七,要深入研究并建立大数据人才培养体系。实战本领(1)提出分析目标或分析主题的能力;(2)整备数据的能力;(3)选用方法及模型的能力;(4)解析预测结果的能力;一、大数据大数据体量庞大;大数据类型多样;大数据是高速运行的;大数据是沙里淘金,为此,就非得使用大数据的分析方法不可。二、大数据的价值国家观点企业观点专家
8、观点三、大数据的三维解析:理论、实践、技术1.大数据的理论解析2.大数据实践中的三大主体与一个最大推手3.大数据的5项技术四、大数据支撑下的税收治理第一,立法方面第二,政策方面第三,执法方面第四,司法方面大数据支撑下的税收治理应该怎么做呢?共7点建议。报告的报告的提纲提纲微观税收流失率微观税收流失率测算方法研究测算方法研究一个用大数据机器学习算法模型测算行业税收流失率的完全案例税收缺口与税收缺口与税收流失率计算公式税收流失率计算公式1 1纳税人应当缴纳的税款与实纳税人应当缴纳的税款与实际缴纳的税款之间的差额际缴纳的税款之间的差额1-1 1-1 税收缺口定义税收缺口定义这里这里“应当缴纳的税款应
9、当缴纳的税款”是指综合考虑税法条是指综合考虑税法条例和税法精神所确定的最终税额。例和税法精神所确定的最终税额。1-2 1-2 税收缺口组成结构税收缺口组成结构本讲研究的是税收净缺口本讲研究的是税收净缺口1-3 1-3 税收流失环节税收流失环节如图红线所示,我们如图红线所示,我们由于纳税人不遵从税法,由于纳税人不遵从税法,进行虚假申报导致的税收流失进行测算。进行虚假申报导致的税收流失进行测算。(纳税人应当缴纳税额(纳税人应当缴纳税额实际缴纳实际缴纳税额)税额)/应当缴纳税额应当缴纳税额*100%100%1-4 1-4 流失率计算公式流失率计算公式等同于:等同于:流失金额流失金额/(流失金额(流失
10、金额+实际缴纳税额)实际缴纳税额)*100%100%税收流失率税收流失率测算方法概述测算方法概述2 2税收流失率测算方法概览税收流失率测算方法概览研究所的测算方案研究所的测算方案3 33-0 3-0 测算方案总体架构测算方案总体架构3-1 3-1 确定待测总体确定待测总体主题库主题库地区库地区库时间库时间库行业库行业库规模库规模库税种库税种库未来设想未来设想分析样本数据库分析样本数据库清洗规则库清洗规则库指标库指标库工具库工具库模型库模型库3-2 3-2 形成分析数据库形成分析数据库研究所起草了详尽的研究所起草了详尽的“数据数据需求需求”文档,包括:取数范围、内文档,包括:取数范围、内容和规则
11、的要求。容和规则的要求。第一步第一步 提出数据需求提出数据需求 明确指出明确指出“管理服务类数据、申报征收类数据、税务管理服务类数据、申报征收类数据、税务稽查类数据、财务报表类数据、相关代码表、稽查类数据、财务报表类数据、相关代码表、第三方信息等是数据采集的边界。第三方信息等是数据采集的边界。考虑到目前国内运转着多个征管软件版本,为了方便各地理解,考虑到目前国内运转着多个征管软件版本,为了方便各地理解,研究所特别以文字表述方式给出了研究所特别以文字表述方式给出了“取数相关表格内容取数相关表格内容”。这样,。这样,各地、各版本对字段取值不会再产生歧义。各地、各版本对字段取值不会再产生歧义。实际采
12、集数据实际采集数据7474张表,张表,14.714.7亿条记录。亿条记录。为此,三下为此,三下S S省省第二步第二步 取数与存储取数与存储 第三步第三步 初筛初筛根据根据S S省数据的实际情况,制订了筛选样本企省数据的实际情况,制订了筛选样本企业的规则,对原始数据进行初步清理。业的规则,对原始数据进行初步清理。初初筛筛规规则则1.1.停业户、证件失效户、注销户、注销停业户、证件失效户、注销户、注销迁出户等非正常户;迁出户等非正常户;2.2.进行了税务登进行了税务登记但经确认为起征点以下的纳税户;记但经确认为起征点以下的纳税户;3.3.小规模纳税户;小规模纳税户;4.4.一般纳税人中不一般纳税人
13、中不缴纳企业所得税的纳税户;缴纳企业所得税的纳税户;5.5.该申报该申报而未申报增值税、企业所得税的纳税户而未申报增值税、企业所得税的纳税户征收征收信息信息财务财务信息信息登记登记信息信息初筛之后,进一步在登记信息、申报信息、征收初筛之后,进一步在登记信息、申报信息、征收信息、财务信息和第三方信息中寻找同时存在的信息、财务信息和第三方信息中寻找同时存在的企业户,就此形成分析数据库的初步形态企业户,就此形成分析数据库的初步形态申报申报信息信息计:计:140,937140,937户户第第四四步步 寻寻找找交交集集第五步第五步 终筛终筛 在分析数据库的初步形态基础上,制订在分析数据库的初步形态基础上
14、,制订终筛样本企业的规则,形成终筛样本企业的规则,形成分析数据库的最终形态分析数据库的最终形态终筛终筛规则规则能不能不做终筛?不能。能不能不做终筛?不能。指标值为空,如何计算?指标值为空,如何计算?指标值极度异常,肯定影响指标值极度异常,肯定影响分析结果。这里分析结果。这里,流动资产占流动资产占总资产比例总资产比例11且且00,在财务,在财务会计原理上无法讲通。会计原理上无法讲通。不符合常理:不符合常理:总资产周转率为总资产周转率为482,104,734482,104,734次,平均次,平均每分钟转每分钟转917917次次再举一例再举一例本课题最终确定本课题最终确定以以20102010年年 S
15、 S省省 批发零售业批发零售业107,719107,719户户企业作为测算对象企业作为测算对象从从税税额额占占比比看看20102010年年 S S省批发和零售业省批发和零售业企业所得税为企业所得税为 276 276 亿元亿元第六步第六步 评估测算样本的代表性评估测算样本的代表性12样本企业样本企业107,719 107,719 户户261.9261.9亿元亿元95%95%非样本企业非样本企业5%5%107,719107,719户样本企业已有足够代表性户样本企业已有足够代表性从从户户数数占占比比看看第七步第七步 指标优化与计算指标优化与计算 “宽表宽表”“宽表宽表”!共共117117个指标(还不
16、包括第三方数据)个指标(还不包括第三方数据)研究所认为,实现研究所认为,实现“宽表宽表”是是保证税收流失率测算正常保证税收流失率测算正常开展的基本形态开展的基本形态第八步第八步 撰写数据质量综合分析报告撰写数据质量综合分析报告通过这八步,完整地形成了包括数通过这八步,完整地形成了包括数据采集范围、采集内容、存储、清据采集范围、采集内容、存储、清洗、分类、组织、应用准备等一整洗、分类、组织、应用准备等一整套的套的“治数治数”规则和方法。为课题规则和方法。为课题研究奠定了基础。研究奠定了基础。信息管税的信息管税的“信息信息”二字,就是指二字,就是指要对税收经济数据实现全面掌要对税收经济数据实现全面
17、掌控,非如此,不能管税。控,非如此,不能管税。更不能应用于科学分析。更不能应用于科学分析。对于数的理解到此结束。对于数的理解到此结束。我相信,不管我说的多么言之凿我相信,不管我说的多么言之凿凿,依然会有人认为,仅靠企业凿,依然会有人认为,仅靠企业自报的数据,是算不出能让人信自报的数据,是算不出能让人信服的结论的,也就是说,立基于服的结论的,也就是说,立基于不可信数据基础上的模型测算,不可信数据基础上的模型测算,基本不靠谱。基本不靠谱。我的基本观点是:我的基本观点是:不是所有企业在所有时间、所有地点、所有税种、不是所有企业在所有时间、所有地点、所有税种、所有指标、所有科目上造同样的假!所有指标、
展开阅读全文