金税三期工程数据架构蓝图设计方案.pptx
- 【下载声明】
1. 本站全部试题类文档,若标题没写含答案,则无答案;标题注明含答案的文档,主观题也可能无答案。请谨慎下单,一旦售出,不予退换。
2. 本站全部PPT文档均不含视频和音频,PPT中出现的音频或视频标识(或文字)仅表示流程,实际无音频或视频文件。请谨慎下单,一旦售出,不予退换。
3. 本页资料《金税三期工程数据架构蓝图设计方案.pptx》由用户(晟晟文业)主动上传,其收益全归该用户。163文库仅提供信息存储空间,仅对该用户上传内容的表现方式做保护处理,对上传内容本身不做任何修改或编辑。 若此文所含内容侵犯了您的版权或隐私,请立即通知163文库(点击联系客服),我们立即给予删除!
4. 请根据预览情况,自愿下载本文。本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
5. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007及以上版本和PDF阅读器,压缩文件请下载最新的WinRAR软件解压。
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 金税三期 工程 数据 架构 蓝图 设计方案
- 资源描述:
-
1、金税三期工程金税三期工程1金税三期工程金税三期工程数据架构蓝图设计方案数据架构蓝图设计方案V1.0V1.0汇报人:总体规划设计项目组汇报人:总体规划设计项目组金税三期工程金税三期工程2目目 录录1 1、概述、概述2 2、数据分布、数据分布3 3、数据交换与共享、数据交换与共享4 4、元数据、元数据5 5、数据治理、数据治理6 6、通用数据标准、通用数据标准金税三期工程金税三期工程3数据架构的目标数据架构的目标p以科学的信息资源观和规划理念,基于合理设计的应用系统的体系结构,并以信息利用能力为目标,构建全局化、规范、统一的数据架构,提高应用系统运行性能,提升税收数据的分析利用价值信息资源(信息资
2、源(Information ResourcesInformation Resources)与人、财、物资源一样,都是企业的重要资源,)与人、财、物资源一样,都是企业的重要资源,金税三期工程金税三期工程41.功能性:满足当前应用的需要。2.灵活性:适应应用功能在一定范围内的调整和扩展。3.长期性:业务数据一旦形成,保证在后续任意时段的可利用。4.前瞻性:为后续新业务提供支持。5.增值性:服务社会,服务国民经济。数据架构规划原则数据架构规划原则增值性前瞻性功能性灵活性长期性数据架构规划数据架构规划金税三期工程金税三期工程5数据架构定位数据架构定位1、数据架构位于应用架构和基础技术架构之间,承上启下
3、。2、应用架构的输出,是数据架构重要、核心的输入;数据架构规划是应用架构落地过程中的重要支撑。3、数据架构中数据逻辑分布尽量遵从于业务架构和应用分布。4、数据架构中的数据物理分布是从技术视角看逻辑分布,结合数据库技术、灾备等,给出相应的规划方案。5、数据物理分布中的技术发展可能带来数据逻辑分布的优化,从而促进应用架构的完善和改进。金税三期工程金税三期工程6架构规划内容架构规划内容数据架构规划的关键内容包括数据分类、数据逻辑分布、数据物理分布、数据共享交换、数据治理、数据标准数据架构规划内容数据架构规划内容n数据分类数据分类 从多个角度包括业务、数据生命周期和数据本身特点对税收产生的数据进行分类
4、,从而分数据的分布夯实基础;n数据逻辑分布数据逻辑分布 从逻辑的角度对业务环节产生的数据进行合理的规划;n数据物理分布数据物理分布 基于逻辑分布和应用架构的划分,从技术的角度对数据的落地进行详细的规划、分析和合理布局,支撑应用落地和解决全国大集中性能问题;数据交换共享数据交换共享 从总局与外部,总局与省局,总局内部各部门间出发,规划数据交换共享的机制和内容 数据治理数据治理 从数据的生命周期管理、数据质量管理和数据安全三面进行规划;数据标准数据标准 简单规划数据标准内容体系;金税三期工程金税三期工程7工作思路工作思路金税三期工程金税三期工程8现状分析现状分析p缺乏统一的规划,多以迅速实现功能为
5、主要目的,缺乏从全局的考虑,造成了缺乏统一的规划,多以迅速实现功能为主要目的,缺乏从全局的考虑,造成了数据孤岛、多头采集、业务数据分散、标准不一等问题。数据孤岛、多头采集、业务数据分散、标准不一等问题。p数据达不到全面性、规范性、一致性的要求,降低了内部管理的效率,不能为数据达不到全面性、规范性、一致性的要求,降低了内部管理的效率,不能为决策分析提供严谨、全面、细致的数据基础;决策分析提供严谨、全面、细致的数据基础;p数据的实时监控能力不强,缺乏掌握全面、及时信息的渠道,无法满足数据的实时监控能力不强,缺乏掌握全面、及时信息的渠道,无法满足“信息信息管税管税”的业务发展趋势,缺少对全国数据的高
6、效利用、业务集成度要求不断提的业务发展趋势,缺少对全国数据的高效利用、业务集成度要求不断提高的支持。高的支持。金税三期工程金税三期工程9数据架构的需求数据架构的需求1.全国国地税税收生产数据在总局集中存储和处理,生产数据的第一次落地点在总局。2.满足应用系统间的松耦合性,实现应用系统间的故障隔离。3.建立数据共享、交换的机制,明确数据内容,保障数据的时效性。4.建立数据全生命周期管理机制,保证系统持续稳定高效地运行。5.建立完备的数据仓库体系,为面向管理决策的应用奠定基础。金税三期工程金税三期工程10目目 录录1 1、概述、概述2 2、数据分布、数据分布3 3、数据交换与共享、数据交换与共享4
7、 4、元数据、元数据5 5、数据治理、数据治理6 6、通用数据标准、通用数据标准金税三期工程金税三期工程11目目 录录p数据分布数据分布数据分类数据分类数据分布内容数据分布内容典型场景典型场景金税三期工程金税三期工程12p 按业务环节进行分类按业务环节进行分类 数据分类方式数据分类方式数据分类数据分类税务数据分类就是满足各种数据对数据组织的要求,并独立于具体的数据模型和数据分布p 按生命周期进行分类按生命周期进行分类 p 按数据结构进行分类按数据结构进行分类 金税三期工程金税三期工程13举例:按业务环节进行分类举例:按业务环节进行分类业务环节业务环节数据子类数据子类数据内容描述数据内容描述税务
8、登记法人基本信息法人的基本信息、状态和关系税务认定税(费)核定信息纳税人应纳税(费)的税(费)种、税(费)目、税(费)率、征期类型、申报期限、纳税(费)期限、征收方式、预算科目、预算级次、金库名称等信息税收优惠优惠信息纳税人享受的各类优惠信息,包括减(抵)免税、税前扣除、增值税即征即退等信息发票税务机关进销存信息税务机关的库存信息,包括发票计划、入库、调拨、核销等信息凭证信息发票计划表、发票出入库单等申报申报信息各种申报记录,包括自行申报、委托代征申报、代扣代缴申报、个人所得税申报等征收应征信息应该征收的税费信息计会统税收计划信息各类税收收入、规费收入计划明细税务稽查稽查案件信息税务稽查案源、
9、案件的基本信息法制违章类文书责令限期改正通知书等评估审计过程信息纳税评估流程数据、国际情报交换流程数据、特别纳税调整流程数据、纳税人纳税信誉等级认定流程数据纳税服务拓展业务信息通过纳税服务渠道向纳税人采集的民意调查、服务评价、投诉举报等信息外部门交换外部门信息从银监会、组织机构代码中心、工商、公安、统计、海关、国库、银行等外部门交换到税务系统的业务数据,包括税款上解入库信息、企业财务报表、企业银行账号、组织机构代码、工商登记、海关报关单等信息CA认证身份认证信息内外部业务工作平台对税务人员和纳税人进行身份认证所需的各类信息决策支持分析主题数据按照各个分析主题进行组织的业务数据金税三期工程金税三
10、期工程14举例:按生命周期进行分类举例:按生命周期进行分类生命周期生命周期数据子类数据子类数据内容描述数据内容描述渠道数据身份认证信息内外部业务工作平台对税务人员和纳税人进行身份认证所需的各类信息比对差异信息税务系统与外部门数据进行比对后产生的差异信息生产数据法人基本信息法人的基本信息、状态和关系自然人基本信息自然人的基本信息、状态和关系扣缴义务人信息扣缴义务人的基本登记信息税务机关进销存信息税务机关的库存信息,包括发票计划、入库、调拨、核销等信息统一视图基于税务整体企业级数据模型组织后的细粒度业务数据,并按照(法人、自然人、发票、风险、税务机构、法规、第三方信息等领域)梳理并整合成统一的数据
11、视图管理决策分析数据 分析主题数据按照各个分析主题进行组织的业务数据指标维度数据用于数据分析的各类指标和维度数据,包括税源分析指标、征管质量与数据质量分析指标、成本分析指标、社会满意度分析指标等税源分析汇总数据包括收入分析、宏观税源分析、微观税收分析、重点税源分析、税收收入趋势分析、税源管理能力平均分析等。报表数据税务系统产生的各类涉税报表数据,包括税收征管、流转税、所得税、计会统、国际税收、税收法制、税务稽查、出口退税等9类报表的明细数据历史数据 在线历史数据征管操作数据的在线历史库离线归档数据按归档年限进行归档的各类业务明细数据和统计数据金税三期工程金税三期工程15举例:按数据结构进行分类
12、举例:按数据结构进行分类生命周期生命周期数据子类数据子类数据内容描述数据内容描述结构化数据业务数据存储在关系数据库中的各类生产数据和分析数据非结构化数据XML凭证按XML结构保存的各类文书凭证信息影像资料通过影像设备采集的各类文书凭证的影像信息内外网站多媒体资料包括PDF文件、图片、语音、视频,地理信息等金税三期工程金税三期工程16目目 录录p数据分布数据分布数据分类数据分类数据分布内容数据分布内容典型场景典型场景金税三期工程金税三期工程17p分析应用系统划分、各个应用系统的特性p分析应用系统之间的数据关系p结合数据分类,将数据划为不同的数据存储集合,形成数据的合理分布架构数据分布数据分布数据
13、分布数据的物理分布数据的逻辑分布金税三期工程金税三期工程18数据逻辑分布原则数据逻辑分布原则p当期数据与历史数据分离当期数据与历史数据分离p操作数据与查询数据分离,减少生产系统压力操作数据与查询数据分离,减少生产系统压力p生产数据与分析数据按不同的数据组织方式分离生产数据与分析数据按不同的数据组织方式分离p体现数据的生命周期管理需求:数据的产生、数据的采集、体现数据的生命周期管理需求:数据的产生、数据的采集、数据的加工,数据的利用和数据的归档几个阶段数据的加工,数据的利用和数据的归档几个阶段金税三期工程金税三期工程19数据逻辑分布框架图数据逻辑分布框架图金税三期工程金税三期工程20数据逻辑分布
14、框架图数据逻辑分布框架图记录当期业务活动发生过程和结果的数据包括与当期操作数据的同构但保留更长时间的数据、实时查询统计和报表所需辅助数据、税源管理数据、按各省清分后的数据通过影像设备采集的各类文书凭证的影像信息和在业务环节中采集或生成的原始业务凭证资料电子明细信息具有高业务价值、跨各业务域被共享使用的核心数据面向业务主题、集成的、历史的细粒度数据面向管理决策分析主题、集成的、历史的、按多个维度深度加工的数据包括在线操作历史数据、脱机存放的历史数据描述流程、信息和对象的数据,涉及数据的技术属性、业务定义以及操作特征金税三期工程金税三期工程21术语说明术语说明p 生产数据:生产数据:n 当期操作数
15、据:记录当期业务活动发生过程和结果的数据;n 近期操作数据:包括与当期操作数据同构但保留更长时间的数据、实时查询统计和报表所需辅助数据、税源管理数据、按各省清分后的数据;n 主数据:具有高业务价值、跨各业务域被共享使用的核心数据;n 凭证数据:在业务环节中采集或生成的原始业务凭证资料电子明细信息;n 影像数据:通过影像设备采集的各类文书凭证的影像信息;p 分析型数据:n 统一视图:面向业务主题、集成的、历史的细粒度数据;n 管理决策分析数据:面向管理决策分析主题、集成的、历史的、按多个维度深度加工的数据;p 历史数据:包括在线操作历史数据、脱机存放的历史数据;p 元数据:描述数据的数据,即描述
16、流程、信息和对象的数据。涉及数据的技术属性、业务定义以及操作特征金税三期工程金税三期工程22数据逻辑分布图数据逻辑分布图金税三期工程金税三期工程23逻辑分布数据内容描述逻辑分布数据内容描述组成子类具体内容渠道数据外部交换数据税库银数据、出口退税报关数据、组织机构代码数据纳税服务数据网上税局、12366、企业端、自助终端、纳税人关系管理内部系统管理数据涉税数据、税务人员身份以及权限数据征管生产数据当期征管操作数据登记、申报、征收、发票、票证、稽查法制凭证影像数据登记表、申报表、出口退税申请表、影像资料等主数据纳税人基本信息、纳税人公共状态、代码数据近期征管操作数据包括与当期操作数据同构但保留更长
17、时间的数据、实时查询统计和报表所需辅助数据、风险处理数据、按各省清分后的数据管理决策数据统一视图法人、自然人、税务机关、大企业、发票、财产、外部信息、知识库管理决策分析数据数据仓库数据、数据集市数据历史数据在线历史数据征管生产数据在一定规则下迁移成历史业务明细数据离线归档数据历史业务明细数据在一定规则下迁移成归档数据金税三期工程金税三期工程24数据物理分布原则数据物理分布原则p 生产数据和分析数据分离p 结构化数据和非结构化数据分离p 不同生命周期的数据分别存放p 数据大集中的性能分担 降低当期交易数据库的数据量 根据业务内聚性,同一业务域的数据尽量放在同一库中 满足业务操作的同时,平衡数据查
18、询的代价 在分的同时,平衡数据交换和共享的代价 在合的同时,平衡应用分包管理的复杂度金税三期工程金税三期工程25物理分布设计的关注点物理分布设计的关注点1.数据的生命周期,与各层的对应2.如何保障申报征收/发票业务的效率,满足高并发性3.查询效率如何解决4.在数据共享和交换时,如何保证业务的连续性,解决应用系统间的故障隔离问题5.如何解决省局决策分析和其他增值业务的数据获取、使用的问题。6.与数据模型、数据标准的关系,支持度如何7.关键点的技术考虑,产品选型的风险金税三期工程金税三期工程26数据物理分布总图数据物理分布总图ETLETL金税三期工程金税三期工程27数据物理分布总图数据物理分布总图
19、金税三期工程金税三期工程28数据物理分布总图数据物理分布总图金税三期工程金税三期工程29数据物理分布总图数据物理分布总图金税三期工程金税三期工程30数据物理分布总图数据物理分布总图主数据主数据管理管理金税三期工程金税三期工程31主数据管理内容主数据管理内容税务主数据是指纳税人基本信息、纳税人公共状态信息等税务核心业务实体的数据,这些信息一般被多个应用系统共享使用。借鉴应用划分的U/C矩阵方法,以征管业务操作平台为例,如下表所示:通过上面的分析我们得出,金税三期主数据为:纳税人基本信息:纳税人识别号、纳税人名称、登记注册类型等;纳税人基础状态信息:纳税人登记状态、增值税一般纳税人资格、纳税人信用
20、等级、防伪税控纳税人资格、出口退税纳税人资格、是否具有其它资格、定期定额征收、减免优惠标志、稽查案件未结、违法违章未处理等;代码金税三期工程金税三期工程32主数据管理方案主数据管理方案如图所示,各系统间已与主数据库建立发布和订阅的实时数据同步。1.某个业务系统触发对主数据的改动;2.主数据管理系统将整合之后完整、准确的主数据分发给所有有关的应用系统;3.任何系统在主数据库改动纳税人信息等主数据后,主数据库向其它系统传递新的纳税人信息等主数据。所有数据更新在实时的情况下进行。4.新的应用系统可以直接使用主数据库,获取完整全面的纳税人基本信息等主数据。并可以在主数据库中直接添加、修改数据,通过发布
21、和订阅把修改数据传递给其它系统5.各系统间的纳税人基本信息等主数据实时地同步,保证了数据的完整和一致金税三期工程金税三期工程33数据物理分布数据物理分布-核心生产库说明核心生产库说明金税三期工程金税三期工程34数据物理分布数据物理分布-核心生产库说明核心生产库说明金税三期工程金税三期工程35数据物理分布数据物理分布-核心生产库说明核心生产库说明金税三期工程金税三期工程36数据物理分布数据物理分布-核心生产库说明核心生产库说明金税三期工程金税三期工程37数据物理分布数据物理分布-核心生产库说明核心生产库说明金税三期工程金税三期工程38征管生产数据库群(一)征管生产数据库群(一)p 属前台生产数据
22、,通过各种渠道从纳税人处采集,包括相关流程数据,覆盖税务登记属前台生产数据,通过各种渠道从纳税人处采集,包括相关流程数据,覆盖税务登记、认定、优惠、申报、征收、发票内外部管理、个税等业务环节;、认定、优惠、申报、征收、发票内外部管理、个税等业务环节;p 业务环节中产生的各类凭证,独立存储在凭证库中;业务环节中产生的各类凭证,独立存储在凭证库中;p 面向增、删、改类型操作,特点为数据量大,增长快,交易并发量高,访问更新频繁面向增、删、改类型操作,特点为数据量大,增长快,交易并发量高,访问更新频繁,事务小,需要实时响应;,事务小,需要实时响应;p 支持纳税人管理、申报征收、发票管理应用;支持纳税人
23、管理、申报征收、发票管理应用;p 申报征收库当前设计是一个库,后续将根据大集中试运行后的性能状况决定是否按区申报征收库当前设计是一个库,后续将根据大集中试运行后的性能状况决定是否按区域分库,最小单位为省。域分库,最小单位为省。金税三期工程金税三期工程39征管生产数据库群(二)征管生产数据库群(二)p 后台生产数据,主要由税务人员在处理风险类业务时采集,以流程类数据为后台生产数据,主要由税务人员在处理风险类业务时采集,以流程类数据为 主,覆盖评估审计、纳税人信用等级、稽查、法制等业务环节;主,覆盖评估审计、纳税人信用等级、稽查、法制等业务环节;p 业务环节中产生的各类凭证,独立存储在凭证库中;业
24、务环节中产生的各类凭证,独立存储在凭证库中;p 面向增、删、改类型操作,特点为数据量小,增长缓慢,访问更新频度低;面向增、删、改类型操作,特点为数据量小,增长缓慢,访问更新频度低;p 支持纳税评估、稽查、法制应用;支持纳税评估、稽查、法制应用;金税三期工程金税三期工程40征管应用数据库群(三)征管应用数据库群(三)p 以会计账务数据为主,数据量很大,增长快,访问更新频度低;以会计账务数据为主,数据量很大,增长快,访问更新频度低;p 业务环节中产生的各类凭证,独立存储在凭证库中;业务环节中产生的各类凭证,独立存储在凭证库中;p 支持税收会计核算应用;支持税收会计核算应用;金税三期工程金税三期工程
25、41p 存储的数据包括:存储的数据包括:n 同征管操作数据保持同结构、保留时间较长的数据,征管操作数据实时复制而得同征管操作数据保持同结构、保留时间较长的数据,征管操作数据实时复制而得n 税源管理数据税源管理数据n 实时查询辅助数据,如报表基础数据、统计基础数据等实时查询辅助数据,如报表基础数据、统计基础数据等n 按省局清分的数据按省局清分的数据p 分担操作数据库的查询、统计业务,减少操作型数据库压力分担操作数据库的查询、统计业务,减少操作型数据库压力n 实时性要求不高的定制报表实时性要求不高的定制报表n 实时跨系统查询统计实时跨系统查询统计n 应用系统和跨系统大数据量的批量计算应用系统和跨系
展开阅读全文