1、Python数据分析技术在 在公务用车加油审计中的应用 【摘要】现代审计中,随着审计的数据量越来越大,传统的 审 计手段很难满足大数据的审计要求。引入Python可以更好的 解决大 数据审计的问题。 【关键词】大数据审计Python 公务用车使用、管理涉及落实中央八项规定精神、领导干部 执 行廉政纪律情况,是巡视巡查、内外部审计关注重点。而公车 私用、 私车公养又是车辆审计的重中之重。公车加油审计需将审 计期间全 部车辆的加油、ETC通行记录与派车单、公车使用管理 台账等进行比 对分析,表单多、数据量大,传统的手工抽样方式 难以实现审计全 覆盖,存在审计风险。运用Python的数据处理、 分析
2、、可视化展示 等优势,对某支行公车加油情况进行检查,查 实该支行在审计期间 “公油私用”37次、金额7892. 92元的违 规问题。 一、主要数据分析思路及方法 审计组总结“公油私用问题发生的规律及特点,列出了四 个 关注点:一是加油时间是否异常。包含是否存在节假日加油、 周末 加油、非工作时间加油。二是是否存在一段时间连续加油。 三是车 辆百公里油耗是否正常。四是是否存在未经审批的异地加 油。 ()法定节假日加油。将法定节假日库导入Python,通过 关键词“交易时间,将加油对账单中全部加油时间快速提取并 与法定节假日库进行比对,筛选出节假日加油记录并进行可视化 图1国家法定节假日加油统计示
3、意图 展示结果表明:2019年国庆节、2020年春节、劳动节均有 加油 记录。审计人员与派车单、公务用车使用管理台账核对,发 现上述 节假日并无派车记录。 (二)周末加油。通过关键词“交易时间”,将加油对账单 中 全部加油时间快速提取,利用Python “week_day”函数将交 易时间转 化为周一到周日格式,并统计周一至周日加油次数,将 统计结果进 行可视化展示,如下图: 日崽 图2周一至周日加油统计示意图 展示结果表明:周六、周日均有加油记录,车牌号5751加 油次 数最多。审计人员将周日加油日期与派车单逐一核对,发现2019年9 月22日、2019年10月6日、2019年12月1日、2
4、020年2月 2日均无派车记录。 3.非工作时间加油。通过关键词“交易时间提取一天不同 时 间段加油记录,并统计非工作时间加油次数,将统计结果进行 可视 化展示,如下图: 展示结果表明:4: 00-6: 00、18: 00-20: 00、20: 00-22: 00均有加油记录,与派车单、ETC通行记录逐一核对,发现2019 年9月26日、2019年10月15日、2019年10月22日、2019年11 月29日、2019年12月1日、2020年1月9日、2020年2月2日、2020 年3月6日、2020年4月28日、2020年4月30日加油均与行车记录 不符。 4.连续加油(连续多日、一天多次)
5、。利用Python提取连续 N日(N2).一天N次(总2)加油记录,与派车单、公务用车 使用 管理台账、ETC记录核对,将统计结果进行可视化展示,如 下图: 图3天不同时间段加油统计示意图 曰嬢 卡号I林卡人丨 文易时目Ixfle II单价 图4连续多日、一日多次加油统计图 展示结果表明:2019年9月-2020年5月,存在多次连续多 日、 一天多次加油记录, 其中2019年9月29日、2019年10月15日、2019 年10月22日、2019年11月4日、2019年11月5日、2019年11月 28日、2019年11月29日、2019年12月23日、2020年1月7日、 2020年1月8日、
6、2020年1月9日、2020年1月17日、2020年2月 24日、2020年3月6日、2020年3月12日、2020年3月25日、2020 年4月21日、2020年4月23日、2020年4月24日、2020年4月30 日与派车单、公务用 车使用管理台账、ETC等记录不符。 1000113200020639825 1000113200020639825 1000113200020639825 1000113200020639825 1000113200020639825 1000113200020639525 1000113200020639825 1000113200020639825 100
7、011320002063982& 1000113200020639825 1000113200020639825 1000113200020639825 1D0011320002063982S 1000113200020639825 1000113200020639825 1000113200020639825 1000113200020639825 1000113200020639825 1000113200020639825 1000113200020639825 1000113200020639825 1000113200020639825 1000113200020639825 100
8、0113200020639825 1000113200020639823 1000113200020639825 1000113200020639825 1000113200020639&25 1000113200020639825 romrom贝闪罚风风贝贝raro贝贝b贝 raB B 贝贝W W贝贝WW贝贝贝ro贝贝 P3P3贝R R贝贝ReRe贝贝ee贝贝e贝RP3RP3贝ro贝贝贝e贝贝贝e贝R R 7T7T3习马旧习 习月习耳月习习冯3 3习马3 3习马月耳习3PT马月3 3 7019-09-2607-32:01 019-09-27151115 2019-10-21114336 01
9、9-10-22193051 019-11-04114246 *2019-11-0318:1602 2019-11.06145744 019-11-2708-13-48 *2019-11-2813.22.03 *2019-11-29130227 019-12-0518:51:47 *2019-12-0610.23.24 *2019-12-23 16 44 07 ?0 的22413:02:19 019-12-2513:2145 *2020-01-07 12 OB U 02001-0916-4401 020-01-091858:31 02001-1613:58:03 020-01-17112028
10、020-02-23150356 *2020 0224 11:33.26 *2020-02-25140259 020-04-2019:4:16 *2020-042110.02.51 *2020-04-23 17 3750勿 20042416:06:19 *2020-042709.06.36 020-04-20 2120 17 油油血油油油:油油油血血油油油油油尬: tc tc 协如加加加加加tc tcmm加加 加加.tcfc .tcfc加加如加协加加加加加加加加 775 1792目车用玄2 27 2S8 7495E车用旳0 44 r328 99 92冬车03 325 0595号车用6 37 38
11、1 295E车用知38 *275 3393E车用旳878 302 0792号车用&5 22 勺笳6592三车用尢3 93 320.1293弓张用畑 勺48 0892号车用曲172 *288 7695吕车用咼 % 1-392W午用加.44 *261 5792号车用之38 58 201 2392W车用$9 68 *406.4395E车用网6.37 303 3292启车用 左3 58 313 292写车用左5 0 r200 07 95E车用270 *246 9492启车用才35 48 290 3295号车用:39 18 26( 5892W车用Zn 52 力393弓牛用旳1.24 5 5 1717 0
12、 0 0 0 6 67 7 卞? 163163737316167373 7%EV7%EV先r-b.lpr-b.lp 78787878 7777的.4964494949.4964494949 8 8先弓8r-8r-b b儿n n 8 8r-nr-n 23913 巾39 10863 勺783 58 r1675 25 r1399 92 r1097 85 勺65 *4680.03 力332 45 3349.04 *21909 伽67 583.24 勺57 88 tUG8 *444 61 *2 86 *47125* 引30 25 30乂.93 勺743 07 42627 *265.09 勺54钿 978
13、隔 1.98 *4401 3 2019为3建云盪商公尝姑 20,9027 il云左用面徴絡砧*2019-10-21 连 N 屯电时环城冷站 r2019-10-22 建云0笔商坏Ml宋站2019-11 tl云住用図攻笳站*2019-11-05 连 N 黑泡南处兴冷帖2019-11X16 iIWP缢內公兴砧*2019-11-27 0 云羽防以以结站 r2019-11-28 连 N 淞泡由仝兴站 r2019-11-29 2O19-1200 云羽何以垃结站 r2019-126 :2019 12 23 2019-12-24 F2019-12-25 *2020-01-07 支云荒年商公冥姑 曲云姦洱面 晰
14、兴掐砧 连云虫公兴牯 *2020-01-08 iiW笔商坏煉跆箔 F2O2M14 疔云左用面煤絡站 *202001-16 谨 N 屯泡由环城冷帖 r2020J31-17 公去牯20223 0 云处沿用汗垛结站202X20 连 N:屯泡阳坏城冷帖 r2020JX2-25 航吴冷牯 r202GJM-20 0 云站 r2020019-10-15怜43 29 019-11-29 13 02 27 *2019-11-29 18 28 41 01012.23 11 34 38 2019-12-23 11 36 02 r20112-23 16 44 07 020-0X06 18 14 55勿 23)3)6
15、48 33 23匀23)3 06 18 35 49 0200X12 14 27 48勺23)42 17 27 05 *2020-05-25 11 13 26 0204)3-25 11 33 45 0204)3-25174623 0204)4-30 14.05 01知 23)丿30 18 1918 16448 r144 78 *256.47 r156 78 5801 *244.57 r148 8 rl59 19 1 的.02 15 82 衣号车69 &52 生用芦17 67 9 牡 忘 用51.05 95号 生 阳 巾 143 92目生 用 艺31 51 92E车 用才51 72 92号 生用右
16、8 84 92 号车用flO9 92E 车用茗24 44 9 疋生尉才38 58 95号车用4 55 务E车21 61沁 车阳岁38 28 95 号车用/23 4昉 三生用力8 51 905:/41.8895 号车用巾5 48 昉乞主爲芦27 26 92E车用Z34 43 92号峯用右 1 99 71 0 0 ( (482a01為老甫人尺呛热 u roo *4701 85 直云召处富坏8恰 7.u ro.o ”380206 旌云*在毎胳站 7.u*00 r3649 05 谊云疮宦苗坏诡皓 r6 71roo 3437 62 连云召滾窝幷城於 6 73 roo 33245 边云盅溟I?公汽皓 %7
17、3*00*4205 66 谊云冷足雨廉诡捲 r6 78roo 2625 56 6 780 r24524? 边云盅农常环城招 r6 78roo 390 9 逹云总星M六匪 r67roo 0253 44谩壬电淞甯坏城吊 I 7 Foor2108 66 边云盅程常环城呆 6.7 ro.or185Z19 连云范E帛斤腻招 r67 勺0 r165 41 连云老漣官开城吊 飞7 roo 仙4 如 ro.o 119283 逹云范迟坏区将 r5&4roo 1044 03 復云為屋甫坏城招 roo 304 84连云召浸5?幷8忌 5.49 ro.o 721228 逹云专&幣汗/於花 r5 49Foo *4146
18、 46 iS云冷*页坏 201909-29 0190929 2019-10-15 2019-10-15 019-10-15 r20!9-11-29 2019-11-29 019-12-23 r20!9-12-23 r2019-12-23 020-006 勿23)乂6 *202006 02003-12 *2020-03-12 *202005-2 2020025 2020 心 25 02004-30 2020-4-30 0.0 勺 Q 亦 r0.0 7) )o 5.百公里油耗。利用Python按月提取加油量和一车一档行 驶 里程数据,计算百公里油耗,将百公里油耗趋势进行可视化展 不O 展示结果表明
19、:2019年3月-2019年9月,月平均油耗10.49, 2019年10月至2020年5月,月平均油耗大幅增加为17. 14,增 长率 达63.4%,与实际派车情况不符。 6.异地加油。通过剔除关键字“连云港”提取异地加油记录, 并统计异地加油量,将统计结果进行可视化展示,: 月份 图5 5751车在2019年-2020年5月百公里油耗变化示意图 5- 0- MftIR 3M汀3MV ! WAfllE WSIZI SVtlfl 1V92RWA 5 5 2 2 0 0 图6异地加油示意图 展示结果表明:2019年1月-2020年5月,异地加油共有五 次, 与派车单、ETC通行记录核对,发现“上海
20、31000103无派 车单和高 速通行记录。 二、主要成效 (一)数据整理快速完整。在本次公车加油审计中,审计人 员 需要处理18张IC卡加油对账单,每张表单均包含卡号、持卡 人、 交易时间、交易类型、金额、数量、单价、余额、地点等要 素,数 32. 96 33. 65 - 58.41 - 74. 92 - 51.76 - 20. 78 - 高建宁淮六合母站东区盐域响水东方站高連连徐锯屛山母站南 上海31000103高速沿海东台母站东区 地点 据量大且分散。运用python处理Excel,通过调用模块, 处理这些数 据并生成报表。相比Excel, python能够处理更大的 数据集,更容易 的
21、实现自动化分析,大大提高了数据搜集、整理、 处理的效率和质 量。 (二)数据分析方便快捷。本次审计中,运用python拥有的 numpy、matplotlib、glob、os、pandasdatetime等工具对卡 号、交 易类型、交易时间、金额、数量、地点等关键词分别提取、 建模、 评估,筛选异常数据。 (三)结果展示直观明晰。利用Python可视化图形探索分 析 数据、直观展现分析结果,使审计线索更加清晰明了,促使审 计人 员能够通过图形精准查看审计发现,审计的便利性和精准性 得到极 大的提高。 (四)可继承性与可重复性。本次公务用车加油审计中,利 用 python代码分别得到了车辆每月百公里油耗、非工作时间加 油记录、 加油时间对应的星期、连续天数加油记录、一天不同时 间段加油记 录、月度加油金额及数量等数据。 公务用车加油的原始数据是“中国石化加油IC卡台账对 账 单”,其数据的格式是不变的。在本次审计分析完成后,可以 将代 码进行保存,在下一次公务用车加油审计中稍加修改就可以 直接使 用,有着极高的可继承和可重复性。