永利澳门赌场官方网址

首頁 > 審計科研 > 審計學會
大數據審計實踐應用研究
来  源: 审计局     发表时间:2018-12-03     字体显示:【】【】【
 

  摘要:中辦、國辦《關于完善審計制度若幹重大問題的框架意見》及省委辦、省政府辦聯合下發通知要求,構建大數據審計模式推進審計監督全覆蓋。目前,大數據審計能夠顯著提升審計工作成效已成共識,創新技術應用給審計帶來積極影響。本文通過大數據關聯分析和挖掘分析兩大創新技術應用研究,分析當前實踐應用中存在的困難問題,提出今後發展與提升方向,強力推進審計監督全覆蓋。 

  关键词:审计 大数据  应用  研究 

  中辦、國辦《關于完善審計制度若幹重大問題的框架意見》及省委辦、省政府辦《關于完善福建省審計制度的實施意見》等文件明確,要積極運用大數據技術,加大業務數據與財務數據、單位數據與行業數據以及跨行業、跨領域數據的綜合比對和關聯分析力度,提高運用信息化技術查核問題、評價判斷、宏觀分析的能力。當前,創新大數據審計分析技術,構建大數據審計工作模式,建立健全與審計全覆蓋相適應的工作機制已成共識。特別是,在審計實踐中加大數據綜合關聯分析力度,加大對財政、金融、企業等各領域之間數據關聯分析,中央、部門、地方間的數據關聯分析,財務、業務數據見的關聯分析,部門縱向各級間數據的關聯分析,被審計單位、行業、地方單個系統與宏觀經濟運行間的數據關聯分析已成爲關鍵技術。 

  一、大數據與審計大數據 

  目前,大數據的研究與應用已經成爲國內外的熱點,列入全球10大關鍵技術。不同文獻,給出的大數據的定義也有不同。最初的概念,是指需要處理的信息量過大,已經超出一般電腦在處理數據時所能使用的內存,因此必須改進處理數據的工具。這導致新處理技術的産生,如谷歌的MapReduce和Apache的hadoop平台,這些技術使得人們可以處理的數據量極大地增加。最常見的定義,是世界著名咨詢機構麥肯錫公司做出的,大小超出常規數據庫工具獲取、存儲、管理和分析能力的數據集。概括起來說,大數據主要具有大量Volume、高速Velocity、多樣Variety、真實Veracity四個特點,即“4V”特點。 

  審計領域,審計大數據的內容也是包羅萬象,涉及國民經濟運行的主要數據。當前,審計大數據主要基于被審計單位信息系統存儲的結構化數據,但非結構化的文檔、網頁和社交數據對審計的價值也是毋庸置疑的。將來,來自物聯網的傳感器數據也會成爲審計大數據的來源。具體來說,審計大數據既包括來自被審計單位信息系統的財務、業務數據和相關支撐資料,也包括其他部門、互聯網的交互數據;即包括結構化數據,也包括文檔、音頻等非結構化數據。實踐中,審計大數據在揭露重大違法違紀問題、提高揭示宏觀經濟社會運行風險的能力和效率方面發揮積極作用,是實現審計全覆蓋的技術保障,其最終目標是維護國家經濟安全,促進國家審計在國家治理現代化中發揮基石和保障作用。 

  二、大數據審計帶來的影響 

  大數據時代的到來賦予了審計技術改革新的動力和內容,對審計機關分析利用大數據、審計模式和審計組織方式等帶來正向的積極的影響。 

  1、數據利用上,強化對數據深層次多維度的關聯分析。 

  一是提高現有數據的價值。大數據的價值不在單純源于數據本身的基本用途,而更多源于它的二次利用。隨著各地審計機關開展審計數據定期報送制度化,加之曆年審計項目中積累的各種數據,審計可用的數據將越來越多,審計數據集中力度將更高。如何將現有多行業、多部門、多類型數據利用好,是當前審計數據分析的要務。二是應更加注重數據關聯分析。數據總和比部分更有價值,當多個數據集的總和重組在一起時,重組總和本身的價值也比單個總和更大。只有加大行業內數據以及跨行業、跨領域數據的綜合比對和關聯分析力度,才能提高運用信息化技術查核問題、評價判斷、宏觀分析的水平。 

  2、分析模式上,注重大數據常態性的數據分析。 

  一是審計範圍由“抽樣審計”向“全景審計”轉變,審計模式也將會轉向大數據審計模式。過去,審計分析由于受到人力、時間和分析條件的限制,無法做到對所有審計數據的收集和分析,所以在審計項目中一般采用依賴于審計重要性水平的審計抽樣方法。大數據時代,大數據審計模式可以精確定位問題所在,減少抽樣審計帶來的片面性和局部性,讓風險控制更有針對性。二是審計數據分析呈現常態化。數據分析不只局限于審計項目開始時,可以在整個項目年度持續開展。日常數據分析中,審計人員將采用新技術,從海量數據中挖掘相關審計疑點,通過一個一個審計項目現場進行驗證,使得後台數據分析與審計現場作業融合更加緊密。促使單兵審計向兵團聯動審計轉變,現場審計向現場審計與非現場審計相結合的轉變,提高了審計能力、質量和效率,拓展了審計監督的廣度和深度。 

  3、組織形式上,強化數據分析管理“中心制”。 

  審計大數據應用必然需要一種能打破行業界限,突破項目限制、有利于審計資源整合的組織管理模式。《“十三五”國家審計工作發展規劃》也明確提出創新審計管理模式和組織方式,大力推行現代審計綜合模式,全面推廣“總體分析、發現疑點、分散核實、系統研究”的數字化審計方式。目前,盡管已經形成以扁平化模式組織實施大數據審計的共識,但多頭管理的問題還是客觀存在,一定程度上會消解大數據審計所帶來的技術優勢。實踐中,可由審計機關主要負責人指定一位分管領導、處長負責領導具體項目數據分析,其他同級別的負責人在審計現場或業務方面服從統一調度。成立領導小組辦公室、政策分析組、數據分析組和現場核查組等,打破多頭指揮,有效落實“統一審計計劃、統一審計方案、統一審計培訓、統一審計實施、統一審計處理”的“五統一”的工作方式。 

  三、大數據審計的技術方法 

  當前,數據大已經是一個毋庸置疑的事實,所以更重要的現實是對大數據進行分析的方法,只有通過分析才能獲取更多智能的、深入的、有價值的信息。前審計長劉家義同志提出大數據審計分析的本質是“全維化與智能化”,業內普遍認爲大數據分析的特征是“交叉融合+智能挖掘”。二者觀點的共同點,說明了在某種程度上,數據關聯分析的應用和智能挖掘算法的應用是當前大數據審計分析方法創新的兩大重點。 

  1、數據關聯分析的應用 

  關聯分析是在交易數據、關系數據或其他信息載體中,查找存在于項目集合或對象集合之間的關聯性、相關性或因果結構,從而發現海量數據中不同項之間的聯系。審計數據關聯分析是基于審計獲取的財政、地稅、公積金和社保等財務、業務數據,運用大數據的關聯分析技術(SQL語句等),探尋不同數據源、同一數據源不同數據層級之間的聯系,進而快速鎖定審計疑點。重點做好五個方面的關聯:一是從中央財政到省市縣乃至每個鄉鎮的資金使用、從部門到項目具體執行單位的資金使用的縱向關聯;二是從市財政、市發改委到一級、二級預算單位的各種專項資金的橫向關聯;三是財政、金融和企業三方面的數據關聯;四是財政與其他多部門、多行業的數據關聯;五是財政數據與業務數據、宏觀經濟數據的關聯。近幾年,各地審計人員積極踐行“五大關聯”分析,開展了跨領域、跨層級、跨系統的數據分析工作。從數據應用的角度講,我們已經進入大數據分析階段。 

  2、智能挖掘技術的應用 

  大數據分析的另一特征就是各種深度挖掘、智能學習算法、可視化等技術的應用。數據挖掘是信息時代背景下發展起來的新興技術,是針對日益龐大的電子數據應運而生的一種新型信息處理技術。一般采取排除人爲因素而通過自動的方式,從數據庫、數據倉庫中發現新的、隱藏的或不可預見的知識。數據挖掘是在對數據集全面而深刻認識的基礎上,對數據內在和本質的高度抽象與概括,也是對數據從感性認識到理性認識的升華。近年,全國多地審計機關,特別是審計署,審計人員正從簡單的彙總、統計數據分析,開始向專業數據挖掘方向推進,開展數值分析,聚類、分類、孤立點分析等數據挖掘算法在審計數據分析中的應用案例也多有湧現。但是,現階段審計實踐中數據挖掘的深度、綜合利用的程度還有待提高,從這個角度講審計大數據分析尚在初級階段,距離智能化還有較長的路要走。 

  四、大數據審計實踐與探索 

  審計分析方法是爲了實現審計目標采用的方法和手段,審計大數據量大面廣,相應的審計數據分析方法也數量衆多,無法一一枚舉,實施中應根據審計重點內容編制具體審計方法。下面結合近年來大數據審計方面的一些實踐,闡述大數據審計中關聯分析和數據挖掘技術的應用。 

  (一)數據關聯分析的應用 

  在審計工作中,關聯數據分析對于發現線索、查處問題,降低審計風險,有著重要的意義:一是有助于提高取證數據的可靠程度,引入相關數據,互相印證,更具真實性;二是有助于全面地把握事實,將被審計單位提供的數據與相關數據進行比對,多角度反映事實,能夠形成完整的證據鏈;三是有助于有效發現疑點,將各類相關數據進行比對,可以識別出與反映事實之間的差異,能夠較快地發現一些有價值的線索。對被審計單位而言,目前的數據主要分內部數據和外部數據兩類,實際應用中針對數據來源,分別通過構建行業間橫向關聯模式、行業內縱向關聯模式的方法進行數據關聯分析。本文以構建行業間橫向關聯模式和行業內縱向關聯模式爲出發點,結合近年的代表性實踐,詳細闡析關聯分析技術在審計中的應用。 

  1、行業內縱向關聯分析 

  行業內縱向關聯分析是通過對來自同一部門不同層級之間數據的關聯比對,實現對數據的多維度審查。可通過下鑽,從高層級逐步下移到底層級,查清去向;可通過上卷從低層級上溯至高層級,追蹤來源。 

  (1)資金維度數據分析。當前,財政部門使用較多的是龍圖、用友和太極華青等財政管理信息系統。其中,指標管理系統裏包含FromCtrlID和ToCtrlID兩個字段,將指標管理系統裏的指標流向串聯起來;龍圖平台中包含映射表,控制可執行指標、國庫集中支付系統和總預算會計數據的對應關系,跟蹤資金的最終流向,確定最終收款方。結合起來,可以實現對財政部門內的指標管理系統、國庫集中支付系統和總預算會計軟件關聯操作,將與財政資金分配、支付、記賬相關的預算指標表、用款計劃表、支付申請表、資金支付表、總預算會計憑證表等關聯起來,實現資金流向的逐層分析。如“同級審”中,我們在對農林水功能科目總體執行情況進行分析,通過對功能科目字段設置條件篩選出農林水科目的所有項目,再按項目資金的流向,從指標管理系統數據查詢項目資金下達中涉及單位及執行情況,最後通過國庫集中支付系統查詢該項目對應資金流向的最終收款方(企業)情況,從而對資金的整個流向進行跟蹤。大大提高了對同一企業享受多種不同財政補助、相似項目多頭申報財政補助、連續多年財政直接支付給相同個人等疑點篩選的審計效率。據篩選的疑點延伸審計發現,農林水事務科目專項轉移支付資金沈澱現象仍較爲突出,市財政下達某縣專項轉移資金5.17億元,實際支出2.95億元,有2.22億元資金滯留財政和部門當年未實際支出等問題。 

  (2)業務維度數據分析。稅務部門的稅收征管系統電子數據,存儲的每一條記錄都有明確含義,存在緊密的業務對應關系。利用系統內不同稅種征收數據之間的業務關系建立審計分析模型,可達到分析問題、發現線索的目的。如房地産土地增值稅征管審計,預征土地增值稅的計稅依據是不動産預售收入,營業稅的計稅依據也是不動産預售收入。審計人員可以利用申報營業稅和土地增值稅計稅額都是營業額這一關聯關系建立審計分析模型,檢查有無通過調節土地增值稅進而調整稅收的現象。按納稅人電子檔案號做爲關鍵字,分組彙總繳納土地增值稅的總收入、繳納營業稅的總收入,並以納稅人電子檔案號做連接進行關聯比對,計算兩個稅種計稅額差額。審計中,將計稅額差額絕對值較大的企業作爲調節征收稅款的疑點,抽查發現某一年有40多家房地産企業未如實申報稅費3億多元,影響了年度稅收收入的真實性。 

  (3)時間維度數據分析。在業務性專項預算編制合理性數據分析中,審計人員認爲如果某一業務性質專項的預算執行率連續多年都很低間接說明該業務性專項的預算編制不夠准確,項目資金需求虛高。據此,根據審計人員符合客觀實際經驗來建立分析模型,將近三年指標系統中可執行指標數據進行合並彙總,按單位、業務性專項項目名稱和年度分別重算預算指標的執行情況,篩選出連續三年執行率都低于60%的項目作爲重點延伸對象,進行進一步核實。在政府投資建設項目結算情況專項審計調查中,通過對建設單位連續7年財務賬套進行分析,按照近三年往來科目變化情況對項目的進度進行分類,挖掘可能已經完工的工程項目和在建工程項目,從而進一步驗證了業務填報數據的真實性,夯實審計證據,發現了工程結算滯後,已完工程700多個項目僅僅審結300多個,審結數量占比不到50%。審計結果得到了市政府、市長的高度重視,要求在全市範圍內,對不結算、不清算、不驗收、不掃尾的工程項目進行全面摸底,形成清單,明確責任,馬上整改。要求各相關部門單位“一把手”要親自抓整改,效能辦要將整改列入績效考評範圍,嚴肅處理履查履犯問題;市紀委、監察部門嚴格專項督察,嚴肅責任,嚴格落實。同時要求對症下藥、建章立制,完善制度,舉一反三,防止問題“回潮”。 

  當然,我們還可根據審計人員觀察數據的不同角度,選擇不同重點、從不同緯度展開對數據的分析,了解和發現數據中隱藏的一些業務活動。 

  2.行業間橫向關聯分析應用。 

  被審計單位的經濟活動並非孤立運行,通過業務系統之間、業務系統和財務系統之間、內部系統和外部系統之間的關聯比對,包含內部數據之間的表間關聯,還包含內外部之間的跨庫關聯,是發現審計疑點線索的有效方法。審計實踐中,關聯模型構建的核心在于找到一個關聯數據的關鍵字段,通過關鍵字段,實現不同數據庫之間的整合展示,比較常用的有身份證號碼、工商登記號碼等。 

  (1)在城鎮土地使用稅審計中。稅務部門以實際占用的土地面積爲計稅依據向納稅人征收城鎮土地使用稅,土地主管部門通過核發土地使用權證准確記錄特定人的土地使用面積。審計人員可根據土地使用人使用權證上的土地面積和申報城鎮土地使用稅的計稅土地面積之間的一一對應關系,建立數據分析模型。先向國土部門取得土地證發證表,同時按照企業名稱彙總整理土地使用稅繳納企業明細表,將兩表按照土地使用人進行關聯比對,就此發現已經由國土管理部門發放土地使用證,但未及時繳納土地使用稅的企業,或繳納土地使用稅不足的情況。審計發現,有4000多家應征收城鎮土地使用稅的單位應補繳某年度城鎮土地使用稅1億多元,有150多家新發證的單位應補繳城鎮土地使用稅1000多萬元。基于同樣的審計方法,在房産稅審計中,審計人員從房屋登記管理部門取得房産登記信息,與房産稅征收數據比對建立模型,即可發現未繳納房産稅的疑點,審計發現90家企業少交房産稅近900萬元,繼而落實問題成因。 

  (2)公務人員兼職取酬數據分析。納稅義務人在某一公司繳納個人所得稅的數據與該義務人在該公司取得勞動報酬的數據有著必然對應關系。對此,我們從稅務部門采集個人所得稅報告表中同一個身份證號相同月份在不同單位繳納個人所得稅的疑點數據,將其與財政工資統發系統的公務員名單信息進行關聯分析,可以快速鎖定所有公務人員兼職取酬的違規問題,進行達到對數據全覆蓋分析。如,我們部門預算執行審計中,延伸了某部門的下屬單位,發現該單位副主任在兼任其相關單位法人代表期間領取補貼和年終績效達13多萬元,並將線索移送紀委部門進一步核實查處。 

  (3)違規領取扶貧惠民資金數據分析。扶貧、惠民資金的發放面廣、鏈長、點多、量小,要做到審計監督全覆蓋必須創新審計方式方法,強力推進大數據關聯分析。其中各類資金發放都有相應的政策法規規定,一些還有比較嚴格的條件限制,而這些前提條件往往可通過其他部門業務數據中間接佐證。因此,利用多部門數據間的關聯關系,從惠民資金網系統和財政工資統發系統、房産持有信息數據、公積金和醫保等繳費工資數據中身份證號出發,對五個系統2000多萬條記錄進行關聯比對,分析是否存在違規領取惠民項目資金的情況。篩選公積金計算工資、醫療保險計算工資大于2500元還領取扶貧相關惠民資金的疑點數據1140條,持有房産但同時領取扶貧相關惠民資金的疑點數據140條,公職人員(含退休)領取惠民資金的疑點數據646條。還與建檔立卡家庭4425戶14042人的領取扶貧涉農資金進行分析,鎖定審計重點和延伸對象,發現1142戶建檔立卡家庭3726條疑點數據。審計組根據疑點數據確定入戶調查審計重點,證實有173戶收入明顯超過建檔立卡標准或重複享受農村危房改造和造福工程補助資金家庭,大大提升了精准審計力度和工作效率。 

  (二)數據挖掘技術的應用 

  数据挖掘技术应用于审计工作有着重要的意义,能够帮助审计人员在极短的时间里筛选出有代表性的审计样本,提高审计效率,大大降低了审计风险,是未来大数据审计实践的重点和难点。数据挖掘技术应用的核心是数据挖掘算法,在SQL SERVER和ORACLE数据库中都自带了一些算法,如SQL SERVER数据库里默认集成了9种算法,包含了决策树、聚类分析和逻辑回归等。这些数据挖掘算法本身是被统计学家们公认的,能够深入数据内部,挖掘出公认的价值,做出预测分析。如,利用Benford定律发现海量数据中存在分布异常数据。 

  Benford定律最早是美国天文学家Simon Newcomb和美国通用电气公司科学家Frank Benford研究发现,即在不同种类的统计数据中,首位数字是数字d的概率为log10(1+1/d)。其中,数据的首位数字是指左边的第一位非零数字,出现的标准概率分布曲线如图1所示。同样,Benford定律不但适用于个位数字,连续多位数也适用,概率分布曲线如图2所示。 

   

  (圖1) 

   

  (圖2) 

  但是,Benford定律並不適用于所有被審計數據,主要有三個條件限制:數據具備一定的規模、沒有人工設定最大值和最小值範圍、受人爲影響較小。 

  實際中,如果要分析的數據不符合Benford定律的標准概率分布曲線,則表明在被分析的數據中可能含有“異常”數據,存在人爲舞弊行爲。所以,大數據環境下,Benford定律提供了一種大數據審計數據分析方法,有助于審計人員探索、分析和解釋複雜的海量數據,快速從大數據中發現問題。一般來說,采用Benford定律進行大數據審計的流程有:  

  (1)對審計大數據集進行分析,初步判斷數據集是否符合Benford定律的分析條件,選擇分析的目標字段,如國庫集中支付數據的支付金額字段; 

  (2)對總體進行分析,進行首位有效數字Benford定律的符合性測試,初步發現測試線索和重點; 

  (3)根據初步線索,進行首二位,首三位數字的詳細分析; 

  (4)在需要的情況下,對數據進行細分,進行分組分析,重複以上步驟深入挖掘; 

  (5)將標准分布概率和實際分布概率進行比較,尋找異常偏差點,並分析出現異常的原因,識別可能的錯誤,從而發現審計線索。以某縣國庫集中支付數據爲例,利用Benford定律對實收費用“支付金額”字段進行分析,其過程如下: 

  (1)利用SQL編輯器,利用“Benford定律”對支付金額字段第一位數字進行分析,結果如下圖。基本符合班副定律,除了以7開頭的數值差異較大。 

   

  (2)根據初步線索,進行對以數字7爲首的二位數字再進行benford法則的詳細分析,具體見下圖。 

  最後根據,分析情況定位不符合班服定律的數值分布情況,抽查支付數值以77、73和78爲開頭的記錄進行分析,重點延伸。 

  五、大數據審計的融合發展 

  從近年大數據審計實踐來看,各地做了許多有益的探索實踐,但還存在一些不足的地方。一是審計數據庫資源采集還不夠全面。如對所有一級預算單位的財務賬套的收集還不完整,對數據的管理應用還不夠規範,一些業務處室在開展審計項目時,數據先行的觀念還需進一步樹立,應盡可能收集與審計項目相關的數據資源,並進行統一管理,進一步強化數據安全存儲保障。二是數據分析方面還存在業務與計算機技術結合不夠密切的問題。需要充分認識到大數據時代,審計數據分析是集業務、統計和技術爲一體的複合型工作,要認識加強業務知識對數據分析的指導的重要作用。 

  (一)持續引入外部數據 

  當前,對內部數據的獲取已經逐步完善,形成了一整套較爲完整的機制,比如采集的方式、內容和字段等。被審計單位在信息的輸入階段就存在信息失真的可能, 某種程度上加大了審計人員從被審計單位的數據中萃取真實審計信息的難度。外部數據關聯分析提供了解決審計人員和被審計單位信息不對稱的新途徑,應積極探索形成外部數據持續引入機制。如借審計署電子審計數據報送的契機,加大多行業數據的報送機制,豐富現有審計數據中心內容;利用全市政務信息系統調查成果,積極向相關部門采集審計項目需要的業務數據,豐富審計項目中獲取的有價值外部數據,建立全市自然資源資産審計數據庫等。 

  (二)深化業務與技術的融合 

  審計思路和思維方式的提出是開展大數據審計的關鍵,需要加大業務知識和計算機技術的深入融合,研發關聯分析模型。一是政策分析數據關聯模型。依據相關法律法規的規定,將法律、法規的定量、定性規定具體化爲分析模型中的篩選、分組和統計等條件。二是業務邏輯數據關聯模型。尋找、利用業務處理邏輯關系,建立分析模型發現與業務處理邏輯關系不吻合的事項。三是知識經驗數據關聯模型。摸索、總結出某類問題的表現特征,將問題的表征轉化爲特定的數據特征,通過編寫查詢語句或審計軟件來檢索查詢出可疑的數據。 

  (三)探索引進可視化分析方法 

  大數據分析的使用者有大數據分析專家,同時還有普通用戶,二者對于大數據分析最基本的要求就是可視化分析,因爲可視化分析能夠直觀的呈現大數據特點,容易被讀者所接受。大數據環境下,要將傳統的驗證型思維方法轉變到可視化分析上來,通過可視化的自動建模技術將大數據以直觀的圖形形式展示,幫助審計人員一眼洞悉數據背後隱藏的信息,不再受制于枯燥晦澀的分析算法。 

  參考文獻: 

  【1】湖北省審計廳財政審計處課題組,部門預算執行審計全覆蓋組織與實施研究【J】.審計月刊,2016(3) 

  【2】郑伟 张立民  杨莉,试析大数据环境下的数据式审计模式【J】.审计研究,2016(4) 

  【3】陈伟 吴正  刘海,基于Benford定律的大数据审计方法研究与实现【J】.审计与鉴证,2016(3) 

  【4】裴文華,大數據環境下財政審計數據分析研究【J】.審計研究,2017(3) 

  【5】維克托.邁爾.舍恩伯格,肯尼斯.庫克耶,大數據時代生活工作與思維的大變革【M】 

  【6】蓋九宇,商務智能【M】 

  【7】陳泉倩,財政大數據審計思路與方法探究【J】,探索思考 



收藏】【打印】【關閉