掃碼下載APP
及時接收最新考試資訊及
備考信息
「內容摘要」本文從計算機審計中審計數(shù)據(jù)轉換的必要性入手,給出了審計數(shù)據(jù)轉換涉及的相關操作,結合這些操作設計出審計數(shù)據(jù)轉換系統(tǒng),并對審計數(shù)據(jù)轉換日志進行了深入探討。
1、引言
審計數(shù)據(jù)轉換是計算機審計中非常重要的一環(huán)。以下兩個方面決定了在計算機審計過程中必須進行審計數(shù)據(jù)轉換。
(1)提高數(shù)據(jù)質量
審計數(shù)據(jù)來源眾多,這些來源于不同被審計單位的數(shù)據(jù)中可能存在方方面面的質量問題,具體表現(xiàn)為數(shù)據(jù)不清潔、不完整,甚至有些數(shù)據(jù)可能是不真實的、錯誤的。數(shù)據(jù)質量問題必然會影響數(shù)據(jù)分析的結果。例如,對錯誤的數(shù)據(jù)進行分析將得不到正確的結果。為了有效開展審計,必須最大程度地消除這些數(shù)據(jù)質量問題。
(2)形成集成的數(shù)據(jù)
一方面,被審計單位的數(shù)據(jù)組織通常是面向業(yè)務處理的,不是面向分析的。而審計工作要求根據(jù)審計目標和分析主題來組織數(shù)據(jù),這就需要將不同的數(shù)據(jù)經(jīng)過整理和轉換后集成到一起,形成審計分析用的統(tǒng)一數(shù)據(jù)集合。這個集合通常稱為審計中間表。也就是說,審計分析必須建立在一個數(shù)據(jù)清潔、結構良好的審計中間表的基礎上。另一方面,審計所需的數(shù)據(jù)并不單單局限于某個系統(tǒng)或某家被審計單位。利用不同系統(tǒng)間的數(shù)據(jù)以及外部數(shù)據(jù)進行關聯(lián)分析已經(jīng)成為一種有效的手段,它可以有效克服信息不全面帶來的審計風險。例如財務數(shù)據(jù)和業(yè)務數(shù)據(jù)之間的對比分析,利用商業(yè)銀行的存貸款數(shù)據(jù)、人民銀行的統(tǒng)一授信數(shù)據(jù)、稅務部門的納稅申報數(shù)據(jù)和金稅工程數(shù)據(jù)、工商部門的企業(yè)登記數(shù)據(jù)、社保部門的社會保險數(shù)據(jù)、技術監(jiān)督局的企業(yè)編碼數(shù)據(jù)、海關部門的進出口數(shù)據(jù)及退稅數(shù)據(jù)、電力公司的電費數(shù)據(jù)、自來水公司的水費數(shù)據(jù)進行企業(yè)行為的綜合分析,等等。從多個數(shù)據(jù)源中抽取數(shù)據(jù)進行集成,必須消除數(shù)據(jù)的不一致性和沖突。這些都對數(shù)據(jù)轉換提出了很高的要求。
2、相關概念
2.1 審計中間表
數(shù)據(jù)轉換過程中經(jīng)常使用審計中間表。審計中間表是指將清理、轉換后的數(shù)據(jù)按照提高審計分析效率、實現(xiàn)審計目標的要求進一步選擇、整合而形成的數(shù)據(jù)集合。它有兩個特點:一是面向分析主題。審計中間表的構建總是針對具體的審計項目進行的。同樣的數(shù)據(jù)庫,如果審計目的不同,構建的中間表也不相同。在構建的過程中,審計人員應該依據(jù)審計方案既定的審計目標進行數(shù)據(jù)的選擇、整合,構建出面向主題、滿足審計目標的數(shù)據(jù)集合。二是相對穩(wěn)定。審計中間表是在具體的審計項目實施過程中所形成的,是對采集到的被審計單位數(shù)據(jù)進行清理、轉換,并進一步根據(jù)審計目標選擇、整合而形成的數(shù)據(jù)集合。由于這些集合具有比較固定的結構,并且保存的是被審計單位的歷史數(shù)據(jù),一般不進行更新,所以審計中間表是相對穩(wěn)定的。
2.2 審計元數(shù)據(jù)
所謂審計元數(shù)據(jù),指的是描述審計中間表內部數(shù)據(jù)的結構和建立方法的數(shù)據(jù)。在審計數(shù)據(jù)的采集和轉換系統(tǒng)中,元數(shù)據(jù)可以幫助審計人員非常方便地找到他們所關心的數(shù)據(jù)。它有兩方面用途。首先,審計元數(shù)據(jù)能提供審計人員所需的,基于計算機審計的各種信息,如被審計單位數(shù)據(jù)項的業(yè)務描述信息和審計中間表的結構與關系信息等,從而幫助計算機審計人員有效使用各種與審計任務相關的數(shù)據(jù)。其次,審計元數(shù)據(jù)能支持系統(tǒng)對審計數(shù)據(jù)的管理和維護,如關于審計中間表數(shù)據(jù)項存儲方法的元數(shù)據(jù)能支持系統(tǒng)以最有效的方式訪問數(shù)據(jù)。
3、審計數(shù)據(jù)轉換系統(tǒng)中涉及的相關操作
審計數(shù)據(jù)轉換系統(tǒng)的功能是否強大,在很大程度上取決于轉換規(guī)則集是否健全。通過分析被審計單位數(shù)據(jù)和審計項目的具體需求,我們發(fā)現(xiàn)幾乎所有被審計單位數(shù)據(jù)都是采用關系數(shù)據(jù)庫來存放的,審計中間表的設計與存儲也是建立在關系數(shù)據(jù)庫基礎之上的,因此我們制定的審計數(shù)據(jù)轉換規(guī)則都是針對關系數(shù)據(jù)庫來定義的。同時,我們的轉換規(guī)則集設計采用開放的方式進行管理,也就是說審計人員可以根據(jù)自己的需求添加轉換算法。如果審計人員需要復雜的審計數(shù)據(jù)轉換,可以通過一系列的轉換操作組合來達到目的,這個轉換組合就是一個轉換活動。
3.1 數(shù)據(jù)的合法性檢查
審計中間表中的數(shù)據(jù)來自于被審計單位的多種數(shù)據(jù)源,這些數(shù)據(jù)源可能是在不同的硬件平臺上,使用不同的操作系統(tǒng),因而數(shù)據(jù)往往以不同的格式存在不同的數(shù)據(jù)庫中。所以,在審計數(shù)據(jù)轉換的過程中,有時需要對被審計單位的數(shù)據(jù)進行合法性檢查,將那些語義相同但格式不同的數(shù)據(jù)轉換成統(tǒng)一的格式,以便更加適用于審計中間表的設計,這也就是數(shù)據(jù)的格式化的過程(如對不一致的摘要進行處理的問題)。
3.2 數(shù)據(jù)清理
數(shù)據(jù)清理主要涉及到數(shù)據(jù)的匹配與合并。通過匹配,發(fā)現(xiàn)重復的對象;通過合并,保留或生成一個完整的對象。數(shù)據(jù)清理活動的核心是近似重復對象的識別。所謂近似重復對象是指表現(xiàn)形式不同但語義上相同的對象。從狹義的角度來看,如果兩條記錄在某些字段上的值相等或足夠相似,則認為這兩條記錄互為近似重復
數(shù)據(jù)清理包括以下幾個步驟:
記錄排序:選擇一個或幾個字段作為關鍵字進行排序;
識別重復記錄;
合并重復記錄:從相似記錄集中獲得記錄的完整信息,并作為該記錄的表示。
3.3 數(shù)據(jù)變換
常見的數(shù)據(jù)變換操作包括:簡單變換,日期、時間格式的轉換,由代碼到名稱的轉換以及字段(值)拆分和字段(值)合并等。
簡單變換:是指變換源數(shù)據(jù)庫表中某些字段的類型、長度以及NU約束;
日期、時間格式的轉換:是指將來自各個數(shù)據(jù)源的不同格式的日期和時間數(shù)據(jù)變換為目標數(shù)據(jù)庫的規(guī)范格式;
字段值合并:是指將源數(shù)據(jù)庫中的多個字段的值合并成一個字段的值;
字段值拆分:是指將源數(shù)據(jù)庫中的一個字段值拆分成多個字段值。
3.4 丟失的數(shù)據(jù)處理
數(shù)據(jù)丟失是指某個或某些數(shù)據(jù)元沒有值。解決數(shù)據(jù)丟失問題的方法有:
忽略該元組;
用一個全局常量填充空缺值;
用屬性平均值或其他推導值來填充空缺值;
用相關的外部數(shù)據(jù)填充空缺值。
3.5 數(shù)據(jù)集成
數(shù)據(jù)集成是將被審計單位數(shù)據(jù)從一個或多個來源中取出,并逐字段地將數(shù)據(jù)映射到審計中間表的數(shù)據(jù)結構上。這種轉換最大的困難在于將被審計單位數(shù)據(jù)集成為一個緊密結合的審計中間表數(shù)據(jù)模型。這是因為數(shù)據(jù)可能來源于多個數(shù)據(jù)源,這些數(shù)據(jù)來源往往遵守不同的業(yè)務規(guī)則,在生成審計中間表數(shù)據(jù)時,要建立它們之間的關系,消除它們之間的不一致性。數(shù)據(jù)的集成分為兩個層面:字段層面的集成和關系表層面的集成。
4、審計數(shù)據(jù)轉換系統(tǒng)組織結構
我們把從被審計單位數(shù)據(jù)到審計中間表數(shù)據(jù)之間所需要的各種操作均刻畫為轉換操作,因此在審計數(shù)據(jù)轉換系統(tǒng)的設計過程中,可以把對被審計單位數(shù)據(jù)的轉換操作定義為一系列的審計數(shù)據(jù)轉換活動。
在審計數(shù)據(jù)的轉換過程中,一個轉換將源對象利用一種轉換規(guī)則轉換成一組目標對象。源對象和目標對象都是數(shù)據(jù)對象集合的元素。數(shù)據(jù)對象集中的元素能夠是任何類型的數(shù)據(jù)元素,但是典型的是表、列或表示在內存中暫存對象的模型元素。數(shù)據(jù)對象集可以是不同轉換活動的源和目標。具體來說,在同一個邏輯單元中,一個給定的數(shù)據(jù)對象集可以是一個轉換的目標和一個或多個轉換的源。通常,轉換也可以產(chǎn)生一系列的臨時數(shù)據(jù)。那些必須一起執(zhí)行的轉換被歸類到相應的轉換任務中。在執(zhí)行時,轉換步驟是用來協(xié)調轉換任務之間執(zhí)行情況的控制流。每個轉換步驟執(zhí)行單一的轉換任務,這種轉換任務既可以是從源對象利用一種轉換規(guī)則轉換成一組目標對象,又可以是源對象經(jīng)過多種轉換規(guī)則轉換成一組目標對象。轉換步驟可以進一步被歸類成轉換活動。在每個轉換活動中,它的轉換步驟的執(zhí)行序列可以通過審計元數(shù)據(jù)定義。
5、審計數(shù)據(jù)轉換日志
根據(jù)以往審計經(jīng)驗,在審計數(shù)據(jù)轉換系統(tǒng)的設計和開發(fā)時需要考慮:對被審計單位數(shù)據(jù)庫系統(tǒng)及相關業(yè)務的了解是否充分;審計中間表的設計是否合理,關注的焦點應該是被審計數(shù)據(jù)的業(yè)務內涵;被審計單位數(shù)據(jù)是否存在質量問題,質量問題是特殊性的,還是普遍性的;審計數(shù)據(jù)轉換與審計元數(shù)據(jù)之間的關系;由于審計的特點,往往也需要看到被審計單位數(shù)據(jù)的原貌,因此審計數(shù)據(jù)轉換日志問題也需特別關注。
審計數(shù)據(jù)轉換日志有兩種類型,一種是記載審計數(shù)據(jù)轉換過程中產(chǎn)生的轉換錯誤的日志,稱之為轉換錯誤日志;另一種是能反映審計數(shù)據(jù)在轉換過程中變化情況的日志,稱之為轉換變化日志。
5.1 轉換錯誤日志
在審計數(shù)據(jù)轉換過程中,從被審計單位采集的數(shù)據(jù)可能來自異構的數(shù)據(jù)源,這些數(shù)據(jù)之間可能存在著不同層面的沖突。對這些沖突如果考慮不周就會導致審計數(shù)據(jù)轉換錯誤的發(fā)生,從而影響審計中間表的數(shù)據(jù)質量,進而影響審計人員的數(shù)據(jù)分析。常見的沖突有:
(1)模式層的沖突
當審計中間表的實體及其聯(lián)系在被審計單位數(shù)據(jù)庫中被用不同的概念模式表示時,就必然產(chǎn)生模式層的沖突。
命名沖突
主鍵沖突
結構約束沖突
表達格式?jīng)_突
(2)實例層的沖突
將被審計單位的數(shù)據(jù)轉換到審計中間表的過程中,轉換錯誤的來源并不僅限于模式層沖突,還有各種各樣的實例沖突:
數(shù)據(jù)缺失
不正確的數(shù)據(jù)
數(shù)據(jù)不一致
以上是審計數(shù)據(jù)轉換時常見的一些沖突,也是設計審計數(shù)據(jù)轉換系統(tǒng)時需要解決的主要問題。這些問題同時也是產(chǎn)生審計數(shù)據(jù)轉換錯誤的源泉。轉換錯誤日志不僅記載著這些在進行審計數(shù)據(jù)轉換時由于種種沖突所產(chǎn)生的錯誤,而且還記載著審計數(shù)據(jù)轉換過程中由于系統(tǒng)編程失誤而產(chǎn)生的出錯信息(比如某些表中的某些記錄沒有轉換成功等),為審計人員最終能得到最準確可靠的數(shù)據(jù)提供一定的幫助。
5.2 轉換變化日志
審計工作的對審計數(shù)據(jù)有著特殊的要求,不僅要求轉換前后保持一致性,而且要求有一定的可追溯性。即當審計人員要進一步查閱數(shù)據(jù)的原始面貌時,能夠保證通過審計中間表中的數(shù)據(jù)追溯到其被轉換前的原始狀況。這一工作就需要對審計數(shù)據(jù)轉換過程及有關數(shù)據(jù)的變化情況進行記載,稱為轉換變化日志。
轉換變化日志包含兩個層面:
(1)面向審計數(shù)據(jù)轉換流程步驟的轉換流程日志
審計數(shù)據(jù)的轉換過程就是審計數(shù)據(jù)通過不同的轉換活動,最終形成審計中間表數(shù)據(jù)的過程。而轉換活動又由許多不同的轉換步驟組成,每個轉換步驟又包含多個轉換任務。轉換流程日志記錄的就是審計中間表中的不同數(shù)據(jù)都是被審計單位哪些數(shù)據(jù)都經(jīng)過哪些轉換任務、轉換步驟以及轉換活動而來的,這期間又運用了什么樣的轉換規(guī)則。它實際上是審計元數(shù)據(jù)中有關審計數(shù)據(jù)轉換的結構描述的具體化,比較容易實現(xiàn)。
(2)面向審計數(shù)據(jù)變化情況的轉換數(shù)據(jù)日志
審計數(shù)據(jù)變化主要記錄著為避免在審計數(shù)據(jù)轉換過程中由于被審計單位數(shù)據(jù)中存在的沖突而導致的審計數(shù)據(jù)轉換錯誤而進行的對被審計單位數(shù)據(jù)的不同處理過程,比如對日期時間數(shù)據(jù)、缺失數(shù)據(jù)以及不正確或不規(guī)范數(shù)據(jù)的處理等。
被審計單位的數(shù)據(jù)量往往很大,如果對每個數(shù)據(jù)的變化都進行記載,轉換數(shù)據(jù)日志量就會非常龐大,保存這么龐大的日志數(shù)據(jù)會增加審計人員的負擔。通過分析,我們發(fā)現(xiàn)在進行審計數(shù)據(jù)轉換的過程中,有些數(shù)據(jù)處理(比如日期時間型數(shù)據(jù)的處理、定義規(guī)范不一致的數(shù)據(jù)處理等)對審計人員的分析將不產(chǎn)生實質性的影響,這些數(shù)據(jù)通過轉換流程日志就可以實現(xiàn)其可追溯性。所以對于這樣的變化轉換數(shù)據(jù)日志可以不記錄。但其他的數(shù)據(jù)處理(比如缺失數(shù)據(jù)處理等)要實現(xiàn)其可追溯性就必須對其進行記載。轉換數(shù)據(jù)日志的數(shù)據(jù)量取決于轉換活動中是否包含這樣的數(shù)據(jù)處理。
6、小結
本文的審計數(shù)據(jù)轉換系統(tǒng)是審計署承接的國家863課題《計算機數(shù)據(jù)采集與處理技術》的一個子課題,它結合當前的計算機審計實踐,根據(jù)審計數(shù)據(jù)轉換的需要,提出了數(shù)據(jù)轉換系統(tǒng)的實現(xiàn)技術,并對審計數(shù)據(jù)轉換過程中應關注的審計日志進行了深入的探討。
Copyright © 2000 - 8riaszlp.cn All Rights Reserved. 北京正保會計科技有限公司 版權所有
京B2-20200959 京ICP備20012371號-7 出版物經(jīng)營許可證 京公網(wǎng)安備 11010802044457號