24周年

財(cái)稅實(shí)務(wù) 高薪就業(yè) 學(xué)歷教育
APP下載
APP下載新用戶掃碼下載
立享專屬優(yōu)惠

安卓版本:8.7.50 蘋果版本:8.7.50

開發(fā)者:北京正保會(huì)計(jì)科技有限公司

應(yīng)用涉及權(quán)限:查看權(quán)限>

APP隱私政策:查看政策>

HD版本上線:點(diǎn)擊下載>

淺談電子數(shù)據(jù)質(zhì)量問題及解決方法

來源: 李斐 編輯: 2010/01/22 13:44:13  字體:

  隨著社會(huì)信息化程度的提高,許多的單位和組織都建立了與之相適應(yīng)的計(jì)算機(jī)信息系統(tǒng),并且系統(tǒng)功能不斷完善,存儲(chǔ)了大量電子數(shù)據(jù)。由于被審計(jì)單位軟硬件平臺(tái)的異構(gòu)性以及人為隱瞞信息等原因,造成審計(jì)部門與被審計(jì)單位之間的信息不對(duì)稱,審計(jì)人員所獲取的電子數(shù)據(jù)存在不同程度的質(zhì)量問題,由于電子審計(jì)數(shù)據(jù)的質(zhì)量與審計(jì)結(jié)果的質(zhì)量密切相關(guān),這就要求審計(jì)人員對(duì)所獲取的電子數(shù)據(jù)進(jìn)行檢查、控制和分析,進(jìn)行有效的電子數(shù)據(jù)質(zhì)量控制,從而降低審計(jì)風(fēng)險(xiǎn)。

  一、電子數(shù)據(jù)質(zhì)量對(duì)審計(jì)風(fēng)險(xiǎn)的影響

  在面向數(shù)據(jù)的計(jì)算機(jī)審計(jì)中,審計(jì)人員了解被審單位的經(jīng)濟(jì)、業(yè)務(wù)活動(dòng)主要是通過其提供的審計(jì)數(shù)據(jù),如財(cái)務(wù)報(bào)表、交易記錄、原始憑證等,并按照一定的程序進(jìn)行取證,形成審計(jì)意見。由于信息系統(tǒng)的廣泛運(yùn)用,被審計(jì)單位內(nèi)部積累了大量的電子數(shù)據(jù),由于各種原因,被審計(jì)單位現(xiàn)有系統(tǒng)數(shù)據(jù)庫中存在這樣或那樣的“臟”數(shù)據(jù),主要表現(xiàn)為重復(fù)的數(shù)據(jù)、錯(cuò)誤的數(shù)據(jù)、不完整的數(shù)據(jù)等,這些都會(huì)影響電子數(shù)據(jù)的質(zhì)量。

  電子數(shù)據(jù)不但邏輯組織方式多樣,有層次、網(wǎng)狀、關(guān)系等,而且物理存儲(chǔ)格式多樣,簡(jiǎn)單的可使用文本文件、電子表格文件,復(fù)雜的為不同類型的電子數(shù)據(jù)庫管理系統(tǒng)。審計(jì)人員只能評(píng)估其風(fēng)險(xiǎn)水平,但卻無法控制和影響電子數(shù)據(jù)。并且,審計(jì)人員實(shí)際上缺乏有力的技術(shù)手段對(duì)數(shù)據(jù)質(zhì)量進(jìn)行檢查評(píng)價(jià),只能夠進(jìn)行簡(jiǎn)單的分析判斷。在信息系統(tǒng)環(huán)境下,被審計(jì)單位的數(shù)據(jù)量達(dá)到一定的規(guī)模,而且由于介質(zhì)的變化,使資料修改、刪除更加容易,很少留下審計(jì)線索。另外,電子數(shù)據(jù)的采集、整理和分析過程中,數(shù)據(jù)的質(zhì)量問題帶來的審計(jì)風(fēng)險(xiǎn)也尤為重要。在實(shí)際的工作中,審計(jì)人員要根據(jù)掌握的技術(shù)、實(shí)踐經(jīng)驗(yàn)、獲得的技術(shù)支持等來確定對(duì)電子數(shù)據(jù)的采集、處理方式,這一階段對(duì)數(shù)據(jù)質(zhì)量的要求比較敏感,可能會(huì)給審計(jì)帶來風(fēng)險(xiǎn),例如數(shù)據(jù)格式存在缺陷,系統(tǒng)格式不兼容,數(shù)據(jù)分析技術(shù)和工具使用不恰當(dāng)?shù)取?

  電子數(shù)據(jù)對(duì)于審計(jì)工作越來越重要的情況下,帶給審計(jì)人員快捷高效的審計(jì)技術(shù)手段的同時(shí),也對(duì)審計(jì)人員提出了更艱巨的技術(shù)挑戰(zhàn),數(shù)據(jù)質(zhì)量的高低將直接對(duì)審計(jì)結(jié)果及其風(fēng)險(xiǎn)產(chǎn)生影響。

  二、審計(jì)人員對(duì)審計(jì)電子數(shù)據(jù)的需求

  在“電子數(shù)據(jù)審計(jì)”模式下,審計(jì)人員獲得的電子審計(jì)數(shù)據(jù)成為重要的資料來源。雖然審計(jì)人員得到電子審計(jì)數(shù)據(jù)的目的可能是多元的,如掌握資金使用情況、進(jìn)行風(fēng)險(xiǎn)評(píng)估等,但整體來看,利用電子審計(jì)數(shù)據(jù)的主要目的是為了取得審計(jì)證據(jù),支持其關(guān)于審計(jì)事項(xiàng)的判斷或結(jié)論。盡管現(xiàn)行證據(jù)法的滯后性和不確定性使得電子證據(jù)在審計(jì)工作的實(shí)際運(yùn)用中仍舊面臨問題,但是電子證據(jù),或者通過電子數(shù)據(jù)獲得的其他證據(jù),及其所帶來的邊際效應(yīng),無疑已經(jīng)成為現(xiàn)代審計(jì)人員一個(gè)非常重要的證據(jù)來源。審計(jì)數(shù)據(jù)的應(yīng)用目標(biāo)是取得適當(dāng)?shù)膶徲?jì)證據(jù),審計(jì)數(shù)據(jù)的質(zhì)量需求與審計(jì)取證需求基本一致。

  根據(jù)審計(jì)取證需求,電子數(shù)據(jù)應(yīng)滿足以下兩個(gè)方面要求:

  一是取證過程的可行性,審計(jì)人員能夠比較經(jīng)濟(jì)地利用審計(jì)數(shù)據(jù)進(jìn)行取證,這就要求審計(jì)數(shù)據(jù)具有可采集、可驗(yàn)證、可理解、可分析等特點(diǎn)。

  二是證據(jù)適用性,從電子數(shù)據(jù)中獲得的審計(jì)證據(jù)應(yīng)該滿足審計(jì)證據(jù)的基本特征、要求。電子數(shù)據(jù)中獲得的證據(jù)是整個(gè)證據(jù)體系中的一個(gè)組成部分,并和其他部分一起,具備充分性、適當(dāng)性、相關(guān)性等一系列特征。

  三、常見的電子數(shù)據(jù)質(zhì)量問題

  隨著數(shù)據(jù)采集的技術(shù)和渠道日益廣泛,審計(jì)數(shù)據(jù)庫中的數(shù)據(jù)質(zhì)量主要由進(jìn)入數(shù)據(jù)庫中的原始數(shù)據(jù)源的數(shù)據(jù)質(zhì)量決定的。原始數(shù)據(jù)源中的數(shù)據(jù)質(zhì)量問題有許多種,以下主要從電子采集、整理、分析等階段,分析審計(jì)人員在實(shí)際工作中遇到的問題。

  1 數(shù)據(jù)采集: 數(shù)據(jù)采集是信息化環(huán)境下對(duì)于被審計(jì)單位電子數(shù)據(jù)審計(jì)的首要前提和基礎(chǔ),是在審前調(diào)查提出數(shù)據(jù)需求的基礎(chǔ)上,按照審計(jì)目標(biāo),采用一定的工具和方法對(duì)被審計(jì)單位會(huì)計(jì)信息系統(tǒng)中的數(shù)據(jù)庫文件進(jìn)行采集的過程,該階段主要分為以下兩種問題:

 ?。?)被審計(jì)單位的信息系統(tǒng)沒有實(shí)現(xiàn)數(shù)據(jù)接口,或?qū)崿F(xiàn)了的數(shù)據(jù)接口不能滿足審計(jì)的要求,導(dǎo)致審計(jì)人員無法將電子數(shù)據(jù)遷移至審計(jì)軟件系統(tǒng)。

  (2)審計(jì)軟件環(huán)境無法識(shí)別從被審單位的信息化環(huán)境遷移的數(shù)據(jù)格式,導(dǎo)致使用審計(jì)軟件打開電子數(shù)據(jù)時(shí)顯示亂碼或缺少部分?jǐn)?shù)據(jù)等情況出現(xiàn)。

  2 數(shù)據(jù)整理:審計(jì)人員在獲得電子數(shù)據(jù)后,首先應(yīng)處理電子數(shù)據(jù)本身存在的缺陷,為下一步的數(shù)據(jù)分析提供保證。該階段常遇到以下三種情況:

 ?。?)數(shù)據(jù)缺失:在一些記錄的字段屬性上沒有值,如資金金額、客戶名稱為NULL。這可能是由于采集時(shí)值不確定、誤操作或采用缺省值等原因而引起的。

 ?。?)屬性異常:數(shù)據(jù)表中某些記錄的屬性值在數(shù)據(jù)遷移過程中發(fā)生變化,例如數(shù)據(jù)被采集到審計(jì)人員的審計(jì)軟件后某數(shù)據(jù)文件的“日期”字段顯示的屬性為數(shù)字類型。

 ?。?)冗余沖突:既有可能是同一數(shù)據(jù)在不同數(shù)據(jù)源里的簡(jiǎn)單重復(fù),如數(shù)據(jù)集中有多條記錄表示同一個(gè)實(shí)體,也有可能重復(fù)的數(shù)據(jù)之間還存在沖突。

  3、數(shù)據(jù)分析:需要審計(jì)人員充分理解數(shù)據(jù)庫中各個(gè)數(shù)據(jù)文件的格式,文件中各字段代表的具體含義,及其各個(gè)文件中的相互關(guān)聯(lián)等情況,運(yùn)用各種分析方法對(duì)電子數(shù)據(jù)進(jìn)行深層次的挖掘工作,發(fā)現(xiàn)隱藏其中的問題,分析中遇到的問題主要是:

 ?。?)數(shù)據(jù)命名無規(guī)則:底層數(shù)據(jù)庫中的文件名或文件中的字段名大多使用英文字母或特殊符號(hào),有些被審單位使用某些軟件公司開發(fā)的應(yīng)用軟件,文件或?qū)傩悦?guī)則性較差,相關(guān)聯(lián)的數(shù)據(jù)文件名稱沒有明顯的區(qū)分,造成審計(jì)人員花大量的時(shí)間分析文件內(nèi)容和相互關(guān)聯(lián)關(guān)系,影響審計(jì)效率,同時(shí),審計(jì)人員也有容易忽略某些具有特殊含義的字段,造成審計(jì)風(fēng)險(xiǎn)。

  (2)數(shù)據(jù)模式?jīng)_突:是與數(shù)據(jù)模式相關(guān)的不一致,主要有命名沖突和結(jié)構(gòu)沖突。命名沖突表現(xiàn)為同一名稱表示不同的實(shí)體/屬性或不同名稱表示同一實(shí)體/屬性。如一個(gè)數(shù)據(jù)源中用“借方”來表示科目表中“借方”屬性名,而在另一個(gè)數(shù)據(jù)源中用“Db”這一英文縮寫來表示。結(jié)構(gòu)沖突通常表現(xiàn)為同一對(duì)象在不同的數(shù)據(jù)源中用不同的表示形式,如對(duì)于借貸方余額的存儲(chǔ),在一個(gè)數(shù)據(jù)源中用“借方余額”和“貸方余額”兩個(gè)屬性來表示,而在另一個(gè)數(shù)據(jù)源中用“借貸方余額” 和“借貸方向”來表示。

 ?。?)數(shù)據(jù)語義沖突:是與實(shí)例相關(guān)的不一致,產(chǎn)生的原因主要是不同的設(shè)計(jì)者在對(duì)客觀對(duì)象進(jìn)行闡釋時(shí)采用了不同的描述方法。如在一個(gè)數(shù)據(jù)源中用“借”或“貸”來表示“借貸方向”,而在另一個(gè)數(shù)據(jù)源中用“Dr”或“Cr”來表示同一屬性的取值。

 ?。?)數(shù)據(jù)值異常:即數(shù)據(jù)集中存在孤立點(diǎn),它們不符合數(shù)據(jù)的一般模型或規(guī)律。造成孤立點(diǎn)的原因很多,可能是數(shù)據(jù)進(jìn)行遷移時(shí)產(chǎn)生的錯(cuò)誤,也可能是程序?qū)θ笔傩灾底詣?dòng)生成的替代值,同時(shí),孤立點(diǎn)也可能正好反映了數(shù)據(jù)中蘊(yùn)含的某種審計(jì)線索,審計(jì)人員不能簡(jiǎn)單將它刪除。

  四、處理電子數(shù)據(jù)質(zhì)量問題的基本方法

  出現(xiàn)電子數(shù)據(jù)質(zhì)量問題將直接影響審計(jì)結(jié)果的準(zhǔn)確性,審計(jì)人員應(yīng)予以高度重視。解決這些電子數(shù)據(jù)質(zhì)量問題對(duì)于提高審計(jì)的質(zhì)量與效率都至關(guān)重要,對(duì)于不同的問題應(yīng)該“對(duì)癥下藥”,采用不同的解決方法:

  1.對(duì)于被審計(jì)單位的信息系統(tǒng)沒有實(shí)現(xiàn)數(shù)據(jù)接口或?qū)崿F(xiàn)了的數(shù)據(jù)接口不能滿足審計(jì)的要求的問題,審計(jì)人員應(yīng)充分與被審單位信息系統(tǒng)管理人員進(jìn)行溝通,了解電子數(shù)據(jù)格式,利用被審單位信息管理軟件平臺(tái)將數(shù)據(jù)導(dǎo)出轉(zhuǎn)換為符合審計(jì)要求的數(shù)據(jù)格式,或者通過ODBC等數(shù)據(jù)庫訪問接口,直接訪問被審計(jì)信息系統(tǒng)的數(shù)據(jù)庫,獲取電子數(shù)據(jù),必要時(shí)聯(lián)系軟件系統(tǒng)開發(fā)企業(yè)的有關(guān)技術(shù)人員幫助解決。

  2.命名規(guī)則性較差的電子數(shù)據(jù)文檔,通常不符合一般數(shù)據(jù)庫、表、字段等名稱的命名格式,一方面需要審計(jì)人員閱讀有關(guān)的應(yīng)用軟件開發(fā)或系統(tǒng)數(shù)據(jù)庫維護(hù)文檔,獲取數(shù)據(jù)表文件及包含屬性的含義,另一方面,在無法獲取文檔幫助的情況下,需要審計(jì)人員通過文件中具有明顯特征數(shù)據(jù)內(nèi)容找出重要的帳表文件,推導(dǎo)出部分屬性含義,再根據(jù)這些屬性找出其他關(guān)聯(lián)文件。

  3. 數(shù)據(jù)缺失的處理根據(jù)不同的情況,有以下解決方法:

 ?。?)對(duì)于那些包含大量空值的列的電子數(shù)據(jù),不僅不能給審計(jì)人員足夠的信息,反而會(huì)影響審計(jì)效率和執(zhí)行的效果。解決這一問題的方法之一就是刪除那些包含大量空值的列。(2)使用一個(gè)固定的值填充缺失值:所有空缺的值用一個(gè)常量代替。這種方法雖然簡(jiǎn)單,但只適合缺失值不多的情況。

 ?。?)使用屬性的平均值填充缺失值:對(duì)同一個(gè)屬性的所有缺失值都用該屬性的平均值代替,使替代值更接近缺失值,以降低誤差。

 ?。?)使用推導(dǎo)值代替缺失值:若某屬性的取值只有少量幾種,就可以計(jì)算這幾種屬性值在該屬性中所占的比例,并對(duì)該屬性中的缺失值同比例隨機(jī)賦值。這種方法較適合缺失屬性為邏輯型的情況。

  (5)使用最可能的值代替缺失值:可以利用回歸分析、決策樹或貝葉斯形式化推導(dǎo)方法等建立一個(gè)預(yù)測(cè)模型,然后按照這個(gè)模型的預(yù)測(cè)值填充缺失值。這種方法相對(duì)比較復(fù)雜,但卻最大程度地利用了現(xiàn)存數(shù)據(jù)所包含的信息來預(yù)測(cè)空缺值,具有很好的效果。

  4.屬性異常通常在數(shù)據(jù)的遷移過程中不易被發(fā)現(xiàn),往往是審計(jì)人員在對(duì)電子數(shù)據(jù)進(jìn)行分析時(shí)取值失真才意識(shí)到問題的存在,有些是該屬性字段下的所有數(shù)據(jù)格式都發(fā)生變化,有些是部分?jǐn)?shù)據(jù)格式異常,對(duì)于這兩種情況都可以將該屬性字段下的所有數(shù)值格式全部選取進(jìn)行格式轉(zhuǎn)換,避免尋找個(gè)別數(shù)據(jù)元進(jìn)行操作的復(fù)雜性。

  5.對(duì)于冗余記錄的處理,一般要經(jīng)過以下兩個(gè)步驟: (1) 通過實(shí)例匹配找出表示現(xiàn)實(shí)世界同一實(shí)體的相似記錄。(2) 將相似的記錄合并到包含所有相關(guān)屬性并沒有冗余屬性的記錄中。對(duì)于同一實(shí)體中冗余屬性的處理,可以通過屬性間的相關(guān)分析來刪除冗余屬性。最常用的相關(guān)分析方法是計(jì)算屬性間的相關(guān)系數(shù)。如果屬性A和屬性B的相關(guān)系數(shù)大于設(shè)定的閾值,則表明A和B具有較強(qiáng)的相關(guān)性,A(或B)可以作為冗余而去掉。同時(shí)還可以運(yùn)用技術(shù)手段刪除冗余屬性,如運(yùn)用判定樹歸納方法選擇屬性子集,由源數(shù)據(jù)構(gòu)造判定樹,不出現(xiàn)在樹中的所有屬性被認(rèn)為是冗余的,出現(xiàn)在樹中的所有屬性形成歸約后的屬性子集。

  6.所謂數(shù)據(jù)值異常,就是遠(yuǎn)離或者超出某列分布規(guī)律的數(shù)據(jù),主要表現(xiàn)為孤立點(diǎn)的存在,所以對(duì)于數(shù)據(jù)值異常處理的主要任務(wù)就是檢測(cè)出孤立點(diǎn)。由于孤立點(diǎn)可能是數(shù)據(jù)質(zhì)量問題導(dǎo)致的,但也可能反映了事物背后某種異常現(xiàn)象的發(fā)展變化,在面向數(shù)據(jù)的計(jì)算機(jī)審計(jì)中,孤立點(diǎn)可能預(yù)示著某種審計(jì)線索。所以在檢測(cè)出孤立點(diǎn)后必須再由人工判斷檢測(cè)出的孤立點(diǎn)是否為事實(shí)上的孤立點(diǎn)。若為事實(shí)上的孤立點(diǎn),則可將孤立點(diǎn)視為干擾數(shù)據(jù)而丟棄,或者運(yùn)用數(shù)據(jù)平滑技術(shù)按數(shù)據(jù)分布特征修正源數(shù)據(jù)。對(duì)于孤立點(diǎn)的檢測(cè),若數(shù)據(jù)量較小,可以人工進(jìn)行檢測(cè),但當(dāng)數(shù)據(jù)量很大時(shí),就需要運(yùn)用計(jì)算機(jī)技術(shù)和統(tǒng)計(jì)學(xué)相關(guān)原理進(jìn)行檢測(cè),例如使用 Benford法則對(duì)企業(yè)的大量費(fèi)用支出情況進(jìn)行檢測(cè)發(fā)現(xiàn)的孤立點(diǎn)。

  7.數(shù)據(jù)模式?jīng)_突、數(shù)據(jù)語義沖突以等問題,在分析時(shí)常常涉及到對(duì)各數(shù)據(jù)源中的原始表及其有關(guān)屬性進(jìn)行模式重構(gòu)工作,審計(jì)人員可以利用AO現(xiàn)場(chǎng)審計(jì)實(shí)施系統(tǒng)的強(qiáng)大分析功能,對(duì)被審計(jì)單位的電子數(shù)據(jù)的某些屬性進(jìn)行分解、合并、展開等工作,以達(dá)到各個(gè)數(shù)據(jù)文件形成一致集成模式的目的。

責(zé)任編輯:冠
回到頂部
折疊
網(wǎng)站地圖

Copyright © 2000 - 8riaszlp.cn All Rights Reserved. 北京正保會(huì)計(jì)科技有限公司 版權(quán)所有

京B2-20200959 京ICP備20012371號(hào)-7 出版物經(jīng)營許可證 京公網(wǎng)安備 11010802044457號(hào)