关于审计抽样的问题,我查了一下,我在《让数字说话–审计就这么简单》里面没有讲。当时是觉得这部分比较枯燥,涉及一些数理统计知识。对于新进公司的小朋友来说,只要能想明白审计大概是怎么回事就不错了,能够按照上级的布置完成任务就行,抽样也许不算是第一年必须掌握的知识。所以我就没有写。
没有写的另外一个原因,是写了也没太大用处,不会有多少人能照着做的。关于这个原因,如果你不太明白我的意思,相信你看完这篇文章就明白了。
不过,审计抽样技术应用太广泛了,做函证,查凭证,几乎所有的审计测试,都要通过抽样来决定测试的具体对象。所以,为了满足对此理论感兴趣的人的需求,我将自己的理解写出来,供大家阅读和自娱自乐。谁要是愿意在审计实务中严格照此执行,请注意以下提示:
“抽样有风险,较真需谨慎。”
--------------------------------
关于审计抽样,国际审计准则是ISA 530,我国的审计准则是独立审计具体准则第4号——审计抽样,这两者几乎一样。各事务所在这方面的规定,也大体如此。不过,在实践当中,不管国内所还是国际所,不管哪一家四大,不管在哪个国家,做的正确的非常少。我这话说的可能有一点儿绝对,但我的有限的经验告诉我,绝大部分审计师的数理统计知识太差,根本理解不了审计抽样的原理。
0.什么是抽样
国际审计准则里说,选取总体里的某些东西做审计测试时,有三种选法。一是全选(简直是废话),二是选取特殊的,三是审计抽样。
要是做了一,我也没啥要说的了。
要是做二,那么这个“特殊的”得有个能写得出来的客观标准,然后按这个标准从总体里选。比如标准是金额是整万元的,等等。这个标准当然应该和你做审计测试的目的有一定关联。
做完了二,对于不符合标准的那部分,相当于没有经过任何审计测试,仍然要想个法子做测试,除非其总额/性质已经很不重要了。这个要想的法子,往往还是“三.审计抽样”,只不过是总体比原来缩水了而已。
1.抽样的目的
抽样的目的一般是两种之一:要么是测试内控的执行是否好,要么是实质性测试抽查细节。也有个别抽样是“以一博二”的双重目的抽样,例如审计师监督存货盘点时的抽样。
目的不同,样本选取方法就不一样,对于抽样发现的偏差的态度和处理方法也就不同。
测试内控执行是否好的抽样,每一个样本得到的结论就是简单的“Yes”或者“No”,不要去谈金额大小。另外,一般是抽样20-30个,这是由数理统计里的正态分布和置信区间等理论计算决定的。我大概就理解这些,详细的计算我自己没做过。
如果是实质性测试的抽样,就和金额有一定关系了。因为,一般实质性测试的抽样,要能够用样本的误差来推算总体的误差。而不仅仅是发现一个个体有问题就只对那一个个体做解释或做审计调整。
有一个原则要记住,抽样从来都不能彻底解决某个科目是否低估(understatement)的问题,即使双向抽样也不行。因为不管怎么抽样,都是有总体存在,才能在总体的范围内抽样。监督存货盘点时的双向抽样,只不过是有两个总体而已。一个是帐上的存货,一个是仓库里的存货。如果客户有一个仓库是在外面租的没告诉你,你还是没办法。
2.定义抽样单位(Sampling Unit)
抽样单位是构成审计对象总体的单位项目,也就是每个个体。它可以是凭证,可以是每个客户的余额,可以是每张发票。若干抽样单位合在一起,就构成了总体。比如,对于应收款的期末余额这个总体,它是由每个客户的余额构成的,也可以看做是由每个客户尚未付款的发票汇总而成的。如果将应收款期末余额看作是由历年借方发生额和历年贷方发生额相减的结果,则总体就变成了两个,一个是历年的借方发生额,一个是历年的贷方发生额。前者的个体可能就是历年记录的每笔收入,后者的个体可能就是历年记录的每笔收款。
抽样单位好比是物理学中的“质子,中子,电子”,是不可再分的。对一个抽样单位,你的审计测试要么做了,要么没做,不存在做一半的情况。
例如,将应收款的期末余额看作是总体,将每个客户的余额看作是抽样单位时,对于某客户余额,要么发函证,要么不发。或者要么全部做凭证检查,要么不做。这个“全部做凭证检查”也不好做的,因为一个客户的余额可能是历年借贷累计下来的,就算假设期初数是已审计数字没问题了,当年的借贷都查一遍也不容易。变通的办法就是将这个客户的余额再看作是一个总体,做“二次抽样”后再做审计测试,“二次抽样”要遵守的抽样规则是一样的。
3.每个样本都有机会被抽到及统计抽样和非统计抽样
抽样的一个基本原则是每个抽样单位都要有机会被抽到。但机会并不一定非得是均等的。
如果是测试内控为目的的抽样,则每个个体的机会一般应该均等,因为,每个个体出错所代表的审计风险是一样大的。风险相同,则被抽中的机会就应该相同。
如果是实质性测试目的的抽样,一般是以金额为标准。金额的误差大小与审计风险的大小成正比。因此,从统计学角度讲,一张金额为10万元的发票和一张金额为1万元的发票,其被抽到的机会应该正好10倍于后者。
如果你的抽样机制能够能够确保这一点,这种抽样方法就被称做是统计抽样,因为它能公平地让每1元金额被抽到的机会都完全相等。注意,这里的抽样单位是每一张发票,但由于测试的是总体的金额,所以,真正意义上的个体其实不是发票,是每1元金额。让每1元金额有平等的机会被抽样抽到,是真正的公平;让每张发票机会均等,并不是真正的公平。这就好像是股份有限公司的股东是按人头表决还是按股权表决一样。
但一般的抽样方法都做不到这么科学精确,所以,一般的抽样方法都是非统计抽样。并不是说你的抽样方法是随机的,并且用了一些理论和工具就是统计抽样了,真正要看的,是你的抽样方法的结果是不是真正公平。
从数理统计的角度讲,抽样都是为了通过样本的情况估计总体的情况。为了达到同样的估计精确程度,统计抽样所需的样本量可以比非统计抽样的样本量少1/3左右。
我们一般都只能用非统计抽样。统计抽样一般是要有真正懂数理统计的人来设计抽样方法。更重要的是,你的项目经理和合伙人得能明白上述的道理。
4.分层
即使在非统计抽样里,我们也可以尽量模拟统计抽样的一些手法,来减少要做的样本量。最经典的手法就是“分层”。
所谓“分层”,是将总体分成几层,也就是把一个大的总体分成几个小的总体。在每一层内部,风险水平较为接近;层与层之间,风险水平有一定差距。然后在每层里再进行抽样。这样,在风险高的层里,样本量多一些;在风险低的层里,样本量少一些。
以上是理论。举个例子。对管理费用的存在性做检查凭证测试,要抽样决定查哪些凭证。管理费用的凭证上的金额可能小到10元,可能大到10万元。金额不同,代表了风险的不同。所以,我们可以将10-1000元的凭证划为第1层,1001-10000元的划为第2层,10001-10万元划为第3层,然后对每一层分别抽样:比如,第1层抽2个,第2层抽6个,第3层抽15个。或者,总的样本个数是30个的话,肯定要将其中的15-20个分给第3层,再将5-10个分给第2层,剩下的0-5个,分给第1层。
具体怎么算样本个数,每个大所里应该有自己的规定。具体如何分层,每个大所里往往也有自己的指导性原则。
5.由样本误差估计总体误差
抽样抽出来了,审计测试也做完了,就要能够由样本误差来估计总体的误差。最简单的估计方法就是同比放大来估计。
比如,对于一个测试内控的抽样(一般别谈金额),对于这个控制点,本年共有1万个控制次数,我们抽了30个做测试,其中有1次是内控失效的。则可以推算,1万次里有333次是内控失效的。
再如,对于检查管理费用的存在性,管理费用总金额是500万元。抽了25个凭证,样本总金额是75万元,发现误差是5000元。则可以估计管理费用总体的误差是3.33万元。精确的说法是:我们有xx%的把握认为,管理费用总体的总金额估计为[500-3.33,500+3.33]万元的区间里。
这个估计方法绝对是科学的方法,但你要是打算据此给客户做个管理费用3.33万元的审计调整,客户可能要和你急。毕竟,客户里明白数理统计和概率论的人不会太多的,审计师亦然。所以,一般没人像我说的这么做。
6.总体中的“坏点”
“坏点”是数理统计上的一个说法,意思是一些表现特殊,不大符合一般统计规律的个体。对于这些“坏点”,比如金额超大的凭证,在审计抽样时,应该先挑选它们逐一进行单独测试,有调整就做调整。然后将它们从总体里刨除,再对修正后的较小的总体做抽样。
7.其它问题
主要的理论问题我已经讲了,其它具体问题一般就不要问我了,每个所里自己有规定的。比如,如果某些样本出现了较大误差怎么办?是扩大样本量?扩大多少?找不到所选的凭证怎么算?等等。这些不是理论问题,是实务操作问题,我说了也不算数的,你自己看自己所的规定好了。
最后赋七律打油诗一首,总结一下理论和实务的差距:
“不懂理论随便抽,懂了理论不自由。众人皆醉我不醒,齐道天凉好个秋。
避谈原理埋头做,忍看风险手底溜。内外都夸情商好,上下同乐逍遥游。”