Bernd Giezek Monetary Unit Sampling
GABLER RESEARCH
Bernd Giezek
Monetary Unit Sampling Der Einsatz statistischer Verfahren im Rahmen der Jahresabschlussprüfung Mit einem Geleitwort von Prof. Dr. Louis Velthuis
RESEARCH
Bibliografische Information der Deutschen Nationalbibliothek Die Deutsche Nationalbibliothek verzeichnet diese Publikation in der Deutschen Nationalbibliografie; detaillierte bibliografische Daten sind im Internet über abrufbar.
Dissertation Johannes Gutenberg-Universität Mainz, 2010
1. Auflage 2011 Alle Rechte vorbehalten © Gabler Verlag | Springer Fachmedien Wiesbaden GmbH 2011 Lektorat: Stefanie Brich | Stefanie Loyal Gabler Verlag ist eine Marke von Springer Fachmedien. Springer Fachmedien ist Teil der Fachverlagsgruppe Springer Science+Business Media. www.gabler.de Das Werk einschließlich aller seiner Teile ist urheberrechtlich geschützt. Jede Verwertung außerhalb der engen Grenzen des Urheberrechtsgesetzes ist ohne Zustimmung des Verlags unzulässig und strafbar. Das gilt insbesondere für Vervielfältigungen, Übersetzungen, Mikroverfilmungen und die Einspeicherung und Verarbeitung in elektronischen Systemen. Die Wiedergabe von Gebrauchsnamen, Handelsnamen, Warenbezeichnungen usw. in diesem Werk berechtigt auch ohne besondere Kennzeichnung nicht zu der Annahme, dass solche Namen im Sinne der Warenzeichen- und Markenschutz-Gesetzgebung als frei zu betrachten wären und daher von jedermann benutzt werden dürften. Umschlaggestaltung: KünkelLopka Medienentwicklung, Heidelberg Gedruckt auf säurefreiem und chlorfrei gebleichtem Papier Printed in the Netherlands ISBN 978-3-8349-2714-9
Für meine Familie.
Geleitwort Im Rahmen des Jahresabschlusses werden die finanzielle Lage und der Erfolg eines Unternehmens festgestellt. Zum einen hat dies eine Informationsfunktion für die Stakeholder, insbesondere Shareholder der Gesellschaft. Zum anderen besteht eine Zahlungsbemessungsfunktionen für die Besteuerung sowie für die Dividendenzahlungen. Damit diese beiden Funktionen gewährleistet sind, müssen die Angaben im Jahresabschluss hinreichend zuverlässig sein. Insofern muss sichergestellt sein, dass die Angaben nicht fehlerhaft sind und insbesondere nicht manipuliert wurden. Es können durchaus Anreize für die Unternehmensleitung bestehen, durch Manipulationen die Lage der Gesellschaft positiver darzustellen als sie tatsächlich ist. Vor diesem Hintergrund ist die für größere Gesellschaften gesetzlich vorgeschriebene externe Prüfung des Jahresabschlusses durch einen Wirtschaftsprüfer von besonderer Bedeutung. Die Prüfung des Jahresabschlusses zeigt sich hierbei als eine in quantitativer und qualitativer Hinsicht sehr anspruchsvolle Aufgabe. Bei der Prüfung einzelner interessierender Prüfungsfelder ist es aus Zeit- und Kostengründen in der Regel erforderlich, statt einer Vollprüfung eine Auswahlprüfung, eine sogenannte Stichprobenprüfung, vorzunehmen. Bei der Stichprobenauswahl muss allerdings gewährleistet sein, dass von der Stichprobe auf die Grundgesamtheit des Prüfungsfeldes geschlossen werden kann. Bei einer Stichprobenprüfung existieren in der Praxis zwei grundsätzlich unterschiedliche Verfahren, um die Auswahl der Stichprobe vorzunehmen. Dies sind zum einen Verfahren mit bewusster Auswahl und zum anderen Verfahren mit zufälliger, mathematisch-statistischer Auswahl. In der vorliegenden Arbeit vermittelt Herr Giezek dem Leser einen sehr guten Einblick in das statistische Standardverfahren „Monetary Unit Sampling“, welches zur Zeit international eine starke Beachtung erfährt. Damit das Konzept erfolgreich in der Praxis eingesetzt werden kann, beleuchtet Herr Giezek sowohl die grundlegenden statistischen Zusammenhänge als auch die spezifischen praktischen Gegebenheiten des Prüfer-Umfeldes im integrativen Zusammenhang. Hierbei werden zunächst die wichtigsten prüfungstheoretischen sowie allgemeine statistische Grundlagen verständlich vermittelt. Hierauf aufbauend werden alternative Auswahl- und Auswertungsmethoden mit ihren Wechselwirkungen
VIII
Geleitwort
überzeugend analysiert und praktische Verbesserungsmöglichkeiten aufgezeigt. Eine empirische Untersuchung zur Anwendung von Stichprobenverfahren im Rahmen der Jahresabschlussprüfung rundet die Arbeit ab. Herrn Giezek ist es mit seiner Arbeit gelungen, einen eigenständigen wissenschaftlichen Beitrag zu einem anspruchsvollen, komplexen und zugleich für die Prüferpraxis bedeutenden Thema zu liefern. Uni.-Prof. Dr. Louis Velthuis
Vorwort Statistische Verfahren werden in zunehmendem Maße in vielen Bereichen der Betriebswirtschaftslehre eingesetzt. Auch im Rahmen der Wirtschaftsprüfung ist aufgrund der Komplexität der Aufgabenstellungen eines Prüfers der Einsatz statistischer Methoden notwendig und hilfreich. Dabei geht es nicht darum, dass die Erfahrungen eines Prüfers oder die erprobten Methoden der bewussten Auswahl ersetzt werden sollen, sondern vielmehr ergänzt und unterstützt die Statistik den Prüfungsablauf. Das Ziel, das Prüfungsrisiko zu minimieren, kann gerade wegen des zunehmenden Zeit- und Kostendrucks durch eine auf statistischen Methoden basierende Auswahlprüfung besser erreicht werden. Im Rahmen eines Seminars über den Einsatz mathematisch-statistischer Methoden in der Qualitätskontrolle am Lehrstuhl für Statistik und Ökonometrie von Herrn Univ.-Prof. Dr. Horst Rinne an der Justus-Liebig-Universität in Gießen bin ich Ende der achtziger Jahre zum ersten Mal mit dem damals in Deutschland fast unbekannten Verfahren „Monetary Unit Sampling“ in Berührung gekommen. Aufgrund meines beruflichen Werdeganges und meiner Schulungstätigkeiten im Bereich der Steuerberater- und Wirtschaftsprüferausbildung habe ich eine lange Zeit der Auseinandersetzung mit diesem Thema in der Zielsetzung abgeschlossen, dem Praktiker auch einen besseren Einblick in die statistischen Grundlagen des Monetary Unit Sampling zu geben. Mit diesem Beitrag soll daher die Lücke geschlossen werden, die sich durch die zwar notwendige, aber bislang nur unzureichend thematisierte Verbindung von Prüfungswesen und Statistik vor allem im Bereich des Monetary Unit Sampling ergibt. Mein besonderer Dank geht an dieser Stelle an Herrn Univ.-Prof. Dr. Louis Velthuis, Inhaber des Lehrstuhls für Controlling am Fachbereich Rechts- und Wirtschaftswissenschaften der Johannes Gutenberg Universität in Mainz. Dank seiner Mitwirkung und Unterstützung als Erstgutachter und Ratgeber wurde diese Arbeit in der jetzigen Form erst möglich. Auch möchte ich mich an dieser Stelle bei meinem Zweitgutachter, Herrn Univ.-Prof. Dr. Florian Heiss, und bei Herrn Univ.-Prof. Dr. Stefan Rammert für ihre Mitwirkung und Unterstützung bedanken. Abschließend bedanke ich mich bei Frau Christina Fricke, Frau Stefa-
X
Vorwort
nie Loyal und Frau Dr. Angelika Schulz, die durch ihre Korrekturanmerkungen und Kommentare die Qualität der Arbeit erhöhten. Den Lesern dieses Buches möchte ich zu einer Diskussion über die Inhalte und die Ideen in diesem Werk auffordern. Gerade durch den Austausch mit der Prüfungspraxis können in dem Verfahren in Zukunft sicher noch weitere Verbesserungen eingebaut werden. Bitte nutzen Sie dazu die Möglichkeit, sich mit mir per E-Mail (
[email protected]) auszutauschen. Dr. Bernd Giezek
Inhaltsverzeichnis Geleitwort .......................................................................................................... VII Vorwort .............................................................................................................. IX Inhaltsverzeichnis ............................................................................................... XI Abbildungsverzeichnis ..................................................................................... XIII Tabellenverzeichnis ........................................................................................... XV Abkürzungsverzeichnis .................................................................................. XVII 1
Einleitung ......................................................................................................1 1.1 Problemstellung und Gang der Arbeit ...................................................1 1.2 Historische Entwicklung des Monetary Unit Sampling .........................4
2
Prüfungstheoretische Grundlagen ..................................................................9 2.1 Prüfungsbegriff ......................................................................................9 2.2 Prüfungsablauf .....................................................................................12 2.3 Prüfungsrisiken ....................................................................................16 2.4 Prüfungsmethoden ...............................................................................23 2.4.1 Vollprüfung ..............................................................................24 2.4.2 Auswahlprüfung: Bewusste Auswahl versus Zufallsauswahl ..25
3
Grundlagen der Statistik für das Monetary Unit Sampling..........................47 3.1 Grundlagen der Stichprobentheorie .....................................................47 3.2 Stichprobenfunktionen .........................................................................52 3.3 Verteilungen von Stichprobenfunktionen ............................................63 3.4 Grundlagen der Testtheorie .................................................................85
4
Stichprobenziehung im Monetary Unit Sampling .......................................93 4.1 Grundidee der Ziehung im Monetary Unit Sampling ..........................93 4.2 Methoden der Stichprobenziehung im Monetary Unit Sampling ........97 4.2.1 Einfache Zufallsauswahl...........................................................97 4.2.2 Systematische Auswahl mit Zufallsart .....................................98 4.2.3 Variable Intervallziehung .......................................................100 4.2.4 Zellenauswahl .........................................................................101
XII
Inhaltsverzeichnis
4.2.5 Siebverfahren..........................................................................102 4.2.6 Modifiziertes Siebverfahren ...................................................104 4.2.7 Lahiri Auswahl .......................................................................105 4.3 Der Vergleich von Monetary Unit Sampling mit nicht wertproportionalen Auswahlverfahren ..............................................106 4.4 Beurteilung der wertproportionalen Zufallsauswahl..........................110 5
Simulation der Stichprobenziehung im Monetary Unit Sampling .............113 5.1 Zusammensetzung des Prüfungsfeldes ..............................................113 5.2 Einfache Zufallsauswahl ....................................................................118 5.3 Systematische Auswahl mit Zufallstart..............................................121 5.4 Variable Intervallziehung ..................................................................123 5.5 Zellenauswahl ....................................................................................126 5.6 Siebverfahren .....................................................................................128 5.7 Modifiziertes Siebverfahren ..............................................................131 5.8 Lahiri Auswahl ..................................................................................134 5.9 Vergleich und Beurteilung .................................................................136
6
Auswertung beim Monetary Unit Sampling ..............................................141 6.1 Grundlegende Überlegungen zur Auswertung ...................................141 6.2 Auswertung vollständig fehlerhafter Geldeinheiten ..........................143 6.3 Auswertung teilweise fehlerhafter Geldeinheiten ..............................148 6.3.1 Maximalfehlermethode...........................................................151 6.3.2 Fehlerreihungsmethode ..........................................................152 6.3.3 Durchschnittsfehlermethode ...................................................154 6.3.4 Beispielsberechnungen ...........................................................156 6.4 Erweiterung der Auswertung um die Binomialverteilung .................159 6.5 Erweiterung der Auswertung um Unterbewertungen ........................164 6.6 Berechnung des Stichprobenumfanges ..............................................168
7
Empirische Untersuchung zur Anwendung von Stichprobenverfahren .....173
8
Zusammenfassung .....................................................................................185
Literaturverzeichnis ...........................................................................................187
Abbildungsverzeichnis Abbildung 1: Abbildung 2: Abbildung 3: Abbildung 4: Abbildung 5: Abbildung 6: Abbildung 7: Abbildung 8: Abbildung 9: Abbildung 10: Abbildung 11: Abbildung 12: Abbildung 13: Abbildung 14: Abbildung 15: Abbildung 16: Abbildung 17: Abbildung 18: Abbildung 19: Abbildung 20: Abbildung 21: Abbildung 22: Abbildung 23: Abbildung 24:
Periodizität von Prüfungen ..................................................... 10 Ablauf einer Prüfung .............................................................. 14 Wasserhahn-Sieb-Analogien .................................................. 21 Differenzierung der Auswahlverfahren .................................. 28 Auswahlkriterien der bewussten Auswahl.............................. 29 Darstellung der einfachen Auswahl........................................ 37 Darstellung wertproportionaler Auswahl ............................... 37 Arten der Zufallsauswahl ....................................................... 38 Visuelle Darstellung des Ist-Soll-Vergleiches ........................ 39 Differenzierung zwischen Unter- und Überbewertung ........... 40 Fragestellungen statistischer Stichprobenverfahren ............... 41 Überblick über die Verfahren bei heterograden Fragestellung .......................................................................... 43 Einordnung des Monetary Unit Sampling .............................. 44 Darstellung der Auswahlgesamtheit beim Monetary Unit Sampling................................................................................. 50 Annahme- und Ablehnungsbereich der Nullhypothese .......... 87 Sequenzieller Prüfplan ........................................................... 91 Allgemeine Darstellung der Zellenauswahl.......................... 102 Absolute Häufigkeiten Konto A ........................................... 116 Absolute Häufigkeiten Konto B ........................................... 117 Absolute Häufigkeiten Konto A mit einfacher Zufallsauswahl ...................................................... 119 Absolute Häufigkeiten Konto B mit einfacher Zufallsauswahl ...................................................... 120 Absolute Häufigkeiten Konto A mit systematischer Zufallsauswahl ..................................................................... 122 Absolute Häufigkeiten Konto B mit systematischer Zufallsauswahl ..................................................................... 122 Absolute Häufigkeiten Konto A mit variabler Intervallziehung ..................................................... 124
XIV
Abbildungsverzeichnis
Abbildung 25: Absolute Häufigkeiten Konto B mit variabler Intervallziehung ..................................................... 125 Abbildung 26: Absolute Häufigkeiten Konto A mit Zellenauswahl ............ 127 Abbildung 27: Absolute Häufigkeiten Konto B mit Zellenauswahl ............. 127 Abbildung 28: Absolute Häufigkeiten Konto A mit Siebverfahren ............. 129 Abbildung 29: Absolute Häufigkeiten Konto B mit Siebverfahren.............. 130 Abbildung 30: Absolute Häufigkeiten Konto A mit modifiziertem Siebverfahren ....................................................................... 132 Abbildung 31: Absolute Häufigkeiten Konto B mit modifiziertem Siebverfahren ....................................................................... 133 Abbildung 32: Absolute Häufigkeiten Konto A mit Lahiri-Auswahl........... 135 Abbildung 33: Absolute Häufigkeiten Konto B mit Lahiri Auswahl ........... 135 Abbildung 34: Absolute Häufigkeiten Konto A mit Zufallsauswahl der Buchungen...................................................................... 137 Abbildung 35: Absolute Häufigkeiten Konto B mit Zufallsauswahl der Buchungen...................................................................... 138 Abbildung 36: Auswertungsbestandteile ...................................................... 148 Abbildung 37: Benutzung von Stichprobenverfahren 1994 ......................... 174 Abbildung 38: Benutzung von Stichprobenverfahren 2009 ......................... 175 Abbildung 39: Benutzung von statistischen Stichprobenverfahren 1994 ..... 177 Abbildung 40: Benutzung von statistischen Stichprobenverfahren 2009 ..... 177 Abbildung 41: Überblick über die genutzten statistischen Verfahren 1994 . 178 Abbildung 42: Überblick über die genutzten statistischen Verfahren 2009 . 178 Abbildung 43: Bekanntheit von Monetary Unit Sampling 1994 .................. 179 Abbildung 44: Bekanntheit von Monetary Unit Sampling 2009 .................. 180 Abbildung 45: Einsatz von Prüfungssoftware 2009 ..................................... 181 Abbildung 46: Vorteile statistischer Prüfungsverfahren 1994...................... 181 Abbildung 47: Vorteile statistischer Prüfungsverfahren 2009...................... 182 Abbildung 48: Nachteile statistischer Stichprobenverfahren 1994............... 184 Abbildung 49: Nachteile statistischer Stichprobenverfahren 2009............... 184
Tabellenverzeichnis Tabelle 1: Musterkonto für die statistischen Grundlagen.............................. 49 Tabelle 2: Beispiel für eine dichotome Grundgesamtheit in der Wirtschaftsprüfung....................................................................... 64 Tabelle 3: Urteilsrisiken bei der Anwendung von Stichprobenverfahren ..... 88 Tabelle 4: Musterkonto für die Stichprobenziehung ..................................... 95 Tabelle 5: Kumuliertes Musterkonto für die Stichprobenziehung ................ 96 Tabelle 6: Musterkonto von Leslie, Teitlebaum & Anderson ..................... 107 Tabelle 7: Stichprobenzusammensetzung im Musterkonto Leslie, Teitlebaum & Anderson ............................ 108 Tabelle 8: Auswertung Konto A ................................................................. 116 Tabelle 9: Auswertung Konto B ................................................................. 117 Tabelle 10: Auswertung Stichprobe Konto A mit einfacher Zufallsauswahl ........................................................................... 119 Tabelle 11: Auswertung Stichprobe Konto B mit einfacher Zufallsauswahl ........................................................................... 120 Tabelle 12: Auswertung Stichprobe Konto A mit systematischer Auswahl ..................................................................................... 121 Tabelle 13: Auswertung Stichprobe Konto B mit systematischer Auswahl ..................................................................................... 121 Tabelle 14: Auswertung Stichprobe Konto A mit variabler Intervallziehung ......................................................................... 124 Tabelle 15: Auswertung Stichprobe Konto B mit variabler Intervallziehung ......................................................................... 125 Tabelle 16: Auswertung Stichprobe Konto A mit Zellenauswahl................. 126 Tabelle 17: Auswertung Stichprobe Konto B mit Zellenauswahl ................. 126 Tabelle 18: Auswertung Stichprobe Konto A mit Siebverfahren ................. 129 Tabelle 19: Auswertung Stichprobe Konto B mit Siebverfahren .................. 130 Tabelle 20: Auswertung Stichprobe Konto A mit modifiziertem Siebverfahren ............................................................................. 132 Tabelle 21: Auswertung Stichprobe Konto B modifiziertem Siebverfahren ............................................................................. 133
XVI
Tabellenverzeichnis
Tabelle 22: Auswertung Stichprobe Konto A mit Lahiri Auswahl ............... 134 Tabelle 23: Auswertung Stichprobe Konto B mit Lahiri Auswahl ............... 134 Tabelle 24: Auswertung Stichprobe Konto A mit Zufallsauswahl der Buchungen ................................................................................. 137 Tabelle 25: Auswertung Stichprobe Konto B mit Zufallsauswahl der Buchungen ................................................................................. 138 Tabelle 26: Faktoren zur Berechnung der oberen Fehlergrenzen Ȝk;Į ........... 145 Tabelle 27: Ausschnitt aus Tabelle 26 .......................................................... 157 Tabelle 28: Faktoren Pk;Į auf Basis der Binomialverteilung (n = 100) ......... 163 Tabelle 29: Tabelle für Fehler 1. Art ............................................................ 169 Tabelle 30: Tabelle für Fehler 2. Art ............................................................ 170
Abkürzungsverzeichnis Abb. Abs. Abt. ACL AICPA AktG BGB BilMoG BP bzw. c.p. CMA DFM d.h. DUS e.V. EDV engl. ER etc. EUR f. ff. FOG FRM ggf. GmbH GmbHG HGB Hrsg. i.d.R.
Abbildung Absatz Abteilung Access Control List American Institute of Certified Public Accountants Aktiengesetz Bürgerliches Gesetzbuch Bilanzrechtsmodernisierungsgesetz Basis Precision beziehungsweise ceteris paribus Cumulative Monetary Amount Sampling Durchschnittsfehlermethode das heißt Dollar Unit Sampling eingetragener Verein Elektronische Datenverarbeitung englisch Entdeckungsrisiko et cetera Euro folgende und folgende Fehlerobergrenze Fehlerreihungsmethode gegebenenfalls Gesellschaft mit beschränkter Haftung Gesetz betreffend die Gesellschaften mit beschränkter Haftung Handelsgesetzbuch Herausgeber in der Regel
XVIII
i.S.d. IDEA IDW IKS IR IT KG KonTraG KPMG KR MFM MLE MSE MUS o.ä. PASW PGW PPS PR PwC R S. SPSS u.a. u.e.m. u.U. USA usw. vgl. Vol. WPK WPO z.B.
Abkürzungsverzeichnis
im Sinne der (des) Interactive Data Extraction and Analysis Institut der Wirtschaftsprüfer e.V. Internes Kontrollsystem inhärentes Risiko Informationstechnologie Kommanditgesellschaft Gesetz zur Kontrolle und Transparenz im Unternehmensbereich Klynveld, Peat, Marwick, Goerdeler Kontrollrisiko Maximalfehlermethode Most Likely Error Mean Square Error Monetary Unit Sampling oder ähnliches Predictive Analytics Software Precision Gap Widening Probability-Proportional-to-Size Prüfungsrisiko PricewaterhouseCoopers Statistische Software Seite Superior Performing Software System unter anderem und einiges mehr unter Umständen United States of America und so weiter vergleiche Volume Wirtschaftsprüferkammer Wirtschaftsprüferordnung zum Beispiel
1 Einleitung 1.1 Problemstellung und Gang der Arbeit Die Anforderungen an die Jahresabschlussprüfung und den damit beauftragten Abschlussprüfer sind in den letzten Jahren, nicht zuletzt aufgrund des immer größer werdenden Prüfungsumfanges, ständig gestiegen. Während der risikoorientierte Ansatz in der Abschlussprüfung bewusste Einzelfallprüfung unterstützt, werden trotzdem im praktischen Einsatz Verfahren statistischer Zufallsauswahl schon aus Kosten- und damit Wettbewerbsgründen1 eingesetzt. Selbst bei optimaler Gestaltung des Prüfungsablaufes kann der Wirtschaftsprüfer eine Vollprüfung in der Regel nicht vornehmen. Restriktionen hinsichtlich der Prüfungskosten und daraus unmittelbar folgend auch hinsichtlich der Prüfungszeit machen eine Auswahlprüfung erforderlich. Der Wirtschaftsprüfer hat im Rahmen der Abschlussprüfung die Aufgabe, die Verlässlichkeit der im Jahresabschluss und Lagebericht enthaltenen Informationen zu bestätigen und insoweit deren Glaubwürdigkeit zu erhöhen. Dabei führt der Abschlussprüfer die Abschlussprüfung mit dem Ziel durch, Prüfungsaussagen mit hinreichender Sicherheit unter Beachtung der Wirtschaftlichkeit zu treffen.2 Aus dem Grundsatz der Wirtschaftlichkeit folgt, dass die Abschlussprüfung keine lückenlose Prüfung erfordert, sondern Prüfungshandlungen auch in Form von Stichproben durchgeführt werden.3 Gerade wenn große Datenmengen vorliegen, die eine vollständige Prüfung aller Elemente in einem Prüffeld bzw. Prüfgebiet unmöglich machen, sind Verfahren der Stichprobenauswahl einzusetzen. Zum einen können Verfahren der bewussten Auswahl und zum anderen statistische Verfahren zur Anwendung kommen. Der Vorteil statistischer Verfahren liegt in der Berücksichtigung der 1 2
3
Vgl. DOHMS, H.-J. (2009). S. 5. Auch für die großen Wirtschaftsprüfungsgesellschaften wird der Wirtschaftlichkeitsgedanke immer wichtiger, denn beispielsweise die PwC hat im Geschäftsjahr 2008/ 2009 zehn Prozent Umsatzrückgang im Prüfungsgeschäft; vgl. KANNING, T. (2009), S. 13. Vgl. PS 200.
B. Giezek, Monetary Unit Sampling, DOI 10.1007/978-3-8349-6588-2_1, © Gabler Verlag | Springer Fachmedien Wiesbaden GmbH 2011
2
1 Einleitung
Wahrscheinlichkeitstheorie, die dem Prüfer objektive, mathematisch nachvollziehbare Aussagen über das Prüffeld erlauben. Da viele Grundgesamtheiten in der Prüfungspraxis einen hohen Anteil fehlerfreier Buchungen enthalten, ergibt sich daraus auch eine hohe Wahrscheinlichkeit, dass die Stichprobe keinen Fehler enthält (Zero-Error-Problem). Daher bedarf es auch bei der Anwendung statistischer Verfahren detaillierter Überlegungen sowohl über die Wahl der Auswertungsmethodik als auch insbesondere über die richtige Modalität der Ziehung. Das Monetary Unit Sampling4 hat sich mittlerweile zum statistischen Standardverfahren für den Einsatz in der Prüfungspraxis entwickelt. Die Grundlagen des Verfahrens sind in den USA in den 60er, 70er und 80er Jahren gelegt worden. Das Verfahren fand dann auch seinen Weg in die deutsche Prüfungspraxis, wurde jedoch Mitte der 90er Jahre von einigen, auch großen Prüfungsgesellschaften, teilweise nicht mehr aktiv eingesetzt. Erst in den letzten Jahren haben der Einsatz des Verfahrens und damit auch die Forschung in diesen Bereichen wieder zugenommen. Während frühere Veröffentlichungen sich intensiv mit den Stichprobenauswertungen beschäftigt haben, liegt der Fokus der aktuellen Forschung, die sich erst seit kurzem wieder diesem Verfahren zuwendet, auf den Auswahltechniken. Ziel dieser Arbeit ist u.a. daher, für diesen Bereich einen entsprechenden Beitrag zu leisten. Im Rahmen dieser Arbeit werden zu Beginn die prüfungstheoretischen Grundlagen für die Abschlussprüfung und die methodischen Grundlagen für den Einsatz statistischer Verfahren detailliert dargestellt und auch die entsprechenden Prüfungsstandards und Verlautbarungen berücksichtigt. Dabei wird darauf Rücksicht genommen, dass die Annäherung an dieses Thema aus zwei verschiedenen Blickwinkeln kommen kann; zum einen aus statistischer Sicht und zum anderen aus der Sicht des Prüfungswesens. Daher werden zu Beginn die grundlegenden Begriffe aus diesen beiden Bereichen erörtert. Aufgrund meiner langjährigen Erfahrung in vorbereitenden Schulungen für das Wirtschaftsprüferexamen habe ich 4
Monetary Unit Sampling (MUS) ist mittlerweile der anerkannte Begriff für dieses Verfahren geworden. Da das Verfahren aus den USA kam, etablierte sich zunächst der Begriff des Dollar-Unit-Sampling (DUS). In der Literatur finden sich ferner noch die folgenden Begriffe: Probability-Proportional-to-Size (PPS) sampling, Cumulative monetary amount (CMA) sampling, Guilder number method, Combined attributesvariables sampling (CAV-sampling).
1.1 Problemstellung und Gang der Arbeit
3
die Erkenntnis gewonnen, dass vielfach die tiefer gehenden Kenntnisse der statistischen Grundlagen für den durchgeführten Einsatz statistischer Stichprobenverfahren fehlen. Dies kann aber trotz – um nicht zu sagen gerade wegen – der Nutzung von Prüfungssoftware zu erheblichen Risiken führen, da bestimmte Einstellungen nur unter besonderen statistischen Voraussetzungen im Programm geändert werden dürfen. Auch kann der Abschlussprüfer mangels dieser Erkenntnisse oft auch keine weitergehenden Verbesserungshinweise für einen optimierten Einsatz des Monetary Unit Sampling geben. Dies machen ausschließlich Spezialabteilungen, die dafür bestens ausgebildet sind, denen aber die Praxisnähe und die täglichen Erfahrungen aus der Prüfungstätigkeit fehlen könnten. Mit diesem Beitrag soll die Lücke geschlossen werden, die sich durch die zwar notwendige, aber bislang nur unzureichend thematisierte Verbindung von Prüfungswesen und Statistik vor allem im Bereich des Monetary Unit Sampling ergibt. Der erste Teil geht aus den genannten Gründen daher stärker auf die statistischen Grundlagen für den Einsatz in der Jahresabschlussprüfung ein. Im zweiten Teil der Arbeit werden die verschiedenen Verfahren der Auswahltechnik mit ihren Vor- und Nachteilen und mit aktuellen Weiterentwicklungen heraus gearbeitet. Anhand von eigenen Simulationen mit realen Daten werden anschließend die Verfahren miteinander verglichen. Hierbei soll dargestellt werden, wie das Auswahlverfahren den Einsatz des Monetary Unit Sampling unterstützt, aber auch auf welche Besonderheiten zu achten ist. Somit soll aufgezeigt werden, wie sich die verschiedenen Auswahltechniken letztendlich auf die Verteilung in der Stichprobe und damit auf die Arbeiten des Wirtschaftsprüfers in der Abschlussprüfung auswirken. Dabei werden Originaldaten aus der Wirtschaftsprüfungspraxis verwendet, da frühere Studien – hauptsächlich aus den 90er Jahren – nur mit simulierten Grundgesamtheiten arbeiteten. Ferner werden in dieser Untersuchung auch alle aktuellen Weiterentwicklungen der Auswahlverfahren berücksichtigt. Für den Einsatz bei weiteren Datensätzen in der Forschung und in der Praxis wird ferner ein Programm in R zur Nutzung erstellt und umgesetzt.5 Der dritte Teil widmet sich der Auswertung der Stichprobenergebnisse und den daraus entstehenden Schwierigkeiten für die Praxis. Ferner zeigt dieser Teil Lösungswege für diese Probleme auf. Darüber hinaus werden die aktuellen Aus5
R ist eine Programmiersprache: http://de.wikipedia.org/wiki/R_%28Programmier sprache%29.
4
1 Einleitung
wertungsmodule auf Basis der Poisson-Verteilung verglichen mit den in dieser Arbeit entwickelten Modulen auf Basis der Binomialverteilung. Diese sind für die Praxis auch ohne besondere Softwaremodule nutzbar. Im abschließenden Teil werden die Ergebnisse einer aktuellen Befragung in kleinen, mittleren und großen Wirtschaftsprüfungsgesellschaften über den Einsatz von statistischen Verfahren ausgewertet und anschließend mit den Ergebnissen mit einer ähnlichen, eigenen, empirischen Erhebung aus dem Jahre 1994 verglichen und die Entwicklungen aufgezeigt.
1.2 Historische Entwicklung des Monetary Unit Sampling Anfang der sechziger Jahre begannen verschiedene amerikanische Prüfungsgesellschaften, ein neues statistisches Prüfungsverfahren zu entwickeln.6 Das Verfahren sollte speziell für die Prüfungssituationen entwickelt werden, bei denen die bisherigen Verfahren nicht effizient eingesetzt werden konnten. Die Entwickler dachten dabei insbesondere an Prüffelder mit einem geringen Fehleranteil, bei denen aber das Risiko besteht, dass die wenigen Fehler wertmäßig bedeutend sind. Zwischen 1960 und 1965 wurde ein solches Verfahren sowohl von zwei Prüfungsgesellschaften als auch von einem einzelnen Buchprüfer entwickelt. Obwohl diese Verfahren nicht identisch waren, basierten sie doch alle auf der wertproportionalen Zufallsauswahl. Die beiden Prüfungsgesellschaften waren HASKIN & SELLS in den USA sowie CLARKSON CORDON in Kanada; der einzelne Buchprüfer war der Niederländer A. van HEERDEN, dessen Aufsatz im Jahre 1961 der erste Artikel über das neue Verfahren war. Er nannte das Verfahren Guilder number method. Da der Artikel von 1961 in holländisch geschrieben und erst 1967 erstmalig in verkürzter Form in die englische Sprache übersetzt wurde,7 blieb die Bedeutung dieser Schrift außerhalb des holländischen Sprachraumes lange Zeit gering. 6
7
Vgl. LESLIE, D.A./ TEITLEBAUM, A.D./ ANDERSON, R.J. (1979), Anhang L; vgl. McRAE, T.W. (1982), S. 151 ff.; vgl. KAPLAN, R.S. (1975/II), S. 138 ff. Eine Darstellung der Entwicklung des betriebswirtschaftlichen Prüfungswesens in Deutschland seit den Vorarbeiten des LUCA PACIOLI zur Einführung der doppelten Buchführung im Jahre 1494 findet sich bei LÜCK, W. (1986), S. 1 ff. Eine vollständige Übersetzung erfolgte erst 1979.
1.2 Historische Entwicklung des Monetary Unit Sampling
5
KENNETH STRINGER, ein Teilhaber von HASKINS & SELLS in New York, bat 1961 den Statistikprofessor F. STEPHAN von der Princetown University um Mithilfe bei der Entwicklung eines neuen Stichprobenverfahrens für die Buchprüfung. STEPHAN, der außerdem auch Vorsitzender der New York Applied Business Statistic Group war, verbrachte daraufhin mehrere Wochen damit, die Tätigkeit eines externen Prüfers zu analysieren. Das Resultat der Beobachtungen und der Zusammenarbeit von STRINGER und STEPHAN war ein Verfahren, das sie „cumulative monetary amount sampling (CMA)“8 nannten. Der erste Artikel über das neu entwickelte Verfahren erschien 1963. Das Verfahren wurde in den Jahren 1963-1964 getestet, ehe es ab 1966 in den USA weitreichende Verwendung in der praktischen Anwendung fand. Für die kanadische Prüfungsgesellschaft CLARKSON GORDON entwickelten zwei der Mitarbeiter, RON ANDERSON und DON LESLIE, in Zusammenarbeit mit Dr. A.D. TEITLEBAUM von der McGill University in Montreal ein auf der Basis des CMA-sampling modifiziertes, statistisches Prüfungsverfahren. Sie nannten dieses Verfahren Dollar-unit Sampling. Das Verfahren des Dollarunit Sampling ist nicht so konservativ9 wie das CMA-sampling und ermöglicht aus diesem Grund einen geringeren Stichprobenumfang und dadurch auch geringere Prüfungskosten. Die Auswertungen des Dollar-unit Sampling basieren im Regelfall auf der Poisson-Verteilung. Der erste Artikel, der über Dollar-unit Sampling von ANDERSON und TEITLEBAUM verfasst wurde, stammt aus dem Jahre 1973. Das Hauptwerk über Dollar-unit sampling ist das 1979 geschriebene Buch „Dollar-unit sampling: A Practical Guide for Auditors“ von LESLIE, TEITLEBAUM und ANDERSON. Das Verfahren etablierte sich bei CLARKSON GORDON. Bereits 1980 wurde es bei 60% der Prüfungen genutzt. Mitte der achtziger Jahre wurde dann das Dollar-unit Sampling weiterentwickelt. Basis der Weiterentwicklung und der Aufhebung einiger Nachteile dieses Verfahrens ist die Ersetzung der Poisson-Verteilung durch die Multinominalverteilung als Basis der Stichprobenauswertung. In diesem Zusammenhang sei beispielsweise der Aufsatz von TSUI, K.-W., MATSUMURA und TSUI, K.-L. genannt, der im Jahre 1985 entstand. Auch der zunehmende Einsatz von Perso8 9
LESLIE, D.A./ TEITLEBAUM, A.D./ ANDERSON, R.J. (1979), Anhang L. Der Begriff konservativ wird in der Prüfungsliteratur meist als vorsichtig übersetzt. Vgl. zum Begriff u.a. PÖHLMANN, H. (1998), S. 23.
6
1 Einleitung
nalcomputern in dieser Zeit führte dazu, dass das Interesse an statistischen Stichprobenverfahren wie Dollar-unit Sampling insbesondere in den USA leicht anstieg. WILLITS und McCASLIN stellten beispielsweise 1985 ein auf Lotus 1-2-3 basierendes Programm für das Dollar-unit Sampling vor. In der deutschen Prüfungspraxis wurde das Verfahren dagegen bis Ende der 80er Jahre noch sehr selten angewendet, da es entweder den Prüfern unbekannt war oder der Prüfer die Stichprobenverfahren der bewussten Auswahl vorzogen. Lediglich die großen bundesdeutschen Wirtschaftsprüfungsgesellschaften wie z.B. KPMG griffen zumindest teilweise auf Dollar-unit Sampling zurück. Durch den verstärkten Einsatz der EDV im Rahmen der Prüfung – auch vor Ort beim Mandanten – wurden nach und nach Programme für das mittlerweile unter dem Namen Monetary Unit Sampling bekannter werdende Verfahren entwickelt. Jedoch stießen diese bald an die Kapazitätsgrenzen der Softwarepakete.10 Dies führte dazu, dass viele Gesellschaften Mitte der 90er Jahre das Verfahren wieder einstellten bzw. nicht mehr ausdrücklich in den Prüfungsrichtlinien erwähnten. Erst durch die Entwicklung von größeren Prüfungssoftwarepaketen wie z.B. IDEA, welches mittlerweile auch von den Betriebsprüfern der deutschen Finanzverwaltung eingesetzt wird, wurde der Einsatz von Monetary Unit Sampling ab Mitte dieses Jahrzehntes wieder praktikabel und führte dazu, dass Monetary Unit Sampling heutzutage bei der Prüfung zu den anerkannten Standardverfahren gehört. Da die Nutzung dieses Verfahrens aber in ein Softwarepaket eingebunden ist, fehlt – selbst erfahrenen Abschlussprüfern11 – vielfach noch ein tiefer gehendes Verständnis für die statistischen Grundlagen des Monetary Unit Sampling. Durch verstärkte – aber auch kostenintensive – Schulungen werden die Wirtschaftsprüfer detaillierter über die Grundlagen der Stichprobenverfahren im Allgemeinen und des Monetary Unit Sampling im Speziellen informiert. Bei den für den Beruf der Wirtschaftsprüfer notwendigen Examensprüfungen sind die grundlegenden Inhalte der Statistik mittlerweile auch Bestandteile des Prüfungskataloges und auch Inhalt der Examensklausuren der letzten Jahre. Durch das größer werdende Ver10 Aufgrund eigener Untersuchung und Gespräche wurden als Gründe für auftretende Probleme die Umstellung von Apple auf Windows und die auf damals noch ca. 65.000 Zeilen begrenzte Tabellenkalkulationen genannt. Teilweise war in älteren Versionen bestimmter Officepakete die Zeilenanzahl noch geringer. 11 Aufgrund eigener Untersuchung und Gespräche wurde dieses Problem oft angesprochen.
1.2 Historische Entwicklung des Monetary Unit Sampling
7
ständnis für das Verfahren und die wichtigen Parameter beim Einsatz des Monetary Unit Sampling kann der Einsatz in der Praxis der Wirtschaftsprüfung in der Zukunft weiter optimiert werden.
2 Prüfungstheoretische Grundlagen 2.1 Prüfungsbegriff Der Begriff der Prüfung kann definiert werden als „eine von natürlichen, organisatorisch prozessunabhängigen Personen durchgeführte Veranstaltung ..., die aus dem Vergleich von Ist-Objekten mit den entsprechenden Soll-Objekten und der daran anschließenden Urteilsbildung sowie ggf. Urteilsmitteilung besteht.“12 In der Terminologie der Prüfungslehre wird Prüfung als Unterbegriff von Überwachung verwendet. Erfolgt eine Überwachung prozessabhängig, bezeichnet man sie als Kontrolle; erfolgt die Überwachung dagegen prozessunabhängig, spricht man von Prüfung. Bei dem Begriff der Prüfung, für den auch synonym der Begriff Revision verwendet werden kann, unterscheidet die Prüfungslehre zwischen interner und externer Prüfung. Die interne Prüfung (interne Revision) wird von Personen vorgenommen, die Angehörige des zu prüfenden Betriebes sind,13 während als externe Prüfung (externe Revision) die Prüfung durch unternehmensfremde Personen oder Personengesamtheiten bezeichnet wird. Mit der Prozessunabhängigkeit beider Personengruppen, sowohl der internen als auch der externen Prüfer, soll das Risiko der Befangenheit des Prüfers (der Prüfer) ausgeschlossen bzw. minimiert werden. Monetary Unit Sampling kann sowohl bei einer internen Prüfung als auch bei einer externen Prüfung sinnvoll eingesetzt werden, da bei diesem Verfahren eine zufällige Auswahl der Prüfungselemente erfolgt und somit eine bewusste Manipulation bei der Auswahl der zu prüfenden Elemente vermieden werden kann. Werden die Prüfungen nach der Häufigkeit der Prüfungen differenziert, so wird zwischen periodischen und aperiodischen Prüfungen unterschieden (vgl. Abbildung 1). Die bedeutendste periodische Prüfung ist die Jahresabschluss-
12 WYSOCKI, K.v. (1988), S. 7. 13 Auch Wirtschaftsprüfungsgesellschaften führen im Auftragsverhältnis Revisionstätigkeiten durch. Dies ist aber nicht die Regel und kommt meist dann vor, wenn in der Unternehmung keine interne Revision vorhanden ist. B. Giezek, Monetary Unit Sampling, DOI 10.1007/978-3-8349-6588-2_2, © Gabler Verlag | Springer Fachmedien Wiesbaden GmbH 2011
10
2 Prüfungstheoretische Grundlagen
Prüfung
Periodische Prüfung z.B. Jahresabschluss
Abbildung 1:
Aperiodische Prüfung z.B. Prüfung bei Kapitalveränderung
Periodizität von Prüfungen
prüfung. Im Rahmen der Jahresabschlussprüfung kann Monetary Unit Sampling besonders effizient bei der Prüfung von Bilanzaktiva (z.B. Forderungen aus Lieferung und Leistung) eingesetzt werden. Die Pflicht zur Jahresabschlussprüfung durch einen Abschlussprüfer ist gesetzlich vorgeschrieben: „Der Jahresabschluss und der Lagebericht von Kapitalgesellschaften, die nicht kleine im Sinne des § 267 Abs. 1 sind, sind durch einen Abschlussprüfer zu prüfen. Hat keine Prüfung stattgefunden, so kann der Jahresabschluss nicht festgestellt werden.“14 „Werden der Jahresabschluss, der Konzernabschluss, der Lagebericht oder der Konzernlagebericht nach Vorlage des Prüfungsberichts geändert, so hat der Abschlussprüfer diese Unterlagen erneut zu prüfen, soweit es die Änderung erfordert. Über das Ergebnis der Prüfung ist zu berichten; der Bestätigungsvermerk ist entsprechend zu ergänzen.“15
Neben den Vorschriften aus dem HBG sind für die Abschlussprüfung auch noch spezielle Vorschriften wie das GmbHG und das AktG zu beachten.16 Darüber hinaus gelten für die Abschlussprüfung auch die IDW Prüfungsstandards: „Abschlussprüfungen i.S.d. IDW Prüfungsstandards sind gesetzliche Prüfungen gemäß §§ 316 ff. HGB und solche gesetzliche Prüfungen, bei denen dieser Prüfungsgegen-
14 § 316 Abs. 1 HGB (2009). 15 § 316 Abs. 3 HGB (2009). 16 Vgl. COENENBERG, A.G. (2005), S. 33 ff. sowie die dort angegebenen Quellen. Auf eine detaillierte Darstellung wird im Rahmen dieser Arbeit verzichtet. Vgl. auch WYSOCKI, K.v./ SCHULZE-OSTERLOH, J./ HENNRICHS, J./ KUHNER, C. (2007), S. 43 f.
2.1 Prüfungsbegriff
11
stand durch zusätzliche gesetzliche Vorschriften erweitert worden ist (z.B. bei Genossenschaften, Krankenhäusern), sowie freiwillige Abschlussprüfungen, die diesen Prüfungen nach Art und Umfang entsprechen. Die Ausführungen der IDW Prüfungsstandards zur Jahresabschlussprüfung gelten entsprechend für die Konzernabschluss17 prüfung. Abschlussprüfungen können auch Zwischenabschlüsse betreffen.“
Eine aperiodische Prüfung findet nur dann statt, wenn seitens des Gesetzgebers bestimmte Vorgänge in einem Unternehmen als prüfungspflichtig beurteilt werden (z.B. bei einer Kapitalveränderung). Aperiodische Prüfungen werden selten durchgeführt.18 Aus betriebswirtschaftlicher Sicht wird durch die Abschlussprüfung letztendlich auch das Ziel verfolgt, die verschiedenen Interessensgruppen (stakeholder) im Umfeld des Unternehmens – insbesondere jedoch die Eigen- und Fremdkapitalgeber – besser zu informieren und die Glaubwürdigkeit der Unternehmensinformationen zu erhöhen. Wird dies im thematischen Umfeld der Agency-Theorie gesehen, so kann der Begriff der Prüfung auch als Möglichkeit verstanden werden, die Überwachung des Agenten durch den Prinzipal zu verbessern. Der Eigenkapitalgeber (Prinzipal) hat nicht den gleichen Informationsstand wie der Agent (Management) bezüglich der Einhaltung der Rechnungslegungsnormen. Durch eine Jahresabschlussprüfung und ein positives Prüfungsurteil wird dem Prinzipal die Qualität des Managements hinsichtlich der Einhaltung der normgerechten Rechnungslegung aufgezeigt. Die Qualität der Leistung des Agenten zeigt sich letztendlich in den Zahlen des Rechnungswesens, und, wenn diese durch die Abschlussprüfung als korrekt (mit einem Restrisiko) eingestuft werden, dann kann der Prinzipal das bestehende Informationsdefizit abbauen. Aus Sicht des Prinzipals ist eine Abschlussprüfung eine Maßnahme des Monitoring.19 Mittlerweile wird das Verhältnis des Abschlussprüfers zu dem Mandaten auch unter spieltheoretischen Gesichtspunkten gesehen und damit die Prüfung letzt-
17 IDW PS 200, S. 2. Auf eine detaillierte Darstellung wird im Rahmen dieser Arbeit verzichtet. 18 Vgl. WYSOCKI, K.v. (1988), S. 42. 19 Vgl. MARTEN, K.-U./ QUICK, R./ RUHNKE, K. (2007), S. 32ff. und GROLL, M. / GIEZEK, B. (2007), S. 1421 ff. für eine kurze Darstellung der Principal-Agent-Problematik.
12
2 Prüfungstheoretische Grundlagen
endlich als 2-Personen-Nullsummen.20 Der Wirtschaftsprüfer hat die Wahl zwischen den Strategien s1 und s2 und der Mandant als Bilanzaufsteller zwischen den Strategien t1 und t2: s1 s2 t1 t2
– sorgfältige Prüfung – nicht sorgfältige Prüfung – manipulierte Rechnungslegung – nicht manipulierte Rechnungslegung
Um die Gefahr bei einem solchen Spiel zu minimieren, dass sich die Situation einer Manipulation und keiner sorgfältige Prüfung einstellt, werden neben hohen Haftungssummen für den Abschlussprüfer und entsprechenden Strafen für den Bilanzaufsteller auch als risikoorientierter Ansatz die Prüferrotation gefordert. Diese wurde durch das BilMoG für Kapitalgesellschaften im Sinn des § 264 d HGB vorgeschrieben. Es besteht die Pflicht zur internen Rotation gemäß § 319 a HGB bei Abschlussprüfungen von kapitalmarktorientierten für darin involvierte, verantwortliche Prüfungspartner. Verantwortliche Prüfungspartner sind Wirtschaftsprüfer, die den Bestätigungsvermerk zum Jahres- oder Konzernabschluss zeichnen, oder Wirtschaftsprüfer, die von einer Wirtschaftsprüfungsgesellschaft für die Durchführung der jeweiligen Abschlussprüfung verantwortlich bestimmt wurden, ohne dass der Wirtschaftsprüfer den Bestätigungsvermerk zeichnet. Die Abkühlphase beträgt mindestens zwei Jahre.21
2.2 Prüfungsablauf Das Ziel einer Prüfung ist die Beurteilung des vorgegebenen Prüffeldes. Die Abgabe eines Urteils erfordert vom Prüfer, Soll-Ist-Vergleiche durchzuführen und die Tragweite eventuell entdeckter Abweichungen zu beurteilen. Die dazu notwendigen Handlungen werden als Prüfungshandlungen bezeichnet. Der Ablauf einer einfachen Prüfung, der sogenannte Prüfungsprozess, erfolgt im Allgemeinen in vier Schritten:22
20 Vgl. WPK (2005), S. 2f.; vgl. für eine Einführung in die Theorie der 2-Personen-Nullsummenspiele NEUMANN, K./ MORLOCK, M. (2002), S. 142ff. 21 Vgl. PHILIPPS, H. (2009), S. 20. 22 Vgl. WITTMANN, A. (1980), S. 8f.
2.2 Prüfungsablauf
13
1) Feststellung des Ist-Objektes (der Ist-Objekte) 2) Feststellung des Soll-Objektes (der Soll-Objekte) 3) Soll-Ist-Vergleich 4) Beurteilung der eventuell festgestellten Soll-Ist-Abweichung(en) Beispiel: Bei einer Prüfung der Vorräte ist das Ist-Objekt der tatsächliche Zustand der Bestandsaufnahme. Das Soll-Objekt wird anhand der zugrunde liegenden Rechtsnormen ermittelt. Dabei wird im Allgemeinen ein bestimmter bzw. bestimmbarer Toleranzspielraum zugelassen. Die Zulässigkeit von Stichprobenverfahren, wie z.B. das Monetary Unit Sampling, wird u.a. mit dem Bestehen eines solchen Toleranzspielraumes erklärt.23 Der Vergleich des Ist-Objektes mit dem Soll-Objekt kann zu den folgenden Ergebnissen führen: Die Differenz zwischen dem Buchbestand und dem tatsächlichen Bestand übersteigt die zulässige Toleranz oder die festgestellte Soll-Ist-Abweichung liegt innerhalb der Toleranzgrenze, bzw. es liegt keine Abweichung vor. Der Prüfer wird aufgrund des dieses Ergebnisses die Ordnungsmäßigkeit des Prüffeldes bestätigen. Ist dagegen die festgestellte Soll-Ist-Abweichung oberhalb des Toleranzwertes, wird der Prüfer das Prüffeld aufgrund dieses Ergebnisses nicht als ordnungsmäßig annehmen (vgl. Abbildung 2).24 Für den Revisor wird die Durchführung einer ordnungsgemäßen Prüfung nicht zuletzt aufgrund eines immer größer werdenden Aufgabengebietes zunehmend schwieriger („the only certainty about the profession‘s future is that it holds the prospect for more extensive and more rapid change than the profession has already experienced“)25. In diesem Zusammenhang werden hier komprimiert einige Tendenzen gekennzeichnet, die heute genauso gelten wie zu den Zeiten, als das Monetary Unit Sampling entwickelt wurde. Das Berufsbild des Wirtschaftsprüfers wird permanent weiter entwickelt.26
23 24 25 26
Vgl. WYSOCKI, K.v. (1988), S. 171. Vgl. DEINDL, J. (1981), S. 10. HICKOK, R.S. (1984), S. 77. Eigene Befragungen und Untersuchungen.
14
2 Prüfungstheoretische Grundlagen
Ist-Objekt
Feststellungsphase
Soll-Objekt
Vergleichsphase
Soll-Ist-Abweichung
Beurteilungsphase Abweichung > Toleranz
Abweichung Toleranz
Ablehnung des Prüffeldes
Annahme des Prüffeldes
Abbildung 2:
Ablauf einer Prüfung
Externe Tendenzen: Dem Revisor werden vom Gesetzgeber, von den nationalen und internationalen Gerichten, sowie von den entsprechenden Berufsorganisationen neue Aufgaben übertragen, die man verallgemeinernd unter dem Begriff der „Harmonisierung auf internationaler Ebene“ zusammenfassen kann. Teilweise sieht man diesen Trend auch schon als Paradigmenwechsel sowohl in der deutschen Rechnungslegung als auch in der Rechnungslegungsprüfung.27 Zwischen den einzelnen Prüfungsgesellschaften wird der Konkurrenzdruck immer größer, da für die Unternehmen aufgrund der Homogenität der angebotenen Dienstleistungen seitens der Wirtschaftsprüfungsgesellschaften i.d.R. nur noch das Preis-Leistungs-Verhältnis bei einer Prüfung zählt. Ferner erwarten die Unternehmen neben der
27 Vgl. WOLZ, M. (2003) S. 1 in Anlehnung an OLDERHEIDE (2002). Der Autor verweist hier insbesondere auf den §292a Abs. 2 HGB, der deutschen Unternehmen erlaubt, einen Konzernabschluss nach internationalen Normen aufzustellen, ohne zusätzlich einen Konzernabschluss nach dem HGB anzufertigen.
2.2 Prüfungsablauf
15
Bestätigung des Jahresabschlusses auch vielfach eine kompetente Beratung von den Wirtschaftsprüfern, die fast alle Bereiche des Unternehmens (z.B. Qualitätssicherung, Organisation, interne Kontrolle, Risikomanagement usw.) betrifft. Die Anzahl der Buchungen nimmt in einem immer stärker werdenden Maße zu. Durch die voranschreitende Integration und Implementierung der EDV können immer mehr Informationen verarbeitet werden; z. B. der Bankensektor wird selbst für einen Insider aufgrund der starken internationalen Verflechtungen und der steigenden Anzahl an komplizierten Finanzinstrumenten fast unüberschaubar. Wie leicht in diesen Bereichen – als auch in den klassischen Beschäftigungsfeldern der Bank – Manipulationen möglich sind, zeigt die Entwicklung vieler Geldhäuser und nahestehender Unternehmen in den letzten zwei Jahren mehr als deutlich. Interne Tendenzen: Aufgrund der eben dargestellten externen Tendenzen auf der einen Seite und dem ständigen Bemühen zur Verbesserung der Qualität der Revision auf der anderen Seite werden zunehmend modernere Instrumente in die Prüfungshandlungen implementiert. Der Einsatz von mathematisch-statistischen Stichprobenverfahren28 und der damit verbundene Einsatz der EDV für die Revision kann als die wichtigste Maßnahme auf Veränderungen der externen Tendenzen gewertet werden. Dies erfordert für den Wirtschaftsprüfer eine über die eigentliche Theorie der Revision hinausgehende Qualifikation in den oben genannten Bereichen, die sich in der Praxis auch dadurch ausdrückt, dass fast nur noch Akademiker eingesetzt und interne Schulungen intensiver genutzt werden. Ferner kommen bei den großen Gesellschaften sogenannte „statistical audit specialists“ oder „computer audit specialists“ bei aufwendigen Prüfungen zum Einsatz. Es sind Spezialabteilungen geschaffen worden, die weltweit die Prüfer bei der Umsetzung statistischer Verfahren und dem Einsatz der Softwarepakete unterstützen.
28 Monetary Unit Sampling wird zu den statistischen Verfahren innerhalb der Wirtschaftsprüfung gerechnet, so dass im Rahmen dieser Arbeit auf die früher in der mathematischen Theorie diskutierten Modelle der Wirtschaftsprüfung schon deshalb nicht eingegangen wird, da diese Verfahren aufgrund ihrer Komplexität in der Praxis nur sehr selten eingesetzt werden. Für den interessierten Leser in diesem Zusammenhang wird verwiesen auf den Aufsatz von KINNEY, W.R., Jr./FELIX, W.L., Jr. (1980), S. 98 ff.
16
2 Prüfungstheoretische Grundlagen
Die Planung und die Kontrolle der Revisionsarbeiten müssen permanent verbessert werden, um zum einen die Qualität der Revision zu sichern und zum anderen eine Senkung der Prüfungskosten herbeizuführen, damit die Wettbewerbsfähigkeit gesichert werden kann.29 Die Revision wird zunehmend kapitalintensiver und erfordert daher ein schnelles Anpassungsvermögen an die modernen Technologien. Dies führte beispielsweise in den USA schon in den 80er Jahren zur Gründung des „future issue committee“ durch das American Institute of Certified Public Accountants (AICPA), das gerade im Bereich der Implementierung von moderner Technologie in der Revision die Wirtschaftsprüfungsgesellschaften beraten soll.30
2.3 Prüfungsrisiken Für den Abschlussprüfer besteht bei einem risikoorientierten Prüfungsansatz die Gefahr, dass ein Prüffeld trotz wesentlicher Fehler akzeptiert wird. Dies bezeichnet man als Prüfungsrisiko und als sogenannten ȕ-Fehler. Auf der anderen Seite existiert auch ein Į-Fehler, der die irrtümliche Ablehnung eines Prüffeldes bezeichnet. Dieser wird jedoch beim risikoorientierten Prüfungsansatz nicht weiter berücksichtigt.31 Der IDW hat im PS 261 den risikoorientierten Ansatz neu beschrieben. Dieser Ansatz läßt sich in drei Phasen aufteilen:32 1. Phase: Feststellung der Fehlerrisiken Der Prüfer hat Informationen darüber zu gewinnen, wie das Unternehmen als Einheit funktioniert und wie das Umfeld sich zusammensetzt. Dies soll ein kontinuierlicher dynamischer Prozess sein, der sich über die gesamte Prüfung zieht. Der Prüfer muss letztendlich das Geschäftsmodell umfänglich verstehen. Dazu gehören u.a. Kenntnisse
29 Auch für die großen Wirtschaftsprüfungsgesellschaften wird die Wettbewerbssituation immer schwieriger, denn beispielsweise die PwC hat im Geschäftsjahr 2008/ 2009 zehn Prozent Umsatzrückgang alleine im Prüfungsgeschäft; vgl. KANNING; T. (2009), S. 13. 30 Vgl. HICKOK, R.S. (1984), S. 77. 31 Vgl. MARTEN, K.-U./ QUICK, R./ RUHNKE, K. (2006), S. 644. 32 Vgl. IDW PS 261 (2006), S. 8.
2.3 Prüfungsrisiken
17
der Branche
der rechtlichen Rahmenbedingungen
des Rechnungslegungssystems
der Strategie des Unternehmens
der Angemessenheit und Implementierung des IKS (Internes-Kontroll-System)33
2. Phase: Beurteilung von Fehlerrisiken Der Prüfer hat zu beurteilen, welchen Einfluss die festgestellten Fehlerrisiken auf die Rechnungslegung haben, sowohl was die Größenordnung betrifft, als auch die entsprechenden Eintrittswahrscheinlichkeiten. Gesondert sind davon noch bedeutsame Risiken zu beachten wie:
ungewöhnliche Geschäftsvorfälle
Transaktionen mit nahe stehenden Personen
Subjektivität bei Ermessensausübung
fehlerhafte Umsatzrealisierung
3. Phase: Reaktion auf Fehlerrisiken Der Prüfer muss die Prüfungshandlungen entsprechend seiner Risikobeurteilung festlegen. Dazu gehören der Einsatz von Spezialisten und die Durchführung überraschender Prüfungshandlungen. Ferner sind weitere Prüfungshandlungen wie Funktionsprüfungen durchzuführen. Das interne Kontroll- und Risikomanagementsystem spielt in diesem Zusammenhang eine besondere Rolle, und ist durch das Bilanzrechtsmodernisierungsgesetz (BilMoG), das am 29. Mai 2009 in Kraft trat, gesetzlich stärker verankert worden: „Kapitalgesellschaften im Sinn des § 264d HGB haben im Lagebericht die wesentlichen Merkmale des internen Kontroll- und des Risikomanagementsystems im Hinblick auf den Rechnungslegungsprozess zu beschreiben.“34
33 Vgl. HOMMELHOFF, P. / MATTHEUS, D. (2007), S. 2787. 34 HGB (2009), § 289, Abs. 5.
18
2 Prüfungstheoretische Grundlagen
Die Modernisierung des Bilanzrechts und die damit einhergehende Fokussierung auf das interne Risikomanagement betreffen auch den Aufgabenbereich des Abschlussprüfers. § 171 Abs. 1 Satz 2 AktG sieht vor, dass der Abschlussprüfer an den Verhandlungen des Aufsichtsrats oder des Prüfungsausschusses über diese Vorlagen teilzunehmen, und über die wesentliche Ergebnisse seiner Prüfung, insbesondere wesentliche Schwächen des internen Kontroll- und Risikomanagementsystems bezogen auf den Rechnungslegungsprozess, zu berichten hat. § 91 Abs. 2 AktG verpflichtet alle Aktiengesellschaften zur Einrichtung eines Früherkennungssystems. Nach derzeitiger geltender Rechtslage ist es aber keineswegs Pflicht, das Früherkennungssystem zu einem Risikomanagementsystem auszubauen. In dem nach § 289 Abs. 5 erweiterten Lagebericht kommen für kapitalmarktorientierte Aktiengesellschaften weitere Aspekte zum Zuge. Da die Aktiengesellschaften sich zu einem umfassenden Risikomanagement äußern müssen, dieses aber nicht zwingend benötigen, wäre eine Schilderung der Sachlage im Lagebericht erforderlich. Der Normengeber will dem Publizitätsadressaten aber zumindest einfach zugängliche Schlüsselinformationen zur Verfügung stellen. Um diesem Ziel der Richtliniengeber Rechnung tragen zu können, muss die Pflicht zur Einrichtung eines Früherkennungssystems in § 91 Abs. 2 AktG für kapitalmarktorientierte Aktiengesellschaften im Hinblick einer richtlinienkonformen Auslegung so verstanden werden, dass in den betroffenen Gesellschaften ein Risikomanagementsystem zu etablieren ist und nicht ein simples Früherkennungssystem.35 Der Prüfer betrachtet aber nicht nur das interne Kontroll- und Risikomanagementsystem, sondern dies ist nur ein Baustein im Prüfungsrisikomodell, den der Prüfer zu beachten hat. Das Prüfungsrisiko (PR) setzt sich aber nicht nur aus Risiken zusammen, die das IKS betreffen, sondern im Risikomodell (Audit-RiskModell) fließen in der Grundform drei Größen ein:36 1) das inhärente Risiko (IR) als Wahrscheinlichkeit, dass ein Prüffeld ohne Berücksichtigung des IKS wesentliche Fehler enthält,
35 Vgl. IDW PS 261 (2006), S. 8. 36 Vgl. PHILLIPS, H: (2009), S. 153.
2.3 Prüfungsrisiken
19
2) das Kontrollrisiko (KR) als Wahrscheinlichkeit, dass wesentliche Fehler nicht durch das IKS verhindert, aufgedeckt oder korrigiert werden können, 3) das Entdeckungsrisiko (ER) als Wahrscheinlichkeit, dass der Prüfer wesentliche Fehler sowohl bei einer Stichprobenprüfung als auch bei einer nicht stichprobenbezogen Prüfung nicht entdeckt. Die drei Wahrscheinlichkeiten ergeben zusammen dann auf Basis des speziellen Multiplikationssatzes unter Annahme der totalen Unabhängigkeit der einzelnen Wahrscheinlichkeiten37 (Risiken) das gesamte Prüfungsrisiko:
PR
IR KR ER
Die wichtigsten Annahmen des Prüfungsrisikomodells sind: 1) Das Prüfungsrisiko ist eine Funktion des Fehlerrisikos und des Entdeckungsrisikos. Das Fehlerrisiko und/oder das Entdeckungsrisiko korrelieren positiv mit dem Prüfungsrisiko. 2) Bei einem vorgegebenen Prüfungsrisiko kann durch ein niedriges Entdeckungsrisiko ein hohes Fehlerrisiko ausgeschaltet werden. 3) Das Entdeckungsrisiko auf der einen Seite und der Prüfungsumfang auf der anderen Seite korrelieren negativ. Die Komponenten des Prüfungsrisikos detailliert zu kennen und sie genau zu analysieren, dient als Grundvoraussetzung für die Entwicklung einer risikoorientierten Prüfungsstrategie und des daraus abzuleitenden Prüfungsprogramms. Das inhärente Risiko besteht aus einer Vielzahl von Faktoren und ist unabhängig vom Prüfungsprozess. Dazu gehören u.a. allgemeine Faktoren wie die konjunkturelle Situation, die Branche und Besonderheiten des Mandanten in Form von Mitarbeiterqualifikationen oder Unternehmensgröße.38 Es gibt auch inhärente Risiken auf der Prüffeldebene durch die Anfälligkeit eines Prüffeldes auf Fehler. Gründe dafür sind die Manipulationsanfälligkeit eines Prüffeldes, der Umfang, die Häufigkeit und Komplexität von Verarbeitungsprozessen, das Ausmaß von Schät37 Vgl. RINNE, H. (2003), S. 182; die Unabhängigkeit der einzelnen Wahrscheinlichkeiten ist einer der größten Kritikpunkte an diesem Ansatz. Auf die Darstellung dieser Kritik im Rahmen dieser Arbeit wird später eingegangen. 38 Vgl. MARTEN, K.-U./ QUICK, R./ RUHNKE, K. (2007), S. 215.
20
2 Prüfungstheoretische Grundlagen
zungen und Ermessensspielräumen, sowie der Umfang der Teilschritte zur Wertfindung. Das Kontrollrisiko spiegelt die Wirksamkeit des internen Kontrollsystems wider und der Abschlussprüfer muss sich daher ein Bild von den Kontrollstrukturen des Unternehmens machen, das geprüft wird. Wenn für das Prüffeld, das untersucht wird, interne Kontrollmechanismen existieren und der Abschlussprüfer darauf vertrauen will, so sind systemorientierte Prüfungen vorzunehmen, um die Wirksamkeit dieser internen Kontrollen zu überprüfen und als Wahrscheinlichkeit abbilden zu können. Auch dieses Risiko ist unabhängig vom Prüfungsprozess und kann vom Prüfer nur geschätzt, aber nicht kontrolliert werden.39 Dieses Risiko kann nie Null werden, denn das IKS kann teilweise unwirksam sein oder bewusst umgegangen oder ausgeschaltet werden. Das Prüfungsrisiko wird durch den Abschlussprüfer vorgegeben. In der Praxis gilt ein verbleibendes Prüfungsrisiko (d 5 %) als zulässig und unausweichlich, denn die Prüfung darf nicht zur Vollprüfung ausgeweitet werden. Somit ergibt sich letztendlich das Entdeckungsrisiko als die vom Abschlussprüfer zu beachtende Variable: ER
PR IR KR
Die Kontrolle des Entdeckungsrisikos erfolgt durch die Ausgestaltung des Prüfungsprogramms. Das Entdeckungsrisiko kann noch mal unterteilt werden in das Risiko analytischer Prüfungshandlungen als die Wahrscheinlichkeit, dass der Abschlussprüfer aufgetretene und durch das IKS nicht bereinigte wesentliche Fehler durch diese analytische Prüfungshandlungen nicht entdeckt, und das Risiko detaillierter Prüfungshandlungen als Wahrscheinlichkeit, dass der Abschlussprüfer aufgetretene wesentliche Fehler, die weder durch das IKS noch durch analytischer Prüfungshandlungen entdeckt worden, auch nicht entdeckt.40 Will der Prüfer das Entdeckungsrisiko niedrig halten, so bedarf es eines hohen Zeit- und Personalbedarfes, insbesondere an sehr qualifiziertem Personal.41 39 Vgl. PHILIPPS, H. (2009), S. 62. 40 Vgl.GRAUMANN, M. (2009), S. 180. 41 Vgl. MARTEN, K.-U./ QUICK, R./ RUHNKE, K. (2007), S. 217.
2.3 Prüfungsrisiken
21
Inhärentes Risiko mögliche Fehler im Jahresabschluss oder Lagebericht Kontrollrisiko Fehler, die die Kontrollen passieren
Entdeckungsrisiko
Prüfungsrisiko
Abbildung 3:
Fehler, die die Kontrollen umgehen Fehler, die vom Prüfer entdeckt werden Fehler, die vom Prüfer unentdeckt bleiben
Wasserhahn-Sieb-Analogien
Das Prüfungsrisiko wird vom AICPA als Wasserhahn-Sieb-Analogie42 beschrieben (vgl. Abbildung 3). Die Gefahr, dass im Prüffeld wesentliche Fehler auftreten, wird durch einen Wasserhahn bzw. Wasserstrahl dargestellt. Die Maßnahmen des Unternehmens und des Abschlussprüfers sind die Siebe in diesem Modell, in denen letztendlich die Fehler hängen bleiben sollen. Die Siebe sind auf der ersten Stufe das IKS des Mandanten und auf der zweiten Stufe dann die geeigneten Prüfungshandlungen durch den Abschlussprüfer. Ein gewisses Prüfungsrisiko bleibt aber trotz alledem bestehen. Das Prüfungsrisikomodell ist in seiner Ausgestaltung nicht frei von kritischen Aspekten, von denen im Rahmen dieser Arbeit die statistische Problematik dieses Modells kurz dargestellt wird.43 Das Prüfungsrisikomodell geht von dem speziellen Multiplikationssatz aus. Dieser besagt, dass sich die Wahrscheinlichkeit für das gemeinsame Eintreffen dreier unabhängiger Ereignisse wie folgt berechnet: 42 Vgl. AICPA (1985), S. 44, aus dem auch die Grafik inhaltlich entnommen wurde. 43 Vgl. MARTEN, K.-U./ QUICK, R./ RUHNKE, K. (2007), S. 218 ff. für eine Übersicht der wichtigsten Kritikpunkte und die dort genannten Quellen.
22
2 Prüfungstheoretische Grundlagen
P A1 A2 A3
P A1 P A2 P A3
Dies gilt aber nur für den Fall, dass die Ereignisse stochastisch unabhängig sind.44 Dies ist jedoch nicht mit der Realität vereinbar, denn schon das Kontrollrisiko und das inhärente Risiko korrelieren – wie bereits erwähnt – positiv. Schlechte Kontrollen führen meist auch zu mehr Unachtsamkeiten der Mitarbeiter. Dies alleine reicht schon, um die Annahme der stochastischen Unabhängigkeit nicht mehr zu erfüllen. Um dennoch weiterhin eine multiplikative Berechnung zu ermöglichen, müsste der allgemeine Multiplikationssatz angewendet werden: P A1 A2 A3
P A1 P A2 A1 P A3 A1 A2
Die Umsetzung eines solchen Ansatzes ist aber in der Realität sehr schwierig, da für den Prüfer schon die Schätzung der unbedingten Wahrscheinlichkeiten von Kontrollrisiko und inhärentes Risiko sehr schwierig ist. Vielfach wird eine konservative Möglichkeit dadurch ermöglicht, dass das inhärente Risiko auf Eins gesetzt wird. Dies führt aber c.p. zu einem höheren Prüfungsumfang, der aber auch nicht im Sinne des Abschlussprüfers ist, da dies den Umfang der Prüfungshandlungen erweitert und damit die Kosten erhöht oder die Erlöse schmälert. In dem Modell wird ferner unterstellt, dass es sich bei den Wahrscheinlichkeiten um objektive Prior-Wahrscheinlichkeiten handelt. Dies ist aber nicht der Fall, denn der Prüfer schätzt die Wahrscheinlichkeiten nach pflichtgemäßem Ermessen, so dass es sich um subjektive Wahrscheinlichkeiten handelt. Hier besteht die Gefahr aus Prüfungssicht, dass die subjektiven Wahrscheinlichkeiten die unbekannten objektiven Wahrscheinlichkeiten deutlich unterschätzen, so dass der Prüfungsumfang deutlich zu niedrig angesetzt wird.45 Auch die teilweise verbreitete Vorstellung, dass es sich um objektive Posterior-Wahrscheinlichkeiten handelt, weil der Prüfer Erfahrungen aus vorherigen Prüfungen beachtet, ist nicht nachvollziehbar, denn dafür sind viele Versuchswiederholungen notwendig, die der Prüfer in aller Regel nicht darstellen kann.
44 Vgl. HARTUNG; J./ ELPELT; B. / KLÖSENER, K.H. (2005), S. 101. 45 Auch eine Überschätzung der Wahrscheinlichkeiten ist möglich, aber aus Prüfungsrisikoüberlegungen nicht bedeutend.
2.4 Prüfungsmethoden
23
Letztendlich kann und sollte der Prüfer seine Erfahrungen in die Risikomodelle einbauen, aber dennoch beachten, dass im Prüfungsrisikomodell die Grundlagen der Stochastik nicht im dargestellten Umfang erfüllt werden. Dies kann zu einer Unterschätzung des Risikos, dass ein Prüffeld akzeptiert wird, obwohl es wesentliche Fehler enthält, führen, und dessen muss sich der Prüfer bei der Planung seiner Prüfungshandlungen und der Prüfungsmethoden bewusst sein.
2.4 Prüfungsmethoden Für die Durchführung einer Prüfung muss der Prüfer eine Entscheidung für die anzuwendende Prüfungsmethode treffen und die Intensität der Prüfungshandlungen festlegen. Mit Hilfe der Prüfungsmethoden will der Abschlussprüfer den normgerechten Zustand des Prüffeldes feststellen und dann zu einem Prüfungsurteil gelangen.46 Grundlagen der Entscheidung sind neben den gesetzlichen Vorschriften die von den nationalen und internationalen Berufsorganisationen der Prüfer schriftlich fixierten Prüfungsgrundsätze. Die gesetzlichen Vorschriften bilden den Rahmen für die externe Prüfung. Von den beiden Vertragsparteien, dem Prüfer einerseits und dem zu prüfenden Unternehmen andererseits, kann dieser Rahmen nicht ohne weiteres überschritten werden. Die wichtigsten gesetzlichen Regelungen sind die Vorschriften für die gesetzliche Jahresabschlussprüfung im HGB (§§ 316 ff. HGB) und die Regelungen für die Sonderprüfungen im AktG (§§ 142 ff. und §§ 258 ff. AktG). Da in den gesetzlichen Vorschriften nicht sämtliche Details festgelegt werden können, werden von Berufsorganisationen Grundsätze ordnungsmäßiger Prüfungen erarbeitet und regelmäßig aktualisiert. In Deutschland übernimmt diese Aufgabe das Institut der Wirtschaftsprüfer e.V. (IDW). Beispiele sind die vom IDW vorgelegten Fachgutachten (z.B. „Grundsätze ordnungsmäßiger Durchführung von Abschlussprüfungen“47) und die veröffentlichten Stellungnahmen (z.B. „Die Anwendung stichprobengestützter Prüfungsmethoden bei der Jahresabschlussprüfung“48) so-
46 Vgl. LÜCK; W: (1999), S. 65; vgl. FÖRSCHLE, G./ PEEMÖLLER, V.H. (2004), S. 198. 47 Vgl. IDW (1977), S. 210 ff. 48 Vgl. IDW (1988), S. 240 ff.
24
2 Prüfungstheoretische Grundlagen
wie die Prüfungsstandards (z.B. PS 200).49 Die Grundsätze ordnungsmäßiger Durchführung von Abschlussprüfungen benennen den Entscheidungsbereich des Prüfers bei der Festlegung der Intensität der Prüfungshandlungen: „Der Abschlussprüfer muss Art und Umfang der Prüfungshandlungen so bemessen, dass eine sichere Beurteilung der Gesetz- und Ordnungsmäßigkeit der Rechnungslegung möglich ist. Unter dieser Zielsetzung sind Art und Umfang der Prüfungshandlun50 gen gewissenhaft und mit berufsüblicher Sorgfalt zu bestimmen.“
Hinsichtlich des Prüfungsumfanges stehen dem Prüfer zwei Prüfungsmethoden zur Verfügung:
die Vollprüfung (lückenlose Prüfung)
und
die Auswahlprüfung (Stichprobenprüfung).
Nach den gesetzlichen Regelungen des HGB und den Richtlinien des IDW werden Jahresabschlussprüfungen in der Regel als Auswahlprüfungen durchgeführt.51 2.4.1 Vollprüfung Bei einer Vollprüfung („100% examination“) werden sämtliche Elemente eines Prüfungsgebietes/Prüffeldes hinsichtlich aller wichtigen Merkmale geprüft.52 Der Prüfer gibt sein Urteil über ein Prüffeld ab, dessen Elemente vollständig geprüft wurden.53 Dadurch soll eine völlige Sicherheit und Genauigkeit des Urteils erreicht werden. Ein vollkommen sicheres und genaues Urteil ist aber selbst bei einer Vollprüfung nur dann möglich, wenn Erhebungsfehler nicht auftreten. Das Risiko von Fehlern kann für die Tätigkeit des Prüfers auch bei gewissenhafter Durchführung einer Vollprüfung nicht ausgeschlossen werden.54 Eine derartige
49 50 51 52 53 54
Vgl. IDW PS 200 (2000). IDW (1977), S. 212. Vgl. LÜCK, W. (1998/I), S. 66. Vgl. FÖRSCHLE, G./ PEEMÖLLER, V.H. (2004), S. 381. Vgl. RÜCKLE, D. (1978), S. 812. Vgl. SCHILDBACH, T. (1983), Sp. 1458 f.
2.4 Prüfungsmethoden
25
Vollprüfung wird heute nur noch in Ausnahmefällen angewendet, während dies früher durchaus üblich war: „In the early stages of the development of the independent audit, which culminated in its widespread acceptance in our modern economy, it was not uncommon practice for an auditor to perform a 100 per cent examination of the entries and records of the com55 pany audited."
Die Nachteile der Vollprüfung liegen in dem hohen Kosten- und Zeitaufwand.56 Da der Prüfer neben dem Sachziel der ordnungsmäßigen Prüfung auch monetäre Ziele (Gewinnmaximierung bzw. Kostenminimierung) verfolgt, verzichtet der Prüfer in der Regel schon aus wirtschaftlichen Gründen bei der Jahresabschlussprüfung auf eine Vollprüfung, sofern für die Abgabe des Gesamturteils eine absolute Urteilssicherheit von der Prüfungsordnung nicht verlangt wird und der Prüfer die Abgabe des Urteils mit hinreichender Sicherheit vertreten kann.57 Auch ist die Vollprüfung aufgrund der steigenden Anzahl der Geschäftsvorfälle bei den meisten Unternehmen aus zeitlichen Gründen nicht mehr realisierbar. Ferner führt, wie schon erwähnt, der zunehmende Konkurrenzdruck dazu, dass ein Mandant i.d.R. nicht gewillt ist, eine Vollprüfung zu bezahlen. 2.4.2 Auswahlprüfung: Bewusste Auswahl versus Zufallsauswahl Der Einsatz stichprobengestützter Prüfungsmethoden in der Abschlussprüfung wird aus terminlichen und wirtschaftlichen Gründen immer bedeutender. Während bei der Vollprüfung sämtliche Elemente eines Prüfungsgebietes/Prüffeldes hinsichtlich aller wichtigen Merkmale geprüft werden, erfolgt bei der Auswahlprüfung die Beurteilung der Ordnungsmäßigkeit eines Prüffeldes anhand einer Auswahl von Elementen.58 Der Prüfer muss sich bei der Anwendung der stichprobenartigen Prüfung des Risikos bewusst sein, nicht alle Fehler einer Grundgesamtheit zu entdecken. Dies ist aber normalerweise auch nicht das Ziel einer Prüfung,59 sondern vielmehr soll der Prüfer nach Korrektur der eventuell entdeckten Fehler den Schluss für vertretbar halten, dass der nicht in die Stichprobe 55 56 57 58 59
ARKIN, H. (1982), S. 2. Vgl. u.a. GOHOUT, W./ WEBERSINKE, H. (1988), Abs. E, S. 5. Vgl. WYSOCKI, K.v. (1988), S. 171. Vgl. IDW (1988), S. 241. Vgl. BLUMERS, W./ FRICK, J./ MÜLLER, L. (1989), S. 8.
26
2 Prüfungstheoretische Grundlagen
gelangte, also nicht geprüfte Teil der Grundgesamtheit (annehmbar) ordnungsmäßig sei.60 Wichtig für die Abgabe eines solchen Urteils ist die Erzielung einer hinreichenden Urteilsqualität, d.h. einer notwendigen Sicherheit und Genauigkeit des Urteils. Die Qualität eines Urteils wird beeinflusst von dem Prüfungsumfang und dem Auswahlverfahren.61 Da für die Urteilsfindung nur eine Teilmenge aus der Grundgesamtheit ausgewählt wird, stellt sich für den Prüfer die Frage, inwieweit die Ergebnisse der Stichprobe auf die Grundgesamtheit übertragen werden können, d.h., ob eine Stichprobe „repräsentativ“ ist.62 Unter dem Begriff der „Repräsentativität“ wird im allgemeinen Sprachgebrauch die strukturelle Deckungsgleichheit zwischen Stichprobe und Grundgesamtheit verstanden. In der Statistik dagegen zeichnet sich eine repräsentative Stichprobe nicht unbedingt durch Strukturtreue aus, sondern die folgenden drei Bedingungen müssen erfüllt sein, um von einer repräsentativen Stichprobe im statistischen Sinne sprechen zu können:63 1) Jedes Element muss eine von Null verschiedene Auswahlwahrscheinlichkeit haben. 2) Sind die Auswahlwahrscheinlichkeiten nicht für alle Elemente identisch, so müssen die unterschiedlichen Auswahlwahrscheinlichkeiten für die verschiedenen Gruppen der Elemente bekannt sein, um dies bei der Hochrechnung zu berücksichtigen. 3) Es darf kein Zusammenhang zwischen der Auswahltechnik à priori und dem Ziel der Stichprobenuntersuchung existieren. Die Frage nach der Repräsentativität einer Stichprobe sollte daher gut geprüft werden, denn nur dann lassen sich der Stichprobenfehler und damit die Urteilsqualität angeben. Nicht alle Verfahren der Auswahlprüfung erfüllen die oben genannten Bedingungen. Dies sollte dem Prüfer z.B. bei der „Prüfung auf das Geratewohl“ bewusst sein. Die Auswahl der Elemente bei einer Auswahlprüfung
60 61 62 63
Vgl. RÜCKLE, D. (1978), S. 812. Vgl. HÖMBERG, R. (1989/I), S. 199. Vgl. BUCHNER, R. (1983/I), Sp. 1495 f. Vgl. RINNE, H./ ICKLER, G. (1986), S. 532 f.
2.4 Prüfungsmethoden
27
kann nach verschiedenen Aspekten erfolgen. Grundsätzlich werden zwei Verfahren unterschieden (vgl. Abbildung 4):64
die bewusste Auswahl (gezielte Auswahl)
und
die Zufallsauswahl (zufallsgesteuerte Auswahl).
Bei der bewussten Auswahl erfolgt die Auswahl der Prüfungselemente aufgrund der subjektiven Entscheidung des Prüfers. Der Prüfer nutzt daher seine Erfahrung aufgrund seiner bisherigen Tätigkeit als Prüfer und eventuell bekannte (Vor-)Informationen über das Prüffeld. Bei den statistischen Verfahren hingegen, zu denen auch Monetary Unit Sampling zählt, wird die Auswahl der Geschäftsvorfälle nach dem Zufallsprinzip vorgenommen.65 Anmerkung: In der Literatur wird in diesem Zusammenhang auch die Auswahl auf das Geratewohl oder Willkürauswahl als Auswahlverfahren benannt. Der Prüfer wählt die Prüfungselemente ebenfalls nach subjektivem Ermessen aus, ohne bei dieser Auswahl sachliche Überlegungen zu berücksichtigen,66 z.B. die Auswahl der Geschäftsvorfälle, deren Prüfung am schnellsten erfolgen kann. Daher wird das Verfahren in der Literatur auch als Auswahl nach der größten Bequemlichkeit bezeichnet. Da bei einer solchen Auswahl kein pflichtbewusstes Handeln des Prüfers unterstellt werden kann, verstößt das Verfahren gegen die Grundsätze ordnungsmäßiger Buchprüfung und sollte daher nicht angewendet werden.67 Diese Auffassung ist jedoch in der Praxis nicht unumstritten. Bei einer kleinen Grundgesamtheit, bei der durch die bewusste Auswahl von wenigen Elementen schon ein Großteil des Gesamtwertes abgedeckt wird, führt dies nicht zwangsläufig zu einem Verstoß gegen die Prüfungsgrundsätze.68
64 65 66 67 68
Vgl. IDW (2006), S. 1962; UHLIG, B. (1987), S. 289 Vgl. BUCHNER, R. (1983/I), Sp. 1496 f. Vgl. RINNE, H./ ICKLER, G. (1986), S. 535. Vgl. BUCHNER, R. (1983/I), Sp. 1496 und die dort angegebenen Quellen. Eigene Befragungen und Diskussionen bei Schulungen.
28
2 Prüfungstheoretische Grundlagen
Auswahlprüfung
Auswahl zufällig
nicht-zufällig
mathematischstatistische Verfahren
bewusste Auswahl
Abbildung 4:
2.4.2.1
Differenzierung der Auswahlverfahren
Methoden der bewussten Auswahl
Bei der bewussten Auswahl bietet sich dem Prüfer die Möglichkeit, alle Vorinformationen über das Prüffeld und seine persönlichen Erfahrungen bei der Auswahl der Prüfungselemente zu berücksichtigen. Dadurch gelangen die nach Meinung des Prüfers markanten Bereiche des Prüffeldes in die Stichprobe. Der Prüfer testet mit dieser Art der Auswahl seine Annahmen über die Fehler in einem Prüffeld.69 Bei der bewussten Auswahl, die auch Urteilsstichprobe (engl. judgement sampling) genannt wird, erfolgt die subjektive Auswahl des Prüfers nach den in Abbildung 5 dargestellten Kriterien. Werden die Prüfungselemente ihrer Bedeutung nach ausgewählt, so gelangen die Positionen in die Stichprobe, von denen der Prüfer vermutet, dass sie für seine Urteilsbildung am wichtigsten sind.
69 Vgl. LANFERMANN, J. (1983), Sp. 1468.
2.4 Prüfungsmethoden
29
bewusste Auswahl
nach der Bedeutung
Abbildung 5:
nach dem Fehlerrisiko
typische Geschäftsfälle
Auswahlkriterien der bewussten Auswahl
Der Prüfer nennt diese Art der Auswahl „Konzentrationsauswahl“70, „cut-offVerfahren“,71 „Auswahl nach dem Konzentrationsprinzip“72 oder „Auswahl nach dem Prinzip der materiality“73. Der Prüfer wählt z.B. die Geschäftsvorfälle aus, die eine vorher bestimmte Wert- oder Mengengrenze überschreiten, da Fehler innerhalb dieser Positionen die Urteilsabgabe beeinflussen bzw. beeinträchtigen können.74 Nach Prüfung der ausgewählten Elemente ist es dem Prüfer nicht möglich, auf die Fehlerhaftigkeit oder Fehlerlosigkeit in dem nicht geprüften Teil der Grundgesamtheit zu schließen. Der Prüfer kann lediglich folgern, dass eventuell noch vorhandene Fehler von „geringer“ Bedeutung sind, da der Prüfer den nicht ausgewählten Elementen keine große Bedeutung beimisst. Die subjektive Trennung 70 Vgl. LEFFSON, U. (1988), S. 168 und die dort angegebenen Quellen. 71 Vgl. WYSOCKI, K.v. (1988), S. 176 und die dort angegebenen Quellen. Mit dem Begriff „cut-off“ soll ausgedrückt werden, dass die unwichtigen Positionen der Grundgesamtheit nicht berücksichtigt, also abgeschnitten werden. In der Literatur wird die Konzentrationsauswahl bzw. das Cut-off-Verfahren als äquivalentes Auswahlverfahren der bewussten Auswahl zum Monetary Unit Sampling bei den statistischen Verfahren bezeichnet (vgl. MANDL, G. (1984), S. 155). Dabei wird jedoch übersehen, dass beim Monetary Unit Sampling auch die sogenannten „unwichtigen“, d.h. die geringer wertigen Rechnungen in die Auswahl gelangen können. Dies ist bei der Konzentrationsauswahl bewusst ausgeschlossen. 72 Vgl. LÜCK, W. (1998/I), S. 66. 73 Vgl. RÜCKLE, D. (1978), S. 815 und die dort angegebenen Quellen. 74 Vgl. LANFERMANN, J. (1983), Sp. 1469.
30
2 Prüfungstheoretische Grundlagen
zwischen bedeutenden und unbedeutenden Elementen ist aber besonders dann mit Risiken verbunden, wenn das zu prüfende Unternehmen im Voraus erkennen kann, welche Elemente der Prüfer für bedeutend hält, da sich z.B. die Auswahlkriterien des Prüfers in den letzten Jahren nicht geändert haben. Dies kann zu Manipulationen führen, die dann „mit Sicherheit“ nicht entdeckt werden.75 Bei der Auswahl nach dem Fehlerrisiko (detektivische Auswahl)76 sollen die Elemente in die Auswahl gelangen, bei der die Fehlerwahrscheinlichkeit am größten ist. Der Prüfer konzentriert seine Prüfungshandlungen auf die Bereiche, bei denen er Fehler im internen Kontrollsystem des zu prüfenden Unternehmens vermutet. Die Höhe des Stichprobenumfanges wird vom Prüfer aufgrund seiner Fehlererwartung festgelegt. Generell sollte gelten, dass der Stichprobenumfang mit wachsendem Fehlerrisiko größer wird. Der Einsatz von Computern bietet sich auch bei der Auswahl nach dem Fehlerrisiko an, da Elemente, die mit einem Risikomerkmal versehen sind (z.B. Kredite mit einem negativen Bonitätsmerkmal, niedrige Scoringwerte usw.), automatisch ausgewählt werden. Das Risiko, dass die Prüfungshandlungen vorhersehbar sind, bleibt aber auch bei diesem Verfahren bestehen.77 Der Wirtschaftsprüfer kann jedoch aufgrund verschiedener Anzeichen wie z.B. die wirtschaftliche Lage des Unternehmens oder den Stand des internen Kontrollsystems besondere Vorsichtmaßnahmen treffen oder den vorher gesetzten Stichprobenumfang erhöhen. Die dritte Möglichkeit, die der Prüfer bei der bewussten Auswahl nutzen kann, ist die Auswahl typischer Fälle. „Bei der Auswahl typischer Fälle konzentrieren sich die Prüfungshandlungen auf Geschäftsvorfälle, die im Prüfgebiet jeweils in gleicher Weise verarbeitet werden. Die Auswahl typischer Fälle empfiehlt sich vor allem im Rahmen von Systemprüfungen. Die jeweils prüfungsrelevanten Gesichtspunkte (z.B. Abrechnungseinheiten, Geschäftsarten, Belegarten) bestimmen bei diesem Auswahlverfahren den erforderlichen 78 Prüfungsumfang.“
75 Vgl. WYSOCKI, K.v. (1988), S. 176. Bei denen im Rahmen dieser Arbeit durchgeführten Simulationen wird gezeigt, dass bei Monetary Unit Sampling auch die kleineren Belege zufällig in die Stichprobe gelangen. Damit kann diesen Manipulationen vorgebeugt werden. 76 Vgl. LÜCK, W. (2005), S. 7. 77 Vgl. IDW (1977), S. 241 f. 78 IDW (1988), S. 242.
2.4 Prüfungsmethoden
31
Die Auswahl typischer Fälle ist somit vergleichbar mit einer „Klumpenstichprobe“.79 Eine Klumpenstichprobe besteht aus einer Teilerhebung auf der ersten Stufe und einer Vollerhebung auf der zweiten Stufe. Übertragen auf die Prüfungshandlungen bedeutet dies, dass der Prüfer z.B. einen Buchungstag innerhalb eines Abrechnungszeitraumes auswählt und anschließend alle Belege dieses „durchschnittlichen“ Buchungstages vollständig prüft. Das Risiko eines derartigen Vorgehens besteht darin, dass durchaus zum Teil gravierende Unterschiede zwischen den einzelnen Buchungstagen bestehen können. Wird dies vom Prüfer nicht erkannt oder nicht ausreichend beachtet, so wird die Hochrechnung verzerrt. Dadurch wird die Ordnungsmäßigkeit der Prüfung in Frage gestellt. Bei Anwendung der Verfahren der bewussten Auswahl kann der Prüfer nur davon ausgehen, „dass der nicht geprüfte Teil der Grundgesamtheit mit großer Wahrscheinlichkeit relativ weniger Fehler enthält als die Stichprobe.“80 Eine Urteilssicherheit lässt sich aber bei den Verfahren der bewussten Auswahl im Gegensatz zu den mathematisch-statistischen Verfahren, wie z.B. Monetary Unit Sampling, nicht errechnen. In der amerikanischen Prüfungspraxis wurden die auf der Zufallsauswahl basierenden Verfahren auch schon in 80er und Anfang der 90er Jahren häufig eingesetzt, da dort die Vorteile der statistischen Verfahren für bestimmte Bereiche der Prüfungspraxis bereits erkannt wurden.81 Zu dieser Zeit haben viele deutsche Wirtschaftsprüfer die entsprechenden Verfahren noch nicht eingesetzt. Ein weiterer Grund für den verstärkten Einsatz statistischer Verfahren in den U.S.A. liegt in den Haftungsbedingungen für eine Prüfung. In den U.S.A. gibt es im Gegensatz zur Bundesrepublik Deutschland keine Haftungsbeschränkungen. Im Falle einer gerichtlichen Klärung kann der Prüfer bei richtiger Anwendung eines statistischen Verfahrens nachweisen, dass die Auswahl der Prüfungselemente und die anschließende Auswertung nach den statistischen Regeln erfolgt sind und der Prüfer somit ordnungsgemäß geprüft hat. Dieser Beweis fällt einem Prüfer bei Anwendung der bewussten Auswahl schwerer, da die Auswahl auf subjektiven Überlegungen basierte. Um solche Probleme und eventuelle ho-
79 Vgl. WYSOCKI, K.v. (1988), S. 179. 80 Vgl. WYSOCKI, K.v. (1988), S. 180. 81 Vgl. MANDL, G. (1984), S. 763.
32
2 Prüfungstheoretische Grundlagen
he Regressforderungen zu vermeiden, werden in den U.S.A. weitgehend Verfahren der Zufallsauswahl angewendet. 2.4.2.2
Methoden der Zufallsauswahl
Bei den Verfahren mit Zufallsauswahl, den mathematisch-statistischen Verfahren, werden die Prüfungselemente zufällig ausgewählt, ohne dass der Prüfer die Auswahl der Prüfungselemente unmittelbar beeinflussen kann. Charakteristisch für eine zufallsgesteuerte Auswahl ist, dass jedes Element eine berechenbare Wahrscheinlichkeit zwischen Null und Eins hat, in die Auswahl zu gelangen.82 Die Auswertung der Stichprobenergebnisse erfolgt dann auf der Basis der statistischen Theorie.83 Das Urteilsrisiko wird somit im Gegensatz zu den Verfahren der bewussten Auswahl quantifizierbar und die Prüfung kann objektiv nachvollzogen werden.84 Nur anerkannte mathematisch-statistische Verfahren, zu denen auch Monetary Unit Sampling zählt,85 sind vom Gesetzgeber für die Prüfung zugelassen worden: „Bei der Aufstellung des Inventars darf der Bestand der Vermögensgegenstände nach Art, Menge und Wert auch mit Hilfe anerkannter mathematisch-statistischer Methoden auf Grund von Stichproben ermittelt werden. Das Verfahren muss den Grundsätzen ordnungsmäßiger Buchführung entsprechen. Der Aussagewert des auf diese Weise aufgestellten Inventars muss dem Aussagewert eines auf Grund einer körperlichen Be86 standsaufnahme aufgestellten Inventars gleichkommen.“
Da in diesem Gesetz die Anwendung statistischer Verfahren nicht auf eine bestimmte Bilanzposition festgelegt wird, ist die Anwendung der statistischen Verfahren generell für alle Bilanzpositionen legitim. Zu diesem Schluss kommt der IDW: „Der Abschlussprüfer kann sich bei der Stichprobenprüfung einzelner Prüfungsgebie87 te, soweit zweckmäßig, auch mathematisch-statistischer Methoden bedienen.“
82 83 84 85 86 87
Vgl. UNGERER, A. (1980), S. 18 f. Vgl. IDW (1988), S. 242. Vgl. RIEMER, D./ HAAS, G. (1988), S. 174. Vgl. IDW (1988), S. 245 f. § 241 Abs 1 HGB (2009), vgl. auch BUCHNER, R. (2002), S. 52. IDW (1977), S. 212.
2.4 Prüfungsmethoden
33
Diese Auffassung, die sich auch bis heute noch so wiederfindet, ist jedoch in der Praxis nach wie vor sehr umstritten. Gerade bei Verbindlichkeiten sind Stichprobenverfahren oft nicht zweckmäßig einsetzbar, denn die Höhe von Verbindlichkeiten hochzurechnen ist sowohl für den Kaufmann als auch für den Wirtschaftsprüfer nicht fundiert möglich.88 Da Monetary Unit Sampling eine wertproportionale Auswahl der Elemente bewirkt, sollten Prüffelder, bei denen das Auffinden von Unterbewertungen wichtig ist, nicht mit dem Verfahren geprüft werden. Die Durchführung einer Prüfung mit Hilfe mathematisch-statistischer Methoden erfolgt in Anlehnung an die Prüfungsgrundsätze in fünf Schritten, die unabhängig von der Verfahrensart für alle statistischen Verfahren durchlaufen werden: 1) Festlegung des zu untersuchenden Prüffeldes 2) Auswahl der Prüfungselemente 3) Prüfung der ausgewählten Prüfungselemente 4) Auswertung der Stichprobenergebnisse 5) Urteilsfindung Mit der Festlegung des zu untersuchenden Prüffeldes grenzt der Prüfer den Bereich ab, den er mit Hilfe statistischer Verfahren prüfen und abschließend beurteilen will. Der Prüfer muss vorher sicherstellen, ob die Anforderungen an das Prüffeld zur Anwendung statistischer Verfahren erfüllt sind:89 Das Prüffeld muss aus einer hinreichend großen Anzahl von Prüfungspositionen bestehen, um eine Stichprobenprüfung gegenüber einer Vollprüfung sinnvoll anzuwenden. Nur dann kommen die wirtschaftlichen und zeitlichen Vorteile einer Stichprobenprüfung zum Tragen. Das Prüffeld muss in sich homogen, d.h. gleichartig sein;90 die vom Prüfer erwarteten Fehler müssen „von gleicher Art und gleicher Bedeutung für das Urteil sein“91. Prüft der Wirtschaftsprüfer z.B. den Bestand eines Lagers und sind die eventuell auftretenden Fehler in Geldeinheiten messbar, kann in die-
88 89 90 91
Eigene Untersuchung und Diskussion bei Schulungen. Vgl. BUCHNER, R. (1983/II), S. 479 ff. Vgl. REUTER, H.-H. (1975), S. 18 ff. SCHILDBACH, T. (1983), Sp. 1459.
34
2 Prüfungstheoretische Grundlagen
sem Fall von Fehlern gleicher Art gesprochen werden. Hierbei ist jedoch vom Prüfer zu beachten, dass die Bedeutung der Fehler für die Beurteilung des Prüffeldes sehr unterschiedlich sein kann. Dies hat der Prüfer bei der Auswahl der Elemente und der anschließenden Auswertung zu beachten.92 Monetary Unit Sampling berücksichtigt diesen Aspekt aufgrund des wertproportionalen Auswahlmodus und der Auswertung anhand von einzelnen Geldeinheiten: Jede einzelne Geldeinheit des Prüffeldes und damit auch der eventuell auftretenden Fehler in einer Geldeinheit sind gleich wichtig für die Beurteilung des Prüffeldes. Bei den eventuell auftretenden Fehlern muss es sich ferner um Häufigkeitsfehler handeln, so dass nicht schon das Entdecken eines einzigen zufälligen Fehlers zu einem negativen Urteil über das gesamte Prüffeld führt. Erwartet der Prüfer wenige Fehler im Prüffeld, so bietet sich die Anwendung von Monetary Unit Sampling besonders an. Vor der Auswahl der Prüfungselemente ist vom Prüfer der Stichprobenumfang zu ermitteln, d.h., bei der Anwendung des Monetary Unit Sampling berechnet der Prüfer die Anzahl der Geldeinheiten, die in die Stichprobe gelangen. Da bei dem Monetary Unit Sampling die Möglichkeit besteht, dass zwei oder mehr ausgewählte Geldeinheiten aus derselben Untersuchungseinheit (z.B. aus derselben Rechnung) stammen, kann die Anzahl der tatsächlich zu prüfenden Rechnungen kleiner sein als der berechnete Stichprobenumfang. Die Auswahl der Prüfungselemente bei den statistischen Verfahren erfolgt zufällig. Jedes Element hat eine berechenbare Auswahlwahrscheinlichkeit. Sind die Auswahlwahrscheinlichkeiten der Prüfungspositionen für alle Elemente der Grundgesamtheit gleich, so spricht man von Zufallsauswahl mit gleichen Auswahlwahrscheinlichkeiten, d.h., die Prüfungselemente (z.B. Rechnungen) werden unabhängig von ihrer Größe ausgewählt.93 Eine solche Auswahl kann z.B. mit Hilfe des zufälligen Ziehens von Belegnummern erfolgen. Da der Prüfer aber daran interessiert ist, dass möglichst höherwertige Positionen in die Auswahl gelangen, ist diese Art der Auswahl nicht befriedigend.94 Um die Nachteile der Zufallsauswahl mit gleichen Auswahlwahrscheinlichkeiten zu beseitigen, bietet 92 Vgl. WYSOCKI, K.v. (1988), S. 187. 93 Vgl. LÜCK; W: (1999), S. 65; vgl. FÖRSCHLE, G./ PEEMÖLLER, V.H. (2004), S. 198. 94 Vgl. die Ergebnisse der Simulation in Kapitel 5.
2.4 Prüfungsmethoden
35
sich für den Prüfer die Möglichkeit, die Grundgesamtheit in mehrere Schichten zu unterteilen. Üblicherweise dient als Schichtungsmerkmal der Ist-Wert der Prüfungspositionen. Beispiel: Die interne Revision eines Kreditinstitutes will die Kredite des Hauses prüfen. Geprüft werden soll die Werthaltigkeit des Kreditsaldos. Da die Bank sowohl Kredite an Privatpersonen, als auch Unternehmen gewährt, variieren die eingeräumten Kreditlinien sehr stark. Eine zufällige Auswahl nach Kreditnummern könnte zur Folge haben, dass betragsmäßig große Kredite ungeprüft bleiben. Durch die Schichtung können die Kredite in verschiedene Gruppen eingeteilt werden, z.B. in Kredite bis zu 2.000,00 EUR, Kredite bis zu 5.000,00 EUR, usw. Der Prüfer kann jetzt aus jeder Schicht eine vorher bestimmte Anzahl an Prüfungselementen auswählen. Die Elemente in der obersten Schicht. (z.B. Millionenkredite) werden in praxi voll geprüft. Aus dieser Art der Auswahl resultiert, dass die einzelnen Prüfungselemente ungleiche Auswahlwahrscheinlichkeiten erhalten (bei nicht-proportionaler Stichprobenallokation). Die Auswahlwahrscheinlichkeit eines Prüfungselements [P(Eh)] ergibt sich aus dem Umfang einer Schicht (Nh) und dem Umfang der Stichprobe aus dieser Schicht (nh). Die Elemente der obersten Schicht haben in diesem Beispiel eine Auswahlwahrscheinlichkeit von eins, da in diesen Schichten eine Vollprüfung erfolgt.
P Eh
nh , für N h z 0 Nh
Monetary Unit Sampling erfüllt ebenfalls die von der Praxis geforderte Eigenschaft, dass die Auswahlwahrscheinlichkeiten der höherwertigen Positionen größer sind als die der geringerwertigen Positionen. Da bei der Anwendung von Monetary Unit Sampling nicht die einzelne Position, sondern die Geldeinheit als Auswahleinheit betrachtet wird, hat dies bei einer einfachen Zufallsauswahl zur Folge, dass die Prüfungselemente eine Auswahlwahrscheinlichkeit erhalten, die proportional zu ihrem Geldwert ist.95 Durch geeignete Auswahlverfahren kann
95 Vgl. MANDL, G. (1978), S. 762.
36
2 Prüfungstheoretische Grundlagen
die Wahrscheinlichkeiten für Rechnungen ab einer gewissen Summe Eins werden.96 Beispiel für einfache Zufallsauswahl: Eine Rechnung lautet über einen Betrag von 100,00 EUR; eine zweite Rechnung hat als Rechnungssumme einen Betrag von 1.000,00 EUR. Da die zweite Rechnung aus zehnmal mehr Geldeinheiten besteht als die erste Rechnung, ist auch die Wahrscheinlichkeit, dass die zweite Rechnung in die Auswahl gelangt zehnmal so groß, da als Auswahlkriterium bei der Anwendung des Monetary Unit Sampling die Geldeinheit dient. Daher wird im Zusammenhang mit Monetary Unit Sampling nicht nur von Zufallsauswahl mit ungleichen Auswahlwahrscheinlichkeiten gesprochen, sondern von Zufallsauswahl mit wertproportionalen Auswahlwahrscheinlichkeiten (engl. Probability Proportional to Size Sampling).97 Die Anwendung von Monetary Unit Sampling ist jedoch bedeutend einfacher als bei der geschichteten Auswahl. Letztendlich zieht ein Abschlussprüfer aus dem gleichen Prüffeld die Rechnungen als auch die Geldeinheiten.98 Der Unterschied, der durch das Auswahlprinzip bei Monetary Unit Sampling entsteht, wird an einem einfachen Beispiel auch grafisch demonstriert. Wir unterstellen der Einfachheit, dass ein Prüffeld aus drei Rechnungen (5 €, 10 €, 15 €) besteht (vgl. Abbildung 6). Die Wahrscheinlichkeit nach Laplace, eine der drei Rechnungen Ai [A1 (5 €) bis A3(15 €)] zu ziehen, ist bei einfacher Zufallsauswahl ein Drittel. Die Wahrscheinlichkeit wird ermittelt, in dem die Zahl der günstigen Fälle N(Ai) durch die Zahl der überhaupt möglichen Fälle N dividiert wird.
P Ai
N ( Ai ) 1 = N 3
Die Wahrscheinlichkeit, eine der Rechnungen zu ziehen, ist somit unabhängig vom Rechnungswert. Der Prüfer sollte jedoch die Risiken auch mit der Wahl von geeigneten Stichprobenverfahren minimieren. Dazu trägt auch eine wertpropor-
96 Vgl. die Auswahlverfahren in Kapitel 4. 97 Vgl. IDW (1988), S. 242. 98 Vgl. HEROLD, M. (2009), S. 6.
2.4 Prüfungsmethoden
37
5€
15 €
10 €
Abbildung 6:
Darstellung der einfachen Auswahl
tionale Auswahl bei, da der Prüfer in den größeren Buchungen auch die größeren Fehler erwartet und in den kleineren Buchungen die kleineren Fehler. Die wertproportionale Auswahl wird dadurch, dass die Rechnungen ein Geldeinheiten umgewandelt werden (vgl. Abbildung 7). Die Wahrscheinlichkeit nach Laplace99, eine der drei Rechnung Ai [A1 (5 €) bis A3 (15 €)] zu ziehen, ist bei einfacher Zufallsauswahl abhängig von der Anzahl der in der Rechnung enthaltenen Geldeinheiten. Die Wahrscheinlichkeit
Für Rechnung 1 = 5/30 Für Rechnung 2 = 10/30
1
1
1 1 1
1
1
1
1 1
1 1 1
Darstellung wertproportionaler Auswahl
99 Vgl. SCHLITTGEN, R. (2000), S. 72.
1
1
1
Für Rechnung 3 = 15/30
Abbildung 7:
1
1
1
1
1
1 1
1 1
1
1 1
1
1
38
2 Prüfungstheoretische Grundlagen
Zufallsauswahl
Auswahl gleiche Auswahlwahrscheinlichkeit
ungeschichtete Auswahl
Abbildung 8:
ungleiche Auswahlwahrscheinlichkeit
geschichtete Auswahl (außer proportionale Schichtung)
wertproportionale Auswahl Monetary Unit Sampling
Arten der Zufallsauswahl
wird ermittelt, in dem die Zahl der Geldeinheiten einer Rechnung Ai durch die Zahl aller Geldeinheiten insgesamt dividiert wird. P Ai P A1 P A2 P A3
N ( Ai ) N N ( A1 ) 5 = N 30 N ( A2 ) 10 = N 30 N ( A3 ) 15 = N 30
Die Wahrscheinlichkeit, eine der Rechnungen zu ziehen, ist somit abhängig vom Rechnungswert und steigt in diesem Beispiel proportional mit dem Rechnungswert im Gegensatz zu den Verfahren mit gleicher Auswahlwahrscheinlichkeit (vgl. Abbildung 8). Somit kann der Prüfer die geforderte Risikominimierung durch diese spezielle Auswahltechnik zu erreichen. Die durch ein bestimmtes Verfahren der Zufallsauswahl ausgewählten Prüfungspositionen werden vom Prüfer im anschließenden dritten Schritt auf ihre Feh-
2.4 Prüfungsmethoden
39
Fehler (hier Überbewertung) fakturierte Rechnungssumme tatsächliche Rechnungssumme laut Bestätigung
Soll-Wert xi Abbildung 9:
Ist-Wert yi
Visuelle Darstellung des Ist-Soll-Vergleiches
lerhaftigkeit untersucht. Wie bereits erwähnt, werden beim Monetary Unit Sampling die ausgewählten Geldeinheiten nicht unmittelbar geprüft, sondern die Geldeinheiten werden den Untersuchungseinheiten (z.B. Rechnungen) zugeordnet, aus denen sie stammen. Aufgabe des Prüfers ist es jetzt, bei jeder einzelnen Untersuchungseinheit den Istwert yi (Book Value) mit dem Sollwert xi (Audit Value) zu vergleichen (vgl. Abbildung 9). Der Prüfer bildet dazu die Differenz zwischen dem Istwert yi und dem Sollwert xi. Dabei eventuell ermittelte Fehler, d.h. Differenzen zwischen yi und xi werden mit di symbolisiert. Dies ist der absolute Fehler. di
d i ! 0 Überbewertung ° yi xi mit ® d i 0 korrekter Wert ° d 0 Unterbewertung ¯ i
Nimmt di positive Werte an, d.h., der Sollwert ist kleiner als der Istwert, so liegt eine Überbewertung (Overstatement) vor. Analog spricht man von Unterbewertung (Understatement). im umgekehrten Falle (vgl. Abbildung 10).
40
2 Prüfungstheoretische Grundlagen
di = yi - xi
di < 0
di = 0
di > 0
Unterbewertung
fehlerfrei
Überbewertung
Abbildung 10:
Differenzierung zwischen Unter- und Überbewertung
Da bei der Anwendung des Monetary Unit Sampling die abschließende Beurteilung anhand der einzelnen Geldeinheiten erfolgt, ist es notwendig, den in einer Prüfungsposition entdeckten Fehler auf die einzelne Geldeinheit ( d i* ) umzurechnen:100
d i*
di yi
yi xi yi
d i* ! 0 Überbewertung xi ° 1 mit ® d i* 0 korrekter Wert yi ° d * 0 Unterbewertung ¯ i
Die maximale Überwertung d i* kann höchstens 1 werden, da für den Fall der Sollwert gleich Null ist. Die Unterbewertung ist nach unten jedoch nicht beschränkt und kann auch Werte annehmen, die betragsmäßig über Eins liegen. Die Prüfung der Stichprobenelemente auf Fehler und die anschließende Hochrechnung erfolgen nach verschiedenen Aspekten. In der Prüfungsliteratur wird bei den statistischen Verfahren zwischen homograden und heterograden Frage-
100 In der Literatur wird der absolute Fehler teilweise als der bereits auf eine einzelne Geldeinheit i herunter transformierte Fehler definiert. Analog wird dann die Differenz zwischen dem Ist- und der Sollwert der i-ten Geldeinheit gebildet; vgl. dazu RENEAU, J.H. (1978), S. 672. Den absoluten Fehler auf den Sollwert zu beziehen, ist theoretisch auch möglich, aber mathematisch wäre ein solcher Fehler bei einem Sollwert von Null nicht mehr definiert.
2.4 Prüfungsmethoden
41
Statistische Stichprobeverfahren
qualitative Merkmale
quantitative Merkmale
homograde Fragestellung ĺ Fehleranteil
Abbildung 11:
quantitative Merkmale
heterograde Fragestellung ĺ Fehlerausmaß
Fragestellungen statistischer Stichprobenverfahren
stellungen unterschieden (vgl. Abbildung 11).101 Der homograde Fall wird dabei vorrangig diskutiert, obwohl bei der praktischen Anwendung auch heterograde Fragestellungen von Bedeutung sind.102 Monetary Unit Sampling verbindet beide Fragestellungen miteinander und kann daher als wesentlicher Fortschritt angesehen werden, da die monetäre Auswertung der Stichprobenergebnisse bei Anwendung des Monetary Unit Sampling auf der Fehleranteilsprüfung basiert.103 Im homograden Fall (Attribute Sampling) wird das Prüfungselement danach überprüft, ob es eine bestimmte Eigenschaft besitzt oder nicht, d.h., die Elemente werden in fehlerfreie oder fehlerhafte Elemente unterteilt (alternative Fragestellung). Eine andere Variante außer diesen beiden Ausprägungen existiert nicht.104 A person is either wearing a hat or is not. He cannot wearing half a hat.“105
101 Vgl. RÜCKLE, D. (1978), S. 816. Die Unterscheidung zwischen homograden und heterograden Fragestellungen ist auch bei der bewussten Auswahl möglich, jedoch kann bei der bewussten Auswahl keine numerische Auswertung erfolgen. 102 Vgl. KORNDÖRFER, W./ PEEZ, L. (1981), S. 173. 103 Vgl. u.a. ANDERSON, R.J./ LESLIE, D.A. (1975), S. 61. 104 Vgl. LEFFSON, U. (1988), S. 174. 105 ANDERSON, R./ TEILTEBAUM, A.D. (1973), S. 31.
42
2 Prüfungstheoretische Grundlagen
Auf der Basis qualitativer Merkmale wird vom Fehleranteil der Stichprobe auf den Fehleranteil der Grundgesamtheit geschlossen. Bei der Auswertung von Zufallsstichproben wird unterschieden zwischen:
Schätzstichproben,
Entdeckungsstichproben,
Annahmestichproben.106
Mit Hilfe von Schätzstichproben wird aufgrund der fehlerhaltigen Elemente in der Stichprobe auf die Anzahl der fehlerhaften Anteil in der Grundgesamtheit geschlossen, d.h., der Prüfer schätzt den möglichen unbekannten Fehleranteil der Grundgesamtheit auf der Basis des Fehleranteils der Stichprobe. In der Praxis wird bis heute die Schätzstichprobe am häufigsten eingesetzt. Bei der Entdeckungsstichprobe versucht man, die Wahrscheinlichkeit dafür zu berechnen, dass fehlerhafte Elemente im Prüffeld entdeckt werden. Die Annahmestichprobe testet Annahmen (Hypothesen) über den Fehleranteil der Grundgesamtheit anhand der gezogenen Stichprobe. Bei der wertmäßigen Prüfung eines Prüffeldes (Variables Sampling) schließt der Prüfer vom Ausmaß quantitativer Merkmale in der Stichprobe auf das Ausmaß der Grundgesamtheit. Damit bestimmt der Prüfer Durchschnitts- oder Gesamtwerte bzw. die entsprechenden Fehlerausmaße. Dabei stehen dem Prüfer neben Monetary Unit Sampling u.a. die in Abbildung 12 dargestellten statistischen Verfahren zur Verfügung.107 Diese in der amerikanischen Literatur als Classical Variables Sampling Models bezeichneten Verfahren basieren auf der Normalverteilung, während Monetary Unit Sampling die Poisson-Verteilung benutzt.108 Monetary Unit Sampling
106 Vgl. KORNDÖRFER, W./ PEEZ, L. (1981), S. 173. In der Literatur wird die Entdeckungsstichprobe als ein Spezialfall der Annahmestichprobe aufgefasst, so dass sich die Dreiteilung (bzw. Zweiteilung) bei der Auswertung einer Zufallsstichprobe anlehnt an die Unterscheidung zwischen Schätz- und Testverfahren, die in diesem Kontext in der statistischen Methodenlehre vorgenommen wird (vgl. BUCHNER, R. (1983/II), S. 497). 107 Vgl. MANDL, G. (1984), S. 19. 108 Vgl. DELANEY, P.R./ GLEIM, I.N. (1989), S. 382.
2.4 Prüfungsmethoden
43
heterogene Fragestellung
Abbildung 12:
Mittelwertschätzung
(Mean-per-unit estimation)
Verhältnisschätzung
(Ratio estimation)
Differenzschätzung
(Difference estimation)
Regressionsschätzung
(Regression estimation)
Überblick über die Verfahren bei heterograden Fragestellung
wird in der deutschen Prüfungsliteratur als Verfahren der wertmäßigen Prüfung bezeichnet.109 Dabei wird nicht berücksichtigt, dass Monetary Unit Sampling heterograde und homograde Fragestellungen miteinander kombiniert, da die wertmäßige Prüfung bei der Anwendung des Monetary Unit Sampling auf der Basis der Methoden der Attributenprüfung erfolgt. Die in diesem Zusammenhang in der amerikanischen Literatur verwendete Bezeichnung Combined Attributes Variables Sampling110 weist auf diese Besonderheit hin. Die Abbildung 13 zeigt daher eine modifizierte Einordnung von Monetary Unit Sampling in die Verfahren der Abschlussprüfung. Die Einsatzmöglichkeiten, die auch mittlerweile von Softwarepaketen wie IDEA und ACL unterstützt werden, sind sehr vielfältig.111 Das Monetary Unit
109 Vgl. u.a. IDW (1988), S. 245 f.; vgl. MANDL, G. (1984), S. 19. 110 Vgl. u.a. ARENS, A.A./ LOEBBECKE, J.K. (1981), S. 284 ff; vgl. GOODFELLOW, J.L./LOEBBECKE, J.K./NETER, J. [1974/I], S. 23 ff.; vgl. GOODFELLOW, J.L./LOEBBECKE, J.K./NETER, J. [1974/II], 47 ff.; vgl. RENEAU; J.H. [1978], S. 669 ff. 111 Vgl. ACL (2006), S. 16.
44
2 Prüfungstheoretische Grundlagen
Prüfungsmethode
Vollprüfung
Auswahlprüfung
bewusste Auswahl
statistische Verfahren
homogene Fragestellung
heterogene Fragestellung
Monetary Unit Sampling Abbildung 13:
Einordnung des Monetary Unit Sampling
Sampling eignet sich hauptsächlich – und dies ist auch der Schwerpunkt dieser Arbeit – als Verfahren, um im Rahmen der Jahresabschlussprüfung die Existenz und die Höhe von Forderungen zu belegen.112 Aber nicht nur die Existenz und Höhe von Forderungen, sondern auch die Existenz und Höhe der Verbindlichkeiten können analysiert werden. Dies geschieht, indem Stichproben auf Ausgaben zum Jahresende durchgeführt werden. Allerdings gilt es hier zu beachten, dass die wertproportionale Auswahl – als Basis und Vorteil des Monetary Unit Sampling – für Verbindlichkeiten nur bedingt sinnvoll ist. Weiterhin macht es das Monetary Unit Sampling möglich, bestehende Forderungen aus Anleihen und Hypotheken zu bestätigen. Ein weiterer Anwendungsbereich stellen Tests über Provisionseinkünfte dar. Diese werden auf bestimmte Typen von Erträgen, z.B. Erlöse aus Versicherungsprämien, getestet. Selbst in der Buchhaltung findet das Monetary Unit Sampling Anwendung. Denn es kön112 Vgl. auch die Ergebnisse der Befragung in Kapitel 7.
2.4 Prüfungsmethoden
45
nen mit dem Verfahren Tests auf die Bewertung und Existenz von gebuchten Lohn- und Gehaltswerten durchgeführt werden. Neben diesen Personalausgaben können auch andere Ausgaben auf deren Bewertung und Existenz hin getestet werden, jedoch wird im Rahmen dieser Arbeit nicht detaillierter auf diesen Einsatz eingegangen.113 Anmerkung: 1) Die in Abbildung 12 dargestellten Verfahren werden im Rahmen dieser Arbeit nicht explizit beschrieben. Eine detaillierte Beschreibung findet man erstmalig in der deutschsprachigen Literatur u.a. bei MANDL, G. (1984) und in der amerikanischen Literatur u.a. bei DELANEY, P.R./GLEIM, I.N. (1989) und entsprechend auch in aktuellen Werken wie RUHNKE, K. (2006). 2) In der Prüfungsliteratur wird auch die Zufallsauswahl mit ergebnisabhängigem Stichprobenumfang (sequentielle Zufallsauswahl) diskutiert. Zu Beginn der Stichprobenprüfung steht der Umfang der Stichprobe noch nicht fest, sondern der Stichprobenumfang ist abhängig von der Auswertung der bereits gezogenen Stichprobenelemente. Werden Fehler in der Stichprobe entdeckt, so vergrößert sich der Stichprobenumfang (vgl. für eine umfangreiche Beschreibung u.a. WYSOCKI, K.v. (1988), S. 187 ff. und die dort angegebenen Quellen). 3) In der Prüfungslehre wird ebenfalls die Anwendung BAYESscher Verfahren für die Rechnungslegungsprüfung dargestellt. Bei diesen Verfahren können die a-priori-Informationen des Prüfers bei der Zufallsauswahl berücksichtigt werden (vgl. für die allgemeine Darstellung WEBER, K. (1972), S. 91 ff. oder für die spezielle Darstellung WOLZ, M. (2003), S. 132ff.
113 Vgl. HEROLD; M. (2009), S. 11f. und die Ergebnisse der Befragung in Kapitel 7.
3 Grundlagen der Statistik für das Monetary Unit Sampling 3.1 Grundlagen der Stichprobentheorie Die Verteilungen im Rahmen der Wirtschaftsprüfung sind eindimensional, d.h. es wird je Buchung nur ein Merkmal betrachtet. Eine der einfachsten Ausprägungen einer solchen Verteilung zeigt, ob eine Buchung entweder korrekt oder nicht korrekt ist. Fragestellungen multivariater Art bleiben im Rahmen dieser Untersuchung ohne Berücksichtigung, da diese auch für die praktische Anwendung nicht von überragender Bedeutung sind. Im besten Fall kennt der Prüfer die Verteilung des Merkmals in der Grundgesamtheit vollständig. Dies bedeutet, dass der Prüfer die für die Verteilung relevante Funktion kennt (dies kann die Verteilungs-, die Wahrscheinlichkeits- oder Dichtefunktion sein) und die Werte der Funktionsparameter der Verteilung ebenfalls bekannt sind. Dies ist aber in der Praxis der Wirtschaftsprüfung überwiegend nicht der Fall. Vielfach ist aber zumindest die Verteilung bekannt oder der Prüfer nutzt eine bestimmte Verteilung. Die Werte der Funktionsparameter müssen jedoch in Form von Schätzungen ermittelt werden. Dafür werden dann die Stichproben aus der Grundgesamtheit entnommen. Die Funktionsparameter werden dann auf Basis der Stichproben geschätzt. Funktionsparameter sind die Parameter, die in der Verteilungsfunktion und/oder in der Dichte- bzw. Wahrscheinlichkeitsfunktion direkt auftreten. Davon abzugrenzen sind die Funktionalparameter, die abhängig von der tatsächlichen Verteilung sind. Wichtige Funktionalparameter sind Perzentile, Erwartungswerte oder Varianzen.114 Bei der Anwendung von Monetary Unit Sampling in der Wirtschaftsprüfung verfolgt der Wirtschaftsprüfer – wie bei jedem anderen statistischen Verfahren auch – das Ziel, Aussagen über eine Grundgesamtheit des Umfanges N aufgrund einer daraus entnommenen Stichprobe des Umfanges n zu treffen. Eine Grundgesamtheit oder auch Zielgesamtheit, ist in diesem Zusammenhang die Menge aller Elemente eines Prüffeldes. Kontrolliert der Prüfer ein bestimmtes Konto, so 114 Vgl. RINNE, H./ MITTAG, H.-J. (1995), S. 77 f. B. Giezek, Monetary Unit Sampling, DOI 10.1007/978-3-8349-6588-2_3, © Gabler Verlag | Springer Fachmedien Wiesbaden GmbH 2011
48
3 Grundlagen der Statistik für das Monetary Unit Sampling
ist die Grundgesamtheit die Menge aller Rechnungen des Prüffeldes, d.h., das Prüffeld besteht aus N Rechnungen (Losgröße). Jede dieser Rechnungen hat einen bestimmten, meist zu anderen differierenden, Rechnungsbetrag (yi). Der Anwender des Monetary Unit Sampling wählt die zu prüfenden Rechnungen nicht unmittelbar aus dieser Grundgesamtheit aus, sondern er definiert eine neue Grundgesamtheit, die Auswahlgesamtheit oder Erhebungsgesamtheit.115 Die Auswahlgesamtheit beim Monetary Unit Sampling besteht aus Y Geldeinheiten, die als Summe der N Buchwerte definiert ist: N
Y
¦y
i
i 1
Bei der Anwendung des Monetary Unit Sampling werden durch die Unterscheidung zwischen Auswahl- und Untersuchungseinheit die Rechnungen nicht direkt ausgewählt, sondern der Prüfer geht von dem Gesamtwert der Rechnungen aus. Basierend auf dem Musterkonto besteht die Auswahlgesamtheit aus Y = 631.054 einzelnen Eine-Geldeinheit (€)-Positionen (vgl. Tabelle 1 und Abbildung 14). Aus dieser Gesamtheit wählt der Prüfer einzelne Geldeinheiten, die Auswahleinheiten, aus. Die Auswahleinheiten sind nicht mit den Untersuchungseinheiten identisch, da der Prüfer nicht die einzelne Geldeinheiten, sondern die korrespondierende Buchung, überprüft, d.h., die „ausgewählte Eine-Geldeinheit-Buchung“ wird der Buchung zugeordnet, aus der sie entstammt und daraufhin wird die Buchung überprüft. Eine Prüfung der Buchung bedeutet indirekt aber auch eine Überprüfung der einzelnen ausgewählten Geldeinheit. Bei der Anwendung des Monetary Unit Sampling werden die Elemente der Auswahlgesamtheit, d.h. die einzelnen Geldeinheiten, durch eine, in einfachen Auswahlmodellen, einstufige Zufallsauswahl ermittelt. Man spricht in diesem Zusammenhang von einer einfachen oder einstufigen Zufallsstichprobe. Dies bedeutet, dass bei einem Stichprobenumfang von Umfang n die n auszuwählenden Geldeinheiten in einem Schritt aus den insgesamt Y Geldeinheiten (hier Y = 631.054) ausgewählt werden. Eine Hintereinanderschaltung mehrerer Zufallsauswahlen, wie bei einer mehrstufigen Stichprobe, oder eine vorherige Schichtung
115 Vgl. RINNE, H./ MITTAG, H.-J. (1995), S. 79.
3.1 Grundlagen der Stichprobentheorie Tabelle 1: Nr.
49
Musterkonto für die statistischen Grundlagen
Buchwert
Nr.
Buchwert
Nr.
Buchwert
Nr.
1
1.069,75 €
30
10.112,00 €
59
14.837,67 €
88
112,75 €
2
12.323,67 €
31
100,00 €
60
12.345,66 €
89
36.724,00 €
3
13.458,87 €
32
220,00 €
61
2,00 €
90
3,60 €
4
7.435,50 €
33
10.980,00 €
62
6.375,00 €
91
2,80 €
5
7.500,00 €
34
9.900,70 €
63
9,88 €
92
4,50 €
6
3.465,50 €
35
6.633,50 €
64
35,98 €
93
77,00 €
7
223,80 €
36
3.524,90 €
65
1.287,10 €
94
321,77 €
8
2.244,00 €
37
765,00 €
66
254,66 €
95
23.580,00 €
9
909,76 €
38
5.790,00 €
67
165,40 €
96
876,45 €
10
345,88 €
39
12,99 €
68
12.798,53 €
97
999,00 €
11
4.423,17 €
40
34,49 €
69
123,99 €
98
4.567,00 €
12
5.720,00 €
41
399,00 €
70
27,99 €
99
49,80 €
13
6.748,30 €
42
3,50 €
71
45,80 €
100
50,20 €
14
1.234,70 €
43
1,99 €
72
87,90 €
101
47,00 €
15
8.746,00 €
44
2,40 €
73
34,00 €
102
1,90 €
16
94,55 €
45
5,70 €
74
2,77 €
103
12.735,00 €
17
12,20 €
46
98,20 €
75
3,44 €
104
14.888,64 €
18
98,77 €
47
444,88 €
76
12,00 €
105
5,67 €
19
1.100,89 €
48
12,30 €
77
111,09 €
106
32,99 €
20
2.370,40 €
49
97,00 €
78
3,00 €
107
37,90 €
21
666,89 €
50
100,00 €
79
12,78 €
108
1.245,67 €
22
735,00 €
51
99.700,00 €
80
912,65 €
109
220,89 €
23
893,40 €
52
50.000,00 €
81
32,98 €
110
37.889,00 €
24
9.999,76 €
53
49.846,00 €
82
57,66 €
111
345,78 €
25
110,56 €
54
432,00 €
83
99,76 €
112
123,98 €
26
443,28 €
55
49.842,00 €
84
145,49 €
113
26.745,00 €
27
555,00 €
56
5.000,70 €
85
44,99 €
114
333,26 €
28
5.730,00 €
57
5.643,99 €
86
12,34 €
115
612,70 €
29
9.837,40 €
58
332,00 €
87
5,00 €
Ȉ
Buchwert
631.054,00 €
50
3 Grundlagen der Statistik für das Monetary Unit Sampling
#1
#2
#6.199
#6.200
1,- Euro
1,- Euro
1,- Euro
1,- Euro
#6.201
#6.202
#14.199
#14.200
1,- Euro
1,- Euro
1,- Euro
1,- Euro
#619.999
#620.000
1,- Euro
1,- Euro
#620.001
#620.002
#620.884
1,- Euro
1,- Euro
1,- Euro
Abbildung 14:
Darstellung der Auswahlgesamtheit beim Monetary Unit Sampling
der Grundgesamtheit mit unterschiedlichen Auswahleinheiten auf den einzelnen Stufen, wie bei einer geschichteten Stichprobe, sind beim Monetary Unit Sampling nicht notwendig.116 Im Rahmen dieser Arbeit wird jedoch mit Hilfe von Simulationen gezeigt, ob die Auswahltechniken Auswirkungen auf die empirischen Verteilungen in der Stichprobe haben.
116 Eine Übersicht über die Techniken und Verfahren der Zufallsauswahl, die auch bei anderen Verfahren im Rahmen der Wirtschaftsprüfung eingesetzt werden, finden sich bei u.a. bei MARTEN, K./ QUICK, R./ RUHNKE, K. (2007), S. 314 ff. Insbesondere findet sich dort eine Darstellung über die sogenannten unechten zweistufigen Stichproben. Dies sind auf der einen Seite die Klumpenstichprobe (Stichproben nur auf der ersten Stufe und Vollerhebung auf der zweiten Stufe) sowie die bereits erwähnte Schichtenprobe (Stichprobe nur auf der zweiten Stufe und Vollerhebung auf der ersten Stufe). Für den Einsatz dieser Auswahltechniken ist jedoch wichtig, vorher zu prüfen, dass die Verteilung im Klumpen möglichst der nahe der Verteilung der Grundgesamtheit kommt und dass die Verteilung in den Schichten möglichst homogen ist.
3.1 Grundlagen der Stichprobentheorie
51
Eine Stichprobe kann mit oder ohne Zurücklegen gezogen werden.117 Beim Monetary Unit Sampling erfolgt die Auswahl der Geldeinheiten in der Regel ohne Zurücklegen. Stichprobenverfahren, bei denen die Auswahl der Elemente ohne Zurücklegen erfolgt, sind typisch für die Wirtschaftsprüfung. Charakteristisch für das Ziehen ohne Zurücklegen ist, dass ein bereits gezogenes Element nicht wieder in die Stichprobe gelangen kann, d.h., es werden für unser Beispiel 20 verschiedene Geldeinheiten gezogen. Dies bedeutet bei der Anwendung des Monetary Unit Sampling aber nicht, dass im Anschluss an die Auswahl der 20 Geldeinheiten auch 20 verschiedene Rechnungen geprüft werden, denn es ist (teilweise sehr) wahrscheinlich, dass zwei oder mehr gezogene Geldeinheiten aus derselben Rechnung stammen. Daher ist der tatsächliche Prüfungsumfang118 in der Regel kleiner als der vorher berechnete Stichprobenumfang. Dies bedeutet in der Praxis, dass eine deutliche Kostenersparnis erzielt werden kann. Ziehen ohne Zurücklegen bedeutet ferner, dass sich der Umfang der Auswahlgesamtheit Zug um Zug verringert und die Auswahlgesamtheit sich in ihrer Zusammensetzung ändert. Bei Stichprobenverfahren wird zwischen Stichprobenverfahren mit gleichen und ungleichen Auswahlwahrscheinlichkeiten unterschieden119 Monetary Unit Sampling wird als Verfahren mit ungleichen, respektive wertproportionalen Auswahlwahrscheinlichkeiten bezeichnet, d.h., die Untersuchungseinheiten besitzen unterschiedliche, größenabhängige Auswahlwahrscheinlichkeiten.120 Je höher der Rechnungswert, desto größer ist die Wahrscheinlichkeit, dass die Rechnung in die Auswahl gelangt. Diese Eigenschaft des Verfahrens kommt ebenfalls den Interessen des Prüfers entgegen. Betrachtet man das Monetary Unit Sampling 117 Vgl. RINNE, H./ MITTAG, H.-J. (1995), S. 80. 118 Der tatsächliche Prüfungsumfang gibt die Menge der zu prüfenden Positionen (beispielweise die Menge der zu prüfenden Rechnungen) an. Da aufgrund der Auswahlmodalität bei der Anwendung des Monetary Unit Sampling der errechnete Stichprobenumfang sich auf die Anzahl der auszuwählenden Geldeinheiten bezieht, kann es vorkommen, dass der Wirtschaftsprüfer tatsächlich weniger Rechnungen als die vorher angegebene Stichprobenumfang zu prüfen hat, da eine oder mehrere Rechnungen mehr als eine der ausgewählten Geldeinheiten umfasst. In diesen Fällen die der rechnerische Stichprobenumfang größer als die Anzahl der zu prüfenden Rechnungen (sog. tatsächlicher Stichprobenumfang). 119 Vgl. RINNE, H./ MITTAG, H.-J. (1995), S. 80. 120 Vgl. IDW (1988), S. 242.
52
3 Grundlagen der Statistik für das Monetary Unit Sampling
aber als Verfahren, bei dem einzelne Geldeinheiten aus einer zuvor definierten Menge von Geldeinheiten ausgewählt werden, so resultiert aus dieser Überlegung, dass es sich beim Monetary Unit Sampling um ein Stichprobenverfahren mit gleichen Auswahlwahrscheinlichkeiten handelt. Jede einzelne Geldeinheit besitzt somit die gleiche Auswahlwahrscheinlichkeit. „Monetary Unit Sampling is a method of statistical sampling in which every dollar (or other monetary unit) in an accounting population is given an equal chance of selec121 tion.“
Die Wertproportionalität der Auswahlwahrscheinlichkeiten wird bei dem Verfahren des Monetary Unit Sampling dadurch erreicht, dass die ausgewählte Geldeinheit der Rechnung zugeordnet wird, aus der sie stammt. Höhere Rechnungen besitzen daher eine größere Wahrscheinlichkeit überprüft zu werden, da höhere Rechnungen sich aus einer größeren Anzahl einzelner Geldeinheiten zusammensetzen als niedrigere Rechnungen.
3.2 Stichprobenfunktionen Aus der Grundgesamtheit N werden n Elemente in der Stichprobe ausgewählt. Beim Monetary Unit Sampling werden aus der Summe Y die n Elemente ausgewählt. Die Zufallsvariable X der Grundgesamtheit besitzt eine von einem oder mehreren (Anzahl: l) Funktionsparametern (ș1, ș2,..., șl) abhängige Verteilung. Diese Parameter sind beispielsweise bei der Poisson-Verteilung der Parameter Ȝ und bei der Normalverteilung die Parameter ȝ und ı2. Jedes ausgewählte Element xi (von i = 1 bis n) in der Stichprobe des Umfangs n ist die Realisation einer Zufallsvariablen Xi (von i = 1 bis n). Daher besteht eine Stichprobe des Umfangs n aus n Zufallsvariablen, dem sogenannten Stichprobenvektor.122 Dabei werden die Stichprobenvariablen in der Beobachtungsreihenfolge dargestellt: X = (X1, X2, …, Xn) Sind durch die Stichprobenziehung die einzelnen Werte bekannt, so wird die Realisation des Stichprobenvektors X in vektorieller Notation dargestellt. 121 LESLIE, D.A./ TEITLEBAUM, A.D./ ANDERSON, R.J. (1979), Einleitung. 122 Vgl. RINNE, H./ MITTAG, H.-J. (1995), S. 84.
3.2 Stichprobenfunktionen
53
x = (x1, x2, …, xn) Auch in diesem mehrdimensionalen Fall lässt sich die Zufallsvariable durch eine Verteilungsfunktion und/oder eine Dichte- bzw. Wahrscheinlichkeitsfunktion vollständig beschreiben. Im Rahmen der Wirtschaftprüfung werden i.d.R. diskrete Zufallsvariablen123 betrachtet, so dass sich die gemeinsame Wahrscheinlichkeitsfunktion folgendermaßen darstellen lässt. P( X
x T)
P( X 1
x1 , X 2
x2 ,...., X n
xn T )
n
P( X
xi T )
i
i 1
Unterstellten wir vereinfachend, dass der Prüfer aus einer Grundgesamtheit mit N Elementen, von denen M Elemente fehlerhaft sind, n Elemente mit Zurücklegen zieht. Die Zahl für M sei unbekannt und liegt zwischen 0 und N. Der Stichprobenumfang sei beispielsweise vier und es gilt, dass die Null-Eins-Variable Xi den Zustand des i-ten Elementes der Stichprobe beschreibt. Die Zufallsvariablen Xi sind unabhängig identisch verteilt mit der Verteilung von X. Es sei xi = 0 für den Fall einer fehlerfreien Buchung und xi = 1 für den Fall der fehlerhaften Buchung definiert. Die gemeinsame Wahrscheinlichkeitsfunktion ergibt sich auf Basis des Multiplikationssatzes für unabhängige Ereignisse dann wie folgt: n
P( X
x)
P( X 1
x1 , X 2
x2 , X 3
x3 , X 4
x4 )
( P( X
i
xi )
i 1
P( X P( X 1
x) x1 , X 2 1 x1
P (1 P ) x1
x2 , X 3
x3 , X 4 1 x2
P (1 P ) x2
x4 )
P ( 1 P )1 x3 P x4 ( 1 P )1 x4 x3
P x1 x2 x3 x4 ( 1 P )4 ( x1 x2 x3 x4 )
Da die Verteilung der Stichprobenvektoren oft nicht einfach darzustellen und der Umgang damit schwer handhabbar ist, wird eine Stichprobenfunktion verwendet, die die Größen des Stichprobenvektors über eine Funktionsvorschrift zu einer Größe zusammenfasst. In der Schätztheorie nennt man dies Schätzfunktion (Esti-
123 Vgl. RINNE, H./ MITTAG, H.-J. (1995), S. 84.
54
3 Grundlagen der Statistik für das Monetary Unit Sampling
mator) und in der Testtheorie Prüf- bzw. Testvariable (Test Statistic).124 Als wichtige Stichprobenfunktion werden u.a. eingesetzt:125 1) Stichprobenmittelwert \( X )
Xn
1 T 1 n Xn : ¦ Xi n n i1
2) Stichprobenvarianz \( X )
mit S n*2
1 n ¦ ( X i X n )2 n 1 i 1
S n2
1 n ¦ ( X i X n )2 n i1
1 § n 2 2 · ¨ ¦ X i nX n ¸ n 1 © i 1 ¹
n *2 Sn n 1
1 n 2 ¦ X i X n2 , n i1
die alternativ auch als Stichprobenfunktion genutzt werden kann und für Stichprobenumfänge von n mit (n ĺ ) mit der obigen Funktion ( S n2 ) identisch ist. 3) Stichprobenstandardabweichung \( X )
S n2
Sn
4) Stichprobenminimum \( X )
X1
min X i 1d i d n
5) Stichprobenmaximum \( X )
X
n
max X i 1d i d n
6) Stichprobenmedian
\( X )
X k 1 ° X : ®X k X ° 2 ¯
falls n ungerade ( n
k 1
2k 1 )
falls n gerade ( n
2k )
124 Vgl. RINNE, H./ MITTAG, H.-J. (1995), S. 85. 125 Vgl. u.a. SCHLITTGEN, R. (2000), S. 261 ff. und BOSCH, K. (1996), S. 326.
3.2 Stichprobenfunktionen
55
7) Stichprobenspannweite \( X )
SWn
X
n
X1
Für die Schätzung sollten diese Funktionen (=Schätzfunktionen) bestimmte Eigenschaften erfüllen. Gesucht wird ein unbekannten Funktions-, u.U. auch Funktionalparameter, einer Grundgesamtheit. Diesen Parameter wird in allgemeiner Form üblicherweise als 4 bezeichnet. Wie bereits erwähnt, wird dafür eine geeignete Schätzfunktion gewählt, die, wie schon zuvor, mit \( X ) symbolisiert
ˆ bezeichnet wird. Die wichtigsten Eigenschaften einer wird und hier auch als 4 n solchen Schätzfunktion lauten: 1) Erwartungstreue
ˆ E 4 n
4
für alle n `
Stimmt der Erwartungswert der Schätzfunktion mit dem zu schätzenden Parameter überein, so heißt eine Schätzfunktion erwartungstreu (unverzerrt, unbiased). Die Differenz zwischen dem Erwartungswert der Schätzfunktion und dem zu schätzenden Parameter, der bei einer nicht erwartungstreuen Schätzfunktion entsteht, nennt man Verzerrung oder Bias und misst den systematischen Schätzfehler wie folgt:
ˆ B 4 n
ˆ 4 mit E 4 n
ˆ 0 systematische Unterschätzung B 4 n ° ° ˆ 0 Unverzerrheit ®B 4 n ° ˆ ! 0 systematische Überschätzung °B 4 n ¯
Ein Schätzfunktion heißt asymptotisch erwartungstreu oder asymptotisch unverzerrt, wenn
ˆ l im B 4 n n of
gilt.
ˆ 4 lim E 4 n
n of
0
oder einfach
ˆ lim E 4 n n of
4
56
3 Grundlagen der Statistik für das Monetary Unit Sampling
2) Effizienz Zum Vergleich von mehreren erwartungstreuen Schätzfunktionen kann die Varianz als ein mögliches Kriterium herangezogen werden
ˆ V 4 n
ˆ E 4 ˆ º E ª4 n ¬ n ¼
2
Die Funktion mit minimaler Varianz heißt effizient oder wirksam. Im Vergleich ˆ 1 und 4 ˆ 2 ) gilt die Schätzfunktion zweier erwartungstreuen Schätzfunktionen ( 4 n
n
ˆ ) als effizienter (oder wirksamer), deren Varianz kleiner ist. (4 1 n
ˆ 1 V 4 ˆ2 V 4 n n
Bildet man den Quotienten aus zwei Varianzen, so kann man damit das Maß der ˆ 1 eine Effizienz berechnen. Für Werte größer eins, hat die Schätzfunktion 4 n
ˆ2. größere Varianz als die Schätzfunktion 4 n K
ˆ V 4 ˆ1 V 4 n 2 n
Für den praktischen Einsatz von Schätzfunktionen in der Wirtschaftsprüfung sollten Schätzfunktionen mit möglichst geringer Varianz eingesetzt werden, die aber auf jeden Fall auch erwartungstreu sein sollten. Eine erwartungstreue Schätzfunktion mit der kleinst möglichen Varianz heißt wirksamst oder absolut effizient. Die Variabilität, also die gesamte Abweichung einer Schätzfunktion, kann mit dem mittleren quadratischen Fehler, dem MSE (Mean Square Error), gemessen werden:126 Der mittlere quadratische Fehler besteht aus Zufallsabweichung, gemessen durch die Varianz, und die systematische Über- oder Unterschätzung, gemessen durch den Bias bzw. quadrierten Bias:
126 Vgl. RINNE, H. (1984) S. 360.
3.2 Stichprobenfunktionen
57
ˆ 4 º Eª 4 ¬ n ¼
ˆ MSE 4 n
2
2
2
ˆ E 4 ˆ º E 4 ˆ 4 E ª4 n n n ¬ ¼
2 ˆ ˆ B 4n V 4n
ˆ B2 4 ˆ V 4 n n
3) Konsistenz
ˆ für den unbekannten Parameter 4 heißt konsistent, Eine Schätzfunktion 4 n wenn für die Schätzfunktion eines der Gesetze der großen Zahlen gilt: a) einfach konsistent, falls
ˆ 4 ! H lim P 4 n
n of
0
bzw.
ˆ plim4 n
4
b) konsistent im mittleren Fehlerquadrat, falls
ˆ lim MSE 4 n
n of
0
c) stark konsistent, falls
ˆ P lim 4 n
4
n of
1
4) Suffizienz Eine Schätzfunktion heißt suffizient, wenn die in den n Stichprobenvariablen steckenden Informationen von der Schätzfunktion ausgeschöpft werden. Dies ist für beispielsweise die Verteilungen Stichprobenminimum oder Stichprobenmaximum nicht der Fall. 5) Mediantreue Eine Schätzfunktion heißt mediantreu, wenn die Wahrscheinlichkeit, dass die Schätzfunktion größer gleich oder kleiner gleich dem zu schätzenden Parameter, jeweils 0,5 ist und somit der zu schätzende Parameter der Median der Verteilung der Schätzfunktion ist:
ˆ d4 P 4 n
0 ,5
58
3 Grundlagen der Statistik für das Monetary Unit Sampling
6) Linearität Eine Schätzfunktion heißt linear, wenn die Schätzfunktion eine Linearkombination der Xi ist: ˆ 4 n
n
a0 ¦ ai X i i 1
Bei der Anwendung des Monetary Unit Sampling kann durch ein und dieselbe Stichprobe sowohl der Fehleranteil als auch das Fehlerausmaß geschätzt werden.127 Der Prüfer schätzt zuerst den unbekannten Anteil P* (= PMUS) der fehlerhaften Geldeinheiten in der Grundgesamtheit und bildet in einem zweiten Schritt den Schätzwert der Überbewertungen bzw. der Unterbewertungen des Prüffeldes.128 Die Schätzung des Anteils P* basiert auf den Grundlagen der Attributenprüfung. Bei den vor Monetary Unit Sampling eingesetzten Verfahren der Attributenprüfung in der Wirtschaftsprüfung wird der Anteil P der fehlerhaften Prüfungspositionen (der Anteil der fehlerhaften Rechnungen) in der Grundgesamtheit N geschätzt.129 Zieht der Prüfer eine Stichprobe des Umfangs n und finden sich in der Stichprobe k fehlerhafte Elemente, dann ist der Fehleranteil S n in der Stichprobe
Sn
k n
1 n ¦ X i mit X i ni1
0 fehlerfrei ® ¯1 fehlerhaft
ein unverzerrter oder erwartungstreuer Schätzer (oder Schätzfunktion) für den unbekannten Fehleranteil P der Grundgesamtheit.130 Pˆ
Sn
1 n ¦ Xi ni1
k n
Erwartungstreue bedeutet hier: E ( Pˆ )
P
127 Vgl. SPERL, A. (1978), S. 179. 128 Vgl. DEINDL, J. (1982), S. 1585. P* (= PMUS) ist in diesem Zusammenhang der Anteil der fehlerhaften Geldeinheiten, der später ausschließlich als PMUS bezeichnet wird, und P der Anteil der fehlerhaften Buchungen in der Grundgesamtheit. 129 N = Anzahl aller Prüfungspositionen (z.B. Anzahl aller Rechnungen). 130 Vgl. MANDL, G. (1984), S. 121 f.; zur Herleitung vgl. LEINER, B. (1985), S. 28 f.
3.2 Stichprobenfunktionen
59
Für die Varianz von S n gilt: V S n
PQ N n mit Q n N 1 P(1 P) N n n N 1
1 P
wenn die Stichprobe ohne Zurücklegen gezogen wurde.131 Wird die Stichprobe mit Zurücklegen gezogen, so lautet die Varianz:132 V S n
P Q mit Q n P (1 P) n
1 P
Die Varianz dient als Maß der Genauigkeit einer Schätzung. Der Vergleich der beiden Varianzen zeigt, dass ceteris paribus die Schätzung bei einer Stichprobe ohne Zurücklegen wegen (N – n)/(N – 1) < 1 für n > 1 genauer ist als die Schätzung bei einer Stichprobe mit Zurücklegen.133 Das Ziehungsschema „Ziehen ohne Zurücklegen“ ist typisch für die Wirtschaftsprüfung. Bei der Anwendung des Monetary Unit Sampling wird aber nicht der Anteil der fehlerhaften Geschäftsfälle P = M / N (homograde Fragestellung) geschätzt134, sondern bei der Anwendung des Monetary Unit Sampling erfolgt die Schätzung des Anteiles der fehlerhaften Geldeinheiten PMUS = MMUS /Y (homograde und heterograde Fragestellung) im Prüffeld135.
131 Vgl. auch zur Herleitung LEINER, B. (1985), S. 32. In der Stichprobentheorie bezeichnet man (N – n) / (N – 1) als den Korrekturfaktor für die endliche Gesamtheit (vgl. RINNE, H./ ICKLER, G. (1986), S. 613). 132 Vgl. auch zur Herleitung LEINER, B. (1985), S. 31 f. 133 Vgl. RINNE, H./ ICKLER, G. (1986), S. 613. 134 Eine derartige Schätzung ist auch mit Monetary Unit Sampling möglich, jedoch muss dabei beachtet werden, dass zwei oder mehr fehlerhafte Geldeinheiten aus ein und derselben Prüfungsposition stammen können. Dies ist bei der Berechnung von p = k / n zu beachten. 135 Der Verständlichkeit wegen wird in diesem Abschnitt unterstellt, dass die fehlerhaften Geldeinheiten in einem Prüffeld entweder nur vollständig überbewertet (di/yi = 1) sind (vgl. Kapitel 5).
60
3 Grundlagen der Statistik für das Monetary Unit Sampling
(M = Anzahl der fehlerhaften Geschäftsfälle in einem Prüffeld, N = Anzahl aller Geschäftsfälle in einem Prüffeld, MMUS = Anzahl der fehlerhaften Geldeinheiten in einem Prüffeld, Y = Anzahl aller Geldeinheiten in einem Prüffeld [Istwert des Prüffeldes] und kMUS = Anzahl fehlerhafter Geldeinheiten in der Stichprobe. Übertragen wir diese bezüglich des Fehleranteiles P gemachten Überlegungen auf den Anteil der fehlerhaften Geldeinheiten PMUS, so gilt, dass der Anteil der fehlerhaften Geldeinheiten in der Stichprobe
S MUS n
k MUS n
1 n ¦ Yi mit Yi n i1
0 fehlerfreie Geldeinheit ® ¯1 fehlerhafte Geldeinheit
ein erwartungstreuer Schätzer für den Anteil der fehlerhaften Geldeinheiten in der Grundgesamtheit ist. Pˆ MUS
S nMUS
1 n ¦ Yi n i1
k MUS n
Für die Varianz von S nMUS gilt für das Ziehen ohne Zurücklegen:
V S nMUS
P MUS Q MUS Y n mit Q* n Y 1 P MUS (1 P MUS ) Y n n Y 1
1 P *
Da den Prüfer neben dem Fehleranteil auch das Fehlerausmaß interessiert,136 wird bei Anwendung des Monetary Unit Sampling in einem zweiten Schritt die Anzahl Y · PMUS der fehlerhaften Geldeinheiten in der Grundgesamtheit geschätzt. Die Hochrechnung Y S nMUS ist eine erwartungstreue Schätzung für die Anzahl Y · PMUS der fehlerhaften Geldeinheiten in der Grundgesamtheit. Für die Varianz von Y S nMUS gilt:
136 Vgl. LEINER, B. (1985), S. 36 f.
3.2 Stichprobenfunktionen
61
P MUS Q MUS Y n P MUS Q MUS |Y2 n Y 1 n MUS MUS P (1 P ) Y n P MUS (1 P MUS ) Y2 |Y2 n Y 1 n
V Y S nMUS Y 2
Die oben angegebenen Varianzen sind die Varianzen der Grundgesamtheit.137 In der praktischen Anwendung werden die unbekannten Varianzen der Grundgesamtheit geschätzt. Da mit der Schätzung des unbekannten Parameters PMUS der Grundgesamtheit durch den Stichprobenparameter S nMUS ein Freiheitsgrad verloren geht, ergeben sich als erwartungstreue Schätzung der Varianzen:
Vˆ S nMUS
S nMUS 1 S nMUS Y n
n 1
Vˆ Y S nMUS Y 2
Y 1
S nMUS 1 S nMUS Y n n 1
Y 1
|Y2
S nMUS 1 S nMUS n 1
Die Hochrechnung Y S *n kann als Punktschätzung der Überbewertungen angesehen werden, da – wie aber bereits erwähnt – Monetary Unit Sampling möglichst auf Prüffelder anzuwenden ist, bei denen nur Überbewertungen zu erwarten sind. Im Rahmen des Monetary Unit Sampling wird diese Punktschätzung als Most Likely Error (MLE)138 bezeichnet. Die Punktschätzung des Fehleranteils bzw. des Fehlerausmaßes ist auf der Grundlage von Stichproben normalerweise mit Ungenauigkeiten behaftet. Der Wirtschaftsprüfer schätzt den tatsächlichen Wert des Fehleranteiles bzw. Fehlerausmaßes auf Basis einer zufälligen Stichprobe und die Wahrscheinlichkeit, dass der richtige Fehleranteil geschätzt wird, ist Null. Der Prüfer kann mit absoluter Sicherheit nur aussagen, dass der unbekannte Anteil P* der Grundgesamtheit im Intervall
Y n k k MUS d P MUS d n Y
MUS
137 Für das Ziehen ohne Zurücklegen entwickelten HORWITZ, D.G./ THOMPSON, D.J (1954) einen allgemeinen Ansatz. Eine kurze Vorstellung findet sich in HARTUNG; J./ ELPELT; B. / KLÖSENER, K.H. (2005), S. 299 f. 138 Vgl. LESLIE, D.A./ TEITLEBAUM, A.D./ ANDERSON, R.J. (1979), S. 124.
62
3 Grundlagen der Statistik für das Monetary Unit Sampling
liegt. Die Genauigkeit der Schätzung kann durch große Stichprobenumfänge verbessert werden. Diese sind aber in der praktischen Anwendung wegen der bestehenden Restriktionen hinsichtlich der Prüfungszeit und der Prüfungskosten nicht realisierbar. Ziel der Schätztheorie ist es daher auch, mit einem vertretbaren Stichprobenumfang eine Höchstgrenze PH und eine Untergrenze PU für den unbekannten Anteil PMUS der fehlerhaften Geldeinheiten in der Grundgesamtheit mit einer vorher bestimmten Wahrscheinlichkeit festzulegen:139 PU d P MUS d PH
Der Prüfer sucht ein zufälliges Intervall [PU; PH], welches mit vorgegebener Wahrscheinlichkeit (1 – D) den festen, aber unbekannten Fehleranteil PMUS überdeckt: P PU d P MUS d PH
(1 D )
Ein solches Intervall heißt zweiseitiges Konfidenzintervall zum Konfidenzniveau (1 – D). Für den Prüfer ist aber im Rahmen der Jahresabschlussprüfung im Allgemeinen die Höchstgrenze PH nur von Bedeutung, da der Prüfer mit einer vorher festgestellten Sicherheit (1 – D) eine Aussage darüber machen möchte, dass das Prüffeld einen bestimmten Wert nach oben nicht überschreitet. Dies ergibt ein einseitig nach oben begrenztes Konfidenzintervall, für das gilt: P P MUS d PH
(1 D )
Das entsprechende Konfidenzintervall lautet dann einfach: P MUS d PH
Da mit dem Monetary Unit Sampling auch das Fehlerausmaß berechnet wird, kann das Konfidenzintervall auch folgendermaßen angegeben werden: P M MUS d M H
(1 D )
139 Vgl. BUCHNER, R. (1983/II), S. 494.
3.3 Verteilungen von Stichprobenfunktionen
63
Mit einer Wahrscheinlichkeit von (1 – D) kann der Prüfer darauf schließen, dass die gesamte Überbewertung eines Prüffeldes kleiner ist als die berechnete Höchstgrenze MH. M MUS d M H
Diese Höchstgrenze wird in der Terminologie des Monetary Unit Sampling als Fehlerobergrenze (FOG) oder Upper Error Limit (UEL)140 bezeichnet. Diese obere Grenze wird bei der Anwendung des Monetary Unit Sampling auf Basis der Poisson-Verteilung berechnet.141 Daher ist es für die weiteren Betrachtungen wichtig, auch die für statistische Verfahren der Jahresabschlussprüfung zugrunde liegenden Verteilungen zu betrachten.
3.3 Verteilungen von Stichprobenfunktionen Im betriebswirtschaftlichen Prüfungswesen erfolgt im Allgemeinen das Ziehen der Stichprobenelemente ohne Zurücklegen. Die Grundgesamtheit besteht aus fehlerhaften oder nicht fehlerhaften Buchungen, beziehungsweise beim Monetary Unit Sampling aus fehlerhaften oder nicht fehlerhaften Geldeinheiten. Im Vorfeld gibt der Jahresabschlussprüfer einen Stichprobenumfang n vor. Dies alles sind Kriterien für das sogenannte Urnenmodell. Verteilungen aus dem Urnenmodell lassen sich nach drei Kriterien unterscheiden:
Zusammensetzung der Urne (dichotom / nicht dichotom);
Modalität der Kugelentnahme (mit Zurücklegen / ohne Zurücklegen);
Abbruchkriterium (fester Stichprobenumfang (n) / zufälliger Stichprobenumfang).
Damit eine hypergeometrische Verteilung zugrunde gelegt werden kann, erfolgt die Ziehung der n vorher festgelegten Stichprobenelemente aus einer dichotomen Urne ohne Zurücklegen. Somit ist die hypergeometrische Verteilung typisch für
140 Vgl. LESLIE, D.A./ TEITLEBAUM, A.D./ ANDERSON, R.J. (1979), S. 124. Der Begriff des upper error limit wird in der Literatur sowohl für den Fehleranteil als auch für das Fehlerausmaß benutzt. 141 Vgl. TEITLEBAUM, A.D./ ROBINSON, C.F. (1975), S. 86 ff.
64
3 Grundlagen der Statistik für das Monetary Unit Sampling
Tabelle 2:
Beispiel für eine dichotome Grundgesamtheit in der Wirtschaftsprüfung
Rechnung Nr.
Rechnung fehlerfrei
Rechnung fehlerhaft
1
x
2
x
3
x
.
.
.
.
.
.
.
.
.
N–2
.
x
N–1
x
N
x
N
(N – M)
M
Rechnungen
fehlerfrei
fehlerhaft
x
eine mit Hilfe statistischer Verfahren durchgeführte Wirtschaftsprüfung im homograden Fall.142 Aus einer Urne mit N Kugeln wird eine Stichprobe von n Kugeln ohne Zurücklegen gezogen. Die N Kugeln setzen sich aus M roten und (N – M) schwarzen Kugeln zusammen. Das Ziehen einer roten Kugel bedeute „Erfolg“. Überträgt man dieses Urnenmodell auf die Wirtschaftsprüfung, so stellen die N Kugeln die prüfungspflichtigen Geschäftsvorfälle dar, von denen n Vorfälle ausgewählt und geprüft werden. Von den N Positionen sind M Geschäftsvorfälle fehlerhaft und (N – M) fehlerfrei.143 Das Ziehen erfolgt also aus einer bernoulliverteilten Grundgesamtheit. Der Buchprüfer entnimmt aus dieser Urne die zu überprüfenden Elemente ohne Zurücklegen. Das Ergebnis der einzelnen Züge ist voneinander abhängig. Die Wahrscheinlichkeiten für das Ziehen einer bestimmten Merkmalsausprägung bleiben vor jedem Zug berechenbar.
142 Vgl. u.a. FRANK, G./ SCHNEWEIS, L. (1985), S. 579 f.; vgl. SPERL, A. (1978), S. 164 f.; vgl. LESLIE, D.A./ TEITLEBAUM, A.D./ ANDERSON, R.J. (1979), S. 64 ff.; vgl. STRINGER, K.W. (1961), S. 66 und die jeweils dort angegebenen Quellen. 143 Vgl. BUCHNER, R. (1983/II), S. 484 ff.
3.3 Verteilungen von Stichprobenfunktionen
65
Die Wahrscheinlichkeit, eine fehlerhafte Rechnung im ersten Zug (E1) zu ziehen, beträgt somit: P E1
M N
Zieht der Prüfer beim ersten Zug ein fehlerhaftes Element aus der Urne, so errechnet sich die Wahrscheinlichkeit für das Ziehen eines weiteren fehlerhaften Elements im zweiten Zug (E2) folgendermaßen: P E2 E1
M 1 N 1
Will der Prüfer nun errechnen, wie groß die Wahrscheinlichkeit ist, dass nach zweimaligem Ziehen beide ausgewählten Rechnungen fehlerhaft sind, so bedeutet dies, dass sowohl das Ereignis E1 als auch das Ereignis E2 eintreten muss: Die Berechnung erfolgt über den allgemeinen Multiplikationssatz:
P E1 E2
P E1 P E2 E1
M M 1 N N 1
Beispiel: Die N = 1.000 Rechnungen eines Kontos bestehen aus M = 50 fehlerhaften und (N – M) = 950 fehlerfreien Rechnungen. Das Ziehen einer fehlerhaften Rechnung bedeute „Erfolg“. Die Wahrscheinlichkeit, eine fehlerhafte Rechnung im ersten Zug (E1) zu ziehen, beträgt somit:
P E1
M N
50 1.000
0,05
Zieht der Prüfer beim ersten Zug ein fehlerhaftes Element aus der Urne, so errechnet sich die Wahrscheinlichkeit für das Ziehen eines fehlerhaften Elementes im zweiten Zug (E2) folgendermaßen:
P E2 E1
M 1 N 1
49 999
0,049
66
3 Grundlagen der Statistik für das Monetary Unit Sampling
Will der Prüfer nun errechnen, wie groß die Wahrscheinlichkeit ist, dass nach zweimaligem Ziehen beide ausgewählten Rechnungen fehlerhaft sind, so bedeutet dies, dass sowohl das Ereignis E1 als auch das Ereignis E2 eintreten muss:
P E2 E1
P E1 P E2 E1
M M 1 N N 1
50 49 1.000 999
0,00245
Überträgt man diese Vorüberlegungen auf eine Stichprobe des Umfangs n, die ohne Berücksichtigung der Reihenfolge und ohne Zurücklegen aus einer Grundgesamtheit N gezogen wird, so lässt sich die Wahrscheinlichkeit, dass die Stichprobe des Umfangs n genau k Erfolge aus den insgesamt M möglichen Erfolgen und (n – k) Nicht-Erfolgen aus den insgesamt (N – M) Nicht-Erfolgen enthält, mit Hilfe der Wahrscheinlichkeitsfunktion der hypergeometrischen Verteilung berechnen. Diese Funktion lautet:144
hy k N ; M ; n
§ M · § N M · °¨ ¸ ¨ ¸ °° © k ¹ © n k ¹ für c d k d c 1 2 §N· ® ¨ ¸ ° ©n¹ ° °¯ 0 sonst
mit:
c1 : max 0; n M N ; c2 : min n; M Für c1 d k d c2 lässt sich die Wahrscheinlichkeitsfunktion ebenfalls in folgender Form darstellen:145
hy k N ; M ; n
N M ! M! k ! M k ! n k ! ª¬ N M n k º¼ ! N! n ! N n !
144 Vgl. RINNE, H./ MITTAG, H.-J. (1995), S. 93. 145 Für die Berechnung von Fakultäten (n t 70) bietet sich die Approximation mit Hilfe der sogenannten Stirlingschen Formel an. Nach der Formel wird log (n!) folgendermaßen berechnet: log (n!) = n log (n) – n log (e) + 0,5 log(2Sn) mit e = 2,718281828 und S = 3,141592653).
3.3 Verteilungen von Stichprobenfunktionen
67
Im Zähler der Wahrscheinlichkeitsfunktion steht die Anzahl aller Stichproben, die genau (n – k) Nicht-Erfolge aus den (N – M) insgesamt möglichen Nicht-Erfolgen und k Erfolge aus den insgesamt M Erfolgen enthalten, während im Nenner die Anzahl aller möglichen Stichproben des Umfangs n steht, die ohne Zurücklegen und ohne Berücksichtigung der Reihenfolge aus einer Grundgesamtheit N gezogen werden können. Damit ist die Wahrscheinlichkeitsfunktion der hypergeometrischen Verteilung eine Wahrscheinlichkeit, die nach der klassischen Laplace-Definition (PIERRE SIMON DE LAPLACE, 1749-1827) gebildet wurde. Die Wahrscheinlichkeit für ein Ereignis A berechnet mit der Zahl der günstigen Fälle N(A) bezogen auf die Zahl der möglichen Fälle N: P A
N ( A) N
Die Wahrscheinlichkeit für das Auftreten von höchstens k Erfolgen berechnet sich mit Hilfe der Verteilungsfunktion der hypergeometrischen Verteilung:
Hy k N ; M ;n
0 für k c1 ° k ° ®¦ hy i N ; M ;n für c1 d k d c2 ° i c1 ° 1 für k t c2 ¯
mit:
c1 : max 0; n M N ; c2 : min n; M Die Funktionalparameter der hypergeometrische Verteilung ȝ, der Erwartungswert, und ı2, die Varianz, werden wie folgt berechnet.
P
E( X )
n
M N
und
V2
V (X )
n
M N M N n N N N 1
Bei der Anwendung beim Monetary Unit Sampling besteht die Grundgesamtheit aus Y Geldeinheiten, aus denen eine Stichprobe des Umfanges n gezogen wird. Auch hier erfolgt das Ziehen ohne Zurücklegen aus einer dichotomen (fehlerhafte/nicht fehlerhafte Geldeinheit) Urne. Daher ergibt sich analog die folgende Wahrscheinlichkeitsfunktion:
68
3 Grundlagen der Statistik für das Monetary Unit Sampling
hy k MUS Y ; M MUS ; n
§ M MUS · § Y M MUS · °¨ KUS ¸ ¨ MUS ¸ ¹© n k ¹ für c d k MUS d c °© k ° 1 2 Y § · ® ¨ ¸ ° ©n¹ ° °¯ 0 sonst
mit:
c1 : max 0; n M Y ; c2 : min n; M Für c1 d k MUS d c2 lässt sich die Wahrscheinlichkeitsfunktion ebenfalls in folgender Form darstellen:
Y M MUS ! M MUS ! k MUS ! M k MUS ! n k MUS ! ª Y M MUS n k MUS º ! ¬ ¼ MUS MUS hy k y; M ; n Y! n ! Y n ! Die Wahrscheinlichkeit für das Auftreten von höchstens k Erfolgen berechnet sich mit Hilfe der Verteilungsfunktion der hypergeometrischen Verteilung:
Hy k MUS Y ; M MUS ; n
0 für k c1 °k ° MUS MUS d c2 ®¦ hy i Y ; M ; n für c1 d k i c ° 1 ° 1 für k t c2 ¯
mit:
c1 : max 0; n M Y ; c2 : min n; M Die Funktionalparameter der hypergeometrische Verteilung ȝ, der Erwartungswert, und ı2, die Varianz, werden wie folgt berechnet.
P
E( X )
n
M MUS Y
3.3 Verteilungen von Stichprobenfunktionen
V 2 V (X ) n
69
M MUS Y M MUS Y n Y Y Y 1
Da die Verteilungsfunktion der hypergeometrischen Verteilung drei Funktionsparameter besitzt, sind auch entsprechende Berechnungen sehr umfangreich und umständlich, so dass daher eine sinnvolle, praktische Anwendung zu Beginn der Arbeiten mit Monetary Unit Sampling nicht möglich war. Die Anwendung der hypergeometrischen Verteilung kann durch den Einsatz geeigneter Softwarepakete erleichtert werden, dennoch wird diese Verteilung auch in solchen Programmen oft nicht eingesetzt.146 Die zweite Möglichkeit, die sich dem Prüfer bietet, ist die Approximation der dreiparametrigen, hypergeometrischen Verteilung durch die Binomialverteilung, die Poisson-Verteilung oder die Normalverteilung.147 Eine Approximation ist immer dann möglich, wenn die sogenannten Approximationsbedingungen erfüllt sind.148 Es gilt, wenn P = M / N den unbekannten Anteil fehlerhafter Elemente (Buchungen) in der Grundgesamtheit bezeichnet: 1) Binomialapproximation: Approximationsbedingung: 0,1 P 0,9 sowie n ! 10 und
n 0,1 N
hy k N ; M ; n | bi k P; n
2) Poissonapproximation: Approximationsbedingung: P d 0,1 oder P t 0,9 sowie n ! 30 und
n 0,1 N
hy k N ; M ;n | po k nP
146 Eigene Untersuchungen und Befragungen. 147 Vgl. u.a. BUCHNER, R. (1983/II), S. 486 f.; vgl. SCHULTE, E.B. (1970), S. 91 ff. 148 Die Approximationsbedingungen werden in der Prüfungsliteratur nicht einheitlich festgelegt. Eine Übersicht über einen Teil der in der deutschsprachigen Literatur vorgeschlagenen Approximationsbedingungen findet sich u.a. bei SCHILDBACH, T. (1983), Sp. 1.462 ff. und statistischen Formelsammlungen wie RINNE, H. (2003).
70
3 Grundlagen der Statistik für das Monetary Unit Sampling
3) Normalapproximation mit Stetigkeitskorrektur:149 Approximationsbedingung: 0,1 P 0,9 sowie n ! 30 und
§ k 0,5 n P hy k N ; M ; n | ) ¨ ¨ n P Q N n N 1 ©
· § k 0,5 n P ¸ )¨ ¸ ¨ n P Q N n N 1 ¹ ©
n 0,1 N
· ¸ ¸ ¹
Übertragen auf die Anwendung beim Monetary Unit Sampling sind die Approxi-
M MUS den unbekannten Anteil Y fehlerhafter Elemente in der Grundgesamtheit bezeichnet: mationen analog möglich. Es gilt, wenn P MUS
1) Binomialapproximation: Approximationsbedingung: 0,1 P MUS 0,9 sowie n ! 10 und
hy k MUS Y ; M MUS ; n | bi k MUS P MUS ; n
n 0,1 Y
2) Poissonapproximation: Approximationsbedingung:
P MUS d 0,1 oder P MUS t 0,9 sowie n ! 30 und
n 0,1 Y
hy k MUS Y ; M MUS ; n | po k MUS n P MUS 3) Normalapproximation mit Stetigkeitskorrektur: Approximationsbedingung: 0,1 P 0,9 sowie n ! 30 und
n 0,1 Y
149 Die Stetigkeitskorrektur ist bei der Approximation einer diskreten Verteilung wie z.B. der hypergeometrischen Verteilung durch die stetige Normalverteilung notwendig, da ansonsten die berechnete Wahrscheinlichkeit die tatsächliche Wahrscheinlichkeit unterschätzt.
3.3 Verteilungen von Stichprobenfunktionen
§ k MUS 0,5 n P MUS hy k MUS Y ; M ; n | ) ¨ ¨¨ n P MUS 1 P MUS YY 1n © § k MUS 0,5 n P MUS ) ¨ ¨¨ n P MUS 1 P MUS YY n1 ©
71
· ¸ ¸¸ ¹
· ¸ ¸¸ ¹
In der Prüfungsliteratur wird häufig die Approximation der hypergeometrischen Verteilung durch die Binomialverteilung diskutiert,150 da die zweiparametrige Binomialverteilung die Rechenarbeit im Vergleich zur hypergeometrischen Verteilung reduziert und die Binomialverteilung entsprechend gut tabelliert ist.151 Dabei muss jedoch beachtet werden, dass ein Fehleranteil von 0,1 < P < 0,9, der eine Approximation der hypergeometrischen Verteilung durch die Binomialverteilung rechtfertigt, bei einer Stichprobenprüfung im Rahmen der Jahresabschlussprüfung in den meisten Fällen nicht vorliegt, da in der Prüfungspraxis im Allgemeinen mit sehr kleinen Fehleranteilen (PMUS d 0,1) zu rechnen ist.152 Dennoch kann die Binomialverteilung gerade bei sehr großen Grundgesamtheiten – und bei dem Einsatz von Monetary Unit Sampling in der Jahresabschlussprüfung sind die Grundgesamtheiten meist sehr groß – als Approximationsverteilung sinnvoll im Sinne einer konservativen Schätzung für das Prüffeld eingesetzt werden. Der Vorteil ist jeden Fall die einfachere Handhabung und der Wegfall von Y (=Umfang der Grundgesamtheit) als Funktionsparameter, da dieser von Prüffeld zu Prüffeld variiert. Im Rahmen dieser Arbeit werden daher die Auswertungsberechnungen, die im Monetary Unit Sampling erfolgen, auch auf die Binomialverteilung übertragen, um zu zeigen, dass dies auch eine konservative Schätzung erlaubt. Die Binomialverteilung ist ebenso wie die hypergeometrische Verteilung eine Urnenmodellverteilung. Auch die Binomialverteilung kann durch die drei Kriterien 150 Vgl. u.a. BUCHNER, R. (1983/II) S. 486 f. und die dort angegebenen Quellen. Zur Herleitung der Binomialverteilung als Grenzverteilung der hypergeometrischen Verteilung vgl. WETZEL, W./ JÖHNK, M.-D./ NAEVE, P. (1967), S. 22 ff. 151 Vgl. SCHULTE, E.B. (1970), S. 94 und die dort angegebenen Quellen. 152 Vgl. SPERL, A. (1978), S. 165 f.
72
3 Grundlagen der Statistik für das Monetary Unit Sampling
Zusammensetzung der Urne (dichotom / nicht dichotom);
Modalität der Kugelentnahme (mit Zurücklegen / ohne Zurücklegen);
Abbruchkriterium (fester Stichprobenumfang (n) / zufälliger Stichprobenumfang).
eingeordnet werden. Die Binomialverteilung unterscheidet sich von der hypergeometrischen Verteilung in der Modalität der Kugelentnahme, da bei der Binomialverteilung ein Ziehen mit Zurücklegen erfolgt (fester gleich bleibender Wert von P und Q vor jedem Zug). Der Funktionsparameter P errechnet sich durch: P
M bzw. P MUS N
M MUS . Y
Es liegt eine stochastische Unabhängigkeit der Züge vor, d.h. die Wahrscheinlichkeit eine fehlerhafte Geldeinheit zu finden ist unabhängig davon, ob bereits eine fehlerhafte Geldeinheit im Zug (in den Zügen) davor gefunden wurde oder nicht.153 Damit dies auch beim Ziehen ohne Zurücklegen gilt, denn hier liegt an sich stochastische Abhängigkeit der Züge vor, müssen die Approximationsbedingungen erfüllt sein. Die Wahrscheinlichkeitsfunktion der Binomialverteilung mit Q = 1 – P lautet: bi k P; n
§ n · k n k für k =0,1,...,n °¨ ¸ P Q ®© k ¹ ° 0 sonst ¯
§n· n! als Binomialkoeffizient. mit ¨ ¸ k k n k )! !( © ¹ Die Funktionalparameter ȝ, der Erwartungswert, und ı2, die Varianz, der Binomialverteilung werden wie folgt berechnet.
P
E( X ) n P
V 2 V ( X ) n P (1 P) 153 Vgl. auch für eine illustrierte Darstellung der Unterscheidung zwischen dem Unterschied zwischen Abhängigkeit und Unabhängigkeit BOHLEY, P. (2000), S. 323.
3.3 Verteilungen von Stichprobenfunktionen
73
Die Wahrscheinlichkeit für das Auftreten von höchstens k Erfolgen berechnet sich mit Hilfe der Verteilungsfunktion der Binomialverteilung: 0 ° k ° ®¦ bi i P; n °i 0 °¯ 1
Bi k P; n
für k 0 für 0 d k n für k t n
Wird dies auf das Monetary Unit Sampling, wo Geldeinheiten statt Buchungsbelege gezogen werden, übertragen, so sieht die Wahrscheinlichkeitsfunktion der Binomialverteilung analog aus:
bi k P
MUS
;n
§ n · MUS k MUS n k für k =0,1,...,n °¨ ¸ P 1 P ®© k ¹ ° 0 sonst ¯
Die Funktionalparameter ȝ, der Erwartungswert, und ı2, die Varianz, der Binomialverteilung werden wie folgt berechnet:
P
E ( X ) n PMUS
V2
V (X )
n P MUS 1 P MUS
Die Wahrscheinlichkeit für das Auftreten von höchstens k Erfolgen berechnet sich mit Hilfe der Verteilungsfunktion der Binomialverteilung:
Bi k P MUS ; n
0 ° k ° MUS ®¦ bi i P ; n °i 0 °¯ 1
für k 0
für 0 d k n für k t n
Wird die obengenannte Wahrscheinlichkeitsfunktion eingesetzt, so ergibt sich in einer anderen Schreibweise für die Verteilungsfunktion beim Monetary Unit Sampling.
74
3 Grundlagen der Statistik für das Monetary Unit Sampling
Bi k P MUS ; n
0 °k n ° § · MUS i MUS n i ®¦ ¨ ¸ P 1 P °i 0 © i ¹ ° 1 ¯
für k 0 für 0 d k n für k t n
Die Binomialverteilung ist für den Einsatz im Rahmen des Monetary Unit Sampling durchaus geeignet, jedoch ist die Übertragung auf das Monetary Unit Sampling im Rahmen der Auswertung bis jetzt noch nicht erfolgt. Wie bereits erwähnt, werden im Rahmen dieser Arbeit die typischen Berechnungen des Monetary Unit Sampling zunächst mit der Poisson-Verteilung als die übliche Verteilung durchgeführt, aber anschließend mit eigenen Berechnungen auf Basis der Binomialverteilung verglichen. Da die Grundgesamtheiten im Rahmen der Jahresabschlussprüfungen immer größer werden, führt die Approximation der hypergeometrischen Verteilung durch die Binomialverteilung zu immer kleiner werdenden Unterschieden. Je größer die Grundgesamt, desto geringer ist c.p. dieser Unterschied.154 Für die meisten Prüfungszwecke und auch in den entsprechenden Prüfungssoftwareprodukten wird aber auch die Binomialverteilung, um den Rechenaufwand zu verringern, weiter entweder durch die Poisson-Verteilung oder sehr selten durch die Normalverteilung approximiert. Die Approximation der hypergeometrischen Verteilung bzw. der Binomialverteilung durch die Normalverteilung,155 unter Beachtung der Stetigkeitskorrektur, ist für die Wirtschaftsprüfung nur bedingt verwendbar.156 Ein Fehleranteil zwischen 10 % und 90 %, 154 Vgl. BAMBERG, G. BAUR, F. (2002), S. 102. 155 Zur Herleitung der Normalverteilung als Grenzverteilung der Binomialverteilung vgl. WETZEL, W./ JÖHNK, M.-D./ NAEVE, P. (1967), S. 22 ff. 156 Die Approximationsbedingung n P Q ! 9 für die Approximation der Binomialverteilung durch die Normalverteilung führt bei den meisten praktischen Anwendungen zu großen Stichprobenumfängen, da der Prüfer mit sehr kleinen Fehleranteilen rechnet. Große Stichprobenumfänge sind aber bei der Mehrzahl der Prüfungen aufgrund der wirtschaftlichen und zeitlichen Restriktionen nicht realisierbar, so dass die Normalverteilung nicht vorteilhaft genutzt werden kann (vgl. ROBERTS, D.M. (1978), S. 30 und S. 32 f.). In der Prüfungsliteratur hingegen wird die Normalverteilung oftmals als einzige Verteilung detailliert beschrieben, da sich die Normalverteilung gut zu Demonstrationszwecken eignet und der Bekanntheitsgrad der Normalverteilung sehr groß ist. Dadurch kann aber der Eindruck entstehen, dass die Normalver-
3.3 Verteilungen von Stichprobenfunktionen
75
wie die Approximationsbedingungen es fordern, kann in den meisten Bereichen der Wirtschaftsprüfung, besonders bei Ordnungsmäßigkeitsprüfungen, nicht als Regelfall betrachtet werden.157 Die Anwendung der Normalverteilung bei Grundgesamtheiten mit kleinen Fehleranteilen führt tendenziell zu Unterschätzungen, so dass die Gefahr besteht, ein nicht mehr ordnungsmäßiges Prüffeld als ordnungsmäßig zu beurteilen.158 Die statistische Methodenlehre empfiehlt daher die Anwendung der PoissonVerteilung (SIMEON DENIS POISSON, 1781–1840),159 wenn der Fehleranteil (P d 0,1) klein ist. Bei der Wirtschaftsprüfung kann bei einem guten internen Kontrollsystem i.d.R. mit sehr kleinen Fehleranteilen gerechnet werden. Ein Fehleranteil von P d 0,04 gilt als sehr wahrscheinlich, wenn in dem zu prüfenden Unternehmen ein gut funktionierendes, internes Kontrollsystem installiert ist.160 Daher kann die theoretisch exakte, hypergeometrische Verteilung für die meisten Prüfzwecke durch die Poisson-Verteilung, die auch Verteilung der seltenen Ereignisse genannt wird,161 approximiert werden.162 Die Poisson-Verteilung ist zwar nicht so leicht zu handhaben wie die Normalverteilung, der Rechenaufwand verringert sich aber im Vergleich zu der hypergeometrischen Verteilung bzw. der
157 158 159
160
161 162
teilung eine vorrangige Bedeutung für die Stichprobenprüfung besitzt. Dies ist aber bei den meisten Anwendungen in der Wirtschaftsprüfung nicht der Fall (vgl. SPERL, A. (1978), S. 165 f. Vgl. u.a. BUCHNER, R. (1983/II), S. 490, FN 33 und die dort angegebenen Quellen. Vgl. WYSOCKI, K.v. (1988), S. 192 ff. Die Poisson-Verteilung kann als eigenständige Verteilung eines stochastischen Prozesses, aber auch als Grenzverteilung der hypergeometrischen Verteilung bzw. der Binomialverteilung aufgefasst werden; vgl. RINNE, H./ MITTAG, H.-J. (1995), S. 52 ff.; zur Herleitung der Poisson-Verteilung als Grenzverteilung der Binomialverteilung vgl. WETZEL, W. (1973), S. 101 und SCHULTE, E.B. (1970), S. 95 FN 89. Das interne Kontrollsystem umfasst alle von der Unternehmensleitung festgelegten Grundsätze, Maßnahmen und Verfahren, die u.a. darauf gerichtet sind, die Ordnungsmäßigkeit und Verlässlichkeit der internen und externen Rechnungslegung zu sichern. Vgl. zum Begriff, Ziele, Grundsätze und die Prüfung des internen Kontrollsystems RUHNKE; K.-U./ QUICK, R./ RUHNKE, K. (2007), S. 269 ff. Vgl. MOCHTY, L. (1989), S. 574. Vgl. u.a. WEBER, K. (1972), S. 97 f.
76
3 Grundlagen der Statistik für das Monetary Unit Sampling
Binomialverteilung.163 Die Poisson-Verteilung ist in der Literatur überdies gut tabelliert164 und auch einfach zu programmieren.165 Das Institute of Certified Public Accountants (AICPA) veröffentlicht(e) eine solche Tabelle für die Berechnungen mit dem Monetary Unit Sampling für die Poisson-Verteilung.166 Auch in der Praxis der Jahresabschlussprüfung in Deutschland wird heute meist mit der Approximation durch die Poisson-Verteilung gearbeitet und viele interne Leitlinien für Wirtschaftsprüfer geben stets die Fehlerintensitäten gemäß der Poisson-Verteilung an.167 Die Approximationsbedingungen für die Approximation der hypergeometrischen Verteilung durch die Poisson-Verteilung werden nicht allgemein verbindlich festgelegt; so werden beispielsweise genannt:168 a)
n d 0,1 und n t 30 und P 0,1 N
b)
n d 0, 05 und n t 10 und P 0, 05 N
n t 10 n t 20 n c) d 0, 05 und n t 50 N n t 100
und und und und
P d 0, 01 P d 0, 03 P d 0, 05 P d 0, 08
d) n t 100 und P d 0,1 Die Wahrscheinlichkeit, dass eine Stichprobe des Umfangs n, die aus einer Grundgesamtheit N gezogen wurde, genau k fehlerhafte Elemente enthält, wird mit Hilfe der Wahrscheinlichkeitsfunktion der Poisson-Verteilung wie folgt berechnet: 163 Vgl. WYSOCKI, K.v. (1988), S. 194. 164 Vgl. z.B. die Tabellen bei WETZEL, W./ JÖHNK, M.-D./ NAEVE, P. (1967), S. 86 ff. 165 Vgl. LESLIE, D.A./ TEITLEBAUM, A.D./ ANDERSON, R.J. (1979), S. 70. 166 Vgl. AICPA (1999), S. 109. 167 Eigene Untersuchungen und Befragungen. 168 Vgl. für a) SCHULTE, E.B. (1980), S. 101; vgl. für b) BLEYMÜLLER, J./ GEHLERT, G./ GÜLICHER, H. (1981), S. 55 f. und für c) SPURR, W.A./ BONINI, C.P. (1967), S. 170 und S. 175 ff.; vgl. für d) SCHIRA, J. (2009), S. 355.
3.3 Verteilungen von Stichprobenfunktionen
po k O
O k O ° e für k ® k! ° 0 sonst ¯
77
0,1,..., n
Dabei gilt O n P . Der Funktionsparameter O, der auch Ereignisintensität genannt wird, ist gleichzeitig der Erwartungswert E(X) und die Varianz V(X) einer poisson-verteilten Zufallsvariablen X und somit auch gleichzeitig dann in diesen beiden Fällen Funktionalparameter. Die Funktionalparameter ȝ, der Erwartungswert, und ı2, die Varianz, der Poisson-Verteilung werden wie folgt berechnet.
P V2
E( X )
V (X )
O O
nP nP
n
M N
n
M N
Die Wahrscheinlichkeit für das Auftreten von höchstens k Erfolgen berechnet sich mit Hilfe der Verteilungsfunktion der Poisson-Verteilung: Die zugehörige Verteilungsfunktion lautet:169
Po k O
0 für k 0 °k ° ®¦ po i O für 0 d k d n °i 0 °¯ 1 für k t n
Überträgt man dies auf das Monetary Unit Sampling, sieht die Wahrscheinlichkeitsfunktion der Poisson-Verteilung analog aus. Die Wahrscheinlichkeit, dass eine Stichprobe des Umfangs n, die aus einer Grundgesamtheit von Y Geldeinheiten gezogen wurde, genau k fehlerhafte Geldeinheiten enthält, wird mit Hilfe der Wahrscheinlichkeitsfunktion der Poisson-Verteilung wie folgt berechnet:
po k O
O k O ° e für k ® k! ° 0 sonst ¯
0,1,..., n
169 (k) bezeichnet die größte ganze Zahl, die kleiner oder gleich k ist (sog. Gauß-Klammer), z.B. ist (4,1) = 4, (4) = 4, (–4,1) = –5 und (–4) = –4.
78
3 Grundlagen der Statistik für das Monetary Unit Sampling
Dabei gilt O n PMUS . Der Funktionsparameter O, der auch Ereignisintensität genannt wird, ist gleichzeitig der Erwartungswert E(X) und die Varianz V(X) einer poisson-verteilten Zufallsvariablen X und somit auch gleichzeitig dann in diesen beiden Fällen Funktionalparameter. Die Funktionalparameter ȝ, der Erwartungswert, und ı2, die Varianz, der Poisson-Verteilung werden wie folgt berechnet.
P
E( X )
n P MUS
V 2 V ( X ) n P MUS
n
M MUS Y
n
M MUS Y
Die Wahrscheinlichkeit für das Auftreten von höchstens k Erfolgen berechnet sich mit Hilfe der Verteilungsfunktion der Poisson-Verteilung. Die zugehörige Verteilungsfunktion lautet:
Po k O
0 für k 0 °k ° ®¦ po i O für 0 d k d n °i 0 °¯ 1 für k t n
Übertragen wir diese allgemeinen Ausführungen zum besseren Verständnis auf ein einfaches Beispiel und machen wir uns anhand des Musterkontos (vgl. Tabelle 1) noch mal die einzelnen Größen klar: N = 115
Buchungspositionen, Belege, Rechnungen
Y = 631.054 Summe aller Buchungen, Anzahl aller Geldeinheiten n = 20
Stichprobenumfang (an dieser Stelle angenommen)
Wir unterstellen jetzt, dass die Rechnungen 27, 37 und 61 sich bei einer Prüfung als nicht 100 % fehlerhaft herausstellen würden, d.h. die tatsächliche Rechnungssumme sei Null. Alle anderen Rechnungen werden als korrekt (fehlerfrei) unterstellt. Dann ergibt sich: P
M N
3 115
0, 026
2,6% aller Buchungspositionen sind fehlerhaft
3.3 Verteilungen von Stichprobenfunktionen
79
M MUS 550 765 2 0, 00212 N 620.884 0,212% aller Geldeinheiten sind fehlerhaft. P MUS
Wir berechnen zu Beginn ohne Anwendung des Monetary Unit Sampling die Wahrscheinlichkeit, dass aus dieser Grundgesamtheit mit der Stichprobe des Umfanges n = 20 kein fehlerhafter Buchungsbeleg gefunden wird. hy 0 115;3; 20
3! 112 ! 0! 3! 20! 92! 115! 20! 95!
bi 0 0, 026; 20
20! 20 0, 0260 1 0, 026 0!20!
po 0 0,52
0,520 0,52 e 0!
0,5606
0,595
mit O
0,97420
0,59
20 0,026 0,52
Die Wahrscheinlichkeiten liegen bei diesem einführenden Beispiel schon recht nahe beieinander, aber der Prüfer hat ein Risiko von über 56,06 % auf Basis der exakten Verteilung, dass er aus der fehlerhaften Grundgesamtheit eine Stichprobe zieht, die kein fehlerhaftes Element enthält. Obwohl die Buchungsfehler wertmäßig mit insgesamt 1.317 Euro für die Grundgesamtheit zu vernachlässigen sind, muss dabei beachten werden, dass sich diese Wahrscheinlichkeit (dieses Prüfungsrisiko) auch nicht ändert, wenn beispielsweise statt der Rechnung Nr. 27, 37 und 61 die Rechnungen Nr. 51 bis 53 komplett fehlerhaft sind. In diesem Falle kommt eine Überbewertung des Kontos von 199.546 Euro vor. Selbst eine Erhöhung des Stichprobenumfanges auf n = 40 Stichprobenelemente senkt das Risiko, die fehlerhaften Rechnungen in der Stichprobe nicht zu entdecken, nur auf ca. 27 %. hy 0 115;3; 40
3! 112 ! 0! 3! 40! 72! 115! 40! 75!
0, 2735
80
3 Grundlagen der Statistik für das Monetary Unit Sampling
Dies ist einer der Hauptgründe, warum der Einsatz von wertproportionalen Verfahren für den Einsatz in der Jahresabschlussprüfung so bedeutend ist. Berechnen wir nun für den letzten Fall auf Basis des Monetary Unit Sampling die Wahrscheinlichkeiten mit der exakten hypergeometrischen Verteilung so ergibt sich:170 hy 0 631.054;199.546; 40
199.546! 431.508! 0!199.546! 40! 431.468! 631.054! 40!631.014!
0, 00000025
Das Risiko, dass keine fehlerhafte Geldeinheit in der Stichprobe gefunden wird, liegt bei 0,00002 %. Bei einem Stichprobenumfang von n = 20 beträgt das Risiko auch nur 0,04 % und selbst bei nur 10 ausgewählten Geldeinheiten in der Stichprobe nur bei 2 %. In der Praxis der Jahresabschlussprüfung arbeitet der Prüfer mit größeren Grundgesamtheiten. Daher erfolgen die folgenden Beispielrechnungen nicht mehr anhand des Musterkontos, sondern anhand neuer Werte. Aus einer Grundgesamtheit von N = 10.000 Elementen wird eine Stichprobe des Umfangs n = 100 gezogen. Der Fehleranteil der Grundgesamtheit beträgt P = 3 %, somit sich als Anzahl der fehlerhaften Teile M ein Wert von 300. Bei der Berechnung mit der Poissonverteilung ergibt sich für Ȝ ein Wert von 3.
O 100 0, 03 3 Die Wahrscheinlichkeit eine Stichprobe zu ziehen, die kein fehlerhaftes Element enthält (k = 0), berechnet sich anhand der Formel: po 0 0, 03
30 3 e 0!
0, 0497871
Die exakte Berechnung (einmal mit dem einführenden Ansatz aus Abschnitt 3.3 und einmal mit Hilfe der Wahrscheinlichkeitsfunktion für die hypergeometrische Verteilung) führt bei diesem Beispiel zu folgendem Ergebnis:
170 Die Berechnungen sind mit Hilfe einer Tabellenkalkulation und den entsprechenden Funktionen gut nachzuvollziehen.
3.3 Verteilungen von Stichprobenfunktionen
hy 0 10.000;300;100
81
9.700 9.699 9.698 9.601 ... 10.000 9.999 9.998 9.901 300! 9.700! 0! 300! 100! 9.600! 10.000! 100! 9.900! 0, 046825
Wird die hypergeometrische Verteilung durch die Binomialverteilung approximiert, dann berechnet sich die Wahrscheinlichkeit für eine Stichprobe des Umfanges n = 100, die kein fehlerhaftes Element (k = 0) enthält, folgendermaßen: 100! 100 0, 030 1 0, 03 0!100!
bi 0 0, 03;100
0,97100
0, 04755
Dieses einfache Beispiel zeigt schon, dass die Approximation der hypergeometrischen Verteilung durch die Binomialverteilung bzw. durch die Poisson-Verteilung eine konservative Approximation im Sinne der Wirtschaftsprüfung darstellt. Die Wahrscheinlichkeit, respektive das Risiko des Prüfers, eine Stichprobe, die kein fehlerhaftes Element enthält, aus einer Grundgesamtheit zu ziehen, die fehlerhafte Elemente enthält, wird durch die Poisson-Verteilung bzw. durch die Binomialverteilung überschätzt: 0,0497871
>
Poisson-Verteilung
0,04755251
>
Binomialverteilung
0,046825 Hypergeometrische Verteilung
Für den Fall, dass der Prüfer die Wahrscheinlichkeit für das Auffinden von höchstens einem fehlerhaften Teil, die Wahrscheinlichkeiten mit den drei Verteilungen berechnet, ergeben sich unter Hinzurechnung der Wahrscheinlichkeit für den Fall (k = 1) folgende Wahrscheinlichkeiten: 0,1991
>
Poisson-Verteilung
0,1946
>
Binomialverteilung
0,1931 Hypergeometrische Verteilung
Die Approximation der hypergeometrischen Verteilung durch die Poisson-Verteilung hat nicht unbedingt eine Verringerung der Urteilsqualität zur Folge, wenn bei gleichem Sicherheits- und Genauigkeitsgrad die approximativ verwendete
82
3 Grundlagen der Statistik für das Monetary Unit Sampling
Poisson-Verteilung ceteris paribus zu höheren Stichprobenumfängen führt.171 Der höhere Stichprobenumfang durch Approximation der hypergeometrischen Verteilung durch die Poisson-Verteilung kann vielmehr bei vorgegebener Sicherheit und Genauigkeit zu einer Erhöhung der Urteilsqualität, d.h. zu einer „Sicherheitsreserve“, führen.172 Die Poisson-Verteilung, die auch als Basis der Auswetung für das Monetary Unit Sampling dient, kann somit als konservative (sichere) Approximation der hypergeometrischen Verteilung angesehen und als adäquater Verteilungstyp für Prüfzwecke genutzt werden.173 Übertragen wir jetzt diese Überlegungen auf das Monetary Unit Sampling. Der Prüfer zieht eine Stichprobe des Umfanges n = 100 aus einer Grundgesamtheit Y = 1.000.000 und unterstellen wir, dass der Anteil von fehlerhaften Geldeinheiten auch bei 3 % liegt. Die Wahrscheinlichkeit eine Stichprobe zu ziehen, die kein fehlerhaftes Element enthält (k = 0), berechnet sich anhand der Formel auf Basis der PoissonVerteilung mit wieder der gleichen Berechnung wie vorher: po 0 0, 03
30 3 e 0!
0, 0497871
Da wir auch hier 3 % fehlerhafte Geldeinheiten unterstellen, ergibt sich für den Funktionsparameter Ȝ der Poisson-Verteilung der gleiche Wert wie bei den vorherigen Berechnungen: O 100 0,03 3 Die exakte Berechnung (diesmal direkt über die Wahrscheinlichkeitsfunktion) führt bei diesem Beispiel zu folgendem Ergebnis: hy 0 1.000.000;30.000;100
30.000! 970.000! n! 0! 30.000! 100! 970.000! 1.000.000! r ! n r ! 100! 999.900! 0, 04755
171 Vgl. BUCHNER, R. (1983/II), S. 493 f. 172 Vgl. BUCHNER, R. (1983/II), S. 494. 173 Vgl. LESLIE, D.A./ TEITLEBAUM, A.D./ ANDERSON, R.J. (1979), S. 71.; vgl. SCHULTE, E.B. (1970), S. 96.
3.3 Verteilungen von Stichprobenfunktionen
83
Wird die hypergeometrische Verteilung durch die Binomialverteilung approximiert, dann berechnet sich die Wahrscheinlichkeit für eine Stichprobe des Umfanges n = 100, die kein fehlerhaftes Element (k = 0) enthält, folgendermaßen: bi 0 0, 03;100
100! 100 0, 030 1 0, 03 0!100!
0,97100
0, 04755
Bleiben wir zunächst jedoch bei der in der Literatur typischen Verteilung für Monetary Unit Sampling. Wie oben ermittelt, beträgt die Wahrscheinlichkeit, kein fehlerhaftes Element (k = 0), aus einem Prüffeld mit 3 % fehlerhaften Geldeinheiten bei einer Stichprobe von n = 100 zu ziehen ca. 5 %. po 0 0, 03
30 3 e 0!
0, 0497871 5%
Für den Abschlussprüfer stellt sich aber eine andere Fragestellung: Bei einer Risikovorgabe von 5 % (Į) zieht der Prüfer eine Stichprobe, in der keine fehlerhafte Geldeinheit (Fall 1) gefunden wird. Mit welchem Anteil fehlerhafter Geldeinheiten ist in dem gesamten Prüffeld aufgrund der Wahrscheinlichkeitstheorie dennoch zu rechnen. Im Grunde ist das die gleiche Berechnung nur mit unbekannten Ȝ und dafür schon bekannter Wahrscheinlichkeit !
po 0 100; P 0, 05= P
e n P n P
0
!
e 100 P 0, 05
0! ln(0, 05) / 100 0,02996 3%
Da wir den Parameter P damit schätzen und wir im Monetary Unit Sampling diesen Parameter PMUS nennen, ergibt sich: Pˆ MUS
0, 03
Der Prüfer schätzt nach einer fehlerfreien Stichprobe des Umfanges n = 100 den Anteil der fehlerhaften Geldeinheiten auf 3 %, also schätzt der Prüfer den gesamtem Überbewertungsfehler bei 1.000.000 Geldeinheiten auf 30.000 Geldeinheiten.174
174 Die empirischen Untersuchungen im Rahmen dieser Arbeit im Kapitel 7 legen dar, dass genau die Schätzung bei einer fehlerfreien Stichprobe für viele Abschlussprüfer problematisch ist.
84
3 Grundlagen der Statistik für das Monetary Unit Sampling
Fall 2: In der Stichprobe findet der Prüfer eine vollständig fehlerhafte überbewertete Geldeinheit di / yi
1 .
Bei einem Į-Wert von wieder 5 % – dies entspricht wie auch schon eben einem Konfidenzniveau von (1 – Į ) = 95 % – ergibt sich eine obere Fehleranteilsgrenze von 4,75 % Analog zu Fall 1 errechnet sich die obere Fehleranteilsgrenze anhand der folgenden Berechnungen po 0 100; P po 1 100; P
e n P n P 0!
0
e n P n P
1
1! !
e 100 P e 100 P 100 P 0, 05
Diese Bedingung gilt für PMUS = 0,0475, also schätzt der Prüfer den gesamtem Überbewertungsfehler bei 1.000.000 Geldeinheiten auf 47.500 Geldeinheiten, wenn aus einer Stichprobe des Umfangs n = 100 eine fehlerhafte Geldeinheit gefunden wurde. Liegen in einem Prüffeld sowohl unterbewertete als auch überbewertete Geldeinheiten vor, dann wird zuerst der Anteil P* der fehlerhaften Geldeinheiten in der Grundgesamtheit, getrennt nach Überbewertungen und Unterbewertungen, geschätzt. Der Anteil der überbewerteten Geldeinheiten und der Anteil der unterbewerteten Geldeinheiten werden in einem zweiten Schritt in einen Schätzwert für die Überbewertung und in einen Schätzwert für die Unterbewertung übertragen. Die Schätzgrenze für die Überbewertung und die Schätzgrenze für die Unterbewertung werden abschließend zu einem zweiseitigen Konfidenzintervall für den Gesamt-Soll-Wert X des Prüffeldes verbunden.175 Dabei gilt es seitens des Prüfers zu beachten, dass sich durch die Verbindung der beiden Schätzgrenzen – die Schätzgrenze für die Überbewertung und die Schätzgrenze für die Unterbewertung – die Irrtumswahrscheinlichkeiten der beiden Schätzungen kumulieren. Erfolgt beispielsweise die Schätzung der Unterbewertung und die Schätzung der Überbewertung mit einer Sicherheit von jeweils 95 %, dann liegt der Schätzwert für X mit einer Wahrscheinlichkeit von 90 % im angegebenen Konfidenzintervall.176 Im Rahmen dieser Arbeit werden sich die weiteren Betrachtun175 Vgl. DEINDL, J. (1982), S. 1587; vgl. im Besonderen Abschnitt 6.5. 176 Vgl. NETER, J./ LEITCH, R.A./ FIENBERG, S.E. (1978), S. 89; vgl. ROBERTS, D.M. (1978), S. 125.
3.4 Grundlagen der Testtheorie
85
gen auf die Überwertung konzentrieren, da diese für die verfahrenstypische Anwendung am nächsten an den Anforderungen aus der Praxis liegen. Die Anwendung der Poisson-Verteilung als Approximation der theoretisch exakten hypergeometrischen Verteilung führt zu einer Überschätzung der gesamten Überwertungen. Die Überschätzung wird mit zunehmendem Fehleranteil in der Stichprobe größer. Ferner hat der Prüfer, um Überschätzungen so gering wie möglich zu halten, darauf zu achten, dass der Auswahlsatz (n/N), d.h. das Verhältnis des Stichprobenumfangs zu dem Umfang der Grundgesamtheit, nicht zu groß ist. Für die meisten Prüfungssituationen (kleiner Fehleranteil, kleiner Auswahlsatz) erweist sich die Schätzung unter Verwendung der Poisson-Verteilung als konservativ und damit als sicher.177
3.4 Grundlagen der Testtheorie Monetary Unit Sampling findet im Rahmen der Wirtschaftsprüfung hauptsächlich Anwendung als Schätzverfahren. Theoretisch kann das Monetary Unit Sampling auch als Testverfahren eingesetzt werden. Statistische Testverfahren basieren auf dem Induktionsschluss, d.h. von dem Zustand in der Stichprobe wird auf den Zustand in der Grundgesamtheit geschlossen.178 Der Prüfer formuliert eine, respektive zwei Hypothesen und überprüft anschließend anhand der Stichprobe, ob die aufgestellte Hypothese angenommen werden kann. „Eine statistische Hypothese ist eine Behauptung über Eigenschaften einer oder mehrerer Zufallsvariablen, etwa über die Form ihrer Verteilung (Verteilungshypothesen, ...) oder über deren Parameter (Parameterhypothesen, ...).“ 179
In der Testtheorie wird daher zwischen Anpassungstests und Parametertests unterschieden.180 Zur Veranschaulichung von Testverfahren werden im Rahmen dieser Arbeit werden ausschließlich Parametertests grundlegend beschrieben. Auf der Basis eines statistischen Tests wird überprüft, ob ein Prüffeld als ordnungsmäßig angenommen werden kann oder als fehlerhaft eingestuft wird. Der Prüfer stellt dazu die folgenden Testhypothesen auf. Die Nullhypothese (H0) be177 178 179 180
Vgl. WYSOCKI, K.v. (1988), S. 342. Vgl. SCHILDBACH, T. (1983), Sp. 1459 f. RINNE, H. (1984), S. 113. Vgl. RINNE, H./ MITTAG, H.-J. (1995), S. 112.
86
3 Grundlagen der Statistik für das Monetary Unit Sampling
zeichnet einen Fehleranteil P0, bei dessen Eintreffen der Prüfer das Prüffeld uneingeschränkt als ordnungsmäßig annimmt. Als Gegen- oder Alternativhypothese (H1) bestimmt der Prüfer einen Fehleranteil P1, ab dem der Prüfer das Testat verweigert. P1 wird als die Materiality-Grenze bezeichnet.181 Der Prüfer testet eine einfache Hypothese gegen eine einfache Alternative:182
H0 : P
P0 gegen H1 : P
P1
oder
H0 : P d P0 gegen H1 : P t P1 Da bei der Anwendung des Monetary Unit Sampling der Anteil der fehlerhaften Geldeinheiten geprüft wird und dieser Anteil in ein Fehlerausmaß (= Gesamtüberbewertungsfehler [ÜB]) umgerechnet wird, können daher die folgenden Hypothesen aufgestellt werden:
H 0 : ÜB d M 0 gegen H1 : ÜB t M1 oder
H 0 : ÜB d P0 Y gegen H1 : ÜB t P1 Y Der Prüfer entscheidet dann aufgrund der Stichprobenergebnisse, ob die Nullhypothese angenommen werden kann oder abgelehnt werden muss. Der Prüfer bestimmt dazu einen kritischen Fehleranteil pk bzw. einen kritischen Fehlerbetrag mk, der als Grenzlinie zwischen Annahme- und Ablehnungsbereich der Nullhypothese angesehen werden kann (vgl. Abbildung 15).183 Da der Test und die daraus folgende Entscheidung, ob ein Prüffeld als ordnungsmäßig eingestuft werden kann, auf einer Zufallsstichprobe basiert, kann
181 Vgl. LEFFSON, U. (1988), S. 187. In der Wirtschaftsprüfung wird die MaterialityGrenze so festgelegt, dass der Prüfer diesen Fehleranteil bzw. dieses Fehlerausmaß gerade noch tolerieren würde, ohne zusätzliche Prüfungen einzuleiten. (vgl. ARENS, A.A./ LOEBBECKE, J.K. (1981), S. 136). Die Materiality-Grenze kann somit als Trennlinie zwischen „bedeutend“ und „unbedeutend“ angesehen werden. 182 Vgl. RINNE, H. (1984), S. 116. 183 Vgl. LEFFSON. U. (1988), S. 188.
3.4 Grundlagen der Testtheorie
87
f(p*)
f(p*) Annahme Annahme von H1 H1 von
Annahme Annahme von H0H0 von
pkk Abbildung 15:
p*
p
Annahme- und Ablehnungsbereich der Nullhypothese
der Prüfer die aufgestellte Nullhypothese H0 niemals im erkenntnistheoretischen Sinne verifizieren oder falsifizieren. Die aufgestellte Nullhypothese kann also niemals auf der Basis eines Tests als richtig oder als falsch bewiesen werden. Fehlentscheidungen des Prüfers sind daher möglich. In der Testtheorie werden zwei Arten von Fehlentscheidungen unterschieden. Die Nullhypothese H0 kann aufgrund der Stichprobenergebnisse verworfen werden, obwohl die Nullhypothese tatsächlich zutrifft, d.h. der Prüfer beurteilt ein in Wirklichkeit ordnungsmäßiges Prüffeld als nicht ordnungsmäßig. Diese Fehlentscheidung, das irrtümliche Ablehnen der Nullhypothese, heißt Fehler 1. Art (vgl. Tabelle 3) oder auch D-Fehler (D-Risiko), da die maximale Wahrscheinlichkeit für das Eintreten dieser Fehlentscheidung mit D ausgedrückt wird.184 Das D-Risiko wird in diesem Zusammenhang als das Auftraggeber-Risiko bezeichnet, da ein uneingeschränkter Bestätigungsvermerk zu unrecht nicht erteilt wird.185 Wird im umgekehrten Falle ein nicht ordnungsmäßiges Prüffeld als ordnungsmäßig beurteilt, liegt ein Fehler 2. Art oder ȕ-Fehler vor, wobei ȕ die Wahrscheinlichkeit für den Fehler 2. Art angibt.186 Der Fehler 2. Art stellt das Prüferrisiko dar, da der Prüfer eventuell daraus resultierende Folgen zu verantworten hat. Für die Prüfung wird daher auch dem Fehler 2. Art, dessen Risiko in Abhängigkeit von der Leistungsfähig-
184 Vgl. RINNE, H. (2003), S. 495 ff. 185 Vgl. MAGG, A. (1981), S. 87. 186 Vgl. RINNE, H./ MITTAG, H.-J. (1995), S. 112.
88
3 Grundlagen der Statistik für das Monetary Unit Sampling
Tabelle 3:
Urteilsrisiken bei der Anwendung von Stichprobenverfahren Tatsächlicher Zustand des Prüffeldes
Prüferurteil
Prüffeld ordnungsmäßig
Prüffeld nicht ordnungsmäßig
Prüffeld nicht ordnungsmäßig
Fehlurteil (Fehler 1.Art) Auftraggeberrisiko (Į-Risiko)
zutreffendes Prüferurteil
Prüffeld ordnungsmäßig
Zutreffendes Prüferurteil
Fehlurteil (Fehler 2.Art) Prüferrisiko (ȕ-Risiko)
keit des internen Kontrollsystems zu sehen ist,187 die größere Bedeutung beigemessen, da der D-Fehler meist dann entdeckt wird, wenn das geprüfte Unternehmen Maßnahmen einleitet, um das abgelehnte Prüffeld zu korrigieren. Vorgeschlagen wird aufgrund dieser Überlegung für D einen Wert von 5 % und ȕ einen Wert zwischen 2 % und 5 % vor.188 Neben dieser Festlegung von DMAX und ȕMAX hat der Prüfer vor dem Test den noch akzeptablen Fehleranteil P0 bzw. Fehlerbetrag M0 und den nicht mehr akzeptablen Fehleranteil P1 bzw. Fehlerbetrag M1 zu quantifizieren, da auf der Basis dieser Festlegungen die Berechnung des Stichprobenumfanges erfolgt.189 Der Prüfer unterscheidet die Folgen solcher Fehler anhand der Art des Testes, der durchgeführt wird. In diesem Zusammenhang unterscheidet der Wirtschaftsprüfer zwei Arten von Tests: 1) Compliance-Test Mit einem Compliance-Test will der Revisor prüfen, ob er sich auf das Interne Kontrollsystem (IKS) des zu prüfenden Unternehmens verlassen kann (Nullhypothese), da der Prüfer bei einem positiven Verlauf eines solchen Testes die noch zu erläuternden Substantive-Test reduzieren kann. Bei einem solchen Test wird beispielsweise stichprobenartig überprüft, ob eine verbuchte Rechnung laut des internen Kontrollsystems überprüft wurde.190 187 188 189 190
Vgl. ELLIOT, R.K./ ROGERS, J.R. (1972), S. 48. Vgl. SCHILDBACH, T. (1983), Sp. 1461. Vgl. BOCK; J. (1998), S. 107ff. Prüft der Revisor beispielsweise die Position „Forderungen aus Lieferungen und Leistungen“ so könnte der dazugehörige Compliance-Test überprüfen, ob auf den
3.4 Grundlagen der Testtheorie
89
2) Substantive-Test Mit einem Substantive-Test beurteilt der Wirtschaftsprüfer den Buchwert, um herauszufinden, ob der Istwert „bedeutend“ falsch ist („materially mistaked“) oder ob er die Nullhypothese (H0: EOS d M0 bzw. EUS d M0) annehmen kann. Der D-Fehler (das irrtümliche Verwerfen der Nullhypothese) führt bei einem Compliance-Test dazu, dass der Revisor fälschlicherweise annimmt, dass das interne Kontrollsystem nicht die Erwartungen erfüllt, die der Prüfer bei seiner Prüfungsplanung voraussetzte. Das AICPA nennt dies risk of underreliance on internal control.191 Dies führt zu einer Steigerung der Prüfungskosten, da der Revisor die Substantive-Tests vergrößern muss. Bei den Substantive-Tests führt der D-Fehler (das irrtümliche Verwerfen der Nullhypothese) dazu, dass der gebuchte Betrag von Seiten des Revisors fälschlicherweise revidiert wird. Den neu zu buchenden Betrag muss der Prüfer mit Hilfe einer Schätzung (estimate sampling) ermitteln. Dies bedeutet wiederum, dass der Prüfer vermehrte Revisionskosten verursacht. Diese Kosten können im Vergleich zu den Compliance-Tests bedeutend höher sein. „If the sample results for a compliance test do not support the auditor’s planned reliance on a particular internal accounting control, the auditor considers relying on other internal accountig controls or modifying planned substantive tests to compensate for the reduction or elimination of reliance on that particular internal accounting control. Because an alternative audit approach is readily available, the inconvenience to the auditor and the entity resulting from underreliance on internal accounting control is generally relatively small. However, if the sample results for a substantive test support the conclusion that the recorded account balance or class of transactions is materially misstate when it might not be, the alternative approaches available to the auditor might 192 be more costly.”
Der Revisor muss also bei der Prüfungsplanung abwägen zwischen a) einem großen D-Risiko bei anfänglich geringen Prüfungskosten, aber im Falle eines D-Fehlers hohem Risiko von Folgekosten oder Rechnungen entsprechende Handzeichen der Mitarbeiter vermerkt sind (Evidence of Control) und ob die Daten tatsächlich stimmen (Reperformance of Control). 191 AICPA (1982), S. 11. 192 AICPA (1982), S. 11.
90
3 Grundlagen der Statistik für das Monetary Unit Sampling
b) einem geringen D-Risiko bei anfänglich hohen Prüfungskosten aber im Falle eines D-Fehlers geringem Risiko von Folgekosten. Obwohl das E-Risiko (irrtümliches Akzeptieren der Nullhypothese H0: EOS d M0 bzw. EUS d M0) bedeutend gefährlicher für die Arbeit des Prüfers ist, hat schon diese kurze Darstellung gezeigt, dass auch das D-Risiko kontrolliert werden muss. Jedoch hat das E-Risiko für die Praxis eine erheblich größere Bedeutung. „Beta risk is the statistical risk that the auditor has accepted a population that is actually materially misstated.”193 Ein Unternehmen würde bei einer möglichen Einschränkung oder Ablehnung des Testats auf jeden Fall weitere Prüfungshandlungen veranlassen. Dies führt zwar zu einem erhöhten Prüfungsumfang und damit zu höheren Kosten, die im Falle eines Fehlers erster Art auch nicht ohne Weiteres auf den Mandanten umzulegen sind. Somit hat dieser Fehler hauptsächlich Auswirkungen auf die Wirtschaftlichkeit einer Prüfung, während der Fehler zweiter Art das eigentliche Prüfungsrisiko ist.194 Um die Folgen einer solchen Fehlentscheidung darzustellen, wird auch hier wieder zwischen Compliance-Tests und Substantive-Tests unterschieden. Während der Durchführung eines Compliance-Tests hält der Prüfer bei einer solchen Fehlentscheidung das Interne Kontrollsystem für funktionierend und wird daraufhin möglicherweise z. B. den Stichprobenumfang für den nachfolgenden Substantive-Test verringern. Dies führt zu einem Ansteigen der Wahrscheinlichkeit dafür, dass der Prüfer wesentliche Fehler übersieht und damit Gefahr läuft eine unangemessene Bestätigung des Jahresabschlusses abzugeben. Ein besonderer Test stellt der Sequentialtest im Rahmen der Testtheorie dar. Der Unterschied zu den bisherigen Testverfahren besteht darin, dass nach jedem Zug geprüft wird, ob die Nullhypothese angenommen oder abgelehnt werden kann oder ob noch weitere Stichprobenelemente entnommen werden müssen, um eine Entscheidung zu treffen. Der Wirtschaftsprüfer berechnet einen Annahmebereich für die Nullhypothese und einen Annahmebereich für die Gegenhypothese (= Ablehnbereich der Nullhypothese). Der Bereich dazwischen wird in diesem Zusammenhang als Weiterprüfungsbereich bezeichnet. Der Prüfer erhöht den
193 ARENS, A.A./ LOEBECKE, J.K. (1981), S. 136. 194 Vgl. QUICK, R. (1996), S. 25
3.4 Grundlagen der Testtheorie
91
kumulierte Anzahl direkter Stichprobeneinheiten Ablehngrenze
Ablehnbereich
5 4 3 b
Fortsetzungsbereich 2
Pfad 1
Pfad 2
1 0 10
20
30
40
50
Anzahl geprüfter Einheiten
-1 a
-2
Abbildung 16:
Annahmegrenze
Annahmebereich
Sequenzieller Prüfplan
Stichprobenumfang so lange bis der „Prüfungspfad“ die Ablehn- oder Annahmegrenze schneidet (siehe Abbildung 16).195 Der Stichprobenumfang ist somit die variable Größe bei einem Sequentialtest. Dies wird dadurch erreicht, dass der Wirtschaftsprüfer die beiden Obergrenzen D und E für beide Fehlerwahrscheinlichkeiten (Fehler 1. und 2. Art) vorgibt. Dies führt häufig zu wesentlich geringeren Stichprobenumfängen als bei ähnlichen Nicht-Sequentialtests.196 In der Praxis kann der Einsatz von Sequentialtests dadurch zu einer deutlichen Senkung der Prüfungskosten führen. Im Rahmen dieser Arbeit wird – wie in Literatur zur Anwendung von statistischen Verfahren im Rahmen der Jahresabschlussprüfung üblich – das Risiko Į als das Risiko für die irrtümliche Annahme eines ordnungsmäßigen Prüffeldes bezeichnet. Im Monetary Unit Sampling bezeichnet Į im einfachen Auswertungsmodell das Risiko, eine Stichprobe zu ziehen, die kein fehlerhaftes Element, obwohl das Prüffeld eine bestimmte Fehlerrate enthält. Somit ist das Risiko Į in den weiteren Ausführungen anders definiert als in diesem Abschnitt.
195 Vgl. RINNE, H./ MITTAG, H.-J. (1995), S. 227, aus dem die Abbildung entnommen wurde. 196 Vgl. RINNE, H./ MITTAG, H.-J. (1995), S. 133.
4 Stichprobenziehung im Monetary Unit Sampling 4.1 Grundidee der Ziehung im Monetary Unit Sampling Die Auswahl der Prüfungselemente erfolgt bei der Anwendung des Monetary Unit Sampling nach dem Zufallsprinzip mit größen- bzw. wertproportionaler Auswahlwahrscheinlichkeit der einzelnen Positionen eines Prüffeldes.197 Dies wird dadurch erreicht, dass die Grundgesamtheit nicht mehr als Anzahl von Belegen oder Positionen verstanden wird, sondern die Grundgesamtheit besteht aus einer Summe von Geldeinheiten – dem Gesamtbuchwert. Jeder einzelnen Geldeinheit des Prüffeldes wird eine berechenbare, von Null verschiedene Auswahlwahrscheinlichkeit zugeordnet. Jede Geldeinheit hat die gleiche Wahrscheinlichkeit, in die Auswahl zu gelangen.198 Die ausgewählten Geldeinheiten werden den Positionen zugeordnet, aus denen die Geldeinheiten stammen, d.h., die Auswahl der Prüfungselemente (z.B. der Rechnungen) erfolgt nicht direkt, sondern mit Hilfe der Zufallsauswahl von einzelnen Geldeinheiten. Die einzelne Geldeinheit “acts as a hook and drags a whole account balance.”199 Bildlich gesprochen hat eine wertmäßig große Prüfungsposition viele „Haken“ und damit viele Möglichkeiten, aus der Grundgesamtheit „gefischt“ zu werden.200 Die einzelnen Geldeinheiten bilden also die Auswahleinheiten, die physischen Untersuchungseinheiten sind die einzelnen Inventarpositionen oder Rechnungen.201 Aufgrund dieser Funktionsweise besitzen die Untersuchungseinheiten eine Auswahlwahrscheinlichkeit, die proportional zu deren Ist-Wert ist.202 Diese Eigenschaft wird auch als maximale Schichtung der Grundgesamtheit interpretiert. Dadurch werden die geschichtete Mittelwertschätzung einerseits und die wertproportionale Auswahl anderseits miteinander verbunden. Dies entspricht im 197 198 199 200 201
Vgl. RUHNKE, K./ v. TORKLUS, A. (2008), S. 1119. Vgl. ANDERSON, R./ TEITLEBAUM, A.D. (1973), S. 35. ANDERSON, R./ TEITLEBAUM, A.D. (1973), S. 35. Vgl. GUY, D./ CARMICEL, D./ WHITTINGTON, R. (2002), S. 196 Vgl. DEINDL, J. (1982), S. 1585 und vgl. GLEIM, I.N./ HILLISION, W.A. (1983), S. 487. 202 Vgl. GLEIM, I.N./ HILLISION, W.A. (1983), S. 487. B. Giezek, Monetary Unit Sampling, DOI 10.1007/978-3-8349-6588-2_4, © Gabler Verlag | Springer Fachmedien Wiesbaden GmbH 2011
94
4 Stichprobenziehung im Monetary Unit Sampling
höchsten Maße den Anforderungen und damit auch der Vorgangsweise für eine Abschlussprüfung, da die höherwertigen Vermögensgegenstände durch diese Technik eine höhere Auswahlwahrscheinlichkeit haben. Das größere Risiko (im Rahmen der Überbewertung) eines Vermögensgegenstandes findet sich in höherwertigen Vermögenspositionen, denn in kleinen Positionen können nur wertmäßig kleinere Fehler stecken. Umgekehrt ist dann natürlich zu beachten, dass eine solche Auswahltechnik nur sinnvoll eingesetzt werden kann, wenn im Rahmen der Abschlussprüfung nach Überbewertung gesucht wird. Zielt die Prüfung auf das Auffinden von Unterbewertungen, dann ist das Monetary Unit Sampling das verkehrte Verfahren. Unterbewertungen zeichnen sich eher durch kleinere Beträge aus und im ungünstigsten Fall sogar durch Nullsalden. Diese gelangen auf Basis wertproportionaler Wahrscheinlichkeiten mit einer geringen Wahrscheinlichkeit und im ungünstigsten Fall gibt es eine Auswahlwahrscheinlichkeit von Null. Ein Prüffeld besteht also aus N Elementen (Prüfungsobjekte, Belege, Positionen), deren Wertsumme als Gesamtbuchwert ausgewiesen wird. Diese Summe bezeichnen wir nach wie vor mit Y. Y ist die Summe der Beträge der einzelne Buchungen bzw. deren Buchungswerte.
Y
N
¦y
i
i 1
Dieser Gesamtbuchwert wird jetzt beim Monetary Unit Sampling als „neue“ Grundgesamtheit definiert, so dass damit die Wahrscheinlichkeit für ein Prüfungsobjekt in die Stichprobe zu kommen, proportional zum Buchwert ist. Aus dieser Grundgesamtheit von N Geldeinheiten wird dann eine Stichprobe des Umfanges n Geldeinheiten gezogen. Diese werden dann wieder den Rechnungen, aus denen die einzelnen Geldeinheiten entstammen, zugeordnet. Geprüft wird im auch Monetary Unit Sampling die gebuchte Position. Um die Auswahlmethoden zu demonstrieren, wird im Folgenden auf Basis des bekannten Musterkonto die Stichprobenziehungen durchgeführt. Für eine bessere Übersicht wird dieses Konto noch mal an dieser Stelle ausgewiesen (vgl. Tabelle 4) und um eine kumulierte Version erweitert (vgl. Tabelle 5).
4.1 Grundidee der Ziehung im Monetary Unit Sampling Tabelle 4:
95
Musterkonto für die Stichprobenziehung
Nr.
Buchwert
Nr.
Buchwert
Nr.
Buchwert
Nr.
Buchwert
1
1.069,75 €
30
10.112,00 €
59
14.837,67 €
88
112,75 €
2
12.323,67 €
31
100,00 €
60
12.345,66 €
89
36.724,00 €
3
13.458,87 €
32
220,00 €
61
2,00 €
90
3,60 €
4
7.435,50 €
33
10.980,00 €
62
6.375,00 €
91
2,80 €
5
7.500,00 €
34
9.900,70 €
63
9,88 €
92
4,50 €
6
3.465,50 €
35
6.633,50 €
64
35,98 €
93
77,00 €
7
223,80 €
36
3.524,90 €
65
1.287,10 €
94
321,77 €
8
2.244,00 €
37
765,00 €
66
254,66 €
95
23.580,00 €
9
909,76 €
38
5.790,00 €
67
165,40 €
96
876,45 €
10
345,88 €
39
12,99 €
68
12.798,53 €
97
999,00 €
11
4.423,17 €
40
34,49 €
69
123,99 €
98
4.567,00 €
12
5.720,00 €
41
399,00 €
70
27,99 €
99
49,80 €
13
6.748,30 €
42
3,50 €
71
45,80 €
100
50,20 €
14
1.234,70 €
43
1,99 €
72
87,90 €
101
47,00 €
15
8.746,00 €
44
2,40 €
73
34,00 €
102
1,90 €
16
94,55 €
45
5,70 €
74
2,77 €
103
12.735,00 €
17
12,20 €
46
98,20 €
75
3,44 €
104
14.888,64 €
18
98,77 €
47
444,88 €
76
12,00 €
105
5,67 €
19
1.100,89 €
48
12,30 €
77
111,09 €
106
32,99 €
20
2.370,40 €
49
97,00 €
78
3,00 €
107
37,90 €
21
666,89 €
50
100,00 €
79
12,78 €
108
1.245,67 €
22
735,00 €
51
99.700,00 €
80
912,65 €
109
220,89 €
23
893,40 €
52
50.000,00 €
81
32,98 €
110
37.889,00 €
24
9.999,76 €
53
49.846,00 €
82
57,66 €
111
345,78 €
25
110,56 €
54
432,00 €
83
99,76 €
112
123,98 €
26
443,28 €
55
49.842,00 €
84
145,49 €
113
26.745,00 €
27
555,00 €
56
5.000,70 €
85
44,99 €
114
333,26 €
28
5.730,00 €
57
5.643,99 €
86
12,34 €
115
612,70 €
29
9.837,40 €
58
332,00 €
87
5,00 €
Ȉ
631.054,00 €
96
4 Stichprobenziehung im Monetary Unit Sampling
Tabelle 5:
Kumuliertes Musterkonto für die Stichprobenziehung
Nr. Buchwert (k.)
Nr. Buchwert (k.)
Nr. Buchwert (k.)
Nr. Buchwert (k.)
1
1.069,75 €
30
118.609,00 €
59
433.369,91 €
88
468.532,50 €
2
13.393,42 €
31
118.709,00 €
60
445.715,57 €
89
505.256,50 €
3
26.852,29 €
32
118.929,00 €
61
445.717,57 €
90
505.260,10 €
4
34.287,79 €
33
129.909,00 €
62
452.092,57 €
91
505.262,90 €
5
41.787,79 €
34
139.809,70 €
63
452.102,45 €
92
505.267,40 €
6
45.253,29 €
35
146.443,20 €
64
452.138,43 €
93
505.344,40 €
7
45.477,09 €
36
149.968,10 €
65
453.425,53 €
94
505.666,17 €
8
47.721,09 €
37
150.733,10 €
66
453.680,19 €
95
529.246,17 €
9
48.630,85 €
38
156.523,10 €
67
453.845,59 €
96
530.122,62 €
10
48.976,73 €
39
156.536,09 €
68
466.644,12 €
97
531.121,62 €
11
53.399,90 €
40
156.570,58 €
69
466.768,11 €
98
535.688,62 €
12
59.119,90 €
41
156.969,58 €
70
466.796,10 €
99
535.738,42 €
13
65.868,20 €
42
156.973,08 €
71
466.841,90 €
100 535.788,62 €
14
67.102,90 €
43
156.975,07 €
72
466.929,80 €
101 535.835,62 €
15
75.848,90 €
44
156.977,47 €
73
466.963,80 €
102 535.837,52 €
16
75.943,45 €
45
156.983,17 €
74
466.966,57 €
103 548.572,52 €
17
75.955,65 €
46
157.081,37 €
75
466.970,01 €
104 563.461,16 €
18
76.054,42 €
47
157.526,25 €
76
466.982,01 €
105 563.466,83 €
19
77.155,31 €
48
157.538,55 €
77
467.093,10 €
106 563.499,82 €
20
79.525,71 €
49
157.635,55 €
78
467.096,10 €
107 563.537,72 €
21
80.192,60 €
50
157.735,55 €
79
467.108,88 €
108 564.783,39 €
22
80.927,60 €
51
257.435,55 €
80
468.021,53 €
109 565.004,28 €
23
81.821,00 €
52
307.435,55 €
81
468.054,51 €
110 602.893,28 €
24
91.820,76 €
53
357.281,55 €
82
468.112,17 €
111 603.239,06 €
25
91.931,32 €
54
357.713,55 €
83
468.211,93 €
112 603.363,04 €
26
92.374,60 €
55
407.555,55 €
84
468.357,42 €
113 630.108,04 €
27
92.929,60 €
56
412.556,25 €
85
468.402,41 €
114 630.441,30 €
28
98.659,60 €
57
418.200,24 €
86
468.414,75 €
115 631.054,00 €
29
108.497,00 €
58
418.532,24 €
87
468.419,75 €
4.2 Methoden der Stichprobenziehung im Monetary Unit Sampling
97
4.2 Methoden der Stichprobenziehung im Monetary Unit Sampling 4.2.1 Einfache Zufallsauswahl Um eine einfache203 Zufallsauswahl (Unrestricted Random Selection) von n Elementen zu realisieren, werden die Buchungen der Grundgesamtheit kumuliert.204 Formal wird jeder Buchung j eine bis dahin kumulierte Summe zugeordnet (vgl. Tabelle 5): j
Yj
¦y
i
i 1
Die bereits vorher definierte Summe Y ist in diesem Fall also YN. Aus dem Intervall [1;YN] sind dann die Zufallszahlen (ZZ) zu ermitteln. Ein Element j gelangt in die Stichprobe, wenn folgendes gilt: Y j 1 ZZ d Y j
In den frühen Werken205 zum Monetary Unit Sampling werden die Verfahren aufgrund der damals noch nicht so ausgeprägten technischen Unterstützung auf verschiedenartigen Weisen (meist Tabellen) dargestellt,206 jedoch ist das Grundprinzip der Auswahl und das weitere Vorgehen das Gleiche. Wird eine Zufallszahl (ZZ) z.B. mit Hilfe einer Tabellenkalkulationssoftware von bspw. 20.125 ermittelt, dann kommt dadurch die Geldeinheit 20.125 in die Stichprobe. Der Prüfer wählt dann die Rechnung aus, in denen diese Geldeinheit enthalten ist. In unserem Testkonto wird dann die Prüfungsposition Nr. 3 ausgewählt. Ein Nachteil dieser Methode liegt darin, dass der vorgegebene und geplante Stichprobenumfang des Umfanges n in vielen Fällen größer ist als die tatsächliche Anzahl der zu prüfenden Positionen, wenn jede Buchung nur einmal in die
203 In der Literatur wird auch der Begriff der reinen oder uneingeschränkten Zufallsauswahl in diesem Zusammenhang gebraucht. 204 Vgl. LESLIE, D.A./ TEITLEBAUM, A.D./ ANDERSON, R.J. (1979), S. 100. 205 Vgl. NETER, J./ LEITCH, R.A./ FIENBERG, S.E. (1978), S. 79. 206 Vgl. NETER, J./ LEITCH, R.A./ FIENBERG, S.E. (1978), S. 79.
98
4 Stichprobenziehung im Monetary Unit Sampling
Stichprobe gelangen soll. Eine Prüfungsposition j kann zufällig mehrmals in die Auswahl geraten, wenn es mehrere Zufallszahlen gibt, für die gilt: Y j 1 ZZ d Y j
Für den Prüfer gibt es zwei Möglichkeiten darauf zu reagieren. Zum Einen wird eine Prüfungsposition, die bereits ausgewählt ist, nicht nochmal berücksichtigt – also ein Ziehen ohne Zurücklegen im übertragenen Sinne. In der Praxis, in der Literatur und auch in den Handbüchern der dafür verwendeten Softwarepakete (wie ACL oder IDEA) wird zum Anderen jedoch empfohlen, die ausgewählten Elemente mehrmals zu verwenden. Dies wird auch bei den späteren Simulationen (vgl. Kapitel 5) so erfolgen. Ein zusätzlicher Nachteil der reinen Zufallsauswahl liegt in der Gefahr, dass große Rechnungen, die u.U. Überbewertungen enthalten könnten, nicht in die Stichprobe gelangen.207 In diesem Fall kommt die Vorteilhaftigkeit des Monetary Unit Sampling gegenüber den nicht-wertproportionalen Stichprobenverfahren nur zum Teil zum Tragen. Um ein solches Risiko zu vermeiden und Überbewertungen, die ein bestimmtes Ausmaß übersteigen, zu entdecken, verwendet der Prüfer in der Praxis systematische Auswahltechniken bzw. werden Prüfungspositionen einer bestimmten Größe erst gar nicht stichprobenartig, sondern als Einzelfall geprüft.208 4.2.2 Systematische Auswahl mit Zufallsart Vor der systematischen Auswahl mit Zufallsstart (Fixed Intervall Systematic Selection) werden die einzelnen Positionen des Prüffeldes addiert. Im Anschluss daran berechnet der Prüfer das Stichprobenintervall oder Entnahmeintervall. Ausgehend vom Gesamtbuchwert, der Summe Y, wird unter Beachtung des geplanten Stichprobenumfanges das Stichprobenintervall I ermittelt.
207 Vgl. WURST, J. NETER, J., GODFREY, J. (1989/I), S. 200. 208 Vgl. LESLIE, D.A./ TEITLEBAUM, A.D./ ANDERSON, R.J. (1979), S. 108 f.; vgl. GARSTKA, S.J./ OHLSON, P.A. (1979), S. 36; vgl. McRAE, T.W. (1974), S. 206 f.; vgl. ANDERSON, R./ TEITLEBAUM, A.D. (1973), S. 35; vgl. ARENS, A.A./ LOEBBECKE, J.K. (1981), S. 34.
4.2 Methoden der Stichprobenziehung im Monetary Unit Sampling
99
N
I
Y n
¦y
i
i 1
n
Aus dem Intervall [1;I – 1] wird folgend eine Zufallszahl (ZZ) ermittelt. Ein Element j gelangt in die Stichprobe, wenn die Prüfungsposition die folgenden Geldeinheiten enthalten: ZZ , ZZ I , ZZ 2 I , ZZ 3I , ZZ 4 I , ..... , ZZ ( n 1 )I Unter der Annahme, dass im Vorfeld aus dem Konto nicht schon bestimmte wertmäßig große Prüfungspositionen aussortiert wurden,209 gelangen alle Prüfungspositionen in die Stichprobe, für die gilt: yi t I Damit können insbesondere große Prüfungspositionen, in denen große Überbewertungen enthalten seinen könnten, mit einer Auswahlwahrscheinlichkeit von Eins in die Stichprobe gelangen. Untersuchungen haben jedoch gezeigt, dass trotz dieses Vorteiles bei ungewöhnlichen Fehlerverteilungen im Prüffeld, dieses Verfahren Risiken in sich birgt.210 Diese Prüfungspositionen (ab der bestimmten Summe), die über dem Intervall I liegt, könnten im Unternehmen schon besondere Kontrollen im Vorfeld durchlaufen, während u.U. die Positionen, die geringer sind, diese nicht durchlaufen. Damit will das Unternehmen sicher stellen, dass bei dieser Auswahltechnik die Anzahl von Fehler in der Stichprobe möglichst Null werden soll. Im Rahmen der Simulation (vgl. Kapitel 5) kann aber gezeigt werden, dass auch eine ausreichende Zahl zufällig gezogener kleiner Rechnungen, die keine besonderen Kontrollen durchlaufen, gezogen werden. Generell ist natürlich aber eine besonders intensive Prüfung der Positionen im Vorfeld durch das Unternehmen durchaus sinnvoll und aus der Sicht der Jahresabschlussprüfung durchaus wünschenswert. Auch bei dieser Auswahltechnik besteht wei209 Eigene Untersuchungen und Befragungen sowohl in großen als auch in mittleren Gesellschaften. Viele Gesellschaften haben in ihren internen Prüfungsregeln schon vermerkt, dass Rechnungen ab einem bestimmten Wert vorher gesondert geprüft werden (siehe auch Abschnitt 4.2.4). In der Literatur wird dies erst in jüngster Zeit berücksichtigt. 210 Vgl. APOSTOLOU/ ALLEMAN (1991), S. 72.
100
4 Stichprobenziehung im Monetary Unit Sampling
terhin der Nachteil, dass der vorgegebene und geplante Stichprobenumfang des Umfanges n in vielen Fällen größer ist als tatsächliche Anzahl der zu prüfenden Positionen. Es gilt jedoch das Gleiche wie bei der einfachen Zufallsauswahl. Eine Prüfungsposition j wird mit Sicherheit mehrmals in die Auswahl geraten, für die gilt: yi t 2 I Bei der systematischen Auswahl mit Zufallsstart ist es dem Prüfer aufgrund der Beziehung N
I
y n
N
¦y
i
i 1
n
nmin
Y I
¦y
i
i 1
I
möglich, den Stichprobenumfang so zu bestimmen, dass Überbewertungen im Prüffeld, die ein bestimmtes, vorher festgelegtes Ausmaß (hier vereinfacht wieder I genannt) überschreiten, auf jeden Fall entdeckt werden. Auf Basis des Musterkontos kommt dann bspw. bei einer Intervalllänge von 31.553211die Rechnungen Nr. 51–53 mit einer Wahrscheinlichkeit von Eins in die Stichprobe. 4.2.3 Variable Intervallziehung Bei der variablen Intervallziehung werden die beiden bisher beschriebenen Verfahren kombiniert. Es wird zunächst wieder ein Intervall I mit der folgenden Bedingung festgelegt: N
I
Y n
¦y
i
i 1
n
Anschließend werden aber für das weitere Vorgehen gleichverteilte Zufallszahlen aus dem Intervall (0;1) ermittelt, um damit dann variierende Intervalle zu generieren.212 Somit wird quasi eine einfache Zufallsstichprobe simuliert. Zunächst werden dafür die variablen Stichprobenintervalle VIi ermittelt:
211 Wir unterstellen vereinfachend einen Stichprobenumfang von n = 20. 212 Vgl. LESLIE, D.A./ TEITLEBAUM, A.D./ ANDERSON, R.J. (1979), S. 101.
4.2 Methoden der Stichprobenziehung im Monetary Unit Sampling
101
I ln( ZFi )
VI i
Im Folgenden werden die so gebildeten variablen Stichprobenintervalle VIi werden Schritt für Schritt aufaddiert und nach jeder Summenbildung kommt das entsprechende Element in die Stichprobe. Durch die Zufälligkeit der Stichprobenintervalle variiert bei dieser Methode aber auch der tatsächliche Stichprobenumfang, auch wenn er im Mittel dem geplanten Stichprobenumfang entspricht (vgl. Kapitel 5). 4.2.4 Zellenauswahl Bei der Zellenauswahl (cell selection) wird das Prüffeld in einzelne, gleich große Zellen eingeteilt (vgl. Abbildung 17). Die Größe Z einer Zelle ergibt sich auch hier aus dem Quotienten des Gesamtbuchwertes und des geplanten Stichprobenumfanges n: N
Z
I
Y n
¦y
i
i 1
n
Aus jeder dieser n Zellen wird dann wieder auf Basis von Zufallszahlen zwischen 1 und I eine Geldeinheit ausgewählt. Der geringste Abstand zwischen zwei ausgewählten Geldeinheiten kann eine Geldeinheit,213 der größte Abstand (2 I – 1) Geldeinheiten betragen.214 Unter der Annahme, dass im Vorfeld aus dem Konto nicht schon bestimmte wertmäßig große Prüfungspositionen aussortiert wurden,215 gelangen alle Prüfungspositionen in die Stichprobe für die gilt: yi t ( 2 I 1 )
213 Die eine ausgewählte Geldeinheit ist die letzte Geldeinheit einer Zelle, und die zweite ausgewählte Geldeinheit bildet die erste Geldeinheit der darauffolgenden Zelle. 214 Die eine ausgewählte Geldeinheit ist die erste Geldeinheit einer Zelle, und die zweite ausgewählte Geldeinheit bildet die letzte Geldeinheit der darauffolgenden Zelle. 215 Eigene Untersuchungen und Befragungen sowohl in großen als auch in mittleren Gesellschaften. Viele Gesellschaften haben in ihren internen Prüfungsregeln schon vermerkt, dass Rechnungen ab einem bestimmten Wert vorher gesondert geprüft werden. In der Literatur wird dies erst in jüngster Zeit berücksichtigt.
102
4 Stichprobenziehung im Monetary Unit Sampling
GE1
A1
GE2
A2
Zelle 1 Abbildung 17:
A3
GE3
A4
Zelle 2
Allgemeine Darstellung der Zellenauswahl
Durch die zufällige Auswahl der Geldeinheiten innerhalb der Zellen können eventuelle Verzerrungen oder Manipulationen, wie sie bei einer systematischen Auswahl möglich sind, verringert werden. Da aber die Wahrscheinlichkeit für eventuelle Verzerrungen und Manipulationen aufgrund der Auswahl anhand von Geldeinheiten bei der Anwendung von Monetary Unit Sampling gering ist, wurde in der Praxis das Verfahren der systematischen Auswahl schon hinsichtlich der einfachen Durchführung zu Beginn bevorzugt. Mittlerweile sind nicht zuletzt durch die eingesetzten Software Programme wie IDEA oder ACL viele Prüfungsgesellschaften jedoch dazu übergegangen, das Zellenverfahren zu empfehlen bzw. teilweise sogar vorzuschreiben.216 4.2.5 Siebverfahren Das Siebverfahren (sieve sampling217) fand zunächst als Auswahlmethode, die mittlerweile auch schon seit 30 Jahren218 in der Literatur zu finden ist, wenig Beachtung. Der Hauptgrund lag darin, dass der geplante Stichprobenumfang aufgrund der Methodik dieses Verfahrens nicht immer dem tatsächlichen Stichprobenumfang (auch wenn ausgewählte Geldeinheiten aus einer Prüfungsposition mehrmals genommen werden) entsprach und somit der Prüfer noch 216 Eigene Untersuchung und Befragungen. 217 Vgl. HORGAN, J.M. (1997), S. 42. 218 Entwickelt wurde das Verfahren ursprünglich von REITVELD, C. (1978, 1979a, 1979) und wurde in drei zusammenhängenden Aufsätzen dargestellt.
4.2 Methoden der Stichprobenziehung im Monetary Unit Sampling
103
zusätzliche Elemente „nachziehen“ musste. Dies machte das Verfahren für den praktischen Einsatz erst einmal ungeeignet, obwohl es in der Umsetzung einfach durchzuführen ist. Die Grundgesamtheit kann hier wieder wie bei den klassischen Stichprobenverfahren als eine Menge von Rechnungen aufgefasst werden.219. An sich wird aber auch bei dieser Auswahlmethode letztendlich wieder eine Geldeinheit ausgewählt. Daher kann das Verfahren eher als eine Art modifizierte Methode des Monetary Unit Sampling angesehen werden, denn eine Summenbildung im Konto ist nicht mehr notwendig. Ferner werden die späteren Prüfungselemente so zu sagen durch „Ziehen ohne Zurücklegen“ ermittelt. Zunächst werden aus der Grundgesamtheit die Einheiten aussortiert, die aufgrund ihres besonderen Risikos einer Einzelfallprüfung unterzogen werden. Unterstellen wir hierzu eine Anzahl von R Elementen, so besteht die Grundgesamtheit anschließend aus (N – R) Elementen. Die Summe Y* besteht dann nur noch aus der Buchsumme der (N – R) Elemente: Y*
N
R
¦y ¦y i
i 1
j
j 1
Anschließend wird ein geplanter Stichprobenumfang nPLAN festgelegt. Auf Basis dieser Größe werden N Zufallszahlen (ZZi) ermittelt, für die gilt: 0 ZZ i d
Y* nPLAN
Eine Rechnung bleibt im „Sieb“ hängen, d.h., sie kommt in die Stichprobe, wenn für diesen i-ten Beleg gilt ZZ i d yi Werden die Zufallszahlen aus einer einem gleichverteilten Intervall [0;1] gezogen, dann lautet die Bedingung: ZZ i
Y* d yi nPLAN
219 Vgl. GILL, R.D. (1983), S. 1.
104
4 Stichprobenziehung im Monetary Unit Sampling
Rechnungen, die diese Bedingungen nicht erfüllen, fallen durch das Sieb und werden nicht in der Stichprobe berücksichtigt. Im zweiten Schritt werden dann auf Basis der Zufallszahlen die entsprechenden Geldeinheiten für die eigentliche Stichprobe entnommen. Da die Geldeinheiten nur aus den Rechnungen entnommen werden, die im Sieb verbleiben, variiert die Zahl der zu prüfenden Geldeinheiten sehr stark. In frühen Tests schwankte bei einem geplanten Stichprobenumfang von nPLAN = 60 der tatsächliche Stichprobenumfang zwischen 36 und 85.220 Bei eigenen Simulationen (vgl. Abschnitt 5.5) schwankte der Stichprobenumfang, jedoch nicht in diesem Maß. Bei einem geplanten Stichprobenumfang von 100 ergaben sich Werte zwischen 87 und 119.221 Allerdings ist der tatsächliche Stichprobenumfang – auch aufgrund eigener Untersuchungen – ein unverzerrter Schätzer für den geplanten Stichprobenumfang n.222 E( n ) nPLAN Jedoch zeigt sich auch bei den Auswertungen, dass die errechneten Intervalle deutlich stärker variieren als bei den anderen Auswahlmethoden.223 4.2.6 Modifiziertes Siebverfahren Um das Problem der Schwankungen in den Stichprobenintervallen zu vermeiden, kann der Prüfer unter bestimmen Voraussetzung ein modifiziertes Stichprobenverfahren nutzen. Wir unterstellen zunächst wieder, dass aus der Population der N Prüfungspositionen die R besonders großen oder qualitativ risikobehafteten Element aus der Grundgesamtheit entnommen werden, so dass die Grundgesamtheit nur noch aus (N – R) Prüfungspositionen besteht. Die Summe dieser Position bezeichnen wir wieder mit Y*: Y*
N
i
i 1
220 221 222 223
R
¦y ¦y
j
j 1
Vgl. HORGAN, J.M. (1997), S. 45. Eigene Simulationen in Kapitel 5. Vgl. HOOGDUIN, L.A./ HALL, T.W./ TSAY, J.J. (2008), S. 8. Vgl. WURST, J./ NETER, J./ GODFREY, J. (1989/II), S. 245.
4.2 Methoden der Stichprobenziehung im Monetary Unit Sampling
105
Für die verbleibenden (N – R) Positionen wird für jede einzelne Position i eine Zufallszahl ZZi gezogen. Anschließend wird für jede Position i ein sogenannter Siebquotient (SQi) gebildet: SQi
yi ZZ i
Dann werden die Siebquotienten in absteigender Reihenfolge sortiert und es werden dann die ersten nPLAN Elemente genommen und damit die dazu gehörigen Prüfungspositionen ausgewählt. Somit ist sichergestellt, dass der geplanten Stichprobenumfang n dem tatsächlichen Stichprobenumfang entspricht.224 4.2.7 Lahiri-Auswahl Wie bereits erwähnt, führt das Siebverfahren zu unterschiedlichen Stichprobenumfängen und birgt daher die Gefahr, dass der tatsächliche Stichprobenumfang deutlich geringer ist als der geplante Stichprobenumfang. Für den Prüfer stellt sich dann die Frage, wie die fehlenden Prüfungspositionen aufgefüllt werden können. Eine Möglichkeit zeigt ein von Horgan am Ende der neunziger Jahre für den Wirtschaftsprüfungsbereich übertragenes Stichprobenverfahren von Lahiri aus den fünfziger Jahren.225 Auch bei diesem Verfahren werden an sich nicht direkt Geldeinheiten, sondern im ersten Schritt die Prüfungspositionen betrachtet. Unterstellen wir vereinfachend, dass der Prüfer keine Vorauswahl aus den N Prüfungspositionen getroffen hat. Die Auswahl der n Elemente bei direkter Anwendung der Lahiri-Methode oder der (nPLAN-nSIEVE) Elemente als Anschlussverfahren an die Siebmethode erfolgt dann nach folgendem Algorithmus. N
1. Schritt: 2. Schritt: 3. Schritt:
¦y
i Y i 1 n n Bilde eine Zufallszahl zwischen 1 und N, um eine Prüfungsposition aus den N Elementen zu ermitteln.
Berechne das Intervall I
Bilde eine Zufallszahl ZZi zwischen 1 und I!
224 Vgl. HOOGDUIN, L.A./ HALL, T.W./ TSAY, J.J. (2008), S. 8. 225 Vgl. HORGAN, J.M. (1997), S. 41.
106
4 Stichprobenziehung im Monetary Unit Sampling
4. Schritt:
Wenn yi ZZi gilt, wenn wähle die Prüfungsposition i für die Stichprobe.
5. Schritt:
Ist der Stichprobenumfang n bzw. (nPLAN-nSIEVE) erreicht? Wenn nein, dann fahre fort mit Schritt 2. Wenn ja, dann ist die Auswahl beendet.
4.3 Der Vergleich von Monetary Unit Sampling mit nicht wertproportionalen Auswahlverfahren Die Besonderheiten des Monetary Unit Sampling im Vergleich zu den nicht wertproportionalen Auswahlverfahren (Unstratified Physical Unit Sampling) lassen sich am Besten anhand eines einfachen Beispiels aus dem ersten großen Werk zum Monetary Unit Sampling und einer darin beschriebenen einfachen Zufallsauswahl aufzeigen.226 Im Rahmen der Simulation von Abschnitt 5 wird auch mit realen Datensätzen auf diesen Unterschied besonders eingegangen. Das in Tabelle 6 dargestellte Konto (auf Basis der angegebenen Quelle)227 soll mit beiden Verfahren geprüft werden. Die 1.000 Rechnungen des Kontos werden mit Hilfe einer Stichprobe von n = 100 geprüft. Bei den bisher bekannten Auswahlverfahren, wie z.B. die Verfahren mit gleichen Auswahlwahrscheinlichkeiten, werden die 100 Untersuchungselemente ohne Berücksichtigung des Rechnungswertes aus den N = 1.000 Rechnungen ausgewählt. Dies kann z.B. mit Hilfe einer Tabelle vierstelliger Zufallsziffern zwischen 0001 und 1000 oder mit dreistelligen Zufallszahlen (001, ..., 999, 000) erfolgen. Bei der Anwendung des Monetary Unit Sampling hingegen besteht die Grundgesamtheit, aus der ausgewählt wird, nicht aus N = 1.000 Rechnungen, sondern aus Y = 597.700 einzelnen Geldeinheiten (GE), aus denen zufällig n = 100 Geldeinheiten ausgewählt werden. Dies kann z.B. mit Hilfe von sechsstelligen Zufallsziffern zwischen 000001 und 597.700 erfolgen. Unterstellen wir für unser Beispiel, dass die n = 100 aus-
226 Vgl. LESLIE, D.A./ TEITLEBAUM, A.D./ ANDERSON, R.J. (1979), S. 85 ff. Das Buch wird mittlerweile nicht mehr gedruckt und erreicht unter interessierten Forschern und Sammlern mittlerweile Preise von über 300 Euro. 227 Vgl. auch eigene Simulationen in Kapitel 5.
4.3 Der Vergleich von Monetary Unit Sampling Tabelle 6:
107
Musterkonto von Leslie, Teitlebaum & Anderson
Schicht Nr.
Anzahl der Rechnungen pro Schicht
1
180
97,00
75,35
13.563,00
2
205
195,00
162,00
33.251,00
3
174
307,00
240,00
41.760,00
4
125
518,00
408,00
51.000,00
5
105
1.005,00
864,20
90.741,00
6
98
1.435,00
1.212,88
118.862,00
7
54
1.970,00
1.725,35
93.169,00
8
37
2.304,00
2.135,27
79.005,00
9
13
3.401,00
3.103,77
40.349,00
10
9
6.112,00
4.000,00
36.000,00
Ø 597,70
597.700,00
1.000
Höchster Rechnungswert in Geldeinheiten
Durchschnittlicher Rechnungswert
Summe der Berechnungen in Geldeinheiten
gewählten Geldeinheiten aus 100 verschiedenen Rechnungen stammen, so enthält zwar jetzt jede Stichprobe 100 Rechnungen, doch die Zusammensetzungen der Stichproben unterscheiden sich gravierend voneinander (siehe Tabelle 7). Bei der Anwendung des Monetary Unit Sampling ist im Durchschnitt jede 5.977. Geldeinheiten (Dollar oder Euro o.ä.) ausgewählt worden. Man spricht in diesem Zusammenhang von dem durchschnittlichen Stichprobenintervall [I] (Average Sampling Interval). In diesem Beispiel beträgt das durchschnittliche Stichprobenintervall [I] 5.977 Geldeinheiten. Da die Auswahl bei der Anwendung des Monetary Unit Sampling anhand der Geldeinheiten erfolgt, erhalten die großen Rechnungen eine höhere Auswahlwahrscheinlichkeit und werden daher eher ausgewählt. Die detaillierte Zusammensetzung des Datensatzes ist den Originalquellen nicht zu entnehmen. Bei den Verfahren mit gleicher Auswahlwahrscheinlichkeit der Untersuchungseinheiten wird jede 10. Rechnung unabhängig ihres Ist-Wertes ausge-
108
4 Stichprobenziehung im Monetary Unit Sampling
Tabelle 7:
Schicht
Stichprobenzusammensetzung im Musterkonto Leslie, Teitlebaum & Anderson Monetary Unit Sampling (einfache Zufallsauswahl)
Klassische Verfahren (einfache Zufallsauswahl)
1
2
18
2
6
20
3
7
17
4
9
13
5
15
11
6
20
10
7
15
5
8
13
4
9
7
1
10
6
1
100
100
wählt. Es besteht bei diesem Verfahren das Risiko, dass wertmäßig große Positionen nicht geprüft werden. Damit eine größere Anzahl an Rechnungen in die Auswahl gelangt, müsste der Prüfer eine vorherige Schichtung der Grundgesamtheit vornehmen.228 Eine Schichtung ist aber für den Prüfer mit zusätzlichen Kosten verbunden. Für die Anwendung des Monetary Unit Sampling ist die vorherige Schichtung nicht notwendig. Auch die Auswertung der Stichprobenergebnisse (vgl. auch Kapitel 6) unterscheidet Monetary Unit Sampling von den anderen Verfahren der Attributenprüfung. Nehmen wir für unser Beispiel an, dass in beiden Stichproben keine fehlerhafte Untersuchungseinheit entdeckt wurde. Bei beiden Verfahren wird eine Fehlerobergrenze (FOB) auf der Basis der Poisson-Verteilung berechnet. Es ergibt sich bei einer Sicherheit von 95 % eine obere Fehleranteilsgrenze von 3 %. Bei der Anwendung des klassischen Verfahrens kann der Prüfer mit einer Sicherheit von 95 % nur aussagen, dass maximal 3 % von 1.000 Rechnungen, also 30 Rechnungen fehlerhaft sind. Für den Prüfer stellt sich aber anschließend die Frage der Bewertung dieser 30 Rechnungen: 228 Vgl. ROBERTS, D.M. (1978), S. 95.
4.3 Der Vergleich von Monetary Unit Sampling
109
1) Bewertung mit dem durchschnittlichen Rechnungsbetrag:229 30 597, 70 17.931, 00
Bewertung mit dem Betrag der 30 größten Rechnungen: Die 30 größten Rechnungen haben einen Ist-Wert von zusammen ungefähr 95.000,00 Geldeinheiten.230 Für viele Prüfungssituationen trifft sicher die erste Bewertung zu, jedoch kann der Prüfer nicht ausschließen, dass auch die Rechnungen mit einer großen Rechnungssumme fehlerhaft sind. Im Falle der zweiten Bewertung beurteilt der Prüfer in der Regel das Prüffeld zu kritisch. Es besteht daher die Gefahr, dass der Prüfer ein Prüffeld, das noch ordnungsmäßig ist, als nicht ordnungsmäßig ablehnt. Um die Aussagen zu präzisieren, ist es daher erforderlich, den Stichprobenumfang zu erhöhen.231 Dies wiederum ist unter Kostengesichtspunkten schwer umsetzbar. Bei der Anwendung des Monetary Unit Sampling stellt sich das Problem der Bewertung nicht, da der Prüfer eine obere Anteilsgrenze der fehlerhaften Geldeinheiten berechnet, so dass der Fehler direkt in Geldeinheiten ausgedrückt werden kann: 3% von 597.700 Geldeinheiten = 17.931 Geldeinheiten Der Prüfer kann also für dieses Beispiel mit einer Sicherheit von 95 % folgern, dass die Abweichung des Prüffeldes kleiner als 17.931,00 Geldeinheiten ist. Monetary Unit Sampling ermöglicht dem Prüfer also unmittelbar eine betragsmäßige Auswertung, ohne dabei auf die Vorteile der einfachen Anwendung einer Attributenprüfung zu verzichten.
229 Der durchschnittliche Rechnungsbetrag sind 597,70 GELDEINHEITEN (Tabelle 6). 230 Ist eine dieser 30 Rechnungen in die Stichprobe gelangt und wurde diese Rechnung daher geprüft und laut Annahme als fehlerfrei beurteilt, so wird der Betrag dieser Rechnung nicht bei der Bewertung berücksichtigt, sondern der Prüfer nimmt stattdessen den Betrag der nächst kleineren Rechnung in die Bewertung, falls diese Rechnung nicht geprüft wurde, solange bis 30 Beträge addiert wurden. 231 Vgl. LESLIE, D.A./ TEITLEBAUM, A.D./ ANDERSON, R.J. (1979), S. 91.
110
4 Stichprobenziehung im Monetary Unit Sampling
4.4 Beurteilung der wertproportionalen Zufallsauswahl Die wertproportionale Zufallsauswahl der Untersuchungseinheiten unterstützt den Prüfer in dem Anliegen, möglichst Positionen mit einem großen Ist-Wert in die Auswahl zu bekommen, da große Positionen auch wertmäßig große Fehler enthalten können. Die wertproportionale Zufallsauswahl der Untersuchungseinheiten wird daher als mathematische Weiterentwicklung des cut-off-Verfahrens angesehen.232 Die wertproportionale Zufallsauswahl führt dazu, dass überbewertete Positionen eine hohe Auswahlwahrscheinlichkeit besitzen, während unterbewertete Positionen eine geringe Auswahlwahrscheinlichkeit aufweisen. Bei der Prüfung von Aktiva ist der Prüfer schon aus Gläubigerschutzinteressen besonders an der Entdeckung von Überbewertungen interessiert. Die wertproportionale Zufallsauswahl, respektive das Monetary Unit Sampling unterstützt effizient dieses Anliegen des Prüfers. Auf der Passivseite besteht aber die Gefahr, dass gravierende Unterbewertungen wegen der geringen Auswahlwahrscheinlichkeit nicht entdeckt werden können, da die Wahrscheinlichkeit, einen Fehler zu entdecken, bei der Anwendung des Monetary Unit Sampling von dem Ist-Wert der Prüfungsposition abhängig ist.233 Deswegen ist der Einsatz von Monetary Unit Sampling für die Prüfung von Passivpositionen der Bilanz – wie bereits erwähnt – nicht geeignet, da in diesen Fällen die Suche nach Unterbewertungen für den Prüfer am wichtigsten ist.234 Eine sollwertproportionale Auswahl würde die Wahrscheinlichkeit, eine unterbewertete Position in die Stichprobenauswahl zu bekommen, erhöhen. Die sollwertproportionale Auswahl ist aber für die praktische Anwendung schwierig zu realisieren. Monetary Unit Sampling kann daher nicht effizient eingesetzt werden, wenn der Prüfer in einem Prüffeld gravierende Unterbewertungen erwartet. Besonders deutlich wird diese Problematik bei den sogenannten Nullpositionen.235 „It is not possible to sample units which are not there.”236 Da bei der Anwendung des Monetary Unit Sampling eine Auswahl anhand von Geld232 233 234 235 236
Vgl. DEINDL, J. (1982), S. 1586. Vgl. DEINDL, J. (1982), S. 1586. Vgl. ARKIN, H. (1982), S. 119. Vgl. DEINDL, J. (1981), S. 128 f. ARKIN, H. (1982), S. 119.
4.4 Beurteilung der wertproportionalen Zufallsauswahl
111
einheiten erfolgt, können nur die Prüfungselemente in die Auswahl gelangen, die mindestens eine Geldeinheit enthalten. Eine beispielsweise nicht verbuchte Forderung gegenüber einem Lieferanten würde bei der Anwendung des Monetary Unit Sampling nicht in die Stichprobe gelangen, und die Unterbewertung würde unentdeckt bleiben. Daher ist es sinnvoll, Nullpositionen, d.h. Positionen, deren Ist-Wert am Prüfungsstichtag gleich Null ist, zu einem eigenständigen Prüffeld zusammenzufassen und in einer separaten Prüfung zu untersuchen. Da Monetary Unit Sampling aber im praktischen Einsatz nur bei Prüfung von Aktiva eingesetzt werden soll, ist diese Einschränkung zu vernachlässigen, da in der Praxis nicht verbuchte Forderungen sehr selten sind. Abschließend dazu bleibt festzuhalten, dass Monetary Unit Sampling aufgrund der wertproportionalen Zufallsauswahl der Elemente besonders bei zu erwartenden Überbewertungen im Prüffeld wirksam eingesetzt werden kann. Aufgrund der bereits erwähnten Vorteile ist für die praktische Anwendung die systematische Auswahl als geeignete Auswahltechnik anzuwenden.
5 Simulation der Stichprobenziehung im Monetary Unit Sampling 5.1 Zusammensetzung des Prüfungsfeldes Der vorherige Abschnitt verdeutlicht, dass beim Monetary Unit Sampling unterschiedliche Auswahlverfahren eingesetzt werden können. Dies hat dann auch Einfluss auf die Zusammensetzung der Stichprobe. Die Idee des Monetary Unit Sampling war und ist, dass Buchungspositionen mit hohen Beträgen eine größere Wahrscheinlichkeit dafür bekommen sollen, in die Stichprobe des Abschlussprüfers zu gelangen. Denn der Abschlussprüfer vermutet, dass in den hohen Rechnungen auch die hohen und damit für die letztendliche Prüfungsentscheidung bedeutsamen Fehler liegen könnten. Ziel dieser Simulation soll es daher sein, die unterschiedlichen Verfahren in dieser Richtung zu vergleichen und ein Programm zu entwickeln, damit der Abschlussprüfer auch auf Basis bestehender Officepakete oder allgemeiner statistischer Software für typische Debitorenkonten Auswertungen einfach selbst erstellen kann. Wichtig ist auch die Transparenz der Methoden, die in den bisherigen Modulen zu Monetary Unit Sampling nicht immer nachvollziehbar waren, da die Quellcodes nicht einzusehen sind. Damit dieses Programm und die anschließende Simulation möglichst nahe an den Anforderungen und den Realitäten eines Abschlussprüfers heran kommen, werden zwei Originaldatensätze ausgewertet. Diese Datensätze kommen von einer großen Wirtschaftsprüfungsgesellschaft in New York, die für diese Studie zur Verfügung gestellt worden sind. Dabei wurde auch darauf geachtet, dass die Zusammensetzung der Grundgesamtheit möglichst unterschiedlich ist. Da die Konten in anonymisierter Form ursprünglich in einer bestimmten Währungseinheit waren, trägt die Abszizze bei den folgenden Auswertungen die Beschreibung „Betrag (neu)“, da die Dimension geändert worden ist. Letztendlich sind die Daten und die Auswertung dimensionslos, so dass das Programm jederzeit auf alle Geldeinheiten übertragen werden kann. Die Daten wurden in Form einer anonymisierten txt-Datei geliefert, anschließend in Excel eingelesen und im Folgenden wurde die Einheit entfernt. Eine diB. Giezek, Monetary Unit Sampling, DOI 10.1007/978-3-8349-6588-2_5, © Gabler Verlag | Springer Fachmedien Wiesbaden GmbH 2011
114
5 Simulation der Stichprobenziehung im Monetary Unit Sampling
rekte Auswertung der Ziehungsmodalitäten gestaltet sich in Excel recht schwierig und aufwendig, so dass die Daten in SPSS bzw. in PASW Statistic 17 eingebunden wurden.237 In diesem Programm könnten die Auswertungen sehr schnell eingebunden werden.238 Die Routinen, die für die Simulationen notwendig waren, sind in R239 geschrieben. Anhand der Routinen sind die Simulationsläufe durchgeführt worden, aus denen dann die Stichproben aus den Konten A und B entstehen. Letztendlich wurde – wie in einer realen Prüfung auch – das Ergebnis einer Simulation, die auch nach dem Zufallsprinzip ausgewählt wurde, genommen und deskriptiv ausgewertet. Allerdings sind im Vorfeld die Durchläufe permanent wiederholt worden, um zum einen den wechselnden Stichprobenumfang bei der variablen Intervallziehung und dem Siebverfahren zu ermitteln und eventuelle Auffälligkeiten und Unterschiede bei den Simulationsläufen zu erkennen. Es geht zum Schluss auch darum, die in der praktischen Anwendung sehr weit verbreitete systematische Auswahl mit den anderen Verfahren und insbesondere auch mit nicht wertproportionalen Verfahren zu vergleichen. Diese Untersuchung bietet dafür einen ersten Ansatz, jedoch sind in letzter Konsequenz intensivere Simulationen mit vielen realen Datensätzen, die aus der Praxis kommen können, notwendig. Weitergehenden Simulationen sind mit der Routine ohne Probleme einfach möglich und das Programm wurde so nachvollziehbar geschrieben, dass diese jederzeit auf anderen Konten übertragen werden und auch angepasst werden können. Um diese Routinen allgemein zu halten, wurde die Dimension abschließend wieder entfernt, damit die Berechnungen in jeder Währung durchführbar sind. Letztendlich könnte aber der Euro hier als Einheit genutzt werden. Das Debitorenkonto (Konto) A enthält sehr viele kleinere Rechnungsbeträge und nur eine vergleichsweise geringe Anzahl an großen Rechnungen. Die mitt237 Aus Lizenzgründen erfolgte die deskriptive Auswertung der simulierten Stichproben und der dazugehörigen Grundgesamtheiten an dem Hochschulrechenzentrum der Justus-Liebig-Universität Gießen. 238 Vgl. PINNEKAMP, H.J./ SIEGMANN, F. (2008), S. 283 ff. 239 Die Software R ist eine auch für Windows freie verfügbare Programmiersprache und Statistik-Software. Die Entwickler Ross Ihaka und Robert Gentleman von den Bell Laboratories orientierten sich an dem Programm S sowie dessen Nachfolger S-Plus. Vgl. SCHLITTGEN, R. (2009), S. 29 ff.
5.1 Zusammensetzung des Prüfungsfeldes
115
leren 50 % liegen zwischen 939,82 und nur 3.613,63. Das 90 %-Perzentil liegt bei nur 4.387,46. Jedoch liegt die größte Rechnung bei 92.931,44. Der Median ist mit 3.073,53 kleiner als das arithmetische Mittel (Mittelwert) mit 3.975,85, so dass eine linkssteile Verteilung vorliegt, die für Prüfungssituationen typisch ist.240 Der Variationskoeffizient liegt bei 1,76 und zeigt damit eine sehr große Streuung im Datensatz an. Insgesamt besteht der Datensatz aus 8.659 Rechnungen zwischen 49,00 und 92.931,44 (siehe Tabelle 8 und Abbildung 18). Das Debitorenkonto (Konto) B enthält viele kleinere Rechnungsbeträge, im Vergleich zum Konto A aber auch eine große Anzahl von Rechnungen mit Beträgen zwischen 10.000 und 40.000 Euro. Besonders auffällig sind extrem viele Rechnungen bei knapp über 40.000. Die mittleren 50 % aller Rechnungen liegen zwischen 4.836,64 und 34.453,21. Das 90 %-Perzentil liegt bei 41.823,96, d.h. heißt, fast 15 % aller Rechnungen liegen zwischen 34.453,21 und 41.823,96. Die höchste Rechnung liegt bei 51.293,05. Der Median ist kleiner als das arithmetische Mittel, so dass auch hier eine linkssteile Verteilung vorliegt, die für Prüfungssituationen typisch ist.241 Dennoch liegt hier durch die vielen Belege um die 40.000 schon eine besondere Verteilung vor. Es macht fast den Eindruck, dass es zwei Verteilungen in einer sind. Der Variationskoeffizient liegt bei 0,83, so dass die Streuung in diesem Datensatz vergleichsweise geringer ist. Insgesamt besteht der Daten aus 4.267 Rechnungen zwischen 0,33 und 51.293,05 (siehe Tabelle 9 und Abbildung 19).
240 Eigene Untersuchungen und Befragungen. 241 Eigene Untersuchungen und Befragungen.
116 Tabelle 8:
5 Simulation der Stichprobenziehung im Monetary Unit Sampling Auswertung Konto A Gültig
N
8.659
Mittelwert
3.975,85
Median
3.073,53
Standardabweichung
6.983,85
Varianz
48.774.119,09
Minimum
49,00
Maximum
92.931,44
Summe (Y)
Abbildung 18:
34.426.896,49
Absolute Häufigkeiten Konto A
5.1 Zusammensetzung des Prüfungsfeldes Tabelle 9: N
117
Auswertung Konto B Gültig
4.267
Mittelwert
19.209,50
Median
15.818,08
Standardabweichung
16.016,95
Varianz
256.542.843,72
Minimum
0,33
Maximum
51.293,05
Summe (Y)
Abbildung 19:
81.966.916,63
Absolute Häufigkeiten Konto B
118
5 Simulation der Stichprobenziehung im Monetary Unit Sampling
5.2 Einfache Zufallsauswahl Bei der einfachen Zufallsauswahl werden für beiden Konten 100 Zufallszahlen aus dem Intervall von eins bis Y gezogen. Wie bereits im Abschnitt 4.2.1 beschrieben, werden dann die entsprechenden Zufallszahlen der kumulierten Summe zugeordnet, um dann den dazu gehörigen Beleg in die Stichprobe(n) zu geben. Schon der Blick auf die Mittelwerte, die arithmetischen Mittel, zeigt, dass die einfache Zufallsauswahl die Idee des Monetary Unit Sampling umsetzt und höhere Rechnungen in die Stichprobe gelangen (vgl. Tabellen 10 und 11 sowie Abbildungen 20 und 21). Das Ziel des Prüfers, möglichst hohe Rechnungen in die Stichprobe zu bekommen, ist erreicht. Wichtig ist aber auch, dass auch kleinere Belege in die Stichprobe gelangen, was auch hier erfüllt wird, damit erstens auch kleinere Belege, die Fehler enthalten könnten, geprüft werden, und zweitens der Gefahr von Manipulationen bei kleinen Belegen vorgebeugt wird. Es ist jedoch erkennbar, dass bei Konto B, das nicht so viele sehr kleine Belege enthielt wie Konto A, die Anzahl der kleineren Belege in der Stichprobe gering ist, insbesondere die Belege unter einer Geldeinheit kommen fast nie in die Stichprobe. Dies ist aus Prüfungssicht auch nicht so bedeutsam. Wichtig ist allerdings, dass die Rechnungen um die 40.000 auch in der Stichprobe eine hohe Häufigkeit haben, was durch diese Auswahlmethode wie auch durch die folgenden Methoden erreicht wird. Die Verteilung des Kontos A bleibt linkssteil, was für den Prüfungsbelange in Ordnung ist, da die Grundgesamtheit nicht so viele große Rechnungen hatte. Bei Konto B wird die Verteilung rechtssteil, was wiederum für den Prüfer wichtig ist, denn dadurch sind viele der hohen Rechnungen aus diesem Konto auch in der Stichprobe. Dies gilt auch die die weiteren Verfahren beim Monetary Unit Sampling bei der Auswertung dieser beiden Konten.
5.2 Einfache Zufallsauswahl Tabelle 10:
Auswertung Stichprobe Konto A mit einfacher Zufallsauswahl Gültig
n Mittelwert
100 18.674,70
Median
3.882,38
Standardabweichung Varianz
119
24.105,64 581.081.932,00
Minimum
670,32
Maximum
92.335,60
Summe
Abbildung 20:
1.867.469,88
Absolute Häufigkeiten Konto A mit einfacher Zufallsauswahl
120 Tabelle 11:
5 Simulation der Stichprobenziehung im Monetary Unit Sampling Auswertung Stichprobe Konto B mit einfacher Zufallsauswahl Gültig
n
100
Mittelwert
31.194,58
Median
33.372,02
Standardabweichung
13.079,51
Varianz
171.073.509,05
Minimum
1.324,24
Maximum
51.193,41
Summe
Abbildung 21:
3.119.457,60
Absolute Häufigkeiten Konto B mit einfacher Zufallsauswahl
5.3 Systematische Auswahl mit Zufallstart
121
5.3 Systematische Auswahl mit Zufallstart Bei der systematischen Auswahl mit Zufallsstart ergibt sich für die beiden Konten ein Auswahlintervall von 344.269 bei Konto A bzw. bei Konto B von 819.669. Damit sind beide Intervalle größer als der jeweils größte Beleg in den beiden Konten (92.931,44 bei Konto A und 51.293,05). Damit kommen keine großen Belege mit einer Auswahlwahrscheinlichkeit von eins in die Stichprobe(n). Dies bewirkt, dass sich keine signifikanten Änderungen in den Stichprobenverteilungen im Vergleich zur einfachen Zufallsauswahl ergeben. Die Durchläufe ergaben keine bedeutsamen Unterschiede bei den Werten der Parameter Mittelwert, Median und Standardabweichung in den Stichproben der Konten A und B gegenüber dem vorherigen Verfahren (vgl. Tabellen 12 und 13 Tabelle 12:
Auswertung Stichprobe Konto A mit systematischer Auswahl Gültig
n Mittelwert
100 16.571,68
Median
3.925,68
Standardabweichung
20.010,06
Varianz
400.402.468,34
Minimum
687,96
Maximum
76.915,30
Summe Tabelle 13:
1.657.167,70 Auswertung Stichprobe Konto B mit systematischer Auswahl
n
Gültig
100
Mittelwert
33.186,14
Median
40.344,03
Standardabweichung
12.410,85
Varianz
154.029.255,87
Minimum
2.338,49
Maximum
51.259,47
Summe
3.318.614,26
122
5 Simulation der Stichprobenziehung im Monetary Unit Sampling
Abbildung 22:
Absolute Häufigkeiten Konto A mit systematischer Zufallsauswahl
Abbildung 23:
Absolute Häufigkeiten Konto B mit systematischer Zufallsauswahl
5.4 Variable Intervallziehung
123
sowie Abbildungen 22 und 23). Bei Konto B sind auch die wichtigen Rechnungen um die 40.000 wieder mit einer großen Häufigkeit vertreten.
5.4 Variable Intervallziehung Bei der variablen Intervallziehung ergeben sich für beide Konten – wie bereits in Abschnitt 4.2.3 beschrieben – unterschiedliche Stichprobenumfänge, die im Rahmen dieser Studie zwischen 83 und 112 schwankten. Während sich bei Konto B keine bedeutsamen Veränderungen in der Verteilung der Stichprobe ergaben, sind bei Konto A zwar die Mittelwerte vergleichbar mit den bisherigen Auswahlverfahren, aber der Median ist deutlich höher als bei den vorherigen Verfahren. Dies änderte sich auch nicht in den einzelnen Durchläufen. Ansonsten sind die Stichprobenverteilungen der Konten A und B vergleichbar mit den bisherigen Verfahren. (vgl. Tabellen 14 und 15 sowie Abbildungen 24 und 25). Bei Konto B sind auch wieder die wichtigen Rechnungen um die 40.000 mit einer großen Häufigkeit vertreten. In der Literatur sehen viele bei diesen Verfahren eine bessere Abdeckung als mit der systematischen Auswahl.242 Dies konnte im Rahmen dieser Untersuchung nicht ermittelt werden. Generell sind für eine weitergehende Forschung aber mehr reale Daten notwendig, denn um eine solche Aussage auch auf Basis von realen Daten zu treffen, werden mehr Konten benötigt und insbesondere ist aus Prüfersicht letztendlich wichtig, ob sich auch die Fehler in den ausgewählten Einheiten zeigen, was im Rahmen dieser Untersuchung nicht darstellbar ist (vgl. auch Abschnitt 5.8)
242 Vgl. WOLZ, M. (2003), S. 124.
124 Tabelle 14:
5 Simulation der Stichprobenziehung im Monetary Unit Sampling Auswertung Stichprobe Konto A mit variabler Intervallziehung Gültig
n Mittelwert
18.157,33
Median
8.759,24
Standardabweichung Varianz
109
20.105,30 404.222.918,01
Minimum
660,06
Maximum
76.831,02
Summe
Abbildung 24:
1.979.148,97
Absolute Häufigkeiten Konto A mit variabler Intervallziehung
5.4 Variable Intervallziehung Tabelle 15:
125
Auswertung Stichprobe Konto B mit variabler Intervallziehung Gültig
n
109
Mittelwert
34.340,19
Median
40.380,01
Standardabweichung
13.172,44
Varianz
173.513.143,61
Minimum
2.609,69
Maximum
51.193,41
Summe
Abbildung 25:
3.743.080,54
Absolute Häufigkeiten Konto B mit variabler Intervallziehung
126
5 Simulation der Stichprobenziehung im Monetary Unit Sampling
5.5 Zellenauswahl Bei der Zellenauswahl wird in der praktischen Anwendung empfohlen, große Rechnungen gesondert, wie auch bei den folgenden Verfahren im Vorfeld, aus dem Prüffeld zu entnehmen, da diese zum einen mit einer großen Wahrscheinlichkeit in die Stichprobe kommen würden und der Prüfer auf der anderen Seite die Gefahr vermeidet, dass größere Überwertungen unentdeckt bleiben.243 Im Rahmen dieser Untersuchung sind bei diesen Verfahren keine Rechnungen im Vorfeld ausgewählt worden. Jedoch kann diese Einschätzung auch auf die bisherigen Auswahlverfahren erweitert werden. Bei den Simulationen im Rahmen Tabelle 16:
Auswertung Stichprobe Konto A mit Zellenauswahl Gültig
n
100
Mittelwert
18.169,25
Median
5.072,63
Standardabweichung
22.757,01
Varianz
517.881.648,81
Minimum
710,70
Maximum
92.931,44
Summe Tabelle 17:
1.816.925,00 Auswertung Stichprobe Konto B mit Zellenauswahl
n
Gültig
100
Mittelwert
31.595,23
Median
35.947,83
Standardabweichung
12.461,98
Varianz
155.300.952,80
Minimum
181,22
Maximum
50.732,05
Summe
243 Vgl. NEWIAK, M. (2009), S. 12 f.
3.159.523,34
5.5 Zellenauswahl
Abbildung 26:
Absolute Häufigkeiten Konto A mit Zellenauswahl
Abbildung 27:
Absolute Häufigkeiten Konto B mit Zellenauswahl
127
128
5 Simulation der Stichprobenziehung im Monetary Unit Sampling
dieser Arbeit sind mit dem Zellenverfahren teilweise große Rechnungen in die Stichprobe gekommen und teilweise nicht. Eine einheitliche Tendenz war aber nicht zu erkennen. Ansonsten konnten aber keine bedeutsamen Unterschiede in den Stichprobenverteilungen festgestellt werden (vgl. Tabellen 16 und 17 sowie Abbildungen 26 und 27).
5.6 Siebverfahren Das Siebverfahren stellt an sich eine Mischung aus bewusster und zufälliger Auswahl dar, denn zunächst werden bei dieser Methodik besonders große Einheiten aus der Grundgesamtheit gesondert entnommen und dann anschließend erst die eigentliche Zufallsauswahl durchgeführt. Dadurch ergeben sich zwei Möglichkeit bezüglich des Stichprobenumfanges. Zum einen erhöht sich der Stichprobenumfang wie bei Konto A um die Anzahl der Rechnungen (hier 33 Rechnungen), die im Vorfeld ausgewählt werden. Wie bereits im Abschnitt 4.2.5 erwähnt, variiert bei dieser Methode der Stichprobenumfang für die eigentliche zufällige Auswahl. Bei dieser Studie lagen die Werte zwischen 87 und 119. Da im Rahmen dieser Untersuchung – wie in der realen Prüfung auch – die vorher ausgewählten Buchungen der gesamtem Stichprobe zugefügt werden, ergaben sich letztendlich Stichprobenumfänge zwischen 120 und 152. Zum anderen könnte der Prüfer auch den geplanten Stichprobenumfang von n = 100 um die bereits im Vorfeld ausgewählten Einheiten reduzieren. Bei Konto B wurde von keiner Rechnung die Grenze für die Vorauswahl, die hier auf die Größe (Summe/ 6 n) gesetzt wurde, erreicht, so dass sich auch bei dieser Stichprobenverteilung keine bedeutsamen Unterschiede zu den vorherigen Verfahren festzustellen sind. Bei Konto A sind die Lageparameter deutlich größer als bei den vorherigen Verfahren, jedoch ist dabei die Vorauswahl zu berücksichtigen. (vgl. Tabellen 18 und 19 sowie Abbildungen 28 und 29). Vergleichbare Ergebnisse lassen sich auch mit der systematischen Zufallsauswahl erreichen, wenn die großen Rechnungen unter der Intervallgrenze aussortiert werden. Wird diese vorherige Auswahl beim Siebverfahren – was hier nicht erfolgte – wieder heraus gerechnet, dann bleiben die Ergebnisse fast unverändert.
5.6 Siebverfahren Tabelle 18:
129
Auswertung Stichprobe Konto A mit Siebverfahren Gültig
n Mittelwert
24.645,93
Median
9.148,30
Standardabweichung Varianz
146
27.915,69 779.285.791,65
Minimum
666,40
Maximum
92.931,44
Summe
Abbildung 28:
3.598.306,35
Absolute Häufigkeiten Konto A mit Siebverfahren
130 Tabelle 19:
5 Simulation der Stichprobenziehung im Monetary Unit Sampling Auswertung Stichprobe Konto B mit Siebverfahren Gültig
n
94
Mittelwert
32.064,11
Median
40.343,53
Standardabweichung
13.773,42
Varianz
189.706.994,20
Minimum
1.399,20
Maximum
51.259,47
Summe
Abbildung 29:
3.014.026,23
Absolute Häufigkeiten Konto B mit Siebverfahren
5.7 Modifiziertes Siebverfahren
131
5.7 Modifiziertes Siebverfahren Das modifizierte Siebverfahren stellt auch eine Mischung aus bewusster und zufälliger Auswahl dar, denn zunächst werden auch bei dieser Methodik besonders große Einheiten aus der Grundgesamtheit gesondert entnommen und dann anschließend erst die eigentliche Zufallsauswahl durchgeführt. Dadurch ergeben sich auch hier wieder zwei Möglichkeit bezüglich des Stichprobenumfanges. Zum einen erhöht sich der Stichprobenumfang wie beim Konto A um die Anzahl der Rechnungen (hier 33 Rechnungen), die im Vorfeld ausgewählt werden. Das modifizierte Verfahren hat aber gegenüber dem Siebverfahren den Vorteil, dass der Stichprobenumfang nicht schwankt, d.h. bei allen Simulationen mit Konto A ergab sich ein Stichprobenumfang von 133 und bei Konto B, da keine Rechnung im Vorfeld ausgewählt wurde, ein Stichprobenumfang von 100. Dieser gleichbleibende Stichprobenumfang ist für den Prüfer auch wegen der Kalkulation der Kosten nicht unwesentlich. Im Rahmen dieser Untersuchung wurden mit dieser Methode bei Konto A die besten Resultate im Sinne der Jahresabschlussprüfung erreicht. Bei Konto A war der Mittelwert bei den Simulationen größer als bei den vorherigen Verfahren, jedoch ist auch hierbei wieder die Vorauswahl zu berücksichtigen. (vgl. Tabellen 20 und 21 sowie Abbildungen 30 und 31). Bei Konto A blieben jedoch die Mittelwerte auch nach dem Herausrechnen der 33 vorher gezogenen Rechnungen über den Werten der Mittelwerte bei den anderen Auswahlverfahren. Bei Konto B ergaben sich vergleichbare Ergebnisse wie bei der systematischen Zufallsauswahl, also keine deutliche Verbesserung in der Verteilung.
132 Tabelle 20:
5 Simulation der Stichprobenziehung im Monetary Unit Sampling Auswertung Stichprobe Konto A mit modifiziertem Siebverfahren Gültig
n
133
Mittelwert
27.475,43
Median
10.422,72
Standardabweichung
27.878,99
Varianz
777.238.350,83
Minimum
614,46
Maximum
92.931,44
Summe
Abbildung 30:
3.654.232,77
Absolute Häufigkeiten Konto A mit modifiziertem Siebverfahren
5.7 Modifiziertes Siebverfahren Tabelle 21:
133
Auswertung Stichprobe Konto B mit modifiziertem Siebverfahren Gültig
n
100
Mittelwert
34.169,36
Median
40.348,59
Standardabweichung
12.087,56
Varianz
146.109.046,19
Minimum
1.644,62
Maximum
51.259,47
Summe
Abbildung 31:
3.416.935,59
Absolute Häufigkeiten Konto B mit modifiziertem Siebverfahren
134
5 Simulation der Stichprobenziehung im Monetary Unit Sampling
5.8 Lahiri-Auswahl Bei der Lahiri-Auswahl, die in der praktischen Anwendung bis jetzt weder als eigenständiges Verfahren noch als Ergänzung zum Siebverfahren große Bedeutung bekommen hat, fallen die Ergebnisse im Vergleich zu der in der Praxis häufig eingesetzten systematischen Auswahl fast gleich aus. In den Simulationen lagen die Mittelwerte bei Konto A immer unter den Mittelwerten bei der systematischen Auswahl, während bei Konto B keine einheitliche Tendenz erkennbar war. Die Verteilungen der Häufigkeiten zeigt aber auch keine großen Unterschiede zu den bisherigen Verfahren (vgl. Tabellen 22 und 23 sowie Abbildungen 32 und 33). Tabelle 22:
Auswertung Stichprobe Konto A mit Lahiri-Auswahl Gültig
n Mittelwert
100 14.557,47
Median
3.900,34
Standardabweichung
19.230,31
Varianz
369.804.992,54
Minimum
724,22
Maximum
76.832,98
Summe Tabelle 23:
1.455.747,15 Auswertung Stichprobe Konto B mit Lahiri-Auswahl
n
Gültig
100
Mittelwert
34.253,81
Median
40.408,88
Standardabweichung
12.396,98
Varianz
153.685.074,24
Minimum
5.640,89
Maximum
51.293,05
Summe
3.425.381,10
5.8 Lahiri-Auswahl
Abbildung 32:
Absolute Häufigkeiten Konto A mit Lahiri-Auswahl
Abbildung 33:
Absolute Häufigkeiten Konto B mit Lahiri-Auswahl
135
136
5 Simulation der Stichprobenziehung im Monetary Unit Sampling
5.9 Vergleich und Beurteilung Die wertproportionale Zufallsauswahl der Untersuchungseinheiten unterstützt den Prüfer in dem Anliegen, möglichst Positionen mit einem großen Ist-Wert in die Auswahl zu bekommen, da große Positionen auch wertmäßig große Fehler enthalten können. Ob dies letztendlich so ist, kann anhand der im Rahmen dieser Untersuchung eingesetzten Konten nicht geklärt werden, denn die Konten enthalten nur die Ist-Werte. Was aber gerade im Vergleich mit der klassischen Auswahl gezeigt werden kann, ist die Vorteilhaftigkeit des Monetary Unit Sampling gegenüber diesen Verfahren und das auch bei unterschiedlichster Zusammensetzung der Grundgesamtheit. Die wertproportionale Zufallsauswahl führt dazu, dass hohe Positionen eine hohe Auswahlwahrscheinlichkeit unabhängig von dem eingesetzten Auswahlverfahren besitzen. Der Vergleich zu dem (den) klassischen Verfahren, die per Zufallsprinzip ohne Berücksichtigung der Buchungssumme aus der Grundgesamtheit ziehen, unterstreicht diesen Vorteil. Auch im Rahmen dieser Untersuchungen mit Originaldaten sind die Stichproben mit den Verfahren des Monetary Unit Sampling aus Sicht der Jahresabschlussprüfung wesentlicher besser als die Stichproben aus dem klassischen Verfahren (vgl. Tabellen 24 und 25 sowie Abbildungen 34 und 35). Die arithmetischen Mittel liegen bei beiden Konten und des Verfahrens des Monetary Unit Sampling deutlich über den Mittelwerten der klassischen Verfahren und deutlich über den Mittelwerten der Grundgesamtheiten. Vergleichen wir die in der Praxis oft eingesetzte systematische Auswahl mit den Stichproben aus den klassischen Verfahren, liegt das arithmetische Mittel bei der systematischen Auswahl bei 16.571,68 im Vergleich zu nur 4.596,41 bei der Zufallsauswahl anhand von Buchungsnummern. Dennoch ist wichtig, dass nicht nur große Belege gezogen werden, um Manipulationen vorzubeugen. Dies zeigt der Vergleich der Mediane. Der Median bei der systematischen Auswahl im Monetary Unit Sampling liegt bei 3.925,68, d.h. 50 % der ausgewählten Rechnungen überschreiten diesen Betrag nicht und daher kommen auch kleinere Buchungen in die Stichproben. Somit ist die Gefahr, dass Fehler übersehen werden, die verstärkt in kleineren Rechnungen aufzufinden sein könnten, nicht all zu groß.
5.9 Vergleich und Beurteilung Tabelle 24:
137
Auswertung Stichprobe Konto A mit Zufallsauswahl der Buchungen Gültig
n
100
Mittelwert
4.596,41
Median
3.113,05
Standardabweichung Varianz
10.090,99 101.828.154,37
Minimum
119,56
Maximum
76.738,90
Summe
Abbildung 34:
459.641,32
Absolute Häufigkeiten Konto A mit Zufallsauswahl der Buchungen
138 Tabelle 25:
5 Simulation der Stichprobenziehung im Monetary Unit Sampling Auswertung Stichprobe Konto B mit Zufallsauswahl der Buchungen Gültig
n
100
Mittelwert
19.812,23
Median
22.793,17
Standardabweichung
15.687,67
Varianz
246.102.867,88
Minimum
0,83
Maximum
51.193,41
Summe
Abbildung 35:
1.981.223,47
Absolute Häufigkeiten Konto B mit Zufallsauswahl der Buchungen
5.9 Vergleich und Beurteilung
139
Bei Konto B war die Zusammensetzung der Grundgesamtheit sehr ungewöhnlich durch die große Häufigkeit an sehr großen Rechnungen um die 40.000. Wichtig für den Wirtschaftsprüfer ist, dass insbesondere sich die großen Häufigkeiten der Belege um die 40.000 auch in der Stichprobe wiederfinden. Das kann die Zufallswahl auf Basis der Buchungsnummer, also das klassische Verfahren, nicht liefern und ist daher nicht optimal im Sinne der Abschlussprüfung. Das 15 % Quantil liegt gerade mal bei 16,65 für die im Rahmen der Untersuchung festgehaltene Simulation. Die Gefahr von Überbewertungen in diesem Bereich ist für die Prüfung ohne besondere Bedeutung. Dafür gelangen aber auch nur 15 % der Buchungen über 40.000 in die Prüfungsstichprobe. Das Prüfungsrisiko ist für dieses Prüffeld mit dieser klassischen Methode sehr groß. Dagegen bringen die Auswahlverfahren des Monetary Unit Sampling für diese sicher untypische, aber reale Grundgesamtheit deutlich bessere Ergebnisse. Die Häufigkeit der großen Rechnungen ist wesentlich höher, ohne jedoch auf eine Auswahl auch geringer Rechnungen zu verzichten. Aber insbesondere die ganz kleinen Rechnungen (teilweise unter 1,00) werden durch die wertproportionale Auswahltechnik mit einer Wahrscheinlichkeit von fast Null nicht in die Stichprobe gezogen, was dem Prüfer im Sinne einer risikoorientierten Prüfung entgegen kommt Abschließend dazu bleibt festzuhalten, dass Monetary Unit Sampling aufgrund der wertproportionalen Zufallsauswahl wirksam eingesetzt werden kann. Aufgrund der bereits erwähnten Vorteile – insbesondere in der einfachen Anwendung – ist für die praktische Nutzung die systematische Auswahl als geeignete Auswahltechnik anzuwenden, aber auch die anderen Verfahren zeigen keine – zumindest im Rahmen dieser Untersuchung – signifikanten Nachteile (außer den Stichprobenumfangsschwankungen), aber auch keine entscheidenden Vorteile. Es bleibt aber kritisch festzuhalten, dass eine Simulationen mit nur zwei realen Konten ohne letztendlich die Möglichkeit zu haben, auch die Fehlerverteilung zu begutachten, nur einen ersten Anstoß geben kann. Dazu sollen auch die mitgelieferten Routinen dienen, die auch ohne großen Aufwand übertragen werden können und den Prüfern die Möglichkeit geben, diese Auswahltechniken mit den realen Konten zu simulieren. Wie auch RUHNKE und von TORKLUS, die im Jahr 2008 die in der Literatur beschriebenen Simulationen der Auswertungsverfahren analysiert und verglichen haben, anmerken, sollte die Richtung der zukünftigen Forschungen sich – auch bei den Zielen dieser Untersuchung (Aus-
140
5 Simulation der Stichprobenziehung im Monetary Unit Sampling
wahlverfahren) – verstärkt auf reale Daten konzentrieren. Wenn die Simulationen der Auswahlverfahren mit mehr realen Konten und mit mehr Kenntnis über die Fehlerverteilung in diesen Konten durchgeführt werden kann, dann können den Wirtschaftsprüfern anhand von Entscheidungsbäumen oder ähnlicher Instrumente Empfehlungen gegeben werden, welches Auswahlverfahren für welche Verteilung in der Grundgesamtheit am besten einzusetzen ist. Auch die professionellen Softwareprogramme haben in diesem Bereich noch Entwicklungspotenzial. Aber die Basis dieser Weiterentwicklungen sind auf jeden Fall verstärkte Forschungen mit mehr realen Konten für die Auswahlverfahren und – wie RUHNKE und von TORKLUS es fordern – auch für die Auswertungsmethoden beim Monetary Unit Sampling (vgl. Kapitel 6).
6 Auswertung beim Monetary Unit Sampling 6.1 Grundlegende Überlegungen zur Auswertung Im Rahmen des Monetary Unit Sampling erfolgt die Auswertung der Stichprobe in mehreren Schritten. Im ersten Schritt werden die Buchungsbelege, aus denen die ausgewählten Geldeinheiten stammen, überprüft. In der Praxis werden bspw. für diese Zwecke Saldenbestätigungen verschickt.244 Findet der Prüfer bei seiner Untersuchung einen oder mehrere wertmäßige Fehler, so wird die Anzahl aller Abweichungen ermittelt, um daraus den Fehleranteil in der Stichprobe zu bestimmen. Der Fehler in der Buchungsposition wird dabei wieder auf die ausgewählte Geldeinheit aus dieser Buchungsposition übertragen. Der Prüfer rechnet dieses Ergebnis der Prüfung in einem zweiten Schritt auf die von ihm ausgewählte Geldeinheit um.245 Anhand der in der Stichprobe entdeckten fehlerhaften Buchungsposition und der daraus abgeleiteten fehlerhaften Geldeinheiten wird auf Basis der Poisson-Verteilung246 der obere Anteil der fehlerhaften Geldeinheiten berechnet. Dieser Anteil kann bei Monetary Unit Sampling im nächsten Schritt unmittelbar in den Fehlerwert für das jeweilige Prüffeld umgerechnet werden. In der Praxis kann der Prüfer auf entsprechende Software (IDEA; ACL u.a.) oder auf Tabellenwerke zurückgreifen. Eine solche Tabelle wurde vom American Institute of Certified Public Accountants (AICPA) veröffentlicht. Damit wird im einfachen Modell der Wert der oberen Fehlergrenze (FOG),247 in 244 Wir unterstellen zu Beginn, dass nur 100 % Fehler gefunden werden, d.h., der Prüfer stellt fest, dass eine oder mehrere Buchungspositionen gar nicht existieren. 245 Sind in einer Stichprobe mehrere Geldeinheiten aus einer Buchungsposition, so sollte auch ein eventueller Fehler der Buchung auf jede einzelne Geldeinheit übertragen werden. Dieses Vorgehen ist aber nicht unumstritten. Vgl. HORGAN, J.M: (1998), S. 43. 246 Zunächst erfolgen die typischen Berechnungen für die Auswertung beim Monetary Unit Sampling auf Basis der Poisson-Verteilung, die in der Praxis am häufigsten eingesetzt wird. Im Rahmen dieser Arbeit wird dann auch die Binomialverteilung angewendet. 247 In der englischen Literatur wird an dieser Stelle vom UEL (Upper Error Limit) gesprochen. B. Giezek, Monetary Unit Sampling, DOI 10.1007/978-3-8349-6588-2_6, © Gabler Verlag | Springer Fachmedien Wiesbaden GmbH 2011
142
6 Auswertung beim Monetary Unit Sampling
Form von Ȝ, einer Poisson-Verteilung ermittelt. Dieser Faktor wird dann mit dem durchschnittlichen Stichprobenintervall (I) multipliziert, um dadurch den geschätzten Fehlerwert für das Prüffeld direkt zu ermitteln. FOG OFOG I Abschließender Schritt einer solchen Auswertung ist der Vergleich des geschätzten Fehlerwertes mit dem vor der Prüfung festgelegten Materiality-Grenze (M). Stellt der Prüfer dabei eine Überschreitung dieser Grenze M durch den geschätzten Fehlerwert fest, so wird das Prüffeld mit der vorgegebenen Sicherheit als nicht ordnungsmäßig abgelehnt. Dies bedeutet, dass der Prüfer neue Prüfungshandlungen in Form weiterer Stichproben vornehmen wird;248 in Ausnahmen erfolgt auch eine Vollprüfung, um den tatsächlichen Fehler des Prüffelds festzustellen. Im umgekehrten Fall, bei der die Grenze M nicht überschritten wird, kann der Prüfer das Prüffeld mit der vorgegebenen Sicherheit als ordnungsmäßig annehmen.249 1 2 FOG ! M weitergehende Prüfungshandlungen FOG d M Annahme des Prüffeldes
(Erhöhung des Stichprobenumfanges)
Für beide Entscheidungen gilt, dass der Prüfer auch eventuelle Formfehler wie beispielsweise das Fehlen eines Kontrollstempels beachten muss, da dadurch die Einschätzung des internen Kontrollsystems im Rahmen der Prüfungsplanung sich als falsch herausstellen könnte. Dies würde zusätzliche Prüfungshandlungen nach sich ziehen, da in einem solchen Fall auch die Gefahr besteht, dass quantitative Fehler von dem internen Kontrollsystem übersehen wurden.250 Der Prüfer findet in der Stichprobe i.d.R. auch nicht nur vollständig fehlerhafte (vollständig überbewertete) Geldeinheiten, sondern auch teilweise fehlerhafte (überbewerte Geldeinheiten). Während die Auswertung für die vollständig feh-
248 Vgl. RUHNKE,K./ von TORKLUS, A. (2008), S. 1121. 249 Vgl. DELANEY, P.R./ GLEIM, I.N. (1989), S. 394. 250 Vgl. McRAE, T.W. (1974), S. 208.
6.2 Auswertung vollständig fehlerhafter Geldeinheiten
143
lerhaften Geldeinheiten – außer von der zugrunde liegenden Verteilung251 – einheitlich durchgeführt wird, gibt es für die Auswertung der teilweise fehlerhaften Geldeinheiten – immer noch auf Basis der Poisson-Verteilung – mehrere Ansätze, die dargestellt und untersucht werden und dann auf die Binomialverteilung übertragen werden.
6.2 Auswertung vollständig fehlerhafter Geldeinheiten Die Berechnung eines Schätzwertes für den Fehleranteil bzw. das Fehlerausmaß erfolgt bei der Anwendung des Monetary Unit Sampling – wie bereits erwähnt – zu einem in mehreren Schritten und richtet sich zum zweiten selbstverständlich auch nach der Anzahl der in der Stichprobe entdeckten fehlerhaften Geldeinheiten. Um die Grundidee bei der Auswertung möglichst anschaulich zu demonstrieren, wird – wie bereits erwähnt – erst unterstellt, dass sich in der Grundgesamtheit neben den fehlerfreien Geldeinheiten nur vollständig überbewertete Geldeinheiten befinden (100 %-Fehler).252 Fall 1: In der Stichprobe des Umfangs n wird keine fehlerhafte Geldeinheit (k = 0) entdeckt. In diesem Fall kann der Prüfer nicht mit völliger Sicherheit davon ausgehen, dass ein fehlerfreies Prüffeld vorliegt. Vielmehr muss der gewissenhafte Prüfer schon aus Sicherheitsüberlegungen damit rechnen, dass sich in dem ungeprüften Teil der Grundgesamtheit fehlerhafte Elemente befinden, von denen der Revisor vorsichtshalber annimmt, dass es sich um 100 %-Fehler handelt. Auf der Basis
251 Typischer wird für die Auswertung beim Monetary Unit Sampling eine PoissonVerteilung unterstellt. Im Rahmen dieser Arbeit wird später auch bei dieser Art der Auswertung die Binomialverteilung angewendet. 252 Für den Wirtschaftsprüfer, der mit Monetary Unit Sampling ausgewählte Aktivpositionen kontrolliert, sind i.d.R. nur die Überbewertungen von Bedeutung, da diese ein Risiko bei der Erteilung des Testats darstellen. Unterbewertungen sind zwar auch fehlerhafte Einheiten, werden aber in der Prüfungspraxis (bei der Prüfung von Aktiva!) nicht entsprechend gewürdigt, da Unterbebewertungen keine Vergrößerung des Testat-Risikos darstellen.
144
6 Auswertung beim Monetary Unit Sampling
der Poisson-Verteilung und entsprechenden Tabellen wird somit eine Fehlerobergrenze [FOG]253 berechnet. Die weitere Auswertung erfolgt dann – wie schon bekannt – mit Hilfe der tabellierten FOG-Faktoren und des durchschnittlichen Stichprobenintervalls (I):
FOG OFOG I
Ok ,D I
Ok ,D
Y n
Da bei der Poisson-Verteilung – als Approximation der Binomialverteilung – sich der Parameter ȜFOG aus dem Produkt vom Stichprobenumfang n und dem Anteil P berechnet, ergibt sich durch die Division von ȜFOGdurch n (siehe vorherige Formel) wieder der geschätzte Anteil der fehlerhaften Geldeinheiten. Im weiteren Verlauf nennen wir den Faktor aber nicht mehr ȜFOG, sondern Ȝk;Į, denn der Faktor ist abhängig von zwei Größen:
der Anzahl der gefundenen fehlerhaften Elemente in der Stichprobe: k und
den Fehler erster Art (irrtümliche Annahme des Prüffeldes): Į.
Unterstellen wir einen Į-Wert von 5 % so ergibt sich ein Ȝ0;0,05 = 3. Der exakte Wert auf der Basis der Poisson-Verteilung ist 2,995732 und kann durch folgende Gleichung ermittelt werden:
O0 ,D
ln( D )
Der Prüfer kann also mit einer Sicherheit von (1 – Į) davon ausgehen, dass das maximale Fehlerausmaß des Prüffelds den Wert von FOG nicht überschreitet, wenn in der Stichprobe keine fehlerhafte Einheit gefunden worden ist. Für die verschiedenen Werte von k und n ergibt sich (leicht gerundet) Tabelle 26, die auch in ähnlicher Form durch die AICPA veröffentlicht wurde.254
253 Vgl. LESLIE; D.A./ TEITLEBAUM, A.D./ ANDERSON, R.J. (1979), S. 124; in der amerikanischen Literatur wird der Begriff Dollar Error Limit oder Upper Error Limit synonym benutzt (vgl. u.a. BAILEY, A.D. Jr. (1981), S. 192 ff.). 254 Vgl. AICPA (1999), S. 109.
6.2 Auswertung vollständig fehlerhafter Geldeinheiten Tabelle 26: Anzahl der Überbewertungen in der Stichprobe (k)
145
Faktoren zur Berechnung der oberen Fehlergrenzen Ȝk;Į Risiko der irrtümlichen Annahme des Prüffeldes Į
1%
5%
10 %
15 %
20 %
25 %
30 %
37 %
50 %
0
4,61
3,00
2,31
1,90
1,61
1,39
1,21
1,00
0,70
1
6,64
4,75
3,89
3,38
3,00
2,70
2,44
2,14
1,68
2
8,41
6,30
5,33
4,72
4,28
3,93
3,62
3,25
2,68
3
10,05
7,76
6,69
6,02
5,52
5,11
4,77
4,34
3,68
4
11,61
9,16
8,00
7,27
6,73
6,28
5,90
5,43
4,68
5
13,11
10,52
9,28
8,50
7,91
7,43
7,01
6,49
5,68
6
14,57
11,85
10,54
9,71
9,08
8,56
8,12
7,56
6,67
7
16,00
13,15
11,78
10,90
10,24
9,69
9,21
8,68
7,67
8
17,41
14,44
13,00
12,08
11,38
10,81
10,31
9,68
8,67
9
18,79
15,71
14,21
13,25
12,52
11,92
11,39
10,74
9,67
10
20,15
16,97
15,41
14,42
13,66
13,02
12,47
11,79
10,67
11
21,49
18,21
16,60
15,57
14,78
14,13
13,55
12,84
11,67
12
22,83
19,45
17,79
16,72
15,90
15,22
14,63
13,89
12,67
13
24,14
20,67
18,96
17,86
17,02
16,32
15,70
14,93
13,67
14
25,45
21,89
20,13
19,00
18,13
17,40
16,77
15,97
14,67
15
26,75
23,10
21,30
20,13
19,24
18,49
17,84
17,02
15,67
16
28,03
24,31
22,46
21,26
20,34
19,58
18,90
18,06
16,67
17
29,31
25,50
23,61
22,39
21,44
20,66
19,97
19,10
17,67
18
30,59
26,70
24,76
23,51
22,54
21,74
21,03
20,14
18,67
19
31,85
27,88
25,91
24,63
23,64
22,81
22,09
21,18
19,67
20
33,11
29,07
27,05
25,74
24,73
23,89
23,15
22,22
20,67
146
6 Auswertung beim Monetary Unit Sampling
Fall 2: In der Stichprobe des Umfangs n wird eine zu 100 % fehlerhafte (überbewertete) Geldeinheit (k = 1) entdeckt. Nach wie vor kann die Fehlerobergrenze auf Basis der Poisson-Verteilung entsprechend berechnet werden.
FOG Ok ,D I
Ok ,D
Y n
Durch das Auffinden einer fehlerhaften Geldeinheit wird eine Erweiterung der Fehlerobergrenze (FOG) notwendig. Wie bereits im Fall 1 erläutert besteht auch hier die Gefahr, dass noch weitere fehlerhafte Geldeinheiten in der Grundgesamtheit vorliegen, d.h. die Fehlerobergrenze für Fall 2 muss mindestens genauso groß sein wie im Fall 1. Im Monetary Unit Sampling kann diese FOG aus Informationsgründen in drei Auswertungsteile aufgeteilt werden:255 1) Grundeinstellung (Basis Precision, BP) Diese Grundeinstellung basiert auf dem Faktor Ȝ0;Į, der sich bei einem vorgegebenem Risiko an Į einstellt, wenn kein fehlerhaftes Element in der Stichprobe gefunden wurde. Bei einem Į-Wert von 5 % ergibt sich wieder 3. 2) Plausibelster Fehler (Most Likely Error, MLE) Dadurch, dass eine fehlerhafte Geldeinheit in der Stichprobe entdeckt wurde, wird eine Punktschätzung des Fehlerausmaßes berechnet: ˆ MUS MLE =Y P
Y S nMUS
Y
k n
I k
Während mit Hilfe dieser Punktschätzung ein konkreter Wert für die Überbewertung des Prüffeldes ermittelt wird, muss ein gewissenhafter Prüfer aber berücksichtigen, dass das tatsächliche Fehlerausmaß größer sein kann. 3) Einstellungserweiterung (Precision Gap Widening, PGW) Ziel dieser Komponente ist es, dass die Fehlerobergrenze sich mit jedem gefundenen fehlerhaften Element in der Stichprobe überproportional erhöht. Der PGW-Faktor kann als Differenz zweier aufeinander folgender Faktoren einer Poisson-Verteilung bei einem vorgegebenen Risiko Į verstanden werden. Jedoch
255 LESLIE, D.A./ TEITLEBAUM, A.D./ ANDERSON, R.J. (1979), S. 124.
6.2 Auswertung vollständig fehlerhafter Geldeinheiten
147
muss dabei berücksichtigt werden, dass die in der Komponente zwei ermittelte Punktschätzung wieder heraus gerechnet wird: PGW Faktor
Ok ,D Ok 1,D 1
Somit kann die Fehlerobergrenze auch durch folgende Berechnung dargestellt werden und kann damit auch auf die Fälle übertragen werden, dass der Prüfer mehr als ein fehlerhaftes Element in der Stichprobe findet: k ª º FOG « O0 ,D ¦ Oi ,D Oi 1,D » I i 1 ¬ ¼
k ª º Y «O0 ,D ¦ Oi ,D Oi 1,D » n i 1 ¬ ¼
Wird in der Stichprobe mehr als eine fehlerhafte Geldeinheit entdeckt, so erfolgt die Berechnung der Fehlerobergrenze (FOG) analog zu den bisherigen Fällen, d.h. auch hier wird auf Basis der Poisson-Verteilung. Natürlich kann auch in diesem Fall die Darstellung der zu ermittelnden Fehlerobergrenze anhand der drei Komponenten der Monetary Unit Sampling-Auswertung erfolgen, wie dies in der Abbildung 36 dargestellt wird. Die Unterteilung der Fehlergrenze in die einzelnen Komponenten ist aber gerade bei einer größeren Anzahl von Fehlern zu umständlich und auch nicht mehr angebracht, da für den Prüfer nur die Fehlerobergrenze und u.U. die Punktschätzung des Fehlerausmaßes von Bedeutung sind. Die Punktschätzung [MLE] ist für den Prüfer in diesem Fall ohne Addition der Einzelfehler direkt zu ermitteln: ˆ MUS MLE =Y P
Y S nMUS
Y
k n
I k
Für die bisher unterstellten Fehler (100 %-Fehler) reicht es also vollkommen aus, direkt die Fehlerobergrenze auf Basis der Poisson-Verteilung und die entsprechende Punktschätzung zu ermitteln.
148
6 Auswertung beim Monetary Unit Sampling
Ȝ PGWFaktor
BPFaktor
gesamter Sicherheitszuschlag auf MLE
MLEFaktor
k
Abbildung 36:
Auswertungsbestandteile
6.3 Auswertung teilweise fehlerhafter Geldeinheiten In der Prüfungspraxis kommt neben den Fällen, dass ganze Prüfungspositionen (z.B. Forderungen) nicht existent sind, zum größten Teil aber die Situation vor, dass lediglich Teile der Forderungen nicht mehr bestehen bzw. nie bestanden haben. Der Prüfer kann in einem solchen Fall natürlich nicht die ganze Rechnung als fehlerhaft ansehen, sondern muss den entdeckten Fehler prozentual umrechnen. Bei einer derartigen Fragestellung wurde in den Anfangszeiten des Monetary Unit Sampling ein Verfahren vorgeschlagen, dass der Niederländer van HEERDEN256 als „my-dollar-right-or wrong-approach“257 bezeichnete. Danach besteht
256 Vgl. van HEERDEN, A. (1967); der Autor übersetzte anläßlich des „9th International Congress of Accountants 1967“ in Paris seinen 1961 in niederländisch geschriebenen Aufsatz „Steekproeven als middel an accountants controlle“ unter dem Titel „Statistical Sampling as a means of auditing“ in die englische Sprache. Erwähnt
6.3 Auswertung teilweise fehlerhafter Geldeinheiten
149
eine Rechnung des Umfanges yi aus di vollständig überbewerteten und (yi – di) fehlerfreien Geldeinheiten. Die Schwierigkeit bei der Umsetzung dieses Verfahren besteht jetzt darin, den bzw. die ausgewählten Geldeinheiten einer dieser zwei Gruppen zuzuordnen, da nicht eindeutig geklärt werden kann, wie sich beispielsweise die fehlerfreien Geldeinheiten auf die insgesamt yi Geldeinheiten verteilen, d.h. befinden sich die fehlerfreien Geldeinheiten am Anfang oder am Ende oder verteilen sie sich gleichmäßig über die Rechnung usw. Dementsprechend erhält der Prüfer für ein und dieselbe Stichprobe unterschiedliche Auswertungen. Gehört die von dem Revisor ausgewählte Geldeinheit per definitione zu den fehlerfreien Geldeinheiten der yi Geldeinheiten, so ergibt sich bei einer Sicherheit von (1 – Į) eine andere Fehlerobergrenze als bei der Zuordnung zu den fehlerhaften. Somit gibt es bei einer Stichprobe zwei unterschiedliche Fehlerobergrenzen. Dies ist für die Anforderungen an eine nachvollziehbare und objektive Jahresabschlussprüfung nicht umsetzbar. Es ist daher leicht zu verstehen, dass eine solche Auswertungsvielfalt nicht den Anforderungen einer ordnungsgemäßen Prüfung entspricht, und sich deswegen bei der Auswertung des Monetary Unit Sampling eine zweite sinnvollere Berechnung für solche Prüfungsfälle durchgesetzt hat, nämlich die prozentuale Fehlerberechnung (Tainted Dollar Approach). Die festgestellte Überbewertung wird bei Monetary Unit Sampling umgerechnet auf die einzelne Geldeinheit. Letztendlich wird der relative Fehler einer Geldeinheit berechnet, der in den weiteren Ausführung mit di* bezeichnet wird: di*
di yi
yi xi yi
1
xi yi
Dieser Fehlerbegriff dient als Basis der weiteren Auswertungsmöglichkeiten. Wir unterstellen ferner als konservative Annahme und Gegensatz zum vorherigen Ansatz, dass die Fehler gleichverteilt sind.258 Dennoch entstehen nicht mehr wird dieser Aufsatz bei LESLIE, D.A./ TEITLEBAUM, A.D./ ANDERSSON, R.J. (1979), Anhang L. 257 LESLIE, D.A./ TEITLEBAUM, A.D./ ANDERSON, R.J. (1979), S. 120. 258 In der Praxis gibt es zwei Einschätzungen zur Verteilung der Fehler. Auf der einen Seite vermutet ein Prüfer mehr Fehler in kleineren Positionen, da der Buchhalter oder Bilanzaufsteller bei diesen Positionen u.U. nicht gründlich arbeitet. Auf der anderen Seite sehen Prüfer auch die Möglichkeit, dass hohe Debitorensalden auch
150
6 Auswertung beim Monetary Unit Sampling
(wie bei vollständig fehlerhaften Geldeinheiten) eindeutige Lösungen auf Basis der zugrundeliegenden Verteilung – in unserem Fall nach wie vor erstmal die Poisson-Verteilung – sondern vielmehr gibt es für den Prüfer mehrere Ansätze. Der Prüfer hat aber immer noch die konservative Möglichkeit, die Fehlerobergrenze so zu berechnen, wie es bei vollständig fehlerhaften Geldeinheiten der Fall war, und das Ausmaß (den Prozentsatz) der partiellen Überbewertungen zu ignorieren.
FOG Ok ,D I
Ok ,D
Y n
Dieses Vorgehen ist natürlich für die Praxis suboptimal, da schon bei wenigen, prozentual sehr geringen Überbewertungen in der Stichprobe der Prüfer zu großen Fehlerobergrenzen kommen würde, die dann zur einer Ablehnung der Ordnungsmäßigkeit des Prüffeldes führen könnte. In diesem Zusammenhang finden sich in der frühen Literatur noch mal eine andere Art der Benennung der drei Schätzungsbestandteile in FOG-Faktoren 1 bis 3 statt BP, MLE, und PGW, aber inhaltlich führt das zu keinen neuen Erkenntnisse, denn die FOG-Faktoren sind die gleichen wie vorher auch. 1) Faktor für die Grundeinstellung (FOG1-Faktor) 2) Faktor für die Punktschätzung (FOG2-Faktor) 3) Faktor für die Erweiterung (FOG3-Faktor) Für die praktische Anwendung hat der Prüfer die Wahl zwischen hauptsächlich drei Ansätzen, die hier vorgestellt werden. Nicht alle Ansätze werden jedoch von den aktuellen Prüfungssoftwarepaketen unterstützt. Da diese meist noch mit der Poisson-Verteilung arbeiten, wird im Rahmen dieser Arbeit auch noch mal eine Erweiterung auf die Binomialverteilung als Approximation der zugrunde liegenden Hypergeometrischen Verteilung aufgezeigt. Damit soll gezeigt werden, dass auch mit der Binomialverteilung vergleichbare Ergebnisse generiert werden können. Um die mit diesen Verfahren berechneten Grenzen von den bisherigen Grenzen zu unterscheiden, wird auch oft der Begriff für die Grenzen neu behohe Fehler enthalten können. Die Gleichverteilungsnahme ist somit eine plausible Annahme.
6.3 Auswertung teilweise fehlerhafter Geldeinheiten
151
zeichnet als CAV (Combined Atrributes and Variables Bounds). Anhand eines Beispiels werden auch konkrete Werte zum Vergleich der Methoden berechnet. 6.3.1 Maximalfehlermethode Die Maximalfehlermethode (MFM) ist eine andere Bezeichnung für die bereits obengenannte Methode. Der Prüfer nutzt die konservative Möglichkeit, die Fehlerobergrenze so zu berechnen, wie es bei vollständig fehlerhaften Geldeinheiten war und das Ausmaß der partiellen Überbewertungen zu ignorieren.
FOGMFM Ok ,D I
Ok ,D
Y n
Analog kann der Prüfer wieder diese Fehlerobergrenze aufteilen: 1) Grundeinstellung (Basis Precision, BP) Diese basiert auf dem Faktor Ȝ0,Į, der bei einem vorgegebenem Risiko an Į einstellt, wenn kein fehlerhaftes Element in der Stichprobe gefunden wurde, also für einen Į-Wert von 5 % wieder 3. 2) Plausibelster Fehler (Most Likely Error, MLE) Dadurch, dass eine fehlerhafte Geldeinheit in der Stichprobe entdeckt wurde, wird eine Punktschätzung des Fehlerausmaßes berechnet: MLEMFM =Y Pˆ MUS
Y S nMUS
Y
k n
I k
Während mit Hilfe dieser Punktschätzung ein konkreter Wert für die Überbewertung des Prüffeldes ermittelt wird, muss ein gewissenhafter Prüfer aber berücksichtigen, dass das tatsächliche Fehlerausmaß größer sein kann. 3) Einstellungserweiterung (Precision Gap Widening, PGW) Ziel dieser Komponente ist es, dass die Fehlerobergrenze sich mit jedem gefundenen fehlerhaften Element in der Stichprobe überproportional erhöht. Der PGW-Faktor kann als Differenz zweier aufeinander folgender Faktoren einer Poisson-Verteilung bei einem vorgegebenen Risiko Į verstanden werden. Jedoch muss dabei berücksichtigt werden, dass die in der Komponente zwei ermittelte Punktschätzung wieder heraus gerechnet wird:
152
6 Auswertung beim Monetary Unit Sampling
PGW -Faktor MFM Ok ,D Ok 1,D 1
Somit kann die Fehlerobergrenze auch durch folgende Berechnung dargestellt werden und kann damit auch auf die Fälle übertragen werden, dass der Prüfer mehr als ein fehlerhaftes Element in der Stichprobe findet: k ª º FOGMFM «O0 ,D ¦ Oi ,D Oi 1,D » I i 1 ¬ ¼
k ª º Y «O0 ,D ¦ Oi ,D Oi 1,D » n i 1 ¬ ¼
Diese Aufteilung ist somit identisch mit dem bereits in Abschnitt 6.2 beschriebenen Methoden und wird daher nicht noch mal detaillierter wiederholt. 6.3.2 Fehlerreihungsmethode Bei der Fehlerreihungsmethode (FRM) werden die fehlerhaften (überbewerteten) Geldeinheiten in der Stichprobe nach fallender Größe sortiert, um die größeren Fehler auch entsprechend mit den größeren Faktoren zu gewichten.259 Die Methode wurde bereits schon in den sechziger Jahren von Stringer (und Stephan) vorgeschlagen und wird daher in der Literatur auch als Stringer-Bound bezeichnet:260
1
t
d1* t d 2* t d3* t
... t d k* ! 0
Nach der Sortierung anhand des Fehlerausmaßes kann in bereits bekannter Art und Weise die Berechnung der Fehlerobergrenze erfolgen. k ª º FOG FRM «O0 ,D ¦ Oi ,D Oi 1,D d i* » I i 1 ¬ ¼
k ª *º Y «O0 ,D ¦ Oi ,D Oi 1,D d i » n i 1 ¬ ¼
Bei der Ermittlung des geschätzten Wertes eines Prüffeldes kann der Wirtschaftsprüfer selbst bei der Prüfung einer Aktivposition nicht davon ausgehen, dass nur fehlerfreie oder überbewertete Geldeinheiten im Prüffeld vorliegen. Vielmehr können im Prüffeld zum Einen sogenannte Nullpositionen und zum Anderen unterbewertete, d.h. nicht in ihrer tatsächlichen Höhe verbuchte Positio259 Vgl. u.a. GARSTKA, S.J. (1977), S. 181; vgl. FIENBERG, S.E./ NETER, J./ LEITCH, R.A. (1977), S. 297 und vgl. HÖMBERG, R. (1989/II), S. 253f. 260 Vgl. BIAGGIO, L. (1987) S. 217; vgl. STEPHAN, F.F. (1963), S. 404 sowie STRINGER, K.W. (1963) S. 405 ff.
6.3 Auswertung teilweise fehlerhafter Geldeinheiten
153
nen auftreten, jedoch wird auch hier der Fall der Unterbewertung nicht betrachtet.261 In vielen Softwarelösungen wird diese Berechnung mit der Zellenauswahl kombiniert und unterstellt damit die ungünstigste Verteilung der Fehler auf die Zellen. Durch das degressive Anwachsen von Ȝk,Į bekommen die höheren Fehleranteile eine höhere Gewichtung in der Schätzung als die geringen Fehleranteile am Ende der Reihung. Aktuelle Simulationsstudien haben diese konservative Schätzung, die regelmäßig zu Überbewertungen der oberen Fehlergrenze führt, bestätigt.262 Die Differenz Ȝk,Į-Faktoren wird in diesem Zusammenhang auch wieder als Grenzerweiterungsfaktor263 (Adjustment Factor“264 oder Incremental Factor)265 bezeichnet. Der Grenzerweiterungsfaktor nimmt mit zunehmenden k ab und geht für größer werdende Werte von k gegen den Wert 1. Auch die Punktschätzung des Fehlerausmaßes kann anhand des bisherigen Ansatzes durchgeführt werden, jedoch wird der Grad (das Ausmaß) der Überbewertung der fehlerhaften Geldeinheiten dabei beachtet. k
MLE
FRM
Y
¦d i 1
n
* i
k
I ¦ d i* i 1
In der Prüfungspraxis wird die Stringer-Methode oft eingesetzt,266 da diese von den Prüfungssoftwarepaketen unterstützt wird und auch für die Auswertung mit
261 Da man jedoch Monetary Unit Sampling nur für die Prüfung von Aktiva anwenden soll, kann der Wirtschaftsprüfer die i.d.R. sehr seltenen Unterbewertungen, die auch über 100 % sein könnten, vernachlässigen, da der Wirtschaftsprüfer unterstellen kann, dass das Unternehmen schon im Eigeninteresse die eigenen Forderungen ordnungsgemäß verbucht (vgl. Abschnitt 6.5). 262 Vgl. NEWIAK, M. (2009), S. 51ff und für einen Vergleich von 23 nach 1980 veröffentlichen Studien zum Monetary Unit Sampling RUHNKE, K./ von TORKLUS, A. (2008), S. 1122. 263 Vgl. DEINDL, J. (1982), S. 1587. 264 Vgl. MEIKLE, G.R. (1972), S. 41. Der Aufsatz wird erwähnt bei Sperl, A. (1978), S. 178. 265 Vgl. ANDERSON, R./ TEITLEBAUM, A.D. (1973), S. 41. 266 Eigene Untersuchungen und Befragungen.
154
6 Auswertung beim Monetary Unit Sampling
Excel im CPA Journal empfohlen wurde.267 Dennoch darf nicht übersehen werden, dass mit dieser Methode zwar eine konservative, aber auch meist zu hohe Schätzung der Fehlerobergrenze erfolgt, weil der Faktor Ȝ0,Į der den Fall der fehlerfreien Stichprobe in die Berechnungen eingeht, immer mit 100 % (100 %ige Überbewertung) eingeht. Vielfach wird daher vorgeschlagen, und dies ist auch im Vorfeld in Softwarepaketen einstellbar, dass der Prüfer den Faktor Ȝ0,Į mit der höchsten anzunehmenden Fehlerrate gewichtet. Oftmals besteht aber bei dieser Voreinstellung aber auch ein direkter Zusammenhang mit dem Stichprobenumfang, der auch dadurch verringert wird, weswegen dieses Vorgehen durchaus kritisch zu sehen ist. 6.3.3 Durchschnittsfehlermethode Die Durchschnittsfehlermethode (DFM) arbeitet mit dem durchschnittlichen Fehler der in der Stichprobe gefunden fehlerhaften Einheiten. Eine Sortierung wie beim Fehlerreihungsverfahren ist nicht notwendig. Der Prüfer berechnet aus den Fehleranteilen ein arithmetisches Mittel der Fehleranteile: ___
d*
1 k * ¦ di k i1
Für den Fall, dass keine fehlerhafte Geldeinheit in der Stichprobe gefunden wird, setzt der Prüfer diesen Mittelwert auf eins: ___
d*
1 für k
0
Die Berechnung der Fehlerobergrenze ergibt sich nach dieser Methode auch auf Basis des bisherigen Formelwerkes nur mit Berücksichtigung des Mittelwertes der fehlerhaften Anteile: ___
FOG DFM Ok ,D d * I
___
Ok ,D d *
Y n
Auch die Punktschätzung des Fehlerausmaßes kann anhand des bisherigen Ansatzes durchgeführt werden:
267 Vgl. WAMPLER, B./ McEACHARN, M. (2005), S. 37.
6.3 Auswertung teilweise fehlerhafter Geldeinheiten
k
MLE
DFM
Y
¦d i 1
n
* i
155
k
I ¦ d i* i 1
Das Verfahren gilt auch als konservativ, hat jedoch den Nachteil, dass die Auswertung auf gewisse Weise unlogisch ist.268 Findet der Prüfer in der Stichprobe keine fehlerhafte Geldeinheit, so sieht er das Risiko, dass sich trotzdem in der Grundgesamtheit noch 100 %ige Überbewertungen befinden könnten. Findet er jedoch in der Stichprobe nur teilweise unterbewertete Geldeinheiten, so wird bei dieser Methode dann das Risiko für das Auffinden von weiteren fehlerhaften Geldeinheiten in der Grundgesamtheit auf den maximalen Prozentsatz des arithmetischen Mittels der bereits gefundenen Geldeinheiten reduziert. Dies entspricht nicht einem risikoorientierten Ansatz und ist daher sehr bedenklich. Durch leichte Änderungen in der bestehenden Formel könnte dieses Problem behoben werden. Dieser Fehlerobergrenze wird hier als modifizierte Fehlergrenze bezeichnet. In der bisherigen Literatur findet sich ein solcher Ansatz jedoch nicht. __ ª *º FOG mod. «O0 ,D ( Ok ,D O0 ,D )d » I DFM ¬ ¼
__ ª *º Y «O0 ,D ( Ok ,D O0 ,D )d » ¬ ¼ n
Der Prüfer hat darüber hinaus auch beim der regulären Durchschnittsfehlermethode die Möglichkeit, bei einer fehlerfreien Stichprobe die dann durchgeführte Schätzung mit einer nach seinem Ermessen maximalen Fehlerüberbewertungsrate anzupassen. Dies ist aber auch im höchsten Maß gefährlich, da auch hier durch den Zusammenhang mit dem Stichprobenumfang die Gefahr besteht, durch die Annahme eines geringen möglichen Fehleranteils den Stichprobenumfang – natürlich auch aus Kostenüberlegungen – zu verkleinern, und das Risiko würde u.U. wieder unterschätzt.
268 Vgl. WOLZ, M. (2003), S. 126.
156
6 Auswertung beim Monetary Unit Sampling
6.3.4 Beispielsberechnungen Um die einzelnen Methoden noch deutlicher zu machen, werden die notwendigen Berechnungen anhand eines Beispiels demonstriert. Dabei sind die folgenden Größen gegeben bzw. werden berechnet: Gesamtsumme des Kontos: Wesentlichkeit: Sicherheitsniveau: Stichprobenumfang: Stichprobenintervall:
8.000.000 Euro 240.000 Euro 95 % 100 Geldeinheiten 80.000 Euro
=Y =W = (1 – Į) =n =I
Der Prüfer kennt die Gesamtsumme des Kontos (8.000.000 Euro) und legt den maximal tolerierbaren Fehler in Form der Wesentlichkeit von 240.000 Euro und das Risiko für eine irrtümliche Annahme des Prüffeldes, des Kontos, mit 5 % (95 %ige Sicherheit) fest. Auf Basis der Poisson-Verteilung bzw. der entsprechenden Tabellen (vgl. Tabelle 26) wird der notwendige Stichprobenumfang von n = 100 ermittelt. Der Ansatz lautet: po 0 O O
O0
e O 0 ,05 0! ln( 0, 05 ) 2,996 | 3
Der Prüfer kann diesen (gerundeten) Wert „3“ auch direkt aus Tabelle 26 bzw. 27 entnehmen. Der Prüfer unterstellt bzw. erwartet, dass er keine fehlerhafte Einheit in der Stichprobe findet und setzt sein Risiko auf 5 % fest, also k = 0 und Į = 5 %. Dann ergibt sich auch der Wert „3“. Der Parameter Ȝ ergibt sich bei der Approximation aus dem Produkt des Anteils P und des Stichprobenumfanges n. Dies wird dann entsprechend nach n umgeformt, um auf Basis einer Annahme eines Fehleranteiles von 0,03 den Stichprobenumfang zu ermitteln.
O
240.000 3 8.000.000 8.000.000 3 100 240.000
nP
n
n
6.3 Auswertung teilweise fehlerhafter Geldeinheiten Tabelle 27:
157
Ausschnitt aus Tabelle 26
Anzahl der Überbewertungen in der Stichprobe (k)
Risiko der irrtümlichen Annahme des Prüffeldes Į
1%
5%
10 %
15 %
20 %
25 %
30 %
37 %
50 %
0
4,61
3,00
2,31
1,90
1,61
1,39
1,21
1,00
0,70
1
6,64
4,75
3,89
3,38
3,00
2,70
2,44
2,14
1,68
2
8,41
6,30
5,33
4,72
4,28
3,93
3,62
3,25
2,68
Diese beiden Schritte können auch in einer Rechnung zusammengefasst werden: n
ln( D )
Y W
ln( 0 ,05 )
8.000.000 | 100 240.000
Das Stichprobenintervall ist dann wieder:
I
Y n
8.000.000 100
80.000
In der Stichprobe werden zwei fehlerhafte Geldeinheiten entdeckt: 1. fehlerhafte Geldeinheit: 45 %ige Überbewertung 2. fehlerhafte Geldeinheit: 25 %ige Überbewertung Auf Basis der eben vorgestellten Methoden ergeben sich die folgenden Berechnungen und die daraus abgeleiteten Entscheidungen. Bei den Berechnungen wird zuerst anhand der Faktoren der Tabelle 26 bzw. 27 die Fehlerobergrenze ermittelt. Als Vergleich dazu werden auch noch mal die Fehlerobergrenzen mit den exakten Faktoren z.B. mit Excel berechnet. Beide Schätzungen basieren auf der Poisson-Verteilung und differieren wertmäßig nur gering, so dass der Prüfer die Berechnung wählen kann, die aus seiner Sicht in der Durchführung am einfachsten ist. Bei der Maximalfehlermethode wird der Prozentsatz der Überbewertung (hier 45 % und 25 %) nicht in den Berechnungen berücksichtigt. Es ergeben sich daher die folgenden Schätzungen:
158
6 Auswertung beim Monetary Unit Sampling
Tabelle 26: FOGMFM O2 ;0 ,05 I FOGMFM O2 ;0 ,05 I
exakt:
6 ,3 80.000
504.000
6 , 296 80.000
503.680
Die Schätzungen liegen deutlich über dem maximal tolerierbaren Fehler, so dass der Prüfer zunächst das Prüffeld als nicht ordnungsmäßig ablehnt und i.d.R. den Stichprobenumfang erhöht. Bei der Fehlerreihungsmethode erfolgen die Schätzungen nach der Sortierung der gefunden fehlerhaften Geldeinheiten: 2 ª º FOG FRM « O0 ;0 ,05 ¦ Oi;0 ,05 Oi 1;0 ,05 di* » I i 1 ¬ ¼ ª¬3 4 ,75 3 0 , 45 6 ,3 4 ,75 0 , 25º¼ 80.000
334.000
(Tabelle 26)
2 ª º FOG FRM « O0;0 ,05 ¦ Oi;0 ,05 Oi 1;0 ,05 di* » I i 1 ¬ ¼
ª 2,996 4, 744 2,996 0, 45 º « » 80.000 ¬« 6, 296 4, 744 0, 25 ¼»
(exakt)
333.648
Die Schätzungen liegen auch wieder deutlich über dem maximal tolerierbaren Fehler, so dass der Prüfer zunächst das Prüffeld als nicht ordnungsmäßig ablehnt und i.d.R. den Stichprobenumfang erhöht. Bei der Durchschnittsfehlermethode wird zunächst der Mittelwert der prozentualen Fehleranteile gebildet, und anschließend erfolgt die Berechnung der Schätzwerte: ___
d*
1 2 * ¦ di 2i1
1 ( 0 , 45 0 , 25 ) 0 ,35 2 ___
Tabelle 26: FOG DFM O2;0 ,05 d * I ___
exakt:
FOG DFM O2 ;0 ,05 d * I
6,3 0,35 80000 176.400 6, 296 0 ,35 80000 176.288
6.4 Erweiterung der Auswertung um die Binomialverteilung
159
Der Schätzwert liegt bei der Durchschnittsmethode deutlich unter den bisherigen Schätzwerten, und in diesem Falle wird der Prüfer die Ordnungsmäßigkeit des Prüffeldes bestätigen. Dies zeigt die große Gefahr durch die Durchschnittsbildung, denn der Schätzwert ist trotz zwei gefundener fehlerhafter Geldeinheiten in der Stichprobe geringer als für den Fall, dass keine fehlerhafte Geldeinheit in der Stichprobe gefunden worden wäre: Tabelle 8:
FOG O0 ;0 ,05 I
3 80.000
exakt:
FOG O0 ;0 ,05 I
2 ,996 80.000
240.000 239.680
Die kritische Einschätzung der Durchschnittsmethode für den Einsatz in der Praxis der Jahresabschlussprüfung wird noch deutlicher, wenn man überlegt, dass noch mehr, aber prozentual sehr kleine fehlerhafte Geldeinheiten gefunden würden. Dies kann dazu führen, dass die Schätzung der Fehlerobergrenze sogar abnimmt.
6.4 Erweiterung der Auswertung um die Binomialverteilung Die Auswertung kann auch auf Basis der Binomialverteilung erfolgen. Die Binomialverteilung wird allerdings bis dato in der Praxis der Jahresabschlussprüfung bei der Anwendung des Monetary Unit Sampling nicht eingesetzt, 269 da die Poissonverteilung insbesondere bei der Entwicklung der Methode in den 60ern und 70ern den Vorteil hatte, dass die dafür notwendige Tabelle der Faktoren unabhängig ist vom Stichprobenumfang. Erst bei der späteren Ermittlung der Fehlerobergrenze und der Punktschätzung wird der Paramater Ȝ in die Komponenten n und P zerlegt. Für die Binomialverteilung sind solche Tabellen immer abhängig vom Stichprobenumfang n, d.h. der Prüfer braucht für jeden möglichen Stichprobenumfang eine entsprechende Tabelle. Dies war zu der Zeit der Entwicklung des Verfahrens nicht praktikabel, ist jedoch heutzutage mit modernen Tabellenkalkulationsverfahren, statistischer Software und Internet kein Problem. Im Rahmen dieser Arbeit werden die Berechnungen der Fehlerobergrenze auf Basis der Binomialverteilung dargestellt, da diese für den Einsatz im Rahmen der Jahresabschlussprüfungen am Bedeutendsten sind. Um die Ergebnisse mit den Ergeb269 Eigene Untersuchungen und Befragungen.
160
6 Auswertung beim Monetary Unit Sampling
nissen der Beispielrechnungen anhand der Poissonverteilung aus dem Abschnitt 6.3.4 zu vergleichen, werden auch die entsprechenden Berechnungen mit der Binomialverteilung auf Basis der Angaben aus Abschnitt 6.3.4 durchgeführt. Die Auswertungen erfolgen auch bei Anwendung der Binomialverteilung nach den gleichen drei Methoden, mit denen auch schon die Auswertungen mit Hilfe der Poisson-Verteilung erfolgten. Da die Binomialverteilung mit n und P zwei Funktionsparameter besitzt, hängt der Pk,Į-Wert in den folgenden Berechnungen und Formeln von dem vorgegebenen Stichprobenumfang n ab. Der Pk,ĮWert variiert mit dem vorgegeben Wert für n: Pk ,D
Pk ,D ( n )
In den weiteren Ausführungen wird zur übersichtlicheren Darstellung weiterhin das Symbol Pk,Į verwendet, unter der Prämisse, dass ein bestimmter Stichprobenumfang n vorgegeben ist. Die Maximalfehlermethode (MFM) nutzt die konservative Möglichkeit, die Fehlerobergrenze so zu berechnen, wie es bei vollständig fehlerhaften Geldeinheiten, die hier nicht mehr explizit betrachtet werden, der Fall wäre: FOGMFM Pk ,D I n
Pk ,D Y
bzw. k ª º FOGMFM « P0 ,D ¦ Pi ,D Pi 1,D » I n i 1 ¬ ¼
MLEMFM =Y Pˆ MUS
Y S nMUS
Y
k n
k ª P Pi ,D Pi 1,D »º Y ¦ « 0 ,D i 1 ¬ ¼
I k
Bei der Fehlerreihungsmethode (FRM) werden die fehlerhaften (überbewerteten) Geldeinheiten in der Stichprobe nach fallender Größe sortiert, um die größeren Fehler auch entsprechend mit den größeren Faktoren zu gewichten
1
t
d1* t d 2* t d3* t
... t d k* ! 0
Nach der Sortierung anhand des Fehlerausmaßes kann in bereits bekannter Art und Weise die Berechnung der Fehlerobergrenze berechnet werden.
6.4 Erweiterung der Auswertung um die Binomialverteilung
k ª º FOG FRM « P0 ,D ¦ Pi ,D Pi 1,D d i* » I n i 1 ¬ ¼
k
MLE
FRM
Y
¦d
* i
i 1
n
161
k ª *º « P0 ,D ¦ Pi ,D Pi 1,D di » Y i 1 ¬ ¼
k
I ¦ d i* i 1
Die Durchschnittsfehlermethode (DFM) arbeitet mit dem durchschnittlichen Fehler der in der Stichprobe gefunden fehlerhaften Einheiten. Eine Sortierung wie beim Fehlerreihungsverfahren ist nicht notwendig. Der Prüfer berechnet aus den Fehleranteilen ein arithmetisches Mittel der Fehleranteile: ___
1 k * ¦ di k i1
d*
Für den Fall, dass keine fehlerhafte Geldeinheit in der Stichprobe gefunden wird, setzt der Prüfer diesen Mittelwert auf eins: ___
d*
1 für k
0
Die Berechnung der Fehlerobergrenze und der Punktschätzung des Fehlerausmaßes erfolgt nach dieser Methode wie folgt: ___
FOG DFM Pk ,D d * I n k
MLE
DFM
Y
¦d i 1
n
* i
___
Pk ,D d * Y
k
I ¦ di* i 1
Auch hier kann die Formel leicht modifiziert werden, um dem Prüfer die Möglichkeit zu geben, den Faktor für die fehlerfreie Stichprobe nicht mit dem Durchschnitt zu gewichten und damit den risikoorientierten Ansatz zu unterstützen: ___ ª º FOG DFM « P0 ,D ( Pk ,D P0 ,D )d * » I n ¬ ¼
___ ª *º P ( P P )d « 0 ,D » Y 0 ,D k ,D ¬ ¼
162
6 Auswertung beim Monetary Unit Sampling
Der Stichprobenumfang beim Monetary Unit Sampling kann auf Basis der Binomialverteilung durch den folgenden Ansatz ermittelt werden, und daraus kann dann auch die allgemeine Formel abgeleitet werden, wobei zu beachten ist, dass die Werte vom Prüfer vorgegeben werden: Ansatz: bi 0 P;n
§ W · bi ¨ 0 ;n ¸ © Y ¹ ln( D ) n § W ln ¨1 © Y
§n· 0 n ¨ ¸ P (1 P ) 0 © ¹ 0
§ n·§W · § W · ¨ ¸ ¨ ¸ ¨1 ¸ © 0¹© Y ¹ © Y ¹
D n
D
· ¸ ¹
Anhand der Beispielrechnung aus Abschnitt 6.3.4 werden die folgenden Beispielrechnungen auf Basis der Binomialverteilung durchgeführt. Gesamtsumme des Kontos: Wesentlichkeit: Sicherheitsniveau: Stichprobenumfang: Stichprobenintervall:
8.000.000 Euro 240.000 Euro 95 % 100 Geldeinheiten 80.000 Euro
=Y =W = (1 – Į) =n =I
Der Prüfer kennt die Gesamtsumme des Kontos (8.000.000 Euro) und legt den maximal tolerierbaren Fehler in Form der Wesentlichkeit von 240.000 Euro und das Risiko für eine irrtümliche Annahme des Prüffeldes, des Kontos, mit 5 % (95 %ige Sicherheit) fest. Auf Basis der Binomialverteilung wird der notwendige Stichprobenumfang von n = 99 ermittelt. Das P zur Berechnung des Stichprobenumfanges auf Basis der Binomialverteilung ergibt sich aus dem Quotienten von Wesentlichkeit und Gesamtsumme des Kontos; hier 3 % (= 0,03). Der Ansatz und die Berechnung lauten: §n· bi 0 0, 03;n ¨ ¸ 0 , 030 0,97 n ©0¹ ln( 0, 05 ) 98,35 | 99 n ln( 0 ,97 )
0, 05
6.4 Erweiterung der Auswertung um die Binomialverteilung Tabelle 28:
163
Faktoren Pk;Į auf Basis der Binomialverteilung (n = 100)
Anzahl der Überbewertungen in der Stichprobe (k)
Risiko der irrtümlichen Annahme des Prüffeldes Į 1%
5%
0
0,0450
0,0295
1
0,0645
0,0465
2
0,0813
0,0616
Der Stichprobenumfang hat sich im Vergleich mit der Poisson-Verteilung verringert. Unterstellen wir jedoch zur Vergleichbarkeit der Auswertungsergebnisse einen Stichprobenumfang von n = 100, so erhöht sich das Sicherheitsniveau leicht (auf 95,2 %). Die Fehleranteile in Abhängigkeit von k und Į sind ausschnittsweise (hier für die Beispielsrechnung) der Tabelle 28 zu entnehmen. In der Stichprobe werden dann zwei fehlerhafte Geldeinheiten entdeckt: 1. fehlerhafte Geldeinheit: 45 %ige Überbewertung 2. fehlerhafte Geldeinheit: 25 %ige Überbewertung Bei den drei Verfahren ergeben sich die folgenden Fehlerobergrenzen. Auf die Berechnung der Punktschätzung wird auch im Rahmen dieser Beispielrechnung verzichtet. Maximalfehlermethode: FOGMFM P2 ,0 ,05 Y
0 , 0616 8.000.000
492.800
Fehlerreihungsmethode: k ª º FOG FRM « P0 ,D ¦ Pk ,D Pk 1,D di* » Y i 1 ¬ ¼ ª0 ,0295 0 , 0465 0 ,0295 0 , 45 º « » 8.000.000 ¬« 0 , 0616 0 , 0465 0 , 25 ¼»
327.400
164
6 Auswertung beim Monetary Unit Sampling
Durchschnittsfehlermethode: ___
d*
1 2 * ¦ di 2i1
1 (0, 45 0, 25) 2 ___
FOG DFM P2 ;0 ,05 d * Y
0,35
0 , 0616 0 ,35 8.000.000 172.480
Die Schätzungen bei der Maximalfehlermethode und bei der Fehlerreihungsmethode liegen auch bei den Berechnungen mit der Binomialverteilung deutlich über dem maximal tolerierbaren Fehler, so dass der Prüfer zunächst das Prüffeld als nicht ordnungsmäßig ablehnt und i.d.R. den Stichprobenumfang erhöht. Lediglich die Durchschnittsfehlermethode liefert eine Schätzung, die unter dem Grenzwert liegt. Somit ergeben die Berechnungen mit der Binomialverteilung auch verlässliche Schätzungen für die Fehlerobergrenze, obwohl bei zu erwartenden kleinen Fehleranteilen P die Approximationsbedingungen nicht erfüllt sind. Jedoch ist der Umfang der Grundgesamtheit sehr groß und dafür führt die Approximation der Hypergeometrischen Verteilung durch die Binomialverteilung auch zu konservativen Schätzungen. Die Probleme, die hier auch mit der Durchschnittsmethode auftreten können, sind vergleichbar mit den vorherigen Berechnungen auf Basis der Poisson-Verteilung. Durch moderne Softwarelösungen ist es mittlerweile auch möglich, alle Berechnungen beim Monetary Unit Sampling auch auf Basis der eigentlichen Verteilung, der Hypergeometrischen Verteilung, durchzuführen. Dann braucht sich der Prüfer auch bei kleineren Grundgesamtheiten keine Gedanken darüber zu machen, ob die Approximationsbedingungen erfüllt sind, und wenn nicht, ob trotzdem konservative Schätzung für die Jahresabschlussprüfung sinnvoll sind.
6.5 Erweiterung der Auswertung um Unterbewertungen Bei der Ermittlung der Fehlerobergrenze eines Prüffeldes kann der Abschlussprüfer – selbst bei der Prüfung einer Aktivposition – nicht nur fehlerfreie oder überbewertete Geldeinheiten im Prüffeld auffinden, sondern in der Stichprobe können auch unterbewertete Positionen auftreten. Theoretisch können auch vollständig unterbewertete Geldeinheiten, sogenannte Nullpositionen, vorliegen. Da das Monetary Unit Sampling – wie bereits schon mehrmals erwähnt – möglichst
6.5 Erweiterung der Auswertung um Unterbewertungen
165
auf Aktivpositionen angewendet werden sollen, ergeben sich nur wenige Gründe dafür, dass in einer Geldeinheit Unterbewertungen aufgefunden werden.270 Bei Forderungen kann dies dadurch entstehen, dass es zeitliche Buchungsunterschiede gibt. Im Vorratsvermögen können Unterbewertungen durch falsche Bewertungen entstehen. Diese Fälle sind aber nicht häufig.271 Die Softwarelösungen verarbeiten solche Unterbewertungen und reduzieren durch die gefundenen Unterbewertungen auch die Fehlerobergrenzen, was u.U. zu deutlich geringeren Fehlerobergrenzen führen kann und daher mit Vorsicht betrachtet werden sollte. Zur Vereinfachung des Verfahrens wird unterstellt, dass in den Fällen aufgefundener Unterbewertung die Unterbewertung maximal 100 % beträgt.272 Die Auswertung erfolgt für eine allgemeine Darstellung wieder mit Hilfe der Poisson-Verteilung. Bei der Gesamtauswertung eines Prüffeldes werden zuerst die Über- und Unterbewertungen separat nach Ihrer Größe geordnet. Da die Unterbewertungen per Definition ein negatives Vorzeichen haben, werden bei der Sortierung die Beträge der Fehler betrachtet. Überbewertungen:
1
t
d1* t d 2* t d3* t
Unterbewertungen:
1
t
d1*
... t d k* ! 0
t d 2* t d3* t ... t d k* ! 0
Anschließend werden, wie bereits in Abschnitt 6.3.2 dargestellt, die Punktschätzung des Fehlerausmaßes (MLE) der Über- bzw. Unterbewertung sowie die Fehlerobergrenze (FOG) für die Über- und Unterbewertung nach der Fehlerreihungsmethode, die hier angewendet wird, getrennt voneinander berechnet: 270 Vgl. HORGAN, J.M. (1996), S. 218. 271 Eigene Untersuchungen und Befragungen. Vgl. HORGAN, J.M. (1996), S. 218. In dieser Studie mit Originaldatensätzen wurden in den untersuchten Datensätzen nur Überbewertungen festgestellt. 272 Bereits in Abschnitt 6.3 wurde der Fehler je Geldeinheit (d·i) definiert. Aufgrund dieser Definition ist es dadurch möglich, dass auch unterbewertete Geldeinheiten auftreten, die zu mehr als 100 % unterbewertet sind. Da man jedoch Monetary Unit Sampling nur für die Prüfung von Aktiva anwenden soll, kann der Wirtschaftsprüfer die i.d.R. sehr seltenen Unterbewertungen über 100 % vernachlässigen, da der Wirtschaftsprüfer unterstellen kann, dass das Unternehmen schon im Eigeninteresse die eigenen Forderungen ordnungsgemäß verbucht. Ferner wird durch diese Verallgemeinerung das für den Wirtschaftsprüfer bedeutende Risiko der irrtümlichen Annahme eines Prüffeldes nicht erhöht. Zusätzlich wird im Rahmen der Berechnungen bei unterbewerteten Geldeinheiten der betragsmäßige Fehler betrachtet.
166
6 Auswertung beim Monetary Unit Sampling
k
Überbewertung:
ÜBER FOGFRM
ÜBER FRM
MLE
Y
¦d
* i
n
i 1
k ª *º « O0 ,D ¦ Oi ,D Oi 1,D di » I i 1 ¬ ¼
k
UNTER FRM
Unterbewertung: MLE
UNTER FOGFRM
k
I ¦ di*
i 1
Y
¦d
* i
i 1
n
k ª *º Y « O0 ,D ¦ Oi ,D Oi 1,D di » n i 1 ¬ ¼
k
I ¦ di* i 1
k ª O Oi ,D Oi 1,D di* º» I ¦ , 0 D « i 1 ¬ ¼ k ª * º Y « O0 ,D ¦ Oi ,D Oi 1,D di » n i 1 ¬ ¼
Nachdem der Abschlussprüfer zunächst für die Über- und die Unterbewertung die einzelnen Schätzungen berechnet hat, werden im abschließenden Schritt diese Auswertungen zusammengefasst, um eine Endaussage über das gesamte Prüffeld treffen zu können. Zunächst werden die beiden einzelnen Punktschätzungen zu einer sogenannten Netto-Punktschätzung (Most Likely Net Error) zusammengefasst.273 NETTO ÜBER UNTER MLEFRM =MLEFRM MLEFRM
Ebenso werden im zweiten Schritt die Netto-Fehlerobergrenzen berechnet. Dabei
NETTO(Ü) erhält man eine Netto-Fehlerobergrenze für die Überbewertung FOGFRM
NETTO(U) : und für die Unterbewertung FOGFRM NETTO(Ü) FOGFRM
ÜBER UNTER FOGFRM MLEFRM
NETTO(U) FOGFRM
UNTER ÜBER FOGFRM MLEFRM
273 Vgl. LESLIE, D.A./ TEITLEBAUM, A.D./ ANDERSON, R. J. [1979], S. 130. Die Schätzfunktion beim Monetary Unit Sampling erfüllt u.a. die Eigenschaft der Erwartungstreue und der Linearität.
6.5 Erweiterung der Auswertung um Unterbewertungen
167
Im Rahmen der Abschlussprüfung führen die Nettobetrachtungen dazu, dass die Fehlerobergrenze durch das Auffinden von unterbewerteten Geldeinheiten ceteris paribus niedriger ist als in dem Fall, dass nur überbewertete Geldeinheiten gefunden werden. In besonderen Konstellationen kann die Fehlerobergrenze auch geringer werden als für den Fall, dass gar keine fehlerhaften Geldeinheiten gefunden werden. Dies sollte für den Einsatz in der Jahresabschlussprüfung durchaus wieder kritisch gesehen werden. Ferner besteht für den Wirtschaftsprüfer die Möglichkeit, die Ergebnisse der getrennten Auswertung von Über- und Unterbewertung zu einem Konfidenzintervall für den Soll-Wert des Prüffeldes zusammen zufassen. Dabei muss der Wirtschaftsprüfer jedoch beachten, dass sich bei einem zweiseitigen Intervall die Irrtumswahrscheinlichkeiten addieren, so dass bezogen auf das vorherige Beispiel der Sollwert X des Prüffeldes mit einer Wahrscheinlichkeit von 90 % im nachfolgenden Intervall liegt: NETTO(U) NETTO(Ü) Y FOGFRM d X d Y FOGFRM
Ein solches Intervall ist jedoch für den praktischen Einsatz nur bedingt nutzbar, jedoch unterstützen die Softwarepakete solche Auswertungen.274 Diese berechnen aber meist die Nettopunktschätzungen sowie die Fehlerobergrenzen für die Über- und Unterbewertung. Allerdings sind die dazugehörigen Interpretationen in verbaler Form in zumindest bei einen der großen Softwarepakete höchst kritisch zu sehen, denn die Punktschätzungen (MLE) werden als die wahrscheinlichste Über- bzw. Unterbewertung des Prüffeldes dem Prüfer suggeriert und das
NETTO ÜBER UNTER ; MLEFRM ; MLEFRM ist nicht korrekt. Die Punktschätzungen MLEFRM
sind
nicht der wahrscheinlichste Wert für eine Unter- oder Überwertung, denn die Wahrscheinlichkeit, dass die Unter- oder Überwertung genau diesem Wert geschätzten Wert entspricht, ist gleich Null.
274 Eigene Untersuchungen und Befragungen.
168
6 Auswertung beim Monetary Unit Sampling
6.6 Berechnung des Stichprobenumfanges Die Bestimmung des Stichprobenumfanges ist, wie bei der Beispielrechnung in Abschnitt 6.3.4 zu ersehen, auf Basis der Poissonverteilung und der entsprechenden Tabellen einfach durch zu führen. Unter Berücksichtung der Gesamtsumme Y, der Wesentlichkeit W sowie dem Risiko für die irrtümliche Annahme des Prüffeldes ergibt sich die folgende Berechnung: n
ln(D )
Y W
Für den Einsatz des Monetary Unit Sampling als Schätzverfahren reicht diese Berechnung normalerweise aus. In einigen wenigen Literaturquellen werden jedoch auch Erweiterungen auf Basis eines Einsatz des Monetary Unit Sampling als Testverfahren dargestellt, die an dieser Stelle kurz zusammengefasst werden. Für die Bestimmung des notwendigen Stichprobenumfanges hat der Prüfer die folgenden Größen zu berücksichtigen:275
das Fehlurteilsrisiko : Dmax
das Fehlurteilsrisiko : Emax
die Fehlergrößen:
P0, P1, M0, M1
Nachdem der Wirtschaftsprüfer die für die Prüfung notwendigen Größen festgesetzt hat, erfolgt die Bestimmung des Stichprobenumfanges dadurch, dass die zwei folgenden Bedingungen gleichzeitig erfüllt werden. D 1) Die Wahrscheinlichkeit für einen Fehler 1. Art beträgt höchstens MAX 2
2) Die Wahrscheinlichkeit für einen Fehler 2. Art beträgt höchstens E MAX 2
Interessiert den Wirtschaftsprüfer beispielsweise als Testgröße den Fehlerbetrag M, kann der Stichprobenumfang durch Iteration berechnet werden. Die Berechnungsgrößen
275 Vgl. DEINDL, J. [1981], S. 1588.
6.6 Berechnung des Stichprobenumfanges
O§ D ¨ ©
O§ E ¨ ©
MAX
2
MAX
2
169
· ;k ¸ ¹
· ;k ¸ ¹
stellen dabei die untere bzw. obere Vertrauensgrenze auf Basis der unterstellten Poisson-Verteilung dar.276 Der Wirtschaftsprüfer kann dabei für die Werte dieser Berechnungsgrößen in Abhängigkeit von D bzw. E und der kritischen Fehlerzahl k auf entsprechende Tabellenwerke zurückgreifen. In der testtheoretischen Betrachtung, die in der Praxis der Abschlussprüfung vollumfänglich so nicht eingesetzt wird, und daher im Rahmen dieser Arbeit nur der Vollständigkeit erwähnt wird, bezeichnet ȕ (=Fehler 2. Art) wieder den Fehler für die irrtümliche Annahme. Daher entspricht die Tabelle 30 der Tabelle 26, die bei der Schätzung durch das Monetary Unit Sampling eingesetzt wird. Da wir hier eine zweiseitige Betrachtung haben, werden die Į- und die ȕ-Werte halbiert.277 Tabelle 29:
Tabelle für Fehler 1. Art
Anzahl der Überbewertungen in der Stichprobe (k)
D MAX 2
1%
5%
10 %
0
0,01
0,05
0,11
1
0,15
0,36
0,53
2
0,44
0,82
1,10
3
0,82
1,37
1,75
4
1,28
1,97
2,43
5
1,79
2,61
3,15
6
2,33
3,29
3,90
276 Vgl. KAPLAN, R.S. [1975/I], S. 128. 277 Vgl. DEINDL, J. [1981], S. 1587. Bei diesen Betrachtungen ist wieder zu beachten, dass hier Į und ȕ der Fehler 1. und der Fehler 2. Art sind, wie diese im den testtheoretischen Grundlagen besprochen worden sind. Somit ist Į nicht mehr das Risiko einer irrtümlichen Annahme des Prüffeldes wie in den sonstigen Betrachtungen.
170
6 Auswertung beim Monetary Unit Sampling
Tabelle 30:
Tabelle für Fehler 2. Art
Anzahl der Überbewertungen in der Stichprobe (k)
EMAX 2
1%
5%
10 %
0
4,61
3,00
2,31
1
6,64
4,75
3,89
2
8,41
6,30
5,33
3
10,05
7,76
6,69
4
11,61
9,16
8,00
5
13,11
10,52
9,28
6
14,57
11,85
10,54
Der Wirtschaftsprüfer hat bei der Bestimmung des notwendigen Stichprobenumfanges die Werte für Y, M0, M1, D MAX und E MAX vorzugeben. Danach erfolgt 2
2
die Berechnung iterativ, bis der zu ermittelnde Stichprobenumfang n die nachstehende Bedingung erfüllt. Der Wirtschaftsprüfer beginnt zuerst mit einer kritischen Fehlerzahl von k = 0.278 Die entsprechenden Werte aus den Tabellen werden dann in die Formel eingesetzt. Liegt der berechnete Mindeststichprobenumfang n in dem ermittelten Intervall, d.h., beide Bedingungen werden erfüllt, wird die untere Intervallgrenze als notwendiger Stichprobenumfang akzeptiert. Werden die Bedingungen nicht beide erfüllt, so erhöht man die kritische Fehlerzahl um jeweils einen weiteren Fehler, bis die folgende Bedingung erfüllt ist:
Y Y O dnd O§ DMAX · · ;k ¸ ;k ¸ M 1 §¨© EMAX M ¨ 0 2 ¹ © 2 ¹ Bei dieser Art der Berechnung des Stichprobenumfanges kann der Wirtschaftsprüfer beide Risiken (D und E) kontrollieren, jedoch ist für den Prüfer das E-Risi-
278 Das maximale Fehlerausmaß wird dabei auf 100 % sowohl für Über- als auch für Unterbewertungen festgesetzt, um dadurch den größtmöglichen Fehler zu unterstellen.
6.6 Berechnung des Stichprobenumfanges
171
ko die größere Gefahr.279 Dennoch darf der Wirtschaftsprüfer schon mit Rücksicht auf seinen Kunden, dem zu prüfenden Unternehmen, das D-Risiko nicht unterschätzen. Für die typischen Einsätze des Monetary Unit Sampling als Schätzverfahren, bei dem der Haupteinsatz darin besteht, das Ausmaß von Überbewertungen zu schätzen, sind solche Überlegungen nicht notwendig, denn in diesem Bereich interessiert den Prüfer in erster Linie das Risiko, Überbewertungen im Prüffeld auf Basis der Stichprobe nicht zu entdecken. Dieses Risiko, das in diesem Zusammenhang – anders als in der Testtheorie – mit Į bezeichnet wird, und die vom Prüfer auf Basis der entsprechenden Normen festgelegte Wesentlichkeit sind letztendlich die Parameter, die in der Anwendung des Monetary Unit Sampling den Stichprobenumfang unter Beachtung der Gesamtsumme des Kontos bestimmen. Unter besonderen Umständen kann dieser Stichprobenumfang dann noch dadurch variiert (gesenkt) werden, in dem der Prozentsatz der Fehlerhaftigkeit noch mit berücksichtigt wird, was aber aus Prüfersicht als sehr riskant eingeschätzt muss und auch aus statistischer Sicht bei den Softwarepaketen nicht nachvollziehbar ist.280
279 Vgl. KAPLAN, R.S. [1975/I], S. 127. 280 Eigene Untersuchungen und Befragungen.
7 Empirische Untersuchung zur Anwendung von Stichprobenverfahren Im Rahmen dieser Arbeit wurde sowohl im Jahr 1994, als auch erneut im Jahr 2009, ein Fragebogen mit dem Titel „Stichprobeneinsatz im Rahmen der Jahresabschlussprüfung“ entwickelt, an Wirtschaftsprüfungsgesellschaften verschickt, an Prüfer und Prüfungsassistenten persönlich verteilt und ausgewertet.281 Ziel dieser empirischen Untersuchung ist es zu zeigen, wie häufig Stichprobenverfahren im Allgemeinen und statistische Stichprobenverfahren im Besonderen genutzt werden und wie sich der Einsatz dieser Verfahren in den letzten 15 Jahren verändert hat. Aus Sicht der Praxis der Jahresabschlussprüfung werden auch die Vor- und Nachteile explizit dargestellt. Um einen Stichprobenumfang von n1995 = 183 in der Befragung aus dem Jahre 1994 und von n2009 = 209 bei der aktuellen Befragung zu erreichen, wurde der Fragebogen bewusst auf zehn Fragen beschränkt, damit der Prüfer trotz des sehr zeitintensiven Tagesgeschäfts diese Fragen beantwortet. Die Rücklaufquote bei der Befragung von 1994, die zum größten Teil noch auf dem klassischen Briefverkehr und persönlichen Befragungen im Rahmen der Schulungen beruhte, lag bei rund 50 %. Bei der Befragung im Jahr 2009 wurde neben zufälligen Versendungen an große und mittelständische Wirtschaftsprüfungsgesellschaften auch ehemalige und teilweise auch aktuelle Schulungsteilnehmer direkt angesprochen und meist per E-Mail befragt. Da die Schulungen fast im gesamten Bundesgebiet stattfanden und -finden und die Teilnehmer aus verschiedensten Wirtschaftsprüfungsgesellschaften aus der gesamten Republik kommen, werden fast alle Regionen berücksichtigt. Im Gegensatz jedoch zu einer Stichprobe, die Ruhnke zitiert,282 wurden nicht nur Wirtschaftprüfer, sondern – besonders in den Schulungen – sogenannte Assistant Manager befragt, da diese meist das operative Geschäft der Prüfung beim Man281 Der Fragebogen in 2009 ist gegenüber der Befragung 1994 geringfügig erweitert worden. Darauf wird in den weiteren Ausführungen noch eingegangen. 282 Vgl. RUHNKE, K./ von TORKLUS, A. (2008), S. 1120. Diese Umfrage ist allerdings schon aus dem Jahr 2002 und wie bereits erwähnt, hatten einige WP-Gesellschaften zu der Zeit den Einsatz von Monetary Unit Sampling und anderen statistischen Stichprobenverfahren nicht aktiv unterstützt. B. Giezek, Monetary Unit Sampling, DOI 10.1007/978-3-8349-6588-2_7, © Gabler Verlag | Springer Fachmedien Wiesbaden GmbH 2011
174
7 Empirische Untersuchung zur Anwendung von Stichprobenverfahren
danten und damit auch den Einsatz von Stichprobenverfahren durchführen. Dies führt zu den Unterschieden insbesondere bei der Akzeptanz statistischer Stichprobenverfahren im Vergleich zu der eben angesprochenen Befragung.283 Vier Teilnehmer der Befragung, die laut Vermerk auf dem Fragebogen nicht oder nicht mehr aktiv in der Prüfung arbeiten, fanden keine Berücksichtigung in der Stichprobe. Bei den versendeten Anfragen lag die Rücklaufquote bei über 60 %, jedoch lag es sicher auch daran, dass die Bitte um Weiterleitung an Kollegen – auch außerhalb der eigenen Gesellschaft zu weiteren Rückläufern aus dieser Gruppe führte, die mitgezählt worden sind. Bei der direkten Ansprache lag die Quote bei über 70 %. Auf die erste Frage, ob im Rahmen der Jahresabschlussprüfung Stichprobenverfahren verwendet werden, antworteten 1994 82 % der Befragten mit „ja“ und 18 % mit „nein“ (siehe Abbildung 37). Im Jahre 2009 fiel der Anteil der Prüfer, die keine Stichprobenverfahren nutzen auf mittlerweile nur 4% der Befragten (vgl. Abbildung 38).
ja nein
18%
82%
Abbildung 37:
Benutzung von Stichprobenverfahren 1994
283 Vgl. RUHNKE, K./ von TORKLUS, A. (2008), S. 1120. Nur 15 % der Befragten nutzen statistische Stichprobenverfahren. Von diesen 15 % der Befragten nutzen allerdings ca. 80 % Monetary Unit Sampling wie auch in meiner noch folgenden Auswertung.
7 Empirische Untersuchung zur Anwendung von Stichprobenverfahren
175
4% ja nein
96%
Abbildung 38:
Benutzung von Stichprobenverfahren 2009
Somit ist festzustellen, dass der Anteil von Stichprobenverfahren aus den bereits bekannten Gründen innerhalb der Wirtschaftsprüfung in den letzten
2 15 Jahren, auf Basis eines Chi-Quadrat-Test F emp.
18,9 , signifikant zugenom-
men hat. Die Stichprobenverfahren werden sowohl heute als bereits vor 15 Jahren für verschiedene Zwecke eingesetzt, wobei am häufigsten – fast in 90 % aller Fälle – der Bereich „Forderungen aus Lieferung und Leistung“ genannt wurde. Ferner wurden auch Vorräte (Inventur) – ca. 80 % der Fälle – sowie Verbindlichkeiten (50 % der Fälle) genannt. Dies deckt sich ungefähr mit den Werten aus 1994, wobei diese Frage im aktuellen Fragebogen oft detaillierter, mit zusätzlichen Prüfgebieten, beantwortet wurde. Dazu gehörten:
Materialreklamations-Rückstellungen
Prozessprüfung
Prüfung des internen Kontrollsystems
Auswahl von Transaktionen zur Zinskalkulation
SOX (Sarbanes-Oxley Act)
Anlagevermögen
176
7 Empirische Untersuchung zur Anwendung von Stichprobenverfahren
Zugänge im Anlagevermögen
Umsatztesting
Journal Entry Testing
Inputtests Personalrückstellungen
Preistests
NRV-Test
u.e.m.
Nicht alle Stichprobenverfahren basieren auf statistischen Methoden, daher erfolgt an dieser Stelle nur eine Aufzählung. Es zeigt sich jedoch, wie vielfältig und unterschiedlich der Einsatz von Stichprobenverfahren im Rahmen der deutschen Jahresabschlussprüfung ist. Umso wichtiger ist, dass durch die Verwendung statistischer Stichprobenverfahren auch objektiv nachvollziehbare Methoden eingesetzt werden. Dieser Einsatz von statistischen Verfahren im Rahmen der Jahresabschlussprüfung ist in den letzten 15 Jahren deutlich gestiegen. Während Mitte der 90er Jahre der Anteil der Prüfer, die statistische Verfahren nutzten, noch bei knapp 50 % Prozent lag, beträgt dieser Anteil mittlerweile über 80 %. Als Hauptgrund werden die verbesserten Angebote seitens der Prüfungssoftware oder die Erweiterung bestehender Officepakte genannt. Gerade in den letzten Jahren ist, nach Aussagen aus der Branche,284 der Einsatz von Stichprobenverfahren stark gestiegen (vgl. Abbildung 39 und 40). Bei dem Einsatz statistischer Stichprobenverfahren hat sich auch gezeigt, dass Monetary Unit Sampling mittlerweile das Standardverfahren im Rahmen der Jahresabschlussprüfung ist. Die anderen Verfahren sind deutlich in den Hintergrund getreten und werden nur noch gelegentlich eingesetzt. Ausgewertet wurden nur die Fragebögen der Teilnehmer, die statistische Stichprobenverfahren nutzen. Nur in zwei Fällen kam eine Doppelnennung von zwei Verfahren auf, so dass die Doppelzählung nicht berücksichtigt wurde (vgl. Abbildung 41 und 42).
284 Eigene Untersuchungen und Befragungen.
7 Empirische Untersuchung zur Anwendung von Stichprobenverfahren
ja nein
46% 54%
Abbildung 39:
Benutzung von statistischen Stichprobenverfahren 1994
ja nein
19%
81%
Abbildung 40:
Benutzung von statistischen Stichprobenverfahren 2009
177
178
7 Empirische Untersuchung zur Anwendung von Stichprobenverfahren
9% Mittelwertschätzung
24%
21%
geschichtete Mittelwertschätzung Verhältnisschätzung Differenzschätzung
9%
Monetary Unit Sampling andere
19% 18%
Abbildung 41:
Überblick über die genutzten statistischen Verfahren 1994
1%
1% 10% 11%
1% Mittelwertschätzung geschichtete Mittelwertschätzung Verhältnisschätzung Differenzschätzung
76%
Abbildung 42:
Monetary Unit Sampling andere
Überblick über die genutzten statistischen Verfahren 2009
7 Empirische Untersuchung zur Anwendung von Stichprobenverfahren
179
Bei der Befragung 1994 nutzten 9 % das – ehemals unter dem Namen Dollarunit sampling bekannte – Verfahren. Damals wurde das Verfahren hauptsächlich von den Mitarbeitern zweier großer Wirtschaftsprüfungsgesellschaften eingesetzt. In 2009 jedoch kommen die Antworten, bei denen Monetary Unit Sampling das Standardverfahren ist, von Wirtschaftsprüfungsgesellschaften aller Größen. Auch hier hat nach Aussagen der Prüfer neben den bekannten, bereits angeführten Vorteilen, hauptsächlich die Softwareunterstützung als wichtiger Faktor für die starke Entwicklung in den letzten Jahren den größten Einfluss. Natürlich hat damit auch der Bekanntheitsgrad des Verfahrens zugenommen, wenn auch viele aus der jüngeren Generation der Prüfer den älteren Begriff „Dollarunit Sampling“ gar nicht mehr kennen und ihn auch nicht mit dem Verfahren des Monetary Unit Sampling in Verbindung bringen. Als Indiz hierfür könnten die ungefähr 10 % der Fragebögen gesehen werden, bei denen Monetary Unit Sampling als angewandtes Verfahren gekennzeichnet wurde, aber gleichzeitig das dahinter stehende „Dollar-unit Sampling“ nicht als Synonym anerkannt, sondern bewusst durchgestrichen wurde. Auf die Frage, ob das Verfahren des Monetary Unit Sampling bekannt ist, antworteten 2009 über 80 % mit „ja“. Zum Vergleich lag dieser Wert vor fünfzehn Jahren erst bei 33 % (vgl. Abbildung 43 und 44).
ja nein 33%
67%
Abbildung 43:
Bekanntheit von Monetary Unit Sampling 1994
180
7 Empirische Untersuchung zur Anwendung von Stichprobenverfahren
ja 16%
nein
84%
Abbildung 44:
Bekanntheit von Monetary Unit Sampling 2009
Auf die Frage nach dem Einsatz von Prüfungssoftware, die in der Befragung 2009 erstmalig gestellt wurde, zeigte sich, dass IDEA mittlerweile eine besondere Stellung bei der Prüfungssoftware hat, die auch statistische Stichprobenverfahren unterstützen. Wie bereits erwähnt, nutzen auch die Betriebsprüfer der deutschen Finanzverwaltung diese Software und unterstreichen damit die Bedeutung dieser Software für die Branche. Das Programm ACL, das ursprünglich in den 70er Jahren das erste Programm für die Wirtschaftsprüfung war, kommt nach dieser Untersuchung auf den zweiten Rang. Da Excel mittlerweile keine, für die Jahresabschlussprüfung mehr bedeutende Zeilenbeschränkung hat, beginnen auch mehr und mehr, insbesondere kleinere und mittelständische Prüfungsgesellschaften, einige Tools auf Basis dieser Software zu entwickeln. Als weitere Programme wurden zusätzlich genannt:
Caseware
Monarch
SPSS
CMA Sampling
7 Empirische Untersuchung zur Anwendung von Stichprobenverfahren
5%
181
IDEA
7%
ACL Excel andere
33%
Abbildung 45:
55%
Einsatz von Prüfungssoftware 2009
Während der Kostendruck oft als ein großer Vorteil für den Einsatz von Auswahlprüfungen im Allgemeinen und bei dem Einsatz statistischer Verfahren im Speziellen gesehen wird, zeigen die Befragungen mitunter, dass auch viele andere Gründe für deren Einsatz sprechen. kostengünstig
4% zeitsparend
20% 16% 22% 38%
objektive Nachvollziehbarkeit der Prüfungshandlung einfache Handhabung andere
Abbildung 46:
Vorteile statistischer Prüfungsverfahren 1994
182
7 Empirische Untersuchung zur Anwendung von Stichprobenverfahren
Risikominimierung einfache Handhabung kostengünstig objektive Nachvollziehbarkeit der Prüfungshandlung Ausschalten subjektiver Fehler
Abbildung 47:
Vorteile statistischer Prüfungsverfahren 2009
Bei der Befragung im Jahre 1994 waren keine Mehrfachnennungen zugelassen (und gezählt worden) und es ergab sich damals folgendes Bild (vgl. Abbildung 46). Als wichtiges Kriterium wurde die objektive Nachvollziehbarkeit der Prüfungshandlungen gesehen, gefolgt von dem Zeit- und dem davon sicher auch abhängigen Kostenfaktor. Bei der Befragung in 2009 wurde dann ganz bewusst nach mehreren Vor- und Nachteilen für den Einsatz statistischer Prüfungsverfahren gefragt (vgl. Abbildung 47 und 49). Den wichtigsten Vorteil, mit 68 %, sehen die Prüfer in der Risikominimierung, die durch den Einsatz solcher Methoden erwartet wird. Damit sachlogisch verknüpft ist die objektive Nachvollziehbarkeit, die die Prüfungshandlungen auch gegenüber Dritten erklären kann. Diesen Vorteil sahen immerhin noch über die Hälfte der Wirtschaftsprüfer in dieser Stichprobe. Das Ausschalten subjektiver Fehler, das teilweise noch ergänzt wurde, geht in eine ähnliche Richtung. Die Zeitersparnis, die mit einer stichprobenartigen Prüfung verbunden ist, wurde noch von fast der Hälfte der Befragten als Vorteil genannt. Erst dann kam die einfache Handhabung („nur“ 35 %), die scheinbar von vielen
7 Empirische Untersuchung zur Anwendung von Stichprobenverfahren
183
Wirtschaftsprüfern doch nicht so empfunden wird. Zum Schluss wird erst der Kostenvorteil mit nur 31 % genannt, den viele so nicht mehr sehen. Die Softwarepakete für die statistische Jahresabschlussprüfung sind auf jeden Fall sehr schulungsintensiv und leider ist auch die Sprache – wie bei einigen Programmen aus dem englischen Sprachraum – noch nicht optimal (insbesondere in den Auswertungsbereichen) der deutschen Fachsprache angepasst worden. Die Nachteile der Verfahren liegen in der Verständlichkeit und Nachvollziehbarkeit. Dies bestätigen 2/3 der Befragten und zeigen damit auf, dass trotz Schulungen und regelmäßigem Einsatz der Programme meist die Kenntnis und das Verständnis der statistischen Seite der Stichprobenverfahren fehlen. Hierin steckt viel Potenzial auch für die Verbesserung der Programme. Wenn der Prüfer nicht nur die Eingaben korrekt tätigt, sondern auch nachvollziehen kann, warum das Programm zu dieser Auswahl und anschließender Bewertung kommt, dann können die Schnittstellen zwischen den Softwareentwicklern und den Nutzern, wie auch schon bei vielen anderen Programme belegt, optimiert werden. Über die Hälfte der Prüfer sehen als großen Nachteil statistischer Verfahren, dass die Prüfer- und Prüfungserfahrung in diesem Rahmen nicht genutzt werden. Hier beginnt langsam auch ein Umdenken in einigen Wirtschaftsprüfungsgesellschaften, die versuchen, über z.B. Bayesianische Ansätze die a priori Informationen zu nutzen. Dies ist aber erst der Anfang und in diesen Bereichen besteht noch viel Forschungsbedarf. Schon länger hingegen werden Methoden vorgestellt, um den hohen Stichprobenumfang, der von fast 50 % als Nachteil gesehen wird, zu verringern. Leider können dabei auch ungewollte Risiken entstehen, wie an anderer Stelle schon einmal aufgezeigt wurde. Der Kostenaspekt ist bei den befragten Wirtschaftsprüfern durchaus umstritten. Fast der gleiche Prozentsatz, der den Vorteil von Stichprobenverfahren in den Kosten sieht, sieht dies auch als Nachteil, denn gerade die Schulungen und die Lizenzen für die Software im Rahmen der Jahresabschlussprüfung sind beachtlich (vgl. Abbildung 48 und 49). Abschließend bleibt festzuhalten, dass sich die Akzeptanz für das Monetary Unit Sampling in den letzten fünfzehn Jahren deutlich erhöht hat. Aus persönlichen Befragungen war zu entnehmen, dass gerade in den letzten Jahren dies
184
7 Empirische Untersuchung zur Anwendung von Stichprobenverfahren
7%
21%
Erfahrung des Prüfers wird nicht genutzt
42%
statistischer Hintergrund oft nicht nachvollziehbar Stichprobenumfang zu hoch
30%
Abbildung 48:
andere
Nachteile statistischer Stichprobenverfahren 1994
noch mal verstärkt der Fall war. Viele Prüfer sehen aber immer noch das mangelnde Verständnis für die Zusammenhänge beim Monetary Unit Sampling als großen Nachteil und Gefahr bei dem Einsatz dieses Verfahrens.
Verständlichkeit und Nachvollziehbarkeit Prüfer- und Prüfungserfahrung wird nicht genutzt kostenintensiv (Anschaffung und Schulung bei Software) zu hoher Stichprobenumfang
Abbildung 49:
Nachteile statistischer Stichprobenverfahren 2009
8 Zusammenfassung Das Monetary Unit Sampling hat sich mittlerweile in der deutschen Prüfungspraxis als Standardverfahren für die auf dem Zufallsprinzip basierende Stichprobenprüfung durchgesetzt. Die Vorteile der wertproportionalen Auswahl gegenüber den klassischen Verfahren unterstützen den Abschlussprüfer bei dessen Umsetzung eines risikoorientierten Prüfungsansatzes. Die Vorteilhaftigkeit gegenüber den klassischen Verfahren konnte im Rahmen von Simulationen mit realen Konten deutlich gezeigt werden. Dass die Vorteilhaftigkeit auch mittlerweile von den Wirtschaftsprüfern und Prüfungsleitern deutlicher gesehen wird als noch vor der Jahrtausendwende, zeigen die Ergebnisse der durchgeführten Befragungen aus den Jahren 1994 und 2009. Durch die im Rahmen dieser Arbeit entwickelten Routinen können auch ohne aufwendige Softwareimplementierung die verschiedenen Auswahlmodalitäten des Monetary Unit Sampling in der täglichen Praxis eingesetzt werden. Auch bei den Auswertungsmethoden sind mit der Binomialverteilung Möglichkeiten aufgezeigt worden, wie die Schätzung auf Basis der Stichprobenergebnisse erfolgen kann. Bei der Weiterentwicklung des Monetary Unit Sampling, das gerade in jüngster Zeit wieder mehr Interesse in der Forschung hervorruft, sind, neben der Verbesserung der Auswertungsmethoden, insbesondere die Wechselwirkungen zu den Auswahlmethoden noch stärker zu berücksichtigen. Gerade die prüfungsfeldorientierte Auswahl von Stichproben und die damit verbundene Wahl der optimalen Methodik im Monetary Unit Sampling sind für die Prüfungsplanung als Bestandteil des risikoorientierten Prüfungsansatzes von zunehmender Bedeutung. Die Impulse und die Datensätze aus der Praxis der Wirtschaftsprüfung sind dabei besonders gefragt. Der Austausch zwischen der Forschung und der Praxis kann nur effizient erfolgen, wenn es gelingt, dass sich die statistische Methodenlehre und das Prüfungswesen in diesem Bereich noch weiter annähern.
B. Giezek, Monetary Unit Sampling, DOI 10.1007/978-3-8349-6588-2_8, © Gabler Verlag | Springer Fachmedien Wiesbaden GmbH 2011
Literaturverzeichnis ACL (2006): Risky Business: Use of Spreadsheets for Audit, Vancouver. AICPA (1982): Audit Guide: Audit Sampling, American Institute of Certified Public Accountants, New York. http://www.aicpa.org. AICPA (1999): Audit Guide: Audit Sampling, American Institute of Certified Public Accountants, New York. http://www.aicpa.org. AICPA (2008): Audit Guide: Audit Sampling, American Institute of Certified Public Accountants, New York. http://www.aicpa.org. ANDERSON, R./ TEITLEBAUM, A.D. (1973): Dollar-Unit Sampling: A Solution to the Audit Dilemma, in: Canadian Chartered Accountant, Vol. 102, No. 4, pp. 30-39. ANDERSON, R.J./ LESLIE, D.A. (1975): Discussion of Considerations in Choosing Statistical Sampling Procedures in Auditing, in: Journal of Accounting Research, Vol. 13, Supplement, pp. 53-64. APOSTOLOU, B./ ALLEMAN, F. (1991): Internal Audit Briefings, Internal Audit Sampling, Institute of Internal Auditors, USA. ARENS, A.A/ LOEBBECKE, J.K. (1981): Applications of Statistical Sampling to the Auditing, Englewood Cliffs. ARKIN, H. (1982): Sampling Methods for the Auditor: An Advanced Treatment, New York. BAILEY, A.D. JR. (1981): Statistical Auditing: Review, Concepts and Problems, New York. BAMBERG, G./ BAUR, F. (2002): Statistik. 12. Auflage, München, Wien. BIAGGIO, L. (1987): Der Einsatz von mathematisch-statistischen Modellen durch den Revisor unter Berücksichtigung der EDV-Unterstützung. Schweizerische Treuhand- und Revisionskammer, Zürich. BLEYMÜLLER, J./ GEHLERT, G./ GÜLICHER, H. (1981): Statistik für Wirtschaftswissenschaftler, 2. Auflage, München. BLUMERS, W./ FRICK, J./ MÜLLER, L. (1989): Betriebsprüfungshandbuch – einschließlich Zollprüfungen -, München.
B. Giezek, Monetary Unit Sampling, DOI 10.1007/978-3-8349-6588-2, © Gabler Verlag | Springer Fachmedien Wiesbaden GmbH 2011
188
Literaturverzeichnis
BOCK, J. (1998): Bestimmung des Stichprobenumfangs für biologische Experimente und kontrollierte klinische Studien, München. BOHLEY; P. (2000): Statistik: einführendes Lehrbuch für Wirtschafts- und Sozialwissenschaftler, München. BOSCH, K. (1996): Großes Lehrbuch der Statistik, München. BUCHNER, R. (1983/I): Stichprobenprüfung, Zufallsauswahl, in: Coenenberg, A.G./Wysocki, K.v. (Hrsg.), Handwörterbuch der Revision, Sp. 1495-1502, Stuttgart. BUCHNER, R. (1983/II): Zur Diskussion um die Frage ‘‘Zufalls- oder Urteilsstichprobe“ bei Buchprüfungen, in: Zeitschrift für betriebswirtschaftliche Forschung, Heft 6, S. 478-502. BUCHNER, R. (2002): Buchführung und Jahresabschluss, 6. Auflage, München. CASEWARE IDEA INC.(2004): IDEA 2004 User Guide, Toronto. COENENBERG, A.G. (2005): Jahresabschluss und Jahresabschlussanalyse, 20. Auflage, Stuttgart. DEINDL, J. (1981): Die Prüfung der Vorräte mit Hilfe mathematischer Stichprobenverfahren, Frankfurt am Main. DEINDL, J. (1982): Stichprobenprüfung mit Hilfe von Dollar-Unit Sampling, in: Betriebs-Berater, Heft 26, S. 1585-1590. DELANEY, P.R./ GLEIM, I.N. (1989): CPA Examination Review 1989 Edition, New York. DOHMS, H.J. (2009): Abwerbungen – Beraterfirmen balgen sich um Mitarbeiter, in: Financial Times, Ausgabe 17.09.2009, Seite 5. ELLIOT, R.K./ ROGERS, J.R. (1972): Relating Statistical Sampling to Audit Objectives, in: Journal of Accountancy, pp. 46-55. FIENBERG, S.E./ NETER, J./ LEITCH, R.A. (1977): Estimating the Total Overstatement Error in Accounting Populations, in: Journal of the American Statistical Association, pp. 295-302. FÖRSCHLE, G./ PEEMÖLLER, V.H. (2004): Wirtschaftsprüfung und Interne Revision, Heidelberg. FRANK, G./ SCHNEEWEIS, L. (1985): Verzerrte Stichproben trotz Zufallsauswahl – Notwendigkeit eines Repräsentativitäts-Checks –, in: Zeitschrift für betriebswirtschaftliche Forschung, S. 597-586.
Literaturverzeichnis
189
GARSTKA, S.J. (1977): Models for Computing Upper Error Limits in DollarUnit Sampling, in: Journal of Accounting Research, pp. 179-192. GARSTKA, S.J./ OHLSON, P.A. (1979): Ratio Estimation in Accounting Populations with Probabilities of Sample Selection Proportional to Size of Book Values, in: Journal of Accounting Research, pp. 23-59. GILL, R.D. (1983): The Sieve Method as an Alternative to Dollar-Unit Sampling: The Mathematical Background, Mathematisch Centrum, Amsterdam. GLEIM, I.N./ FISHER, D.L. (1987): CMA Examination Review, Volume I. 3. Auflage, Gainesville. GLEIM, I.N./ HILLISION, W.A. (1983): Auditing & EDP: Objektive Questions and Explanations, Gainesville. GOHOUT, W./ WEBERSINKE, H. (1988): Grundzüge der statistischen Methodenlehre, Gießen. GOODFELLOW, J.L./ LOEBBECKE, J.K./ NETER, J. (1974/I): Some perspectives on CAV sampling plans (Part I) , in: CA magazine, pp.23-30. GOODFELLOW, J.L./ LOEBBECKE, J.K./ NETER, J. (1974/II): Some perspectives on CAV sampling plans (Part II) , in: CA magazine, pp. 47-53. GRAUMANN, M. (2009): Wirtschaftliches Prüfungswesen, 2. Auflage, Herne. GROLL, M./ GIEZEK, B. (2007): Wer entscheidet, wohin ein Fußballspieler wechselt?, in: wisu 11/07, S. 1421-1423. GUY, D./ CARMICEL, D. / WHITTINGTON, R. (2002): Audit Sampling, 5. Auflage, Hoboken. HARTUNG, J./ ELPELT, B./ KLÖSENER, K.-H. (2005): Statistik: Lehr- und Handbuch der angewandten Statistik, 14. Auflage, München. HEROLD, M. (2009): Einführung in das Monetary Unit Sampling Verfahren (MUS) mit IDEA, Hamburg.HGB (2009) 49. Auflage, München. HICKOK, R.S. (1984): Looking to the future: a Key to Success, in: Journal of Accountancy, January 1984, S. 77-84. HÖMBERG, R. (1989/I): Auswahlprüfung, Lexikon der Rechnungslegung und Abschlussprüfung, S. 199-200, Marburg. HÖMBERG, R. (1989/II): Fehlerreihungsmethode, in: Lexikon der Rechnungslegung und Abschlussprüfung, S. 253-254, Marburg.
190
Literaturverzeichnis
HOMMELHOFF, P./ MATTHEUS, D. (2007): Risikomanagementsystem im Entwurf des BilMoG als Funktionselement der Corporate Covernance, in: BetriebsBerater, S. 2787-2791, Frankfurt. HOOGDUIN, L.A./ HALL, T.W./ TSAY, J.J. (2008): Modified Sieve Sampling: A Method for Single- and Multi-Stage Probability-Proportional-to-Size Sampling, New Jersey. HORGAN, J.M. (1996): The Moment Bound with Unrestricted Random, Cell and Sieve Sampling of Monetary Units, in: Accounting and Business Research, Vol. 26, No. 3, S. 215-223. HORGAN, J.M.(1997): Stabilizing the Sieve Sample Using PPS, in: Auditing: A Journal of Practice & Theory, Vol. 16, No. 2, pp. 40-51. HORGAN, J.M. (1998): Stabilized Sieve Sampling: A Point-Estimator Analysis, in: Journal of Business & Economic Statistics, Vol. 16, No. 1, pp. 42-51. HORWITZ, D.G/ THOMPSON, D.J. (1954): A generalization of sampling from a finite universe, in: Journal of the American Statistical Association, Heft 47, S. 663-685. IDW (1977): Fachgutachten des Hauptfachausschusses Nr. 1/1977: Grundsätze ordnungsmäßiger Durchführung von Abschlussprüfungen, in: Die Wirtschaftsprüfung, S. 210-214. IDW (1988): Stellungnahme HFA 1/1988: Zur Anwendung stichprobengestützter Prüfungsmethoden bei der Jahresabschlussprüfung, in: Die Wirtschaftsprüfung, Heft 8, S. 240-247. IDW PS 200 (2000): www.idw.de. IDW PS 261 (2006): www.idw.de. IDW (2006): WP Handbuch: Wirtschaftsprüfung, Rechnungslegung, Beratung, Band I, 13. Auflage, Düsseldorf. JONES, P. (1999): Statistical Sampling and Risk Analysis in Auditing, Aldershot. KANNING, T. (2009): Weniger Neueinstellungen – Krise beendet Wachstum der Wirtschaftsprüfer, in: FAZ, Ausgabe 15.07.2009, Seite 13 KAPLAN, R.S. (1975/I): Sample Size Computations for Dollar-unit Sampling, in: Journal of Accounting Research, Vol. 13, Supplement, pp. 126-133. KAPLAN, R.S. (1975/II): A Synthesis, in: Journal of Accounting Research, Vol. 13, Supplement, pp. 134-142.
Literaturverzeichnis
191
KORNDÖRFER, W./ PEEZ, L. (1981): Einführung in das Prüfungs- und Revisionswesen: Lehrbuch für Studium und Praxis, Wiesbaden. LANFERMANN, J. (1983): Stichprobenprüfung, bewusste Auswahl, in: Coenenberg, A.G./Wysocki, K.v. (Hrsg.), Handwörterbuch der Revision, Sp. 1468-1474, Stuttgart. LEFFSON, U. (1988): Wirtschaftsprüfung, 4. Auflage, Wiesbaden. LEINER, B. (1985): Stichprobentheorie: Grundlagen, Theorie und Technik. München. LESLIE, D.A./ TEITLEBAUM, A.D./ ANDERSON, R.J. (1979): Dollar-Unit Sampling: A Practical Guide for Auditors, Toronto. LOEBBECKE, J.K./ NETER, J. (1975): Considerations in Choosing Statistical Sampling Procedures, in: Auditing, Journal of Accounting Research, Supplement, pp. 38-52. LÜCK, W. (1986): Wirtschaftsprüfung und Treuhandwesen: institutionelle und funktionelle Aspekte der betriebswirtschaftlichen Prüfungslehre, Stuttgart. LÜCK, W. (1998/I): Auswahlprüfung, in: Lexikon der Rechnungslegung und Abschlussprüfung, S. 66, 4. Auflage, München. LÜCK, W. (1998/II): Statistische Auswertungsmethoden von Zufallsstichproben, in: Lexikon der Rechnungslegung und Abschlussprüfung, S. 743, 4. Auflage, München. LÜCK, W. (1998/III): Stichprobenprüfung, in: Lexikon der Rechnungslegung und Abschlussprüfung, S. 760, 4. Auflage München. LÜCK, W. (1999): Prüfung der Rechnungslegung: Jahresabschlussprüfung, München. LÜCK, W. (2005): Einführung in die Rechnungslegung, 12. Auflage, München. LUTHIGER, F./ UEBERSAX, R. (1985): Praxisbezogene Stichprobenauswahl, in: Der Schweizer Treuhänder, Heft 6, S. 188-192. MAGG, A. (1981): Der notwendige Prüfungsumfang bei Anwendung des Hypothesentests im betriebswirtschaftlichen Prüfungswesen, in: Betriebswirtschaftliche Forschung und Praxis, Heft 1, S. 87-90. MANDL, G. (1978): Die Anwendung statistischer Stichprobenverfahren bei Prüfungen, in: Lechner, K., (Hrsg.), Treuhandwesen: Prüfung, Begutachtung, Beratung, S. 747-772, Wien.
192
Literaturverzeichnis
MANDL, G. (1984): Untersuchungen über Anwendungsvoraussetzungen und Effizienz statistischer Stichprobenverfahren in der Buchprüfung, Wien. MARTEN; K.-U./ QUICK, R./ RUHNKE, K. (2006): Prüfungsrisiko, in: Lexikon der Wirtschaftsprüfung: nach nationalen und internationalen Normen, Stuttgart MARTEN; K.-U./ QUICK, R./ RUHNKE, K. (2007): Wirtschaftsprüfung: Grundlagen des betriebswirtschaftlichen Prüfungswesens nach nationalen und internationalen Normen, 3. Auflage, Stuttgart. MCRAE, T.W. (1982): A Study of the Application of Statistical Sampling to External Auditing, London. MCRAE, T.W. (1974): Statistical Sampling for Audit and Control, London. MEIKLE, G.R. (1972): Statistical Sampling in an Audit Context, Toronto. MOTCHY, L. (1989): Poisson-Verteilung, in: Lexikon der Rechnungslegung und Abschlussprüfung, S. 574, Marburg. NETER, J./ LEITCH, R.A./ FIENBERG S.E. (1978): Dollar-unit sampling Multinomial Bounds for Total Overstatement and Understatement Errors, in: The Accounting Review, Vol. LIII, No. 1, pp. 77-93. NEUMANN, K. / MORLOCK, K. (2002): Operations Research, .2 Auflage, München. NEWIAK, M. (2009): Prüfungsurteile mit Dollar Unit Sampling, in:, Hans Gerhard Strohe (Hrsg.) Statistische Diskussionsbeiträge Nr. 30, Potsdam. PHILIPPS, H. (2009): Prüfung der Rechnungslegung, Frankfurt. PINNEKAMP, H.J./ SIEGMANN, F. (2008): Deskriptive Statistik: mit einer Einführung in das Programm SPSS, 5. Auflage, München. PÖHLMANN, H. (1996): Jahresabschlussprüfung auf Stichprobenbasis: Die Anwendung von Verfahren der statistischen Qualitätskontrolle auf die Jahresabschlussprüfung, Pfaffenweiler. QUICK/ R. (1996): Die Risiken der Jahresabschlussprüfung, Düsseldorf. RENEAU, J.H. (1978): CAV Bounds in Dollar-unit sampling Some Simulation Results, in: The Accounting Review, Vol. LIII, No. 3, pp. 669-680. REUTER, H.-H. (1975): Prüfungsumfang und Urteilsbildung im Rahmen einer Buchprüfung auf Stichprobenbasis. Frankfurt.
Literaturverzeichnis
193
RIEMER, D./ HAAS, G. (1988): Stichprobenverfahren in der Betriebsprüfung, in: Die steuerliche Betriebsprüfung, Heft 8, S. 173-179. RINNE, H./ ICKLER, G. (1986): Grundstudium Statistik, 2. Auflage, München. RINNE, H. (1984): Statistische Formelsammlung, 2. Auflage, Frankfurt am Main. RINNE, H. (2003): Taschenbuch der Statistik, 3. Auflage, Frankfurt am Main. RINNE, H./ MITTAG, H.-J. (1995): Statistische Methoden der Qualitätssicherung, 3. Auflage, München. ROBERTS, D.M. (1978): Statistical Auditing, New York. RÜCKLE, D. (1978): Prüfungswege, in: Lechner, K., (Hrsg.), Treuhandwesen: Prüfung, Begutachtung, Beratung, S. 797-842, Wien. RUHNKE, K./ von TORKLUS, A. (2008): Monetary Unit Sampling – Eine Analyse empirischer Studien, in: Die Wirtschaftsprüfung, Ausgabe 23/2008, S. 1119-1128, Düsseldorf. SCHILDBACH, T. (1983): Stichprobenprüfung, Annahmestichprobe, in: Coenenberg, A.G./Wysocki, K.v. (Hrsg.), Handwörterbuch der Revision, Sp. 1458-1467, Stuttgart. SCHIRA, J. (2009): Statistische Methoden der VWL und BWL, 3. Auflage, München. SCHLITTGEN, R. (2000): Einführung in die Statistik: Analyse und Modellierung von Daten, 9. Auflage, München. SCHLITTGEN, R. (2009): Das Statistik Labor: R leicht gemacht, 2. Auflage, Heidelberg. SCHULTE, E.B. (1970): Quantitative Methoden der Urteilsgewinnung bei Unternehmensprüfungen, Düsseldorf. SPERL, A. (1978): Prüfungsplanung, in: Leffson, U., (Hrsg.), Schriftenreihe des Instituts für Revisionswesen der Westfälischen Wilhelms-Universität Münster, Band 12, Düsseldorf. SPURR, W.A./ BONINI, C.P. (1967): Statistical Analysis for Business Decisions, Homewood. STEPHAN, F.F. (1963): Some Statistical Problems Involved in Auditing and Inspection, in: Proceedings of the American Statistic Association, S. 404.
194
Literaturverzeichnis
STRINGER, K.W. (1961): Some basic concepts of statistical sampling in auditing, in: Journal of Accountancy, pp. 63-69. STRINGER, K.W. (1963): Practical Aspects of Statistical Sampling in Auditing, in: Proceedings of the American Statistic Association, S. 405–411. TEITLEBAUM, A.D./ ROBINSON, C.F. (1975): The Real Risk in Audit Sampling, in: Journal of Accounting Research, Supplement, pp. 70-97. UHLIG, B. (1987): Anwendung stichprobengestützter Prüfungsmethoden bei der Jahresabschlussprüfung, in: Die Wirtschaftprüfung, Heft 10, S. 288-290. UNGERER, A. (1980): Stichproben bei der Inventur von Lagerbeständen, in: Stenger, H., (Hrsg.), Praktische Anwendungen von Stichprobenverfahren, Göttingen. van HEERDEN, A. (1967): Statistical Sampling as a Means of Auditing, in: Leslie, D.A./ Teitlebaum, A.D./ Andersson, R. J. (1979), Anhang L. WAMPLER, B./ McEACHARN, M. (2005): Monetary Unit Sampling Using Microsoft Excel, in: The CPA Journal, S. 36-40. WEBER, K. (1972): Anwendungsmöglichkeiten des Theorems von Bayes bei Buchprüfungen, in: Zeitschrift für betriebswirtschaftliche Forschung, S. 91-115. WETZEL, W. (1973): Statistische Grundausbildung für Wirtschaftswissenschaftler: II Schließende Statistik, Berlin. WETZEL, W./ JÖHNK, M.-D./ NAEVE, P. (1967): Statistische Tabellen. Berlin. WITTMANN, A. (1980): Systemprüfung und ergebnisorientierte Prüfung: Die Systemprüfung als Grundlage der ergebnisorientierten Prüfung im Rahmen der aktienrechtlichen Jahresabschlussprüfung. Berlin. WPK (2005): Wirtschaftsprüfer-Examen gemäß §§ 5-14 a WPO, 1. Aufsichtsarbeit aus dem Gebiet „Angewandte Betriebswirtschaftslehre, Volkswirtschaftslehre“, www.wpk.de WOLZ, M. (2003): Wesentlichkeit im Rahmen der Jahresabschlussprüfung, Düsseldorf. WURST, J./ NETER, J./ GODFREY, J. (1989/I): Efficiency of Sieve Sampling in Auditing, in: The Statistician, Vol. 7, No. 2, S. 199-205.
Literaturverzeichnis
195
WURST, J./ NETER, J./ GODFREY, J. (1989/II): Comparison of Sieve Sampling with Random Sampling an Cell Sampling of Monetary Units, in: The Statistician, Vol. 38, No. 4, S. 235-249. WYSOCKI, K.v./ SCHULZE-OSTERLOH, J./ HENNRICHS, J./ KUHNER, C. (2007): Handbuch des Jahresabschlusses 1 Abt. I, aktualisiert mit 46. Lieferung September 2009, Köln. WYSOCKI, K.V. (1988): Grundlagen des betrieblichen Prüfungswesens: Prüfungsordnungen, Prüfungsorgane, Prüfungsverfahren, Prüfungsplanung und Prüfungsbericht. 3. Auflage, München.