Thomas Sommerer Können Staaten voneinander lernen?
Thomas Sommerer
Können Staaten voneinander lernen? Eine vergleich...
5 downloads
492 Views
2MB Size
Report
This content was uploaded by our users and we assume good faith they have the permission to share this book. If you own the copyright to this book and it is wrongfully on our website, we offer a simple DMCA procedure to remove your content from our site. Start by pressing the button below!
Report copyright / DMCA form
Thomas Sommerer Können Staaten voneinander lernen?
Thomas Sommerer
Können Staaten voneinander lernen? Eine vergleichende Analyse der Umweltpolitik in 24 Ländern
Bibliografische Information der Deutschen Nationalbibliothek Die Deutsche Nationalbibliothek verzeichnet diese Publikation in der Deutschen Nationalbibliografie; detaillierte bibliografische Daten sind im Internet über abrufbar.
Zugl. Dissertation der Universität Konstanz, „Können Staaten voneinander lernen? Transnationales Modelllernen als Einflussfaktor von Wandel in der Umweltpolitik“ 1. Referent: Prof. Dr. Katharina Holzinger 2. Referent: Prof. Dr. Christoph Knill 3. Referent: Prof. Dr. Thomas Hinz Mündliche Prüfung am 20. Oktober 2009
1. Auflage 2011 Alle Rechte vorbehalten © VS Verlag für Sozialwissenschaften | Springer Fachmedien Wiesbaden GmbH 2011 Lektorat: Dorothee Koch / Sabine Schöller VS Verlag für Sozialwissenschaften ist eine Marke von Springer Fachmedien. Springer Fachmedien ist Teil der Fachverlagsgruppe Springer Science+Business Media. www.vs-verlag.de Das Werk einschließlich aller seiner Teile ist urheberrechtlich geschützt. Jede Verwertung außerhalb der engen Grenzen des Urheberrechtsgesetzes ist ohne Zustimmung des Verlags unzulässig und strafbar. Das gilt insbesondere für Vervielfältigungen, Übersetzungen, Mikroverfilmungen und die Einspeicherung und Verarbeitung in elektronischen Systemen. Die Wiedergabe von Gebrauchsnamen, Handelsnamen, Warenbezeichnungen usw. in diesem Werk berechtigt auch ohne besondere Kennzeichnung nicht zu der Annahme, dass solche Namen im Sinne der Warenzeichen- und Markenschutz-Gesetzgebung als frei zu betrachten wären und daher von jedermann benutzt werden dürften. Umschlaggestaltung: KünkelLopka Medienentwicklung, Heidelberg Druck und buchbinderische Verarbeitung: STRAUSS GMBH, Mörlenbach Gedruckt auf säurefreiem und chlorfrei gebleichtem Papier Printed in Germany ISBN 978-3-531-17292-7
Inhalt
Abbildungsverzeichnis ........................................................................................ 9 Tabellenverzeichnis .......................................................................................... 11
Vorwort .......................................................................................................... 13
1
Einleitung ............................................................................................... 15
2
Theorien und Konzepte des Lernens ................................................... 21
2.1 Forschungstraditionen der Analyse von Lernprozessen in der Politik .... 2.1.1 Historische Analogien und „Lessons from the Past“ ....................... 2.1.2 Diffusions-, Transfer- und Konvergenzforschung ........................... 2.1.3 Systemisches Lernen in der Organisationsforschung ...................... 2.1.4 Policy-Analyse und Lernen von politischen Ideen .......................... 2.1.5 Theorien des sozialen Lernens in der Ökonomie ............................ 2.1.6 Lernen in der Spiel- und Entscheidungstheorie ............................... 2.1.7 Analyse von Lernen in Nachbardisziplinen der Politikwissenschaft
22 22 23 24 25 26 27 28
2.2 Terminologie und Definition von Policy-Lernen ..................................... 2.2.1 Veränderungs- vs. Verbesserungslernen ......................................... 2.2.2 Instrumentelles vs. konzeptuelles Lernen ........................................ 2.2.3 Policy-Lernen vs. strategisches Lernen ........................................... 2.2.4 Lernen vom Modell vs. Erfahrungslernen ....................................... 2.2.5 Transnationales vs intra-systemisches Lernen ................................ 2.2.6 Individuelles vs. kollektives Lernen ................................................ 2.2.7 Rationales vs. eingeschränkt-rationales Lernen ..............................
29 32 34 34 35 36 36 38
2.3 Mechanismen des Policy-Lernens ........................................................... 41 2.3.1 Warum lernen Staaten? Motivation und Anreizfaktoren ................. 43
6
Inhalt 2.3.1.1 Unsicherheit und Informationskosten ...................................... 2.3.1.2 Unzufriedenheit mit bestehenden Lösungen ........................... 2.3.1.3 Streben nach Reputation .......................................................... 2.3.1.4 Konformität und der Wunsch nach Legitimität ....................... 2.3.1.5 Attraktivität eines Politikmodells ............................................ 2.3.1.6 „Policy Promotion“ und missionarisches Werben ................... 2.3.1.7 Funktionale Interdependenz .................................................... 2.3.2 Wovon lernen Staaten? Orientierungspunkte des Policy-Lernens ... 2.3.2.1 Lernen von Erfolg und scheinbarem Erfolg ............................ 2.3.2.2 Lernen unter Nachbarn und Konkurrenten .............................. 2.3.2.3 Lernen in Netzwerken ............................................................. 2.3.2.4 Herdenverhalten und Lernen von der Masse ........................... 2.3.3 Was folgt auf Lernen? Variationen des Policy-Wandels .................
44 45 46 47 48 50 51 52 53 57 60 65 68
2.4 Alternative Erklärungen von Policy-Wandel ........................................... 2.4.1 Internationale Harmonisierung und Konditionalität ........................ 2.4.2 Standortkonkurrenz und regulativer Wettbewerb ............................ 2.4.3 Nationale Institutionen: Vetospieler, Pfadabhängigkeit und administrative Kapazitäten .............................................................. 2.4.4 Problemdruck und politische Nachfrage .........................................
70 72 74 76 79
2.5 Zusammenfassung ................................................................................... 81
3
Forschungsdesign, Daten und Methoden einer Analyse von .................. Policy-Lernen ......................................................................................... 85
3.1 Methoden der Analyse von Policy-Lernen: ein Literaturüberblick ......... 3.1.1 Experimentelles Design und Simulation ......................................... 3.1.2 Qualitative Methoden und „process tracing“ ................................... 3.1.3 Makro-quantitative Methoden ......................................................... 3.1.4 „Caveats“ für eine empirische Analyse des Policy-Lernens ...........
86 86 89 91 94
3.2 Design einer quantitativen Analyse von Lernen in der Umweltpolitik .... 96 3.2.1 Europäische Umweltpolitik als geeignete Datenbasis ..................... 97 3.2.2 Dyadische Operationalisierung von Policy-Wandel ...................... 101 3.2.3 Breites Repertoire von Lernvariablen ............................................ 102 3.2.4 Kombination verschiedener Analysetechniken ............................. 103 3.2.5 Übersicht des Forschungsdesigns .................................................. 104
Inhalt
7
3.3 Abhängige Variable: Policy-Wandel in der Umweltpolitik ................... 3.3.1 Datenbasis und Auswahl der Politiken .......................................... 3.3.2 Datenerhebung .............................................................................. 3.3.3 Operationalisierung von Policy-Wandel ....................................... 3.3.3.1 Policy-Wandel bei der Ersteinführung .................................. 3.3.3.2 Policy-Wandel als Veränderung von Standards ....................
106 106 114 119 120 125
3.4 Unabhängige Variablen ........................................................................ 3.4.1 Lernvariablen ................................................................................ 3.4.1.1 Orientierung an Erfolg und Reputation ................................. 3.4.1.2 Orientierung an Ähnlichkeit .................................................. 3.4.1.3 Orientierung an Netzwerken ................................................. 3.4.1.4 Orientierung an Herdeneffekten ............................................ 3.4.2 Variablen für alternative Erklärungsfaktoren des Wandels ........... 3.4.2.1 Internationale Harmonisierung .............................................. 3.4.2.2 Ökonomischer Wettbewerb ................................................... 3.4.2.3 Nationale Institutionen .......................................................... 3.4.2.4 Problemdruck und politische Nachfrage ...............................
131 132 132 137 140 143 144 144 145 147 149
3.5 Zusammenfassung ................................................................................. 150
4 Facetten des Wandels: eine deskriptive Analyse nationaler Umweltpolitik ......................................................................................... 153 4.1 Häufigkeit und Richtung von Wandel in der Umweltpolitik .................. 4.1.1 Veränderung von Politiken ............................................................ 4.1.2 Ersteinführung neuer Politiken ...................................................... 4.1.3 Veränderung von Standards .......................................................... 4.1.3.1 Häufigkeit der Änderung von Standards ............................... 4.1.3.2 Richtungsverlauf der Veränderung von Standards ................
154 154 158 166 166 170
4.2 Konvergenz in der Umweltpolitik .......................................................... 173 4.2.1 Konvergenz im Repertoire nationaler Umweltpolitik ................... 174 4.2.2 Konvergenz im Regulierungsniveau nationaler Umweltpolitik .... 177 4.3 Formen konditionalen Wandels in der Umweltpolitik ........................... 4.3.1 Konditionaler Wandel bei der Ersteinführung von Politiken ........ 4.3.2 Konditionaler Wandel bei der Veränderung von Standards .......... 4.3.3 Policy-Wandel und Wettbewerbseffekte bei Länderpaaren ..........
187 188 197 205
8
Inhalt
4.4 Zusammenfassung ................................................................................. 208
5
Faktoren des Wandels: Policy-Lernen und die Veränderung ................. nationaler Umweltpolitik ..................................................................... 211
5.1 Modellspezifikation ............................................................................... 211 5.2 Einfluss von Lernen auf die Ersteinführung .......................................... 5.2.1 Analyse von freiwilligem Modellwandell: Ersteinführungen ....... 5.2.2 Vergleich von Typen konditionalen Wandels: Ersteinführungen .. 5.2.3 Analyse freiwilligen Modellwandels: drei einzelne Politiken .......
216 217 228 236
5.3 Einfluss von Lernen auf die Veränderung von Standards ..................... 5.3.1 Analyse von freiwilligem Modellwandel bei Standards ................ 5.3.2 Vergleich von Typen konditionalen Wandels bei Standards ......... 5.3.3 Analyse freiwilligen Modellwandels: drei Standards ...................
245 246 254 265
5.4 Zusammenfassung ................................................................................. 275
6
Schlussfolgerung .................................................................................. 280
Anhang ......................................................................................................... 289
Literaturverzeichnis .................................................................................... 297
Abbildungsverzeichnis
Abbildung 1: Abbildung 2: Abbildung 3: Abbildung 4: Abbildung 5: Abbildung 6: Abbildung 7: Abbildung 8: Abbildung 9: Abbildung 10: Abbildung 11: Abbildung 12: Abbildung 13: Abbildung 14: Abbildung 15: Abbildung 16: Abbildung 17: Abbildung 18: Abbildung 19:
Häufigkeit der Begriffe "Learning" und "Diffusion", SSCI . 30 Alternative Begriffe des Lernens, SSCI .............................. 31 Motive und Orientierungspunkte des Policy-Lernens ......... 83 Ländersample ...................................................................... 99 Übersicht Forschungsdesign .............................................. 104 Häufigkeit der Veränderungen von 22 Umweltpolitiken .. 155 Häufigkeit Gesetzesänderungen / alle Änderungen, ................. 22 Politiken ....................................................................... 157 Ersteinführung und kumulierte Übernahmerate von ................ 22 Politiken ....................................................................... 158 Kumulierte Übernahmeraten, frühe Diffusion ................... 160 Kumulierte Übernahmeraten, mittlere Diffusion ............... 160 Kumulierte Übernameraten, späte Diffusion ..................... 162 Vergleich Aufwärts- und Abwärtswandel, ............................... 17 Umweltstandards .......................................................... 168 Ländervergleich Aufwärts- und Abwärtswandel, ..................... 17 Standards ...................................................................... 169 Regulierungsverlauf Schwefelgehalt in Heizöl (Vol %) ... 172 Regulierungsverlauf Lärmschutz an Autobahnen (dB) ..... 173 Boxplot PKW-Emissionen CO (g/km) .............................. 179 Größe und Zahl der Herden, Schwefelgehalt im Heizöl .... 181 Formen konditionalen Wandels, Ersteinführung, .................... 22 Politiken ....................................................................... 193 Formen konditionalen Wandels, 17 Umweltstandards ...... 202
Tabellenverzeichnis
Tabelle 1: Tabelle 2: Tabelle 3: Tabelle 4: Tabelle 5: Tabelle 6: Tabelle 7: Tabelle 8: Tabelle 9: Tabelle 10: Tabelle 11: Tabelle 12: Tabelle 13: Tabelle 14: Tabelle 15: Tabelle 16: Tabelle 17: Tabelle 18: Tabelle 19: Tabelle 20: Tabelle 21: Tabelle 22: Tabelle 23:
Liste der 22 Umweltpolitiken ................................................ 107 Liste der 17 Umweltstandards ............................................... 112 Beispiel für die Rohdaten: Bleigehalts im Benzin, Finnland .. 118 Ausschnitt aus dem dyadischer Datensatz, Ersteinführung ... 124 Spezifikation konditionalen Wandels bei Umweltstandards . 128 Ausschnitt aus dem dyadischen Datensatz, Grenzwert ............... Bleigehalt in Benzin .............................................................. 130 Häufigkeit der Änderungen, Vergleich von 22 Politiken ...... 156 Pionierländer bei der Ersteinführung von 22 Politiken ......... 163 Ersteinführung von 22 Politiken, Darstellung nach Ländern 165 Häufigkeit der Veränderung von 17 Umweltstandards ......... 167 Mittelwertentwicklung bei 17 Umweltstandards ................... 170 Ähnlichkeit des Politikrepertoires zwischen Länderpaaren,.......... in % ....................................................................................... 175 Länderrankings für das Repertoire von 22 Politiken ............. 176 Variationskoeffizienten für 17 Umweltstandards .................. 178 Ähnlichkeit der Umweltstandards zwischen Länderpaaren, ......... in % ....................................................................................... 180 Herdengröße bei 17 Umweltstandards .................................. 183 Länderrankings für 17 Umweltstandards .............................. 184 Mobilität der Länderrankings: Gamma-Koeffizienten, ................ 17 Standards .......................................................................... 185 Ersteinführung Umweltverträglichkeitsprüfung, .......................... Land/Dyade . .......................................................................... 188 Konditionaler Wandel bei der Ersteinführung von ....................... 22 Politiken ........................................................................... 190 Konditionaler Wandel bei Ersteinführungen, Vergleich .............. 22 Politiken ........................................................................... 193 Ländervergleich konditionaler Wandel, Ersteinführung .............. 22 Politiken ............................................................................. 195 Wandel bei Standards von Schwefelgehalt in Heizöl, Land/Dyaden ......................................................................... 198
12 Tabelle 24: Tabelle 25: Tabelle 26: Tabelle 27: Tabelle 28: Tabelle 29: Tabelle 30: Tabelle 31: Tabelle 32: Tabelle 33: Tabelle 34: Tabelle 35: Tabelle 36: Tabelle 37: Tabelle 38: Tabelle 39: Tabelle 40: Tabelle 41: Tabelle A.1: Tabelle A.2: Tabelle A.3: Tabelle A.4: Tabelle A.5:
Tabellenverzeichnis Konditionaler Wandel, Veränderung von ..................................... 17 Umweltstandards .............................................................. 199 Vergleich konditionalen Wandels bei 17 Umweltstandards .. 203 Ländervergleich konditionalen Wandels, ..................................... 17 Umweltstandards .............................................................. 203 Häufigkeit von Länderpaaren mit einer Sequenz von .................. Konvergenz und Divergenz, 17 Standards ............................ 207 Auswahl der Politiken für die Analyse von Einzelbeispielen 216 Freiwilliger Modellwandel bei der Ersteinführung von ............... 22 Politiken, logistische Regression RE ................................ 218 Freiwilliger Modellwandel bei Ersteinführungen von .................. 22 Politiken, alternative Schätzverfahren .............................. 226 Vergleich Formen konditionalen Wandels bei ............................. 22 Ersteinführungen, logistische Regression RE ................... 231 Ersteinführung Politik zur Altlastensanierung, ............................ Ereignisanalyse ...................................................................... 237 Ersteinführung Politik zur Energieeffizienz von .......................... Kühlschränken, Ereignisanalyse ............................................ 240 Ersteinführung Nationaler Umwelt-/Nachhaltigkeitsplan, Ereignisanalyse ...................................................................... 243 Freiwilliger Modellwandel und Konvergenz von ......................... 17 Umweltstandards, logistische Regression RE .................. 247 Freiwilliger Modellwandel und Konvergenz von ......................... 17 Umweltstandards, alternative Schätzverfahren ................ 251 Vergleich Formen konditionalen Wandels von ............................ 17 Umweltstandards, logistische Regression RE .................. 255 Freiwilliger Modellwandel und Konvergenz des ......................... Schwefelgehalts von Heizöl .................................................. 266 Freiwilliger Modellwandel und Konvergenz der .......................... Lärmstandards an Autobahnen .............................................. 269 Freiwilliger Modellwandel und Konvergenz der Grenzwerte ...... für Zink im Abwasser ............................................................ 273 Faktoren freiwilligen Modellwandels, Übersicht der ................... Resultate ................................................................................ 276 Liste der Länder .................................................................... 289 Deskriptive Statistik und Datenquellen: Lernvariablen ......... 290 Deskriptive Statistik und Datenquellen, Kontrollvariablen ... 292 Liste der internationalen Institutionen ................................... 293 Korrelationsmatrix unabhängige Variablen ........................... 295
Vorwort
Dieses Buch beschäftigt sich mit der Frage nach der Effektivität von Lernen im Kontext der Politik, und untersucht beispielsweise die Orientierung an Vorbildern oder einer „peer group“. Wie in vielen anderen Bereichen haben solche Verhaltensmuster auch für das Zustandekommen dieser Arbeit eine wichtige Rolle gespielt. Sie wäre ohne die Unterstützung von zahlreichen Kollegen und Freunden nicht zustande gekommen. Der vorliegende Text ist eine leicht korrigierte Fassung meiner am 16.Juli 2009 am Fachbereich für Politik- und Verwaltungswissenschaft der Universität Konstanz eingereichten Dissertation. An erster Stelle möchte ich Prof. Dr. Katharina Holzinger für die Betreuung meines Promotionsvorhabens herzlich danken. In den Jahren, in denen ich für Sie als wissenschaftlicher Mitarbeiter tätig war, hat Sie mit Ratschlägen und konstruktiver Kritik viel zum Gelingen dieser Arbeit beigetragen. Für die stetige Herausforderung, den offenen Dialog bin ich ihr genauso dankbar wie für das Vorbild an wissenschaftlichem Enthusiasmus, ohne den die Fertigstellung eines solch langwierigen Projektes kaum möglich wäre. Ganz besonderen Dank schulde ich auch Prof. Dr. Christoph Knill, der bereit war, die Dissertation mit zu betreuen und zu begutachten. Seine wertvollen Anregungen und Kommentare zu inhaltlichen wie forschungspraktischen Fragen haben ebenfalls viel zur Fertigstellung dieser Arbeit beigetragen. Mein Dank gilt auch Prof. Dr. Thomas Hinz für die Bereitschaft, in der Prüfungskommission mitzuwirken. Des Weiteren möchte ich auch der Deutschen Forschungsgesellschaft für die Finanzierung des Projektes „Policy-Wandel in der Umweltpolitik. Der Einfluss von nationalen Vetospielern und transnationalem Policy-Lernen“ (HO 1811/3-1) danken, das seit Juli 2006 an der Universität Konstanz und der Universität Hamburg durchgeführt wird. Diese Förderung ermöglichte es mir, einen umfangreichen Datensatz zur Umweltpolitik zu erheben, ohne finanzielle Sorgen an der Bearbeitung der Fragestellung zu arbeiten und die Ergebnisse auf internationalen Konferenzen vorzustellen. An dieser Stelle ist es unabdingbar, mich auch besonders bei Stephan Heichel, meinem Kollegen im DFG-Projekt, zu bedanken, von dessen Datenrecherche und immensem bibliographischem Wissen ich sehr profitiert habe. Gleiches gilt für die Unterstützung durch die studentischen Hilfskräfte Thomas Abeling, Jan Jacobi und Andreas Goldberg.
14
Vorwort
Auch die längere Vorgeschichte dieses Buches soll nicht unerwähnt bleiben. So möchte ich mich bei all denen bedanken, die im Zuge meiner Mitarbeit in einem von der Europäischen Kommission finanzierten Projekt zu Konvergenz in der Umweltpolitik (ENVIPOLCON) und während meiner Tätigkeit als wissenschaftlicher Mitarbeiter am Max-Planck-Institut in Bonn, an der Universität Hamburg und an der Universität Konstanz auf die unterschiedlichste Art und Weise etwas dazu beigetragen haben, dass die Arbeit in dieser Form vorliegt. Dazu möchte ich in alphabetischer Reihenfolge ganz besonders Prof. Dr. Joachim Behnke, Prof. Dr. Christian Martin, Tobias Meier, Aike Müller, Dr. André Suck sowie all meinen Kollegen vom Lehrstuhl für Internationale Politik und Konfliktforschung danken. Hätte ich bei meiner ersten Begegnung mit dem Gegenstand dieser Arbeit während eines Projekttreffens in Jena im Januar 2003 gewusst, wie viel Wasser den Rhein und die Elbe bis zur Fertigstellung meiner Dissertation hinabfließen musste, hätte ich vielleicht gezögert. Hätte ich gewusst, wie viel Freude, wie viele Erfahrungen und positive Begegnungen damit verbunden sind, hätte ich mich mit Sicherheit nicht anders entschieden. Zuletzt möchte ich mich bei allen Freunden bedanken, die es in den langen Jahren meiner Promotionszeit immer wieder geschafft haben, mich nicht an diesem Projekt verzweifeln zu lassen und mich motiviert und unterstützt haben. Ganz besonders danke ich Mia, die mit mir die Hochs geteilt, die Tiefs ausgehalten und dafür gesorgt hat, dass diese Zeit für mich eine glückliche war. Ihr und meinen Eltern, die mich immer unterstützt haben, widme ich dieses Buch.
1 Einleitung
„Denn da die Menschen fast immer in ausgetretenen Wegen gehen und in ihren Handlungen die andren nachahmen, so muss ein Mann von Geist, auch wenn er nicht imstande ist, jenen Vorbildern in allem gleichzukommen, noch gar die Tugend derer, denen er nacheifert, zu überbieten, doch immer auf den Wegen der Großen wandeln und die hehrsten Muster nachahmen, damit er, wenn er das Ziel auch nicht erreicht, doch wenigstens in ihrem Geiste handelt.“ Niccolo Machiavelli, Der Fürst (1990[1532]), Kap. VI, S. 36.
Mit einer Vielzahl unterschiedlichster Maßnahmen versucht die deutsche Bundesregierung seit Herbst 2008, den negativen Folgen der globalen Finanzkrise entgegenzuwirken. Nur wenige Steuerungsinstrumente waren dabei in der Öffentlichkeit so gut populär wie die staatliche Umweltprämie für den Kauf von Neuwagen.1 Die sogenannte „Abwrackprämie“ sollte einerseits die Umweltbelastung durch die Emissionen alter Fahrzeuge senken, vor allem aber die Automobilindustrie vor einem Nachfrageeinbruch schützen. Nach ihrem Erfolg in Deutschland scheint diese Maßnahme auch ein Exportschlager zu werden. So argumentierte etwa der amerikanische Präsident Obama im Kongress für die Einführung eines „cash for clunkers“-Programms in den USA unter Verweis auf das vermeintliche Erfolgsmodell in Deutschland.2 Auch in vielen anderen Bereichen der Politik kann beobachtet werden, dass sich bestimmte Konzepte und Instrumente über Ländergrenzen hinweg ausbreiten und Regierungen voneinander lernen. Im politischen Diskurs ist häufig die Rede von Vorbildern und Modellen, wie zum Beispiel der dänischen Arbeitsmarktpolitik, der englischen Wirtschaftspolitik oder finnischen Bildungspolitik.3 1
2
3
Richtlinie zur Förderung des Absatzes von Personenkraftwagen vom 20. Februar 2009; Bundesministerium für Wirtschaft und Technologie: Bundesanzeiger Nr. 48 vom 27. März 2009, S. 1144. „Vorbild Deutschland: Obama macht Abwrackprämie zur Chefsache“, Spiegel online vom 9. April 2009 www.spiegel.de/wirtschaft/0,1518,618322,00.html; „Obamas umstrittener Plan“, Financial Times Deutschland vom 6.April 2009; „Euros for Clunkers Drives Sales“, New York Times vom 1. April 2009. „Härte und Fürsorge: Die Erfolge Dänemarks im Kampf gegen die Arbeitslosigkeit faszinieren auch deutsche Politiker“, Der Spiegel vom 13. November 2006; „Merkel looks to Britain as model for a free market“, The Times vom 26. Januar 2006; „Top of the class: Education reform“, The Economist vom 28. Juni 2008.
T. Sommerer, Können Staaten voneinander lernen?, DOI 10.1007/ 978-3-531-92625-4_1, © VS Verlag für Sozialwissenschaften | Springer Fachmedien Wiesbaden GmbH 2011
16
1 Einleitung
Diese Tendenz zeichnet sich auch in der zunehmenden Bedeutung von institutionalisierten Prozessen der gegenseitigen Beobachtung und Bewertung auf internationaler Ebene ab. Ein prominentes Beispiel für solche „Schönheitswettbewerbe“, Benchmarking-Prozesse oder „performance reviews“, die oft als Antwort auf die von der Globalisierung hervorgerufene Standortkonkurrenz verstanden werden, stellt die von der OECD beauftragte PISA-Studie dar. Was für die Relevanz von Lernen in der Politik gilt, ist auch für soziale Systeme im Allgemeinen zu beobachten – und umgekehrt (Goldsmith 2003: 238). Bei jeder Form von Gesellschaft ist wechselseitiges Lernen unter den Mitgliedern einer Gruppe ein zentraler Baustein kultureller Entwicklung. Aus der Anthropologie sowie zahlreichen Geschichten über die Entdecker fremder Kulturen ist bekannt, dass gegenseitige Beobachtung und Imitation nicht nur effizient, sondern zum Teil überlebenswichtig ist (Henrich und McElreath 2003). Orientieren sich Individuen am Verhalten anderer, können kostenträchtige und verlustreiche Prozesse des „trial and error“ vermieden werden. Mit der Verbreitung von Konzepten wie Kognition, Ideen und Wissen nahm die Bedeutung des Themas Lernen in der Politikwissenschaft seit den neunziger Jahren stark zu (Maier et al. 2003: 7). Diese Entwicklung spiegelt sich in einer steigenden Zahl von Arbeiten wider, die auf unterschiedliche Weise politische Reformen der Lernfähigkeit von Regierungen zuschreiben. Theorien des Policy-Lernens beziehen sich dabei auf die Motive und Mechanismen der Veränderung von Politiken. Was bringt politische Akteure dazu, eine bestehende Regulierung ändern zu wollen? Was sind die Impulse für Lernen und Wandel, und woran orientieren sich politische Entscheidungsträger bei der Suche nach einem geeigneten Modell? Die aktuelle empirische Literatur ist vielseitig, und es finden sich Beiträge zu zahlreichen Politikfeldern und Regionen, von denen hier nur beispielhaft einige erwähnt werden sollen: Simmons und Elkins (2004) konnten bei der globalen Diffusion liberaler Wirtschaftspolitik eine Orientierung an soziokulturell ähnlichen Ländern belegen. Crescenzi (2007) untersuchte in einer Studie zur Sicherheitspolitik, ob gegenwärtige Kontrahenten das Verhalten anderer Länder in vorangegangenen Konflikten imitieren. In einer Analyse der Umweltpolitik in Europa identifizierten Holzinger, Knill und Sommerer (2008) transnationale Kommunikation als wesentlichen Faktor für einen umfassenden Konvergenztrend. Meseguer (2004) wies nach, dass die Privatisierungspolitik in lateinamerikanischen Ländern nicht auf internationalen Druck, sondern auf Prozesse des Lernens von erfolgreichen Ländern und „miracle models“ zurückging. Nedergard (2006) beschäftigte sich mit der Frage, wie die institutionelle Form der Offenen Methode der Koordinierung (OMC) in der EU bestimmt, welche Staaten von welchen Modellen lernen. Lodge (2003) untersuchte einen möglichen
1 Einleitung
17
Politiktransfer bei der Neuregulierung des Eisenbahnverkehrs in Großbritannien und Deutschland. Trotz ihrer wachsenden Vielfalt zeichnet sich die politikwissenschaftliche Literatur zum Thema Lernen durch eine Reihe von Forschungslücken aus. Zum einen geht dies auf unscharfe Definitionen und ein Gewirr von Begriffen zurück. Zum anderen ist auch der Stand der empirischen Literatur zu Lernen unzureichend, wenngleich neben der Quantität auch die Qualität der Beiträge sichtbar zugenommen hat. In qualitativen Untersuchungen wird zwar oft ein einzelner Kommunikationsprozess auf der Ebene konkreter Personen nachgezeichnet. Allerdings birgt die prozessorientierte Herangehensweise die Gefahr, Lernen zu überschätzen, da zu wenig auf alternative Erklärungen und unterschiedliche Formen des Lernens kontrolliert wird. Quantitative Analysen können hingegen den Einfluss struktureller Größen besser erfassen. Da eine Korrelation von Lernmechanismen und Wandel beispielsweise auch auf parallele, aber unabhängige Entscheidungen zurückgehen könnte, reicht eine einfache Untersuchung von Zusammenhängen nicht aus. Ein weiterer Schwachpunkt besteht darin, dass auch viele quantitative Beiträge nur auf einzelne Politiken bezogen sind. Konzeptuelle Widersprüchlichkeiten und die fehlende Systematik empirischer Forschung führen dazu, dass für den Erkenntnisstand zur Relevanz von Lernen noch immer gilt, was Bennett und Howlett (1992: 288) in einem häufig zitierten Artikel vor mehr als fünfzehn Jahren feststellten: dass ein Übermaß an Theoretisierung mit einem Mangel an empirischer Überprüfung einhergeht. Daher lautet die erste Forschungsfrage dieser Arbeit, ob Policy-Lernen im Sinne einer Imitation auswärtiger Modelle einen relevanten Faktor im nationalen Politikgestaltungsprozess darstellt, oder Wandel eher auf andere Faktoren wie den internationalen Standortwettbewerb, die rechtliche Harmonisierung durch die EU oder externe Ereignisse wie Krisen und Katastrophen zurückgeht. In der politikwissenschaftlichen Literatur werden unterschiedliche Konzepte der Wirkungsweise von Lernen diskutiert. Deshalb muss die zweite Forschungsfrage lauten, welche Mechanismen der Imitation zu beobachten sind. Dies kann bedeuten, dass beispielsweise erfolgreiche Länder zum Vorbild taugen oder Länder imitiert werden, deren Modelle leicht zugänglich sind. Das Ziel dieser Arbeit ist nicht die Formulierung einer neuen Lerntheorie oder die detaillierte Modellierung eines einzelnen Lernmechanismus. Vielmehr geht es um eine umfassende Analyse des Zusammenhangs der Wahrscheinlichkeit von Policy-Wandel mit verschiedenen Formen des Lernens. Als Ausgangsbasis werden in Kapitel 2 zuerst Literaturtraditionen, die sich mit Lernen und der Erklärung von Policy-Wandel beschäftigen, vergleichend dargestellt. Der Überblick reicht von der Außenpolitikforschung über die Diffusionsliteratur bis hin zu ökonomischen Analysen sozialen Lernens. Darauf auf-
18
1 Einleitung
bauend wird eine Definition erarbeitet, die Policy-Lernen als Prozess einer rationalen, auf Verbesserung abzielenden Beobachtung beschreibt, die zur Imitation eines Modells führt. Anschließend werden vier Kategorien von Orientierungspunkten bei der Modellwahl - (1) Erfolg und Reputation, (2) Nähe und Ähnlichkeit, (3) Netzwerke und (4) Herden – von den Motiven und Konsequenzen des Lernens unterschieden. Ausgehend von einer Darstellung verschiedener Analysemethoden in der Literatur zu Policy-Lernen werden im dritten Kapitel die wesentlichen Aspekte des Forschungsdesigns skizziert. Für die Analyse von Policy-Wandel wird ein neuartiger Datensatz zur Umweltpolitik verwendet. Er umfasst ein Sample von 24 Ländern und den Zeitraum von 1970 bis 2005. Die Daten, die ursprünglich auf eine standardisierte Expertenbefragung zurückgehen, wurden für dieses Projekt durch umfangreiche Recherchen in Datenbanken zur nationalen Gesetzgebung ergänzt. Sie beziehen sich auf so genannte Policy-Outputs, also beispielsweise Gesetze und Verordnungen, und enthalten Informationen zu 22 Politikmaßnahmen sowie 17 Grenzwerten und metrischen Politikstandards. Durch die Breite des Datensatzes können allgemeine Trends von Wandel untersucht werden, die nicht ausschließlich auf idiosynkratische Faktoren zurückgehen. Der Schwerpunkt bei der Länderauswahl liegt auf Europa, was eine Analyse der Effekte regionaler Integration und geographischer Nähe erlaubt. Durch die Berücksichtigung von Japan und den USA sind jedoch auch außereuropäische Wirtschaftsmächte und umweltpolitische Vorreiter repräsentiert. Im weiteren Verlauf des dritten Kapitels wird das Konzept konditionalen Wandels vorgestellt. Als Weiterentwicklung von Ansätzen aus der Konvergenzund Diffusionsliteratur basiert es auf einem dyadischen Ansatz. Dazu wird der Datensatz durch den paarweisen Vergleich der 24 Länder transformiert, so dass sich für jedes Jahr 552 Länderpaare als Untersuchungseinheiten ergeben. Konditionaler Wandel bedeutet, dass die Änderung in einem Land der Dyade mit der Existenz eines Modells im anderen Land einhergeht. Ist dies der Fall, spricht man von Modellwandel. Diese dichotome Variable kann durch Bedingungen wie Konvergenz und Richtung weiter spezifiziert und von Pionierwandel und synchronem Wandel unterschieden werden. Zum Abschluss des Kapitels werden auch Datenbasis und Operationalisierung der unabhängigen Variablen für Lern- und Kontrollmechanismen präsentiert. Eine Besonderheit dieses Projekts liegt in der breiten Aufmerksamkeit, die den mit makro-quantitativen Methoden erkennbaren Konsequenzen von PolicyLernen gewidmet wird. Lerntheorien treffen in vielen Fällen explizit oder implizit Annahmen zur erwarteten Form des Policy-Wandels. Eine deskriptive Analyse kann daher eine inferenzstatistische Analyse ergänzen, indem sie offen legt, ob Wandel als notwendige Bedingung von Lernen vorliegt. Ist diese Bedingung
1 Einleitung
19
nicht erfüllt, muss nicht weiter nach Zusammenhängen gesucht werden. In Kapitel 4 werden daher die unterschiedlichen Facetten des Wandels nationaler Umweltpolitik dargelegt. Neben der Häufigkeit und Richtung von Änderungen werden Konvergenz und konditionaler Wandel analysiert. Schon auf dieser Ebene kann der Einfluss konkurrierender Faktoren wie Standortwettbewerb oder europäische Harmonisierung ermittelt werden, indem Modellwandel mit anderen Mustern des Wandels verglichen werden. Die eigentliche Untersuchung der Erklärungsfaktoren des Wandels erfolgt in Kapitel 5. Multivariate Regressionsanalysen werden zunächst für Modellwandel bei der Ersteinführung von allgemeinen Umweltpolitiken (z.B. Regulierung zum Recycling von Verpackungsmüll) und danach für Modellwandel bei Politikstandards (z.B. Grenzwert für PKW-Emissionen) durchgeführt. Wegen des grundsätzlich binären Charakters von Policy-Wandel als abhängiger Variable wird die Analyse auf der Basis logistischer Regressionen durchgeführt, die für die Besonderheiten des vorliegenden „time series cross section (TSCS)“Designs entsprechend spezifiziert werden. Um möglichst robuste Resultate zu erzielen, wird ein Basismodell mit unterschiedlichen Schätzverfahren und mit Modellen für andere Formen konditionalen Wandels verglichen. Da das Ziel der Analyse die Identifikation eines allgemeinen Trends bei der Erklärung von Policy-Wandel ist, werden für die abhängige Variable Informationen zu allen Politiken und 17 Standards aggregiert, ohne dass dabei ihr dichotomer Charakter verloren geht. Um mögliche Artefakte dieser Aggregation offen zu legen, wird das gleiche Erklärungsmodell auch auf einzelne Politiken und Standards angewandt. Neben den beiden zentralen Forschungsfragen gibt es noch drei weitere Aspekte, hinsichtlich derer in diesem Buch ebenfalls ein Beitrag zur aktuellen politikwissenschaftlichen Forschung geleistet werden soll. Erstens macht der theoretische Analyserahmen Elemente von Lerntheorien einer empirischen Überprüfung zugänglich, die bislang in der politikwissenschaftlichen Komparatistik kaum verwendet wurden. Dazu zählt beispielsweise das Lernen aus eigener Erfahrung oder Herdenverhalten als Orientierung an einer dominanten Gruppe von Staaten. Zweitens wird ein Instrumentarium für die Analyse von PolicyWandel bereitgestellt, das in Form wie Umfang neu ist und einen differenzierten und systematischen Vergleich unterschiedlicher Typen einer Veränderung ermöglicht. Drittens leistet dieses Buch auch einen substanziellen Beitrag zur Analyse von Umweltpolitik. Durch die breite Analyse des neuen Datensatzes wird eine Vielzahl neuer Erkenntnisse zu Dynamik, Niveau und Umfang europäischer Umweltpolitik seit 1970 präsentiert.
2 Theorien und Konzepte des Lernens: ein Analyserahmen für die Untersuchung von Policy-Wandel 2
Theorien und Konzepte des Lernens
Wachsende Beliebtheit macht aus Policy-Lernen ein zunehmend vielseitiges, vor allem aber unübersichtliches Forschungsgebiet (Bandelow 2003a). Dabei treffen sehr unterschiedliche Konzepte von Lernen aufeinander, die oft nur wenig trennscharf von anderen Faktoren des Wandels abgegrenzt werden oder Lernprozesse mit der Veränderung von Politik gleichsetzen (Levy 1994: 289). Zudem findet man in der aktuellen Literatur ein nur wenig geordnetes Nebeneinander von Theorien und Begriffen wie „social learning“, „emulation“, „contagion“ oder „lesson-drawing“. Angesichts dieser Unübersichtlichkeit soll im folgenden Kapitel ein umfassender Überblick über Lerntheorien in der Politik geboten werden, der die vielen Strömungen der aktuellen Literatur systematisiert, um sie für einen empirischen Test der Wirkungsweise von Lernprozessen nutzbar zu machen. Das Ziel ist dabei nicht die Formulierung einer einheitlichen Lerntheorie, sondern eines Analyserahmens, der es wegen einer innovativen Aufarbeitung des Forschungsstandes erlaubt, unterschiedliche Formen des Lernens in einer makro-quantitativen Analyse vergleichend zu untersuchen. Dabei werden neue Kategorien der Systematisierung von Lerntheorien eingeführt und Erkenntnisse aus unterschiedlichen Bereichen der Politikwissenschaft und angrenzender Disziplinen integriert, die bislang nicht oder nicht hinreichend verknüpft wurden. Nach einem kurzen Überblick über verschiedene Forschungstraditionen (2.1) und einer ausführlichen Definition des Lernbegriffs (2.2) werden die drei wesentlichen Elemente von Lerntheorien dargestellt (2.3). Zuerst werden Anreize und Motive des Lernens in sieben Kategorien zusammengefasst. Davon unterschieden werden die Orientierungspunkte, anhand derer ein Modell zur Übernahme ausgewählt wird. Diese unterteilen sich in vier Kategorien der Orientierung: (a) an erfolgreichen und scheinbar erfolgreichen Ländern; (b) an Nähe, kultureller Ähnlichkeit und Konkurrenz; (c) an Netzwerken internationaler Institutionen und (d) an einer dominanten Gruppe oder Herde. Zu den Orientierungspunkten werden jeweils allgemeine Hypothesen formuliert, die den Ausgangspunkt für einen empirischen Test von Lerneffekten bilden. Drittens werden auch die theoretischen Annahmen zu Konsequenzen effektiven Policy-
T. Sommerer, Können Staaten voneinander lernen?, DOI 10.1007/ 978-3-531-92625-4_2, © VS Verlag für Sozialwissenschaften | Springer Fachmedien Wiesbaden GmbH 2011
22
2 Theorien und Konzepte des Lernens
Lernens dargestellt. Im letzten Abschnitt dieses Kapitels erfolgt schließlich eine Darstellung alternativer Ansätze zur Erklärung von Policy-Wandel, die in Konkurrenz zu Lerntheorien stehen (2.4).
2.1 Forschungstraditionen der Analyse von Lernprozessen in der Politik 2.1 Forschungstraditionen Ein derart vielseitiger und allgemeiner Begriff wie der des Lernens taucht in den unterschiedlichsten politikwissenschaftlichen Forschungsbereichen auf, die schon in einer ganzen Reihe von Überblicksartikeln erfasst wurden (Bandelow 2003a; Bennett und Howlett 1992; Dolowitz und Marsh 1996; Levy 1994). Die folgende Darstellung der Literaturtraditionen geht jedoch deutlich über das Spektrum dieser Beiträge hinaus. Die Reihenfolge der Abhandlung entspricht in etwa dem chronologischen Verlauf der wissenschaftlichen Beschäftigung mit dem Thema.
2.1.1 Historische Analogien und „Lessons from the Past“ Hinsichtlich der Erfahrungen, an denen sich politische Führer, Herrscher und Staatenlenker orientieren, besteht schon seit der Antike eine Verbindung von Lernen und Politik.4 Auch das der Einleitung vorangestellte Zitat Machiavellis weist auf die historische Dimension des Themas hin. In der modernen Sozialwissenschaft etablierte sich das Lernen politischer Führer mit dem Aufkommen der politischen Psychologie Mitte des zwanzigsten Jahrhunderts. Wichtigster Untersuchungsgegenstand in der Literatur zu historischen Analogien sind Ereignisse der Außenpolitik, die das zwanzigste Jahrhundert geprägt haben. Es geht um Lehren aus den Versailler Vertrag und dem Münchner Abkommen, später aus dem Korea- und Vietnamkrieg.5 Lernen von Ereignissen der Vergangenheit scheint besonders an den Bereich der Außenpolitik gekoppelt, da ein Land meist auf eine lange Liste vergleichbarer oder scheinbar vergleichbarer Situation in seiner eigenen Geschichte zurückblicken kann. Zudem spielen bei der Gestaltung von Außenpolitik singuläre Ereignisse eine hervorgehobene Rolle, was nicht für viele andere Politikbereiche gelten mag. 4
5
Macdonald (2000: IX) zitiert den griechischen Philosophen Polybus: „For it is history, and history alone, which, without involving us in actual danger, will mature our judgement and prepare us to take right views, whatever may be the crisis or the posture of affairs.” Zur Verdeutlichung des Einflusses von Analogien in der Politik führt Rasmussen (2003: 55) ein Churchill-Zitat zum zehnten Jahrestag des Abkommens von München an: „Now ten years later, let the lessons of the past be a guide.“
2.1 Forschungstraditionen
23
Zu den wichtigsten Arbeiten zählen der Beitrag von Butterfield (1951), der sich mit der Verwendung von Analogien für den Wiener Kongress von 1815 und den Versailler Vertrag von 1919 beschäftigt, sowie „Lessons from the Past“ von May (1973) und „Perception and Misperception in World Politics“ von Jervis (1976; vgl. Levy 1994: 280). May und Jervis analysieren die Verwendung historischer Analogien in der amerikanischen Außenpolitik zur Zeit des Kalten Krieges. Neben historisch-narrativen Arbeiten gibt es in diesem Forschungsbereich auch kognitive Erklärungsansätze, die Erkenntnisse aus der Sozialpsychologie auf die Politik anwendeten (Jervis 1976: 234ff; vgl. Harnisch 2000: 34ff). Ende der achtziger Jahre gab es eine zweite Welle von Arbeiten zu den so genannten „lessons“. Im Mittelpunkt stand dabei die Erforschung des Wandels in der sowjetischen Außenpolitik unter Gorbatschow. Diese Themenkonjunktur war eindeutig durch die Tatsache bedingt, dass strukturalistische Theorien die Wende in den kommunistischen Staaten nicht hinreichend erklären konnten (Breslauer 1991; Stein 1994; vgl. Levy 1994). Eine Berücksichtigung der Literatur zu historischen Analogien ist für die Analyse von Policy-Lernen lohnenswert, weil hier das in anderen Bereichen oft vernachlässigte Lernen aus der Erfahrung eine zentrale Rolle spielt. Zudem werden lernende Akteure auf der Ebene einzelner Individuen explizit modelliert und auch Schwächen des Lernansatzes diskutiert, wie zum Beispiel eine nur metaphorische Verwendung des Lernbegriffs.6
2.1.2 Diffusions-, Transfer- und Konvergenzforschung Die Literatur zu Diffusion, Transfer und Konvergenz von Politiken bildet eine zweite Forschungstradition. Lernen wird hier als eine Form der freiwilligen Imitation von Politikinnovationen über Ländergrenzen hinweg untersucht. Die wissenschaftliche Beschäftigung mit der Diffusion von Innovationen geht auf „Les lois de l'imitation“ von Tarde (1903) zurück. Erste empirische Arbeiten gibt es im politikwissenschaftlichen Kontext seit den dreißiger Jahren in der Analyse der Ausbreitung von Sozialversicherungssystemen (Davis 1930; McVoy 1940). Auf größere Resonanz stießen erst die Arbeiten von Walker (1969) und Gray (1973), die Pionierverhalten und räumliche Muster in der Ausbreitung politischer Innovationen für die amerikanischen Bundesstaaten untersuchten. Collier und Messick (1975) gehörten zu den ersten Autoren, die eine politikwissenschaftliche Diffusionsstudie im internationalen Vergleich durchführten.
6
Schlesinger (1974) vergleicht die Verwendung historischer Analogien mit einer „grab bag of the past“ die nur zur ex-post-Rationalisierung benutzt werde.
24
2 Theorien und Konzepte des Lernens
Seit den frühen neunziger Jahren und dem Beitrag von Berry und Berry (1990) hat sich die vergleichende Diffusionsforschung stark ausgebreitet und methodisch verfeinert (vgl. Elkins und Simmons 2005; Howlett und Rayner 2008; Meseguer und Gilardi 2005; Tews 2002a). In der aktuellen Literatur finden sich Analysen zu vielen Politikfeldern, mit einem Schwerpunkt auf der Untersuchung von Privatisierungs- und Liberalisierungspolitiken (Brooks 2005; Mesegeuer 2005; vgl. Simmons, Dobbins und Garrett 2006). Die Beschäftigung mit Konvergenz und dem Transfer von Politiken ist eng verwandt mit der Diffusionsforschung. In der Konvergenzliteratur wird der Einfluss von transnationaler Kommunikation und Lernen auf die Annäherung staatlicher Regulierungen untersucht (Drezner 2001; Heichel, Pape und Sommerer 2005; Holzinger und Knill 2005). Bei der Untersuchung von Politiktransfers werden speziell die Akteure und Motive der transnationalen Übertragung eines Politikmodells thematisiert (Dolowitz und Marsh 1996; Dolowitz 2000; Evans und Davies 1999; Stone 1999). Die Literatur zu Konvergenz, Transfer und Diffusion enthält eine Reihe wichtiger Bausteine für die Analyse von PolicyLernen. Dazu zählt die Entwicklung innovativer Analyseverfahren sowohl im Bereich qualitativer als auch quantitativer Forschungsmethoden, aber auch der umfassende Bestand empirischer Analysen. Wichtig ist zudem die in anderen Forschungstraditionen oft vernachlässigte Integration unterschiedlicher Lernmechanismen sowie die Berücksichtigung alternativer Erklärungsfaktoren.
2.1.3 Systemisches Lernen in der Organisationsforschung Eine dritte Forschungstradition, die mit den ersten beiden nur wenig gemein hat, betrifft Beiträge zu systemischem und organisationellem Lernen. Sie geht auf die vierziger Jahre zurück, als in den USA der interdisziplinäre Ansatz der Kybernetik entwickelt wurde, in dessen Rahmen auch die Steuerung des politischen Systems thematisiert wurde (Easton 1953). Entscheidenden Anteil an der Entwicklung des Konzeptes von systemischem Lernen in der Politik hatte Karl Deutsch, der in „The Nerves of Government” (1963) die Lernkapazität als Gegenpol zu Machtausübung und als eine überlebensnotwendige Bedingung jeden politischen Systems darstellte. Der Lernbegriff von Deutsch stand Pate für den Forschungsbereich des Organisationslernens (Argyris und Schön 1978; 1996; March und Olsen 1975; Miller 1986; Senge 1990; Dierkes et al. 2001; vgl. Malek und Hilkermeier 2003). In diesem Bereich gibt es jedoch nur sehr vereinzelt politikwissenschaftliche Beiträge (Etheredge 1981; siehe aber LaPalombara 2001). Meist wird aus soziologischer oder betriebswirtschaftlicher Perspektive analysiert, wie Lern-
2.1 Forschungstraditionen
25
prozesse in und zwischen Organisationen ablaufen – überwiegend deskriptiv oder normativ-präskriptiv. Zum Forschungsbereich des Organisationslernens im weiteren Sinne gehören auch die überwiegend soziologischen Beiträge zur Imitation von Organisationsformen. Mit dem Begriff des Isomorphismus beschreiben DiMaggio und Powell (1983; 1991) einen Prozess der Homogenisierung von Organisationen, der durch institutionelle Zwänge, soziale Normen, Unsicherheit und Imitation vorangetrieben wird. Organisationsforschung und Systemtheorie leisten einen wichtigen Beitrag zur Analyse von Policy-Lernen, da hier die Grenzen individualpsychologischer Modellierung überschritten und kollektive Akteure wie Regierungsorgane in die Analyse von Lernprozessen integriert werden. Darüber hinaus werden hier die Rolle von Lernbarrieren und die Struktur von Kommunikationsprozessen in privatwirtschaftlichen Organisationen erforscht, was den Ausgangspunkt für eine systematische Übertragung auf staatliche Organisationen bilden könnte.
2.1.4 Policy-Analyse und Lernen von politischen Ideen In der Policy-Analyse als vierter Forschungstradition stellt Heclo's Vergleich der Sozialpolitik in Schweden und Großbritannien eine Pionierarbeit dar („Modern Social Politics: from Relief to Income Maintenance in Britain and Sweden”, 1974). Mit Bezug auf Deutsch (1963) untersucht er Lernen im politischen Prozess mit qualitativen Forschungsmethoden. Heclo identifiziert dabei Unsicherheit als wesentliche Ausgangsbedingung von Lernen und im „political middleman“ einen durch seine gute internationale Vernetzung für PolitikTransfers entscheidenden Akteurstypus. Ein ebenfalls häufig zitiertes Konzept ist das des Lernens als Paradigmenwechsel (Hall 1989; 1993). Hall unterscheidet mehrere Formen von Policy-Wandel. Paradigmatischer Wandel geht auf einen Prozess gesellschaftlichen Lernens zurück, der nicht nur technische Details einer Politik, sondern die dahinter stehende Idee betrifft. Als Beispiel für einen Prozess sozialen Lernens dient die Ablösung des Keynesianismus durch den Neoliberalismus in der britischen Wirtschaftspolitik zu Beginn der Regierung Thatcher. Neben Fallstudien gibt es in dieser Forschungstradition eine ganz Reihe von theoretischen Beiträgen, etwa zum Konzept des „lesson drawing“ von Rose (1991) oder zum „advocacy coalition“-Ansatz (Sabatier 1987, 1988; vgl. Bandelow 2003a; Howlett und Bennett 1992). Lerntheorien aus der Policy-Analyse tragen verstärkt zu einer Aufklärung der Motive hinter dem Auftreten von Lernprozessen bei. Zudem wurde in diesem Forschungsbereich versucht, individuelles und kollektives Lernen miteinander zu verknüpfen und den Einfluss von Netzwerken auf den Erfolg von
26
2 Theorien und Konzepte des Lernens
Lernprozessen zu erforschen. Schließlich spezifizieren Arbeiten in dieser Forschungstradition das Objekt des Lernens genauer als in anderen Bereichen nach unterschiedlichen Dimensionen einer Politik, von der Kalibrierung spezifischer Instrumente bis hin zu grundlegenden politischen Ideen.
2.1.5 Theorien des sozialen Lernens in der Ökonomie Ein fünfter Bereich der Lernliteratur ist in der Politikwissenschaft bisher nur schwach vertreten. Ökonomische Theorien sozialen Lernens und Konzepte wie „herding“, „contagion“, „bandwagoning“ oder Informations- und Reputationskaskaden befassen sich mit dem Einfluss von sozialen Gruppen auf die Entscheidung des Einzelnen. Der sogenannte „bandwagon“-Effekt stammt ursprünglich aus der politikwissenschaftlichen Wahlforschung (Lazarsfeld, Berelson und Gaudet 1944). Soziales Lernen wurde aber auch in der Ökonomie aufgegriffen, wo Leibenstein (1950) das Auftreten von Modewellen und Hysterien im Konsumverhalten der modernen wissenschaftlichen Behandlung erschloss.7 Über die mathematische Theorie von Epidemien und über die Evolutionsbiologie kam dieses Konzept in der ökonomischen Literatur der neunziger Jahre zu neuer Blüte, wobei die alte Sichtweise von Finanzmärkten als von „tierischen Instinkten getriebenen Institutionen“ (Avery und Zemsky 1998: 724) mit Hilfe ökonomischer Modellbildung formalisiert wurde. In den Annahmen der klassischen Beiträge zu Informationskaskaden ist es für einen Akteur die beste Entscheidung, das Verhalten anderer zu beobachten und gegebenenfalls unter Missachtung eigenen Wissens deren Verhalten zu imitieren, woraus ein „Herdeneffekt“ als Sequenz von Entscheidungen entstehen kann (Banerjee 1992; Bikhchandani, Hirshleifer und Welch 1992). Darauf bauen auch Modelle der Reputationskaskaden auf, die vollständige Rationalität bei der Beobachtung durch die Verwendung kognitiver Heuristiken ersetzen (Ellison und Fudenberg 1993; 1995). Unter den wenigen sozialwissenschaftlichen Anwendungen der Theorien sozialen Lernens finden sich eine Untersuchung von Kuran (1998) zu interkultureller Diffusion ethnischer Normen oder auch ein Beitrag von Lohmann (2000) zu Kaskadeneffekten bei Massendemonstrationen (siehe auch Gavious und Mizrahi 2001). Levi-Faur (2002) beschäftigt sich mit Herdeneffekten und sozialem Lernen bei der Ausbreitung der Liberalisierung im Telekommunikationssektor. Ebenfalls verwandt mit den ökonomischen Theorien sozialen Lernens sind neuere politikwissenschaftliche Beiträge zu Ansteckungseffekten 7
Zu Vorläufern in diesem Forschungsfeld siehe z.B. Foley (1893).
2.1 Forschungstraditionen
27
(„bandwagoning“ oder „contagion“). Diese finden sich meist in der Außen- und Sicherheitspolitik (Huntington 1991; Kaufman 1992; Levy 1982; Li und Thompson 1975; Starr und Most 1983), seltener in anderen Bereichen wie der Privatisierungspolitik (Ikenberry 1990). Dabei kommt das Konzept des Lernens häufig nicht über die Verwendung als Metapher hinaus. Ökonomische Modelle des Herdenverhaltens wurden bislang nicht umfassend in die politikwissenschaftliche Diskussion von Lerntheorien eingegliedert, obwohl im Phänomen der „power in numbers“ (DeNardo 1985) ein Effekt beschrieben wird, der nicht nur theoretische Plausibilität genießt, sondern auch einfach in empirische Analysen integriert werden könnte. Zur Übertragung in die politikwissenschaftliche Analyse bietet sich in dieser Forschungstradition darüber hinaus auch die Strukturierung der Lernanalyse in mehrere Analyseebenen oder die Modellierung der individuellen Imitationsentscheidung als ein Mikromechanismus mit Kosten- und Nutzenkalkül an (Lohmann 2000).
2.1.6 Lernen in der Spiel- und Entscheidungstheorie In einer sechsten Kategorie der politikwissenschaftlichen Literatur zu Lerntheorien werden Forschungsansätze zusammengefasst, die im weiteren Sinne mit entscheidungstheoretischer und spieltheoretischer Modellierung zu tun haben. Entscheidungstheoretische Ansätze des „learning by doing“ mit einer Formalisierung des Erfahrungslernens in repetitiven Entscheidungssituationen finden sich mit wenigen Ausnahmen (Volden, Ting und Carpenter 2008) überwiegend in der ökonomischen Literatur (Selten, Abbink und Cox 2005; Mantzavinos, North und Syed 2004). Beiträge zu Lernen und Imitation auf der Basis bayesianischer und eingeschränkter Rationalität stammen aus der Diffusionsliteratur. Sie werden wegen ihrer expliziten Auseinandersetzung mit den entscheidungstheoretischen Grundlagen jedoch in dieser Kategorie angeführt. Meseguer Yebra (2004, 2006b) beschreibt, wie bayesianisches Lernen in der Politik modelliert werden kann. Unter der Bedingung von Unsicherheit beurteilen Regierungen alle verfügbaren Alternativen und deren Konsequenzen, bevor diese Beobachtungen mit bestehenden Überzeugungen abgeglichen werden. Modelle des „bounded rational learning“, die auf eingeschränkter Rationalität basieren, ersetzen perfekte Fähigkeiten bei der Informationssammlung durch kognitive Heuristiken (Weyland 2005; McDermott 2001; Eising 2003). Die Analyse von Lernprozessen in spieltheoretischen Modellen unterscheidet zwischen individuellem strategischem Lernen, etwa bei einem Anpassungsprozess in einem Oligopol, und sozialem strategischem Lernen, zu dem das Konzept der „evolutionary games“ gehört (Nelson 1998; Fudenberg und Levine
28
2 Theorien und Konzepte des Lernens
1998). In der Politikwissenschaft finden sich erst in jüngster Zeit theoretische Beiträge (Volden, Ting und Carpenter 2008) sowie empirische Anwendungen auf die Analyse internationalen Konfliktlösungs- und Verhandlungsprozesse (Koremenos 2003; Lovell und Silvan 1984; Malici 2008; Reiter 1996). Dieses Forschungsgebiet ist wegen der expliziten Behandlung von Rationalitätsannahmen der lernenden Akteure für eine Definition des Policy-Lernens von großer Bedeutung. Die Darstellung von Lernprozessen in formalen Modellen kann als Anregung dienen, Theorien des Policy-Lernens einer systematischewren Betrachutngsweise zu unterziehen.
2.1.7 Analyse von Lernen in Nachbardisziplinen der Politikwissenschaft Diese kurze Übersicht über die Literatur zu Lerntheorien in der Politikwissenschaft ging schon deutlich über die Grenzen der Disziplin hinaus. Sie zeigt, dass sich die Beschäftigung mit dem Thema Lernen in einem interdisziplinären Feld bewegt. Neben der soziologischen und ökonomischen Literatur gehören dazu auch Psychologie und Anthropologie. Über alle genannten Forschungstraditionen hinweg wird besonders häufig auf das sozial-psychologische Konzept des Modelllernens von Bandura Bezug genommen (1973; 1979; Bandura und Walters 1963; vgl. LeFrancois 1994: 193ff). Dessen sozial-kognitive Lerntheorie gliedert einen Lernprozess in vier Phasen. Sie erlaubt es, die Imitation auch komplexer Verhaltensmuster und Handlungen zu erklären. Beide Aspekte können Impulse für die Definition von Lernen in der Politik und für die Struktur eines Analyserahmens liefern. In der Anthropologie und Evolutionsbiologie werden kulturelles Lernen und der Zusammenhang von Imitation und „trial and error“-Lernen untersucht (McElreath et al. 2005; Henrich und Boyd 1998). Dieser Forschungsbereich findet bislang genauso wie die Populationsökologie (Baum und Oliver 1992) trotz ähnlicher Ursprünge und verwandter Fragestellung kaum Eingang in die politikwissenschaftliche Diskussion. Ein wichtiger Gegenstand der Analyse von Lernen in diesem Bereich betrifft das Gleichgewicht aus individuellem und sozialem Lernen (vgl. Kameda und Nakanishi 2002: 389). Erkenntnisse aus dieser Literatur können die Analyse von Lernen in der Politik dahingehend bereichern, dass Imitation in einen gemeinsamen Kontext mit Innovation und Pionierverhalten gestellt wird und divergierende Vorstellungen zu Lernen auf der individuellen und kollektiven Ebene in Einklang gebracht werden könnten. Die Darstellung der unterschiedlichen Forschungstraditionen umfasst nicht das komplette Universum aller Beiträge zu Lerntheorien, die mit Politik zu tun haben. Zum Beispiel wurde die Literatur zu Politikevaluation oder strategi-
2.2 Terminologie und Definition von Policy-Lernen
29
schem Lernen im Parteienwettbewerb und beim Wahlverhalten nicht berücksichtigt.8 Aber auch so lässt sich der Stand der politikwissenschaftlichen Forschung zu Lerntheorien als ein eklektisches Gebilde erkennen. Die Literatur zeichnet sich durch konzeptuellen Reichtum, aber auch einige beträchtliche Forschungslücken aus, etwa beim Vergleich unterschiedlicher Lerntheorien oder bei einer zu starken Fokussierung auf Lernerfolg bei gleichzeitiger Vernachlässigung der Analyse von Prozessen. Bevor die einzelnen Elemente der Mechanismen von Policy-Lernen in einen Analyserahmen integriert werden, wird eine Basisdefinition von Lernen entwickelt und damit der Blickwinkel von der Breite der Literatur wieder auf den eigentlichen Gegenstand der Untersuchung verengt.
2.2 Terminologie und Definition von Policy-Lernen Wie der Umfang des skizzierten Forschungsfeldes erahnen lässt, gibt es deutlich divergierende Vorstellungen über den Begriff des Lernens. Obwohl - oder gerade weil - in der Literatur kein Mangel an Versuchen besteht, mehr Systematik in die Terminologie zu bringen (Bandelow 2003a; Braun und Benninghoff 2003; Howlett und Bennett 1992; May 1992; Levy 1994), kursiert eine Vielzahl von Begriffen, die mehr oder weniger entfernt mit Lernen zu tun haben. Dazu zählen unter anderem „diffusion“, „lesson-drawing“, „contagion“, „emulation“, „isomorphism“, „imitation“, „herding“, „bandwagoning“ oder „cascades“. Der eigentliche Begriff des Lernens wird häufig mit Zuschreibungen verknüpft, von „social learning“, „rational learning“, „organisational learning“, „governmental learning“, „policy-oriented learning“ bis zu „policy learning“. Mit Hilfe einer bibliometrischen Analyse lassen sich diese Begriffe nach der Häufigkeit ihrer Verwendung untersuchen. So kann einerseits die Beschäftigung mit Lerntheorien im Allgemeinen quantifiziert werden, andererseits wird die relative Bedeutung der einzelnen Konzepte sichtbar. Die Auswertung erfolgt anhand der Trefferzahl der entsprechenden Schlagwörter in einhundert politikwissenschaftlichen Fachzeitschriften, die im „Social Science Citation Index“ (SSCI) gelistet sind.9 Zuerst zeigt Abbildung 1 die jährliche sowie die kumulative Häufigkeit der beiden umfassendsten Begriffe, nämlich „learning“ und „diffusion“. Es fällt auf, dass Lernen zu jeder Zeit deutlich weiter verbreitet war als Diffusion. Die Aus8
9
In jüngster Zeit ist die Lernliteratur auch in diesen Bereichen stark gewachsen. Siehe z.B. für das Lernen von Kandidaten und Amtsinhabern im Wahlkampf Le Borgne und Lockwood 2006; für Wahlverhaltens als Lernprozess McClurg 2003; Arceneaux 2006; für Politikevaluation siehe Bussmann et al. 1997; Wollmann 2006. SSCI ©Thomson Scientific.
30
2 Theorien und Konzepte des Lernens
breitung des Themas verläuft in mehreren Stufen. Während zu Beginn der siebziger Jahre Lernen nur in einer Hand voll Artikel erwähnt wird, erscheinen ab 1975 – also kurz nach den vielzitierten Beiträgen von Heclo, Jervis und May etwa zehn Artikel pro Jahr. Dieser Wert bleibt bis zum Ende der achtziger Jahre konstant. In den Jahren 1991 und 1992 kommt es zu einer starken Erhöhung auf jährlich über 60 Artikel mit einem Bezug auf „learning“. Diese Entwicklung verstärkte sich in den Folgejahren, seit 2000 sind jährlich über 120 Artikel zu verzeichnen. Insgesamt finden sich für den Zeitraum von 1970 bis 2005 über 1.500 Erwähnungen. Für den Diffusionsbegriff ist ein ähnlicher Verlauf zu beobachten, jedoch auf deutlich geringerem Niveau (insgesamt knapp 600 Treffer). Die Verbreitung dieses Konzeptes fand mit einer leichten Verzögerung statt, die größten Zuwächse finden sich am Ende des Untersuchungszeitraums. Abbildung 1:
Häufigkeit der Begriffe "Learning" und "Diffusion", SSCI
Die kumulativen Trefferzahlen von zehn alternativen Bezeichnungen für Lernprozesse sind in Abbildung 2 zu sehen. Wie schon im vorigen Schaubild lässt sich auch hier zunächst eine generelle Zunahme der Beschäftigung mit Lernen konstatieren. Darüber hinaus ist deutlich ein Zyklus unterschiedlicher Themenkonjunkturen zu erkennen. In den siebziger Jahren ist „bandwagoning“ das am weitesten verbreitete Konzept, da der Begriff in Koalitions- und Gleichge-
2.2 Terminologie und Definition von Policy-Lernen
31
wichtstheorien in der Literatur zu Internationalen Beziehungen sowie in der Wahlforschung eine wichtige Rolle spielt (39 Treffer bis 2005). Seit den frühen achtziger Jahren findet sich verstärkt der aus dem medizinisch-biologischen Kontext entlehnte Begriff „contagion“ (48). Er überflügelt damit „imitation“ (40) und „social learning“ (39), deren Verbreitungsgrad in den neunziger Jahren spät, aber rasch wuchs. Der Begriff „policy learning“ ist in der Literatur vor 1990 kaum bekannt, bis dahin wird er im SSCI nur fünfmal angeführt. Seit Mitte der neunziger Jahre steigt die Zahl der Nennungen jedoch deutlich an, bis zum Jahr 2005 werden 52 Treffer gezählt. Eine ähnliche Dynamik, jedoch auf wesentlich geringerem Niveau ist für Informations- und Reputationskaskaden („cascades“, 31) und „herding“ (23) zu beobachten. Seit den späten neunziger Jahren erfreut sich auch „emulation“ verstärkter Beliebtheit, vor allem im Bereich der Diffusions-, Transfer- und Konvergenzforschung (26). Die gleiche Trefferzahl findet sich für Organisationslernen, das in der Politikwissenschaft stark unterrepräsentiert ist. Schließlich entfallen 17 Nennungen auf das Konzept des „isomorphism“. Abbildung 2:
Alternative Begriffe des Lernens, SSCI
32
2 Theorien und Konzepte des Lernens
Man könnte argumentieren, dass einige dieser Begriffe eigenständige Erklärungen von Politikwandel repräsentieren und in der Folge etwa zwischen „emulation“ und „learning“ unterscheiden (siehe Simmons, Dobbin und Garrett 2006). Da sich die meisten der genannten Konzepte zur Erklärung von Policy-Wandel auf irgendeine Form zwischenstaatlicher Kommunikation beziehen, die zur Homogenisierung nationalstaatlicher Regulierungen führt, kann eine ausreichende Basis für die Verwendung von Lernen als gemeinsamen Oberbegriff angenommen werden (vgl. Holzinger, Knill und Sommerer 2008: 559). Ein klarer Nachteil des Lernbegriffs ist jedoch seine Mehrdeutigkeit in der wissenschaftlichen und alltagssprachlichen Verwendung, die zu Missverständnissen führen kann. Dennoch gibt es keine wirklichen Alternativen. Der Diffusionsbegriff ist kaum weniger umstritten, aber noch umfassender und unschärfer. Er setzt zudem keine Freiwilligkeit voraus und ist auf die Dynamik der Ausbreitung, nicht aber auf die Motive und Anreize gemünzt (vgl. Levi-Faur 2002). Die Begriffe „Imitation“ oder „Adaptation“ sind anderweitig und enger definiert, so dass ihre Verwendung ebenfalls nicht für größere Klarheit sorgen kann. Eine Definition des Lernbegriffs muss jedoch auf dessen Vielseitigkeit eingehen. Daher erfolgt sie anhand einer umfassenden Diskussion alternativer Konzepte zu insgesamt sieben Dimensionen des Lernbegriffs, die aus der Literatur abgeleitet werden können. Eine präzise wie umfassende Definition ist wegen der zahlreichen Kontroversen und Widersprüchlichkeiten von großer Wichtigkeit sowohl für die Theorie als auch für die anschließende empirische Analyse. Sie soll helfen, Einwänden gegen die Verwendung des Lernbegriffs zuvorzukommen und Fehldeutungen zu vermeiden. Als Ausgangspunkt dient eine minimale, aber offene Definition von Levy (1994: 283), der Lernen als die Veränderung bestehender oder die Entwicklung neuer Überzeugungen, Fähigkeiten oder Prozeduren versteht, die auf Beobachtung, Interpretation oder Evaluation von Erfahrung beruht (vgl. Weyland 2004: 4).
2.2.1 Veränderungs- vs. Verbesserungslernen Die erste Begriffsdimension bezieht sich auf das bei Levy (1994) genannte Verhältnis von Lernen und einer damit einhergehenden Veränderung des Verhaltens: reicht bloße Veränderung für Lernen aus, oder muss sie mit einer Verbesserung verbunden sein? In der Psychologie werden Lernen und Verhaltensänderung oft synonym gebraucht und nur von Prozessen genetisch vorbestimmter Reifung oder Ermüdung abgegrenzt (LeFrancois 1994: 3f; Hilgard und Bower 1975). Für die politikwissenschaftliche Literatur kritisiert Levy (1994: 282) eine derartige Gleichsetzung als naiv, da zahlreiche alternative Ursachen für Policy-
2.2 Terminologie und Definition von Policy-Lernen
33
Wandel bekannt seien. Stattdessen ist es erforderlich, das Vorliegen von Lernen an die Kontrolle des Einflusses konkurrierender Faktoren zu knüpfen. Dazu zählen beispielsweise der Zufall („random deviation“, Hilgard und Bower 1975) und jede Form von Zwang. Auch durch externe Ereignisse verursachte unabhängige, aber synchrone Entscheidungen oder rechtliche Verpflichtungen können zu Policy-Wandel führen (Holzinger und Knill 2005). Anders formuliert bedeutet dies, dass eine Veränderung intendiert und freiwillig erfolgen muss, wenn es sich um Lernen handeln soll. Lernen entspricht nach Levy (1994) der Veränderung von Präferenzen und Überzeugungen politischer Akteure. Entsprechend den grundsätzlichen Annahmen des Behaviorismus kann Lernen durch Nicht-Handeln wegen mangelnder Beobachtbarkeit nicht in eine Definition aufgenommen werden. In diesem Zusammenhang wird in der Literatur die Frage diskutiert, ob eine Verhaltensänderung bewusst sein muss. In der Psychologie überwiegt die Ansicht, dies nicht vorauszusetzen (Lefrancois 1994: 3). Im Kontext der Politik hingegen wird unbewusste Nachahmung oft vom Lernbegriff abgegrenzt (z.B. Gilardi 2002). Verbunden damit ist meist die Vorstellung, dass ein Individuum nur dann lernt, wenn sich seine Leistung verbessert. Mehr noch als in der Psychologie wird Lernen in der Politikwissenschaft mit einer besseren Zielerreichung in Verbindung gebracht (Bandelow 2003a: 99; Etheredge 1981: 77f; Levy 1994: 282). Dies entspricht der alltagssprachlichen Verwendung des Lernbegriffs, bleibt in der wissenschaftlichen Diskussion jedoch nicht unwidersprochen. Weite Teile der Diffusionsliteratur oder ökonomische Theorien sozialen Lernens kommen ohne Verbesserungslernen aus. Beispiele von Börsencrashs und Spekulationsblasen sowie Begriffe wie „contagion“ suggerieren sogar eine sozial schädliche Entwicklung durch Lernen (vgl. Walt 2000: 41). Zudem stellt die Messung von Lernerfolg den Forscher vor Schwierigkeiten (Hilgard und Bower 1975: 13). Für Lernen in der Politik ist dabei nicht nur die Bezugsgröße von Erfolg strittig (z.B. Machterhalt vs. optimale Problemlösung), sondern auch der Zeithorizont der Erfolgsmessung. Folgt man Erkenntnissen aus der kognitiven Psychologie, kann angenommen werden, dass Individuen Informationen nicht immer richtig verarbeiten (Weyland 2004: 5f). Wegen der Möglichkeit einer Fehldeutung muss Lernen demnach nicht zwingend eine messbare Verbesserung zur Folge haben. Ein Ausweg aus diesem Widerspruch für die Definition in dieser Arbeit besteht darin, die Intention der Verbesserung als notwendige Bedingung von Lernen zu verlangen, ohne dass eine Verbesserung tatsächlich eintreten muss (Weyland 2004: 6). So kann symbolisches Lernen, aber auch Verbesserungslernen im engeren Sinne in die Definition integriert werden. Letzteres ist schließ-
34
2 Theorien und Konzepte des Lernens
lich für die Begründetheit der wissenschaftlichen Beschäftigung mit Lernen in der Politik von großer Bedeutung ist (Bandelow 2003a: 106).
2.2.2 Instrumentelles vs. konzeptuelles Lernen Eine zweite Dimension, hinsichtlich derer Definitionen des Lernens variieren, betrifft die Unterscheidung zwischen instrumentellem (oder einfachem), konzeptuellem (oder komplexem) und sozialem Lernen. Sie spielt vornehmlich beim Organisationslernens als „single-loop“- bzw. „double-loop“-Lernen eine Rolle (Deutsch 1963; Argyris und Schön 1978; Wiesenthal 1995: 141; Malek und Hilkermeier 2003: 84). Während die erste Kategorie Lernen bezüglich eines konkreten Instruments erfasst, bezieht sich das Lernen „zweiter Ordnung“ auf die Ziele einer Organisation (May 1992: 340; Hall 1993: 297). Ein umfassender gesellschaftlicher Lernprozess im Sinne sozialen Lernens bei Hall (1988; 1993) entspricht einem Wandel dritter Ordnung.10 Hall versteht darunter das fundamentale Umdenken einer politischen Elite und Teilen der Gesellschaft. Was komplexes Lernen betrifft, wird oft der Nachweis eines Prozesses des Verstehens als erforderlich betrachtet. Dies schließt im gleichen Atemzug schlichte Nachahmung aus dem Lernbegriff aus: „In the case of imitation, and contrary to learning, governments do not choose policies due to an improved understanding of the consequences of their choices.“ (Meseguer 2006a: 172; May 1992; Bennett 1992; Schmid 2003: 32).11 Wenn man jedoch mehr Anreize zum Lernen anerkennt als lediglich das Streben nach einer besseren Problemlösung (vgl. Abschnitt 2.3.1), kann der Ausschluss von Imitation nicht aufrechterhalten werden. So elegant sie auch klingt, stellt die enge Definition eine zu große Vereinfachung dar. Folglich schließt die Definition dieser Arbeit das Lernen zu spezifischen Steuerungsinstrumenten, aber auch zu umfassenden politischen Ideen und Prinzipien ein.
2.2.3 Policy-Lernen vs. strategisches Lernen May (1992) diskutiert eine dritte Dimension der Definition von Policy-Lernen. In der politikwissenschaftlichen Analyse kann das Objekt des Lernens eine sub10
11
Die Bezeichnung „social learning“ bei Hall sollte nicht mit dem gleichlautenden Begriff aus der ökonomischen und anthropologischen Literatur verwechselt werden, der generell Lernen unter Einfluss Dritter beschreibt und im Fortlauf dieser Arbeit bevorzugt wird. Ein ähnliches Konzept beschreibt „mimetic isomorphism“ (DiMaggio und Powell 1991: 69) eine Imitation bei mangelndem Verständnis einer Innovation (Holzinger und Knill 2005: 785).
2.2 Terminologie und Definition von Policy-Lernen
35
stanzielle Politik oder eine politische Strategie sein. Bei „political learning“ geht es um das Erlernen erfolgversprechender Strategien zur Interessensdurchsetzung im politischen Betrieb. Policy-Lernen als das Lernen von Inhalten überwiegt in der Literatur und wird auch im Fokus dieses Buches stehen. Regierungen können sowohl hinsichtlich der Kalibrierung des Niveaus einer Regulierung lernen, als auch bei der Auswahl von Steuerungsinstrumenten, allgemeinen politischen Ideen oder Organisationsformen (Hall 1988: 7f).
2.2.4 Lernen vom Modell vs. Erfahrungslernen Nach Levy (1994: 283) beruht Lernen auf der Beobachtung, Interpretation oder Evaluation von Erfahrung. Lernen durch die Imitation eines Modells (Bandura 1973) wird in der vierten Dimension des Lernbegriffs von Lernen aus eigener Erfahrung nach dem Prinzip von Versuch und Irrtum unterschieden.12 Der Nutzen von Beobachtungslernen, auf das sich ein Großteil des menschlichen Verhaltensrepertoires bezieht, liegt darin, eigene Fehler zu vermeiden und Kosten auf andere abzuwälzen. In Experimenten konnte jedoch nachgewiesen werden, dass in einer sich verändernden Umwelt Imitation ohne Ergänzung durch individuelles „trial and error“- Lernen kollektiv zu schlechten Ergebnissen führt (Henrich und McElreath 2003: 125). Daher gibt es in jeder Form von Gesellschaft eine Mischung beider Lernstrategien (Henrich und McElreath 2003: 131; Kameda und Nakanishi 2002; für die Diffusionsliteratur Gray 1973). Beim Beobachtungs- oder Modelllernen hat das Verhalten anderer großen, manchmal sogar alleinigen Einfluss auf die individuelle Entscheidung. Da Individuen und selbst große Organisationen oft nicht über die Informationen verfügen, die der Entscheidung anderer zu Grunde lagen, bleibt nur der indirekte Weg, tatsächliches Verhalten zu beobachten und daraus Rückschlüsse zu ziehen (Gale 1996: 619). Im politikwissenschaftlichen Kontext führt dies beispielsweise zum Vergleich mit erfolgreichen Ländern oder Nachbarstaaten. Auch im politischen Diskurs ist häufig die Rede von Modellen. So war etwa das „Modell Deutschland“ Gegenstand unterschiedlichster Debatten, von der Vorbildrolle bis hin zur Schlusslichtdebatte Mitte der neunziger Jahre (Schmid 2003; Czada 2002).
12
Im Konzept des Modelllernens gehören Beobachtung und Imitation zusammen. Erst durch die Annäherung an ein Modell - ob graduell oder total - wird Beobachtungslernen jenseits individualpsychologischer Methoden messbar. Daher wird Imitation nicht wie in anderen Bereichen der Literatur vom Lernbegriff abgegrenzt. Beobachtung und darauf folgende Abweichung von „schlechten“ Beispielen wird hingegen nicht in die Definition aufgenommen.
36
2 Theorien und Konzepte des Lernens
Die Beobachtung der eigenen Erfahrung über die Zeit stellt eine Zwischenkategorie von Erfahrungs- und Modelllernen dar. Diese spielt in der Literatur zu historischen Analogien in der Außenpolitik eine zentrale Rolle. In anderen Forschungstraditionen finden sich jedoch nur wenige Bezüge auf diesen Lerntyp, so dass eine beträchtliche Forschungslücke entstand: „However, simply looking at the transfer of ideas or doctrines provides an incomplete picture of the information available to adopters. With some exceptions (see for example, Rose 1993; Olsen and Peters 1996; Lodge 2003), the literature of policy transfer is guilty of a failing typical of social science: overlooking learning from experience” (Mantzavinos, North und Syed 2004). Daher wird Modelllernen durch räumlichen, aber auch durch zeitlichen Vergleich in die Definition des Policy-Lernens integriert, so dass die Wirkung der Beobachtung des Erfolgs anderer mit Lehren der eigenen Vergangenheit gemeinsam untersucht werden kann.
2.2.5 Transnationales vs intra-systemisches Lernen Die fünfte Dimension des Lernbegriffs betrifft die Unterscheidung von intrasystemischem und intersystemischem Policy-Lernen. Beobachtungslernen bezieht sich in der Forschung zu Politikdiffusion, -transfer und -konvergenz meist auf den räumlichen Vergleich über die Grenzen politischer Systeme hinweg (Braun und Benninghoff 2003: 1853). Modelle werden auf der Ebene von Nationalstaaten imitiert, aber auch zwischen den Gliedstaaten eines föderalen Systems, wie die Literatur zur Diffusion von Politikinnovationen in den amerikanischen Bundesstaaten zeigt. Lernen innerhalb eines politischen Systems spielt etwa im Konzept des policy-orientierten Lernens von Interessengruppen und „advocacy coalitions“ bei Sabatier (1988) sowie in der Evaluationsliteratur eine Rolle, wird aber in der Definition dieser Arbeit nicht weiter berücksichtigt.
2.2.6 Individuelles vs. kollektives Lernen Auf der sechsten Dimension des Lernbegriffs unterscheiden sich Konzeptionen der Akteure des Lernens. Dieser Aspekt wird häufig stark vereinfacht oder gänzlich ausgespart: „Much of the learning literature is especially vague about who learns.“ (May 1992: 334). Die Darstellung lernender Akteure reicht von einem individualpsychologischen Modell des „einsamen Staatenlenkers“ oder der schlichten Black-Box-Darstellung einer homogenen Regierung bis hin zu ausgefeilten Konzepten wie dem der epistemischen Gemeinschaften bei Haas (1992), eines über institutionelle Grenzen hinweg operierenden Expertennetz-
2.2 Terminologie und Definition von Policy-Lernen
37
werks mit gemeinsamer Policy-Mission. Die grundsätzliche Unterscheidung bezieht sich auch hier auf zwei Alternativen: individuelles und kollektives Lernen (Etheredge 1981: 79). Für den ersten Ansatz spricht, dass die Träger politischer Entscheidungen reale Personen sind, bei denen sich ein kognitiver Wandel vollzieht (Levy 1994). Einige Anwendungen finden sich in Fallstudien der Policy-Analyse, vor allem aber in der Außenpolitikanalyse.13 Dies entspricht psychologischen Lernmodellen, vernachlässigt aber die Besonderheit des politischen Kontextes. Daher wurde schon früh über kollektive Lernakteure diskutiert (Deutsch 1963; May 1973; Heclo 1974; Jervis 1976). Dabei sind politische Entscheidungsträger Agenten und treffen Entscheidungen nicht nur nach Neigung und Fähigkeiten. Sie sind standardisierten Verfahren und dem politischen Wettbewerb unterworfen und können auf umfangreiche Ressourcen zurückgreifen (Malek und Hilkermeier 2003: 83). Ein kollektiver Akteur kann mehrere Prozesse arbeitsteilig und synchron bearbeiten und verfügt über ein „Gedächtnis“, das über den Verbleib einzelner Individuen hinaus Bestand hat (Jones 2003). Die Annahme, dass Organisationen lernen können, wurde oft und teilweise heftig kritisiert. Für manche Autoren ist in derartigen Konzepten Lernen kaum mehr als eine Metapher, während nur die Kognition einzelner Individuen für Lernprozesse verantwortlich gemacht werden könne (vgl. Levy 1994: 288). Im Gegenzug ist es jedoch auch plausibel, dass Organisationen aus Erfahrung lernen können, falls diese Erfahrung in die Doktrin und das Regelwerk einer Organisation, in ihre Struktur und ihre Entscheidungsfindungsprozesse „eingebettet“ wird (Lovell 1984: 135). Also besteht auch bei dieser Dimension eine Entscheidung für die Definition in dieser Arbeit nicht im Ausschluss einer der beiden Alternativen, sondern in ihrer Verknüpfung. Einen solchen Versuch formuliert schon Levy (1994: 288) so: „The process involves learning only if it includes individual cognitive change and only if individuals' inferences from experience become embedded in organizational memory and procedures. This organizational learning involves a multistage process in which environmental feedback leads to individual learning, which leads to individual action to change organizational procedures, which leads to a change in organizational behaviour which leads to further feedback.“ In dieser Integration des individuellen und kollektiven Ansatzes lernt ein politischer Akteur, ob idealtypisch als Regierungschef oder Fachminister, analog zum Individuum. Er kann dabei aufgrund des Eindrucks persönlicher Erfahrungen einer Fehleinschätzung unterliegen (Jones 2003: 401). Sein indivi13
Dass individuelle Akteure in der Literatur zu historischen Analogien eine wichtige Rolle spielen, kann nicht zuletzt auf den Handlungsspielraum amerikanischer Präsidenten in der Außenpolitik zurückgeführt werden.
38
2 Theorien und Konzepte des Lernens
duelles Lernen spiegelt sich aber in der Veränderung organisationeller Prozesse wider, die wiederum zu einer Veränderung des Outputs der Organisation führt. Der politische Entscheidungsträger unterscheidet sich in seiner Motivation, aber auch in seiner Einschränkung durch institutionelle Regeln von gewöhnlichen Individuen. Neben seinen kognitiven Ressourcen verfügt er über die Informationsverarbeitungskapazität eines bürokratischen Unterbaus. Mit diesem Konzept können Lernprozesse jenseits des Einzelfalls erfasst und Muster und Gesetzmäßigkeiten des Policy-Lernens untersucht werden.
2.2.7 Rationales vs. eingeschränkt-rationales Lernen Aus der politikwissenschaftlichen Lernliteratur kann schließlich noch eine siebte Dimension des Lernbegriffs in Form unterschiedlicher Rationalitätsannahmen abgleitet werden. Grundsätzlich kann Policy-Lernen als ein rationaler Prozess der Veränderung verstanden werden, wenn man beispielsweise berücksichtigt, dass politische Akteure Budgetdruck unterliegen oder vom Wähler nach ihrem Erfolg beurteilt werden (Rose 1993). Konzepte rationalen Lernens basieren auf der Annahme, dass Akteure bestimmten Regeln folgen, nach relevanten Informationen als Grundlage für die Entscheidung suchen und über ausreichend Präzedenzfälle verfügen (Braun und Benninghoff 2003: 1852).14 Es bleibt dabei jedoch offen, ob sich die Rationalität auf die Verbesserung der Problemlage oder der Situation politischer Akteure bezieht. Die beiden wichtigsten Konzepte, die diese allgemeinen Annahmen spezifizieren, sind vollständige und eingeschränkte Rationalität. Vollständig rationales Lernen wird meist als bayesianisches Lernen modelliert, da im politischen Kontext von Unsicherheit auszugehen ist (Braun und Gilardi 2006; Breen 1999; Meseguer 2004). Ausgangsbasis ist die Annahme, dass Regierungen über a priori Überzeugungen zu bestimmten Modellen verfügen (Meseguer 2000: 12). Abhängig von ihrer Risikoneigung werden Regierungen diese Überzeugungen regelmäßig (z.B. jährlich) nach der Bayes’schen Regel mit neu gewonnenen Erkenntnissen über die Wirksamkeit von Modellen anderer Länder abgleichen beziehungsweise „updaten“ (Meseguer 2004: 309; 14
Die Frage nach der Rationalität von Lernen ist trotz eines partiellen Konsenses ein wichtiger Streitpunkt in der Literatur (Braun und Benninghoff 2003: 1851). So werden rationale und „ideenorientierte“ Lerntheorien manchmal als Gegensätze angesehen (Harnisch 2000: 43; Bandelow 2003b). Die Abgrenzung geht jedoch oft mit einer Ausschlachtung des Instrumentariums rationaler Ansätze einher, wie zum Beispiel „beliefs“ und Heuristiken (Maier et al. 2003: 28; vgl. Goldstein und Keohane 1993). Lux (1995: 883) verweist auf eine ähnliche Diskussion in der ökonomischen Literatur zur Rationalität von Beobachtungslernen (Orléan 1989; Lesounre 1992).
2.2 Terminologie und Definition von Policy-Lernen
39
Koremenos 2003: 294; Gersen 2001: 19).15 Dabei wird einer Regierung unterstellt, dass sie Informationen über alle anderen Staaten auswerten und Alternativen prinzipiell ohne Bias bewerten kann (Meseguer 2006b: 39; Crescenzi 2007: 385). Rationale Lernmodelle machen starke Annahmen, etwa bezüglich der Kapazitäten der Informationsverarbeitung – und sie werden für ihre Realitätsferne und den mangelhaften Erklärungserfolg kritisiert (Abrahamson und Rosenkopf 1993: 489f; Barrell et al. 1997; Jones 2003: 395). Beispiele der empirischen Analyse von uneingeschränkt-rationalem Lernen finden sich in der Diffusionsliteratur (Meseguer 2004; 2006; Gilardi, Füglister und Luyet 2009). Darüber hinaus werden im Bereich von „social learning“ und Theorien des Herdenverhaltens ebenfalls keine Einschränkungen der Fähigkeiten eines Akteurs modelliert. Unter der Bedingung extremer Unsicherheit oder sogar Ungewissheit gilt dort, dass durch dynamische Effekte des Entscheidungsprozesses einer Gruppe die eigene Bewertung weniger Gewicht hat als das Verhalten anderer (Hirshleifer und Teoh 2003: 10ff). In diesem Forschungsgebiet zeigt sich aber auch die Nähe beider Rationalitätskonzepte, denn ein Teil der Kaskadenliteratur basiert auf eingeschränkter Rationalität und „ad hoc learning rules“ (Ellison und Fudenberg 1993; 1995; Gale 1996: 618; Kuran und Sunstein 1999; Gersen 2001). „Bounded rational learning“ basiert auf ähnlichen Annahmen, was das systematische Sammeln von Informationen und das Einhalten von Regeln angeht (Barrell et al. 1997: 471).16 Vor dem Hintergrund der Knappheit kognitiver Ressourcen wird jedoch erwartet, dass nicht alle Informationen ohne Bias verarbeitet werden können (Conlisk 1996: 686ff; Jones 1999: 305; Maier et al. 2003: 40). Dies gilt auch für politische Akteure, die oft weder die Reaktionen anderer Staaten abschätzen noch davon ausgehen können, dass ihre ursprünglichen Annahmen vollständig und richtig sind (Eising 2000: 4). Wesentliches Merkmal dieses Rationalitätskonzeptes ist der Einsatz von Heuristiken im Prozess der Informationssuche (Weyland 2004: 3; Gilovich, Griffin und Kahneman 2002). Die drei bedeutendsten Heuristiken sind „representativeness“, „availability“ und „anchoring“ (McDermott 2001: 9ff; vgl. 15
16
Die Bayes'sche Regel: p(A|B)·p(B) = p(B|A)·p(A) ermöglicht die Berechnung der Wahrscheinlichkeit eines Ereignisses durch die Beobachtung des Eintretens anderer Ereignisse. Durch Hinzunahme von Erfahrungswerten wird eine a priori-Wahrscheinlichkeitsschätzung zur statistischen Wahrscheinlichkeit: „beliefs conditional on data – posterior beliefs – are proportional to prior beliefs times the likelihood“ (Meseguer 2006b: 39; zu Grundlagen der bayesianischen Theorie s. DeGroot 1975; für politikwissenschaftliche Anwendungen s. Western und Jackman 1994) Dieser Ansatz geht auf die Arbeit von Simon (1947) und Tversky und Kahnemann (1974; 1982) zurück. Weitere Einflüsse kommen aus den kognitiven Neurowissenschaften (Jones 2003: 397ff).
40
2 Theorien und Konzepte des Lernens
Khong 1992: 35f; McGraw 2000: 820; Stein 2002). Repräsentativität bedeutet, dass Menschen auch in begrenzten Daten Muster erkennen und zum Beispiel anfänglichen Erfolg einer Innovation überschätzen (Weyland 2005). Verfügbarkeit bezieht sich auf die Gleichsetzung der Heftigkeit einer Assoziation mit Häufigkeit (McDermott 2001: 12). Diese Heuristik spielt in der politischen Praxis in Form unwahrscheinlicher, aber anschaulicher „worst case“- und „best case“-Szenarien eine Rolle (McDermott 2001; Khong 1992). Die Verankerungsheuristik basiert auf der Berücksichtigung alter Wertvorstellungen, die nicht mit neuen Informationen abgeglichen werden (McDermott 2001: 14). Einzelne Elemente des Konzeptes von eingeschränkt-rationalem Lernen finden sich schon in der „Lessons“-Literatur mit historischen Analogien als „useful shortcuts to rationality“ (Jervis 1976: 220). Die Zahl politikwissenschaftlicher Anwendungen von Lerntheorien mit der Annahme eingeschränkter Rationalität nahm in den letzten Jahren deutlich zu (Crescenzi 2007; Eising 2002; Kuran 1998; Rose 1991; vgl. Lohmann 2000: 658; McDermott 2001). In diesen Arbeiten wird üblicherweise davon ausgegangen, dass politische Akteure nicht immer von ihren Überzeugungen abstrahieren können oder wollen, und starke Überzeugungen die Wahrnehmung der Umwelt beeinflussen. Schließlich stehen beim Lernen in großen Regierungsapparaten Organisationsroutinen und Pfadabhängigkeit der bedingungslosen Suche nach Alternativen im Weg (Braun und Benninghoff 2003; Olsen und Peters 1996). Anstatt beide Ansätze als sich gegenseitig ausschließend zu betrachten, wird in der Literatur auch eine allgemeine Theorie diskutiert, nach der Lernen je nach Kontext eingeschränkt oder uneingeschränkt rational sein kann (Conlisk 1996: 692). Ähnlich argumentiert Meseguer (2006b: 57), in deren empirischer Analyse Vorhersagen beider Ansätze konvergieren. Eine solche Integration der beiden Konzepte wird auch für diese Definition vorgenommen, da sie hilft, die Aufmerksamkeit weg von der Gegenüberstellung kognitivistischer und rationalistischer Forschungstraditionen und hin zu einer besseren Überprüfbarkeit von Lernkonzepten zu lenken (vgl. Maier et al. 2003: 44). Fasst man alle sieben Dimensionen zusammen, kann daraus die folgende Definition abgeleitet werden: Policy-Lernen beschreibt den Prozess der Beobachtung eines Politikmodells aus einem anderen Land oder der eigenen Vergangenheit durch politische Entscheidungsträger, die mit der rationalen Auswahl eines Modells eine Verbesserung des Status quo aus persönlichen oder idealistischen Motiven anstreben, und dabei den Einschränkungen ihrer individuellen kognitiven Ressourcen, aber auch institutionellen Regeln und politischen Interessen unterworfen sind, andererseits aber auf die Informationsverarbeitung bürokratischer Organisationen zurückgreifen können. Die
2.3 Mechanismen des Policy-Lernens
41
Beobachtung eines Modells führt zur freiwilligen Imitation oder Annäherung mit einer relativ stabilen Veränderung bestehender Politik.
Die Definition ist integrativ, was symbolisches Lernen, Lernen aus eigener Erfahrung oder Lernen unter eingeschränkter Rationalität betrifft. Die übliche Abgrenzung dieser Elemente führt nur zu einer Vielzahl von Konzepten mit ähnlichem Kern, aber unterschiedlichem Label. Darüber hinaus werden Kontroversen, die in vielen Bereichen der Literatur eine Rolle spielen, wie zum Beispiel die notwendige Bedingung einer Verbesserung, eines Verstehensprozesses oder des Lernens auf individueller Ebene, als nicht wesentlich für einen empirischen Vergleich von Mustern des Policy-Lernens erkannt. Die Definition grenzt aber andererseits Lernen von anderen Prozessen ab, die sich auf politische Strategien, Lernen durch Nichthandeln, den Einfluss von schlechten Beispielen oder Zwang beziehen. Was Policy-Lernen substanziell ausmacht, wird in der Darstellung unterschiedlicher Lernmechanismen im folgenden Abschnitt erörtert.
2.3 Mechanismen des Policy-Lernens Das wesentliche Erkenntnisinteresse des zugrunde liegenden Dissertationsprojekts besteht darin, Unterschiede im Beitrag verschiedener Lernmechanismen zur Erklärung von Policy-Wandel zu analysieren. Im Folgenden wird daher ein Analyserahmen für die vergleichende Untersuchung des Einflusses unterschiedlicher Lern- und Imitationsformen auf die Veränderung nationalstaatlicher Politik formuliert, wie er angesichts des Forschungsstandes angebracht erscheint und für verwandte Forschungsbereiche, etwa die ökonomische Literatur zu sozialem Lernen, ebenfalls angeregt wurde (Hirshleifer und Teoh 2003: 64). Das Ziel ist dabei weder die Formulierung einer einheitlichen Theorie, noch die Einführung neuer theoretischer Konzepte. Ersteres wäre zu exklusiv, und Letzteres ist in Fülle vorhanden. Dringlich ist vielmehr die Integration bislang unverbundener, jedoch inhaltlich vergleichbarer Ansätze. Der innovative Beitrag dieses Kapitels besteht in der Organisation eines Analyserahmens, der den „state of the art“ der Literatur aufgreift, bewertet und so klassifiziert, dass sich daraus eine neue Perspektive auf Theorien des Policy-Lernens ergibt und diese für einen quantitativen empirischen Test zugänglich macht. Die auffälligsten Unterscheidungsmerkmale von Lerntheorien sind die Orientierungspunkte des Lernens. Sie definieren, welche Eigenschaften ein Land zu einem Modellland machen. Politische Akteure können sich zum Beispiel an besonders erfolgreichen oder benachbarten Ländern orientieren. Ein Lernmechanismus besteht jedoch nicht alleine in einem Orientierungspunkt. In einem
42
2 Theorien und Konzepte des Lernens
bisher wenig rezipierten Modell verweist Lohmann (2000: 676; vgl. Levi-Faur 2002) in ihrer Arbeit zu Kaskaden und kollektiven Handlungsproblemen auf drei Ebenen in der Analyse von Lernprozessen.17 Die Orientierungspunkte oder Mechanismen der Ansteckung stellen dabei analog zur Modellsprache von Coleman (1990) die Meso-Ebene dar. Die Mikro-Ebene der Analyse von PolicyLernen bezieht sich hingegen auf die Ziele und Anreize der Akteure und auf die Rationalität von Imitation (Lohmann 2000: 655). Auf der Makro-Ebene wird schließlich untersucht, welche Konsequenzen sich aus der Ausbreitung von Politikmodellen ergeben (Levi-Faur 2002: 6). Oft werden die einzelnen Ebenen nur getrennt voneinander analysiert. Auf der Makro-Ebene sind die Folgen des Imitationsverhaltens ein wichtiges Element der Untersuchung von Konvergenz und Diffusion (Holzinger und Knill 2005; Heichel und Sommerer 2007). Dabei kommt häufig Analyse von Ansteckungsprozessen (Meso-Ebene), selten jedoch der Motivation hinzu (Levi-Faur 2002: 35). Theorien sozialen Lernens hingegen blenden die Meso-Ebene überwiegend aus und betrachten nur die Anreize, zum Beispiel die Sorge um die Reputation, sowie die Konsequenzen des Lernens. In der Policy-Analyse fehlt wegen geringer Fallzahlen häufig die Makro-Perspektive, dazu werden auf der Meso-Ebene nur selten mehrere Mechanismen vergleichend untersucht. Es spricht für diesen dreigliedrigen Ansatz, dass Widersprüche zwischen Lerntheorien aufgelöst werden können. Widersprüche entstehen, wenn die Analyseebenen nicht differenziert und ihre Zusammenhänge nicht erkannt werden (Schelling 1978; vgl. Levi-Faur 2002: 15). Auf der Mikro-Ebene wird es meist als nützlich erachtet, individuelle Rationalität anzunehmen, auf der Meso-Ebene hingegen wird das Verhalten Einzelner in der Menge mit verschiedenen Adjektiven wie „emotional“ oder „contagious“ beschrieben. Schließlich findet sich auf der Makro-Ebene die Ansicht, das Verhalten großer Gruppen wäre jenseits menschlicher Vernunft (Dunn 1989: 2; vgl. Lohmann 2000: 655). Folglich kann ein und derselbe Lernprozess je nach Analyseebene als rational oder irrational aufgefasst und beschrieben werden. Wenn man für den Prozess des Modelllernens die Anreize des Lernens von der Identifikation und Verfügbarkeit eines Modells sowie von den Konsequenzen des Imitationsverhaltens unterscheidet, kann man das komplexe Zusammenspiel analytisch klar darstellen. Das vereinfacht eine spezifische Operationalisierung der wesentlichen Konzepte für die auf diesem theoretischen Rahmen aufbauende quantitative empirische Überprüfung. Dazu wird deutlich, dass Klassi17
Das Modell von Lohmann weist deutliche Parallelen zum Konzept sozialen Lernens bei Bandura (1979: 27ff) auf. Dort findet man die Unterscheidung in motivationale Prozesse (MikroEbene), Aufmerksamkeits- und Behaltensprozessen (Meso-Ebene) und Umsetzung eines Verhaltensmodells (Makro-Ebene).
2.3 Mechanismen des Policy-Lernens
43
fikationen zu kurz greifen, die Lernmotive (z.B. Verbesserungsstreben) ausschließlich einem Orientierungspunkt (z.B. Lernen von Erfolg) zuordnen. Zuerst werden für die Mikro-Ebene die Motive und Anreizfaktoren des Lernens behandelt. Danach werden vier Kategorien von Orientierungspunkten als Mechanismen der „Ansteckung“ vorgestellt, aus denen schließlich allgemeine Hypothesen abgeleitet werden.18 Die Diskussion von Ausbreitungsmustern auf der Makro-Ebene, dem dritten Element in der Analyse von Policy-Lernen, erfolgt in dieser theoretischen Darstellung nur kurz, da sie erst mit der Operationalisierung anhand vorhandener Daten genauer spezifiziert werden kann.
2.3.1 Warum lernen Staaten? Motivation und Anreizfaktoren Die allgemeine Lerntheorie in den Verhaltenswissenschaften bietet eine Reihe von Erklärungsansätzen zur Entstehung von Lernprozessen, von bloßer Reaktion auf einen äußeren Reiz bis zum Bedürfnis nach Selbstverwirklichung (Etheredge 1981: 94ff; LeFrancois 1994). Werden diese Erkenntnisse mit politikwissenschaftlichen Beiträgen zu den Ursachen des Lernens zusammengebracht (Deutsch 1963; Heclo 1974; Rose 1991; Weyland 2004: 2), lassen sich daraus sieben Faktoren der Motivation ziehen, die zu Modelllernen anregen. Dazu zählen neben intrinsischen, auf die Problemlösung bezogenen Anreizen auch die extrinsische Sorge um die eigene Reputation und das Streben nach Konformität, sowie Motivation durch Reize von außerhalb, etwa durch besonders attraktive oder vielbeworbene Modelle oder problemspezifische Interdependenzen. Die Suche nach einem besseren Konzept im Ausland oder der eigenen Vergangenheit stellt keinesfalls den normalen modus operandi im politischen Prozess dar (Rose 1991: 10). Lernen wird als Ausnahmefall nur dann stattfinden, wenn der „automatische“ Modus unterbrochen und stattdessen ein „reflexiver“ Modus erreicht wird (Braun und Gilardi 2006). Im Ablauf fast jeden Politikprogramms gibt es nach Rose (1991: 10) einen Moment, in dem die Routine von irgendeiner Form von Unzufriedenheit mit dem Status quo unterbrochen wird. Dann ist entscheidend, welche Anreize zur Übernahme verfügbarer Alternativen bestehen.
18
Hypothesen werden nur zu den Orientierungspunkten formuliert, da das Ziel des konkreten Forschungsvorhabens in einer quantitativen Analyse von Lernmustern besteht, und dabei Motive des Lernens nicht direkt erfassbar sind. Eine weitere Spezifikation der Hypothesen erfolgt nach der Operationalisierung der unabhängigen Variablen.
44
2 Theorien und Konzepte des Lernens
2.3.1.1 Unsicherheit und Informationskosten Erkenntnisse aus der Verhaltensforschung zeigen, dass die Wahrscheinlichkeit von sozialem Lernen und Imitation ansteigt, wenn Unsicherheit Individuen daran hindert, selbst die beste Option für ihr Verhalten herauszufinden (Boyd und Richerson 1985; Rogers 1995). Auch in der Politik kann Unsicherheit über die Auswahl von Alternativen das Verlassen des normalen Modus der Politikgestaltung verursachen: „Politics finds its sources not only in power but also in uncertainty – men collectively wondering what to do“ (Heclo 1974: 305). Verweise auf Unsicherheit finden sich schon in den klassischen Ansätzen der „Lessons“-Literatur, wo politische Entscheider in Krisensituationen bestehende Unsicherheiten durch historische Analogien reduzieren (Jervis 1976; vgl. Rasmussen 2003). Die Unfähigkeit einer Regierung, die Konsequenzen einer Politikalternative richtig einzuschätzen, spielt eine zentrale Rolle für die Imitation von Modellen (Kobrin und Xun 2005: 20; Dimaggio und Powell 1983; Brune und Guisinger 2006: 10). Unkenntnis über die optimale Antwort auf ein Problem als Ursache für die bedingungslose Orientierung am Verhalten anderer wurde auch für Herdenverhalten im ökonomischen Kontext beobachtet (Hirshleifer und Teoh 2003; Levi-Faur 2002). Vor allem die Veränderung der Umwelt führt zu einer Erhöhung von Unsicherheit (Rose 1991). Wenn in einer Situation keine ausreichende Erfahrung vorhanden oder die wissenschaftliche Grundlage eines Problems ambivalent ist, steigt der Anreiz, in anderen Ländern mit ähnlichen Problemen nach vorhandenen Lösungen zu suchen (Sanderson 2002: 9; Strang und Macy 2001: 178; Braun und Benninghoff 2003: 1851). Das Beispiel der Umweltpolitik zeigt anschaulich, wie vielschichtig das Problem der Unsicherheit sein kann (Rosenbaum und Bressers 2000: 524). Das betrifft etwa die Komplexität des zu regulierenden Gegenstandes im Umweltschutz, die Nichtreduzierbarkeit ökologischer Probleme oder das spontane Auftreten eines Problems (Brown 2000: 577; Dryzek 1987). Politische Entscheidungsträger sind im Bereich der Umweltpolitik besonders auf die Problemwahrnehmung und Lösungen aus der Wissenschaft angewiesen (Brown 2000: 576). Wie die Kontroverse in der Klimapolitik zeigt, sind auch vermeintliche Grundlagen nicht unumstritten, und die Integration wissenschaftlicher Erkenntnisse in den politischen Prozess verläuft oft nur schleppend (Rosenbaum und Bressers 2000: 526). Auch in Fällen, in denen die Unsicherheit weniger gravierend erscheint, entstehen für jede Regierung vor einer Reformentscheidung Kosten bei der Suche nach relevanten Informationen. Es ist keineswegs als Zufall anzusehen, dass Lernen in der Politik in den achtziger und neunziger Jahren im Zuge von Kos-
2.3 Mechanismen des Policy-Lernens
45
tendruck durch die Öffnung der Kapitalmärkte sowie durch die globale Standortkonkurrenz größere Bedeutung erlangte. Während in Modellen bayesianischen Lernens angenommen wird, dass Regierungen alle verfügbaren Informationen sammeln und auswerten können (Meseguer Yebra 2004, 2006b), sind in anderen Konzepten die Kosten der Suche nach Lösungen ein starkes Motiv, nach etablierten Modellen zu suchen (Crescenzi 2007: 385). Ansätze auf der Basis von eingeschränkter Rationalität verweisen auf limitierte Kapazitäten, die es selbst einem großen bürokratischen Apparat nicht erlauben, permanent eigene Innovationen zu entwickeln, was wiederum die Imitationswahrscheinlichkeit fördert (Hirshleifer und Teoh 2003: 10ff; Ellison und Fudenberg 1995: 93; Rincke 2006). Unsicherheit stellt eine Funktion der Ressourcen dar, die zur ihrer Reduktion eingesetzt werden – hohe Kosten der Informationsbeschaffung sind mit größerer Unsicherheit und daher mit dem beschriebenen Lernanreiz gleichzusetzen. Imitation hilft auch, teure Fehler zu vermeiden und „noise“ in der eigenen Schätzung zu eliminieren (McElreath et al. 2005). So können Nachzügler davon profitieren, dass die mit einer bestimmten Produkt- oder Politikentwicklung verbundenen Risiken schon von den Pionieren getragen wurden (Braun et al. 2007: 49; Haunschild 1993: 564; Lieberman und Montgomery 1988; Bikhchandani, Hirshleifer und Welch 1992). Wie die Modelle von Informationskaskaden zeigen, kann Imitation im Zeitverlauf immer zwingender erscheinen, da jeder Akteur, der sich einer Herde anschließt, durch das Unterlassen eigener Recherchen die verfügbare Information für alle nachfolgenden Akteure verknappt (Gale 1996: 623; Granovetter 1978; Hung und Plott 2001). Neben institutionellen Ressourcen wie Arbeitskraft, Fähigkeiten und finanziellen Mitteln beeinflusst auch der Zeitfaktor die Informationskosten. Modelllernen kann dem Zeitdruck geschuldet sein, wenn Akteure nicht in der Lage sind, rechtzeitig eigene Problemlösungen zu entwickeln (Soule 1999: 124).
2.3.1.2 Unzufriedenheit mit bestehenden Lösungen Unzufriedenheit mit dem Status quo einer bestehenden Politik und der Wunsch nach einer Verbesserung bilden eine zweite Kategorie von Anreizfaktoren. Das Streben nach einer besseren Politik, das in der Definition von rationalem Modelllernen als wesentlicher Bestandteil genannt worden war, entspricht dem Druck evolutionärer Konkurrenz oder dem Selbstverwirklichungsstreben auf individueller Ebene. Es kann auch als Interesse einer Regierung dargestellt werden, Fehler zu vermeiden (Weyland 2004: 3; Levi-Faur 2002: 11).
46
2 Theorien und Konzepte des Lernens
Wenn sich das Interesse an einer Verbesserung der vorhandenen Politik rein auf die Kostenseite bezieht, ist der Anreiz der gleiche wie im Fall hoher Informationskosten. Die Verbesserung besteht dann in sinkenden Entwicklungskosten und einer Verringerung der Staatsausgaben. Unterstellt man, dass Politiker wegen Zeit- und Ressourcenbeschränkung keine Programmmaximierer sind, kann man erwarten, dass sie nach einfachen Lösungen mit möglichst geringen Kosten suchen (Rose 1991: 10; Abrahamson und Rosenkopf 1993: 489f). Verbesserungstreben kann auch wegen des substanziellen Interesses an einer fortschrittlichen Politik zu Modelllernen anregen. Voraussetzung für diese Form der Motivation ist die Leistungsorientierung der betroffenen Akteure (Strang und Macy 2001: 178). Die Erfolgshypothesen in der Literatur bauen auf der Vermutung auf, dass politische Akteure eine gute Politik und möglicherweise sogar eine bessere Gesellschaft anstreben (Shipan und Volden 2007; Volden und Cohen 2006). Unzufriedenheit mit der eigenen Leistung und Leistungsfähigkeit führt dann zu einem Blick über den eigenen Tellerrand und zu einer ländervergleichenden Perspektive auf die Problemlösungsfähigkeit des politischen Systems (Schmid 2003: 32). Die EU-Beschäftigungspolitik ist ein gutes Beispiel für diesen Anreizfaktor, denn hier liefert die Präsenz sogenannter „best practice“-Modelle einen Maßstab für eigene Unzufriedenheit (Kemmerling und Bruttel 2006: 100; Straßheim 2003: 228; Heinze, Schmid und Strünck 1999).
2.3.1.3 Streben nach Reputation „Window dressing“ oder symbolisches Lernen sind Stichworte aus der Literatur, die verdeutlichen, dass Policy-Lernen nicht durch ein substanzielles Interesse an der eigentlichen Problemlösung motiviert sein muss. Ein extrinsischer Lernanreiz besteht auch im Nutzen eines Modells sowohl für den Erhalt der eigenen Position als auch für die Anerkennung auf internationaler Ebene (Holzinger und Knill 2005: 785). Dass dieser Aspekt der Motivation in der Literatur oft aus dem Konzept des Lernens ausgeschlossen wird (vgl. Braun et al. 2007; Meseguer 2004), mag daran liegen, dass Macht in der Tradition von Karl Deutsch als Gegenmodell zum Lernen, Machtstreben hingegen nicht unbedingt als Ursache von Lernen begriffen wird: „Power is the ability to afford not to learn“ (Deutsch 1963: 111). Ein Imitationsprozess, der dadurch motiviert ist, dass eine Regierung versucht, höheres Ansehen zu erlangen, unterscheidet sich jedoch nicht kategorisch von der Wirkungsweise, vom Ergebnis des Politik-Outputs und vom Ausbreitungsmuster anderer Formen des Lernens. Die Motivation eines Policy-Makers, die eigene Position zu verbessern, kann im Sinne des polit-ökonomischen Modells auf den Wettbewerb um Wäh-
2.3 Mechanismen des Policy-Lernens
47
lerstimmen im eigenen Land, aber auch auf die Reputation eines Landes auf internationaler Ebene gemünzt sein. Die Zielrichtung dieses Geltungsstrebens kann dabei nach zwei Kategorien unterschieden werden, die auf gegenläufige Annahmen zurückgehen. Zum einen könnte sich eine Regierung die Politik anderer Länder zu eigen machen, weil sie schlicht nach der Erhöhung von Reputation und internationalem Einfluss strebt (Soule 1999: 124; Crescenzi 2007). Im Gegensatz zum Modell des reinen Nutzenmaximierers könnte das Ziel aber auch in der Veränderung der relativen Position des eigenen Landes liegen. Der Anreiz liegt dann in der Status-Aspiration zwischen Referenzgruppen von Staaten (Li und Thompson 1975; Kobrin 1985). Imitationsverhalten kann auf den Wunsch zurückgehen, sich dem Niveau einflussreicher oder erfolgreicher Länder anzunähern (Walt 2000: 36). Politische Akteure werden in solchen Modellen als „relative gains maximizers“ konzipiert (Waltz 1979: 77; Powell 1991; Rousseau 2002). Eine Regierung, die ihren relativen Gewinn maximieren will, orientiert sich ausschließlich am Verhalten ihrer militärischen oder ökonomischen Konkurrenten. Sie handelt dabei unter Umständen auch gegen besseres Wissen bezüglich der Optimierung einer Politik, wenn der Nutzen des Ansehens ausreichend hoch bewertet wird. Wenn sich das Reputationsstreben auf den Standortwettbewerb zwischen Nationalstaaten bezieht, besteht ein Anreiz zur Imitation im Sinne des „competitive bandwagoning“ darin, in der durchschnittlichen Regierungsleistung nicht hinter Wettbewerber zurückfallen zu wollen (Abrahamson und Rosenkopf 1993). Der Einfluss der Motivation, Konkurrenten wegen der Vermeidung von Wettbewerbsnachteilen zu imitieren, wurde beispielsweise für die Diffusion liberaler Wirtschaftspolitiken nachgewiesen (Brooks 2005: 280). Reputation ist besonders dann wichtig, wenn es sich bei der Entscheidung um diskrete oder sogar binäre Alternativen handelt, da dann die Bewertung einer Entscheidung für Dritte einfacher ist als bei einer Vielzahl von Handlungsmöglichkeiten (Hautsch und Klotz 2003: 98). Gleiches gilt, wenn es für Akteure keinen anderen Entlohnungsmaßstab gibt als die relative Leistung, und für Außenstehende nicht einfach zu erkennen ist, ob sie es mit einem guten oder mit einem schlechten Manager oder Politiker zu tun haben (Scharfstein und Stein 1990, Gul und Lindholm 1995:1041; Chang und Cheng 2000).
2.3.1.4 Konformität und der Wunsch nach Legitimität Eng verwandt mit der Motivation, die eigene Position gegenüber wichtigen Referenzländern durch Lernen zu verbessern, ist das Streben nach Anpassung und Legitimität. Aus der Psychologie sind zahlreiche Motive der Verhaltensanpas-
48
2 Theorien und Konzepte des Lernens
sung im Sinne von „Keeping up with the Jones's“ bekannt. Diese reichen vom allgemeinen Wunsch nach Zustimmung für die Rationalität des eigenen Denkens und Handelns bis hin zur Angst, zurückgelassen zu werden (Asch 1955; Shiller 1995: 182; Hautsch und Klotz 2003: 97). Im ökonomischen Kontext sorgen die Furcht, anders zu sein oder zu scheinen als die Mehrheit oder auch ein innerer Wunsch nach Konformität für das Auftreten von Herdenverhalten (Abrahamson und Rosenkopf 1993; Cote und Sanders 1997: 22ff; Hung und Plott 2001: 1519). Dieses Motiv kann auch auf den Kontext der Politik übertragen werden. Das Streben nach Anpassung und einer Anerkennung der Legitimität eigener politischer Entscheidungen in der Staatenwelt wurde häufig als Ursache von Lernprozessen benannt (Finnemore 1996, Finnemore und Sikkink 1998; Weyland 2004: 2). Als Beispiel für den Vorzug der Konformität vor der Funktionalität einer Policy wird häufig auf die Diffusion des Modells unabhängiger Zentralbanken verwiesen: „[...]it has been argued that the establishment of independent central banks was less linked to attempts to fight inflation than to the need for governments to show their alignment to socially valued policy-making models“ (Braun et al. 2007: 44; siehe auch Polillo und Guillen 2005; DiMaggio und Powell 1991; Haunschild 1993: 564). Das Konformitätsstreben einer Regierung wird besonders dann ausgeprägt sein, wenn schwierige Entscheidungen zu treffen sind (Soule 1999: 124). Es ist darüber hinaus unter institutionellen Bedingungen relevant, bei denen ein Akteur zwar den Anreiz hat, gut zu sein, aber noch mehr, nicht schlechter zu sein als andere - ein Setting, das in der Politik eine gewichtige Rolle spielt, etwa im Wahlkampf und im Nominierungsprozess politischer Parteien (Hung und Plott 2001: 1509f). Schließlich kann sich der Anreiz zur Anpassung in dynamischer Weise vergrößern, wenn die Motivation, sich einer dominanten Gruppe oder Herde anzuschließen, durch eine sichtbar wachsende Anzahl konformer Akteure verstärkt wird (Kuran 1989).
2.3.1.5 Attraktivität eines Politikmodells Policy-Lernen geht nicht nur auf die aktive Suche einer Regierung nach einem Politikmodell zurück. Es widerspricht zwar dem oft gepflegten Bild von Lernen als einem wohlüberlegten, deliberativen Prozess, dennoch können wie in den behavioristischen Ansätzen der Psychologie auch im Kontext der Politik Anreizfaktoren eine Rolle spielen, die die Initialisierung eines Lernprozesses nicht beim lernenden Akteur, sondern außerhalb sehen (Bandura und Walters 1963; LeFrancois 1994). Externe Motive können sich auf die Eigenschaft eines Mo-
2.3 Mechanismen des Policy-Lernens
49
dells, die Aktivität der Urheber eines Modells oder auf Interdependenzen beziehen. Nimmt man Unsicherheit an, kann auch dabei die Bedingung erfüllt werden, dass Lernen mit dem Versuch der Verbesserung des Status quo verbunden ist. Auch wenn bei diesen Motiven die Nähe zu Orientierungspunkten des Lernens manchmal groß erscheint, sollten sie nicht damit gleichgestellt werden. Manchen Politikmodellen wird eine universelle Anziehungskraft zu geschrieben (Walt 2000: 38ff). Dabei drängt sich ein Modell den Policy-Makern eines anderen Landes zur Nachahmung auf, ohne dass diese aktiv nach einer Policy gesucht und den normalen Modus der Politikgestaltung verlassen hätten. Diese Lernmotivation manifestiert sich häufig anhand von „miracle models“ in der Diffusion von Privatisierungs- und Liberalisierungspolitiken: „In the mid1990s, market actors from Wall Street and Washington lavished praise on Chile as the star performer and model for pension reform“ (Brooks 2005: 280; vgl. Meseguer Yebra 2006b: 44). Auch die japanische Wirtschaftspolitik stand zeitweilig im Ruf eines besonderen Erfolgsmodells. Gerade das Beispiel Japan zeigt aber auch, wie sich Attraktivität über die Zeit verändern kann: „The Japanese miracle provided an economic model for much of Asia and beyond in the 1970s and 1980s, though it has been a far less attractive model during the doldrums of the 1990s.“ (Simmons und Elkins 2004: 175). Eine erste Bedingung für die Attraktivität eines Modells ist seine Verfügbarkeit. Akteure müssen in der Lage sein, die Erfolgsgeheimnisse anderer zu identifizieren (Strang und Macy 2001: 178). Das ist schwierig, wenn erfolgreiche Akteure ihre Praktiken verheimlichen oder sich abschotten, und die Medien die Erfolgsbotschaft nicht verbreiten (Levi-Faur 2002: 12). Des Weiteren zählen auch der „kühne“ und innovative Charakter (Weyland 2004: 12) sowie das Potenzial, lange bestehende und intern als unlösbar geltende Probleme zu lösen, zu attraktiven Eigenschaften eines Modells (Eising 2000: 35). Die Strahlkraft eines Modells erhöht sich auch durch dessen Reputation für Effektivität oder „taken for grantedness“. Dies bedeutet, dass sie als eine Art Standardlösung gilt (Braun et al. 2007). Die Anziehungskraft kann schließlich auch in einer wahrgenommenen moralischen Überlegenheit begründet sein (Finnemore 1996; Keck und Sickink 1998). Der Einfluss einer überlegenen Norm auf die Motivation, sie zu übernehmen, wurde etwa für die Menschenrechtspolitik demonstriert (Kelley 2007; True und Mintrom 2001). Lernen, das durch die Anziehungskraft eines Modells motiviert wurde, hat häufig eine negative Konnotation. Auf den ersten Blick attraktive Modelle können auf lange Frist schlechte Leistung mit sich bringen (Weyland 2004: 23). So verführt eventuell ein scheinbar attraktives Modell wie der Gesang der Sirenen zu einem vorschnellen Transfer, der später zum Scheitern des politischen Re-
50
2 Theorien und Konzepte des Lernens
formprojektes führen kann, wie sich das Modell als für den eigenen Kontext ungeeignet erwiesen hat (Rose 1991: 27).
2.3.1.6 „Policy Promotion“ und missionarisches Werben Aus der Metapher des Sirenengesangs kann ein zweiter externer Lernanreiz abgeleitet werden. Nicht nur der Gesang kann betörend wirken, auch die Überbringer der Botschaft können so überzeugend wirken, dass dies zu einem Lernimpuls führt. In der Literatur wird das Werben derjenigen Akteure, die schon ein Modell besitzen, auch als „policy promotion“ beschrieben (Holzinger und Knill 2005: 785). Wenn sich Regierungen anderer Länder aktiv für ihre eigenen Politiken stark machen und dies mit Belohnung oder Bestrafung koppeln, entstehen für ein Land Anreize, diese Modelle zu übernehmen. Wie die Anziehungskraft eines Modells zeigt „policy promotion“, dass der Prozess des Modelllernens nicht einseitig verlaufen muss (Levi Faur 2002: 10). Auf der konzeptionellen Ebene ist es mitunter schwierig, die Wirkung von „policy promotion“ von der Ausübung von Zwang und Politik-Oktroi zu unterscheiden (vgl. dazu Dolowitz 2000; Tews 2002b). Ob etwa in der Entwicklungspolitik die Empfehlung einer Regierung, gekoppelt an finanzielle Zusagen, als Anreiz zum Lernen empfunden werden kann, ist fraglich. Dennoch ist nicht abzustreiten, dass Werbung für den Bereich des Lernens relevant ist. „Policy promotion“ erhöht die Verfügbarkeit auch wenig attraktiver Modelle, und sie senkt die Kosten der Informationsbeschaffung. Des Weiteren kann es nützlich sein, Impulse von außen zu bekommen, um etwaige innenpolitische Blockaden überwinden zu können (Weyland 2004: 4). Entsprechend der Theorien sozialen Lernens passen sich Individuen in „Herden“ den Vorgaben von Meinungsführern oder „Hirten“ an (Lohmann 2000: 677; Levi-Faur 2002: 12).19 Bei der Beschreibung der Umstände, die die Wahrscheinlichkeit von „policy promotion“ und damit das Auftreten eines Lernprozesses beeinflussen, verschiebt sich der Fokus von der lernenden Regierung zur Aktivität anderer Akteure. Deren Motive reichen von missionarischem Eifer zu ökonomischem Kalkül (Walt 2000: 39) bis zur Notwendigkeit, internen Druck zu kompensieren, (Kuran 1998: 627). Beweggründe für die Aktivität als „policy promoter“ können auch im Stolz auf das eigene Modell (Schmid 2003: 32) oder in Kapazitäten zur Modellentwicklung zu finden sein, die ein Land zu einem „net exporter“ von politischen Ideen machen (Kemmerling und Bruttel 2006: 100). Für die 19
Diese Vorstellung knüpft an das Modell des „Zwei-Stufen-Flusses der Massenkommunikation“ aus der politischen Einstellungsforschung (Lazarsfeld, Berelson und Gaudet 1944), aber auch an andere Konzepte zum Einfluss gut vernetzter Akteure an (vgl. Walt 2000: 39).
2.3 Mechanismen des Policy-Lernens
51
Umweltpolitik konnte gezeigt werden, dass sich die Regierung eines Pionierlandes durch die aktive Unterstützung der Ausbreitung des eigenen Modells ökonomische Vorteile verschafft, da sie der nationalen Industrie einen größeren Markt und Wettbewerbsvorteile beschert (Porter und von Linde 1996; Jänicke 2005). Aus der Europäisierungsliteratur ist hinlänglich bekannt, dass ein Land durch einen „upload“ auf die europäische Ebene und die Ausbreitung seines Modells im Falle einer späteren Harmonisierung Anpassungskosten sparen kann (Héritier, Knill und Menges 1996; Börzel 2003). Neben den Regierungen anderer Länder können auch internationale Institutionen eine wichtige Rolle bei der „policy promotion“ spielen, zum Beispiel in Form der schon erwähnten Benchmarking-Prozesse. Beim PolicyBenchmarking wie auch bei „performance reviews“ wird mehr oder weniger direkt für ein bestimmtes Modell geworben und ein Wettbewerb um die beste Implementation geschürt. Nicht nur die OECD und die EU sprechen regelmäßig Empfehlungen aus, etwa in der Arbeitsmarktpolitik (Kemmerling und Bruttel 2006: 99). Des Weiteren sind auch andere Instrumente des „international soft law“ relevant (Marcussen 2004).
2.3.1.7 Funktionale Interdependenz Ein siebter und letzter Anreizfaktor wird in der Literatur nur selten explizit angeführt. Funktionale Interdependenz als Motiv für Policy-Lernen bedeutet, dass die einer Policy zugrunde liegende Problemstruktur über bestimmte Eigenschaften verfügen kann, die von sich aus Lernen zwischen Ländern anregen. Tritt ein Problem nicht nur lokal, sondern überregional und dabei grenzüberschreitend auf können Regierungen daran interessiert sein, eine gemeinsame Lösung zu suchen und Informationen auszutauschen (Holzinger und Knill 2005: 783; Rose 1991: 15ff). Ein Beispiel für eine solche Konstellation stellt in der Umweltpolitik die Verschmutzung eines Gewässers mit zwei Anrainerstaaten dar. Gibt es noch in keinem der betroffenen Länder eine Policy, könnten diese funktionalen Interdependenzen, wie etwa bei grenzüberschreitenden Umweltproblemen, zur gemeinsamen Formulierung einer Lösung führen. Existiert jedoch in einem der beteiligten Staaten eine Policy, die sich zum Modell eignet, so erhöht ein grenzübergreifendes Problem den Anreiz zum Lernen in Form einer Modellübernahme. In diesem Abschnitt wurden auf der Mikro-Ebene Motive des PolicyLernens beschrieben. Drei allgemeine Schlussfolgerungen können aus dieser Übersicht gezogen werden. Erstens ist für einige Faktoren die Trennung von Motiven und Orientierungspunkten des Lernens nicht trivial. So sind bei der
52
2 Theorien und Konzepte des Lernens
Beschreibung von „policy promotion“ teilweise Elemente einer Beschreibung des gesamten Lernmechanismus enthalten. Nicht umsonst wird diese Unterscheidung in der Literatur selten konsequent vollzogen. Trotz einiger Schwierigkeiten sorgt sie aber für größere analytische Klarheit, denn sie trennt mit quantitativen Methoden erfassbare Orientierungspunkte von dahinter liegenden Motiven des Policy-Lernens. Zweitens konnte gezeigt werden, dass Motive nicht zwingend mit einem Orientierungspunkt gleichgesetzt werden können und auch kumulativ auftreten. Vereinfachungen, wie etwa die Gleichsetzung von Verbesserungsstreben und Lernen anhand von Erfolg, sind so nicht mehr haltbar (siehe Meseguer 2004; 2006). Eine systematische Betrachtung dieser Zusammenhänge erfolgt jedoch erst nach der Diskussion der vier Kategorien von Orientierungspunkten im nächsten Abschnitt. Drittens offenbart die Analyse unterschiedlicher Motive des PolicyLernens auch die Wechselwirkung zwischen Modellnehmer und Modellgeber. Die Integration von passiven und aktiven Anreizen in der Entstehung von Lernprozessen lässt Gemeinsamkeiten von deliberativen und weniger wohlüberlegten oder symbolischen Formen des Lernens erkennen. Obwohl die Motive des Lernens in einem quantitativen Design nicht direkt getestet werden können, kann die Ausführlichkeit ihrer Darstellung ebenso gerechtfertigt werden wie bei der Definition. Um eine quantitative Analyse durchführen zu können, müssen testbare Elemente von Lerntheorien identifiziert werden. Dies wird dann leichter, wenn die oft vermengten Motive und Orientierungspunkte entwirrt werden.
2.3.2 Wovon lernen Staaten? Orientierungspunkte des Policy-Lernens In der politikwissenschaftlichen Literatur gehen die Erwartungen zu den unterschiedlichen Kanälen des Policy-Lernens weit auseinander (Bennett und Howlett 1992). Orientierungspunkte als Eigenschaften, von denen sich Regierungen bei ihrer Suche nach einem geeigneten Politikmodell leiten lassen, stellen den eigentlichen Kernpunkt von Lerntheorien dar. Im folgenden Abschnitt werden auf der Basis einer breiten Analysen der Literatur vier Kategorien von Orientierungspunkten gebildet, zu denen dann allgemeine Hypothesen für einen empirischen Test formuliert werden. Der Analyserahmen umfasst dabei Konzepte aus verschiedenen Forschungstraditionen, die in dieser Form noch nicht vergleichend getestet wurden, wenngleich in den vergangenen Jahren einige Beiträge in der Diffusionsliteratur ähnliche und ähnlich viele Faktoren integriert haben (Volden 2006; Elkins,
2.3 Mechanismen des Policy-Lernens
53
Simmons und Guzman 2006; Simmons und Elkins 2004). Lernen kann sich am Erfolg und der Reputation eines Modelllandes orientieren - was sowohl Lernen von eigenem Erfolg in der Vergangenheit als auch von anderen Ländern einschließt. Überdies können sich Regierungen von ihrer Einbindung in internationale Netzwerke leiten lassen oder dem Einfluss einer dominanten Gruppe von Ländern, einer Herde oder „fad“, also Modeerscheinung, unterliegen. Zwei Forschungslücken sind dabei besonders auffällig. Erstens wurde die Orientierung an einer Herde zwar in vielen theoretischen Beiträgen erwähnt, empirisch bislang jedoch nicht als Erklärungsgröße von Lernprozessen in der Diffusions- oder Policy-Forschung berücksichtigt (Lohmann 2000; Levi-Faur 2002). Zweitens wurde auch das Lernen anhand von eigenem vergangenem Erfolg in der politikwissenschaftlichen Literatur meist vernachlässigt (s. aber Volden, Ting und Carpenter 2008). Die Literaturanalyse zeigt jedoch, dass Erfahrungslernen nicht nur im Bereich der Analyse historischer Analogien eine Rolle spielt, sondern beispielsweise auch in der Evolutionsbiologie (McElreath et al. 2005, Boyd und Richerson 1985; Rogers 1995) oder in ökonomischen Modellen des „learning by doing“ und des optimalen Experimentierens (Bolton und Harris 1999; Kverndokk und Rosendahl 2007; Manne und Barreto 2004). Beide Aspekte sollen im Folgenden in den Analyserahmen integriert werden.
2.3.2.1 Lernen von Erfolg und scheinbarem Erfolg Eine erste Eigenschaft einer Politik, an der sich Regierungen bei der Suche nach einem Modell orientieren können, ist der Erfolg. Getreu dem Motto “if it worked for them, it will work for us” werden Regierungen bei der Auswahl von Vorbildern von erfolgreichen Staaten beeinflusst (Li und Thompson 1975: 66; Brooks 2005). Die Orientierung an Erfolg spielt prinzipiell in jeder Form von Beobachtungslernen eine Rolle (Henrich und McElreath 2003: 130). Sie stellt den Idealfall und damit den natürlichen Ausgangspunkt jeder Analyse dar. Die drei folgenden Orientierungspunkte können als Abweichungen vom Ideal verstanden werden, die durch Informationsprobleme und die Schwierigkeit der Messung von Erfolg verursacht werden.20 Wenn sich Staaten nun an Erfolg orientieren, kann dies auf mehr als nur ein Motiv zurückgehen. Es liegt nahe, dass ein Anreiz im Wunsch nach einer optimalen Lösung oder die Attraktivität eines Modells bestehen kann (Simmons 20
Ein erfolgreiches Modell kann auch aus dem eigenen Land stammen, basierend auf der Erfahrung mit vergleichbaren Situationen. Da diese Form des Erfolgslernens nach den exakt gleichen Mustern und Bedingungen verläuft wie im Falle der Orientierung am Erfolg anderer Länder, wird sie auf der theoretischen Ebene nicht separat behandelt.
54
2 Theorien und Konzepte des Lernens
und Elkins 2004: 175). Erfolgsorientierung sollte aber nicht nur mit idealistischem Verbesserungsdrang gleichgesetzt werden. Auch Unsicherheit und hohe Informationskosten können eine Rolle spielen, da sich ein erfolgversprechendes Modell auch bei unzureichender Kenntnis der eigenen Lage direkt als „focal point“ für bestehende Probleme anbieten kann (Weyland 2004: 7). Erfolgslernen in der erweiterten Form schließt ebenfalls das Streben nach Reputation oder „policy promotion“ ein. Erfolg motiviert die Erfolgreichen, andere von den Qualitäten der eigenen Politik zu überzeugen. In der Literatur gibt es unterschiedliche Annahmen zum genauen Ablauf des Prozesses erfolgsorientierten Lernens. Einige Konzepte basieren auf bayesianischer Rationalität. Regierungen „scannen“ demnach das Angebot verfügbarer Politikalternativen und entscheiden sich in einem Prozess des bayesianischen Updatings für die beste Lösung (Volden 2006; Meseguer 2004; 2006; Simmons und Elkins 2004: 175). Andererseits ist die Fähigkeit einer Regierung, die Verbindung von Modellen und einem bestimmten Outcome zu verstehen, nicht allein ausschlaggebend. Das Verständnis kann geradezu oberflächlich sein: „The apparent success of others may in fact be a cognitive short-cut to assessing policy consequences“ (Simmons und Elkins 2004: 175). Auch Strang und Macy (2001: 173) argumentieren, dass für die Orientierung an erfolgreichen Ländern der Ansatz eingeschränkter Rationalität ebenfalls geeignet sein kann (vgl. DiMaggio und Powell 1983). Unter bestimmten Bedingungen erhöht sich die Wahrscheinlichkeit von Erfolgslernen, etwa wenn es sich bei einem Policy-Modell um ein kostensenkendes Programm handelt (Volden 2006: 296). Ebenso kann die institutionelle Form des politischen Systems Erfolgslernen beeinflussen. Auch eine zentrale Rolle der Ministerialverwaltung im politischen Prozess wirkt sich positiv aus, da diese meist einen besseren Zugang zu Informationen über den Erfolg anderer Länder hat. In Konkurrenz dazu steht die Vermutung, dass legislative Organe, wegen ihres Interesses an einer Wiederwahl besonderem Erfolgsdruck unterliegen und daher ebenfalls Wert auf ein erfolgversprechendes Modell legen (Volden 2006: 299). In der Anthropologie wurde die Neigung, Erfolg zu imitieren, auch mit einer ungleichen Verteilung der Fähigkeiten in einer Population in Zusammenhang gebracht (Henrich und McElreath 2003: 130). Übertragen auf den Kontext der Politik hieße das, dass eine Orientierung an den Besten dann auftritt, wenn sich die administrativen Kapazitäten zur Politikentwicklung zum Beispiel großen und kleinen oder reichen und weniger entwickelten Ländern unterscheiden. Empirische Untersuchungen zu diesem Lernmechanismus finden sich besonders häufig in der Diffusionsforschung. Volden (2006) kann für die Diffusion des Modells einer Krankenversicherung für Kinder in den amerikanischen
2.3 Mechanismen des Policy-Lernens
55
Bundesstaaten nachweisen, dass eine erfolgreiche Politik eine höhere Wahrscheinlichkeit besitzt, von anderen übernommen zu werden. Simmons und Elkins (2004) untersuchen bei der Analyse der globalen Diffusion liberaler Wirtschaftspolitik den Einfluss des Erfolgslernens anhand des wirtschaftlichen Wachstums. Meseguer Yebra (2004; 2006a) beschäftigt sich auch konzeptionell ausführlich mit der Erfolgsorientierung. In ihrer Untersuchung zu Privatisierungs- und Liberalisierungspolitik in Lateinamerika testet sie in einem quantitativen Modell die Orientierung am wirtschaftlichen Erfolg und dessen Auswirkung auf die Übernahme einer bestimmten Politik. In einer Analyse der Diffusion von Krankenhausreformen wird Lernen ebenfalls als Orientierung am effektivsten Modell unter den alternativen Politiken getestet (Gilardi, Füglister und Luyet 2009). Der Einfluss von Erfolg auf die Imitation oder Annäherung eines Modells ist auch in der Konvergenzliteratur ein wichtiges Thema (Drezner 2001: 62). Schließlich ist das Lernen von „best practice“ auch in der Literatur zur Sicherheitspolitik kein unbekanntes Konzept (Waltz 1999; Crescenzi 2007). Es gibt jedoch auch Zweifel, ob Erfolgslernen in der Politik relevant ist. Für Weyland (2004: 10) stellt Erfolg keine wesentliche Bedingung für den Einfluss eines bestimmten Modells dar. Walt (2000: 36) zeigt am Beispiel von historischen Misserfolgen, dass übermäßiger Optimismus hinsichtlich einer Ausbreitung von „best practice“ eher unbegründet ist. Ein Grund für diese Zweifel und die eher geringe Bedeutung in anderen Bereichen der Literatur könnte darin liegen, dass es methodisch oft problematisch ist, Daten zu Erfolg zu erheben. Erfolg wird oft nicht als objektives Kriterium, sondern als kulturelles Konstrukt begriffen, das in der Wahrnehmung der Akteure selbst formuliert wird (Strang und Macy 2001: 179). Neben einem geeigneten Indikator ist die Festlegung der Messperiode ein zweites Problem. Möglicherweise wird Erfolgsmodellen mehr Einfluss zugesprochen, wenn Erfolg kumulativ und nicht ausschließlich über die Leistung in jüngster Vergangenheit definiert würde (Strang und Macy 2001: 174; Mezias, Lant und Joel 1994). Zu dieser Skepsis kommt hinzu, dass das Erkennen von Erfolgsmodellen kein rein akademisches Problem eines geeigneten wissenschaftlichen Indikators darstellt, sondern dass auch die reale Politik Schwierigkeiten hat, im konkreten Fall erfolgreiche Politiken zu identifizieren. Dass dies der Fall ist, zeigt die Bedeutung, der sich Hilfskonstrukte wie die in Bezug auf „policy promotion“ schon erwähnten Benchmarking- und, „peer review“-Prozesse und ähnliche Verfahren erfreuen.21 Die Funktionalität von Benchmarking in Bezug auf Policy-Lernen wird in der Literatur umfassend diskutiert (Mabbett 2007: 85; Lundvall und Tomlinson 21
Bei „policy promotion“ ging es um die Perspektive der Modellgeber, hier um Modellnehmer
56
2 Theorien und Konzepte des Lernens
2002: 203; Rose 1991: 8). Durch Benchmarking wird die politische Entscheidungsfindung von einem Leistungsvergleich beeinflusst (Straßheim 2003: 228). Er beinhaltet die umfangreiche Sammlung von Daten und die Evaluation einzelner Alternativen, meist verbunden mit konkreten Empfehlungen. So soll ein effizienter Informationsaustausch garantiert werden, wobei Lernen aus der eigenen Erfahrung gezielt durch Beobachtungslernen ersetzt wird (Straßheim 2003: 228; Heinze, Schmid und Strünck 1999: 166ff). Benchmarking zielt darauf ab, ein Modell zu einer Marke und damit bekannt und attraktiv zu machen. Als ein Beispiel des Einflusses dieser Prozesse gilt die Arbeitsgruppe „Benchmarking“, die in Deutschland im Rahmen des „Bündnis für Arbeit“ eingesetzt worden war (Schmid 2003: 32; Eichhorst, Profit und Thode 2001). Die empirische Bedeutung von Benchmarkingprozessen wurde bislang meist in Fallstudien untersucht (Mabbett 2007; Nedergaard 2006; Weisband 2000). Neben der erhofften positiven Wirkungen wurde dabei auch festgestellt, dass es zu negativen Konsequenzen in Form des besagten „siren call“ kommen kann, also zu einer für den eigenen Kontext ungeeigneten Übernahme (Rose 1991: 27; Straßheim 2003). In der Analyse der Reformen westeuropäischer Wohlfahrtsstaaten wurde dies auch als „frenzy policy borrowing“ bezeichnet (Cox 1999). Umstritten ist, wie gut Indikatoren beim Benchmarking den Erfolg eines Landes anzeigen können. Dies ist jedoch für den Lernprozess nicht unbedingt entscheidend. Es geht vielmehr um den wahrgenommenen Erfolg, den solche Verfahren kommunizieren. Darum wird die Orientierung an Ländern mit hoher Reputation auch als Lernen von „scheinbarem“ Erfolg tituliert. Diese Orientierung ist auch über formalisierte Verfahren hinaus wirksam. Es kann sich um die Reputation für ein spezifisches Politikfeld oder für Problemlösungskompetenz im Allgemeinen handeln. Reputation wird immer dann relevant sein, wenn die einer Entscheidung zugrunde liegende Informationen über den wahren Erfolg einer Politikalternative nur in geschätzter Form vorliegen (Crescenzi 2007: 386). Die Motivation zur Orientierung an Reputation kann neben Informationsproblemen und der aktiven Werbung Dritter auch im Konformitätsstreben, einer Machtorientierung der „relative gain maximizer“ oder in der Attraktivität eines Modells liegen. Neben der problembezogenen Reputation kann das Prestige eines Landes auch aus dem Verhalten in bewaffneten Konflikten, der Größe eines Landes, dem Handelsvolumen oder ganz einfach der Einschätzung: „Der Feind meines Feindes ist mein Freund“ abgeleitet werden (Lee, Muncaster und Zinnes 1994: 336; Crescenzi 2007; Volden 2006). Eine Ausrichtung des Lernens am objektivierbaren Erfolg anderer Länder, an der eigenen Erfahrung, aber auch an „apparent success“ und damit an inter-
2.3 Mechanismen des Policy-Lernens
57
nationaler Reputation bilden eine gemeinsame Kategorie von Orientierungspunkten. In allen drei Fällen ergibt sich aus den theoretischen Überlegungen die allgemeine Erwartung, dass die Orientierung an Erfolg oder ihr Versuch die Annäherung und Imitation anderer Staaten an dieses Modell zur Folge haben wird. Auch wenn sich das Lernen von eigenem Erfolg von der Beobachtung des Erfolgs anderer unterscheidet, können für beide Formen identische Indikatoren gewählt werden. Hypothese Ia: Je größer der ökonomische oder politikfeldspezifische Erfolg eines Landes ist, desto höher ist die Wahrscheinlichkeit, dass andere Länder ein Modell dieses Landes übernehmen oder sich ihm annähern. Hypothese Ib: Je größer der eigene ökonomische oder politikfeldspezifische Erfolg eines Landes in der Vergangenheit war, desto höher ist die Wahrscheinlichkeit, dass es im gleichen Politikbereich ein ähnliches Modell aus der Vergangenheit übernimmt oder sich ihm annähert. Hypothese Ic: Je höher die politikfeldspezifische oder allgemeine Reputation eines Landes ist, desto höher ist die Wahrscheinlichkeit, dass andere Länder ein Modell dieses Landes übernehmen oder sich ihm annähern.
2.3.2.2 Lernen unter Nachbarn und Konkurrenten Orientiert sich eine Regierung an erfolgreichen Ländern, so erhöht sich für sie die Wahrscheinlichkeit, eine objektiv gute Politik zu bekommen. Neben diesem theoretischen Idealfall können aber auch andere Orientierungspunkte für PolicyLernen von Bedeutung sein. Unter Umständen passt ein Erfolgsmodell nicht zum eigenen nationalen Kontext, wenn das zugrunde liegende Problem nicht global uniform, sondern regional differenziert auftritt. In einer solchen Konstellation kann sich eine Regierung als rationaler Akteur an Ländern orientieren, die sich in einer vergleichbaren Situation befinden (Simmons und Elkins 2004: 175). In der Diffusionsforschung gilt es als erwiesen, dass der soziale Einfluss von Akteuren mit ähnlichem kulturellen Kontext nicht nur auf der individuellen Ebene, sondern auch für Organisationen oder Staaten zu beobachten ist: „In fact, the voluminous literature on diffusion and social influence has found that entities that share similar cultural attributes tend to adopt the same practices. This is true not only of individual behavior like teen smoking (Coleman 1960) and voting (Brady and Sniderman 1985; Lupia and McCubbins 1998) but also of collective behavior with respect to corporations (Davis and Greve 1997), nonprofit organiza-
58
2 Theorien und Konzepte des Lernens tions (Mizruchi 1989), states within federations (Walker 1969; Rose 1993), and indeed nation states (Deutsch 1963)“ (Simmons und Elkins 2004: 175).
Mit dem Streben nach Konformität und Anpassung wurden schon mögliche Anreize für das Lernen von so-genannten Peer-Ländern angeführt, die in einer unsicheren Situation eine ebenso natürliche Orientierung bieten wie Erfolg. Ähnlichkeit mit einem Modellgeber senkt auch die Kosten der Informationssuche, stellt die Kompatibilität einer Policy mit dem eigenen Rechtssystem und der politischen Kultur sicher und verspricht so eine bessere Politik (Weyland 2004: 11; Meseguer 2000: 21f). Des Weiteren erhöhen Nähe und Verwandtschaft die Attraktivität einer Politik und die Wahrscheinlichkeit, auf „policy promotion“ zu reagieren. Schließlich kann die Orientierung an Nachbarländern auch vom Vorliegen eines grenzübergreifenden Problems herrühren. Ähnlichkeit kann sich auf unterschiedliche Dimensionen beziehen. Zuerst kann sie als räumliche Nähe verstanden werden. Angesichts der Konzeption von Ansteckung („contagion“) und Diffusion in ihrem naturwissenschaftlichen Ursprungskontext liegt es nahe, dies als Ausgangspunkt zu wählen. Gleich dem Verhalten von Molekülen oder Krankheitserregern gilt in diesem Fall alleine die Aussetzung an ein Modell als Faktor, der die Ansteckungswahrscheinlichkeit erhöht. In der Populationsökologie geht man davon aus, dass die„relational density“, also die Zahl der formalen Beziehungen zwischen Mitgliedern einer Population, Einfluss auf deren Überlebensrate ausübt (Baum und Oliver 1992: 540). Analog wurde dieser Mechanismus auf benachbarte Länder übertragen. Als Beispiel wird etwa auf den Zusammenbruch des Kommunismus in Osteuropa, nicht aber in China und Kuba verwiesen (Walt 2000: 40). Bei dieser Übertragung wird der „Automatismus“ der Ansteckung durch einen Mechanismus auf der Mikroebene ersetzt. Es wird angenommen, dass durch die räumliche Nähe die Zahl potenzieller Kommunikationsverbindungen größer ist als zwischen anderen Ländern, so dass Informationen über Modelle von einem Land ins andere „überspringen“ können, zum Beispiel durch den Rundfunk oder die Zahl der zwischen Nachbarländern verkehrenden Grenzgänger. Schließlich kann angenommen werden, dass räumliche Nähe auch für ähnlichen Problemdruck steht, was zum Beispiel die außenpolitische Bedrohungslage oder regionale Probleme der Umweltverschmutzung betrifft. Der Lernanreiz besteht dann in der funktionalen Interdependenz und dem transnationalen Charakter eines Problems. In der ökonomischen Literatur (Ellison und Fudenberg 1993: 612), vor allem aber in der Diffusionsforschung ist räumliche Distanz und „neighbour emulation“ ein wichtiger Faktor für die Erhöhung der Imitationswahrscheinlichkeit (Shipan und Volden 2007: 828; Brinks und Coppedge 2006: 464; Ross und
2.3 Mechanismen des Policy-Lernens
59
Homer 1976; Putnam 1967). Hedström (1994) zeigt, dass Ansteckungseffekte lokal operierender Netzwerke für die Mobilisierung der schwedischen Gewerkschaftsbewegung in der ersten Hälfte des 20. Jahrhunderts entscheidend waren. Rincke (2006) untersucht am Beispiel von benachbarten US-Schuldistrikten räumliche Muster der Übernahme von Innovationen. Dyadische Ansätze in der Konvergenzforschung (Holzinger, Knill und Sommerer 2008) und neuere Ansätze der räumlichen Modellierung von Diffusionsprozessen (Beck, Gleditsch und Beardsley 2006; Franzese und Hays 2007a, b; Martin 2009) stellen die Distanz zwischen Ländern in den Mittelpunkt der Operationalisierung. Sie bleiben allerdings nicht auf räumliche Nähe beschränkt, da es gute Gründe gibt, auch andere Aspekte von Ähnlichkeit in die Analyse des Lernens mit einzubeziehen. Über die Nachbarschaft hinaus definieren kulturelle Ähnlichkeit in Form von Sprachgemeinschaften (Elkins, Guzman und Simmons 2006: 831; Meseguer 2004: 312), politischen Allianzen (Brinks und Coppedge 2006: 464), gemeinsamen Traditionen im Rechtssystem (Elkins, Guzman und Simmons 2006: 834) und von anderen historischen Verbindungen wie dem Commonwealth oder einer „familiy of nation“ (Jahn 2006: 11; vgl. Castles 1999; Obinger und Wagschal 2001) die natürliche Peer-Gruppe für eine Land. Der Kommunikationsfluss wird dabei direkt auf den politischen Prozess bezogen und wird ausführlicher konzeptionalisiert als bei räumlicher Distanz (Volden 2006). In der neueren Diffusionsforschung finden sich viele empirische Belege für eine positive Wirkung von kultureller Ähnlichkeit (Elkins, Guzman und Simmons 2006; Fourcade-Gourinchas und Babb 2002; Kobrin und Xun 2005: 20; Kogut und Macphersen 2003; Simmons und Elkins 2004; Weyland 2005). In der Literatur findet sich noch ein dritter Aspekt von Ähnlichkeit, der in einem Prozess des Policy-Lernens Regierungen in ihrer Entscheidungsfindung beeinflussen kann. Ähnliche Probleme können einerseits dazu führen, dass sich Länder aneinander orientieren, die in der Vergangenheit über eine ähnliche Politik verfügten (Volden 2006). Andererseits kann ein ähnliches Problem auch zum Lernen von Konkurrenten im internationalen Standortwettbewerb bedeuten (Guler, Guillen und MacPherson 2002: 215). Unter Unsicherheit kann im Sinne der Annahme von Regierungen als „relativ gain maximizers“ die Motivation darin bestehen, nicht hinter Wettbewerber zurückfallen zu wollen (Brune und Guisinger 2006: 8ff; siehe auch Abrahamson und Rosenkopf 1993: 492). Analog zum ökonomischen Wettbewerb argumentiert Crescenzi (2007: 389), dass ein ähnlicher Mechanismus im Bereich der Außenpolitik dann eine Rolle spielt, wenn im Sinne relativer Machtgleichheit beispielsweise kleine Staaten vom Umgang anderer kleiner Staaten mit Großmächten lernen. Ob es sich bei der Imitation von Peer-Ländern um Lernen handelt, ist in der Literatur umstritten. In manchen Fällen wird dieser Mechanismus als Wett-
60
2 Theorien und Konzepte des Lernens
bewerb behandelt.22 In anderen Fällen besteht beim Lernen unter Gleichen der Verdacht der Scheinkorrelation zwischen synchronen, aber unabhängigen Entscheidungen. Dieses Phänomen wurde zuerst von Max Weber (1921; vgl. Granovetter 1978: 1437) als Regenschirm–Effekt beschrieben. Ohne einander zu beobachten, handeln Akteure in gleicher Weise, da eine bestimmte Handlungsweise besonders naheliegend erscheint (Holzinger und Knill 2005). Dies führt tendenziell zu einer Überschätzung von Diffusion (vgl. Volden, Ting und Carpenter 2008). Wird jedoch auf die Effekte dieser beiden Faktoren kontrolliert, könnte eine Orientierung an ähnlichen Ländern als Lernen interpretiert werden. Hypothese IIa: Je größer die räumliche Nähe zwischen Ländern ist, desto höher ist die Wahrscheinlichkeit, dass ein Land das Modell eines nahen Landes übernimmt oder sich ihm annähert. Hypothese IIb: Je größer die kulturelle Ähnlichkeit zwischen Ländern ist, desto höher ist die Wahrscheinlichkeit, dass ein Land das Modell eines kulturell ähnlichen Landes übernimmt oder sich ihm annähert. Hypothese IIc: Je ähnlicher die Problemsituation und bisherige Politik zwischen Ländern sind, desto höher ist die Wahrscheinlichkeit, dass ein Land das Modell eines politisch ähnlichen Landes übernimmt oder sich ihm annähert. Hypothese IId: Je stärker Länder in Konkurrenz zueinander stehen, desto höher ist die Wahrscheinlichkeit, dass ein Land das Modell eines Konkurrenten übernimmt oder sich ihm annähert.
2.3.2.3 Lernen in Netzwerken Die durch die informationstechnologische Revolution und politische Umbrüche ermöglichte Zunahme globaler Kommunikationsströme in den letzten Jahrzehnten hat die Konnektivität gleichgesinnter Akteure erhöht. Diese können sich nun einfacher über Grenzen hinweg zur Erreichung gemeinsamer Ziele zusammenschließen (Walt 2000: 39). In der politikwissenschaftlichen Literatur wird auch diese Form transnationaler Kommunikation als Lernprozess modelliert und der Einfluss intergouvernementaler Netzwerken auf die Entscheidung der Übernahme eines Politikmodells beschrieben (Holzinger und Knill 2005: 782; Holzinger, Knill und Sommerer 2008: 558). Regierungen orientieren sich an den 22
Beide Konzepte sind zweifelsohne verwandt. Bei Wettbewerb würde man jedoch davon ausgehen, dass Imitation nicht einseitig ist und auf eine Annäherung Divergenz erfolgen und ein sogenanntes „race“ entstehen kann.
2.3 Mechanismen des Policy-Lernens
61
Modellen derjenigen Länder, mit denen sie die intensivsten Beziehungen unterhalten: „Policy diffusion should be strongest among governments that are in especially close communication. We should expect a positive relationship between policies of governments with extensive opportunities to share information about the consequences of [...] policy innovation“ (Simmons und Elkins 2004: 175). Dieser Mechanismus des Lernens knüpft an das Lernen von Peer-Ländern und Erfolg an. Erfolg spricht nicht nur durch die Salienz der Fakten für sich selbst. Internationale Institutionen erleichtern und fördern zudem den Zugang zu Informationen über die Attraktivität eines Modells und den Erfolg und die Reputation eines Landes (Simmons und Elkins 2004). Die Anreize, auf diese Art zu lernen, sind offensichtlich. Institutionen senken Informationskosten bei der Suche nach neuen Politiken. Sie erleichtern so die Suche nach der bestmöglichen Lösung. Die Orientierung an den Zielvorgaben einer internationalen Organisation kann dazu führen, dass ein rückständiges Land sein Image oder seine Wettbewerbsposition verbessert. Alle drei externen Motive können dieser Form des Lernens ebenfalls zu Grunde liegen. Ein Modell erscheint attraktiv, wenn es bekannt ist und häufig diskutiert wird. Internationale Organisationen verfügen über zahlreiche Möglichkeiten, Empfehlungen für ihre Mitglieder auszusprechen, und Vorreiter werden über die Informationskanäle ihrer Netzwerke versuchen, die Verbreitung der eigenen Politiken zu fördern. Schließlich ist die gemeinsame Lösung grenzüberschreitender Probleme ein zentrales Aufgabengebiet internationaler Institutionen. Der positive Einfluss intergouvernementaler Kommunikationsnetzwerke wurde in vielen empirischen Arbeiten nachgewiesen: „Several important studies indicate the importance of learning within communication networks in the policy arena. The international relations literature has recognized a role for channeled learning outside of the policy realm“ (Simmons, Garrett und Dobbin et al: 2006; vgl. Brune und Guisinger 2006: 10). Im Bereich des „lesson drawing“ beschreibt Rose (1991: 18) den positiven Einfluss der OECD in Form von horizontaler Kommunikation. Nedergaard (2006) untersucht die Wichtigkeit der Rolle von Ausschüssen für das Gelingen von Lernprozessen im Nordischen Rat. Auch die EU wurde hinsichtlich ihrer Wirkung auf Lern- und Diffusionsprozesse schon häufiger untersucht (Jahn 2006; Eising 2002). Crescenzi (2007) findet einen Effekt der gemeinsamen Mitgliedschaft in internationalen Organisationen auf Lernen in der Außenpolitik (vgl. Crescenzi, Enterline und Long 2006). Transnationaler Kommunikation in internationalen Organisationen wird auch eine entscheidende Rolle für die Konvergenz nationalstaatlicher Regulierung in der europäischen Umweltpolitik zugeschrieben (Holzinger, Knill und Sommerer 2008; Sommerer, Holzinger und Knill 2008; Arts et al. 2008).
62
2 Theorien und Konzepte des Lernens
Über die Diffusions- und Policy-Literatur hinaus spielen Einflüsse der Struktur des Kommunikationsflusses ebenfalls eine beträchtliche Rolle für die Erklärung von Lernverhalten. Hedström (1994: 116ff) verweist für die Diffusionsliteratur auf die Inspiration durch die Psychologie (Festinger 1954; Schachter 1951). Bandura (1973) zeigt in seiner psychologischen Theorie des sozialen Lernens, dass direkte Kontakte, beispielsweise in politischen Gremien, dazu führen, dass neue Informationen über eine bekannte und vertraute Quelle effektiv aufgenommen werden (vgl. Galaskiewicz und Wassermann 1989: 568). Theorien sozialen Lernens in der Anthropologie beziehen sich ebenfalls auf die Rolle der Struktur einer Gesellschaft (Kameda und Nakanishi 2002). In der ökonomischen Literatur zu sozialem Lernen argumentieren Ellison und Fudenberg (1993: 637), dass ein Mehr an Kommunikation die Wahrscheinlichkeit für Konformität und Imitation erhöht und dass das Design einer Institution dafür verantwortlich ist (Hirshleifer und Teoh 2003; Prendergast 1993; Khanna und Slezak 2000; Ottaviani und Sorensen 2001). Shiller (1995: 181) formuliert es so: „People who interact with each other regularily tend to think and behave similarily“.23 Die Realität politischer Institutionen ist meist komplexer als die einfachen Annahmen zu Netzwerkstrukturen in ökonomischen Modellen. Im Bereich des Lernens zwischen Staaten finden sich in der politikwissenschaftlichen Literatur zwei Kategorien von Netzwerken, die den Akteurstyp und das Umfeld genauer spezifizieren. Zum einen werden Expertennetzwerke oft als lose Zusammenarbeit von Akteuren aus Wissenschaft und Politik konzipiert. Diese üben Einfluss durch den Austausch von Wissen bei Konferenzen und gemeinsamen Forschungsprojekten aus (Rose 1991: 13f). Expertennetzwerke werden zu einer „epistemic community“ (Haas 1992), wenn sie ein gemeinsames Policy-Projekt verfolgen, wie etwa das „International Panel on Climate Change“ (IPCC) in der Klimapolitik (Gough und Shackley 2002). Für einige Beispiele, die meist auf spezifische Akteurskonstellationen beschränkt sind, konnte in der Literatur der Einfluss auf Lernprozesse nachgewiesen werden. Haas (1992) schreibt einer „epistemic community“ wesentlichen Anteil am Gelingen einer Konferenz der Mittelmeeranrainer zu. Auch für die Liberalisierung der Kapitalmarktpolitik wurde der Nachweis der Wirkung von „neoliberal economic thinking“ auf einen Diffusionsprozess erbracht (Chwieroth 2007). Zum anderen kann sich ein Netzwerk auf internationale Regierungsorganisationen beziehen. Die Spanne reicht von Regimen, deren Organisationsgrad kaum über ein kleines Sekretariat hinausgeht, bis zu großen bürokratischen Ap23
Das Konzept des „word of mouth learning“ (Banerjee und Fudenberg 2004) verweist diesbezüglich interessanterweise auf Erkenntnisse aus der Diffusionsliteratur (vgl. Cao und Hirsleifer 2000: 2).
2.3 Mechanismen des Policy-Lernens
63
paraten wie die Europäische Union oder die OECD, die über die Ressourcen und die Legitimation verfügen, eigenständig Politiken oder Empfehlungen zu entwickeln. Die Abgrenzung zu Expertennetzwerken ist nicht immer eindeutig. Solche Netzwerke siedeln sich in der Regel um formale Institutionen herum an, was als Indiz für eine Korrelation der Wirkung beider Netzwerktypen gedeutet werden kann. Dass internationale Institutionen und Organisationen positiven Einfluss auf Lernprozesse ausüben, wird kaum angezweifelt: „The establishment of international governmental organizations (IGOs) facilitates the teaching of new policy models [...].“ (Drezner 2001: 62; vgl. Strang und Meyer 1993). Die Entscheidungsträger nationaler Politik oder ihre Vertreter sind durch ihre Teilnahme an Treffen auf unterschiedlichen Entscheidungsebenen direkt in Kommunikationsprozesse involviert. Die Orientierung an Modellen in Netzwerken formaler Institutionen hat eine horizontale und vertikale Dimension. Zur ersten Kategorie gehört der Austausch von Informationen unter Repräsentanten von Mitgliedstaaten, bei dem internationale Organisationen passiv agieren. Häufige Treffen bilden einen festen Rahmen, der den Zugang zu Policy-Modellen erleichtert: „Frequent intergovernmental meetings at multiple official levels can transmit information to policy makers about 'what works' in other settings“ (Simmons und Elkins 2004: 175). Wo institutionelle Kontakte rar sind, ist es im Gegenzug unwahrscheinlich, dass sich Entscheidungsträger neuer Modelle überhaupt bewusst werden. Diese Erkenntnis wird auch durch die Literatur zu Isomorphismus und Organisationslernen gestützt (vgl. LaPalombara 2001). DiMaggio und Powell (1991) betonen, dass häufig interagierende Organisationen wie nationale Bürokratien dazu tendieren, ähnlich zu reagieren (vgl. Holzinger und Knill 2005). Internationale Institutionen können zur Verringerung von Lernbarrieren zwischen staatlichen Organisationen beitragen. In der organisationssoziologischen Literatur werden drei Typen von Lernbarrieren diskutiert, die auch für den Kontext der Politik relevant sind (Berthoin Antal, Lenhard und Rosenbrock 2003). Eine erste Barriere bezieht sich auf Brüche im Kommunikationsfluss, die das Lernpotenzial senken. Es wird erwartet, dass regelmäßige Treffen und ein ununterbrochener Prozess der Kommunikation die Wahrscheinlichkeit des Austauschs von Informationen und dadurch Lernens befördert (Casey und Gold 2005: 33f; Berthoin Antal, Lenhard und Rosenbrock 2003). Ein zweiter Typus beschreibt Barrieren in der Organisationskultur, etwa „defensive routines“ oder eine „Lernfalle“, die durch lange und ununterbrochene Zeiten des Erfolgs entstehen kann (Argyris 1991: 100; Casey und Gold 2005: 34). Auch hier kann der institutionalisierte Informationsaustausch zwischen Regierungen dafür sorgen, dass der Status quo in Frage gestellt wird und Rivali-
64
2 Theorien und Konzepte des Lernens
täten zwischen „Subkulturen“, wie etwa unterschiedlichen administrativen Traditionen, abgebaut werden. Die dritte Kategorie von Lernbarrieren in der Organisationsstruktur bezieht sich auf die Bevorzugung von Routineabläufen in bürokratischen Organisationen. Werden Vertreter nationaler Regierungen in Treffen auf internationaler Ebene eingebunden, erhöht das Wissen über die Vorteile alternativer Modelle die Chance, Routinen aufzubrechen (Casey und Gold 2005: 34). Ein Beispiel zur Veranschaulichung des Einflusses von Informationsaustausch in internationalen Institutionen ist die „Offene Methode der Koordinierung“ (OMC) der EU, die etwa im Rahmen des Luxemburg-Prozesses und der europäischen Beschäftigungsinitiative angewandt wurde (Casey und Gold 2005: 23). Sie soll entsprechend der Lissabonner Ziele mit Leitlinien und unverbindlichen Empfehlungen den Austausch über „best practices“ erleichtern: „The idea of OMC is to use the EU as a transfer platform rather than as a law-making system“ (Radaelli 2003: 513; s. Mabbett; 2007; Trubek und Mosher 2003). Eine zweite horizontale Wirkungsweise der Vernetzung in internationalen Organisationen stellt die aktive Kooperation bei der Lösung gemeinsamer Probleme dar (Holzinger und Knill 2005: 782). Komplexe Verhandlungssysteme und kooperative Entscheidungsverfahren sind Lernprozessen förderlich: „It is well documented that the process of negotiating and maintaining institutional affiliations may create opportunities to learn and persuad“ (Haas 1959: 169). Internationale Organisationen können bei Unsicherheit im Sinne von Schelling (1978) „focal point“-Lösungen propagieren (vgl. Levy 1994: 281; Goldstein und Keohane 1993; P. Haas 1992; Adler 1992; E. Haas 1990). Die institutionalisierten Entscheidungsprozesse der EU stellen mit ihren Abstimmungsprozessen und ihrem Regelwerk ein gutes Beispiel für eine Orientierungshilfe dar (Eising 2002: 87). Ein Prozess inkrementeller Verhandlungsschritte, beinahe tägliche Treffen wie in der Arbeitsgruppe im Rat der ständigen Vertreter (COREPER) sowie die sequenzielle Lösung einzeln abgetrennter Problempunkte vergrößern die Basis gemeinsamen Wissens und damit die Lernwahrscheinlichkeit (Eising 2000: 28). Als dritte Möglichkeit der Wirkung von Netzwerken kommt zum horizontalen Austausch unter Mitgliedstaaten noch eine vertikale Dimension hinzu, wenn die entsprechenden Organisationen über die Legitimation und die Ressourcen verfügen, Politikmodelle zu entwickeln und zu empfehlen (Holzinger und Knill 2005: 785). Sie können Werbung für bestimmte Modelle machen, in dem sie relevante Information für ihre Mitglieder zusammenstellen, wie es zum Beispiel die Weltbank, der IWF oder die ILO tun (Weyland 2004: 13). Eising (2002: 87) verweist auf die ständig wachsende Menge an Informationen, die die EU-Kommission, zusammenträgt und in Policy-Entwürfe oder Empfehlungen
2.3 Mechanismen des Policy-Lernens
65
kleiden kann. Ähnliches wurde für die OECD beschrieben, die kaum verbindliche Vorschriften für ihre Mitgliedstaaten produzieren darf und sich auf die argumentative Überzeugungskraft verlassen muss. Sie sammelt und bearbeitet Informationen und Daten, und sorgt so dafür, dass sich dieses Wissen unter ihren Mitgliedstaaten verbreitet (Marcussen 2004: 91f). Eine wichtige Form dieser Einflussnahme der OECD auf die politische Agenda ihrer Mitgliedstaaten sind die bekannten „country surveys“ (ebd.: 93). Dabei wird der Zusammenhang mit der Orientierung an Erfolg deutlich: Institutionen können über solche „Schönheitswettbewerbe“ die Anziehungskraft und die Verbreitung bestimmter Modelle beeinflussen. Für alle drei Formen der Orientierung an der Konnektivität in Netzwerken internationaler Institutionen wird erwartet, dass sie die Wahrscheinlichkeit des Modelllernens unter Mitgliedstaaten erhöhen.24 Der Einfluss der Netzwerkdichte und -intensität auf die Wahrscheinlichkeit einer Imitation wird in zwei Hypothesen erfasst. Internationale Institutionen können entweder als Arenen für den Informationsaustausch und gemeinsame Problemlösungen fungieren, oder sich durch Empfehlungen und Bewertungen als Orientierungshilfe bei der Suche nach einem Politikmodell anbieten. Da die Formulierung der Hypothesen auf eine quantitative Analyse von Lernprozessen hinzielt, wird die Rolle von Expertennetzwerken nicht weiter berücksichtigt. Für sie existieren bislang keine über spezifische Akteurskonstellationen hinausgehenden, allgemeinen Konzepte. Hypothese IIIa: Je größer die gemeinsame Aktivität von Ländern in Netzwerken internationaler Institutionen ist, desto höher ist die Wahrscheinlichkeit, dass ein Land das Modell eines anderen Mitglieds dieses Netzwerkes übernimmt oder sich ihm annähert. Hypothese IIIb: Je stärker die Einbindung eines Landes in Netzwerke internationaler Institutionen ist, desto höher ist die Wahrscheinlichkeit, dass dieses Land Empfehlungen dieser Organisationen übernimmt oder sich ihnen annähert.
2.3.2.4 Herdenverhalten und Lernen von der Masse Herdenverhalten wurde in der politikwissenschaftlichen Literatur bislang nicht auf der Meso-, sondern nur auf der Makro-Ebene über Adaptionskurven und 24
Diese Aktivitäten von internationalen Institutionen werden in der Literatur über das Thema des Policy-Lernens hinaus als „international soft law“ bezeichnet (Abbott und Snidal 2000: 434). Es findet dort seine Anwendung, wo harte Mechanismen internationalen Rechts nicht greifen oder am Einstimmigkeitsprinzip scheitern, wird aber oft nicht mit Lernen in Verbindung gebracht.
66
2 Theorien und Konzepte des Lernens
Diffusionswellen erfasst (Levi-Faur 2002). In einer vierten Kategorie von Orientierungspunkten des Policy-Lernens kann jedoch auch der Einfluss einer dominanten Gruppe oder Herde von Akteuren, die ein bestimmtes Politikmodell umgesetzt hat, untersucht werden. Auch wenn diese Form des Lernens häufig als etwas Irrationales dargestellt wird, kann sie im weiteren Sinne als eine Variation des Erfolgslernens begriffen werden. Regierungen richten die eigene Politik am Verhalten anderer aus, weil dies unter bestimmten Bedingungen – etwa bei großer Unsicherheit - als die erfolgversprechendste Option erscheint. Wenn Individuen die direkte Beobachtung von Erfolg nicht möglich ist, müssen sie nach alternativen Indikatoren suchen (Henrich und McElreath 2003: 130). Was macht ein Individuum, wenn es Unterschiede im Erfolg, jedoch nicht im Verhalten feststellt? Oder Differenzen bei den Mitteln, aber gleichen Erfolg? Allgemein gilt, dass in solchen Fällen nicht nur die Identifikation von Akteuren mit hoher Reputation, sondern auch die Orientierung an der großen Zahl hilft. Der so genannte „Konformitäts-Bias“ beschreibt die Neigung, unter Unsicherheit die am weitesten verbreiteten Verhaltensweisen einer Gruppe zu übernehmen (Boyd und Richerson 1985; Kameda und Nakanishi 2002).25 Dies ist rational, weil dahinter die aggregierte Lernanstrengung eines Kollektivs vermutet werden kann (Henrich und McElreath 2003: 131). In institutionalistischen Theorien wird Normen-Konformität als eine Ursache für Herdenverhalten gehandelt, da sie die Überlebenschancen einer Organisation oder eines Staates erhöht (Meyer und Rowan 1977; Holzinger und Knill 2005). Ein komplexes und hoch institutionalisiertes Umfeld drängt Organisationen dazu, vorherrschende Regeln und Praktiken zu übernehmen. Dies geschieht „zeremoniell“ und unabhängig von der Wirksamkeit dieser Regeln (Meyer und Rowan 1977: 340). Auf der Mikro-Ebene können Anreize, einer dominanten Gruppe zu folgen, neben Unsicherheit, Reputations- und Konformitätsstreben auch in der Motivation liegen, das Zurückbleiben hinter Konkurrenten zu verhindern. Auf der Seite externer Reize ist es die Attraktivität eines Modells, die Akteure dazu bewegen kann, ihre eigentlichen Präferenzen zu ignorieren. Auch die Werbeaktivität von Dritten kann Konformitätsdruck erzeugen. In einem Beispiel aus der Privatwirtschaft beschreiben Strang und Macy (2001: 174), dass gerade externe Beratung zur Entstehung von Herden führen kann: „Faddish behavior may occur not in spite of performance pressures and high consulting fees but because of them. Consultants advertise their winners, not their also rans” (Strang und Macy 2001: 174).
25
Vergleichbar dazu ist das sozialpsychologische Konzept der „consensual validation“ (Festinger 1954): Vom Konsens mit der dominanten Meinung wird eine Bestätigung eigener Überzeugungen erhofft.
2.3 Mechanismen des Policy-Lernens
67
Auch andere Beispiele aus der ökonomischen Literatur zu sozialem Lernen, Herdeneffekten, Ansteckung, „bandwagoning“, Kaskaden und Modewellen zeigen, dass diese Form des Lernens nicht zwingend auf irrationalem Verhalten basiert ist. Der Akteur wird stattdessen als bayesianisch-rational (Lohmann 2000: 656) oder beschränkt-rational (Kuran 1998) angenommen. Die Besonderheit bei der Orientierung an einer Herde besteht gegenüber dem normativ geprägten Bild vom Verbesserungslernen darin, dass es bedingt durch eine Dynamik sequenzieller Entscheidungen höchst rational sein kann, auch gegen die eigene Präferenz zu handeln (Abrahamson und Rosenkopf 1993: 489). Auf der Meso-Ebene können Herdeneffekte nach drei Teilaspekten untergliedert werden. Die Gruppengröße beschreibt die erste Form einer möglichen Wirkung. Der Einfluss der absoluten Zahl vorangegangener Ersteinführungen auf spätere Übernahmen wurde in der Organisationsforschung seit Anfang der achtziger Jahre thematisiert (Tolbert und Zucker 1983; Fligstein 1985; Abrahamson und Rosenkopf 1993; Haunschild 1993). Auch in der ökonomischen Literatur spielt dieser Faktor bei den eher spärlich gesäten empirischen Arbeiten eine wichtige Rolle (Bala und Goyal 1998: 598). In der Politikwissenschaft hingegen findet sich keine Berücksichtigung einer solchen Variable, so dass ein starkes Missverhältnis zwischen der theoretischen Plausibilität und der eher schmalen Basis empirischer Erkenntnis besteht. Die „power in numbers“ (DeNardo 1985) ist jedoch nicht die einzige Möglichkeit, Konformitätsdruck einer Gruppe auf die Übernahmeentscheidung von Nachzüglern zu erklären. Über die Zahl der tatsächlichen Handlungen hinaus kann auch das evolutionäre Verhältnis von „Produzenten“ einer Innovation und deren „Schnorrer“ von Bedeutung sein (Kameda und Nakanishi 2002: 390). Um die relative Größe einer Gruppe zu messen, beobachten Individuen zum Beispiel bei einer Massendemonstration die Zahl der tatsächlichen und der potenziellen Akteure und schätzen dann die Differenz (Granovetter 1978: 1422; Lohmann 2000: 656f; Gersen 2001). Eine Gewichtung der Gruppengröße lässt sich auch aus der sozialpsychologischen Literatur herleiten. Konformität tritt in einer Gruppe besonders dann auf, wenn es nur geringen Widerspruch gibt und die Sequenz ununterbrochen konformer Entscheidungen lang ist (Asch 1955). In ökonomischen Analysen sozialen Lernens wurde bestätigt, dass die Zahl alternativer Modelle und die Größe einer konkurrierenden Gruppe einen Einfluss auf den Herdeneffekt haben (Gale 1996: 620). Gibt es zu einer Politik wie der Privatisierung der Rentenversicherung keine sichtbaren Alternativen, wird sie eher von der Masse der Länder imitiert. Analog vermutet Meseguer (2006b: 39), dass Regierungen von der Variabilität der Ergebnisse in anderen Ländern lernen. Erwähnung findet diese Form der Orientierung an einer dominanten Gruppe auch bei Walt (2000: 41),
68
2 Theorien und Konzepte des Lernens
der beschreibt, dass ein Ansteckungsprozess ausbleiben kann, wenn eine politische Innovation oder Idee eine Gegenbewegung provoziert. Ein dritter Aspekt hat in ökonomischen Modellen nur geringe Bedeutung. Hinsichtlich einer Anpassung des Gruppeneffektes an die komplexen Bedingungen der politischen Realität erscheint er dennoch vielversprechend. Geht es beispielsweise um die Einführung einer unabhängigen Zentralbank, so könnte nicht nur die absolute oder relative Zahl derjenigen Länder von Bedeutung sein, die eine solche Institution besitzen. Im Sinne kognitiver Theorien sollten Übernahmen ebenfalls nicht weit zurück und zeitlich nahe beieinander liegen, so dass sie als einheitliches Muster identifiziert werden können (Levi-Faur 2002: 9). Die Orientierung an der Dichte und Aktualität von Imitationen wird zwar häufig in Metaphern zu sozialem Lernen referiert, wenn von „fever, fads and firestorms“ (Walt 2000) die Rede ist. Es gibt jedoch kaum eine empirische Berücksichtigung, die über schlichte Periodeneffekte hinausgeht. Eine Ausnahme bilden Simmons und Elkins (2004), die dieses Phänomen jedoch als externen Effekt und nicht als eine Form des Lernens beschreiben. Insgesamt wird weniger aufgrund des mageren empirischen Kenntnisstandes, sondern wegen der theoretischen Plausibilität und anekdotenhaften Evidenz ein positiver Einfluss von Herden auf das Auftreten eines Lernprozesses in der Politik erwartet. Bei der Formulierung der Hypothesen wird die Orientierung nach den drei Formen eines Effektes unterschieden. Hypothese IVa: Je größer die Gruppe ist, die ein bestimmtes Modell anwendet, desto höher ist die Wahrscheinlichkeit, dass ein Land dieses Modell übernimmt oder sich ihm annähert. Hypothese IVb: Je größer die Gruppe ist, die ein bestimmtes Modell anwendet, und je geringer die Zahl alternativer Gruppen, desto höher ist die Wahrscheinlichkeit, dass ein Land dieses Modell übernimmt oder sich ihm annähert. Hypothese IVc: Je größer die Zahl zeitnaher Übernahmen eines bestimmten Modells ist, desto höher ist die Wahrscheinlichkeit, dass ein Land dieses Modell übernimmt oder sich ihm annähert.
2.3.3 Was folgt auf Lernen? Variationen des Policy-Wandels Eine vollständige Darstellung der Lernmechanismen endet nicht mit einer Beschreibung von Motiven und Orientierungspunkten. Auf einer dritten Ebene des Analyserahmens können die Konsequenzen von Lernen ebenfalls klassifiziert und untersucht werden. Der potenzielle Beitrag einer Integration dieses Aspekts
2.3 Mechanismen des Policy-Lernens
69
in die Analyse des Policy-Lernens wurde in der Literatur bislang kaum erkannt, und so werden die Folgen des Lernens meist nur am Rande und wenig systematisch diskutiert (vgl. Lohmann 2000; Levi-Faur 2002). Im Folgenden werden vier Dimensionen der Veränderung einer Politik dargestellt, anhand derer von der Form des Policy-Wandels auf das Auftreten von Lernprozessen geschlossen werden kann. Als erste Konsequenz von Lernen kann erwartet werden, dass sich eine Politik überhaupt sichtbar verändert. Wie in der Definition von Policy-Lernen in Abschnitt 2.2 beschrieben, kann von einem behavioristischen Standpunkt aus die Beobachtung anderer, die zu keiner Änderung des Verhaltens führt, nicht als Lernen betrachtet werden. In der Definition von Policy-Lernen ist auch eine zweite Annahme zum Muster des Wandels enthalten. Lernen als Modelllernen bedeutet, dass ein Land die Politik eines anderen vollständig übernimmt oder zumindest ein ähnliches Konzept einführt. Dass in der aggregierten Betrachtung mehrerer Länder auf Imitation Konvergenz folgt, ist in der Diffusions- und Konvergenzliteratur allgemein anerkannt (Drezner 2001; Meseguer 2004; Holzinger und Knill 2005; Simmons und Elkins 2004). Auch in der ökonomischen Literatur wird von sozialem Lernen eine Annäherung zwischen Akteuren erwartet (Ellison und Fudenberg 1995: 96; Hirshleifer und Teoh 2003: 42), ebenso im Konzept des „isomorphism“ (Meyer und Rowan 1977: 346). Konvergenz kann unterschiedliche Formen annehmen (Heichel, Pape und Sommerer 2005; Heichel und Sommerer 2007; Knill 2005). Der wichtigste Typus ist Sigma-Konvergenz als Reduktion von Varianz. Lernen kann zu globaler Konvergenz, aber auch zu regional begrenzter Konvergenz und einer Clusterbildung um mehrere konkurrierende Modelle herum führen (Simmons und Elkins 2004; Chang et al. 1997; Gul und Lundholm 1995: 1040). Außerdem kann die Annäherung vollständig oder graduell sein. Bennett (1991) skizziert ein Kontinuum möglicher Abstufungen von bloßer Inspiration bis zur perfekten Kopie eines Vorbildes. Weitere Konvergenztypen beschreiben Wandel in Bezug auf Prozesse des Auf- und Überholens (Beta-Konvergenz) und auf Mobilität in der Rangfolge der Länder (Gamma-Konvergenz; Heichel und Sommerer 2007). Während einige Formen des Lernens zu einem Aufholen der Nachzügler im Verhältnis zu Vorreitern führen sollten, spricht eine Änderung der Rangordnung gegen die Wirksamkeit von Lernen, denn sie kann per definitionem nicht vollständig auf Imitation zurückgehen. Die dritte Dimension von Wandel, die für eine Analyse des Policy-Lernens relevant ist, bezieht sich auf die Richtung einer Veränderung. Sollte Lernen in Form einer Orientierung an erfolgreichen Staaten erfolgen, so muss als Folge die Verschärfung einer Regulierung zu beobachten sein. Tritt hingegen Wandel
70
2 Theorien und Konzepte des Lernens
auf dem kleinsten gemeinsamen Nenner auf oder ist sogar eine Abwärtstendenz zu verzeichnen, kann Verbesserungslernen nicht dafür verantwortlich gemacht werden. Stattdessen könnte diese Veränderung mit dem Lernen von PeerLändern und ökonomischen Konkurrenten in Zusammenhang stehen. Auch zur Ausbreitungsdynamik von Politikmodellen als vierter Dimension gibt es in der Literatur konkrete Erwartungen bezüglich des Policy-Wandels. Sowohl vollständige als auch graduelle Konvergenz muss langfristig keinen stabilen Zustand darstellen. Stattdessen kann es im Zeitverlauf zu Instabilität und der Bildung neuer Gleichgewichte kommen (Hirshleifer und Teoh 2003). In die Theorie zu „bandwagoning“ und Herdeneffekten kann auf Konvergenz eine Phase der Divergenz folgen – und umgekehrt. In der Anthropologie wird die Abfolge von „trial and error“ und sozialem Lernen modelliert (McElreath et al. 2005). Strang und Macy (2001: 173) argumentieren analog, dass ein Zyklus von Übernahme und Aufgabe eines Modells entsteht, wenn unzufriedene Akteure wieder innovativ werden. Die Stabilität von Konvergenz hängt demnach maßgeblich mit der Effektivität einer Innovation zusammen. In der Diffusionsforschung wird für einen idealtypischen Ausbreitungsprozess ein Verlauf in Form einer S-Kurve angenommen (Granovetter 1978; Tews 2002a). Einer zögerlichen Ausbreitung unter Vorreitern in der Anfangsphase folgt ein überproportionaler Anstieg der Übernahmen, der bei hohem Verbreitungsgrad zurückgeht und einige Nachzügler nicht mehr erreicht. In einem rationalen Lernprozess wäre die Phase der Ausbreitung durch sorgfältige Analysen, das Abflauen hingegen durch kontrafaktische Erkenntnisse gekennzeichnet. Geht man von einem geringeren Maß an Rationalität aus, könnte die Imitation durch eine Anfangseuphorie bei neuartigen Konzepten erklärt werden, auf die nach ersten Erfahrungen eine Desillusionierung durch Misserfolg folgt (Abrahamson und Fairchild 1999: 714). Gibt es in der ländervergleichenden Perspektive Muster von Imitation, Konvergenz und Diffusion, so erfüllt dies eine notwendige Bedingung für das Auftreten von transnationalem Policy-Lernen. Es kann jedoch im Umkehrschluss nicht davon ausgegangen werden, dass es sich um eine hinreichende Bedingung, und daher bei der Ursache des Wandels tatsächlich um Lernen handelt. Einige konkurrierende Erklärungsfaktoren können ähnliche Muster von Wandel hervorrufen, aber oft nicht von Lernen unterschieden werden 2.4 Alternative Erklärungen von Policy-Wandel Dass Lernprozesse in einer Vielzahl von Politikfeldern eine Rolle spielen, haben beispielsweise empirische Analysen zur Wirtschaftspolitik (Meseguer 2004; 2006; Simmons und Elkins 2004; Weyland 2005), Umweltpolitik (Holzinger,
2.4 Alternative Erklärungen von Policy-Wandel
71
Knill und Sommerer 2008), Sicherheitspolitik (Crescenzi 2007) oder Energiepolitik (Eising 2003) nachgewiesen. Bei der Erklärung von Wandel steht PolicyLernen jedoch in starker Konkurrenz zu anderen Theorien. Die Definition des Lernens in Abschnitt 2.2 hat gezeigt, wie schwierig in manchen Fällen die Abgrenzung von Lernen und alternativen Erklärungsfaktoren ist. Daher sollte die Integration von Kontrollmechanismen ein wesentlicher Bestandteil der Analyse von Policy-Lernen sein. So kann die Gefahr reduziert werden, dass zwar positive Hinweise auf Lernen vorliegen, diese aber auch im Sinne konkurrierender Ansätze interpretiert werden könnten (Haunschild 1993). Der Versuch, Lerneffekte über die geringe Erklärungskraft anderer Faktoren zu identifizieren, findet sich schon in einigen klassischen Beiträgen dieses Forschungsbereichs. Zum Beispiel arbeitet sich Heclo (1974: 284ff) bei der Analyse der Veränderung der Sozialpolitik in Schweden und Großbritannien an einer langen Liste alternativer Erklärungen ab. Als einen Beleg für die Wirksamkeit von Lernen wertet er, dass weder die sozio-ökonomische Entwicklung noch der Einfluss von Wahlen, Parteien, Interessengruppen oder der Ministerialverwaltung den Wandel erklären können. In der gegenwärtigen Literatur existieren eine ganze Reihe von Versuchen, die große Zahl von Faktoren, die als mögliche Ursachen für Policy-Wandel gehandelt werden, zu kategorisieren. Für Kemmerling und Bruttel (2006: 98) bilden Lerntheorien mit Wettbewerb und Pfadabhängigkeit die „Heilige Dreifaltigkeit“ der Erklärung politischer Reformen. Eine andere Einteilung verfolgen Holzinger und Knill (2005) für Erklärungsfaktoren in der Konvergenzforschung. Neben der Kategorie transnationaler Kommunikation zählen dazu „imposition“, „international harmonization“, „regulatory competition“ und „independent problem solving“. In der Diffusionsliteratur finden sich ähnliche Schemata (Simmons und Elkins 2004: 180; Braun und Gilardi 2006). Für die PolicyLiteratur bietet Wison (2000) einen umfassenden Überblick über Theorien des Wandels. Ähnlich wie Heclo unterscheidet er auf den politischen Entscheidungsprozess bezogene Ansätze von strukturalistischen Theorien, Theorien zu sozialen Bewegungen, Interessengruppen, Eliten, so genannte „policy paradigms“ und schließlich exogenen Faktoren. Zu Letzteren zählen plötzlich auftretende Ereignisse wie Kriege und Naturkatastrophen, aber auch langsame Entwicklungen wie die Urbanisierung. Die folgende Darstellung basiert auf vier Faktoren, die mit Lernen um die Erklärung von Wandel konkurrieren. Das dreigliedrige Schema von Kemmerling und Bruttel (2006) mit Lernen, Wettbewerb und Pfadabhängigkeit wird um internationale Harmonisierung sowie die Erklärung von Wandel durch Problemdruck und besondere Ereignisse erweitert. Diese Mechanismen werden im Folgenden kurz vorgestellt. Da der Schwerpunkt auf Lerntheorien liegt, fällt
72
2 Theorien und Konzepte des Lernens
ihre Darstellung kürzer aus. Sie wird im Vorgriff auf das Design der empirischen Analyse auf die für die Umweltpolitik relevanten Faktoren eingegrenzt.
2.4.1 Internationale Harmonisierung und Konditionalität Der Impuls zu internationaler Harmonisierung kommt wie bei Policy-Lernen von der internationalen Ebene. Der wesentliche Unterschied besteht darin, dass dieser Prozess nicht auf Freiwilligkeit, sondern auf Zwang und rechtlicher Verpflichtung basiert.26 Außerhalb der Literatur zur Europäisierung wird der Effekt internationalen oder supranationalen Rechts auf die Veränderung nationalstaatlicher Regulierung nur am Rande diskutiert (vgl. Holzinger und Knill 2005). Oft wird er als selbstverständlich betrachtet, was jedoch Erkenntnissen der Forschung zu „compliance“ und der Implementation internationaler Vorgaben widerspricht. Ein zweiter Grund für die Vernachlässigung liegt in der schwierigen Abgrenzung von rechtlichen Verpflichtungen und Faktoren des „international soft law“. Wie Kemmerling (2007: 164) argumentiert, kann ein dritter Grund im Fehlen einer geeigneten Definition des Machtbegriffs in der Diffusionsliteratur gesehen werden. Internationales Recht kann sich in dreierlei Weise auf nationale Politikgestaltung auswirken. Die erste Möglichkeit besteht in der Rechtsetzung durch völkerrechtliche Verträge, die von Regierungen ausgehandelt und von den nationalen Gesetzgebern ratifiziert werden (Holzinger und Knill 2008: 51ff). Dies stellt als „negotiated transfer“ keinen hierarchischen Eingriff dar (Dolowitz 2000: 15). Policy-Wandel durch internationale Kooperation wird in der Literatur zu Diffusion (Martin und Simmons 1998), Politiktransfer (Dolowitz und Marsh 1996) und Konvergenz (Holzinger und Knill 2005) beschrieben. Der Mechanismus setzt funktionale Interdependenz voraus, die Regierungen zwingt, gemeinsame Probleme gemeinsam anzugehen und ihre Unabhängigkeit zumindest teilweise zu opfern (Holzinger und Knill 2005: 782; Drezner 2001: 60). Die zweite Wirkungsweise betrifft supranationale Rechtsetzungsakte, die keinem komplexen Ratifikationsprozess unterliegen. In den meisten Fällen bezieht sich dieser Mechanismus auf die Europäische Union. Schreiten Kooperation und Souveränitätsverzicht weit voran, kann eine Eigendynamik entstehen, die über die ursprüngliche Absicht einzelner Regierungen hinausgeht. Ein Beispiel dafür stellt die Umweltpolitik auf europäischer Ebene dar, für die es zuerst keine direkte Rechtsgrundlage in den Verträgen zu den Europäischen Gemeinschaften gab. Die Zuständigkeit der EU wurde im Laufe der Zeit aus einer all26
Genau genommen liegt auch in diesen Fällen Freiwilligkeit vor, und zwar indirekt durch den Souveränitätsverzicht beim Beitrittsakt. Dies gilt jedoch nicht für alle sukzessiven Rechtsakte.
2.4 Alternative Erklärungen von Policy-Wandel
73
gemeinen Ermächtigung zur Harmonisierung von Rechtsvorschriften abgeleitet (Knill 2008: 21ff). In der internationalen Umweltpolitik spielen verbindliche Rechtsvorschriften eine wichtige Rolle. Zahlreiche Studien belegen den Einfluss der EU auf die Umweltpolitik ihrer Mitglieder (Bugdahn 2005; Börzel 2000, 2003; Héritier et al 1996; Jordan 2002, 2003; Jordan und Liefferink 2004; Haverland 2000; Heinelt et al. 2001; Holzinger und Knoepfel 2000; Knill und Lenschow 2000; Knill 1998, 2001). Auch die Auswirkungen horizontaler umweltpolitischer Kooperation durch internationale Organisationen und Regime wurden häufig untersucht (Bernauer und Moser 1996; Dolsak 2001; Miles et al. 2002; Mitchell 2002; Murdoch und Sandler 1997; Schreurs 1997; Wettestad 1997; Young 1999). Die dritte Möglichkeit eines Effektes internationaler Vorgaben auf nationale Politik bezieht sich auf eine asymmetrische Konstellation, in der von internationalen Organisationen eine Gegenleistung zu Finanzhilfen oder Sicherheitsgarantien eingefordert wird (Holzinger und Knill 2005). Als Beispiel wird oft die EU-Osterweiterung (Schimmelfennig und Sedelmeier 2004, Tews 2002b), aber auch die Einflussnahme der Internationalen Finanzinstitutionen genannt: „As for coercion, one widespread explanation of policy convergence is that governments stabilised and adjusted their economies under pressure from IFIs. Imposition is epitomised by IFI conditionality, which implies that policies are adopted in exchange for loans.“ (Meseguer 2004: 314; Brune, Garrett, und Kogut 2004). In der Literatur firmiert dieser Mechanismus als „coercive isomorphism“ (DiMaggio und Powell 1991: 67), „convergence by penetration“ (Bennett 1991: 227) oder Politikoktroi (Tews 2002b: 181). Der Nachweis eines direkten Links zwischen dem Druck internationaler Organisationen und Wandel ist oft mit Schwierigkeiten verbunden, da er beispielsweise durch den Effekt von „international soft law“ überdeckt wird (Brooks 2005; Keohane und Nye 1998: 86). So bleibt die Wirkungsweise umstritten: „Despite the broad scholarly attention given to the question of IFI influences on policy reform, it remains unclear precisely how the World Bank has influenced the policy-making processes of governments around the world.“ (Brooks 2005: 279). Da sich dieser Mechanismus für den Bereich der Umweltpolitik nicht sichtbar von Effekten des Beitritts zu völkerrechtlichen Verträgen unterscheidet, werden für die Wirkung von internationaler Harmonisierung nur zwei Hypothesen formuliert. In den Hypothesen wird dabei auch berücksichtigt, dass für Policy-Wandel Konvergenz unter den Mitgliedstaaten einer internationalen Institution erwartet wird. Diese tritt bei der Ratifikation internationaler Verträge einmalig, im Fall supranationaler Harmonisierung während der gesamten Mitgliedschaftsdauer auf. Wandel sollte sich vorwiegend zeitgleich auf Unterzeichnerstaaten auswir-
74
2 Theorien und Konzepte des Lernens
ken. Wegen Unterschieden in der Implementation kann er aber auch zeitversetzt erfolgen, so dass auf der Makro-Ebene eine gewisse Ähnlichkeit zum Ergebnis von Modelllernen bestehen kann. Hypothese Va: Wenn ein Land Mitglied in einer internationalen Organisation mit der Kompetenz zur verbindlichen Rechtsetzung ist, dann erhöht sich die Wahrscheinlichkeit, dass es seine Politik ändert und die Vorgaben dieser Organisation übernimmt. Hypothese Vb: Wenn ein Land internationalen Verträgen und Organisationen beitritt, dann erhöht sich die Wahrscheinlichkeit, dass es seine Politik ändert und die Vorgaben dieser Organisationen übernimmt.
2.4.2 Standortkonkurrenz und regulativer Wettbewerb Eine zweite konkurrierende Erklärung für Policy-Wandel bezieht sich auf den Einfluss von Wettbewerb. Die Theorie regulativen Wettbewerbs basiert auf der Annahme, dass eine wachsende regionale und globale Integration von Wirtschaftsräumen, die Abschaffung von Handelsbarrieren und die Mobilität von Wirtschaftsgütern und Kapital den klassischen Nationalstaat dazu zwingt, seine Politik so zu verändern, dass die heimische Industrie nicht im Nachteil ist (Goodman und Pauly 1993; Keohane und Nye 1998; Drezner 2001; Holzinger und Knill 2005).27 Regulierungskonkurrenz kann zu einem regulativen „race to the bottom“ führen, also zu einem kumulativen Absenken von Schutzstandards (Hoberg 2001: 127; Simmons und Elkins 2003; Drezner 2001: 57ff). Mobiles Finanzkapital spielt dabei die entscheidende Rolle: „Especially the presence of mobile capital can induce governments to attract capital from elsewhere by lowering environmental standards on the one hand. Rising capital outflows force governments in high-income countries to begin to lower the level of regulation.“ (Wheeler 2000: 2). Bislang findet sich in der Umweltpolitik nur wenig Evidenz für eine Abwärtsspirale, sondern eher für eine Regulierung auf dem Niveau von Vorreiterstaaten (Holzinger 1994; Vogel 1997; Jänicke 1998; van Beers und van der Bergh 1999; Holzinger und Sommerer 2011). Im Gegensatz zu einer Regulierung von Prozessstandards, bei denen immer eine Verlagerung des Produktionsprozesses in ein anderes Land droht, kann Wettbewerb bei Produktstandards sogar zu einer Verschärfung führen (Scharpf 1996; 1997; Holzinger 2007). Ein 27
Zu den ökonomischen Grundlagen dieser Theorien siehe Thiebout 1956; Oates und Schwab 1988; van Long und Siebert 1991; Sinn 1994; 1996.
2.4 Alternative Erklärungen von Policy-Wandel
75
Beispiel für einen solchen Aufwärtswettlauf ist die Übernahme der ambitionierten kalifornischen Grenzwerte zur Regulierung von Autoabgasen in anderen amerikanischen Bundesstaaten (Vogel 1995). Für regulativen Wettbewerb besteht eine starke Nähe zum Lernen von ökonomischen Konkurrenten. In beiden Fällen orientiert sich eine Regierung an der Aktivität von Wettbewerbern. Eine Möglichkeit zur Lösung dieses analytischen Problems liegt darin, Wettbewerb gar nicht von Lernen abzugrenzen (Simmons, Dobbin und Garrett 2006; Braun et al. 2007).28 Ein Unterschied wird jedoch dann sichtbar, wenn die theoretischen Vorhersagen über das Verlaufsmuster von Wandel berücksichtigt werden. Ganz allgemein wird für Wettbewerb und Policy-Lernen gleichermaßen Konvergenz erwartet (Hoberg 2001: 127; Drezner 2001; Simmons und Elkins 2004). Während Lernen jedoch nicht über eine einseitige Imitation hinausgehen sollte, kann im Wettbewerb nach einer Phase der Annäherung ein Anreiz entstehen, durch ein Abweichen von ähnlichen Politiken anderer Länder einen relativen Wettbewerbsvorteil zu erringen: „The structure of this type of interdependence is that of a prisoner’s dilemma: ‘cooperation might lead to regulatory policies that make all better off, but there is a constant temptation to adopt regulatory policies that improve one’s own standing” (Lazer 2001: 476; Braun und Gilardi 2006: 308). Eine Abwechslung von Konvergenz und Divergenz wäre die Folge. Die Hypothesen werden nach den erwarteten Konsequenzen von Wettbewerb differenziert. Die erste Hypothese bezieht sich auf die Richtung von Policy-Wandel, während sich die zweite auf Konvergenz und Divergenz bezieht. Hypothese VIa: Je stärker ein Land ökonomischer Konkurrenz ausgesetzt ist, desto größer ist die Wahrscheinlichkeit für Wandel, der im Fall von Produktstandards zu einem „race to the bottom“, im Fall von prozess-orientierter Regulierung jedoch zu einem „race to the bottom“ führen kann. Hypothese VIb: Je stärker ein Land ökonomischer Konkurrenz ausgesetzt ist, desto größer ist die Wahrscheinlichkeit, dass es ein Modell eines Wettbewerbers übernimmt oder sich ihm annähert, und nach einer Zeit der Annäherung wieder davon abweicht.
28
Von Lernen und Diffusion unterschieden werden Wettbewerbseinflüsse z.B. bei Kobrin und Xun (2005) oder Kemmerling und Bruttel (2006: 98).
76
2 Theorien und Konzepte des Lernens
2.4.3 Nationale Institutionen: Vetospieler, Pfadabhängigkeit und administrative Kapazitäten Die drei Faktoren, die Wandel einer Politik durch internationale Einflüsse erklären, werden durch einen vierten ergänzt, der die Rolle des nationalen politischen Systems in den Vordergrund rückt. Dazu werden aus der Literatur drei unterschiedliche Ansätze zusammengefasst, von denen zwei den negativen Einfluss von Institutionen als Hürden für Wandel erfassen, während sich ein dritter Aspekt auf die administrative Kapazität einer Regierung und deren positive Auswirkungen auf die Innovationsfähigkeit bezieht. In Theorien internationaler Beziehungen stellt Macht häufig das Gegenmodell zu Lernen dar (Deutsch 1963; Crescenzi 2007). Dies gilt auch für die nationale Ebene, wo Lernimpulse aus anderen Ländern durch interne Machtverhältnisse gefiltert oder aufgehalten werden können. Die Vetospielertheorie ist ein Ansatz, der Macht als Verhinderungsmacht innerhalb des politischen Systems operationalisiert. Diese Theorie geht in ihrer formalen Modellierung auf Tsebelis (1995, 1999, 2000, 2002) zurück. Sie besagt, dass bestimmte Eigenschaften institutioneller Akteure, die der Veränderung einer Politik zustimmen müssen, die Wahrscheinlichkeit von Wandel negativ beeinflussen. Vetospieler können nach der Herkunft ihrer Vetomacht in institutionelle und parteipolitische Akteure unterteilt werden. Institutionelle Vetospieler sind beispielsweise Parlamente oder Parlamentskammern. Parteipolitische Vetospieler hingegen sind an der Regierung beteiligte Parteien (Tsebelis 2002: 19ff). Die Wahrscheinlichkeit für Policy-Wandel wird durch drei Charakteristika der Vetospieler beeinflusst: durch ihre Anzahl, ihre Kongruenz (ideologische bzw. Policy-spezifische Präferenzdistanz) sowie die interne Homogenität der ideologischen bzw. Policy-spezifischen Positionen (Tsebelis 1995: 293ff; 2002: 2). Während die Zahl der institutionellen Vetospieler als weitgehend konstant gelten kann, hängt die Anzahl der parteipolitischen Vetospieler von der jeweiligen politischen Konstellation ab. Stabilität und Veränderung einer Regierung können sich auf die Wahrscheinlichkeit von Wandel auswirken (Trueman 1971; Heclo 1974; Castles 1982; Schmidt 1996, 2000; Wison 2000: 264; Polillo und Guillen 2005: 1786). Ändert sich die Zusammensetzung durch Wahlen oder Koalitionswechsel, so wird davon eine Änderung der Politik erwartet, vor allem dann, wenn die ideologische oder Policy-spezifische Distanz zwischen Vorgänger- und Nachfolgeregierung groß ist (Tsebelis 1999).29
29
Alternativ dazu steht die Vermutung, dass Policy-Wandel mit der Amtsdauer einer Regierung wahrscheinlicher wird, da größere Politikveränderungen erst nach einer gewissen Konsolidierungsphase angegangen werden.
2.4 Alternative Erklärungen von Policy-Wandel
77
Die Vetospielertheorie wurde in einer Vielzahl empirischer Untersuchungen getestet. Beiträge liegen zu unterschiedlichen Bereichen der Staatstätigkeit vor, etwa zur Steuerpolitik (Hallerberg und Basinger 1998) oder der Wirtschafts- und Sozialpolitik (Crepaz und Moser 2004; Kastner und Rector 2003; Merkel 2003; Tsebelis 1999; Zohlnhöfer 2001). Für den Bereich der Umweltpolitik gibt es bislang jedoch kaum Anwendungen. Gleiches gilt für eine Integration dieser Theorie in die Analyse von Diffusions- und Lernprozessen (siehe aber Brooks 2005). Pfadabhängigkeit bezeichnet ein zweites Konzept zum Einfluss nationaler Institutionen, das ebenfalls auf potentielle Hindernisse für Policy-Wandel abzielt (Kemmerling 2007: 165; Pierson 1996; Esping-Andersen 1990; David 1985). Das Konzept basiert auf der Annahme, dass sozio-kulturelle und politökonomische Faktoren sowie einmalige historische Konstellationen unterschiedliche Institutionen hervorgebracht haben. Diese Institutionen sind stabil und erzeugen mit der Zeit eine eigene Unterstützerklientel (Pierson 1996). Pfadabhängigkeit bedeutet, dass Institutionen Hürden für ihre eigene Abschaffung kreieren und dadurch eine Kontinuität eines einmal eingeschlagenen Regulierungspfades garantieren (Pierson 2004). Dies gilt nicht nur für das Fortbestehen einer Organisation, sondern auch für ihren regulativen Output. Der kausale Mechanismus von Pfadabhängigkeit wird in unterschiedlicher Weise modelliert (vgl. Kemmerling und Bruttel 2006: 98). Die Ursache für Kontinuität kann in „increasing returns“ liegen, die eine wachsende Verbreitung bestimmter Technologien, Innovationen oder Regulierungen mit sich bringen. Eine andere Möglichkeit liegt in einer zumindest wahrgenommenen Irreversibilität vorangegangener Entscheidungen durch so genannte „sunk costs“ oder im Glauben an die Legitimität bestehender Arrangements (Beyer 2005: 18). Durch Pfadabhängigkeit bleibt die Politikgestaltung im „normalen“ Modus von Routineabläufen und kann nicht in einen „Lern-Modus“ wechseln (Rose 1991; Braun und Gilardi 2006). Während einige empirische Untersuchungen zum Einfluss von Pfadabhängigkeit vorliegen, ist es schwierig, daraus generalisierende Annahmen abzuleiten, da das Konzept stark auf die komplexe Darstellung singulärer Konstellationen bezogen ist. Nationale Institutionen müssen nicht nur ein Hindernis für Wandel darstellen. Sie können ihn auch fördern, wenngleich dieser Aspekt in der theoretischen Debatte bislang nur eine untergeordnete Rolle spielt. Große administrative und finanzielle Ressourcen ermöglichen einer Regierung die Entwicklung neuer Konzepte und innovativer Steuerungsinstrumente (Heclo 1974: 284ff). Eigenständige Institutionen, wie ein Ministerium, bringen nicht nur eine eigene Unterstützerklientel hervor, sondern sorgen auch für stetigen regulativen Output. Entsprechend zu Niskanens' Modell des Budgetmaximierers wird angenommen,
78
2 Theorien und Konzepte des Lernens
dass Akteure der Ministerialbürokratie dadurch ihre Kompetenzen und ihre Ressourcen rechtfertigen und nach größerem Einfluss streben (Niskanen 1968; Wintrobe 1997: 433). Administrative Kapazität spielt in der Analyse von Pionierverhalten in der Umweltpolitik eine größere Rolle (Jänicke 2007: 131ff, 2005: 130f; Weidner 2002; Jänicke und Weidner 1995). Zu den Bedingungen für den Status als umweltpolitischer Vorreiter zählt Jänicke (2007: 130) die Existenz einer grünen Advocacy-Koalition im Sinne von Sabatier und Jankins-Smith (1999) und eine geeignete institutionelle und informationelle Opportunitätsstruktur.30 Wie bei Pfadabhängigkeit wird die Rolle administrativer Kapazität zur Politikentwicklung meist nur für eng begrenzte Konstellationen beschrieben (Weidner 2002). Die Vetospielertheorie und das Konzept der Pfadabhängigkeit stellen gegenwärtig die einzigen explizit auf die Erklärung von Policy-Wandel ausgerichteten Ansätze in der politikwissenschaftlichen Literatur dar. Im Gegensatz zu Harmonisierung, Wettbewerb und Lernen wird für ihre Wirkung jedoch nur allgemein eine erhöhte Wahrscheinlichkeit von Wandel erwartet, nicht aber eine genauer spezifizierte Form der Veränderung. Pfadabhängigkeit kann darüber hinaus dazu führen, dass ähnliche Regulierungen vorhandene Politiken ergänzen. Von administrativer Kapazität wird hingegen auch ein ganz bestimmter Typ von Policy-Wandel erwartet. Da sie die Innovationsfähigkeit einer Regierung beeinflusst, sollte im Ländervergleich sowohl Divergenz als auch eine Erhöhung des Regulierungsniveaus zu beobachten sein. Hypothese VIIa: Je geringer die Anzahl der institutionellen Vetospieler in einem Land ist, desto höher ist die Wahrscheinlichkeit, dass es seine Politik verändert. Hypothese VIIb: Wenn sich durch Wahlen und Regierungswechsel eine Veränderung der parteipolitischen Vetospieler in einem Land ergibt, steigt die Wahrscheinlichkeit, dass es seine Politik verändert. Hypothese VIIc: Je stärker regulative Pfadabhängigkeiten in einem Land sind, desto geringer ist die Wahrscheinlichkeit, dass es eine bestehende Politik verändert, und desto größer ist die Wahrscheinlichkeit, dass es neue Politiken einführt, die den bestehenden Politiken ähnlich sind. Hypothese VIId: Je stärker die administrativen Kapazitäten eines Landes für einen bestimmten Politikbereich sind, desto größer ist die Wahrscheinlichkeit, dass es 30
Jänicke weist mit dem „advocacy coalition“-Ansatz auf eine weitere Bezugsquelle dieses Erklärungsfaktors hin und zeigt damit einen Anknüpfungspunkt zu anderen Lerntheorien auf. Eine weitere Quelle für die Vermutung des Einflusses staatlicher Ressourcen auf die generelle Entwicklungsfähigkeit und Innovationskraft findet sich in der Literatur zu staatszentrierten Ansätzen rund um das Werk „Bringing the State Back In“ (Skocpol 1985; vgl. Wilson 2000).
2.4 Alternative Erklärungen von Policy-Wandel
79
seine Politik verändert, Innovationen hervorbringt und sich dadurch von anderen Ländern absetzt.
2.4.4 Problemdruck und politische Nachfrage Eine letzte Kategorie von Erklärungsfaktoren, die in der theoretischen Debatte eine untergeordnete, bei der empirischen Erklärung von Policy-Wandel jedoch eine wichtige Rolle spielt, hängt mit der Wirkung von Problemdruck zusammen. Bestimmte Probleme können die Veränderung einer Politik unmittelbar hervorrufen. Als einer der wenigen Autoren, die sich konzeptuell mit diesem Mechanismus beschäftigen, unterscheidet Jones (1994) drei Arten des Problemdrucks als Faktoren des Wandels. Erstens kann es vorkommen, dass politische Entscheidungsträger auf einzelne, plötzlich auftretende Ereignisse reagieren müssen („event driven change“; Jones 1994; vgl. Wison 2000: 250). Dazu zählen alle möglichen Spielarten kleinerer und größerer Krisen: Kriege und Skandale, aber auch Entdeckungen oder Naturkatastrophen (Simmons und Elkins 2004: 180; Wison 2000: 260f). Konkrete Beispiele finden sich in der Bedeutung von Tschernobyl für die Umweltpolitik, von 9/11 für die Justizpolitik und der Bankenkrise für die Regulierung der Finanzmärkte. In der Diffusionsliteratur werden solche Ereignisse als Periodeneffekte (True und Mintrom 2001) oder globale Effekte (Brinks und Coppedge 2006) diskutiert. Zweitens kann sich nicht nur ein einzelnes Ereignis, sondern auch ein längerer Prozess auf politische Reformen auswirken („process driven change“; Jones 1994). Beispiele dafür sind Prozesse wie der Klimawandel oder die Änderung der Alterspyramide und ihre Wirkung auf die Rentenpolitik. Wie eine plötzliche Krise kann auch ein längerfristiger Prozess ein bestehendes PolicyRegime schwächen und als Katalysator neuen Lösungen einen Weg öffnen (Wison 2000: 260f). Die dritte Einflussmöglichkeit beschreibt eine indirekte Wirkung von Problemdruck. Drängende Probleme mobilisieren gesellschaftliche Interessengruppen, die dann wiederum neue Themen auf die Agenda setzen, um den politischen Prozess zu beeinflussen. Im Falle dieses „representational change“ (Jones 1994) ist es unwichtig, ob sich Probleme tatsächlich verschärfen, oder ob sich lediglich ihre öffentliche Wahrnehmung verändert. Ereignisse oder Prozesse fungieren dann als Auslöser, der die Aufmerksamkeit auf ein neues Thema lenkt und es politischen Entrepreneuren erlaubt, Mehrheiten für eine Reform zu organisieren:
80
2 Theorien und Konzepte des Lernens „This process [of change, der Autor] entails some sort of trigger event - a catastrophic accident, a depression, a war, etc. - which raises the visibility of an issue, precipitates public awareness of a situation, or dramatizes a problem. Policy initiators exploit this event and define the situation as a problem requiring government action. Policy entrepreneurs shepherd the proposed policy solutions through government and bring about the abrupt change.“ (Wison 2000: 248; siehe Heclo 1974; Cobb und Elder 1983; Baumgartner und Jones 1993).
Die Wirkung von Problemdruck variiert stark mit dem jeweiligen Politikfeld. Mit Blick auf die folgende empirische Analyse werden vorzugsweise Beispiele aus der Literatur zur Umweltpolitik angeführt. Wachsende Umweltverschmutzung und die Entwicklung des Wohlfahrtsniveaus werden im Sinne von „process driven change“ als Auslöser für eine steigende gesellschaftliche Nachfrage nach Umweltpolitik angesehen (Binder 1996; Jänicke 1990; Jänicke und Mönch 1988; Jänicke und Weidner 1995; Jänicke et al. 1996; Kern und Bratzel 1996; Scruggs 1999, 2003; Weidner 2002). Vor allem die parlamentarische Repräsentation und die Regierungsbeteiligung grüner Parteien wurden mit umweltpolitischer Veränderung in Zusammenhang gebracht (King und Borchardt 1994; Jahn 2000; Neumayer 2003). Grünen Parteien wird zugeschrieben, umweltpolitische Themen auf die politische Agenda zu setzen und Impulse für Innovationen zu geben (Boehmer-Christiansen und Skea 1991; Kern und Bratzel 1996; Reich 1984; Schreurs 2002). Als eine weitere Ursache von Wandel wird der Bedeutungszuwachs von Umweltgruppen und der gesellschaftlichen Mobilisierung der Umweltthematik gehandelt (Jänicke 1990; Inglhart 1995, 1997; Jahn 1998, 2000; Daugbjerg und Pedersen 2004; Binder und Neumayer 2005, Fredriksson et al. 2005; Pedersen 2005). Im Idealfall tritt Wandel als Folge von Problemen wie Umweltverschmutzung, Seuchen oder Finanzkrisen in mehreren Staaten zeitgleich auf (Kemmerling 2007: 166). Paralleler Problemdruck führt zu unabhängigen, aber identischen Antworten und damit zu Konvergenz (Hoberg 2001: 127; Brooks 2005; Holzinger und Knill 2005). Was dann auf der Makro-Ebene des Ländervergleichs wie abgestimmtes Verhalten aussieht, steht nur scheinbar in kausalem Zusammenhang und geht in Wirklichkeit auf den in Abschnitt 2.3.2 beschriebenen Regenschirmeffekt zurück. Beispiele finden sich in der Diffusionsliteratur zu Frauenrechten (Ramirez, Soysal und Shanahan 1997), dem marktwirtschaftlichen Modell (Fourcade-Gourinchas und Babb 2002: 533) oder der Abschaffung der Sklaverei (Finnemore und Sikkink 1998: 895).31
31
Ebenso wie für Lernen kann jedoch auch die Wirksamkeit von Problemdruck keinen alleinigen Erklärungsanspruch geltend machen, wie das Regenschirmbeispiel selbst deutlich macht. Die sozialpsychologische Forschung hat hinreichend nachgewiesen, dass es immer Menschen
2.5 Zusammenfassung
81
Problematisch wird die Abgrenzung zu auf lernen zurückgehenden PolicyWandel, wenn Differenzen in der Verarbeitungskapazität oder der internen Durchsetzungsfähigkeit bestehen. In diesen Fällen findet die Änderung nicht synchron, sondern zeitlich verzögert statt, so dass der Forscher leicht einem Trugschluss aufsitzen könnte: „The analyst of policy convergence must avoid the pitfall of inferring from transnational similarity of public policy that a transnational explanation must be at work“ (Bennett 1991: 231). Eine Unterscheidung ist jedoch möglich, wenn sich die Änderung auf eine genau spezifizierte Policy, wie einen Grenzwert oder einen Steuersatz, bezieht. Kann die Imitation eines detaillierten Politikstandards beobachtet werden, ist es wegen der Vielzahl der Wahlmöglichkeiten, die sich bei einer metrischen Skala nicht mehr plausibel, von einer unabhängigen Entscheidung und „taken for granted“Lösung auszugehen. Im Folgenden werden zwei Hypothesen formuliert, die sich danach unterscheiden, ob Problemdruck unmittelbar oder indirekt auf Policy-Wandel einwirkt. Identische Antworten auf ein parallel auftretendes Problem werden nicht erwartet, wenn der Problemdruck über Interessengruppen vermittelt wird, da deren Einfluss zwischen den Ländern variieren kann. Die Möglichkeit einer zeitlich verzögerten Wirkung wird hier nicht weiter spezifiziert. Hypothese VIIIa: Je stärker der durch langfristige Prozesse oder spontan auftretende Krisen verursachte Problemdruck in einem Land ist, desto höher ist die Wahrscheinlichkeit, dass es seine Politik verändert und bei grenzüberschreitenden Problemen ohne jegliche Abstimmung die gleichen Lösungen anwendet wie andere betroffenen Länder. Hypothese VIIIb: Je stärker die Nachfrage nach einer Politik, die durch die Änderung der Problemlage oder ihrer Wahrnehmung entsteht, in einem Land ist, desto höher ist die Wahrscheinlichkeit, dass es seine Politik verändert.
2.5 Zusammenfassung Auf der Basis eines Literaturüberblicks zu verschiedenen Forschungstraditionen, die sich mit Lernen in der Politik beschäftigen, und einer umfassenden Begriffsdefinition wurde in diesem Kapitel ein dreistufiger Analyserahmen vorgestellt. Dieser bildet die theoretische Grundlage für einen vergleichenden Test unterschiedlicher Mechanismen des Policy-Lernens. Auf der Meso-Ebene wurgeben wird, die nur auf die Regenschirmträger, nicht aber auf die Bewölkung am Himmel achten (Granovetter 1978).
82
2 Theorien und Konzepte des Lernens
den für vier Kategorien von Orientierungspunkten Hypothesen formuliert, da sie im Gegensatz zu den sieben Anreizfaktoren auf der Mikro-Ebene in einem quantitativen Design untersucht werden können.32 Die dritte Ebene des theoretischen Rahmens, die sich mit unterschiedlichen Formen des Policy-Wandels als Konsequenz von Lernprozessen beschäftigt, wird ebenfalls in die nachfolgende empirische Analyse integriert. Die Unterscheidung der drei Ebenen ist von großer Bedeutung, weil sie hilft, die Vielfalt von Konzepten, Begriffen und Theorien zu entwirren und neu zu strukturieren. Dadurch schafft der Analyserahmen die Voraussetzung für die präzise Operationalisierung von Lernmechanismen als unabhängigen Variablen. Das Zusammenwirken der Analyseebenen bildet den eigentlichen Mechanismus des Policy-Lernens. Policy-Lernen tritt dann auf, wenn die Notwendigkeit des Lernens und die Verfügbarkeit eines Modells gegeben ist und sich daraus eine beobachtbare Verhaltensänderung ergibt. Damit Lernen stattfindet, muss zuerst die Notwendigkeit bestehen, die normale Routine des Politikgestaltungs-prozesses zu unterbrechen (Rose 1991). Die Anreize dazu können ökonomisch, idealistisch und strategisch sein oder von außerhalb des Kreises lernender Akteure stammen. Modelllernen kann erklärtermaßen nur dann stattfinden, wenn ein Modell verfügbar ist. Eine Policy muss dazu nicht nur von mindestens einem Land angewendet werden. Dieses Land muss zudem über eine Eigenschaft verfügen, die es zum Modellland und Orientierungspunkt für andere Regierungen macht. Schließlich führt Lernen zu bestimmten Formen von Policy-Wandel. Es wird erwartet, dass als Folge eines Lernprozesses Konvergenz auftreten, wobei das Ausmaß der Annäherung und die Richtung der Veränderung je nach Lernmechanismus variieren können. Das Verhältnis von Motivation und Orientierungspunkten ist nicht banal, auch wenn beide Elemente in der Literatur oft nicht getrennt voneinander behandelt werden. Abbildung 3 fasst die Zuordnung der Elemente der Mikro- und Meso-Ebene nochmals zusammen. Die Zahl der Querverbindungen, die keine simple Struktur der Zusammenhänge erkennen lassen, verdeutlicht auf den ersten Blick, dass einzelne Orientierungspunkte nicht mit einem bestimmten Motiv gleichgesetzt werden sollten. Für alle Anreizfaktoren und Orientierungspunkte gilt, dass sie innerhalb ein und desselben Lernprozesses separat oder kumuliert auftreten können. Informationsdefizite und Unsicherheit hinsichtlich der Effektivität von Handlungsalternativen spielen als Auslöser bei fast jedem Prozess des Lernens eine Rolle.
32
Der Analyserahmen ist auch für qualitative Forschung interessant. Während die Orientierungspunkte für einen quantitativen Test von größerer Bedeutung sind, können die Motive des Lernens besser mit qualitativen Methoden untersucht werden.
2.5 Zusammenfassung Abbildung 3:
83
Motive und Orientierungspunkte des Policy-Lernens
Unzufriedenheit als Lernanreiz wird bevorzugt mit erfolgsorientiertem Lernen in Zusammenhang gebracht. Es darf aber nicht vergessen werden, dass eine geeignete Lösung von Ländern in einer ähnlichen Problemsituation ebenfalls zu einer größeren Zufriedenheit führen könnte. Herdenverhalten kann indes kaum durch Unzufriedenheit angeregt werden. Reputations- und Konformitätsstreben als extrinsische Motive liegen nicht nur bei einer Orientierung an Erfolg und scheinbarem Erfolg vor. Sie können aus dem Wunsch nach Anpassung oder einer guten Wettbewerbsposition heraus auch zu Lernen in Netzwerken, von Peer-Ländern oder von einer Herde führen. Mit den externen Faktoren der Lernmotivation verhält es sich ähnlich. Ein attraktives oder viel beworbenes Politikmodell dient als Orientierungspunkt für Erfolg. Solche Modelle haben erhöhte Chancen, von Nachbarstaaten bemerkt zu werden, eine Diffusionselle loszutreten und in internationalen Organisationen auf die Agenda gesetzt zu werden. Bei „policy promotion“ gilt analog, dass auch sie zum Lernen von Konkurrenten oder Nachbarn führen kann. Funktionale Interdependenzen hingegen motivieren hauptsächlich das Lernen in internationalen Institutionen und unter Nachbarländern. In diesem Analyserahmen werden vorhandene Konzepte neu strukturiert, bislang vernachlässigte Ansätze integriert und eine große Bandbreite unter-
84
2 Theorien und Konzepte des Lernens
schiedlicher Lerntheorien vergleichbar gemacht. Eine Weiterentwicklung und Formalisierung zu einer einheitlichen Theorie, wie sie etwa bei Volden, Ting und Carpenter (2008) versucht wurde, ist damit keineswegs ausgeschlossen. Auch eine Integration in ein allgemeines Modell zur Erklärung von PolicyWandel, wie zum Beispiel bei Braun und Gilardi (2006; vgl. Braun et al. 2007; Kemmerling 2007), hätte den Vorteil, dass die Analyse von Policy-Lernen in direkten Bezug zur Analyse politischer Reformen im Allgemeinen gesetzt werden könnte. Wie die Abgrenzungsschwierigkeiten in der Definition des Lernbegriffs und die Beschreibung alternativer Erklärungsfaktoren in Abschnitt 2.4 verdeutlicht haben, stellt ein Vergleich von Lerneffekten mit den Einflüssen von Harmonisierung, Wettbewerb, Beharrungskräften nationaler Institutionen oder Problemdruck eine wichtige Ergänzung der systematischen Analyse von PolicyLernen dar.
3 Forschungsdesign, Daten und Methoden einer Analyse von Policy-Lernen 3
Forschungsdesign, Daten und Methoden
Die politikwissenschaftliche Literatur zu Lerntheorien zeigt ein nur geringes Maß an Kohärenz, obwohl - oder gerade weil - die Zahl der Beiträge in den letzten Jahren stark angestiegen ist. Daher überrascht es nicht, dass in der Vielfalt der Forschungstraditionen auch unterschiedliche Wege zur empirischen Analyse von Lernprozessen in der Politik beschritten werden. In diesem Kapitel soll als Ergänzung des theoretischen Literaturüberblicks im zweiten Kapitel der gegenwärtige Stand der Analysemethoden und Forschungsdesigns in der Literatur skizziert werden (Abschnitt 3.1). Neben quantitativen Designs der Analyse von Policy-Lernen werden auch qualitative und experimentelle Forschungsdesigns erörtert. Eine Diskussion der gesamten Bandbreite verfügbarer Methoden stellt eine idealtypische Ausgangssituation der Methodenwahl dar. Sie ist dabei jedoch nicht unvoreingenommen, sondern geht aus pragmatischen Gründen, die dem Erkenntnisinteresse dieser Arbeit geschuldet sind, von der Präferenz für eine quantitative Analyse aus. Auf der Basis der Schlussfolgerungen der Literaturübersicht und den in der Einleitung formulierten Forschungsfragen werden in Abschnitt 3.2 die Grundzüge eines eigenständigen Forschungsdesigns zum Vergleich unterschiedlicher Lernmechanismen vorgestellt. Es basiert auf einer statistischen Analyse der Veränderung nationaler Umweltpolitiken in 24 Ländern, in der die Breite und der Umfang des Datensatzes, die dyadische Datenstruktur, die Verbindung verschiedener Analysetechniken und die Integration neuer Lernvariablen die wesentlichen und innovativen Elemente darstellen. Die Berücksichtigung alternativer Untersuchungsmethoden und die ausführliche Darstellung des Designs ist aus zweierlei Gründen notwendig und sinnvoll. Zum einen sehen sich quantitative Ansätze der Analyse von PolicyLernen häufiger und fundamentaler Kritik ausgesetzt. Zum anderen wird die Wirksamkeit von Lernen oft mehr behauptet, als dass sie operationalisiert und getestet wird, was nicht zuletzt an der alltagssprachlichen Verwendung und der Unschärfe des wissenschaftlichen Begriffs liegt. Der Beitrag dieser Arbeit besteht also auch darin, die systematische Analyse des Effekts von Lernprozessen auf Policy-Wandel voranzutreiben.
T. Sommerer, Können Staaten voneinander lernen?, DOI 10.1007/ 978-3-531-92625-4_3, © VS Verlag für Sozialwissenschaften | Springer Fachmedien Wiesbaden GmbH 2011
86
3 Forschungsdesign, Daten und Methoden
Im dritten Teil dieses Kapitels folgt die detaillierte Darstellung eines neuartigen Datensatzes zur Umweltpolitik, des Prozesses der Datenerhebung und der Operationalisierung von Policy-Wandel als abhängiger Variable (Abschnitt 3.3). In Abschnitt 3.4 werden schließlich die unabhängigen Variablen für den Test von Lern- und Kontrollmechanismen eingeführt. Für die insgesamt zwanzig unabhängigen Variablen werden die allgemeinen Hypothesen aus dem vorigen Kapitel für die empirische Analyse weiter spezifiziert.
3.1 Methoden der Analyse von Policy-Lernen: ein Literaturüberblick Die Methodenwahl in der vergleichenden empirischen Analyse jeglicher sozialer Einheiten bedeutet in der Praxis zuallererst die grundlegende Entscheidung bezüglich einer Präferenz für qualitative oder quantitative Analysemethoden (Lieberman 2005: 436; Ganghof 2005; Laitin 1995). In jüngster Zeit sind dabei nach langen Jahren der wechselseitigen Missachtung integrative Tendenzen im Sinne eines Methodenmixes aus beiden Bereichen zu beobachten (Tarrow 1995; Behrens 2003: 204; Lieberman 2005; Heichel und Sommerer 2009). Berücksichtigt man auch die interdisziplinäre Literatur zum Forschungsgegenstand des Lernens, kommt ein dritter Ansatz hinzu, der in der Politikwissenschaft vernachlässigt wird: das experimentelle Design. Auch wenn die politikwissenschaftliche Anwendung dieses erkenntnistheoretischen Basismodells oft nicht umsetzbar erscheint, können doch alle anderen Formen des Designs dahingehend beurteilt werden, inwiefern sie einer experimentellen Versuchsanordnung entsprechen (Behnke, Baur und Behnke 2006: 39). Die folgenden Abschnitte knüpfen an den theoretischen Literaturüberblick an und erörtern die Vorzüge und Nachteile der Anwendung dieser Methoden auf den Test von Lerntheorien.
3.1.1 Experimentelles Design und Simulation Empirische Forschung auf der Basis von Experimenten ist in der vergleichenden Politikwissenschaft ein Ausnahmefall, während sie etwa in der sozialpsychologischen, anthropologischen und ökonomischen Grundlagenforschung zu Lerntheorien eine wesentliche Rolle spielt. Mit den Experimenten wie denen von Festinger (1954), Asch (1955), Bandura und Walters (1963) wurden in der Psychologie lerntheoretische Grundlagen modelliert und getestet. Bandura und Walters (1963) wiesen in ihrer „bobo doll“-Studie zur Theorie des Modelllernens die Imitation aggressiven Verhaltens anhand von Experimenten mit Kindern nach. In der Anthropologie untersuchten McElreath et al. (2005) soziales
3.1 Methoden der Analyse von Policy-Lernen: ein Literaturüberblick
87
Lernen anhand von so genannten „microsociety“-Experimenten, bei denen in einer Sequenz von drei Experimenten individuelles Lernen von sozialem Lernen durch das Vorbild einer Bezugsgruppe unterschieden wurde (McElreath et al. 2005: 487ff; Baum et al. 2004). Auch in der ökonomischen Kaskadenliteratur gibt es einige Beispiele für die experimentelle Analyse von Beobachtungslernen (Anderson und Holt 1997; Celen und Kariv 2004). Für Experimente zu sozialem Lernen wird häufig das Argument ins Feld geführt, dass nur so die simultane Wirkung externer Faktoren auf alle Akteure zu kontrollieren sei (Hirshleifer und Teoh 2003: 31; Sacerdote 2001). Auch in der ökonomischen Entscheidungstheorie spielen Experimente bei der Erforschung individuellen Lernens eine wichtige Rolle, wie etwa die Auktionsexperimente der „learning direction theory“ von Selten, Abbink und Cox (2005) zeigen.33 Für Politikwissenschaftler haben solche auf die Erforschung individuellen Verhaltens ausgerichteten Ansätze oft nur geringe Anziehungskraft. Dies gilt auch für die Lernliteratur – mit Ausnahme des Bereichs der Evaluationsforschung. Dort wird mit quasi-experimentellen oder experimentellen Designs des Vorher/Nachher-Vergleichs operiert (Bogumil und Jann 2005; Bussmann et al. 1997: 204ff; Martin und Sanderson 1999). So genannte „policy experiments“ beschreiben institutionelle Innovationen wie eine neue Verfassung oder ein neues Wahlsystem (Druckman et al. 2006). Diese Experimente spielen in der politischen Beratung und Prozessbegleitung eine Rolle, selten aber in wissenschaftlichen Beiträgen. Zum Bereich der experimentellen Forschung zählt aber nicht nur die Durchführung von empirischen Analysen, sondern auch von computerbasierten Simulationen (Druckman et al. 2006).34 In der Politikwissenschaft sind Simulationen schon seit den sechziger Jahren bekannt, zu den bekanntesten Beiträgen zählt Schellings „Micromotives and Macrobehavior“ (1978). Sie konnten sich jedoch nicht als gleichwertige Methoden etablieren, wenngleich in den letzten Jahren ein Bedeutungszuwachs zu erkennen ist (Johnson 1999; Cederman 2001). Simulationen sind besonders dann von Interesse, wenn empirische Experimente unmöglich und teuer sind oder durch die Interaktion des Beobachters mit dem zu untersuchenden System kompliziert werden (Meier et al. 1969: 2). 33
34
Auf den Begriff des Experimentierens stößt man auch in der ökonomischen Literatur zu „optimal experimentation“, wobei sich das Experiment nur in der Modellsprache des Erfahrungslernens wiederfindet, nicht aber als Analyse-methode: „The optimizing policymaker experiments with a tighter monetary policy in order to find out whether the pessimistic belief regarding the relationship between policy and information is correct.“ (Wieland 2000: 219). Auf erkenntnistheoretischer Ebene besteht ein Unterschied zwischen Experiment und Simulation: letztere stellt die Beschreibung möglicher Welten, nicht die Welt der Erfahrungswirklichkeit dar (Popper 1989; Weber 2007: 122).
88
3 Forschungsdesign, Daten und Methoden
In der Anthropologie und der Evolutionsbiologie ist „evolutionary simulation“ ein weit verbreitetes Analyseinstrument für soziales Lernen (Henrich und Boyd 1998). Kameda und Nakanishi (2002: 375ff) setzen eine Simulation ein, um die Logik eines „free rider“-Problems im Modell sozialen Lernens zu zeigen. Eine weitere, schon erwähnte Anwendung gibt es im Bereich der Diffusionsliteratur, wo Hedström (1994: 1164f) seiner empirischen Analyse der schwedischen Gewerkschaftsbewegung eine Simulation voranstellt, in der ein Einfluss von räumlicher Distanz und Ansteckungseffekten auf das Beitrittsverhalten modelliert wurde (vgl. Hedström et al. 2000). Auch Strang und Macy (2001) benutzen Simulationen, um Kaskaden der Imitation wertloser Innovationen unter konkurrierenden Unternehmen zu erzeugen. Schließlich sind auch so genannte Gedankenexperimente mit der Simulation verwandt. Dieses wenig formgebundene Verfahren der kontrafaktischen Analyse eines „Was wäre wenn?“ spielt im Gegensatz zur Simulation in der politikwissenschaftlichen Literatur eine größere Rolle (Axelrod 1997; Tetlock und Lebow 2001) – für die Lernliteratur vor allem im Bereich der historischen Analogien und „lessons from the past“, wo einzelne Entscheidungsprozesse politischer Persönlichkeiten kaum in einem Laborexperiment nachgestellt werden können (Khong 1992; Brandström et al. 2004). Dagegen sprich allerdings, dass es in der Analyse sozialer Netzwerke schwierig bis unmöglich ist, die Rahmenbedingungen in einem Gedankenexperiment konstant zu halten (Jervis 1993). Mit einem experimentellen Design können kausale Mechanismen explizit gemacht und sorgfältig auf Umwelteinflüsse kontrolliert werden (McDermott 2002: 38f). Dass die Zahl der Experimente und Simulationen in der politikwissenschaftlichen Auseinandersetzung mit Lerntheorien gering ist, liegt unter anderem daran, dass diese Methoden häufig als nicht geeignet für eine Anwendung auf komplexe und hochspezifische politische Prozesse betrachtet werden. McDermott (2002: 39) zählt die bedeutendsten Kritikpunkte an Experimenten auf: den Bezug auf ein künstliches Umfeld, in dem die gewünschte Situation nicht erzeugt werden kann, aber auch eine nicht repräsentative Auswahl der Probanden und das Problem der externen Validität. Dabei wird angezweifelt, ob Experimente etwas über tatsächliche politische Entscheidungen aussagen können, da diese nicht die einzigartige geschichtliche Situation oder zukünftige Kooperationsabsichten erfassen können. Schließlich gibt es noch einen nicht unerheblichen Grund, der gegen eine verstärkte Anwendung von Experimenten und Simulationen spricht. Diese werden häufig in explorativen Analysen eingesetzt, da sie sich hervorragend dazu eignen, Hypothesen zu generieren. Wenn man aber den im zweiten Kapitel dargestellten Stand der Literatur betrachtet, ist dies nicht das dringlichste Problem
3.1 Methoden der Analyse von Policy-Lernen: ein Literaturüberblick
89
der Forschung zu Policy-Lernen. Vielmehr fehlt es an systematischer empirischer Evidenz, die durch Simulation nicht ersetzt werden kann.
3.1.2 Qualitative Methoden und „process tracing“ Im Gegensatz zu Experiment und Simulation sind qualitative Analysen in der Lernliteratur weit verbreitet und akzeptiert. Das liegt vor allem am Element des „process tracing“, der detaillierten Analyse einzelner politischer (Lern-) Prozesse (Eising 2002; Weyland 2004). Dabei werden Kommunikationsstrukturen und -inhalte rekonstruiert, um die Veränderung von Präferenzen zu erkennen und den Weg eines Policy-Modells zu verfolgen. Zum einen werden Regierungsdokumente daraufhin analysiert, ob Verweise auf Vorbilder existieren, zum anderen werden Interviews mit politischen Akteuren geführt, die deren Leitlinien bei einer Reformentscheidung offen legen sollen. „Process tracing“ ersetzt die experimentelle Kontrolle durch die möglichst lückenlose Verbindung einzelner Akteure und Handlungen. So können die Gründe einer Entscheidung offengelegt und die gesamte Dynamik eines Prozesses identifiziert werden (George und McKeown 1985, 34-41; Tarrow 1995; Brady und Collier 2004). Die Anwendung qualitativer Methoden findet sich von klassischen Arbeiten wie Heclo (1974) und Hall (1989) bis hin zu aktuellen Beiträgen. In einem Sammelband zu Lernen in der lateinamerikanischen Wirtschaftspolitik werden in mehreren Ländern ehemalige Policy-Maker zur Relevanz von Lernprozessen befragt (Weyland 2004). Eising (2002) wendet die Methode des „process tracing“ auf die Analyse inkrementeller Entscheidungsprozesse in der europäischen Energiepolitik an. Casey und Gold (2005) arbeiten mit Regierungsdokumenten zur EU-Arbeitsmarktpolitik und mit Interviews von Akteuren aus der Ministerialbürokratie, um feststellen zu können, inwiefern ein Lernprozess stattfand und was einen Politiktransfer geeignet erscheinen lässt. Dolowitz (1997) untersucht Lernprozesse bei „welfare to work“-Programmen in Großbritannien mit der Analyse von Medienberichten, wissenschaftlichen Artikeln, Konferenzen und Ministerreisen. Tavits (2003) vergleicht den Einfluss von ausländischen Vorbildern auf eine Rentenreform in Lettland und Estland ebenfalls mit qualitativen Methoden Wie diese Beispiele zeigen, sind qualitative Beiträge über beinahe alle Forschungstraditionen hinweg vertreten – von der Policy-Analyse und „lesson drawing“ bis zur Diffusions- und Konvergenzforschung. Besonders auffällig ist die hohe Anzahl an Fallstudien in der Transferforschung (vgl. auch Eyre und Lodge 2000; Greener 2002; Lavenex 2002; Pierson 2003). Schließlich sind auch in der Literatur zu historischen Analogien qualitative Methoden üblich, wobei auf In-
90
3 Forschungsdesign, Daten und Methoden
formationen aus der Biographie politischer Führer zurückgegriffen wird, wenn der zeitnahe Zugang zu Regierungsdokumenten im Bereich der Außen- und Sicherheitspolitik eingeschränkt ist (Gross Stein 1994; Harnisch 2000). Sucht man nach methodischen Besonderheiten der qualitativen Analyse von Policy-Lernen, so wird man kaum fündig. Bemerkenswert ist allein die Dominanz von Ein-Fall-Studien gegenüber vergleichenden Designs, sowie die auffällig häufige Bestätigung von Lerneffekten. Es gibt nur wenige Fälle, in denen vergeblich auf die Effektivität von Lernprozessen getestet wurde. Was die verwendeten Datenquellen angeht, so ist es hingegen wenig überraschend, dass angesichts der kognitiven Komponente des Lernens Interviews neben der Dokumenten- und Sekundäranalyse eine wichtige Rolle spielen. Nur selten sehen sich qualitative Forschungsansätze fundamentaler Kritik ausgesetzt. Da sie reale Prozesse beschreiben und Lernen im besten Fall auf die Verhaltensänderung einzelner Individuen zurückführen können, werden die Resultate meist als plausibel wahrgenommen. Dabei gibt es eine ganze Reihe von Schwachpunkten. Auf allgemeiner Ebene zählen dazu die ungenau spezifizierte Darstellung der angewandten Methoden (King, Keohane und Verba 1994) und die Verwendung von bekannten, jedoch nicht den „state of the art“ der modernen Politikwissenschaft darstellende Vorbilder wie etwa Hall (1989; vgl. Kemmerling und Bruttel 2006). Weitere Kritikpunkte beziehen sich auf die Generalisierbarkeit und Repräsentativität der Ergebnisse, das Erkennen von Gesetzmäßigkeiten und den mangelhaften Einschluss von Drittvariablen und strukturellen Größen (Tarrow 1995). Qualitative Analysen des Policy-Lernens stehen zudem vor einem Dilemma. Entweder untersuchen sie historische Fälle und können dabei nur auf selektive Daten zurückgreifen, oder sie beziehen sich auf aktuelle Fälle und Interviews mit beteiligten Akteuren (Bennett und Howlett 1992: 290). In beiden Fällen besteht die Gefahr einer mangelnden Differenzierung zwischen tatsächlichem Lernen und dem Einsatz von rhetorischen Elementen in Form von Analogien und Metaphern (Bennett und Howlett 1992: 282). Gravierender erscheint noch das Problem, Kausalität tatsächlich nachzuweisen. Das betrifft die eindeutige Unterscheidung von Lernen als unabhängiger und Policy-Wandel als abhängiger Variable, vor allem aber die Berücksichtigung alternativer Erklärungsfaktoren oder der etwaigen „spuriousness“ einer Entwicklung (Levy 1994; Bennett und Howlett 1992: 290; Jervis 1976: 234f). Wenn in einer Fallstudie der Zusammenhang von Wandel und spezifischen Kommunikationsprozessen nicht auf andere Faktoren kontrolliert wird, kann dies auch bei lückenlosem „process tracing“ nicht als hinreichender Nachweis für Lernen gelten. Nicht zuletzt wegen der Abgrenzungsprobleme in der Definition des Lernbegriffs (vgl. Ab-
3.1 Methoden der Analyse von Policy-Lernen: ein Literaturüberblick
91
schnitt 2.3) ist der Einschluss von Drittvariablen ein notwendiger Bestandteil der Analyse von Policy-Lernen. Verlässt sich der Forscher auf die Aussagen der von ihm befragten Akteure, muss eine weitere Verzerrungsmöglichkeit berücksichtigt werden. Lernen wird sowohl in der Alltagssprache als auch in der Politik als etwas normativ Wünschenswertes begriffen, so dass eigene Handlungen, die möglicherweise auf Druck und ohne Entscheidungsspielraum erfolgten, vom betreffenden Akteur im Nachhinein als Lernen gedeutet werden. Auch der Wissenschaftler kann in eine „Lernfalle“ tappen, wenn er (zu) viele Details eines politischen Reformprozesses kennt und mit entsprechenden Plausibilitätserwägungen auf Lernen schließt, ohne es hinreichend untermauert zu haben. Häufig liefern Autoren nur anekdotenhafte Evidenz, ohne systematisch den Einfluss anderer Faktoren als Maßstab heranzuziehen (Brückner et al. 2001; Frantz und Sato 2005).
3.1.3 Makro-quantitative Methoden Die dritte Alternative besteht in der Wahl quantitativer Forschungsmethoden. In der Analyse von Lernen meint dies vorwiegend makro-quantitative Ansätze auf der Basis statistischer Analyseverfahren für den Ländervergleich. Solche Verfahren ermöglichen die Einbeziehung einer größeren Fallzahl und damit das Erkennen von generalisierbaren Veränderungsmustern. Gleichzeitig können mehrere Variablen zur Kontrolle von Lernprozessen integriert werden. Die Anwendung quantitativer Methoden zwingt den Forscher stärker in das Korsett eines strukturierten Forschungsdesigns, in dem alle beteiligten Variablen und ihr Verhältnis untereinander spezifiziert werden müssen (King, Keohane und Verba 1994). Ein quantitatives Design erlaubt es dem Forscher, Vorhersagen treffen zu können, oft in Form eines numerischen Intervalls (Caporaso 1995). Auch empirische Arbeiten zu Policy-Lernen mit quantitativem Design finden sich für zahlreiche Politikfelder und Ländersamples. Im Gegensatz zu qualitativen Methoden sind sie jedoch weniger zahlreich und auf bestimmte Forschungstraditionen begrenzt. In der aktuellen Diffusionsliteratur haben statistische Analysen eine große Bedeutung (Meseguer und Gilardi 2005). Hier gibt es quantitative Forschungsdesigns besonders seit Anfang der neunziger Jahre, als Berry und Berry (1990) mit der Untersuchung der Diffusion von Lotteriesystemen in amerikanischen Bundesstaaten die „event history“-Analyse etablierten, eine Methode, die das Zeitintervall bis zum Eintritt eines bestimmten Ereignisses schätzt. In quantitativen Diffusionsstudien ist oft eine große Zahl von unabhängigen Variablen enthalten, die Diffusionsmechanismen unterscheiden und auf weitere internationale und intrasystemische Erklärungsgrößen kontrollieren
92
3 Forschungsdesign, Daten und Methoden
sollen. Simmons und Elkins (2004) integrierten beispielsweise in einem vielzitierten Artikel zur Erklärung der Liberalisierungspolitik in IWF-Mitgliedstaaten fünf Mechanismen der Diffusion und insgesamt 24 Variablen in ihr statistisches Modell. Zahlreiche weitere Beiträge kamen in den letzten Jahren hinzu (Brune, Garrett und Kogut 2004; Brooks 2005; Gilardi, Füglister und Luyet 2009; Kemmerling 2007; Mooney 2001; True und Mintrom 2001). Dabei wurde durch die Integration neuer Variablen die Basis empirischer Erkenntnis erweitert und gleichzeitig das methodische Repertoire deutlich ausgebaut. Neben der Ereignisdatenanalyse finden sich auch dynamische Probit- oder Logit-Modelle (Meseguer 2004; 2006). Eine Besonderheit der quantitativen Diffusionsforschung ist, dass die Einführung einer Politikinnovation als abhängige Variable meist dichotom konzipiert ist. In einigen wenigen Fällen gibt es jedoch auch „event count“-Daten mit in einem bestimmten Zeitintervall kumulierten Angaben zu seltenen Ereignissen (Berry und Berry 1999; Prakash und Potoski 2006). Bezüglich der räumlichen Komponente und Interdependenzmuster der verwendeten Daten wird der klassische länderbasierte Vergleich fortlaufend weiterentwickelt. Volden (2006) untersucht die Ausbreitung von Kinderkrankenversicherungen in amerikanischen Bundesstaaten mit einer Analyse auf der Basis von „directed dyads” an (siehe auch Gilardi und Füglister 2008). In diesem Ansatz stellen nicht mehr einzelne Länder, sondern Länderpaare die Fälle dar. Dyadische Modelle ermöglichen den direkten Test nachbarschaftlicher oder anderer, auf Ähnlichkeit basierender Beziehungen (Volden 2006: 295f; Grossback et al. 2004; Case et al. 1993). Solche Verfahren sind sonst eher in der Analyse sozialer Netzwerke (Burt und Minor 1983, Iacobucci et al 1999) und in der Konfliktforschung (Reiter und Stam 2003; Bueno de Mesquita und Lalman 1992) verbreitet. In der neueren Konvergenzliteratur finden sich jedoch ebenfalls quantitative Forschungsdesigns auf der Basis von Länderpaaren (Holzinger, Knill und Sommerer 2008; Manne und Barreto 2004). Eine weitere Entwicklung auf diesem Gebiet stellen Ansätze der räumlichen Regression und des „spatial modelling“ dar, die sich seit den späten achtziger Jahren vor allem in der Geographie und Ökonometrie etablierten (Franzese und Hays 2007a,b; Beck, Gleditsch und Beardsley 2006; Anselin et al. 2004; Anselin 1988). Dabei wird ein „spatial lag“-Term in das Schätzmodell eingeschlossen, der es erlaubt, Nachbarschaftseffekte (die je nach Gewichtung auch über räumliche Effekte hinausgehen können) von Artefakten nicht eingeschlossener oder unterdrückter Variablen sind. Mit Hilfe solcher Regressionsmodelle kann der Nachweis eines räumlichen Effektes erbracht werden.35 Allerdings
35
Es gibt auch erste Ansätze, dyadische Modelle mit „spatial lags“zu verknüpfen (Neumayer und Plümper 2008).
3.1 Methoden der Analyse von Policy-Lernen: ein Literaturüberblick
93
werden dabei die Mechanismen, die zu Diffusion führen, nicht genauer spezifiziert (Tam Cho 2003: 374). Neben der Diffusions- und Konvergenzforschung hat auch die Literatur zu Lernen in der Außen- und Sicherheitspolitik quantitative Beiträge vorzuweisen. Dazu zählt vor allem die Pionierarbeit von Li und Thomson (1978), die die Ausbreitung von Staatsstreichen mit einem auf einer Poisson-Verteilung basierenden Modell schätzen. Crescenzi (2007) testet in einem dyadischen „event history“-Modell den Einfluss von Reputation auf Entscheidungen in der Außenpolitik und unterschiedet dabei intradyadische Effekte von extra-dyadischer Interaktion als „Reputation“ – eine Variable, die in weiten Bereichen der politikwissenschaftlichen Lernforschung bislang ignoriert wurde. Einen anderen Weg wählt Goldsmith (2003, 2005) in einer Untersuchung zu Lernverhalten in der russischen und ukrainischen Außen- und Sicherheitspolitik. Im Gegensatz zur gängigen Praxis quantitativer und qualitativer Forschung in diesem Bereich untersucht er eine größere Stichprobe beteiligter Politiker in Form einer fragebogenbasierten Elitenbefragung. Der wachsenden Verbreitung quantitativer Methoden zu Erforschung von Lernprozessen in der Politik stehen eine Reihe kritischer Argumente entgegen, die zum Teil Einwänden gegen qualitative Verfahren entsprechen, häufiger jedoch auf deren Vorteile anspielen (vgl. Berg-Schlosser und Quenter 1996; Kittel 2006). Ein erstes Argument wendet sich gegen die starke Vereinfachung der Bedingungen realer Politik, denen makro-quantitative Modelle unterliegen. Dies gilt für unabhängige, aber auch für abhängige Variablen, bei denen selten nach vielen Details einer Politik unterschieden wird (Volden 2006: 295). Der Vorteil generalisierbarer Ergebnisse wird mit dem Nachteil der größeren Distanz zum Untersuchungsobjekt erkauft. Bei den unabhängigen Variablen können oft nur abstrakte Indikatoren verwendet werden, die auch eine alternative Interpretation erlauben (Gertzek-Rapaport et al. 2006: 15; Jahn 2006). Durch die Aggregation einer Vielzahl von politischen Prozessen wird dem Vorwurf Vorschub geleistet, dass die Analyseverfahren im besten Fall Potenziale für mögliches Lernen, jedoch nicht tatsächlich erfolgte Lernprozesse abbilden können. Ein zweiter Einwand ist ebenfalls aus der allgemeinen politikwissenschaftlichen Methodendiskussion bekannt. Hier wird argumentiert, dass bestimmte politische Prozesse schlichtweg nicht quantifizierbar seien. Für die Diffusionsliteratur bezieht Weyland (2004: 25) dies auf die politischen Reaktionen zur Regulierung des globalen Kapitalverkehrs. In diesem Sinne verweisen auch Tews (2002: 14) und Gray (1994) auf Effekte singulärer Ereignisse. Schließlich gibt es noch einen dritten, generell lern- und diffusionsskeptischen Einwand, der quantitative und qualitative Verfahren gleichermaßen trifft. Kritiker argumentieren, dass wegen der normativen Erwünschtheit und der ak-
94
3 Forschungsdesign, Daten und Methoden
tuellen Themenkonjunktur die Häufigkeit von Lernen und Diffusion generell überschätzt wird. Es ist auch mit statistischen Analyseverfahren heikel, echte Diffusion von der Illusion von Diffusion zu unterscheiden (Brinks und Coppedge 2006: 464). Im Fall der Liberalisierungspolitik hätten beispielsweise Faktoren des „exogenous easing“, z.B. sinkende Transport- und Kommunikationskosten, die Opportunitätskosten für die Abgeschlossenheit eines Landes massiv erhöht. Dies erleichtert eine gegenseitige Beeinflussung, muss aber nicht zwingend zu Diffusion führen (Frieden und Rogowski 1996; vgl. Simmons, Dobbin und Garrett 2006). Auch wenn Diffusionsprozesse, die in Umfang und Timing variieren, nicht einfach als „noise“ einer Schätzung abgetan werden können, müssen doch alternative Erklärungen, die etwa auf unterschiedliche Kapazitäten in der Reaktionsfähigkeit bezüglich gleichzeitig auftretender Probleme verweisen, ernst genommen werden (Garrett und Lange 1996; Kemmerling 2007).
3.1.4 „Caveats“ für eine empirische Analyse des Policy-Lernens Die Schlussfolgerungen aus der Darstellung unterschiedlicher Methoden der Analyse von Policy-Lernen ähneln grundsätzlich denen der allgemeinen Methodendiskussion in der vergleichenden Politikwissenschaft. So kann auch der Vergleich unterschiedlicher Ansätze im Bereich des Policy-Lernens keine eindeutigen Antworten liefern. Bei der Wahl der Methoden und des konkreten Forschungsdesigns hat der Forscher grundsätzlich zwei Strategien zur Auswahl. Er kann sein Analysekonzept von den theoretischen Anforderungen her optimieren, oder es anhand seiner beschränkten Ressourcen und Begabungen auswählen. Folgt man einer reinen Form der ersten Strategie, folgt daraus wegen der beträchtlichen Schwächen aller Ansätze die Unmöglichkeit der Untersuchung von Policy-Lernen. Alternativ dazu kann ein Design auch die Mischung mehrerer Forschungsansätze beinhalten. Die erste Antwort ist ob ihres idealistischen Motivs respektabel, durch die faktische Existenz einer empirischen Literatur zu Policy-Lernen jedoch nicht zwingend. Eine Kombination von Elementen aller drei Ansätze böte sich hingegen an, um wechselseitige Nachteile auszugleichen. Eine Computersimulation könnte die bislang wenig erforschte Interaktionsdynamik unterschiedlicher Lernvariablen und Kontrollmechanismen ergründen und vorhandene Hypothesen weiter spezifizieren. Eine quantitative Analyse könnte generelle Muster und Korrelationen nachweisen, die für einige relevante Fälle mit Fallstudien auf die Ebene einzelner Reformen und politischer Entscheidungsträger heruntergebrochen und dadurch validiert werden könnten (Lieberman 2006).
3.1 Methoden der Analyse von Policy-Lernen: ein Literaturüberblick
95
Gegen einen Methodenmix spricht in der wissenschaftlichen Realität die Begrenztheit der Ressourcen, was Arbeitskraft, Methodenkenntnis und verfügbare Daten betrifft (vgl. Heichel und Sommerer 2009). Da dies auch für die vorliegende Arbeit gilt, wird einem makro-quantitativen Design der Vorzug gegeben – was nicht bedeuten soll, dass der in Kapitel 2 dargestellte Forschungsstand und die aufgezeigten Forschungslücken nicht hinreichend gute Argumente für eine derartige Untersuchung liefern würden. Der Literaturüberblick zu angewandten Methoden in der Analyse von Policy-Lernen erlaubt es, diese Entscheidung mit Anforderungen an die Optimierung der Stärken und die Minimierung der jeweiligen Nachteile zu verknüpfen. Beide Aspekte sollen hier im Sinne eines „Caveats“ noch einmal zusammengefasst werden, bevor im nächsten Abschnitte ein konkretes Forschungsdesign als konstruktiver Lösungsansatz präsentiert wird. Die Vorteile quantitativer Forschung werden ausgeschöpft, wenn es gelingt, bei der Analyse von Imitationsmustern über den Einzelfall bestimmter Politikinstrumente hinauszugehen. Dabei sollte die Veränderung von Politik umfassend gemessen und eine große Zahl relevanter Erklärungsvariablen in ein statistisches Modell integriert werden, um die Weiterentwicklung der Theorie voranzubringen. Bezüglich der Nachteile quantitativer Analyseverfahren sollte berücksichtigt werden, dass Indikatoren für die Konsequenzen des Lernens (abhängige Variable) wie auch für die unterschiedlichen Lernmechanismen (unabhängige Variablen) möglichst nahe an den jeweiligen theoretischen Konzepten angelehnt sind. Die Operationalisierung von Policy-Wandel sollte über das dichotome Schema der Diffusionsforschung „Übernahme/keine Übernahme“ hinausgehen, um den Anforderungen einer adäquaten Repräsentation einer „public policy“ im Sinne von Bennett (1991: 218) zu entsprechen (vgl. Heichel und Sommerer 2007). Darüber hinaus sind besondere Anstrengungen nötig, um wegen des hohen Aggregationsniveaus einer quantitativen Analyse und der Abgrenzungsprobleme des Lernbegriffs nicht der Fata Morgana eines nur scheinbaren Imitationsprozesses zu unterliegen. Neben der Auswahl trennscharfer Indikatoren für unterschiedliche Lernmechanismen sollte vor allem dem Test alternativer Erklärungen besondere Aufmerksamkeit gelten die über die Integration in ein Regressionsmodell hinausgeht (vgl. Abschnitt 2.4). Es ist offensichtlich, dass eine Reihe wesentlicher Nachteile des quantitativen Ansatzes nicht ausgeglichen werden können. Daher sollte der empirischen Analyse vorangestellt werden, dass die Ergebnisse bestimmten Einschränkungen unterliegen können. Selbst präzise ökonometrische Verfahren werden aufgrund zwingender Vereinfachungen nie in der Lage sein, hinreichende Belege für tatsächlich stattfindendes Lernen zu liefern. Es können höchstens Indizien
96
3 Forschungsdesign, Daten und Methoden
für das Auftreten von Mustern und Korrelationen erbracht werden, die mit Hilfe theoretischer Modelle als Hinweise auf tatsächliche Lernprozesse interpretiert werden können. Das liegt vor allem daran, dass aufgrund der verwendeten Daten keine Informationen über kognitive Prozesse und die Ursachen und Motive des Lernens in die Analyse einfließen. Hier könnte nur eine anschließende qualitative „in depth“-Analyse Abhilfe schaffen. Eine zweite wesentliche Einschränkung wird durch den Vergleich mit einem experimentellen Design offensichtlich: in der Praxis der politikwissenschaftlichen Komparatistik kommt es häufig vor, dass wichtige Erklärungsgrößen nicht unabhängig voneinander auftreten. Zum Beispiel korrelieren die politische Offenheit und das ökonomische Entwicklungsniveau eines Landes oft mit seiner Integration in die Weltwirtschaft und in internationale Institutionen. Die Kontrolle von Umwelteinflüssen, wie sie im Experiment oder in einer Computersimulation möglich ist, kann in einer makro-quantitativen Analyse aber nur begrenzt erfolgen, ohne dass das zugrunde liegende Modell unterspezifiziert ist.
3.2 Design einer quantitativen Analyse von Lernen in der Umweltpolitik In diesem Abschnitt werden die Grundzüge eines quantitativen Designs präsentiert, das die Beantwortung der beiden Forschungsfragen anhand des im vorigen Kapitel skizzierten Analyserahmens ermöglichen soll. Es knüpft an eine Reihe von Vorarbeiten an (Holzinger, Knill und Arts 2008; Holzinger, Knill und Sommerer; aber auch Volden 2006; Simmons und Elkins 2004; Crescenzi 2007), geht jedoch in mancherlei Hinsicht über diese Arbeiten hinaus. Mit dem vorliegenden Forschungsdesign wird eine konstruktive Antwort auf die eben skizzierte Problematik der empirischen Analyse des Policy-Lernens gegeben, die auch konkurrierende Erklärungen und generelle Einwände gegen den Forschungsgegenstand berücksichtigt (vgl. Levy 1994: 289ff). Während im vorigen Abschnitt die Grenzen der Analyse von PolicyLernen beschrieben wurden, stehen nun die entsprechenden Möglichkeiten im Vordergrund. Um deutlich zu machen, was neben empirischen Befunden zur Relevanz des Lernens den innovativen Beitrag dieser Arbeit ausmacht, werden vier Elemente des Designs besonders hervorgehoben, auch wenn sie zum Teil im weiteren Verlauf dieses Kapitels noch im Detail vorgestellt werden. Sie beziehen sich auf die Auswahl geeigneter Daten, die Operationalisierung von Wandel als abhängige Variable, die Entwicklung eines umfangreichen Repertoires von Lernvariablen und die Kombination deskriptiver und inferenzstatistischer Analysetechniken.
3.2 Design einer quantitativen Analyse von Lernen in der Umweltpolitik
97
3.2.1 Europäische Umweltpolitik als geeignete Datenbasis Im Mittelpunkt der empirischen Analyse steht ein neuartiger Datensatz zum Vergleich nationaler Umweltpolitiken. Wie in den meisten Fällen, so geschieht auch in diesem Buch die Auswahl der Datenbasis nicht ohne Berücksichtigung eingeschränkter Ressourcen. Der Grundstock der hier verwendeten Daten stammt aus dem ENVIPOLCON-Projekt.36 Diese Datenbasis wurde im Rahmen eines von der DFG-finanzierten Projektes aktualisiert und erheblich erweitert, wodurch ein innovativer und eigenständiger Datensatz entstand.37 Die Verfügbarkeit sollte jedoch keineswegs die theoretische Betrachtung der Geeignetheit überlagern. Die Datenbasis der abhängigen Variable wird in Abschnitt 3.3 ausführlich erörtert. In einem Vorgriff darauf soll jedoch an dieser Stelle kurz dargestellt werden, wie die Auswahl von Daten aus der Umweltpolitik, eines Samples von 24 Ländern und eines Untersuchungszeitraums von 1970-2005 zu einer Repräsentation von Policy-Wandel führt, die für den Test unterschiedlicher Mechanismen des Policy-Lernens besonders geeignet ist. Die Analyse einzelner Politikmaßnahmen, etwa der Körperschaftssteuerrate oder der Privatisierung des Rentenversicherungssystems, ist wegen der geringen Verfügbarkeit von Daten und der ressourcenintensiven Datenerhebung in der vergleichenden Politikwissenschaft gängige Praxis. Im vorliegenden Datensatz soll jedoch ein größeres Repertoire von Politiken verwendet werden. Es erstreckt sich auf 22 Politiken (z.B. Ökolabel) und 17 Politikstandards (z.B. Grenzwert für PKW-Emissionen). So können problemspezifische Erklärungsfaktoren und idiosynkratische Prozesse kontrolliert und allgemeine Muster von Lernen identifiziert werden. Diese Daten beziehen sich auf die tatsächliche Regierungsaktivität und den legislativen Output, da Lerntheorien auf das Ergebnis einer politischen Entscheidung, nicht aber auf deren Implementation abzielen. Auch wenn durch die Verwendung von Policy-Output-Daten die Gefahr besteht, Umweltpolitiken
36
37
Das Projekt „Environmental Governance in Europe: The Impact of International Institutions and Trade on Policy Convergence (ENVIPOLCON)“ wurde von 2003 bis 2006 im 5. EURahmenprogramm gefördert. Beteiligt waren die Universität Konstanz, die Universität Hamburg, die Radboud University Nijmegen, die Universität Salzburg, die Universität Jena, das Max-Planck- Institut zur Erforschung der Gemeinschaftsgüter in Bonn und die Freie Universität Berlin. Für weitere Informationen zu Projekthintergrund und -ergebnissen siehe http://www.uni-konstanz.de/FuF/Verwiss/knill/projekte/envipolcon/project-homepage.php; Holzinger, Knill und Arts 2008; Heichel und Sommerer 2009. Das von der DFG finanzierte Projekt „Einflussfaktoren des Policy-Wandels: Transnationales Policy-Lernen und Vetospielertheorie am Beispiel der Umweltpolitik“ lief von Juli 2006 bis April 2010 an der Universität Konstanz und an der Universität Hamburg.
98
3 Forschungsdesign, Daten und Methoden
substanziell zu überschätzen, kann so die theoretische Passung von explanans und explanandum erhöht werden. Die Umweltpolitik stellt ein geeignetes Anwendungsgebiet für den quantitativen Test von Lerneffekten dar. In der Literatur wurden Konvergenz und Diffusion sowie das Verhalten von umweltpolitischen Pionierländern schon häufig untersucht (Howlett 2000; Kern, Jörgens und Jänicke 2000; Botcheva und Martin 2001; Delmas 2002; Tews, Busch und Jörgens 2003; Liefferink und Jordan 2005). Nicht zuletzt wurde auch für die ENVIPOLCON-Daten auf die Relevanz von transnationaler Kommunikation und von Konvergenzprozessen verwiesen, ohne jedoch einzelne Lernmechanismen oder Policy-Wandel genauer zu spezifizieren (Holzinger, Knill und Arts 2008; Holzinger Knill und Sommerer 2008). Der Bereich der Umweltpolitik ist im Vergleich zur Sozial- oder Wirtschaftspolitik relativ jung, so dass die Entwicklungsdynamik einer Vielzahl von Politiken vollständig erfasst werden kann. Für einen Vergleich der Wirkung internationaler und nationaler Faktoren ist es darüber hinaus von Vorteil, dass in der Umweltpolitik sowohl grenzüberschreitende und globale als auch lokal begrenzte Probleme reguliert werden. Während sich beispielsweise in der Außenoder Entwicklungspolitik die Abgrenzung des Lernens von Prozessen, die auf Druck und Zwang basieren, eher schwierig gestaltet, ist es schließlich auch von Vorteil, dass Machtasymmetrie im Bereich der Umweltpolitik eine eher geringe Rolle spielt. Drei Lücken in der vergleichenden Forschung zur Umweltpolitik können ebenfalls zur Begründung der Auswahl angeführt werden. Erstens liegt bislang der Schwerpunkt der Forschung weniger auf der Analyse von Policy-Wandel, sondern vielmehr auf der vergleichenden Untersuchung umweltpolitischer Performanz (Jänicke und Weidner 1995; Prittwitz 1990). Zweitens sind makro-quantitative Analysen mit großer Fallzahl im Umweltbereich selten und meist auf Policy-Outcomes als abhängige Variablen fixiert (Binder und Neumayer 2005; Fisher und Freudenburg 2004; Jahn 1998; Murdoch und Sandler 1997; Neumayer 2003; Scruggs 1999, 2003; Wälti 2004). Studien, deren Fokus auf Outputs liegt, verbleiben meist auf deskriptivem Niveau (Tews, Busch und Jörgens 2003) oder sind auf einzelne Maßnahmen beschränkt (Fredriksson et al. 2005; Hironaka 2002). Die nahezu ausschließliche Konzentration auf Outcomes bringt Validitätsprobleme mit sich. Eine Verbesserung der Umweltqualität, wie etwa eine Emissionsreduktion kann das Resultat politischer Maßnahmen sein. Sie kann aber auch von Faktoren bestimmt werden, hinter denen keine umweltpolitische Absicht stand oder die „GratisEffekte“ darstellen (Binder 1996; Vogel 1987). Drittens wird vergleichende Forschung im Bereich der Umweltpolitik meist auf der Basis von Fallstudien betrieben. Da sich die Studien häufig auf ein
3.2 Design einer quantitativen Analyse von Lernen in der Umweltpolitik
99
kleines Sample und die gleichen Untersuchungsländern beschränken, sind aus ihnen kaum generalisierbare Folgerungen abzuleiten (Andersen 1994; Badaracco 1985; Daugbjerg und Pedersen 2004; Pedersen 2005; Vogel 1986). Die Länderstichprobe des weiterentwickelten ENVIPOLCON-Datensatzes umfasst 24 Länder (Abbildung 4; Tabelle A.1). Neben Belgien, Deutschland, Frankreich, Italien und den Niederlanden als Gründungsstaaten der Europäischen Gemeinschaft zählen Länder aus allen Erweiterungswellen zum Sample. Dänemark, Irland und das Vereinigte Königreich traten der Europäischen Gemeinschaft in den siebziger Jahren bei, die drei südeuropäischen Länder Griechenland, Portugal und Spanien folgten in den achtziger Jahren. Ergänzt wird die Auswahl durch die ehemaligen EFTA-Länder Finnland, Österreich und Schweden sowie durch die bis 2005 jüngsten Beitrittsländer Polen, Slowakei und Ungarn. Von den europäischen Staaten, die bis 2005 keine EU-Mitglieder waren, kommen die damaligen Beitrittskandidaten Bulgarien und Rumänien und die EFTA-Staaten Norwegen und Schweiz hinzu. Abbildung 4:
Ländersample
Luxemburg wurde ausgeschlossen, da für einige Kovariaten nur gemeinsame Werte mit Belgien existieren. Auch andere Kleinstaaten wie Zypern, Malta und Island werden nicht berücksichtigt. Die baltischen Länder finden sich ebenfalls nicht in der Stichprobe wieder, da keine eigenständigen Daten für die Zeit vor
100
3 Forschungsdesign, Daten und Methoden
1991 existieren, und die Auflösung der Sowjetunion bei Beibehaltung zahlreicher rechtlicher Gemeinsamkeiten zu künstlicher Konvergenz geführt hätte. Gleiches gilt für das ehemalige Jugoslawien sowie für die DDR, deren Politik ebenfalls nicht repräsentiert ist. Von den Nachfolgestaaten der Tschechoslowakei findet sich aus demselben Grund die Slowakische Republik, aber nicht Tschechien im Ländersample. Auch die USA und Japan zählen zum Sample. Beide spielten in den Anfängen der Umweltpolitik eine gewichtige Rolle, und zählen zudem zu den reichsten Industrienationen der Welt. Andere Länder wie Kanada und Australien wurden nicht berücksichtigt, da dort auf Ebene der Zentralregierung fast keine Umweltpolitik existiert. Mexiko als jüngeres OECD-Mitglied und Schwellenland komplettiert das Sample, um potenzielle Effekte regionaler Ansteckung und kultureller Nähe außerhalb Europas erfassen zu können. Das Ländersample ist hinreichend groß und kann damit den Reichweitenvorteil quantitativ vergleichender Forschung ausnutzen. Der Schwerpunkt der Auswahl liegt auf Europa. Dies schränkt zwar die Generalisierbarkeit ein, für die Untersuchung von Lernmechanismen wie Nachbarschaftseffekten und kultureller Ähnlichkeit erscheint die geschlossene Erfassung einer Region analog zur Verwendung des Konzeptes der „political relevant dyads“ in der Konfliktforschung jedoch notwendig und hilfreich.38 Darüber hinaus enthält die Länderauswahl die wesentlichen umweltpolitischen Pionierländer und auch eine Reihe wirtschaftlicher Großmächte. Für regionale Integration existiert ebenfalls Varianz, obwohl der Anteil der EU-Mitglieder auf den ersten Blick dominierend erscheint. Dies relativiert sich in der historischen Perspektive. Im Jahre 1970 waren nur 5 von 24 Ländern im Sample Mitglied der EU, 1990 mit 11 Ländern immer noch weniger als die Hälfte, und seit 2004 schließlich 17 Länder. Zudem sollen auch asymmetrische Machtkonstellationen sowie Unterschiede im Ausmaß internationaler Kooperationen, politischer Integration und wirtschaftlicher Vernetzung realisiert werden. Die Datenbasis umfasst einen Zeitraum von 35 Jahren. Während das Jahr 2005 als Ende der Zeitspanne durch die Erhebung der Daten bestimmt war, fällt das Jahr 1970 in eine Zeit knapp vor der als Geburtsstunde der internationalen Umweltpolitik geltenden Stockholmer UN-Konferenz von 1972. Dem ersten Umweltprogramm der Vereinten Nationen und der Europäischen Kommission gingen nur vereinzelte Aktivitäten auf internationaler Ebene voraus. Auch auf nationaler Ebene gab es vor 1970 nur wenige Umweltprogramme. In Deutschland war Umweltpolitik seit Willy Brandts Kampagne für einen „blauen Himmel über der Ruhr“ im Bundestagswahlkampf 1961 ein Thema auf der politi38
Dabei werden beispielsweise nur die Länder in eine Analyse bewaffneter Konflikte einbezogen, zwischen denen ein solcher Konflikt auch realistisch ist (Bennett und Stam 2000).
3.2 Design einer quantitativen Analyse von Lernen in der Umweltpolitik
101
schen Agenda, das erste deutsches Umweltprogramm stammt allerdings erst aus dem Jahr 1971 (Jänicke et al. 1997). In den USA wurde 1970 ein weitreichendes Bundesgesetz gegen die Luftverschmutzung, der „Clean Air Act“, verabschiedet und die nationale Umweltschutzbehörde „Environmental Protection Agency“ (EPA) gegründet. Bis 1980 kamen zahlreiche umweltpolitische Aktivitäten auf nationaler und internationaler Ebene hinzu, die sich in den achtziger Jahren in den reichen Industrienationen immer weiter ausbreiteten. Die Umweltpolitik in der Zeit nach 1990 wurde von zwei Entwicklungen geprägt. Zum einen von der Vertiefung der internationalen Zusammenarbeit im Zuge der UN-Konferenz in Rio de Janeiro, und zum anderen von einem Aufholprozess der ehemals kommunistischen Staaten, der nicht zuletzt durch die geplanten oder schon vollzogenen EUBeitritte einiger Länder erhebliche Beschleunigung erfahren hat. Die Daten liegen als Zeitreihe auf der Basis jährlicher Änderungen vor. Ein wichtiger Vorteil gegenüber qualitativen Analysen des Policy-Lernens ist jedoch nicht nur die große Zahl von Datenpunkten und die vollständige Chronologie der Politikveränderung, sondern überhaupt die Existenz eines zeitlichen Rahmens für die Analyse von Wandel (Heichel und Sommerer 2007; Unger und van Waarden 1995). Durch die Bestimmung von Anfangs- und Endpunkten und identische Zeitintervalle kann ein Vorher/Nachher-Vergleich durchgeführt sowie die verzögerte oder synchrone Wirkung kausaler Faktoren getestet werden.
3.2.2 Dyadische Operationalisierung von Policy-Wandel Neben einer geeigneten Datenbasis liegt eine zweite Besonderheit des Designs in der Darstellung und Messung von Policy-Wandel. Die explizite Analyse von Politikveränderung ist in der aktuellen politikwissenschaftlichen Literatur nicht besonders entwickelt. Dies gilt auch für vergleichende Analysen auf der Basis quantitativer Methoden. Wie im zweiten Kapitel gezeigt wurde, stellt die Beschreibung politischer Reformen einen entscheidenden Teil der Analyse von Lernprozessen in der Politik dar. Daher werden für die Messung von Änderungen unterschiedliche Typen von Policy-Wandel operationalisiert und verglichen, und so auch ein allgemeiner Beitrag für die empirische Forschung zu Wandel geleistet. Basis dieser Konzeption von Policy-Wandel ist die Verwendung von Länderpaaren als Untersuchungseinheiten. Dazu werden vorhandene Konzepte der Analyse von Diffusion und Konvergenz weiterentwickelt (Volden 2006; Elkins, Guzman und Simmons 2006; Holzinger, Knill und Sommerer 2008). Mit so genannten gerichteten oder auch richtungssensitiven Dyaden („directed dyads“),
102
3 Forschungsdesign, Daten und Methoden
die durch den paarweisen Vergleich aller Länder generiert werden, können Annäherung und Imitation als notwendige Bedingung für Policy-Lernen unmittelbar erfasst werden.39 Die Analyse „konditionalen“ Wandels, die eine Änderung der Politik in einem Land mit der Existenz eines Modells in einem anderen Land in Beziehung setzt, muss nicht wie bei Volden (2006) nur auf Imitation beschränkt sein. Auch Divergenz, gemeinsame Schocks oder ein „race to the top“ bzw. „race to the bottom“ können so identifiziert und für die weitere Analyse von Wandel genutzt werden. Mit dem dyadischen Ansatz und der expliziten Modellierung von Wandel wird ein unmittelbarer Test der Lernhypothesen ermöglicht. Dieser soll helfen, konkurrierende Erklärungen auszuschließen und die Gefahr eines nur scheinbar kausalen Zusammenhangs von Lernen und Wandel zu reduzieren.
3.2.3
Breites Repertoire von Lernvariablen
Ein drittes Element des Designs bezieht sich auf die Operationalisierung der im zweiten Kapitel skizzierten Lernmechanismen. Das betrifft zum einen die Struktur der Variablen. Bei richtungssensitiven Dyaden können für jedes Länderpaar AB Variablen mit Bezug auf das Land A, das Land B, oder das Länderpaar AB in ein gemeinsames Analysemodell integriert werden (vgl. Elkins, Simmons und Guzman 2006). „Land A“-Variablen bilden intrasystemische Faktoren wie administrative Kapazität oder Vetospieler ab. Für Variablen, die sich auf das Lernen von erfolgreichen oder verwandten Ländern beziehen, kann die Differenz und Ähnlichkeit der Werte von Land A und Land B erfasst werden. Variablen für soziales Lernen enthalten hingegen nur Werte zu Land B und beschreiben die Größe einer Herde als Gruppe von Ländern, die die gleiche Politik wie ein Land B anwendet. Außerdem werden auch neue Indikatoren in die empirische Analyse integriert. Die skizzierte Herdenvariable wurde bislang in der politikwissenschaftlichen Literatur nicht als unabhängige Variable verwendet. Angeregt durch die Untersuchung der Rolle von Reputation in der Konfliktforschung (Crescenzi 2007) werden Variablen für wirtschaftlichen Erfolg durch die Operationalisierung von politikfeldspezifischer Reputation als Indikator für scheinbaren, nicht direkt ermittelbaren Erfolg ergänzt. Neben neuen Variablen für umweltpolitischen Erfolg oder Modewellen werden aber auch Variablen zur Orientierung an Peer-Ländern und zum Lernen in Netzwerken aus der Literatur übernommen.
39
Eine deutsche Übersetzung ist nicht etabliert. Zum Konzept siehe Bennett und Stam (2000); Volden (2006).
3.2 Design einer quantitativen Analyse von Lernen in der Umweltpolitik
103
3.2.4 Kombination verschiedener Analysetechniken Auch im Bereich der Analysemethoden soll ein innovativer Beitrag zur aktuellen Forschung erbracht werden. Dieser besteht nicht in der Weiterentwicklung ökonometrischer Analysetechniken, wie sie in diesem Forschungsgebiet etwa im Bereich der „spatial regression“ in jüngster Zeit vorangetrieben wurde. Unter Anwendung vorhandener Modelle zur Schätzung binärer Zeitreihendaten liegt der Fokus vielmehr auf der Verbindung verschiedener Ansätze der quantitativen Analyse. Diese Kombination kann anhand von drei Aspekten unterschieden werden. Erstens bezieht sie sich auf die Integration der Deskription von PolicyWandel in die Interpretation einer multivariaten Regressionsanalyse. Da der empirische Test von Lernmechanismen mit einigen Schwierigkeiten verbunden ist, werden vor der Regressionsanalyse die Konsequenzen möglicher Lernprozesse in Bezug auf Umfang, Richtung und Qualität von Policy-Wandels analysiert. Diese Vorgehensweise ermöglicht zudem Hinweise auf unterschiedliche Lernmechanismen. Geht ein Trend der Annäherung etwa mit einer permanenten Verschärfung des Regulierungsniveaus einher, könnte man dahinter Erfolgslernen vermuten, während eine Tendenz zum kleinsten gemeinsamen Nenner bei gleichzeitiger Konvergenz eher für den Einfluss des Lernens unter Gleichen spräche. Die Kontrolle von Harmonisierung und Regulierungskonkurrenz, die häufig als alternative Erklärung für eine nur scheinbar kausale Beziehung von Lernen und Wandel herangezogen werden, setzt ebenfalls auf der deskriptiven Ebene der Auswertung an. Effekte verbindlicher EU-Vorschriften können aus der Menge aller Änderungen herausgefiltert werden. So wird sichtbar, wie groß der Anteil der freiwilligen Imitation auch in EU-Ländern ist. Zur Plausibilität von Wettbewerbseinflüssen wird durch die Analyse des Wechsels von Annäherung und Divergenz auf der Ebene von Länderpaaren strategisches Verhalten in Form eines „race to the top/bottom“ überprüft. Zweitens erfolgt ein Vergleich der Analyse von Modellwandel, der als Konsequenz von Lernen erwartet wird, mit den Ergebnissen der Untersuchung anderer Typen von Wandel. Da bei der Formulierung der Lernhypothesen auch die Form der Veränderung spezifiziert wird, sollte sich für die entsprechenden Variablen kein Einfluss auf andere Typen ergeben. Eine dritte Form der Kombination betrifft den Vergleich der Analysen auf der Basis von abhängigen Variablen, die Änderungen bei mehreren Instrumenten des umweltpolitischen Repertoires gleichzeitig erfassen, mit Modellen, die Effekte der gleichen unabhängigen Variablen auf den Wandel einzelner Politiken untersuchen. Die Aggregation erlaubt die Generalisierung von Zusammen-
104
3 Forschungsdesign, Daten und Methoden
hangsmustern der Veränderungen. Eine zusätzliche Analyse einzelner Politiken kontrolliert die Effekte dieser Aggregation und sorgt so für eine verbesserte Transparenz und Verständlichkeit der Ergebnisse.
3.2.5 Übersicht des Forschungsdesigns Anhand dieser Beschreibung sowie der Mechanismen des Lernens und anderer Erklärungen für Policy-Wandel kann nun eine einfache graphische Darstellung des Forschungsdesigns erfolgen. Das Ziel dieser ist es, vor der detaillierten Darstellung der Datenbasis und der empirischen Analyse zu verdeutlichen, dass der Beitrag dieses Buches über die Präsentation neuer Ergebnisse zum Einfluss von Policy-Lernens hinausgeht. Stattdessen besteht er auch in der Entwicklung neuer Ansätze zur empirischen Analyse dieses Phänomens. Abbildung 5:
Übersicht Forschungsdesign
3.3 Abhängige Variable: Policy-Wandel in der Umweltpolitik
105
Der Literaturüberblick in diesem und im vorigen Kapitel hat vor Augen geführt, dass die Beantwortung der beiden in der Einleitung formulierten Forschungsfragen nicht ohne besondere Anstrengungen bezüglich der methodologischen Weiterentwicklung der Analyse von Policy-Lernen zu befriedigenden Ergebnissen führen kann. Abbildung 5 zeigt Policy-Wandel als abhängige Variable. Für 22 Politiken und 17 metrische Politikstandards aus dem Bereich der Umweltpolitik werden unterschiedliche Typen des Wandels analysiert. Dazu zählen die als Folge von Lernen erwarteten Änderungen in Form von Imitation und Modellwandel, aber auch Pionierverhalten und synchroner Wandel, der auf den Einfluss externer Ereignisse oder gemeinsamer Schocks zurückgeht. Für diese Änderungen sollen dann die Effekte der aus den Theorien des Policy-Lernens abgeleiteten Faktoren untersucht werden. Dies betrifft vier Kategorien von Orientierungspunkten: Erfolg und Reputation, Ähnlichkeit, Netzwerkintegration und Herdeneffekt. Das Erklärungsmodell wird durch die Einbeziehung internationaler und nationaler Einflussgrößen ergänzt. Neben europäischer Harmonisierung und Wettbewerb zählen dazu der Vetospieleransatz, regulative Pfadabhängigkeit, der Einfluss administrativer Kapazitäten, Problemdruck und die innenpolitische Nachfrage nach einer bestimmten Politik.
3.3 Abhängige Variable: Policy-Wandel in der Umweltpolitik Die abhängige Variable der skizzierten empirischen Untersuchung bezieht sich auf die Veränderung von umweltpolitischen Steuerungsinstrumenten auf nationaler Ebene. Sie wird auf der Basis eines originären Datensatzes gebildet und stellt im Bereich der politikwissenschaftlichen Komparatistik ein Novum dar. Die Besonderheit dieser Daten, ihre Erhebung und Operationalisierung werden daher in diesem Abschnitt ausführlich erläutert. Für die Literatur zu PolicyWandel im Allgemeinen gilt, was für die Konvergenzforschung an anderer Stelle schon festgestellt wurde. Während der Fokus der meisten Analysen auf der Erklärung von Policy-Wandel liegt, wird die Untersuchung der abhängigen Variablen häufig vernachlässigt (Heichel und Sommerer 2007: 106). Dies führt dazu, dass Konzepte für die Operationalisierung von Policy-Wandel in seinen unterschiedlichen Dimensionen nur spärlich vorliegen. Da die Identifikation der Veränderung einer Politik ein notwendiges Kriterium für die Analyse von Lernen darstellt (Eising 2002), werden geeignete Ansätze aus der Literatur an die Gegebenheiten der vorliegenden Daten angepasst und zu einem mehrstufigen Modell der Messung von Policy-Wandel weiterentwickelt.
106
3 Forschungsdesign, Daten und Methoden
3.3.1 Datenbasis und Auswahl der Politiken Entgegen dem Vorgehen in der Mehrzahl vergleichbarer Untersuchungen werden für die folgende Analyse nicht nur einzelne Maßnahmen, sondern ein Repertoire unterschiedlicher Politiken analysiert.40 Die vorliegende Datenbasis ist mit 22 Politiken außergewöhnlich breit und umfasst Maßnahmen aus beinahe allen Bereichen der Umweltpolitik. Eine große Zahl von Politiken erlaubt es, auf problemspezifische Faktoren einzelner Teilbereiche des Umweltschutzes zu kontrollieren und generalisierbare Aussagen über die Wirkung ausgewählter Erklärungsgrößen zu treffen. Die Grundlage für die Auswahl der Politiken stellt der erwähnte ENVIPOLCON-Datensatz dar. Von den dort vorhandenen 32 Politiken werden 22 für das vorliegende Projekt genutzt und weiter bearbeitet.41 Im Folgenden werden die Politiken einzeln dargestellt (Tabelle 1).42 Zum Bereich der Luftreinhaltepolitik sind im reduzierten ENVIPOLCONDatensatz vier Politikmaßnahmen enthalten. Die erste Policy reguliert den Schwefelgehalt von Heizöl, das überwiegend zu Heizzwecken von privaten Haushalten verwendet wird. Probleme treten meist in dicht besiedelten Regionen auf. Eine zweite Regulierung betrifft den Bleigehalt von Benzin. Diese Politik wurde durch die Einführung des Katalysators Ende der achtziger Jahre allgemein bekannt. Die dritte Maßnahme bezieht sich ebenfalls auf die vom Straßenverkehr verursachte Umweltverschmutzung. Es geht um die Begrenzung der Schadstoffemissionen von Personenkraftwagen, die für die Phänomene des urbanen Smogs und des „sauren Regens“ verantwortlich gemacht wurden. Die vierte im Datensatz enthaltene Maßnahme zur Eindämmung der Luftverschmutzung betrifft die Regulierung von Großfeuerungsanlagen, die fossile Brennstoffe verheizen. Sie bezieht sich vor allem Kraftwerke, aber auch auf industrielle Heizwerke und ähnliche Anlagen in der zellstoff- und metallverarbeitenden Industrie, in der Chemiewirtschaft und bei der Müllverbrennung. Für das Umweltmedium „Wasser“ sind ebenfalls vier Politiken enthalten. Die erste Policy bezieht sich auf Maßnahmen zur Erhaltung oder Wiederherstellung der Wasserqualität in natürlichen Gewässern, an deren Stränden und Küsten das Baden erlaubt ist. Wesentliches Merkmal für die Qualität des Badewassers ist der Gehalt an Kolibakterien.
40
41 42
In dieser Arbeit wird „Policy“ und Politik synonym verwendet. Im Plural wird nur „Politiken“ verwendet, da hier im Deutschen keine Verwechslungsgefahr mit anderen Politikdimensionen (politics, polity) besteht. Der Grund für die Reduktion der Politiken von 32 auf 22 liegt in beschränkten Ressourcen für die Datenerhebung. Für weitere Details zum ENVIPOLCON-Datensatz siehe Heichel et al.(2008) oder auch http://www.uni-konstanz.de/FuF/Verwiss/knill/projekte/envipolcon/project-deliverables.php.
3.3 Abhängige Variable: Policy-Wandel in der Umweltpolitik
107
Tabelle 1: Liste der 22 Umweltpolitiken UmweltMedium
EU-Regulierung (seit…)
Handelsrelevanz*
1
Schwefelgehalt von Heizöl
Luft
1975
P
2
Bleigehalt von Kraftstoff
Luft
1978
P
3
PKW-Emissionen
Luft
1970
P
4
Emissionen von Großfeuerungsanlagen
Luft
1988
PP
5
Kolibakterien in Badegewässern
Wasser
1976
6
Gefährliche Substanzen in Reinigungsmitteln
Wasser
1973
7
Effiziente Wassernutzung in der Industrie
Wasser
PP
8
Industrielle Abwässer
Wasser
PP
9
Bodenschutz
Boden
P
10 Altlastensanierung
Boden
11 Abfallziel Verpackungsmüll
Müll
12 Abfallziel Deponierung
Müll
13 Wiederverwertungsziel Glas
Müll
14 Wiederverwertungsziel Papier
Müll
15 Lärmschutzstandard bei LKWs
Lärm
16 Autobahn Lärmbelastung
Lärm
17 Bauschutt-Recycling
Ressourcen
18 Energieeffizienz bei Kühlschränken
Ressourcen
1992
P
19 Öko-Audit
Allgemein
1993
PP
20 Umweltverträglichkeitsprüfung
Allgemein
1985
21 Öko-Label
Allgemein
1992
22 Umwelt-/Nachhaltigkeitsplan
Allgemein
* P=Produktregulierung, PP=Regulierung des Produktionsprozesses
1994
1970
P
PP
P
108
3 Forschungsdesign, Daten und Methoden
Die zweite Wasserschutzpolitik bezieht sich auf gefährliche Stoffe in Reinigungsmitteln, wie sie in der verarbeitenden Industrie, in Dienstleistungsunternehmen (z.B. Textilreinigung) und privaten Haushalten (z.B. Geschirrspülmittel) enthalten sind. Eine dritte Policy reguliert die effiziente Wassernutzung durch die Industrie, etwa in Form von Abgaben, die Unternehmen für die Förderung von Grundwasser entrichten müssen. Die vierte Politikmaßnahme gegen Wasserverschmutzung begrenzt den Schadstoffgehalt industrieller Abwässer an der Gewässeroberfläche. Zur dritten Kategorie, dem Bodenschutz, zählen zwei Politiken. Die auf langfristige Verschmutzungsprobleme bezogene Altlastensanierung beinhaltet dann Komplikationen, wenn die Verursacher nicht mehr herangezogen werden können. Eine Altlastensanierung wird in vielen Ländern durch Haftungsschemen reguliert. Die zweite Policy bezieht sich auf allgemeine Maßnahmen und Rahmengesetze zum Bodenschutz. Ein vierter Bereich der Umweltpolitik betrifft Abfallpolitik und Abfallmanagement und ist mit vier Maßnahmen im Datensatz vertreten. Diese sind im Gegensatz zu Politiken gegen Wasser- und Luftverschmutzung meist jüngeren Datums. Eine Quote für die Deponierung von Restabfällen und eine Regulierung von Verpackungsmüll werden durch Maßnahmen zu einer Recyclingquote für Papier und Glas komplettiert. Der Lärmschutz als fünfte Kategorie zählt ebenfalls zu den Bereichen der Umweltpolitik, die in der Öffentlichkeit hohe Aufmerksamkeit genießen. Der Datensatz enthält eine Policy zur Regulierung der Lärmemissionen von Lastkraftwagen. Eine zweite Lärmschutzpolitik soll die Lärmbelastung rund um Autobahnen bekämpfen, etwa in Form von Bauvorschriften für den Straßenbelag oder von nächtlichen Geschwindigkeitsbegrenzungen. Ressourcenverbrauch und Klimaschutz werden im Datensatz durch zwei Maßnahmen repräsentiert. Die erste Policy regelt die Wiederverwertung von Bauschutt, wie zum Beispiel Zement, Teer oder Holz, und die Trennung von gefährlichen Substanzen wie Asbest oder Schwermetalle. Die zweite Maßnahme betrifft die Energieeffizienz von Kühlschränken, die in der Debatte um das Ozonloch in den späten achtziger Jahren größere Bedeutung erlangte. In einer siebten Kategorie sind vier allgemeine Maßnahmen zum Umweltschutz enthalten, die keinem Medium zugeordnet werden können. Erstens zählt dazu das Öko-Audit als Umwelt-Managementsystem, das die freiwillige Überprüfung, Verbesserung und Offenlegung der Umweltschutzleistung von Unternehmen und anderen Organisationen ermöglichen soll. Das zweite Instrument ist die Umweltverträglichkeitsprüfung, eine in Planungsverfahren für große Infrastrukturprojekte integrierte Abschätzung umweltbezogener Risiken. Drittens wird auch die Existenz eines nationalen Ökolabels für bestimmte Produktgrup-
3.3 Abhängige Variable: Policy-Wandel in der Umweltpolitik
109
pen erfasst. Es soll Verbrauchern die umweltschutzgerechte Abwägung einer Kaufentscheidung ermöglichen. Schließlich enthält die Auswahl Daten zur Existenz nationaler Umwelt- oder Nachhaltigkeitspläne, wie sie im Zuge der UNKlimakonferenz von Rio 1992 in vielen Ländern aufgestellt wurden, um mittelund langfristige Ziele des Umweltschutzes und der nachhaltigen Entwicklung festzuschreiben. Der Datensatz weist ein hohes Maß an Varianz und Repräsentativität auf. Dass sowohl Politiken aus der Pionierzeit des Umweltschutzes als auch solche jüngeren Datum enthalten sind, konnte der Beschreibung schon entnommen werden. Hinzu kommt, dass mit 12 von 22 Politiken etwa die Hälfte der erfassten Maßnahmen auf der Ebene der Europäischen Union reguliert wird, so dass auf den Effekt europäischer Harmonisierung kontrolliert werden kann (Tabelle 1). Diese Varianz ist wesentlich für die Erklärung von Policy-Wandel: gibt es bindende Vorschriften aus Brüssel, kann bei einer Übernahme eines Modells in den Mitgliedstaaten kein Lerneffekt behauptet werden (Holzinger und Knill 2008: 54; Heichel et al. 2008: 67). Das leichte Übergewicht zugunsten von EUregulierten Politiken relativiert sich dadurch, dass zahlreiche Richtlinien erst im Laufe des Untersuchungszeitraums hinzukamen. Kalkuliert man in „PolicyJahren“, fällt die Bilanz zugunsten der nicht regulierten Politiken aus (360 gegenüber 286 mit EU-Aktivität).43 Die Umweltpolitiken werden auch anhand ihrer Handelsrelevanz unterschieden, so dass die Auswirkungen ökonomischer Globalisierung und des Standortwettbewerbs über die Zusammensetzung der abhängigen Variablen kontrolliert werden können (Holzinger und Knill 2008: 50; Heichel et al. 2008: 67). Während man bei zwölf handelsrelevanten Politiken erwarten kann, dass Wettbewerb zu ihrer Veränderung beiträgt, kann dies für die zehn anderen Politiken nicht gelten (Tabelle 1). Die handelsrelevanten Politiken teilen sich in sieben produkt- und fünf prozessbezogene Maßnahmen auf, für die divergierende Erwartungen in Bezug auf die Entwicklung des Regulierungsniveaus bestehen (Scharpf 1997; Holzinger 2003). Ein weiteres Kriterium, anhand dessen sich der Datensatz beschreiben lässt, betrifft die Reichweite des zugrunde liegenden Problems. Manche Umweltprobleme sind lokal begrenzt, zum Beispiel verseuchte Böden, der Lärmschutz rund um Autobahnen und die Emission von Feinstaubpartikeln durch Großfeuerungsanlagen. Andere Formen der Umweltverschmutzung treten regional auf und verursachen grenzübergreifende Interdependenzen (vgl. Abschnitt 2.3.1). Dazu zählt etwa die Luftverschmutzung durch Schwefel- oder Stickoxide, aber auch die Wasserverschmutzung, da Flüsse und Seen oft eine Landes43
Das bedeutet beispielsweise, dass bei einer Direktive von 1984 und einem Untersuchungszeitraum von 1970 bis 2005 entsprechend 22 Policy-Jahre mit EU-Regulierung vorliegen.
110
3 Forschungsdesign, Daten und Methoden
grenze bilden. Einige Politiken können keiner Reichweite zugeordnet werden (Öko-Audit), andere hingegen sind wie die Vorschriften zum Schutz der Ozonschicht als „global“ anzusehen. Allgemein wurden nur solche Politiken in den Datensatz aufgenommen, die auf nationaler Ebene Geltung haben. Das bedeutet, dass bei einer föderalen Verfassung nur die Aktivität auf zentralstaatlicher Ebene berücksichtigt wird. Für das gewählte Ländersample können vor allem in Belgien, Deutschland, Österreich, der Schweiz und den USA über die erfassten Daten hinaus zusätzliche Regelungen in den einzelnen Gliedstaaten vorliegen, so dass die Umweltpolitik für diese Länder möglicherweise unterschätzt wird. Die Auswahl eines stellvertretenden Gliedstaates als Ausweg aus diesem Dilemma wäre zu aufwendig und gegebenenfalls willkürlich. Nur für Belgien wurden nach 1993 subnationale Standards in den Datensatz aufgenommen, da hier seit einer Verfassungsreform sämtliche Kompetenzen im Umweltbereich vom Zentralstaat auf die Regionen verlagert wurden. Für die zeitliche Einordnung einer Veränderung wird jeweils das Verabschiedungsdatum einer Policy zugrundegelegt, was komplexe Umsetzungsprozesse außer Acht lässt. Die kleinste erfasste Zeiteinheit ist ein Jahr. Wegen des normalen Politikzyklus sollte es nur äußerst selten zur mehrfachen Änderung einer Politik innerhalb von 12 Monaten kommen. Der Policy-Begriff muss für die Operationalisierung der abhängigen Variable genau definiert werden, um Missverständnisse zu vermeiden. Unter einer Policy werden in dieser Arbeit formale Gesetze, Dekrete, Verordnungen und andere Statuten verstanden, die von den entsprechenden nationalen Institutionen beschlossen und verabschiedet wurden.44 Freiwillige Vereinbarungen kommen nur dann zum Zuge, wenn sie einen formalen rechtlichen Status besitzen. Dieser Datentyp wird allgemein als Policy-Output bezeichnet. In Diffusionsstudien wird häufig das Vorhandensein eines spezifischen Politikmodells in einem Land zu einem bestimmten Zeitpunkt erfasst, wie etwa die Einführung einer gesetzlich vorgeschriebenen privaten Rentenversicherung (Brooks 2005; Orenstein 2001). Dies gilt auch für Politiktransfer-Studien, die auf die Übernahme und Angleichung zwischen zwei Staaten abstellen (Dolowitz 1997; Pierson 2003). Ein typisches Beispiel für metrische Policy-Output-Daten sind Körperschaftssteuerraten (Ganghof 2005; Slemrod 2004) oder Umweltstandards (Holzinger, Knill und Sommerer 2008). Policy-Outcome-Daten stellen den zweiten wesentlichen Datentypus in der empirischen Forschung zu Policy-Wandel dar. Sie beziehen sich auf die Ergeb44
Diese Definition ist relativ weit verbreitet, jedoch deutlich enger als z.B. die Definition von Dye (2001: 2): „Public policy is whatever governments choose to do or not to do“ (vgl. Schubert und Bandelow 2003: 4).
3.3 Abhängige Variable: Policy-Wandel in der Umweltpolitik
111
nisse staatlicher Politiken. Typische Beispiele für Outcome-Daten sind in der Umweltpolitik Daten zur Umweltqualität (Neumayer 2001; Van 2005; vgl. Heichel und Sommerer 2007: 115). Outcome-Daten werden häufig von statistischen Ämtern internationaler Organisationen über relativ große Zeiträume und für größere Ländersamples zusammengestellt. Sie brauchen für die Forschung nicht extra erhoben, sondern müssen allenfalls aufbereitet werden. Das metrische Niveau der Daten erleichtert zudem die Anwendung statistischer Analysen. Policy-Output-Daten scheinen aus theoretischen Gründen und im Sinne des Arguments „good theories deserve good data“ (Baumgartner und Leech 1996) besser für den Zweck der vorliegenden Untersuchung geeignet zu sein. Lerntheorien, aber auch alternative Erklärungsmodelle wie die Vetospielertheorie beziehen sich überwiegend auf das Ergebnis des politischen Prozesses, nicht auf dessen Umsetzung. Bei Daten zur Umweltqualität ist hingegen nicht immer klar, ob sie im Einzelfall als Resultat staatlicher Maßnahmen verstanden werden können, oder vielmehr auf intervenierende Variablen zurückgehen, die außerhalb des Einflussbereichs der Politik stehen. Mit Hilfe des beschriebenen Datensatzes können drei unterschiedliche Politikdimensionen untersucht werden. Erstens kann der in der Diffusionsliteratur vorrangig berücksichtigte Wandel als Neueinführung einer Politik analysiert werden. Zweitens können durch die Aggregation von 22 Maßnahmen über den Einzelfall hinaus Änderungen des gesamten Repertoires nationaler Politik Gegenstand der Untersuchung sein. Drittens erlauben die Rohdaten auch die Analyse von Policy-Wandel bezüglich des Niveaus einer Regulierung. Diese Unterscheidung ist von großem theoretischen Interesse, da in einigen Fällen die Erwartungen zum Einfluss von Erklärungsfaktoren divergieren, wenn es um die Einführung einer allgemeinen Politik (z.B. zur Förderung effizienter Wassernutzung) oder die Kalibrierung eines Politikinstruments geht (z.B. Grenzwert für die Lärmemissionen von LKWs; Hall 1993; vgl. Holzinger und Knill 2008: 37). Durch die Berücksichtigung des Schutzniveaus einer umweltpolitischen Maßnahme kann die Richtung einer Änderung erfasst werden, was für die Analyse des Einflusses von Pionierländern und das Auftreten so genannter „races to the top/to the bottom“ erforderlich ist (vgl. Holzinger und Sommerer 2011). Daten zur Regulierungshöhe in Form metrischer Politikstandards sind nicht für alle 22 Politiken verfügbar, wie das Beispiel von Öko-Audits oder nationalen Umweltplänen verdeutlicht. So liegen im Datensatz nur bei 9 von 22 Items Informationen zur Spezifikation eines konkreten Niveaus vor. Da bei einigen Politiken unterschiedliche Schadstoffgruppen reguliert werden, stehen insgesamt 17 Umweltstandards in Form von Grenzwerten oder quantifizierten Politikzielen zur Verfügung.
112
3 Forschungsdesign, Daten und Methoden
Tabelle 2: Liste der 17 Umweltstandards Medium EU-Reg. Handels- Maßeinheit (seit...) relevanz* 1
Schwefelgehalt von Heizöl
Luft
1975
P
Vol%
2
Bleigehalt von Kraftstoff
Luft
1978
P
g/l
3
PKW Emissionen CO
Luft
1970
P
g/km
4
PKW Emissionen HC
Luft
1970
P
g/km
5
PKW Emissionen NOX
Luft
1977
P
g/km
6
Emissionen von Großfeuerungsanlagen SO2
Luft
1988
PP
mg/m³
7
Emissionen von Großfeuerungsanlagen NOx
Luft
1988
PP
mg/m³
8
Emissionen von Großfeuerungsanlagen Staub
Luft
1988
PP
mg/m³
9
Industrielle Abwässer Bleigehalt
Wasser
PP
mg/l
10
Industrielle Abwässer Zinkgehalt
Wasser
PP
mg/l
11
Industrielle Abwässer Kupfergehalt
Wasser
PP
mg/l
12
Industrielle Abwässer Chromgehalt
Wasser
PP
mg/l
13
Industrielle Abwässer BOD
Wasser
PP
mg/l
14
Wiederverwertungsziel Glas
Müll
%
15
Wiederverwertungsziel Papier
Müll
%
16
Lärmschutzstandard bei LKWs
Lärm
17
Autobahn Lärmbelastung
Lärm
1970
P
dB dB
* P= Produkt, PP= Produktionsprozess
In Tabelle 2 werden die entsprechenden Maßnahmen aufgelistet. Beim Schwefelgehalt von Heizöl wird ein Maximum des Anteils am Volumen vorgeschrieben, während die Zugabe von Blei in Normalbenzin in Gramm pro Liter bemessen wird. Für die Regulierung der Emissionen von Personenkraftwagen werden drei Schadstoffgruppen unterschieden. Für das hoch toxische Kohlenmonoxid, für die Stickoxide, die für die Smogbildung und sauren Regen verantwortlich gemacht werden, und für kanzerogene Kohlenwasserstoffe werden Grenzwerte
3.3 Abhängige Variable: Policy-Wandel in der Umweltpolitik
113
in Gramm pro Kilometer bestimmt, die auf einen bestimmten Fahrzyklus und eine Fahrzeugklasse bezogen sind.45 Bei Großfeuerungsanlagen werden ebenfalls Standards zu drei unterschiedlichen Schadstoffarten erfasst: lokal auftretender Feinstaub, sowie Stickoxid- und Schwefeldioxid-Emissionen. Bei den Grenzwerten für industrielle Abwässer (Milligramm pro Kubikmeter) werden fünf Schadstoffe unterschieden. Neben den vier Schwermetallen Zink, Blei, Chrom und Kupfer, die nicht nur unterschiedliche Probleme verursachen, sondern auch für verschiedene Industriezweige relevant sind, wird auch noch der biochemische Sauerstoffbedarf erhoben. Dieser Wert repräsentiert die Wasserverschmutzung durch die zellstoff- und holzverarbeitende Industrie. Vervollständigt wird das Repertoire durch Abfallquoten für das Recycling von Papier und Glas (Angaben in Prozent) sowie durch Lärmschutzstandards für die Emissionen von Lastkraftwagen und Immissionsstandards entlang von Autobahnen (beide in dB).46 Diese 17 Umweltstandards können entsprechend der zugrunde liegenden Politiken nach den gleichen Kriterien wie die allgemeinen Politiken unterschieden werden, wobei sich eine ähnliche Zusammensetzung des Samples ergibt. So findet man für neun Standards eine Regulierung auf Ebene der EU, was in etwa der Hälfte entspricht. Vierzehn Umweltstandards sind handelsrelevant, wovon sechs auf Produkte und acht auf Produktionsprozesse bezogen sind. Der höhere Anteil handelsrelevanter und von der EU-harmonisierter Standards ist nicht zufällig. Die Kalibrierung von Steuerungsinstrumenten ist besonders bei Produktstandards für den ökonomischen Wettbewerb und damit auch für den europäischen Binnenmarks von großer Bedeutung (Holzinger und Knill 2008: 60).
3.3.2 Datenerhebung Bevor die Operationalisierung der abhängigen Variable beschrieben werden kann, muss wegen der Neuheit des Datensatzes auch der Erhebungsprozess kurz skizziert werden. Dies betrifft den ursprünglichen Datensatz aus dem ENVIPOLCON- Projekt, vor allem aber dessen Erweiterung. Dabei werden auch die Reliabilität und Validität der vorliegenden Daten erörtert. Der ENVIPOLCON-Datensatz enthält eine umfassende Datensammlung zu nationalen Umweltpolitiken, welcher in dieser Form bislang nicht erhoben wurde. Die ECOLEX-Datenbank von WCU, UNEP und FAO enthält zwar Daten zu natio-
45 46
Zur Harmonisierung der Daten siehe Heichel et al. (2008: 80). Für Details siehe http://www.uni-konstanz.de/FuF/Verwiss/knill/projekte/envipolcon/projectdeliverables.php.
114
3 Forschungsdesign, Daten und Methoden
nalen Gesetzen, doch diese sind für die Zeit vor 1990 lückenhaft und zudem kaum kodiert oder kategorisiert. Zur Erhebung der ENVIPOLCON-Daten wurden für jedes der 24 Länder über akademische Netzwerke umweltpolitische Experten rekrutiert, meist aus der Ministerialverwaltung oder aus der Wissenschaft. Diese Experten stellen eine homogene Gruppe dar, die die Kompatibilität der Daten sichert (FrankfortNachmias und Nachmias 2000). Der Einsatz von Experten hat in der politikwissenschaftlichen Forschung Tradition (z.B. Castles und Mair 1984; Huber und Inglehart 1995). Die dreimonatige Datensammlung erfolgte auf der Basis eines Fragenkatalogs in Form eines halbstandardisierten Fragebogens. Darin wurden zu den jeweiligen Politiken nicht nur die Jahreszahlen der Einführung, die Existenz bestimmter Instrumente und die Höhe von Standards, sondern auch die Quellen und Titel der Regulierungen sowie Bemerkungen, etwa zur Einschränkung der Gültigkeit bestimmter Vorschriften, eingetragen. Zur Homogenität der Datenerhebung trug ein speziell entwickeltes Handbuch bei, das Informationen zu allen Politiken, generelle Anweisungen und Definitionen enthielt. Nach der Erhebungsphase wurden die Informationen auf Konsistenz und Vollständigkeit überprüft. Darüber hinaus wurden die Daten durch den partiellen Abgleich mit vorhandenen Datenbanken kreuzvalidiert. Dabei zeigten sich Probleme, die für jede Datenerhebung der politikwissenschaftlichen Komparatistik typisch sind. Neben dem hohen Aufwand an Zeit und finanziellen Ressourcen betraf dies vor allem die grundsätzliche Harmonisierung von PolicyDaten aus Ländern, die sich nicht nur in der Sprache, sondern auch in Rechtskultur, Politikstil und Verfassungsgrundlagen unterscheiden. Nicht anders als bei gängigen Datenbanken internationaler Organisationen muss daher die Möglichkeit von Fehlern in Kauf genommen werden (vgl. Heichel et al. 2008: 75ff). Der Rohdatensatz wurde in zweierlei Hinsicht erweitert, um ihn der Fragestellung dieser Untersuchung anzupassen. Zuerst wurde der Beobachtungszeitraum auf das Jahr 2005 ausgedehnt und der Datensatz dementsprechend aktualisiert. Die ENVIPOLCON-Daten, die für die Analyse von Politikkonvergenz erhoben wurden, enthalten nur Informationen zu vier Messzeitpunkten. Da es für die Untersuchung von Policy-Wandel erforderlich ist, nicht nur einen Zwischenstand, sondern alle Änderungen in einem definierten Zeitrahmen zu erfassen, wurden sämtliche Daten für die Zeit zwischen 1970, 1980, 1990, 2000 und 2005 nacherhoben und zu einem Zeitreihendatensatz ergänzt. Dazu stand die zum ENVIPOLCON-Datensatz gehörende Sammlung von Quellen und Dokumenten zur Verfügung. In dieser sind Informationen zu den jeweiligen Gesetzen und Verordnungen enthalten, so dass Anhaltspunkte und Eckdaten für die Zeitreihe jeder Policy vorhanden waren. So konnte gezielt nach Novellierungen zwischen den bisherigen Messpunkten gesucht werden.
3.3 Abhängige Variable: Policy-Wandel in der Umweltpolitik
115
Zuerst wurden die bekannten Dokumente für das Jahr 2000 in den jeweiligen nationalen Gesetzesblättern ausfindig gemacht, wie etwa dem Bundesgesetzblatt für Deutschland oder dem „Moniteur Belgique“ für Belgien. In großen Teilen sind diese Daten im Internet frei oder über kostenpflichtige Server verfügbar. Wo dies nicht der Fall ist, konnte auf Bibliotheksbestände zurückgegriffen werden. Durch eine rückwärts gerichtete Recherche konnte über die Präambel eines Gesetzes oder über den Verweis in einer Verordnung die komplette Regulierungshistorie bis zum Beginn des Untersuchungszeitraums nachvollzogen werden. Wurde eine Vorgängerregulierung identifiziert und in ihrer Relevanz bestätigt, wurde sie in den Datensatz aufgenommen.47 Zur Validierung wurden die Daten mit den vorhandenen Informationen für die Jahre 1990, 1980 und 1970 abgeglichen und gegebenenfalls ergänzt. Im Fall widersprüchlicher Informationen, mangelnder Quellen oder offensichtlicher Fehler wurde dies mit einschlägiger Sekundärliteratur und vorhandenen Beständen aus Datenbanken, wie etwa der EU-Implementationsdatenbank, abgeglichen.48 Diese Vorgehensweise macht den Datensatz in seiner Breite und Tiefe zu einer einzigartigen Ausgangsbasis für die Analyse von Policy-Wandel. Die Erstellung der aktualisierten Datenbasis war mit enormem Aufwand verbunden. Dies wird offensichtlich, wenn man sich vergegenwärtigt, dass der Datensatz über mehr als 19.000 Datenpunkte verfügt (22 Politiken * 24 Länder * 36 Jahre), wohingegen nur zwei wissenschaftliche Mitarbeiter und mehrere studentische Hilfskräfte diese Arbeit in vierzehn Monaten durchführten. Trotz seines innovativen Charakters und der sorgfältigen Datenerhebung unterliegt der Datensatz einer Reihe von Einschränkungen. Erstens besteht theoretisch die Gefahr, dass Regulierungen übersehen wurden, die parallel zu denen im ENVIPOLCON-Datensatz bestanden. Dies gilt besonders dann, wenn sie schon von den Experten des ENVIPOLCON-Projekts nicht berücksichtigt wurden, da mit Ausnahme einzelner Korrekturen den Vorgaben der ENVIPOLCON-Daten gefolgt wurde. Zweitens könnte ein Bias bezüglich bestimmter Sprachen bestehen. Insgesamt kommen im vorliegenden Ländersample 18 Sprachen vor, die von den Projektmitarbeitern nur zum Teil beherrscht wurden. Diesem Problem konnte durch den Einsatz von Online-Übersetzungshilfen sowie von Hilfskräften mit speziellen Sprachkenntnissen entgegnet werden. In skandinavischen Ländern 47
48
Hierbei gab es zahlreiche Ausschlüsse, da in solchen Präambeln nicht nur konkrete Vorläufer eines Gesetzes oder einer Verordnung, sondern auch Rahmengesetze oder allgemeine Regelungen erwähnt werden, die substanziell nichts mit der betreffenden Policy zu tun haben und etwa steuerpolitische Aspekte regeln. Zugänglich über die EUR-LEX-Datenbank, http://eur-lex.europa.eu/LexUriServ/ LexUriServ. do?uri=CELEX:71970L0220:EN:NOT
116
3 Forschungsdesign, Daten und Methoden
und in Osteuropa fanden sich häufig Rechtstexte und Begleitmaterial in englischer Sprache. Wissenschaftliche Sekundärliteratur stand ebenfalls meist in englischer Sprache zur Verfügung. Trotzdem könnte die Möglichkeit bestehen, dass bestimmte Sprachen und damit Länder benachteiligt wurden. Eine dritte Möglichkeit für eine Verzerrung bei der Datenerhebung besteht in Unterschieden der Zugänglichkeit von Gesetzestexten zwischen den einzelnen Ländern. Die Spannweite reicht von gut ausgebauten Portalen bis hin zu eher unübersichtlichen oder dürftigen Sammlungen von Verordnungen und Gesetzen. Solche Unterschiede können auf die Rechtskultur, aber auch auf die komplexe staatliche Struktur in bundesstaatlich verfassten Systemen zurückgehen. Die Gefahr besteht darin, Wandel in gut dokumentierten Ländern wegen der leichteren Verfügbarkeit zu überschätzen. Dementsprechend wurden Vorkehrungen getroffen und die Datensuche in „schwierigen“ Ländern ausgedehnt. Darüber hinaus könnte vermutet werden, dass schlechte Dokumentation möglicherweise mit geringer Regulierungsdichte und -qualität einhergeht, so dass der mögliche Fehler begrenzt sein sollte. Der hier beschriebene Prozess der Erhebung und Auswahl der Daten erlaubt es, von einem reliablen und validen Datensatz für die Analyse von PolicyWandels zu sprechen. Reliabilität als Zuverlässigkeit und Objektivität wird durch die Expertenbefragung gewährleistet, die nur auf Fakten, nicht auf Meinungen oder Einstellungen beruht. Dazu kommt, dass bei der Überprüfung und Vervollständigung der Daten nicht ein einzelner Forscher, sondern eine kleine Gruppe beteiligt war.49 Die umfassende Dokumentation der rechtlichen Grundlagen, oft sogar in elektronischer Form von Weblinks zu Volltexten, erlaubt die jederzeitige Wiederholung bei hoher Stabilität der Ergebnisse. Ein ausreichendes Maß an Validität wird dadurch erzielt, dass für den Bereich der Umweltpolitik ein breites Repertoire von Politiken über einen langen Zeitraum erfasst wurde. Policy-Outputs aus Gesetzen, Verordnungen und anderen Maßnahmen eignen sich hervorragend, um die Effekte von Lernprozessen und anderen Faktoren zu untersuchen, die sich sowohl auf das internationale als auch das nationale politische System beziehen. Der Zeitreihencharakter der Daten erlaubt die lückenlose Darstellung von Wandel ohne eine Festlegung willkürlicher Intervalle. Um den Informationsgehalt dieses Datensatzes zu veranschaulichen, wird mit der finnischen Regulierung des Bleigehalts im Benzin von 1980-2005 ein Ausschnitt des Rohdatensatzes im Detail vorgestellt. Wie in Tabelle 3 zu sehen ist, sind dafür sowohl Daten zu einer Policy als auch Informationen über die Höhe eines Grenzwertes vorhanden. Beim Policy-Typ wurde zwischen Geset49
Zu den Gütekriterien einer Messung siehe Behnke, Baur und Behnke 2006: 115ff.
3.3 Abhängige Variable: Policy-Wandel in der Umweltpolitik
117
zen und Verordnungen unterschieden, wobei letzteres die Residualkategorie aller nicht gesetzesgleichen Policy-Typen darstellt. Neben Titel und Kennzahlen ist auch eine Quellenangabe enthalten. Während die Umweltstandards unmittelbar vorlagen oder gegebenenfalls harmonisiert wurden, folgt die Kodierung für die Politiken einem einfachen Schema: 1 steht für die Veränderung von Gesetzen, 2 für alle anderen Änderungen, 0 für keine Veränderung. Tabelle 3: Beispiel für die Rohdaten: Bleigehalts im Benzin, Finnland Jahr
Regulierung Name, Quelle
1980 1981 1982 Gesetz 1983 1984 1985 1986 1987 1988 1989 1990 1991 1992 1993 1994 1995 1996 1997 1998 1999 2000 2001 2002 2003 2004 2005
Kodierung Grenzwert 0 0 1
Luftvårdslagen 67/82 § 9 http://www.finlex.fi/sv/laki/ajantasa/1982/19820716 2 Verordnung Statsrådets beslut 157/1983 http://www.finlex.fi/fi/laki/smur/1983/19830157 0 0 0 0 Verordnung Statsrådets beslut 1025/1988 2 http://www.finlex.fi/sv/laki/alkup/1988/19881025 0 0 0 1 Gesetz Luftvårdslagen 773/92 § 9 http://www.finlex.fi/sv/laki/ajantasa/1982/19820716 0 0 0 0 0 0 Verordnung Statsrådets beslut 786/1999 2 http://www.finlex.fi/sv/laki/alkup/1999/19990786 2 Verordnung Statsrådets beslut 1271/2000 http://www.finlex.fi/fi/laki/alkup/2000/20001271 0 0 Verordnung Statsrådets förordning 767/2003 2 http://www.finlex.fi/sv/laki/alkup/2003/20030767 0 0
0,15 g/l 0,15 g/l 0,15 g/l 0,15 g/l 0,15 g/l 0,15 g/l 0,15 g/l 0,15 g/l 0,15 g/l 0,15 g/l 0,15 g/l 0,15 g/l 0,15 g/l 0,15 g/l 0,15 g/l 0,15 g/l 0,01 g/l 0,01 g/l 0,01 g/l 0,01 g/l 0,01 g/l 0,01 g/l 0,01 g/l
118
3 Forschungsdesign, Daten und Methoden
Die Daten für Finnland geben ein repräsentatives Bild des Rohdatensatzes ab. Für den Zeitraum von 1969 bis 2005 sind sieben Einträge zu erkennen, nach der Ersteinführung von 1982 folgten sechs weitere Änderungen. Diese Zahl und auch die Abfolge der Änderungen entsprechen den Erwartungen zu einem typischen Policy-Zyklus. Die Regulierung beginnt mit einem allgemeinen Gesetz, das von Verordnungen gefolgt wird, die dann die allgemeinen Vorgaben konkreter ausgestalten. Gesetzesänderungen erfolgen in der Regel deutlich seltener als andere Veränderungen. Ihre Änderungswahrscheinlichkeit nimmt im Verlaufe des Regulierungsprozesses ab, wohingegen die Zahl anderer Veränderungen mit der fortlaufenden Differenzierung anwächst.
3.3.3 Operationalisierung von Policy-Wandel Die explizite Messung von Policy-Wandel stellt eine bedeutende Forschungslücke im Bereich der vergleichenden Politikwissenschaft dar. In quantitativen Analysen wird Wandel oft schlicht dichotom kodiert, was keine Folgerungen über Ausmaß und Richtung der Änderung zulässt. Liegen metrische Daten vor, wird das absolute Niveau, beispielsweise von Regierungsausgaben oder Steuersätzen, als abhängige Variable verwendet (z.B. Montanari 2001; Slemrod 2004). Wandel wird dann jedoch nur selten direkt erfasst. Eine Ausnahme bilden Brinks und Coppedge (2006: 468), die eine Veränderung des „FreedomHouse“Index als Indikator für demokratischen Wandel verwenden. In qualitativen Forschungsdesigns wird Wandel oft detailreich geschildert, ohne ihn mit anderen Fällen zu vergleichen, was die Generalisierbarkeit empirischer Erkenntnisse mindert: „The problem of the policy change literature is that different studies focus on different dimensions of the change process. They highlight one dimension but ignore others.“ (Wison 2000: 255). Um die Veränderung einer Regulierung quantitativ möglichst umfassend darzustellen, wird ein Ansatz verwendet, der auf Konzepten aus der aktuellen Konvergenz- und Diffusionsliteratur aufbaut und diese weiterentwickelt. In der Konvergenzforschung wurde die Annäherung zwischen Staaten als Spezialfall von Wandel erfasst (Holzinger, Knill und Sommerer 2008; vgl. Heichel und Sommerer 2007). Konvergenz wurde dabei in Bezug auf Richtung und Umfange, und sowohl für allgemeine Politiken als auch für das Regulierungsniveau von Politikinstrumenten analysiert. In einigen Fällen stellen Länderpaare die Basis für die Konvergenzmessung dar (Holzinger, Knill und Sommerer 2008: 572). In der Diffusionsliteratur finden sich ebenfalls dyadische Ansätze für die Messung von Policy-Wandel (Volden 2006; Elkins, Guzman und Simmons 2006). Bei einem Test verschiedener Lern- und Diffusionsmechanismen stellt
3.3 Abhängige Variable: Policy-Wandel in der Umweltpolitik
119
Volden (2006) die Veränderung einer Policy auf der Basis von Länderpaaren in konditionaler Weise dar. Wandel, der auf Lernen zurückgehen soll, setzt die Präsenz eines Modells in einem anderen Land voraus. Wie in anderen Diffusionsstudien ist die abhängige Variable immer noch dichotom. Die Operationalisierung der abhängigen Variablen in dieser Arbeit erfolgt durch eine Kombination dieser Ansätze. So wird konditionaler Wandel auf der Ebene richtungssensitiver Dyaden gemessen (s. Abschnitt 3.2.2). Die bei Volden (2006) einzige Form konditionalen Wandels als Modelllernen wird jedoch durch Informationen zu Ähnlichkeit und zur Richtung der Veränderung ergänzt, so dass ein neues, umfassendes Konzept zur Messung von Wandel entsteht. Für die quantitative Analyse werden nicht alle Elemente des beschriebenen Rohdatensatzes verwendet. Der Schwerpunkt liegt auf der Untersuchung der Ersteinführung und der Veränderung von metrischen Standards. Für beide wird konditionaler Wandel auf der Ebene von Länderpaaren operationalisiert. Die Ersteinführung bezieht sich auf den Wandel einer allgemeinen Politikmaßnahme. Ihre Berücksichtigung erlaubt den Anschluss an makroquantitative Beiträge der aktuellen Diffusionsliteratur. Mit der Untersuchung der Veränderung von Umweltstandards in Form von konkreten Grenzwerten und quantifizierten Politikzielen kann hingegen die Frage beantwortet werden, ob bei unterschiedlichen Dimensionen einer Policy unterschiedliche Effekte der Lern- und Kontrollvariablen zu erwarten sind. Die Operationalisierung von Wandel bei Standards ermöglicht zudem die für das Konzept des Modelllernens wichtige Unterscheidung von vollständiger und gradueller Imitation eines Modells.
3.3.3.1 Policy-Wandel bei der Ersteinführung Wie in der Diffusionsliteratur wird die Ersteinführung einer Politik als dichotome Variable konzipiert. Der Wert 0 in einem Jahr bedeutet das Fehlen einer Regulierung, 1 bedeutet die Einführung einer Politik, unabhängig davon, welche Form oder welchen Inhalt diese besitzt. Dabei gilt die erwähnte Begrenzung von maximal einer Veränderung pro Jahr. Die Variable wird zuerst auf der Ebene einzelner Items gebildet, und anschließend für alle 22 Politiken aggregiert. So können Änderungen bezüglich eines Teils oder sogar des gesamten im Datensatz erfassten Repertoires nationaler Umweltpolitik analysiert werden. In einem zweiten Schritt wird Policy-Wandel auf der Ebene von Länderpaaren operationalisiert. Dafür werden alle stochastisch möglichen Kombinationen von Ländern gebildet. Während ein Land A nicht mit sich selbst gepaart werden kann, sind bei zwei Ländern A und B die Paare AB sowie BA möglich, so dass man von gerichteten oder richtungssensitiven Dyaden spricht (siehe FN
120
3 Forschungsdesign, Daten und Methoden
39). Die Zahl der Länderpaare ergibt sich aus der Formel n*(n-1). Bei 24 Ländern kommt es so zu einer Zahl von 552 Länderpaaren pro Jahr. Errechnet man die Fallzahl für die gesamte Zeitreihe von 1970 bis 2005, werden 19.782 Fälle gezählt. Die Messung von Policy-Wandel hat eine dynamische Komponente, denn sie muss den Vergleich zwischen zwei Zeitpunkten beinhalten. Die erste Konsequenz daraus ist, dass von den Zeitpunkten t = {t0,..,tx,..,t35} ein Jahr wegfällt, da es bei 36 Messpunkten nur 35 Vergleichsmöglichkeiten gibt. So reduziert sich die Zahl der Fälle auf 19.320. In der einfachsten Form ergibt sich nun für eine einzelne Policy: (1a )
PC Ai ,'tx
( PAi ,tx PAi ,t ( x1) ) u (1 PAi ,t ( x1) )
wobei PAi die Existenz der Policy i in Land A darstellt, tx und tx-1 die beiden Zeitpunkte, und PC die Veränderungsrate, die den Wert 0 oder 1 annehmen kann. Der einmalige Charakter der Ersteinführung wird über den Ausdruck in der zweiten Klammer repräsentiert. Wurde eine Politik im Jahr tx-1 oder davor eingeführt, kann ein Wandel zwischen tx-1 und tx nicht mehr als Ersteinführung gewertet werden. Durch die Subtraktion von 1 ergibt der Wert für PCAi 0, wenn diese Policy zuvor schon eingeführt worden war. Für eine aggregierte Darstellung aller 22 Politiken gibt es unterschiedliche Möglichkeiten. Zuerst kann die Zahl der Änderungen einfach aufsummiert werden. Das ergibt eine Variable, die zwischen 0 und 22 variiert. Alternativ dazu kann die Aggregation dahingehend vereinfacht werden, dass jegliche Veränderung, ob von einer oder mehreren Politiken verursacht, zu einem Wert von maximal 1 führt und so eine dichotome Variable entsteht: n
(1b)
DPC A,'tx
¦ PC
Ai ,'tx
1
wobei DPC eine Dummy-Variable der Summe aller Veränderungen für n=22 Politiken darstellt. Für diese Version der Aggregation spricht, dass im selben Jahr in der Regel nicht mehrere Politiken eingeführt werden, die nicht auf eine identische Ursache (z.B. EU-Beitritt oder Regierungswechsel) zurückzuführen sind. So fällt bei einer Begrenzung auf maximal eine Veränderung der reelle Informationsverlust gering aus. Zudem steht auf diese Weise eine allgemeine Variable „Einführung einer Umweltpolitik“ zur Verfügung. Eine Aggregation besitzt zwei Vorteile: die Generalisierbarkeit der Analyse von Wandel, und die Vermeidung einer Reduktion der Fallzahl. Letzteres wäre der Fall, wenn Länder nach der einmaligen Übernahme aus der weiteren Analyse ausscheiden. Hat ein
3.3 Abhängige Variable: Policy-Wandel in der Umweltpolitik
121
Land A eine Policy Px eingeführt, kann es jedoch in den nächsten Jahren etwa noch eine Policy Py einführen. Wenn man annimmt, dass für ein Land mit einer großen Zahl von Politiken wegen der Begrenztheit des Politikrepertoires die Wahrscheinlichkeit weiterer Ersteinführungen sinkt oder diese gar nicht möglich sind, kann ein Sättigungsfaktor verwendet werden. Dieser schließt ein Länderpaar ab dem Zeitpunkt des Erreichens eines Wertes von 22 (oder weniger) Ersteinführungen wie bei einer „event history“-Analyse von der weiteren Untersuchung aus. In einem zweiten Schritt wird konditionaler Policy-Wandel auf der Ebene von Länderpaaren operationalisiert. Dafür wird die Ersteinführung einer Politik in Land A in Bezug zur Politik von Land B gesetzt und nach drei Formen der Veränderung unterschieden. Zuerst kann der Einführung einer Policy Pi in Land A die Existenz eines Modells in einem Referenzland B in tx-1 oder früher vorausgehen. Ohne Zeitverzögerung kann es keine Imitation geben, und eine Zeitverzögerung unter einem Jahr wird im Datensatz nicht erfasst. Der Wandel in Land A (PCA) in Abhängigkeit von Land B wird so berechnet:
(2)
PC Ai ( B ),'tx
( PAi ,tx PAi ,t ( x1) ) u (1 PAi ,t ( x1) ) u ( PBi ,t ( x1) )
wobei PAi die Existenz einer Politik in A, und PBi die in B bedeutet. Pionierverhalten stellt eine zweite Form dyadischen Wandels dar. Dies setzt voraus, dass Land A in tx eine Politik einführt, die in Land B zu diesem Zeitpunkt nicht existiert. Da theoretisch die Möglichkeit besteht, dass eine Politik auch abgeschafft wird, könnte zusätzlich berücksichtigt werden, dass Land B diese Politik auch nicht in der Zeit vor tx hatte. Da dieser Fall im vorliegenden Datensatz nicht auftritt, ist diese Spezifikation hier nicht notwendig. Pionierwandel wird daher wie folgt berechnet: (3)
PC Ai ( B ), ' tx
( PAi ,tx PAi ,t ( x 1) ) u (1 PAi ,t ( x 1) ) u (1 PBi ,tx )
Einen dritten Typ konditionalen Policy-Wandels stellen synchrone Änderungen dar. Hier wird zeitgleich mit der Ersteinführung einer Politik Pi in Land A die gleiche Politik Pi in Land B eingeführt. Daher muss in der Formel nicht nur die parallele Einführung, sondern auch das Fehlen eines Modells zum Zeitpunkt tx-1 integriert werden: (4)
PC Ai ( B ),'tx
( PAi ,tx PAi ,t ( x1) ) u (1 PAi ,t ( x1) ) u ( PBi ,tx PBi ,t ( x1) )
122
3 Forschungsdesign, Daten und Methoden
Tabelle 4: Ausschnitt aus dem dyadischer Datensatz, Ersteinführungen Länderpaar A
B
Altlastensanierung A
B
Großfeuerungsanlagen
Wandel A (B)
A
B
Alle 22 Politiken
Wand A (B)
Wand A (B)
Int.* Int. Mod. Pio. Syn. Int. Int. Mod. Pio. Syn. Int. Mod. Pio. Syn. 1980 SWI GER
0
0
0
0
0
0
1
0
0
0
0
0
0
0
1981 SWI GER
0
0
0
0
0
0
1
0
0
0
0
0
0
0
1982 SWI GER
0
0
0
0
0
0
1
0
0
0
0
0
0
0
1983 SWI GER
0
0
0
0
0
0
1
0
0
0
4
1
3
0
1984 SWI GER
0
0
0
0
0
0
1
0
0
0
0
0
0
0
1985 SWI GER
0
0
0
0
0
0
1
0
0
0
0
0
0
0
1986 SWI GER
0
0
0
0
0
1
1
1
0
0
1
1
0
0
1987 SWI GER
0
0
0
0
0
.
1
.
.
.
0
0
0
0
1988 SWI GER
0
0
0
0
0
.
1
.
.
.
0
0
0
0
1989 SWI GER
0
0
0
0
0
.
1
.
.
.
0
0
0
0
1990 SWI GER
0
0
0
0
0
.
1
.
.
.
3
0
3
0
1991 SWI GER
0
0
0
0
0
.
1
.
.
.
2
1
1
0
1992 SWI GER
0
0
0
0
0
.
1
.
.
.
0
0
0
0
1993 SWI GER
0
0
0
0
0
.
1
.
.
.
0
0
0
0
1994 SWI GER
0
0
0
0
0
.
1
.
.
.
0
0
0
0
1995 SWI GER
1
0
0
1
0
.
1
.
.
.
2
1
1
0
1996 SWI GER
.
0
.
.
.
.
1
.
.
.
0
0
0
0
1997 SWI GER
.
0
.
.
.
.
1
.
.
.
1
0
1
0
1998 SWI GER
.
1
.
.
.
.
1
.
.
.
0
0
0
0
1999 SWI GER
.
1
.
.
.
.
1
.
.
.
0
0
0
0
2000 SWI GER
.
1
.
.
.
.
1
.
.
.
0
0
0
0
*
Int. = Ersteinführung; Mod. = Modellwandel; Pio.= Pionierwandel; Syn.=synchroner Wandel
3.3 Abhängige Variable: Policy-Wandel in der Umweltpolitik
123
Nach diesem Schema werden die Variablen für die Ersteinführung aller 22 Politiken berechnet.50 Um die einzelnen Schritte der Berechnung und die Gestalt des dyadischen Datensatzes besser zu illustrieren, wird in Tabelle 4 ein Auszug aus dem Datensatz dargestellt. Er zeigt die Einführung zweier Politiken in der Schweiz mit Bezug auf das Referenzland Deutschland für die Jahre 1980 bis 2005. Hier zeigt sich für die Regulierung der Altlastensanierung, dass die Schweiz im Jahr 1995 eine Policy einführte, während dies in Deutschland erst 1998 geschah. Bezogen auf Deutschland ist die Schweiz in diesem Fall ein Pionier und erhält dementsprechend den Wert 1. Alle Jahre nach 1995 fallen für diese Policy und die Schweiz aus der Wertung. Für die Policy zur Regulierung der Emissionen von Großfeuerungsanlagen sieht die Situation anders aus. Hier gab es in Deutschland seit 1974 ein Gesetz, während die Schweiz erst 1986 nachzog. Sie hätte sich damit zumindest theoretisch am Modell Deutschland orientieren können. Daher findet sich nun in der Spalte zu Modellwandel der Wert 1. Zum Konzept der „directed dyads“ gehört, dass es an einer anderen Stelle im Datensatz das Paar Deutschland-Schweiz gibt, das komplementär zum gezeigten Beispiel für die Altlasten die Schweiz als potenziellen Modellgeber für Deutschland identifiziert, für die Regulierung von Großfeuerungsanlagen jedoch Deutschland als Vorreiter sieht. In den letzten vier Spalten der Tabelle findet sich das Ergebnis der Aggregation aller 22 Items. Hier kann man erkennen, dass in einem Jahr mehr als eine Ersteinführung möglich ist, in der Schweiz waren es im Jahr 1983 insgesamt vier Innovationen. Für die weitere Analyse wird jedoch auch diese Variable dichotomisiert. Darüber hinaus zeigt sich, dass bei der Berücksichtigung des gesamten Repertoires die Fälle nach der Einführung einer einzelnen Policy nicht verloren gehen.
3.3.3.2 Policy-Wandel als Veränderung von Standards Für Umweltstandards wird eine ähnliche Form der abhängigen Variablen entwickelt, die jedoch an einigen Stellen von der Operationalisierung von Wandel bei Ersteinführungen abweicht. Durch den metrischen Charakter von Grenzwerten und quantifizierten Politikzielen kann nicht nur die Richtung einer Politikveränderung – also die Verschärfung oder Lockerung einer Regulierung, sondern auch die graduelle Ähnlichkeit zwischen den Ländern eines Paares gemessen werden. Dies lässt Rückschlüsse auf das Ausmaß von Konvergenz beziehungsweise Divergenz zu.
50
Eine Übersicht über alle Formen der abhängigen Variablen bietet die ausführliche deskriptive Analyse in Kapitel 4.
123
124
3 Forschungsdesign, Daten und Methoden
Die Variable wird in drei Schritten konstruiert. Zuerst wird die Veränderung eines Standards in Land A durch den Vergleich des absoluten Niveaus zu zwei Zeitpunkten errechnet: (5a) SC Ai ,'tx
S Ai ,tx S Ai ,t ( x1)
Dabei ist SC die Veränderung eines Standards in der jeweiligen Maßeinheit, und SAi der Standard i in Land A. Soll die Veränderung über verschiedene Standards hinweg verglichen werden, so muss man die Werte aufgrund unterschiedlicher Maßeinheiten z-transformieren.51 Um ein gewisses Maß an Vergleichbarkeit mit der Analyse von Ersteinführungen herzustellen, wird eine DummyVariable gebildet, die nur die Information enthält, ob sich der Standard zwischen zwei Messpunkten in irgendeiner Weise verändert hat:52 n
(5b)
DSC A,'tx
¦ DSC
Ai ,'tx
1
Dieses Verfahren kann für alle Standards einzeln durchgeführt, die Ergebnisse werden im Anschluss daran für alle n=17 Luft-, Wasser-, und Lärmgrenzwerte bzw. Müllziele aggregiert. Da sich Standards immer wieder ändern können, muss für sie kein Sättigungsfaktor integriert werden. Ansonsten vollzieht sich die Aggregation wie bei den Ersteinführungen, so dass entweder eine Variable mit einer Skala von 0 bis 17 vorliegt, oder, aus den selben gründen wie bei Ersteinführungen, eine vereinfachte dichotome Variable. Die Dummy-Variable für die Veränderung eines Standards (DSC) für das Land A kann dabei Informationen über die Existenz einer Veränderung, durch das Hinzufügen einer zusätzlichen Bedingung aber auch zur Richtung enthalten, so dass Dummy-Variablen für den Aufwärts- und den Abwärtswandel entstehen.53 Dabei beschreibt DSU eine Verschärfung und DSD eine Lockerung in Land A: n
(5c)
DSU A,'tx
¦ DSC
Ai ,'tx
; SC Ai ,'tx 0
1
51 52 53
Wird die ursprüngliche Skala bei den Müllzielen umgekehrt, ist die Richtung aller Standards einheitlich. Ein geringer Wert bedeutet damit immer eine strenge Politik. Zu einer Veränderung zählt dabei auch die Ersteinführung eines Standards. Die Ersteinführung eines Standards wird immer als Aufwärtsbewegung gewertet. Auch die geringste Vorschrift stellt eine größere Einschränkung dar als gar keine Regulierung.
3.3 Abhängige Variable: Policy-Wandel in der Umweltpolitik
125
bzw. n
(5d )
DSDA,'tx
¦ DSC
Ai ,'tx
; SC Ai ,'tx ! 0
1
In einem zweiten Schritt kann die Ähnlichkeit auf der Ebene von Länderpaaren wie folgt gemessen werden (vgl. Holzinger, Knill und Sommerer 2008; Sommerer, Holzinger und Knill 2008):
(5e) SS ( AB )i ,'tx
1
S Ai ,tx S Bi ,tx max Si min Si
Für die Ähnlichkeit eines Standards (SS) der Länder A und B wird der Unterschied im absoluten Niveau der Regulierung verglichen. Diese Differenz wird durch zwei Faktoren verändert. Zum einen wird ihre Quadratwurzel berechnet, um zu vermeiden, dass Ausreißer durch große, jedoch skalenabhängige Änderungen, das Ergebnis zu stark beeinflussen. Zum anderen wird die Skala durch die Spannweite der empirischen Verteilung gewichtet (maxi - mini ), um Änderungen über die Zeit vergleichbar zu machen. Durch die Subtraktion von 1 erhält man einen Ähnlichkeitswert zwischen 0 und 1, wobei 1 vollständige Ähnlichkeit bedeutet. Wird der Ähnlichkeitswert aus (5e) für zwei Zeitpunkte berechnet, kann Konvergenz oder Divergenz auf der Ebene von Länderpaaren erkannt werden. Drittens erfolgt analog zu den Variablen für die Ersteinführung auch für Standards eine Spezifikation konditionalen Policy-Wandels. Ausgehend von der Dummy-Variablen aus (5b) gilt für Modell-Wandel, dass eine Veränderung des Regulierungsniveaus in Land A mit der Existenz eines Standards in Land B in tx-1 einhergehen muss (DSBi): n
(6) DSC A( B ),'tx
¦ DSC
Ai ,'tx
u DS Bi ,t ( x1)
1
Für konditionalen Wandel in Land A in Form von Pionierverhalten gilt analog, dass in Land B weder in tx noch in tx-1 kein Standard i in Kraft sein darf: n
(7) DSC A( B ),'tx
¦ DSC
Ai ,'tx
u (1 DS Bi ,t ( x1) ) u (1 DS Bi ,tx ) )
1
125
126
3 Forschungsdesign, Daten und Methoden
Schließlich existiert auch hier die Möglichkeit der parallelen Änderung von Grenzwerten: n
(8) DSC A( B ),'tx
¦ DSC
Ai ,'tx
u DSC Bi ,'tx )
1
Ebenso wie bei der Veränderung eines Standards in Land A können auch die drei Typen konditionalen Wandels in Bezug auf Richtung und Ähnlichkeit spezifiziert werden, um so den zusätzlichen Informationsgehalt von metrischen Standards hinreichend auszuschöpfen. Vor allem für Modellwandel aus Gleichung (6) bestehen eine Reihe von Möglichkeiten zur weiteren Spezifikation, die in Tabelle 5 zusammengefasst sind. Tabelle 5: Spezifikation konditionalen Wandels bei Umweltstandards Annäherung A an B
Abweichung A von B
(I) SSAB,tx > SSAB, t(x-1) (II) (Ia)
SSAB,tx < SSAB, t(x-1)
SSAB,tx > SSAB, t(x-1) SSAB,tx = 1
Aufwärtswandel in A
Abwärtswandel in A
(III)
(V)
(VI)
SA,tx