Sebastian Pickerodt Informationsgiiterhandel mit Hilfe autonomer Agenten
m
--!
0 ~cJ
Z
m
c~ -r
ml
i r a .
i-...
6 downloads
441 Views
11MB Size
Report
This content was uploaded by our users and we assume good faith they have the permission to share this book. If you own the copyright to this book and it is wrongfully on our website, we offer a simple DMCA procedure to remove your content from our site. Start by pressing the button below!
Report copyright / DMCA form
Sebastian Pickerodt Informationsgiiterhandel mit Hilfe autonomer Agenten
m
--!
0 ~cJ
Z
m
c~ -r
ml
i r a .
i--!-
"--"1
m , ,
C
""l
c~
i--!-
t-..
t~J
""qL
t'--
.-.-I
O
0
Q
C~
C.Q
9l 6
,.,,,.,.,.
!~
(1~
"
"-'l
t--
c.~
t,-
3
Cl~
C0 ,-!
3
O
0
CZ
~'0
mmom
~
ram,,
m
m
~" 1~
lml, L
IZ"
O
r o l l
,-e.
O
~
m
r-i-
0 t,-,J
m , ,
i..,-!ram.
Bibliografische Information Der Deutschen Nationalbibliothek Die Deutsche Nationalbibliothek verzeichnet diese Publikation in der Deutschen Nationalbibliografie; detaillierte bibliografische Daten sind im Internet iiber abrufbar.
Dissertation Universit~it Marburg, 2005
1. Auflage November 2006 Alle Rechte vorbehalten 9 Deutscher Universit~ts-Verlag I GWV Fachverlage GmbH, Wiesbaden 2006 Lektorat: Brigitte Siegel/Britta GShrisch-Radmacher Der Deutsche Universit~ts-Verlag ist ein Unternehmen von Springer Science+Business Media. www.duv.de
"
Das Werk einschliel~lich aller seiner Teile ist urheberrechtlich geschiJtzt. Jede Verwertung aul~erhalb der engen Grenzen des Urheberrechtsgesetzes ist ohne Zustimmung des Verla.gs unzul~issig und strafbar. Das gilt insbesonderefiJr Vervielf~iltigungen, Ubersetzungen, Mikroverfilmungen und die Einspeicherung und Verarbeitung in elektronischen Systemen.
Die Wiedergabe von Gebrauchsnamen, Handelsnamen,Warenbezeichnungen usw. in diesem Werk berechtigt auch ohne besondere Kennzeichnung nicht zu der Annahme, dass solche Namen im Sinne der Warenzeichen- und Markenschutz-Gesetzgebung als frei zu betrachten w~ren und daher von jedermann benutzt werden diJrften. Umschlaggestaltung: Regine Zimmer, Dipl.-Designerin, Frankfurt/Main Druck und Buchbinder: Rosch-Buch, Schel~litz Gedruckt auf s~urefreiem und chlorfrei gebleichtem Papier Printed in Germany ISBN-IO 3-8350-0401-8 ISBN-13 978-3-8350-0401-6
Geleitwort Anbieter von Informationsgiitern im Internet experimentieren gegenw~tig mit vielf'eiltigen neuen GeschMtsmodellen. Eine einfache 0bertragung der traditionellen, auf physischen Tr~igermedien wie Biichern, CDs, DVDs, Zeitschriften oder Zeitungen beruhenden Modelle erweist sich h~iufig als schwierig, zumindest wird auf diesem Wege keine optimale Nutzung der neuen MSglichkeiten des digitalen Vertriebs erreicht. In der vorliegenden Arbeit wird ein GeschMtsmodell untersucht, das auf der Idee beruht, von jedem Nachfrager genau den Preis zu verlangen, den er zu bezahlen bereit ist. Dadurch kann zum einen der Anbieter seinen Gewinn gegeniiber der Situation eines Einheitspreises steigern, zum anderen entstehen aber auch ffir die Nachfrager insgesamt Vorteile, da auch diejenigen mit einer Zahlungsbereitschaft unterhalb des sonst geforderten Preises bedient werden kSnnen. Die Ermittlung der Zahlungsbereitschaft wird durch Programme realisiert, die im Auftrag von Verkiiufer und K~iufer in Verhandlungen treten. Diese Idee wird hier mit Hilfe einer Simulation iiberpriift. Zur Entwicklung dieser Simulation wird ein interdisziplin~irer Ansatz gewfi~hlt, der Gesichtspunkte der 5konomischen Theorie mit Ergebnissen und Methoden aus dem Bereich der (Wirtschafts-)Informatik verkniipft. Es werden zwei miteinander in Beziehung stehende 5konomische Fragen erSrtert: Zum einen ist zu kl~iren, auf welchen Preis sich rationale Verhandlungspartner aus theoretischer Sicht in Verhandlungssituationen wie der oben angedeuteten einigen werden und welche Einflussfaktoren die Einigung beeinflussen. Zum anderen ermSglicht die 5konomische Spieltheorie auch eine Untersuchung des Verhaltens der Akteure, der Verhandlungsstrategien also, die zu den prognostizierten Ergebnissen ffihren. Die dabei gewonnenen Erkenntnisse flie~en sowohl in die Auswahl des in der Simulation eingesetzten Verhandlungsprotokolls ein als auch in die Algorithmen, die das Verhalten der Verhandlungsprogramme bestimmen. Informatik und Wirtschaftsinformatik besch~ftigen sich bereits seit einiger Zeit mit der Koordination mehrerer autonomer Programme, wobei
VI
Geleitwort
auch Verhandlungen als mSgliche Koordinationsmethode betrachtet werden. WfiJarend ffir die Forschung im Bereich verteilter kiinstlicher Intelligenz zun/ichst die Reduktion der Komplexit/it eines von den unabh/ingigen Einheiten gemeinsam zu 15senden Problems im Vordergrund stand, werden in der Literatur zu Multiagentensystemen bereits Zielkonflikte und daraus entstehende Konflikte beziiglich der Allokation von Ressourcen thematisiert. Ein unmittelbarer Einsatz der dort entwickelten Verfahren, insbesondere der vorgeschlagenen Standards zu Kommunikationssprachen, ist jedoch aufgrund der generell kooperativen Ausrichtung der Agenten hier nicht ohne Weiteres mSglich. Bereits existierende Systeme, in denen dezentrale Preisverhandlungen zwischen eigeninteressierten Agenten stattfinden, bilden in der Regel polypolistische Marktstrukturen ab, w/ihrend in dem hier untersuchten Fall ein einzelner Verk/iufer, der Inhaber der Urheberrechte an den Informationsgiitern ist, mehreren K/iufern gegeniiber steht. Die in der 5konomischen und spieltheoretischen Literatur identifizierten LSsungsans~itze und die auf die Problemstellung anwendbaren Prinzipien der Agentenliteratur aus der Informatik flietgen in die Entwicklung eines eigenen Simulationssystems ein. Beim Entwurf dieses Systems mit Hilfe der Beschreibungssprache UML und der Implementierung in Java greift der Verfasser auf aktuelle Methoden der Wirtschaftsinformatik zuriick. Die Ergebnisse der Simulation best/itigen die vermuteten Vorteile der verhandlungsbasierten Preisdifferenzierung und lassen eine weitere Beschfigtigung mit dem Ansatz in Richtung einer ,,produktionsreifen" LSsung lohnend erscheinen.
Paul Alpar
Vorwort
Die Idee zu der vorliegenden Arbeit entstand in der Blfitezeit der ersten Generation der MusiktauschbSrsen im Internet. Es war absehbar, dass aus dieser Entwicklung ffir die Anbieter von Giitern, die hier als Informationsgiiter bezeichnet werden, erhebliche Probleme entstehen kSnnten. Unmittelbar war zuerst die Musikindustrie betroffen, deren Produkte durch die Entwicklung des MP3-Kompressionsverfahrens plStzlich in grot~en Mengen fiber die damals bestehende Netzinfrastruktur verteilt werden konnten. Allerdings war das Problem anfangs kaum spfirbar, da die Zahl der Konsumenten, die fiberhaupt das Internet nutzten, noch relativ gering war. Alle Tendenzen deuteten aber darauf hin, dass die Zahl der Nutzer in den kommenden Jahren schnell wachsen und die Leistungsf~ihigkeit der Infrastruktur erheblich gesteigert werden wfirde. Damit wfirde sich das Problem sowohl fiir die einzelnen betroffenen Branchen vergrSt~ern als auch weitere Branchen, z.B. die Filmindustrie, erreichen. Die Abhilfen, die damals in erster Linie diskutiert wurden, waren entweder technischer oder rechtlicher Natur: Durch technische Kopierschutzbzw. Rechtemanagementsysteme sollte die Verbreitung urheberrechtlich geschfitzen Materials erschwert werden, und die Versch~ixfung von Gesetzen sollte von der Nutzung illegaler Verbreitungsformen abschrecken. In beiden Bereichen wurden inzwischen einige Fortschritte erzielt, die zwar aus Anbietersicht m6glicherweise zu einer Linderung fiihren, aus den verschiedensten Griinden jedoch nicht unumstritten sind. Erw~hnt seien hier nur die mangelnde Herstellerneutralit~it einiger der genutzten Kopierschutzverfahren, die Einschr~h-lkung der von vielen Bfirgern als legitim erachteten Rechte zur Anfertigung privater Kopien sowie die Quasi-Kriminalisierung zahlender Kinobesucher durch drastische Hinweise auf juristische Konsequenzen der Filmpiraterie. Als Okonom mit einer Spezialisierung in Wirtschaftsinformatik und Doktorand an einer Professur fiir Electronic Commerce interessierten mich nicht so sehr die Mittel zur Symptombeldimpfung, sondern die Frage, ob sich nicht durch den Einzug des Internet und des PC in immer mehr Haushalte
VIII
Vorwort
grunds/itzlich neue MSglichkeiten der Vermarktung von Informationsgiitern bieten. Der in dieser Arbeit vorgestellte Ansatz ist das Ergebnis meiner Bemiihungen, 5konomische Theorie und Methoden der Wirtschaftsinformatik (und teilweise der angewandten Informatik) zu einer LSsung zu verkn/ipfen, die sowohl fiir die Anbieter neue Potenziale erschliefgt als auch aus Sicht der Nachfrager gentigend Vorteile bietet, um den Anreiz zur Beschaffung von Raubkopien zu verringern. Im Laufe meiner Besch~fftigung mit der Thematik musste ich feststellen, dass die Verbindung verschiedener Elemente aus zwei in ihren Erkenntniszielen und ihren wissenschaftlichen Paradigmata recht verschiedenen F~ichern zu einer in sich geschlossenen Argumentationen eine ganze Reihe von Fallen und Stolpersteinen bereit h/ilt. Ob es mir dennoch gelungen ist, mSchte ich dem Urteil des geneigten Lesers anheimstellen. Meinem Doktorvater, Herrn Prof. Dr. Paul Alpar, habe ich, neben vielem anderem, besonders dafiir zu danken, dass er mir die Freiheit lieIg, diesen Versuch, dessen Schwierigkeiten er sicherlich genauer vorhersehen konnte als ich selbst, dennoch zu unternehmen. Herrn Prof. Dr. Ulrich Fehl mSchte ich dafiir danken, dass er ohne ZSgern bereit war, die Zweitbegutachtung meiner Arbeit zu iibernehmen. Viele Anregungen, Ermutigung und Unterstiitung fand ich in zahlreichen fruchtbaren Diskussionen mit meiner Kollegin Dr. Annette Kleinbrod und meinen Kollegen Dipl.-Wirtschaftsmath. Patrick Noll, Dr. Markus Pfuhl, Dr. Dr. Marcus Porembski sowie Dr. Nils Stieglitz. Ihnen gilt mein besonders herzlicher Dank. Allen Kollegen am Institut fiir Wirtschaftsinformatik danke ich fiir die stets angenehme, konstruktive und freundschaftliche Arbeitsatmosph/ire. Einige Menschen haben in unschiitzbarer Weise zum Abschluss meiner Arbeit beigetragen, indem sie mich immer dann merken lieIgen, dass sie an mich und mein Vorhaben glaubten, wenn meine eigenes Vertrauen zu schwinden drohte. Von ihnen seien hier nur Agnieszka Wi~niewska, Johanna und Gerhart Pickerodt sowie Daniel Bormuth namentlich genannt. Ihnen und den nicht namentlich Erwiihnten gilt meine grotge Dankbarkeit.
Sebastian Pickerodt
Inhaltsverzeichnis
1
1
Einleitung
1.1
Ausgangsproblem
1.2
Fragestellung der Arbeit u n d Vorgehensweise . . . . . . . . . .
4
2
I n f o r m a t i o n als W i r t s c h a f t s g u t
9
2.1
Der Begriff I n f o r m a t i o n . . . . . . . . . . . . . . . . . . . . . .
2.1.1
Umgangssprachliche Bedeutung
2.1.2
D i m e n s i o n e n des wissenschaftlichen Informationsbegriffs . . . .
.........................
1
9
.................
9 10
2.1.2.1 Informationstr~iger . . . . . . . . . . . . . . . . . . . . . . . . .
10
2.1.2.2 Zweckbezug . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
13
2.1.2.3 Semiotische Dimension
15
......................
2.1.2.4 Zeitbezug . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
18
2.1.2.5 N e u h e i t s g r a d . . . . . . . . . . . . . . . . . . . . . . . . . . . .
19
2.1.2.6 W a h r h e i t s g e h a l t
20
..........................
2.1.3
Der Informationsbegriff dieser Arbeit
..............
21
2.2
Eigenschaften von I n f o r m a t i o n s g i i t e r n . . . . . . . . . . . . . .
25
2.2.1
I n f o r m a t i o n in der S y s t e m a t i k der Gfiter
2.2.2
Information und Knappheit ....................
27
2.2.3
T y p e n von I n f o r m a t i o n s g i i t e r n . . . . . . . . . . . . . . . . . .
29
2.2.4
Digitale I n f o r m a t i o n s g i i t e r
31
2.3
Z a h l u n g s b e r e i t s c h a f t fiir I n f o r m a t i o n s g i i t e r
2.3.1
Q u a n t i t a t i v e A s p e k t e von I n f o r m a t i o n . . . . . . . . . . . . . .
2.3.1.1 E n t r o p i e
............
25
.................... ...........
33 34
. . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
34
2.3.1.2 Logon u n d M e t r o n . . . . . . . . . . . . . . . . . . . . . . . . .
36
2.3.2
38
MikroSkonomische Nachfraget heorie . . . . . . . . . . . . . . .
2.3.2.1 Pr~ferenzen u n d N u t z e n f u n k t i o n e n . . . . . . . . . . . . . . . .
38
2.3.2.2 V o n - N e u m a n n - M o r g e n s t e r n - N u t z e n f u n k t i o n . . . . . . . . . . .
41
2.3.2.3 A b l e i t u n g der Nachfrage aus den P r M e r e n z e n . . . . . . . . . .
44
2.3.3
T h e o r i e der H a u s h a l t s p r o d u k t i o n . . . . . . . . . . . . . . . . .
45
2.3.4
K~iuferverhalten aus der P e r s p e k t i v e des M a r k e t i n g
......
48
X
Inhaltsverzeichnis
2.3.5
Normative Bestimmung des Informationswertes in Entscheidungssituationen . . . . . . . . . . . . . . . . . . . . . . . . . . 2.3.5.1 Der Einfluss der Flexibilit~it . . . . . . . . . . . . . . . . . . .
51 53
2.3.5.2 Der Einfluss der Ergebnis- und der Nutzenfunktion . . . . . . 2.3.5.3 Der Einfluss des Grades der Ungewissheit ...........
54 55
2.3.5.4 Der Einfluss der Informationsstruktur . . . . . . . . . . . . . .
56
2.3.6 2.4
Probleme bei der Bewertung yon Informationsgiitern Zusammenfassung . . . . . . . . . . . . . . . . . . . . . . . . .
3 3.1
Vermarktung von Informationsgiitern Preisdifferenzierung . . . . . . . . . . . . . . . . . . . . . . . .
.....
57 62 65 65
3.2
Die Coase-Vermutung . . . . . . . . . . . . . . . . . . . . . . .
3.3 3.3.1
Intertemporale Preisdifferenzierung mit dauerhaften Giitern Das Grundmodell . . . . . . . . . . . . . . . . . . . . . . . . .
66
3.3.2 3.3.3
Rationale Erwartungen der Konsumenten . . . . . . . . . . . . Kontinuierliche vs. diskrete Zeit . . . . . . . . . . . . . . . . .
74
3.4 3.4.1 3.4.2 3.4.3 3.5
Biindelung und Abonnements . . . . . . . . . . . . . . . . . . Grundlagen zur Bfindelung . . . . . . . . . . . . . . . . . . . . Modelle mit zwei Gfitern . . . . . . . . . . . . . . . . . . . . . Modelle mit mehr als zwei Giitern . . . . . . . . . . . . . . . . Zusammenfassung . . . . . . . . . . . . . . . . . . . . . . . . .
78 78 80 87 91
4 4.1
Spieltheoretische Verhandlungsmodelle Grundbegriffe der Spieltheorie . . . . . . . . . . . . . . . . . .
93 94
4.1.1 4.1.2
"Spiele" und rationales Verhalten . . . . . . . . . . . . . . . . . Kooperative und nicht-kooperative Spieltheorie . . . . . . . . .
94 97
4.1.3 4.1.4
Formale Darstellung von Spielen . . . . . . . . . . . . . . . . . Strategien und die strategische Form eines Spiels . . . . . . . .
98 104
.
69 69
77
4.1.5
Gleichgewichte, Gleichgewichtspunkte und LSsungen . . . . . .
107
4.2
Verhandlungen aus 5konomischer Perspektive . . . . . . . . . .
108
4.3 4.3.1 4.3.2
Einstufige Verhandlungsmodelle . . . . . . . . . . . . . . . . . Modell der Verhandlungssituation . . . . . . . . . . . . . . . . Axiomatische LSsung . . . . . . . . . . . . . . . . . . . . . . .
110 110 112
4.3.3 4.4
Nicht-kooperative LSsung . . . . . . . . . . . . . . . . . . . . . 115 Sequentielle Verhandlungsmodelle mit vollst~indiger Information 117
4.4.1
Grundmodell sequentieller Verhandlungen mit abwechselnden Angeboten
.............................
117
Inh al tsverzei chnis 4.4.2
XI
ZeitprMerenzen und Auszahlungsfunktionen der Akteure
. . . 120
4.4.3
Nash-Gleichgewichte des sequentiellen Verhandlungsmodells
4.4.4
Teilspiel-perfekte Gleichgewichte . . . . . . . . . . . . . . . . .
4.4.5
T P G fiir sequentielle V e r h a n d l u n g s m o d e l l e - allgemeiner Fall . 126
. 123 124
4.4.6
Spezielle F~ille des sequentiellen Verhandlungsmodells . . . . .
132
4.4.7
Variationen des sequentiellen Verhandlungsmodells . . . . . . .
134
4.5
Verhandlungsmodelle mit einseitig u n v o l l s t ~ d i g e r Information 137
4.5.1
Die Rolle von Informationen in spieltheoretischen Verhand-
4.5.2
Das Grundmodell
lungsmodellen
...........................
137
.........................
140
4.5.3
Sequentielles und stationiires Gleichgewicht . . . . . . . . . . .
141
4.5.4
Einseitige Gebote durch den Verkiiufer
144
4.5.5
Exkurs: Weitere Ergebnisse zum Monopol mit dauerhaften
4.5.6
Abwechselnde Gebote . . . . . . . . . . . . . . . . . . . . . . .
151
Giitern
.............
...............................
147
4.6
Zweiseitige unvollst~indige Information . . . . . . . . . . . . . .
154
4.7
Anreizkompatible Verhandlungsmechanismen . . . . . . . . . .
156
4.8
Zusammenfassung . . . . . . . . . . . . . . . . . . . . . . . . .
159
5
A u t o m a t i s i e r t e Verhandlungen zwischen Softwareagenten
161
5.1
Softwareagenten und M u l t i a g e n t e n s y s t e m e
161
5.1.1
Der Begriff Softwareagent . . . . . . . . . . . . . . . . . . . . .
...........
161
5.1.2
Typologie von Softwareagenten . . . . . . . . . . . . . . . . . .
165
5.1.3
Systeme mit mehreren Agenten . . . . . . . . . . . . . . . . . .
168
5.1.3.1 Verteiltes ProblemlSsen vs. M u l t i a g e n t e n s y s t e m e . . . . . . . .
168
5.1.3.2 Koordinationsbedarf . . . . . . . . . . . . . . . . . . . . . . . .
169
5.1.3.3 Koordinationsmodelle . . . . . . . . . . . . . . . . . . . . . . .
170
5.1.4
172
Direkte Kommunikation zwischen Softwareagenten . . . . . . .
5.1.4.1 Transportschicht . . . . . . . . . . . . . . . . . . . . . . . . . .
173
5.1.4.2 Sprachschicht . . . . . . . . . . . . . . . . . . . . . . . . . . . .
174
5.1.4.3 Kommunikationsrichtlinien und Protokolle
...........
175
5.1.4.4 Architektur . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
176
5.1.5
179
Agentenkommunikationssprachen . . . . . . . . . . . . . . . . .
5.1.5.1 Exkurs: Theorie der Sprechakte
.................
179
5.1.5.2 Nachrichtentypen in Agentenkommunikationssprachen . . . . .
180
5.1.5.3 Nachrichteninhalte in Agentenkommunikationssprachen . . . .
188
Inh al ts verzei chnis
XII
5.1.5.4 Zur Anwendbarkeit von ACL in automatisierten Verhandlungen 189 5.2
Verhandlungen zur Koordination in Multiagentensystemen
5.2.1
Taxonomie automatisierter Verhandlungen
5.2.1.1 Kardinalit~it der Verhandlung 5.2.1.2 Merkmale der Agenten
. . 190
...........
190
..................
191
......................
5.2.1.3 Merkmale der U m g e b u n g und der Giiter
192 ............
192
5.2.1.4 Ereignisparameter . . . . . . . . . . . . . . . . . . . . . . . . .
193
5.2.1.5 I n f o r m a t i o n s p a r a m e t e r
193
5.2.1.6 Allokationsparameter
...................... .......................
193
5.2.2
Verhandlungsprotokolle . . . . . . . . . . . . . . . . . . . . . .
193
5.2.3
Entscheidungsmodelle fiir Agenten in automatisierten Verhandlungen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
5.2.3.1 Handlungsoptionen
195
........................
195
5.2.3.2 Spieltheoretisch motivierte Entscheidungsmodelle
.......
197
5.2.3.3 Heuristische Entscheidungsmodelle . . . . . . . . . . . . . . . .
204
5.3
211
Zusammenfassung . . . . . . . . . . . . . . . . . . . . . . . . .
6
Automatisierte Verhandlungen: eine Simulation
213
6.1
Spezifikation des Verhandlungsprotokolls
213
6.1.1
Nachrichtentypen
6.1.2
Ablauf der Verhandlung . . . . . . . . . . . . . . . . . . . . . . .
............
.........................
6.2
Operationalisierung der Verhandlungsstrategien
6.2.1
Strategie des Anbieters
213 213 ........
......................
6.2.1.1 Einfaches Modell der Nachfrage
.................
217
6.2.1.2 E r m i t t l u n g der Gebote und Anpassungsmechanismus 6.2.2
Strategie der Nachfrager
.....
.....................
6.2.2.1 E r m i t t l u n g der E r w a r t u n g e n
...................
6.3
Architektur und Implementierung der Simulation 0bersicht
.............................
219 220 220
6.2.2.2 Entscheidungsmechanismus . . . . . . . . . . . . . . . . . . . . 6.3.1
216 216
222 .......
223 223
6.4
Simulationsergebnisse . . . . . . . . . . . . . . . . . . . . . . .
229
6.4.1
S t r u k t u r der Ergebnisse . . . . . . . . . . . . . . . . . . . . . .
229
6.4.2
Einfluss der P a r a m e t e r
......................
6.4.2.1 Die P a r a m e t e r a l p h a und d e l t a
.................
230 230
6.4.2.2 Der P a r a m e t e r q . . . . . . . . . . . . . . . . . . . . . . . . . .
235
6.4.3
236
Homogene Zahlungsbereitschaft
.................
Inhal tsverzei chnis 6.4.4
XlII
Anwendungsszenario Nachrichtenagenturen . . . . . . . . . . .
6.4.4.1 Nachrichtenagenturen und ihre Dienstleistungen
239
........
240
6.4.4.2 Die K u n d e n der Nachrichtenagenturen . . . . . . . . . . . . . .
243
6.4.4.3 Das g e g e n w ~ t i g e Gesch~iftsmodell der Nachrichtenagenturen 6.4.4.4 Bepreisung von Einzelnachrichten mittels Verhandlungen 6.5
Zusammenfassung
7
Zusammenfassung und Ausblick
Literaturverzeichnis
.........................
. 245
. . . 248 255 257 265
Abbildungsverzeichnis 2.1
Signifikationsebenen
.........................
32
2.2
Informationsgehalt einer Nachrichtenquelle
2.3
E r w a r t u n g s n u t z e n eines risikoaversen Akteurs . . . . . . . . . . .
43
3.1
Monopolsituation . . . . . . . . . . . . . . . . . . . . . . . . . . .
67
............
36
3.2
Optimale Kaufzeitpunkte im dynamischen Monopol
3.3
E r w a r t u n g s p f a d e im dynamischen Monopol
.......
3.4
Einzelbepreisung und Biindelung durch einen Monopolisten
3.5
Aggregierte Nachfrage vs. Btindelnachfrage
71
............
76 . . .
............
81 85
4.1
B a u m s t r u k t u r eines Spiels . . . . . . . . . . . . . . . . . . . . . .
4.2
Gefangenendilemma
4.3
Vereinfachtes Roulette-Spiel . . . . . . . . . . . . . . . . . . . . .
101
4.4 4.5 4.6
Gefangenendilemma in Normalform . . . . . . . . . . . . . . . . . Menge m6glicher Verhandlungsergebnisse . . . . . . . . . . . . . Axiomatische Ableitung der Nash-LSsung . . . . . . . . . . . . .
107 111 113
4.7
Nash-Verhandlungsprozess als extensives Spiel . . . . . . . . . . .
115
4.8
Verhandlungsprozess mit abwechselnden A n g e b o t e n
120
4.9
Teilspiele und abh~ingige Teilb~iume
99
.........................
100
.......
................
4.10 MSglichkeiten von Spieler 1 . . . . . . . . . . . . . . . . . . . . . 4.11 Konstruktion der Menge E k . . . . . . . . . . . 6.1
Z u s t a n d s d i a g r a m m des Verhandlungsprotokolls
6.2
Klassendiagramm InfoBargain . . . . . . . . . . . . . . . . . . . .
125 128
. . . . . . . . . .
..........
131 215 225
6.3
Ergebnisse eines Simulationslaufs . . . . . . . . . . . . . . . . . .
6.4
Einfluss von a l p h a und d e l t a auf die Einigungspreise
...... ......
230 231
6.5
Einfluss von a l p h a und d e l t a auf die Einigungspreise
6.6
Einfluss von a l p h a und d e l t a auf die Verhandlungsdauer
6.7
Einfluss von a l p h a und d e l t a auf die Gegenwartswerte der K~iuferagenten . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
235
6.8
Der Einfluss von q auf die Einigungspreise . . . . . . . . . . . . .
236
....
233 234
A bbildungsverzeichnis
XVI
6.9
Leistungsf'&higkeit der Strategien
..................
6.10 Z a h l u n g s b e r e i t s c h a f t e n eines N a c h f r a g e r a g e n t e n 6.11 K o n s u m e n t e n - u n d P r o d u z e n t e n r e n t e . . . . . . . . . . . . . . . .
238 .........
250 253
Tabellenverzeichnis
5.1 Typen von Vermittleragenten . . . . . . . . . . . . . . . . . . . . .
178
6.1 Nachrichtentypen in InfoBargain . . . . . . . . . . . . . . . . . . .
214
6.2 Verwendete Nachfragefunktionen . . . . . . . . . . . . . . . . . . .
237
6.3 Ressortkennungen bei dpa
242
......................
6.4 Vom I P T C empfohlene Kateogrien ffir Nachrichten . . . . . . . . .
242
6.5 Vergleich von Produzentenrente, Konsumentenrente und deren Summe
.................................
251
Abkiirzungsverzeichnis
ACL . . . . . . . . . . . . .
Agent Communication Language
AFP .............
Agence France Presse
AP . . . . . . . . . . . . . .
Associate Press
CD . . . . . . . . . . . . . .
Compact Disc
CORBA . . . . . . . . .
C o m m o n Object Request Broker Architecture
DAI . . . . . . . . . . . . .
Distributed Artificial Intelligence
dpa . . . . . . . . . . . . . .
Deutsche Presse-Agentur
DPS . . . . . . . . . . . . .
Distributed P r o b l e m Solving
DVD . . . . . . . . . . . .
Digital Versatile Disc
EP
Einigungspreis
..............
FIPA . . . . . . . . . . . .
Foundation for Intelligent Physical Agents
FLBC
Formal Language for Business Communication
...........
FTP .............
File Transfer Protocol
GE . . . . . . . . . . . . . . GW ............. HTTP ...........
Geldeinheit Gegenwartswert H y p e r t e x t Transport Protocol
IP . . . . . . . . . . . . . . .
Internet Protocol
IPTC ............
International Press Telecommunications Council
ISO . . . . . . . . . . . . . .
International Organization for Standardization
ITAR-TASS
Information Telegraph Agency of R u s s i a - Telegraph
.....
Agency of the Soviet Union KQML . . . . . . . . . . .
Knowledge Query and Manipulation Language
KR . . . . . . . . . . . . . .
Konsumentenrente
MAS . . . . . . . . . . . .
Multiagentensystem
MINLP . . . . . . . . . .
Mixed Integer Nonlinear P r o g r a m m i n g
MPI . . . . . . . . . . . . .
Message Passing Interface
NewsML . . . . . . . . .
News M a r k u p Language
PC
..............
Personal C o m p u t e r
PR
..............
Produzentenrente
P REE . . . . . . . . . . .
Perfect Rational Expectations Equilibrium
PTG .............
Potenzieller Tauschgewinn
A bMirzungsverzeichnis
XX
REE .............
Rational E x p e c t a t i o n s Equilibrium
SEP .............
S u m m e der Einigungspreise
SGW ............
S u m m e der G e g e n w a r t s w e r t e
sid . . . . . . . . . . . . . . .
Sportinformationsdienst
SMB . . . . . . . . . . . . .
Server Message Block
SMTP
Simple Mail T r a n s p o r t P r o t o c o l
...........
SZB . . . . . . . . . . . . .
S u m m e der Zahlungsbereitschaften
TCP .............
Transmission Control P r o t o c o l
TPG .............
Teilspiel-perfektes Gleichgewicht
UML
............
UNESCO ........
Unified Modeling L a n g u a g e United Nations Educational, Scientific and C u l t u r a l Organization
UPI
.............
VNMN
..........
United Press I n t e r n a t i o n a l Von-Neumann-Morgenstern-Nutzentheorie
vwd . . . . . . . . . . . . .
Vereinigte W i r t s c h a f t s d i e n s t e
WWW
World Wide Web
...........
ZB . . . . . . . . . . . . . . .
Zahlungsbereitschaft
1 Einleitung 1.1 A u s g a n g s p r o b l e m Immer mehr Arten von Informationsgiitern werden in jfingerer Zeit ohne Einsatz physischer Datentrgger wie CDs (compact discs) oder DVDs (digital versatile discs) direkt fiber Computernetzwerke - insbesondere fiber das I n t e r n e t - vertrieben. Zu den Angeboten, die heute online erhgltlich sind, zghlen unter anderem Anwendungsprogramme fiir Computer, Musikaufnahmen und Spielfilme, Nachrichten und andere journalistische Produkte sowie wissenschaftliche Fachartikel. Diese Entwicklung wird ermSglicht und begiinstigt durch die stetige Steigerung der 0bertragungsbandbreiten von Netzen und der Speicherkapazitgten von Personalcomputern (PCs) sowie durch die Nutzung dieser Techniken in immer weiteren Teilen der BevSlkerung. Wfihrend bereits seit den achziger Jahren des vorigen Jahrhunderts textuelle Informationen wie Marktdaten, Nachrichten und Datenbankinhalte fiber propriertgre Computernetzwerke an bestimmte- fast ausschliet~lich professionelle- Benutzergruppen verbreitet werden, sind die technischen Voraussetzungen zur 0bertragung audiovisueller Informationsgiiter etwa seit Mitte der neunziger Jahre gegeben. Erst in den letzten Jahren beginnen Musikund Filmindustrie als klassische Produzenten solcher Inhalte das Internet als Vertriebskanal in grot~em Mat~stab zu nutzen. Zuvor behinderten vor allem die Sorge um den Schutz der Urheberrechte, Probleme mit geographisch orientierten Lizenzierungspraktiken im globalen Internet sowie die relativ geringe Verbreitung ausreichend schneller Zugangstechniken bei den privaten Haushalten eine intensivere Entwicklung des Onlinevertriebs. In diesem Sektor des elektronischen Geschgftsverkehrs, der als direkter digitaler Vertrieb bezeichnet werden kann, haben sich verschiedene Gesch~ftsmodelle etabliert. Manche Anbieter setzen vollst~indig auf den Einzelverkauf ihrer Inhalte, andere bieten ausschliet~lich Abonnements an, die sich auf einen Zeitraum oder auf eine bestimmte Anzahl von Informationsgiitern beziehen kSnnen. Teilweise setzen dieselben Anbieter Einzelverkauf und Abonnement parallel ein, wie das Beispiel wissenschaftlicher Verlage
2
1 Einleitung
zeigt, die h/iufig sowohl Abonnements ffir die Online-Ausgaben ihrer Zeitschriften als auch die MSglichkeit zum Bezug einzelner Artikel anbieten. Zudem existieren viele ffir den Nutzer freie Angebote, bei denen die Finanzierung der Inhalte fiber Werbung und teilweise auch fiber Quersubventionierung aus den Ums/itzen mit anderen Giitern erfolgt. Schlief~lich gibt es diverse Mischformen. So offerieren z.B. viele Nachrichtenmedien ein aktuelles Nachrichtenangebot kostenlos, w~ihrend umfassendere Hintergrundartikel und Archivmaterialien verkauft werden. Die Geschgtsmodelle entsprechen also weitgehend denen, die auch beim Verkauf von Informationsgiitern auf physischen Medien genutzt werden. Der wesentliche Unterschied besteht in der GrSf~e der einzeln verkauften Informationseinheiten. Statt ganzer Zeitungen oder Zeitschriften werden einzelne Artikel angeboten, und wfi~hrend Plattenfirmen die Mehrzahl der Stiicke, abgesehen von den sogenannten Singles, auf Tontr/igern lediglich zu Alben gebiindelt anbieten, sind online alle Stficke einzeln erh~iltlich. Wenn Informationsgfiter einzeln verkauft werden, geschieht dies auch beim direkten digitalen Vertrieb meist zu einem festen Preis. Manchmal werden aber Mengenrabatte gew~ihrt, z.B. wenn Online-Musikh~indler ganze Alben zu Preisen anbieten, die unter der Summe der Einzelpreise der in ihnen enthaltenen Stficke liegen. Die Gebfihren ffir Abonnements stehen in der Regel ebenfalls fiber l~kngere Zeit fest, wobei der resultierende Stfickpreis bei zeitgebundenen Abonnements von der Nutzungsintensit/it des jeweiligen Abonnenten abh~i~gt. Diese Preispolitik ist jedoch aus 5konomischer Sicht nicht optimal. Der Grund liegt in der Kostenstruktur des direkten digitalen Vertriebs. Wfi~hrend beim Vertrieb auf physischen Medien die Herstellungskosten des Tr/igermediums einen (mehr oder weniger grof~en) Teil des Preises ausmachen und somit variable Kosten darstellen, gehen beim digitalen Vertrieb die variablen Kosten gegen Null. Die Kosten zur Erstellung des Inhalts fallen nur ein einziges Mal an, es handelt sich um fixe Kosten. Die Kosten der Infrastruktur zur digitalen 0bermittlung sind im Prinzip sprungfixe Kosten, die sich nur bei 0berschreiten bestimmter Kapazit/itsgrenzen erhShen. Insgesamt ergibt sich eine subadditive Kostenstruktur, die totalen Durchschnittskosten sinken mit jeder weiteren verkauften Kopie des Informationsguts. Volkswirtschaftliche Effizienz wfirde unter diesen U m s t ~ d e n erreicht, indem jeder Nachfrager, dessen Zahlungsbereitschaft ffir das betreffende Gut
1.1 A usgangsproblem nur marginal fiber Null liegt, bedient wird, denn durch die einmal entstandenen Kosten wfirde auf diese Weise der grSf~te volkswirtschaftliche Nutzen gestiftet. Wenn das einzige mSgliche Gesch~iftsmodell darin bestiinde, das Gut zu einem festen Preis anzubieten, miisste dieser praktisch bei Null liegen. Damit kSnnte natfirlich kein privater Anbieter dauerhaft iiberleben, da er ja die Kosten ffir die Erstellung des Informationsguts zu tragen hat. Jeder Preis, der deutlich fiber Null liegt, schlief~t aber einige Nachfrager aus, obgleich sie praktisch ohne zus~tzliche Kosten ebenfalls bedient werden kSnnten. Eine hypothetische LSsung dieses Problems bestfinde darin, Informationsgfiter als 5ffentliche Giiter zu betrachten und durch Steuern oder Gebfihren zu finanzieren. Wenngleich dies in vielen Staaten teilweise- z.B. in Gestalt 5ffentlich-rechtlicher Rundfunkanstalten oder Nachrichtenagenturengeschieht, kann es doch aus den verschiedensten Grfinden - man denke nur an die Unabh~ingigkeit der Berichterstattung oder die Freiheit der K u n s t kein erstrebenswerter Weg ffir alle Informationsgfiter sein. Werden Informationsgfiter privat produziert, so ist der Produzent, bezogen auf das Angebot eines bestimmten Informationsgutes, in aller Regel Monopolist, da ihm das Urheberrecht die (weitgehend) alleinige Verwertung seines geistigen Eigentums garantiert. Er ist also frei, den Preis zu verlangen, der ihm ad~iquat erscheint. Die mikroSkonomische Theorie prognostiziert, dass er den gewinnmaximalen Preis wfi~hlen wird. Auch aus individueller Sicht des Anbieters ist diese Situation jedoch nicht wfinschenswert, da einerseits Nachfrager mit durchaus positiver, aber eben nicht ganz ausreichender Zahlungsbereitschaft ausgeschlossen werden, andererseits die mSglicherweise ebenfalls vorhandene besonders hohe Zahlungsbereitschaft mancher Nachfrager nicht ausgeschSpft wird. Ideal w~e es ffir den Anbieter, wenn er die Zahlungsbereitschaft jedes Nachfragers kennte und von jedem genau den dieser entsprechenden Preis verlangen kSnnte, eine Politik, die auch als perfekte Preisdifferenzierung bezeichnet wird. Volkswirtschaftlich w~re diese IdeallSsung fibrigens ebenso effizient wie ein Preis von Null, da alle Nachfrager bedient werden, es ~i~dert sich lediglich die Verteilung der Tauschgewinne zu Gunsten des Anbieters. Dieser Zustand ist aber nicht ohne Weiteres erreichbar.
4
1 Einleitung
1.2 Fragestellung der Arbeit und Vorgehensweise In der vorliegenden Arbeit wird eine MSglichkeit untersucht, der oben angedeuteten Idealvorstellung perfekter Preisdifferenzierung ein St/ick n~iher zu kommen. Ausgangspunkt ist die VorsteUung einer Preisverhandlung zwischen dem Anbieter und jedem einzelnen Nachfrager. Dies erscheint auf den ersten Blick angesichts der grofgen Anzahl notwendiger Einzelverhandlungen und dem relativ geringen ,,Streitwert", den der Preis eines einzelnen Informationsguts in der Regel darsteUt, illusorisch, wenn sich Anbieter und Nachfrager persSnlich gegen/ibersitzen m/issten. Die Idee, deren Umsetzbarkeit in dieser Arbeit gepr/ift werden soll, besteht darin, Anbieter und Nachfrager in den Verhandlungen durch sogenannte autonome Agenten vertreten zu lassen. Als autonome Agenten bezeichnet man in der (Wirtschafts-)Informatik Computerprogramme, die in bestimmten, meist eng umgrenzten Situationen f/Jr ihren Benutzer handeln kSnnen, ohne dass f/ir jede einzelne Entscheidung dessen Intervention notwendig ist. Damit ein Agent Entscheidungen im Sinne des Benutzers treffen kann, muss er fiber eine Repr~entation der PrMerenzen des Benutzers verf/igen, d.h. er muss dessen Ziele und Bed/irfnisse kennen. A ufgerdem muss er in der Lage sein, Handlungsalternativen danach zu beurteilen, in welchem Ma~e sie zur Erreichung der Ziele oder zur Befriedigung der Bed/irfnisse beitragen. Ein Nachfrager stattet also in dem angestrebten System einen Agenten mit einem Profil seiner Interessengebiete in Bezug auf den fraglichen Typ von Informationsg/itern aus. Dies versetzt den Agenten in den Stand, die vermutliche Zahlungsbereitschaft seines Benutzers fiir ein bestimmtes angebotenes Informationsgut zu bestimmen. Als Grundlage dient ihm dazu neben dem Interessenprofil des Benutzers eine Beschreibung des Informationsgutes, die der Agent des Anbieters zu Beginn des Verhandlungsprozesses /ibermittelt. In der anschlies Verhandlung besteht die Aufgabe des Benutzeragenten darin, einerseits einen mSglichst g/instigen Preis herauszuschlagen, andererseits aber den Kauf von f/Jr den Benutzer besonders wichtigen Informationsg/iten nicht fiber Geb/ihr hinauszuzSgern. Der Anbieter setzt seinerseits einen Agenten ein, der versucht, in den Verhandlungen mit den Agenten der Nachfrager Preise zu erzielen, die mSglichst nahe an deren jeweiliger tats~ichlicher Zahlungsbereitschaft liegen, und gleichzeitig mSglichst vielen Nachfragern das Gut zu verkaufen. Da der Ein-
1.2 Fragestellung der Arbeit und Vorgehensweise satz von Softwareagenten von den oben bereits angedeuteten Tendenzen immer leistungsf~ihigerer und gleichzeitig kostengiinstigerer Computersysteme und -netzwerke ebenfalls profitiert, scheint zumindest unter Kostengesichtspunkten ein solches GeschMtsmodell im Rahmen des MSglichen zu liegen. Es ist leicht zu erkennen, dass zur vollst~digen Realisierung des skizzierten Systems eine grof~e Zahl von Einzelproblemen gelSst werden muss. Die vorliegende Arbeit kann sich nur einem kleinen Teil von ihnen widmen, kann daher nicht bereits zu einem einsatzreifen System fiihren, wohl aber zu einer Simulation des Verhandlungsprozesses, die allerdings schon mit einer Reihe wichtiger Charakteristika ausgestattet ist, welche die zukiinftige Anwendung besitzen sollte. Diese Arbeit besch~tigt sich haupts/ichlich mit solchen Aspekten des Gesamtproblems, die ffir verschiedene Typen von Informationsgiitern gleichermaf~en relevant sind. Der Begriff des Informationsguts wird pr~izise gefasst und deren Nachfragebedingungen werden erSrtert. Unter Rfickgriff auf spieltheoretische Verhandlungsmodelle wird anschlief~end die Frage eines geeigneten Verhandlungsprotokolls- nach welchen Regeln sollen die Verhandlungen ablaufen- und geeigneter Verhandlungsstrategien fiir die Agenten beider Seiten untersucht. Weitgehend ausgeklammert wird hingegen die Frage, wie die Pr/iferenzen eines Nutzers hinsichtlich eines bestimmten Typs von Informationsgiitern in dessen Agenten repr/isentiert werden kSnnen und wie der Agent mittels dieser Wissensbasis die Bewertung konkreter angebotener Informationsgfiter vornimmt. Dies ist offenkundig ein Problem, ffir das unterschiedliche LSsungen gefunden werden mfissen, je nachdem ob das System fiir schriftliche Nachrichten, Musikaufnahmen, Spielfilme oder irgendeine andere Art von Informationsgut eingesetzt werden soll. Hier wird stattdessen mit einem einfachen Modell der Beschreibung eines Informationsguts gearbeitet, das nur dazu benStigt wird, im Rahmen der Simulation das vorgeschlagene Verhandlungsprotokoll und die erarbeiteten Strategien zu evaluieren. Im Folgenden wird der Inhalt der einzelnen Kapitel und deren Funktion im Kontext der Arbeit kurz erl/iutert. Das auf diese Einleitung folgende zweite Kapitel besch/iftigt sich mit den Begriffen ,,Information" und ,,Informationsgut". In der Literatur wird ,~Informationsgut" zwar verschiedentlich in der Weise verwendet, wie der Begriff auch in dieser Einleitung bisher
6
1 Einleitung
benutzt wurde. Es zeigt sich jedoch, dass der Begriffsbestandteil ,,Information" hier nicht ohne Weiteres dem Verst~indnis von Information entspricht, wie es andernorts in den Wirtschaftswissenschaften, der Wirtschaftsinformatik oder der Informatik fiblich ist. Es wird daher eine Definition des Begriffs zu entwickeln sein, die mit der verbreiteten Vorstellung von Informationsgiitern als Bitfolgen kompatibel ist. Anschlief~end werden wichtige Eigenschaften von Informationsgiitern erSrtert, und schlief~lich wird der Frage nachgegangen, welche Einflussfaktoren auf die Zahlungsbereitschaft fiir Informationsgiiter wirken.
Das dritte Kapitel beschMtigt sich mit den Chancen eines monopolistischen Anbieters dauerhafter Gfiter, zu denen - zumindest im Sinne der mikrSkonomischen Theorie- auch die Informationsgiiter gehSren, Preisdifferenzierung zu betreiben. Nach einer Einfiihrung in die mSglichen Formen der Preisdifferenzierung steht dabei die Gfiltigkeit der sogenannten CoaseVermutung im Mittelpunkt, nach der ein solcher Anbieter in sehr kurzer Zeit dazu gelangen wird, einen Preis in HShe der Grenzkosten zu verlangen, und demnach keine Monopolgewinne erzielen kann. Es wird eine Reihe formaler Modelle dargestellt, deren Annahmen stets zu einer Best~itigung der Coase-Vermutung fiihren. Auf~erdem werden in diesem Kapitel die Auswirkungen der Biindelung mehrerer Informationsgiiter, z.B. in Form eines Abonnements, auf die Gewinnsituation des Monopolisten und auf die volkswirtschaftliche Effizienz des jeweiligen Marktes diskutiert. Es zeigt sich, dass durch Bfindelung unter bestimmten Bedingungen, die vielfach, aber nicht in allen F~illen gegeben sind, sowohl die Gewinne des Anbieters als auch die Effizienz gesteigert werden kSnnen. Damit bietet sich das Verfahren der Biindelung als Vergleichsmaf~stab fiir das im sechsten Kapitel entwickelte Verfahren zweiseitiger Verhandlungen an. Im vierten Kapitel werden spieltheoretische Ergebnisse zu zweiseitigen Preisverhandlungen referiert. Zun~ichst wird dazu eine kurze Einfiihrung in die Grundlagen der spieltheoretischen Methode gegeben. Dies erscheint notwendig, da die Spieltheorie nicht zu den iiblichen Methoden der Wirtschaftsinformatik z~ihlt. Anschlief~end werden Modelle bilateraler Verhandlungen in der Reihenfolge aufsteigender Komplexit~it erSrtert, beginnend bei einstufigen Modellen von Nash fiber sequentielle Modelle mit vollst~indiger Information zu sequentiellen Modellen mit unvollst~indiger Information der Akteure. Die detaillierte theoretische Diskussion dieses Kapitels soll einer-
1.2 Fragestellung der Arbeit und Vorgehensweise seits dazu beitragen, ein geeignetes Verhandlungsprotokoll ffir das im sechsten Kapitel zu entwickelnde Agentensystem zu schaffen. Zum anderen soll sie die 0berlegungen beleuchten, die rational handelnde Akteure bei ihren Entscheidungen in Verhandlungen leiten, und damit eine Grundlage fiir die Spezifizierung geeigneter Verhandlungsstrategien der Agenten legen. Den Stand der Forschung im Bereich der Verhandlungen zwischen Softwareagenten fasst das fiinfte Kapitel zusammen. Zun/ichst werden dazu Grundlagen zu Softwareagenten und sogenannten Multiagentensystemen, in denen mehrere Softwareagenten zur Erreichung ihrer individuellen Ziele interagieren, dargestellt. Anschliet~end wird der Schwerpunkt auf Systeme gelegt, in denen eine Koordination mittels Verhandlungen stattfindet, und es wird eine Reihe existierender Implementierungen vorgestellt. Im sechsten Kapitel wird schlief~lich auf der Basis der Erkenntnisse aus den vorangehenden Kapiteln ein Simulationssystem entwickelt. Zun/ichst werden der allgemeine Aufbau des Systems, die Implementierung der einzelnen Agenten, das genutzte Verhandlungsprotokoll und die von den Agenten genutzten Strategien erSrtert. Anschlief~end werden Ergebnisse von Simulationsl/iufen mit verschiedenen Parametern dargestellt. Schlief~lich wird eine Evaluierung des Systems vorgenommen. Dazu wird als Beispieldom/ine das Gesch/iftsfeld der Nachrichtenagenturen gew~ihlt. Diese bieten ihre Meldungen zur Zeit fiberwiegend gebiindelt in Form von Abonnements an. Anhand von Simulationsl/iufen wird nun die Situation des Anbieters und der Nachfrager im Fall der Biindelung und im Fall des Einzelvertriebs der Nachrichten mittels des Verhandlungssystems verglichen. Konkret werden die Konsumentenrente, die Produzentenrente und deren Verh/iltnis zu den gesamten potenziellen Tauschgewinnen in den beiden F~illen einander gegeniibergestellt. Das abschlief~ende siebte Kapitel fasst wichtigsten Ergebnisse noch einmal zusammen, versucht in Form eines Ausblicks, die weiteren AnwendungsmSglichkeiten des entwickelten Systems abzusch/itzen, und gibt Hinweise auf mSgliche weiterffihrende Forschungsfragen.
2 Information als Wirtschaftsgut Information tritt in dieser Arbeit in doppelter Gestalt auf: einerseits als Objekt des Handelns wirtschaftlicher Akteure, andererseits als Determinante ihrer Handlungsplanung, also der Auswahl kiinftiger Handlungen. In diesem Kapitel geht es um ersteres: Information als Gegenstand des Handelns und Entscheidens, Information als wirtschaftliches Gut. Der Einfluss von Information auf die Entscheidungen bzw. die Strategie von Akteuren wird sp/iter im Kapitel 4 untersucht. In diesem Kapitel werden zun/ichst einige mSgliche Definitionen des Begriffs Information diskutiert, um auf dieser Basis eine ffir diese Arbeit geeignete Definition zu entwickeln. Anschliet~end werden im Abschnitt 2.2 einige wichtige Eigenschaften von Informationsgiitern und insbesondere den in dieser Arbeit behandelten digitalen Informationsgiitern betrachtet. Im Abschnitt 2.3 werden die Einflussfaktoren untersucht, die die Zahlungsbereitschaft von Informationsgfitern bestimmen. 2.1 D e r Begriff Information
2.1.1 Umgangssprachliche Bedeutung Der Begriff Information leitet sich ab von dem lateinischen Wort '~informare", das sich wSrtlich mit "in eine Form bringen" fibersetzen 1/isst. Bereits in der antiken Philosophie findet sich das Substantiv '~informatio", das in etwa die Bedeutung trug, die heute dem Ausdruck "Bildung~' zukommt. Es kann sowohl den Vorgang der Unterrichtung oder Belehrung durch einen Lehrer bezeichnen als auch dessen Ergebnis, also das Gebildetsein. Eine weitere Verwendung des Begriffs "informatio" sieht von einer Schfiler-Lehrer-Beziehung ab und meint "Bildung" durch Darlegung, Erl/iuterung oder Erkl/irung. 1 In der heutigen Umgangssprache hat sich am ehesten die zuletzt genannte Bedeutung des Begriffs erhalten. Information wird verbunden mit der Aufnahme von Kenntnissen, die oft praktischer Natur sind (Abfahrtszeit 1ygl. Seiffert, 1968, S. 25ff.
10
2 Information als Wirtschaftsgut
von Ziigen, BSrsenkurse, das Wetter morgen, etc.) oder jedenfalls einem bestimmten Zweck dienen. Dariiber hinaus werden auch die Kenntnisse selbst als Informationen bezeichnet, sowohl vor ihrer Aufnahme ("Informationen beschaffen") als auch nach ihrer Aufnahme ("fiber Informationen verfiigen", "Informationen besitzen"). Der umgangssprachliche Informationsbegriff besitzt also sowohl einen prozessualen als auch einen statischen Aspekt. 2.1.2 Dimensionen des wissenschaftfichen Informationsbegriffs Eine allgemein giiltige wissenschaftliche Definition des Begriffs Information existiert nicht. Jede der zahlreichen Disziplinen, in denen er eine - h~iufig zentrale - Rolle spielt, betont andere Aspekte, und selbst innerhalb einzelner Disziplinen wird er unterschiedlich verwendet. 2 Auch im engeren fachlichen Umfeld dieser Arbeit, der Betriebswirtschaftslehre, der Wirtschaftsinformatik sowie der 5konomischen Theorie, existieren verschiedene Definitionen. Ein ausfiihrlicher Vergleich all dieser Informationsbegriffe ist nicht Ziel dieser Arbeit. Im folgenden Abschnitt werden sechs a Dimensionen dargestellt, in denen sich verschiedene Definitionen des Informationsbegriffs unterscheiden und die somit das Begriffsfeld aufspannen. Im Rahmen der Diskussion der einzelnen Dimensionen werden beispielhaft bestimmte Definitionen dargestellt. Daran anschliet~end wird diskutiert, welche Auspdigungen entlang der einzelnen Dimensionen gewfi~hlt werden sollten, um einen fiir die Fragestellung dieser Arbeit geeigneten Informationsbegriff zu formulieren. 2.1.2.1 Informationstr~iger S/imtliche Definitionen des Informationsbegriffs stimmen darin iiberein, dass Information einer physischen, d.h. energetischen oder materiellen, R e p r ~ e n tation bedarf. Sie unterscheiden sich jedoch darin, w o u n d wodurch Information physisch repr~entiert wird. Wfi~hrend nach manchen Definitionen 2Fiir einen ~lberblick fiber einige alternative Definitionen des Informationsbegriffs vgl. Rowley, 1998. Eine breit angelegte Gegeniiberstellung der Informationskonzepte verschiedener Disziplinen von der Bibliothekswissenschaft bis zur Systemtheorie enth~lt Machlup und Mansfield, 1983a. 3Fiinf der hier gew~hlten sechs Dimensionen entsprechen den von Maier und Lehner in einem Vergleich von Informationsbegriffen in der Wirtschaftsinformatik genutzten, vgl. Maier und Lehner, 1995, S. 253. Ahnliche Dimensionen verwendet Bode in einem Vergleich betriebswirtschaftlicher Informationsbegriffe, vgl. Bode, 1997, S. 451ff. Von dort wird die Dimension des Wahrheitsgehaltes iibernommen.
2.1 Der Begriff lnformation
11
Information an das menschliche Gehirn gebunden ist, kann sie nach anderen auch unabh/ingig vom Menschen in Form von Zeichen existieren, die in Schriftstiicken oder Computerspeichern, auf Daten-, Ton- oder Bildtr/igern gespeichert sind. Menschengebundene Informationsbegriffe betonen, dass jede Wahrnehmung einer Nachricht, einer Handlung oder bestimmter Umweltbedingungen der Interpretation durch ein Individuum bedarf, bevor sie zu Information wird. a Fiir Hesse et al. ist Information ein "aufgenommener oder mitgeteilter Wissensbestandteil", 5 wobei sie unter Wissen die Gesamtheit der Wahrnehmungen, Erfahrungen und Kenntnisse eines Menschen oder einer Gruppe von Menschen fiber sich und seine bzw. ihre Umwelt verstehen. Da die Wissensebene menschengebunden ist und Information als Wissensbestandteil aufgefasst wird, ist folglich auch die Information menschengebunden. 6 Gegen eine Verortung von Information ausschliet~lich im menschlichen Gehirn spricht jedoch, dass im Verlauf der technischen Entwicklung mehr und mehr Veraxbeitungsfunktionen, die friiher ausschliei~lich Menschen vorbehalten waxen, auch maschinell durchffirbax werden. 7 Die Frage ist, ob die Informationen, auf die sich z.B. der Angestellte einer Bank bei der Priifung einer Kreditvergabe stfitzt, zu Daten werden, nur weil die Kreditprfifung von einem Expertensystem durchgeffihrt wird. Ungeachtet der unterschiedlichen inneren Funktionsweise von Gehirn und Maschine kSnnen beide im Hinblick auf die Ausfiihrung bestimmter Aufgaben substituierbax sein. 8 Daxiiber hinaus ist fraglich, ob ein Informationsbegriff, der Information auf das menschliche Gehirn beschr/inkt, terminologische Vorteile bietet gegenfiber einem weiter gefassten Informationsbegriff. Werden Informationen (auch) aui~erhalb des Gehirns lokalisiert, stellt sich die Frage nach ihrer Repr/isentation. H/iufig wird die Sprache als Informationstr/iger angesehen. So schl/igt Bode folgende Definition vor: "Informationen sind Wissensbestandteile, die in Form menschlicher Sprache repr/isentiert sind. ''9 Wissen wird hier als "jede Form der Repr/isentation von 4Vgl. Maier und Lehner, 1995, S. 259ff. 5Hesse et al., 1994, S. 42. 6Vgl. Hesse et al., 1994, S. 42. 7Vgl. Bode, 1997, S. 458. SVgl. hierzu die 0berlegung von Simon, nach der Computer und das menschliche Gehirn zu einer gemeinsamen Kategorie gehSren, den Symbol-Systemen (engl. symbol systems). Vgl. Simon, 1996, S. 21f. 9Bode, 1997, S. 459, Hervorhebung im Original.
12
2 Information Ms Wirtschaftsgut
Teilen der realen oder gedachten (d.h. vorgestellten) Welt in einem materiellen Tr~igermedium ''1~ aufgefasst. Als Sprachen werden alle natfirlichen und kiinstlichen, verbalen und non-verbalen Sprachen verstanden, die eine 0bertragung zwischen Menschen erlauben. Auch Computersprachen werden als menschliche Konstruktionen ausdrficklich eingeschlossen. In der Informationswissenschaft 11 wird die Unabh~ingigkeit von Information vom menschlichen Gehirn besonders betont. Ihr Untersuchungsobjekt stellt die Informationsarbeit dar, womit die Entwicklung und Betreuung von Informationssystemen im Sinne von On-Line-Retrieval-Systemen, Wissensbanken u./i. gemeint ist. Die Informationsarbeit umfasst die Stufen Informationserarbeitung, Informationsaufbereitung, Informationsverarbeitung, die fiber die Zwischenprodukte Relevanzinformation und aufbereitete Information schlief~lich Handlungsinformation hervorbringen, die zur LSsung von Problemen geeignet ist. 12 Zwischenprodukte und Handlungsinformation kSnnen im Rahmen der Informationsverwaltung gespeichert und wieder abgerufen werden. Letzteres zeigt, dass hier Information offenbar an die physischen Informationstr~ger gebunden ist, aus denen die jeweiligen Informationsprodukte bestehen, und nicht an das Gehirn der einzelnen Bearbeiter. 13 Am weitesten entfernt von jeglichem Bezug auf den Menschen als Informationstr~iger ist der Informationsbegriff der mathematischen Kommunikationstheorie bzw. der Informationstheorie. 14 Hier wird ausschliet~lich der technische Aspekt der 0bertragung von Nachrichten dutch Kommunikationskan~ile mit gegebener Kapazit~it und gegebenem Rauschverhalten betrachtet. Die Bedeutung der fibertragenen Information ffir menschliche
l~ 1997, S. 458. 11Die Informationswissenschaft kann als Schnittmenge von Informationstheorie, Bibliothekswissenschaft und Informatik betrachtet werden, vgl. Machlup und Mansfield, 1983b, S. 18. 12Vgl. Kuhlen, 1995. 13Vgl. Maier und Lehner, 1995, S. 227. 14Mit Informationstheorie wird hier eine formale Disziplin bezeichnet, die aus der Erweiterung der auf Shannon zuriickgehenden mathematischen Kommunikationstheorie hervor gegangen ist; vgl. Shannon und Weaver, 1949. Sie besch~iftigt sich unter anderem mit Verfahren zur Kompression von Daten sowie der Entwicklung yon Fehlerkorrekturcodes fiir die Dateniibertragung; fiir einen 0berblick vgl. MacKay, 2003. Im weiteren Rahmen der Informationstheorie wurden auch Informationsbegriffe entwickelt, die versuchen, mit formalen Methoden semantische Aspekte der Information zu erfassen; vgl. z.B. Hintikka, 1970 sowie Jamison, 1970.
2.1 Der Begriff lnformation
13
Adressaten wird dabei g~inzlich auger Acht gelassen, i5
2.1.2.2 Zweckbezug Manchmal wird als konstitutive Eigenschaft des Informationsbegriffs der Zweckbezug der Information genannt: Information sind nach dieser Auffassung nur Nachrichten oder Wissensbestandteile, die einem bestimmten Zweck dienen. In den wirtschaftswissenschaftlichen Disziplinen wird der Zweck von Information h~iufig in der Vorbereitung bzw. Verbesserung von Handlungen gesehen. Dies wird z.B. in der viel zitierten Definition von Wittmann deutlich, der Information beschreibt als "zweckorientiertes Wissen [...], das zur Erreichung eines Zweckes, n~imlich einer mSglichst vollkommenen Disposition, eingesetzt wird. ''i6 Unter Wissen versteht er Inhalte der menschlichen Vorstellung, die sich auf die Wahrheit bzw. die Wahrscheinlichkeit von Feststellungen beziehen, i7 .~hnlich bezieht sich die Informationswissenschaft direkt auf einen Zweck: Information ist hier "die Teilmenge des Wissens, die von einer bestimmten Person oder einer Gruppe in einer konkreten Situation zur LSsung von Problemen benStigt wird [...],,.is Andere Autoren halten eine solche Abgrenzung fiir zu restriktiv, da alle Verwendungen des Begriffs ausgeschlossen werden, in denen das durch Information erworbene Wissen nicht zur Vorbereitung von Entscheidungen dient, sondern z.B. den Ablauf von Prozessen steuert, aus blogem Erkenntnisinteresse erworben oder aufgrund gesetzlicher Regelungen aufbewahrt wird. Darfliber hinaus wird kritisiert, dass das Kriterium der Zweckorientierung nicht beriicksichtigt, dass Unternehmungen auch Wissen produzieren, das nicht eigenen Zwecken dient, sondern den Zwecken ihrer Kunden. i9 Gelegentlich wird der Zweck von Information in der Reduktion yon Unsicherheit gesehen. Dem liegt die Vorstellung eines pr~zise modellierten Entscheidungsproblems zu Grunde, in dem einige der relevanten GrSfgen nicht i5Vgl. Shannon und Weaver, 1949, S. 3. 16 Wittmann, 1959, S. 14. iZwittmann ist sich durchaus der Problematik bewusst, dass die Wahrheit einer Aussage nur in seltenen F~llen sicher festgestellt werden kann. Er unterscheidet daher zwischen sicherem und wahrscheinlichem Wissen, das auf Vermutungen und Meinungen beruht, aber dennoch eine notwendige Grundlage ffir Entscheidungen darstellt, vgl. Wittmann, 1959, S. 15ft. 18Kuhlen, 1995, S. i9Vgl. Bode, 1997, S. 455f.
14
2 Information als Wirtschaftsgut
genau bekannt sind und daher durch Wahrscheinlichkeitsverteilungen repr~sentiert werden mfissen. Bei den unbekannten GrSgen kann es sich um Umweltzust~inde oder um die Auswirkungen bestimmter Entscheidungen handeln. Eine Reduktion von Unsicherheit liegt vor, wenn neu erlangte Kenntnisse die angenommenen Wahrscheinlichkeitsverteilungen in eine bestimmte Richtung pr~izisieren, d.h. wenn einzelne Zust~inde bzw. Handlungswirkungen wahrscheinlicher werden und andere demnach unwahrscheinlicher. 20 Dass es sich hier um eine sehr enge Begriffsabgrenzung handelt, wird daran deutlich, dass neu hinzukommende Kenntnisse die bestehenden Annahmen ebenso gut in Frage stellen und damit die Unsicherheit vergrSgern kSnnen. 21 Ob sie in die eine oder andere Richtung wirken, ist aber oft erst dann zu beurteilen, wenn sie bereits vorliegen. Ob neue Erkenntnisse Information darstellen oder nicht, entschiede sich demnach erst nach ihrer Beschaffung und Verwendung. VSllige Zweckfreiheit ist auch mit dem kybernetisch-biologischen Informationsbegriff nicht vereinbar, der Information als nicht-energiegetriebene Wechselwirkung betrachtet. Eine Interaktion zwischen zwei Systemen ist nach diesem Verst~indnis in/ormationsbasiert, wenn sie in ihrer makroskopischen Auspr~gung nicht direkt auf die Wirkung physikalischer KrMte zuriickgeffihrt werden kann. Information ist dann das vermittelnde Element einer solchen Interaktion. "[...] it is what links the particular features or pattern in the source system A with the specific changes caused in the structure of the recipient B. ''22 Eine informationsbasierte Interaktion kann jedoch nur zustande kommen, wenn mindestens eines der Systeme A und B einen Zweck verfolgt. 23 Die notwendige Komplexit~it, um an informationsbasierten Interaktionen teilnehmen zu kSnnen, besitzen nur entweder biologische Systeme, bei denen ein evolutionsgeschichtlicher Zweck ffir diese F~ihigkeit unterstellt werden kann, oder von Menschen zu einem bestimmten Zweck geschaffene Systeme. 24 Bei einer begrilllichen Abgrenzung ist letztlich die Frage zu be2~ Nutzen zus~itzlicher Information in solchen Situationen wird in Abschnitt 2.3.5 n~iher untersucht. 21Vgl. fiir eine ~hnliche Kritik Machlup, 1983, S. 649f. 22Roederer, 2003, S. 11. 23Vgl. Roederer, 2003, S. 9f. 24Seine Erfahrung mit dieser Art technischer Systeme fiihrt Wiener zu der These, dass zwischen den Informationsverarbeitungsprozessen in Automaten und Lebewesen Analogien bestehen, die, im Rahmen der Kybernetik, eine Untersuchung mit dem gleichen Instrumentarium zulassen; vgl. Wiener, 1961.
2.1 Der Begriff lnformation
15
antworten, wie weit oder eng die Zwecke gefasst werden, die als konstitutiv fiir Information angesehen werden. 2.1.2.3 Semiotische Dimension In der Semiotik 25 wird der Prozess, in dem etwas als Zeichen fungiert, als Zeichenprozess oder Semiose bezeichnet. Dieser Prozess umfasst vier Faktoren: Das Objekt, das als Zeichen wirkt, wird Zeichentriiger genannt. Das Objekt bzw. die Klasse von Objekten, auf die das Zeichen verweist, heist Designat. Bei dem Rezipienten des Zeichens, den Interpreten, wird ein Effekt ausgelSst, durch den der Zeichentr~iger fiir ihn Zeichencharakter besitzt. Dieser Effekt wird als Interpretant bezeichnet. Vom Designat ist ein mSglicherweise vorhandenes reales Objekt zu unterscheiden, auf das das Zeichen verweist und das als Denotat bezeichnet wird. Das ErtSnen einer Feuersirene wirkt z.B. als Zeichen eines Feuers und kann bei den Rezipienten Fluchtreaktionen oder Panik auslSsen, obgleich tats~ichlich kein Feuer ausgebrochen ist. Der Zeichenprozess wird in drei Dimensionen analysiert: Syntaktik als Analyse der formalen Beziehungen zwischen mehreren Zeichen, Semantik als Analyse der Beziehung zwischen Zeichen und Designat sowie Pragmatik als Analyse der Beziehung zwischen einem Zeichen und seinem Interpreten. 26 Diese drei Dimensionen der semiotischen Analyse, die urspriinglich in einem orthogonalen Verh~iltnis zueinander stehen, werden in der wirtschaftswissenschaftlichen Literatur h~ufig vereinfachend als auf einander aufbauende Zeichen-, Bedeutungs- und Verwendungsebene der Sprache aufgefasst. 27 Nur in diesem Sinne kSnnen sie Auspr~gungen entlang einer Dimension des Informationsbegriffs darstellen. Ein Beispiel fiir einen Informationsbegriff, der ausschlie~lich die syntaktische Ebene berfihrt, ist derjenige der mathematischen Kommunikationstheorie. Nachrichten werden hier als Folgen von Symbolen aus einem Symbolvorrat betrachtet. 2s Die Bedeutung der Nachrichten wird, wie oben bereits festgestellt wurde, explizit nicht beriicksichtigt, da sie unter dem nachrich25Die Semiotik ist die Wissenschaft von den Zeichen, vgl. Morris, 1972b. 26Vgl. Morris, 1972b, S. 21ff. 27Vgl. z.B. Bode, 1997, S. 451, Maier und Lehner, 1995, S. 223. Eine ~ihnliche hierarchische Sichtweise sieht die Syntax als die Beziehung zwischen Zeichen und Daten, die Semantik als Bindeglied zwischen Daten und Information und die Pragmatik als Mittler zwischen Information und Wissen, vgl.Augustin, 1990, S. 16. 2SVgl. Shannon und Weaver, 1949, S. 7.
16
2 Information Ms Wirtschaftsgut
tentechnischen Blickwinkel dieser Theorie unerheblich ist. Die Reihenfolge der gesendeten Zeichen unterliegt aus der Perspektive eines Empfangsger~ites dem Zufall, andernfalls w ~ e die Nachricht bereits beka~nt und eine 0bertragung iiberfliissig. Allerdings kSnnen aus den syntaktischen Regeln, die bei der Erzeugung giiltiger Nachrichten befolgt werden, die Wahrscheinlichkeiten des Auftretens jedes einzelnen Zeichens abgeleitet werden. So tritt z.B. in einer natiirlichen Sprache jeder Buchstabe mit einer charakteristischen durchschnittlichen H~iufigkeit auf, dasselbe gilt fiir Buchstabentupel und ganze WSrter. 29 Information wird in dieser Theorie gleichgesetzt mit der 0berraschung, die das Auftreten eines bestimmten Zeichens verursacht, und ist somit umgekehrt proportional zu dessen Wahrscheinlichkeit. Eine besondere Eigenschaft dieses Verst~indnisses besteht darin, dass es, wie unten in Abschnitt 2.3.1 gezeigt wird, eine Quantifizierung erlaubt. Dies hat vermutlich dazu beigetragen, dass oft versucht wurde, den kommunikationstheoretischen Informationsbegriff auch in breiteren Zusammenhfiagen nutzbar zu machen. 30 Der Erfolg dieser Versuche ist jedoch umstritten, eben weil semantische Aspekte hier auger Acht gelassen werden. 31 Ein semantischer Informationsbegriff betrachtet Information als Abbildung von Teilen der realen oder gedachten Welt, ohne zu untersuchen, welche Effekte diese Abbildung auf den Empf&ager hat. Ein Beispiel stellt der Versuch von Carnap und Bar-Hillel dar, den kommunikationstheoretischen Informationsbegriff mit einer semantischen Interpretation zu versehen. 32 Dabei thematisieren sie insbesondere die Natur der Wahrscheinlichkeiten, auf denen der kommunikationstheoretische Begriff beruht. Wfi~hrend in der Kommunikationstheorie die Wahrscheinlichkeiten des Auftretens von Zeichen als H~iufigkeiten interpretiert werden kSnnen und ausschliet~lich vom Verhalten der Informationsquelle, z.B. von den syntaktischen Regeln der 29Vgl. Shannon und Weaver, 1949, 10ft. 30 Weaver spekuliert bereits in einem frfihen Kommentar zu Shannons grundlegendem Artikel zur mathematischen Kommunikationstheoriefiber deren griigeren Anwendungsbereich, vgl. Shannon und Weaver, 1949, S. 97f. Ein Uberblick findet sich z.B. in Tribus , 1983. 31Sehr kritisch ~iugern sich z.B. Machlup und Mansfield, die von einem methodologischen Desaster sprechen. Weiter schreiben sie: "In actual fact, the theory of signal transmission or activation impulses has nothing to teach that could be extended or applied to human communication, social behavior, or psychology, theoretical or experimental." Machlup und Mansfield, 1983b, S. 56. 32Vgl. Hintikka, 1970, S. 4f.
2.1 Der Begriff lnformation
17
benutzten Sprache, bestimmt sind, werden hier die Erwartungen des Empfiingers betrachtet, die als subjektive Wahrscheinlichkeiten von dessen vorherigem Kenntnisstand abh~ingen. Auch die oben dargestellte Definition von Bode, nach der Information in Form menschlicher Sprache repr~entiertes Wissen ist, stellt einen semantischen Informationsbegriff dar. Ein pragmatischer Ansatz hebt auf die Wechselwirkung zwischen der Information und dem Adressaten ab. Dies wird teilweise mit einem Zweckbezug gleichgesetzt. So f'~illt fiir Bode die Dimensionen des Zweckbezugs mit der pragmatischen Auspr~igung der semantischen Dimension zusammen, Pragmatik wird mit Pragmatismus gleichgesetzt. In diesem Sinne folgt z.B. die bereits dargestellte Definition von Wittmann dem pragmatischen Ansatz, ebenso wie der unten n ~ e r zu erSrternde prozessuale Informationsbegriff, den Kb'nig et al. ffir die Wirtschaftsinformatik entwickeln. Dem ursprfinglichen semiotischen Verst~indnis nach ist es allerdings nicht zwingend, in der Wechselwirkung die Erfiillung eines Zwecks zu sehen. Die wissenschaftstheoretischen Grundlagen der Semiotik liegen im Behaviorism u s . 33 Das semiotische Zeichen ist als Reiz zu verstehen, auf den stets ein bestimmtes Verhalten folgt. Sein Zeichencharakter driickt sich darin aus, dass das bei seinem Auftreten beobachtbare Verhalten demjenigen gleicht, das beobachtet werden kann, wenn ein Objekt der designierten Klasse von Objekten auftritt. 34 Eine Definition von Information, die im ursprfinglichen, behavioristischsemiotischen Sinne pragmatisch sein sollte, miisste also ein beobachtbares Verhalten nach dem Eintreffen der Information als konstitutive Bedingung aufnehmen. Erst wenn z.B. auf der Basis der zur Kenntnis genommenen Wissensbestandteile tats~ichlich eine Entscheidung f'~illt, kSnnte von Information gesprochen werden. Es ist kaum zu sehen, welchen Nutzen eine solche Einschr~inkung im Gebrauch des Informationsbegriffs bieten sollte. Folgt man dieser Argumentation, liegt es nahe, sich mit der semantischen Ebene zu 33Vgl. Fliickiger, 1995, S. 23. Beim Behaviorismus handelt es sich um eine Spielart des Positivismus, ffir die wissenschaftliche Erkenntnisse fiber Lebewesen und insbesondere Menschen nur gewonnen werden kSnnen, indem gezeigt wird, dass auf einen bestimmten Reiz (Stimulus) stets eine bestimmte Reaktion (Response) folgt. Der Versuch, interne psychologische Mechanismen zu ergriinden, die vom Auftreten des Reizes zur Beobachtung der Reaktion fiihren, wird explizit abgelehnt, da solche mentalen Zust~inde nicht beobachtbar sind. Vgl. Graham, 2002. 34Vgl. Morris, 1972b, S. 21.
18
2 Information Ms Wirtschaftsgut
begn/igen. Es zeigt sich aber auch, dass die Pragmatik gewissermagen der Feststellung des Zeichencharakters dient: Wenn es keinen Adressaten gibt, bei dem eine wie auch immer geartete, beobachtbare oder unbeobachtbare Reaktion erfolgt, sobald ein vermeintliches Zeichen erscheint, ist nicht zu begriinden, weshalb es sich um ein Zeichen handelt. Da aber weder das syntaktische Verst~indnis von Information noch die diskutierten semiotischen Begriffskonzepte den Zeichencharakter der Informationselemente in Frage stellen, sind in diesem Sinne alle Informationsbegriffe pragmatisch. 2.1.2.4 Zeitbezug Information kann, wie schon bei der Betrachtung der umgangssprachlichen Bedeutung deutlich wurde, prozessual, also als Vorgang der Aufnahme von Kenntnissen, oder statisch, als Voraussetzung oder Ergebnis dieses Vorgangs, aufgefasst werden. In dem Versuch, die Begriffe Daten und Information abzugrenzen, deftnieren KSnig et. al. z.B. Information als "Prozefl der individuell-zweckorientierten Interpretation von Daten ''35, wfiahrend Daten als "standardisierte und dauerhafte Darstellungen beziehungsweise Abbildungen von Sachverhalten ''36 beschrieben werden. Als Tr~iger von Information kommen hier also nur Menschen in Frage. Eine Konsequenz dieser Definition besteht darin, dass Information in diesem Sinne keinen Sachcharakter besitzt und demnach auch nicht als Ressource bezeichnet werden kann. 37 Ahnlich bezeichnen Ferstl und Sinz Daten als ein Ergebnis der Modellierung eines Realit~itsausschnitts. Durch Anwendung einer Interpretationsvorschrift kSnnen aus Daten Informationen gewonnen werden. Damit ein erfolgreicher Informationsfluss stattfinden kann, m/issen Sender und Empf'~nger die gleiche Interpretationsvorschrift anwenden. Gegenstand der Ubertragung sind aber nur die Daten. 38 Auch der kommunikationstheoretische 35KSnig et al., 1990, S. 48, Hervorhebung im Original. 36KSnig et al., 1990, S. 48. 37Vgl. KSnig et al., 1990, S. 49. 38Ferstl und Sinz, 1998, S. 126f. Eine ~ihnliche Position wird von Boisot und Canals vertreten, die den Zusammenhang zwischen Daten und Information wie folgt charakterisieren: ,,Information constitutes those significant regularities residing in the data that agents attempt to extract from it.", Boisot und Canals, 2004, S. 47; Hervorhebung im Original. Ihr Hauptargument gegen eine Gleichsetzung von Daten und Informati-
19
2.1 Der Begriff Information
Informationsbegriff, wie er oben erl~iutert wurde, stellt auf den prozessualen Charakter von Information ab. Als Tr~iger der Information fungieren hier die fiber den 0bertragungskanal gesendeten Signale. Den Gegenpol beziiglich des Zeitbezuges bilden solche Definitionen, die Information in der einen oder anderen Weise mit Wissen identifizieren. Hier sind z.B. Wittmanns zweckbezogenes Wissen und Bodes in menschlicher Sprache repdisentiertes Wissen zu nennen.
Fliickiger stellt fest, dass die beiden eben unterschiedenen Sichten, die er als funktionell-kybernetische bzw. strukturell-attributive Sicht bezeichnet, jeweils unterschiedliche Aspekte des Informationsbegriffs abdecken. Er strebt daher die Entwicklung eines Informationsbegriffs an, in dem beide Gesichtspunkte beriicksichtigt werden. 39 2.1.2.5 Neuheitsgrad Informationsbegriffe lassen sich auch danach unterscheiden, ob unter Information nur das verstanden werden soll, was fiir den Adressaten subjektiv neu ist, oder ob alles das als Information aufgefasst wird, was den Kenntnisstand eines beliebigen Adressaten erhShen kSnnte, also in einem gewissen Sinne objektive Information ist. 4~ Von den bisher erSrterten Definitionen verlangen z.B. die kommunikationstheoretische Definition und das davon abgeleitete Konzept semantischer Information, dass Information fiir den Empf'~nger neu sein miisse, da dies offensichtlich untrennbar mit der Vorstellung von Information als Uberraschung verkniipft ist. Der Anteil einer iibertragenen Nachricht, der durch die syntaktische Struktur der Sprache bestimmt ist und demnach vom Sender nicht frei gew~ihlt werden kann, wird aus dieser Sicht als redundant bezeichnet. 41 Aus der Sicht des kommunikationstechnischen Problems, mSglichst viel Information fiber einen gegebenen Kanal zu iibertragen, stellt Redun..
on besteht in dem Hinweis, dass bei der Chiffrierung von Informationen zwar Daten erkennbar blieben, jedoch die Information vor einem Betrachter verborgen bleibe, der nicht fiber den Schliissel verfiige. Es bleibt aber weiterhin eine Frage der Definition des Informationsbegriffs, ob die Information, wie es der Definition von Boisot und Canals entspricht, aus den Daten rekonstruiert wird, oder eben doch, fiir einen Empf'~nger, der fiber den richtigen Schlfissel verfiigt, in den Daten enthalten ist. 39Vgl. Fliickiger, 1995, S. 63. 4~ Bode, 1997, S. 453. 41Vgl. Shannon und Weaver, 1949, S. 25f.
20
2 Information als Wirtschaftsgut
danz lediglich ein Problem suboptimaler Kodierung dar. 42 Indirekt wird Neuheit auch zum Kriterium im Informationsbegriff von Kb'nig et. al.: Wenn Information eine situations- bzw. zeitpunktbezogene Interpretation von Daten ist, so wird diese Interpretation in jeder neuen Entscheidungssituation erneut vorgenommen werden m/issen. So kann sich auch aus denselben Daten neue Information ergeben, wenn sich die Interpretationsvorschrift vor dem Hintergrund der neuen Situation ge~ndert hat. 43 Auch in der Betriebswirtschaftslehre existieren Definitionen von Information, die Neuheit fiir den Adressaten zum Kriterium f/Jr Information machen. 44
Sei~ert dagegen interpretiert Redundanz als Ergebnis des bereits vorhandenen Wissens des Informationsempf~ngers. Mit zunehmendem Wissenstand wird die Welt also fiir einen individuellen Empf'&nger informations/irmer. 45 Gleichzeitig ermSglicht aber erst Redundanz Kommunikation, da nur auf der Basis von Redundanz Dinge wiedererkannt und somit verstanden werden kSnnen. Damit verschiebt Seiffert die Systemgrenze bei der Feststellung von Redundanz vom Sender auf den Empf'~nger. 46 2.1.2.6 Wahrheitsgehalt Gelegentlich wird der Wahrheitsgehalt einer Mitteilung als Kriterium zur Begrenzung des Begriffsumfanges der Information verwendet. Nach einem wahrheitsabh~ngigen Informationsbegriff w/ire demnach nur Information, was der Realit~it entspricht, w/ihrend wahrheitsunabhiingige Begriffe auch unabsichtlich oder vors/itzlich falsche Mitteilungen als Information akzeptieren. Von den bisher vorgestellten Informationsbegriffen macht lediglich derjenige von Wittmann den Wahrheitsgehalt zu einem Abgrenzungskriterium. Es existieren jedoch auch neuere wahrheitsabh/ingige Formulierungen des Informationsbegriffs. 47 Gegen einen Wahrheitsanspruch an Information kann vorgebracht werden, dass die Wahrheit von Aussagen oft schon auf der praktischen Ebene 42Vgl. Fliickiger, 1995, S. 17. 43Vgl. Maier und Lehner, 1995, S. 220f. 44Vgl. z.B. Oft, 1992, S. 477. 45Vgl. Seiffert, 1968, S. 73ff. 46Fliickiger, 1995, S. 17. 47Vgl. Floridi, 2003, S.134f.
2.1 Der Begriff Information
21
nicht mit Sicherheit ermittelt werden kann, ganz abgesehen davon, dass aus philosophischer Perspektive ein sicherer Wahrheitsanspruch auch theoretisch problematisch ist. 4s Dariiber hinaus kSnnen in einem weiter gefassten Informationsbegriff Formen von Information existieren, denen, unabh~ingig v o n d e r Frage der Feststellbarkeit, gar kein Wahrheitswert zugewiesen werden kann. Dies gilt z.B. fiir die S~tze eines Romans oder die Kl~i~ge und Melodien eines Musikstiicks.
2.1.3 Der Informationsbegriff dieser Arbeit Im folgenden geht es darum, eine ffir die Fragestellung dieser Arbeit geeignete Abgrenzung des Begriffs Information zu wiihlen. Entlang jeder der oben dargestellten Dimensionen ist dabei eine Positionierung zu finden. Da in dieser Arbeit Information als Tauschobjekt behandelt werden soll, muss der Begriff so gew~ihlt werden, dass Information Objektcharakter besitzt. Dies hat offensichtlich Konsequenzen ffir die Dimensionen des Informationstriigers, indem eine menschenbezogene Sicht ausscheidet. Informationen kSnnen also im Sinne dieser Arbeit auch aut~erhalb des menschlichen Gehirns existieren. Die Fragestellung dieser Arbeit bezieht sich ausschliefAich auf solche Informationsgiiter, die potenziell an mehrere Abnehmer verkauft werden kSnnen, nachdem sie einmal erstellt wurden. Das spricht dafiir, einen objektiven Informationsbegriff zu w~hlen. Die subjektive Neuheit einer Information wird
4SAlbert erl~iutert die theoretische Schwierigkeit ~iuf,erst pr~ignant: Es bedarf einer Begriindung, weshalb eine Aussage fiir wahr gehalten wird. Jede Begrfindung kann aber angezweifelt werden, so dass es einer Begriindung der Begriindung bedarf. Eine sichere, nicht mehr bezweifelbare Grundlage kann nur auf drei Arten erreicht werden, die alle gleichermai~en unbefriedigend sind, weshalb Albert vom Miinchhausen-Trilemma spricht: 1. In einem infiniten Regress der Begriindungen wird fiir jede Begrfindung eine weitere Begriindung geliefert. Dies ist in endlicher Zeit offensichtlich undurchffihrbar. 2. Es wird in einem logischen Zirkel zur Begriindung einer Begriindung auf einen Grund verwiesen, der bereits in einem friiheren Schritt als begrfindungsbediirftig identifiziert wurde. Auch diese LSsung wird nicht fiberzeugen, wenn das ManSver entdeckt wird. 3. Die Folge der Begriindungen wird willkfirlich abgebrochen, indem eine Aussage als offensichtlich wahr bzw. nicht hinterfragbar pr~entiert wird, was jedoch eine Suspendierung des Prinzips der zureichenden Begriindung bedeutet und letztlich einer dogmatischen LSsung gleich kommt; vgl Albert, 1991, S.15.
22
2 Information als Wirtschaftsgut
damit jedoch nicht als prinzipiell unwichtig betrachtet. Sie flietgt vielmehr in die Bestimmung der Zahlungsbereitschaft eines potenziellen K/iufers fiir ein Informationsgut ein. Wie groig ihr Einfluss dabei ist, h~iagt jedoch davon ab, um welche Art von Informationsgut es sich handelt. Die Forderung eines unmittelbaren Zweckbezugs von Information, z.B. im Sinne der Vorbereitung bzw. Verbesserung von Entscheidungen, ist fiir die Zwecke dieser Arbeit eher hinderlich, da auch solche G/iter in die sp/iteren Betrachtungen einbezogen werden sollen, die aus rein konsumptiven Motiven erworben werden, wie z.B. Musikaufnahmen oder belletristische Literatur. Folglich muss der Informationsbegriff hier weit genug gefasst werden, um auch solche Produkte einzuschlieigen. Hinsichtlich des Zeitbezuges steht fiir diese Arbeit der statische Aspekt der Information im Vordergrund, da es um den Absatz vorfabrizierter Informationsgfiter geht, die in digitaler Form gespeichert vorliegen. Dementsprechend wird Information hier als Objekt, nicht als Prozess verstanden. Eine strikt prozessuale Sicht auf Information kSnnte auch nur den Zweck erfiillen, die Wichtigkeit der Interpretation eingehender Daten durch den Adressaten zu betonen. Werden statt dessen semiotische Zeichen als Elemente der Information betrachtet, so impliziert dieser Zeichenbegriff bereits die Notwendigkeit einer Interpretation. Der Wahrheitsgehalt soll hier nicht als konstituierend fiir Information betrachtet werden. Dies schliefot selbstverst~indlich nicht aus, dass das Vertrauen eines Nachfragers, dass bestimmte angebotene Informationen den Tatsachen entsprechen (wenn ihnen denn iiberhaupt ein Wahrheitswert zugewiesen werden kann) seine Bewertung dieser Informationen und damit seine Zahlungsbereitschaft beeinflusst. Der Semiotik kommt eine Schliisselrolle bei der Formulierung des Informationsbegriffs dieser Arbeit zu. Wie bereits oben erl/iutert wurde, stellen Syntaktik, Semantik und Pragmatik in ihrer urspriinglichen Bedeutung keine Auspr~igungen einer einzelnen Dimension dar, sondern spannen vielmehr ihrerseits den Raum auf, in dem sich die semiotische Untersuchung von Zeichen bzw. Zeichenprozessen vollzieht. Es geht also im Folgenden nicht darum, zwischen einem syntaktischen, semiotischen oder pragmatischen Informationsbegriff zu w~ihlen, sondern darum, genauer zu formulieren, wie die drei Dimensionen und ihr Verh~iltnis zueinander in dieser Arbeit verstanden werden.
2.1 Der Begriff lnformation
23
In der syntaktischen Dimension werden die Beziehungen von Zeichen untereinander untersucht, insbesondere die Regeln, nach denen mehrere Zeichen zu einem neuen Zeichen verkniipft werden kSnnen. Die Zeichen der Semiotik sind nfixnlich nicht nur ein Synonym fiir Buchstaben oder anderweitige Zeichen im Sinne von elementaren Bestandteilen eines Alphabets, sondern der Zeichenprozess, aufgrund dessen semiotische Zeichen existieren, kann mehrfach auf verschiedenen Ebenen stattfinden. So stellen Buchstaben eines Alphabets tats~ichlich Zeichen dar: Zeichentr~iger ist die graphische Form des Buchstabens, Designat ist ein Laut. 49 Ein aus Buchstaben gebildetes Wort ist seinerseits aber wiederum ein Zeichen, dessen Designat eine Menge von konkreten oder abstrakten Objekten enth/ilt. Auch ein ganzer Satz fungiert wieder als ein von seinen Elementen unterscheidbares Zeichen. Daraus entsteht ein Abgrenzungsproblem zwischen Syntaktik und Semantik. 5~ Wfi~hrend aus der Sicht eines zusammengesetzten Zeichens die Beziehungen zwischen den Einzelzeichen, aus denen es aufgebaut ist, als syntaktische Beziehungen identifiziert werden kSnnen, gehSrt das zusammengesetzte Zeichen aus der Perspektive eines untergeordneten Zeichens zu dessen Designat. ~1 Die Beziehung zwischen Einzelzeichen und zusammengesetztem Zeichen liegt damit in der semantischen Dimension. Syntaktische Regeln, denen die Beziehungen zwischen Zeichen unterworfen sind, dienen aus dieser Perspektive demselben Zweck wie semantische Regeln, nfi~nlich der Zuordnung zwischen Zeichen und Designat. Zur Pr~izisierung der semantischen Dimension wird deren formale Darstellung durch Szaniawski herangezogen. 52 Eine Information bzw. ein Informationselement ist danach ein Element y, das aus einer Menge Y von potenziellen Informationstr~igern ausgewfiahlt wurde. Die Elemente von Y kSnnen mit den Zeichen im Sinne der Semiotik gleichgesetzt werden, es kann sich also z.B. um in einer natiirlichen oder formalen Sprache formulierte S~itze handeln. Mit X wird eine Menge von Objekten, Zust~iaden oder Ereignissen bezeichnet und mit Oy die Tatsache, dass das Element y ausgew~hlt wurde. Oy ist eine Information iiber X, wenn eine Verbindung 49Dies gilt fiir phonetische Alphabete wie das lateinische; in anderen Schriftsystemen verweisen bereits einzelne Schriftzeichen auf WSrter oder Wortbestandteile, vgl. Wikipedia contributors, 2005. 5~ Fliickiger, 1995, S. 26ff. 51Die Verwendung von Abkfirzungen in Texten veranschaulicht dies: ein einzelner oder wenige Buchstaben fungieren hier als Zeichen fiir ein gesamtes Wort. 52Vgl. Szaniawski, 1998.
24
2 In?ormation Ms WirtschMtsgut
zwischen X und Y besteht, die y relevant fiir die Identifikation des tats~ichlichen Zustands x E X macht. Eine solche Verbindung kann zum einen durch eine sog. semantische Informationsstruktur 18 = (X, Y, s) hergestellt werden, zum anderen durch eine sog. probabilistische Informationsstruktur
Ip = (X, y,p).53 In einer semantischen Informationsstruktur bezeichnet s e i n e Funktion s : Y --. 7~(X), die jedem y E Y eine Menge s(y) aus der Menge aller Untermengen von X, also aus der Potenzmenge 7~(X), zuordnet. Die Menge s(y) kann als Designat des Zeichens y betrachtet werden. Eine Informationsstruktur vermittelt generische Information, wenn s die Menge der mSglichen Zust~inde einschrfiaakt, also ffir jedes y mindestens ein Element aus X enth~lt, andererseits aber nicht mit X identisch ist, d.h. wenn gilt Vy E Y :0 ~ s(y) C X. Dies entspricht zwar der oben als Zweckkriterium diskutierten Reduktion von Unsicherheit, die Verwendung des qualifizierenden Adjektivs ,,generisch" fiir diese Situation zeigt abet, dass dieser Informationsbegriff generell auch S~itze einschlief~t, die alle mSglichen Zust~ade zulassen, ffir die folglich gilt s(y) - X. In einer probabilistischen Informationsstruktur Ip = (X,Y,p) wird die Verbindung zwischen den Mengen X und Y dutch eine gemeinsame Wahrscheinlichkeitsverteilung p(x,y) =_ P(Ax A Oy) hergestellt, die die Wahrscheinlichkeit daffir angibt, dass gleichzeitig x den tats~ichlichen Zustand darstellt und das Zeichen y ausgewfiahlt wird. Die bedingte Wahrscheinlichkeit p(x [y) bezeichnet dann die Wahrscheinlichkeit, dass x der Fall ist, wenn das Zeichen y auftritt. Probabilistische Informationsstrukturen fiahneln der von Carnap und Bar-Hillel entwickelten semantischen Variante des kommunikationstechnischen Informationsbegriffs. Wie Szaniawski zeigt, liegt der Unterschied zwischen semantischen und probabilistischen Informationsstrukturen lediglich in der Sicherheit der jeweiligen Aussagen. Der pragmatischen Dimension des Zeichenprozesses kommt ffir den Informationsbegriff dieser Arbeit ein geringeres Gewicht zu. Es wird auf den behavioristischen Anspruch verzichtet, die Zeichenwirkung anhand einer beobachtbaren, ~iugeren Reaktion des Interpreten bzw. Informationsempf'&agers sicherstellen zu wollen. Statt dessen wird gewissermagen eine Innensicht des Interpreten eingenommen: Sobald ein beliebiger Interpret, wobei es sich hier ausdrficklich auch um eine Maschine handeln kann, fiber eine Informa53Vgl. Szaniawski, 1998, S. 227.
2.2 Eigenschaften yon Informationsgiitern
25
tionsstruktur verfiigt, um Zeichen der Menge X zu interpretieren, werden solche Zeichen als Information betrachtet. Dabei spielt es keine Rolle, ob die Informationsstruktur allgemein anerkannt ist oder lediglich von einem einzelnen Individuum oder einer Gruppe als giiltig betrachtet wird. Eine solche Innensicht erscheint insbesondere beziiglich der maschinellen Verarbeitung von Information vollkommen legitim, da die inneren Vorg/inge einer Maschine der Beobachtung entweder direkt zug/inglich sind oder mindestens aufgrund ihres prinzipiell bekannten, deterministischen Funktionsmechanismus nachvollzogen werden kSnnen. Im Fall menschlicher Informationsempf'~nger wird das Problem der Beobachtbarkeit des Zeichenprozesses dadurch entsch/irft, dass es in dieser Arbeit in erster Linie um Information als Tauschobjekt geht. Die Tatsache, dass ein Individuum bereit ist, ffir ein Zeichen bzw. eine Zeichenfolge etwas zu bezahlen, kann als hinreichendes Indiz dafiir gewertet werden, dass es sich im Besitz einer Informationstruktur glaubt, die eine Interpretation der Zeichen zul/isst. 2.2 E i g e n s c h a f t e n von Informationsgiitern 2.2.1 Information in der Systematik der GSter
Giiter dienen als "Biindel nutzbringender Eigenschaften in Form eines dinglichen oder organisatorischen Ganzen T M direkt oder indirekt der Befriedigung menschlicher Bediirfnisse. Sie werden eingeteilt in Sachgiiter, Dienstleistungen und Nutzungen. Alle Giiter lassen sich weiterhin nach ihrer Verwendung unterscheiden in Produktionsgiiter, die von Unternehmen erworben werden und in die Produktion anderer Giiter eingehen, sowie in Konsumgfiter, die von Haushalten erworben werden und entweder der direkten Befriedigung von Bedfirfnissen dienen oder in Produktionsprozessen des Haushalts eingesetzt werden. Sachgiiter werden weiterhin anhand ihrer typischen Nutzungsdauer in dauerhafte und nichtdauerhafte unterteilt. Dienstleistungen und Nutzungen dagegen sind nie von Dauer, sie lassen sich nicht lagern oder transportieren. W/ihrend Dienstleistungen das Ergebnis von Produktionsprozessen sind, fallen unter die Nutzungen z.B. die Nutzung menschlicher Arbeitskraft, dauerhafter Produktionsmittel, immaterieller VermSgenswerte, z.B. Patente, sowie dauerhafter Konsumgfiter. 5~ Weitaus differenziertere
54Breyer_Mayldnderund Werner 2003, S. 31. 55Vgl. z.B. Stobbe, 1989, S. 2f.
26
2 Information als Wirtschaftsgut
Giitersystematiken finden u.a. in der amtlichen Statistik Verwendung. Informationsgiiter, h~iufig auch als Medieng/iter bezeichnet, sind Sachgiiter bzw. materielle Giiter. Selbst wenn sie, wie z.B. Rundfunkprogramme oder Onlinemedien, immateriell verbreitet werden, kSnnen sie sowohl beim Sender als auch beim Empf~inger in materieller Form gespeichert und gelagert werden. 56 Ihre generelle Zuordnung zu den Produktions- oder Konsumgiitern ist ebenso wenig mSglich wie eine generelle Aussage fiber ihre Nutzungsdauer. Aus Sicht der mikroSkonomischen Theorie kSnnen sie jedoch deshalb zu den dauerhaften Giitern gerechnet werden, weil ein einzelner Nachfrager in den meisten F~llen nur genau eine Einheit nachfragt. Eine andere, in der Konsequenz vergleichbare Sichtweise betrachtet Informationsgiiter als sog. unteilbare Giiter. 57 Welches sind nun die ,dmtzbringenden Eigenschaften", die Information zu einem Gut werden lassen? Nach dem Verst~hadnis von Information, das oben entwickelt wurde, kSnnen sie aus zwei Quellen stammen. Zum einen kann sich der Nutzen von Information aus der Tatsache ableiten, dass sie hilft, bessere Entscheidungen zu treffen bez/iglich der Produktion oder Beschaffung von G/itern, die unmittelbar der Bed/irfnisbefriedigung dienen. Dies ist der Aspekt, der in dem oben diskutierten Aspekt der Zweckgerichtetheit von Information zum Ausdruck kommt. Kihlstrom formuliert dies im Hinblick auf die Informationsnachfrage von Konsumenten folgendermatgen: ,,Consumers demand Information because it helps them to make better purchases of other commodities. But information is a commodity that possesses none of the desirable attributes which make other commodities attractive to consumers. ''58 Der zweite Aspekt dieser Aussage l~isst sich jedoch mit dem hier zugrunde gelegten Informationsverst~indnis nicht vereinbaren. Information wurde bewusst ohne Rfickgriff auf das Zweckkriterium definiert, um auch solche Giiter unter dem Begriff Informationsgut erfassen zu kSnnen, die der unmittelbaren Befriedigung von Bed/irfnissen dienen. Dabei handelt es sich um kiinstlerische Produkte wie Romane, Spielfilme und Musikaufnahmen. W~ihrend solchen Giitern in der InformationsSkonomik kaum Beachtung geschenkt wird, werden sie in der Semiotik durchaus als Gebilde verstan-
56Vgl.Breyer-Maylander und Werner, 2003, S. 31f. 57Vgl. Arrow, 1962, S. 615. 5SKihlstrom, 1974, S. 414.
2.2 Eigenschaften von Informationsgiitern
27
den, die sich aus Zeichen zusammensetzen. 59 Da semiotische Zeichen hier als Grundbausteine der Information verstanden werden, fallen auch diese Giiter in die Gruppe der Informationsgiiter. Die beiden eben abgegrenzten Gruppen werden im weiteren Verlauf als Produktionsgiiter und Konsumgiiter bezeichnet. Eine andere Systematik, die hier zur K l ~ u n g der Gutseigenschaften eines Informationsgutes herangezogen werden soll, ist die Mengersche Gfiterordnung, die Giiter nach dem Grad ihrer Konsumferne ordnet. Giiter, die unmittelbar dem Konsum dienen, werden als Gfiter erster Ordnung aufgefasst, Produktionsgiiter, die unmittelbar zur Produktion des Konsumgutes dienen, werden als Giiter zweiter Ordnung betrachtet, und Gfiter, die zur Produktion der Produktionsgiiter eingesetzt werden, sind Gfiter entsprechend hSherer Ordnung. Giiter zweiter und hSherer Ordnung gewinnen in der Mengerschen Vorstellung ihren Wert ausschliefolich aus dem Beitrag, den sie zur Produktion von Konsumgiitern leisten. 6~ Information im Verst~.dnis dieser Arbeit kann also einerseits ein Gut erster Ordnung darstellen, andererseits ein Gut hSherer Ordnung, indem sie zur Herstellung bzw Verbesserung oder Vermehrung von Konsumgiitern bzw. Produktionsgiitern beitr~igt. 61 Allerdings ist eine Ableitung des Wertes von Information aus den Giitern erster Ordnung problematisch, da Information in vielen F~illen lediglich die Verteilung vorhandener Gfiter beeinflusst, also einen Wert fiir einen Akteur besitzt, solange sie exklusiv ist.
2.2.2 Information und Knappheit Manche Gfiter, z.B. Atemluft, sind so reichlich vorhanden, dass sehr viele oder alle Menschen sie verbrauchen oder nutzen kSnnen, ohne dass es zu gegenseitigen Beeintr~ichtigungen kommt. Die meisten Giiter sind jedoch knapp in dem Sinne, dass sie nicht in ausreichender Menge vorhanden sind 59Vgl. hierzu z.B. die Abhandlung von Morris fiber ,~sthetik und Zeichentheorie", deren Hauptthese lautet, dass Kunstwerke Zeichen seien, die auf sich selbst verweisen, die also ihren eigenen Zeichencharakter in die Aufmerksamkeit des Betrachters rficken, dabei aber nichtsdestotrotz gleichzeitig auch Zeichen ffir etwas anderes, z.B. fiir Ausschnitte der von dem Urheber des Kunstwerks wahrgenommenen Realit~it oder seiner psychischen Befindlichkeit, sein kSnnen. Vgl. Morris, 1972a, S. 97ff. 6~ Menger: Grunds~itze der Volkswirtschaftslehre. 61Vgl. Hopf, 1983, S. 71f., wo Informationen generell als Gfiter dritter Ordnung bezeichnet werden.
28
2 Information als Wirtschaftsgut
oder hergestellt werden kSnnen, um alle bestehenden Bediirfnisse nach ihnen befriedigen zu kSnnen. Der Umgang mit dem Ph~inomen der Knappheit steht im Zentrum wirtschaftlichen Handelns, daher werden knappe Giiter auch als wirtschaftliche Giiter bezeichnet. 62 Viele Giiterarten sind durch Rivalit~it im Konsum gekennzeichnet, d.h. ihre Nutzung durch eine Person schlie~t andere Nutzer aus. Bei Informationsgiitern besteht Konsumrivalittit lediglich insofern, als sie an physische Medien wie Druckerzeugnisse oder CDs gebunden sind. Die Information selbst wird jedoch in der Regel ffir einen Akteur nicht dadurch in ihrem Nutzwert beeintr~ichtigt, dass sie auch von anderen rezipiert wird. Es gibt aber auch F~ille, in denen der exklusive Besitz bestimmter Informationen einen erheblichen Vorteil darstellt. So zahlt es sich z.B. fiir einen BSrsenhfiadler aus, friiher als andere fiber Ereignisse informiert zu sein, die den Kurs eines Wertpapiers beeinflussen kSnnen, da er entsprechende Kaufoder Verkaufstransaktionen durchfiihren kann, bevor andere dies tun. 63 A1lerdings ist ein Vorteil in diesem Beispiel nur realisierbar, wenn die entsprechende Information spiiter auch die anderen Marktteilnehmer erreicht, so dass die antizipierte Kursreaktion auch tats~ichlich eintritt. 64 Auch der gegenteilige Effekt ist denkbar, also ein Anstieg des Wertes der Information fiir einen Nachfrager, wenn andere Nachfrager dieselbe Information ebenfalls konsumieren. Viele Unterhaltungsmedien gehSren in diese Kategorie, da das Interesse der Nutzer solcher Medien nicht zuletzt von der Tatsache abh~ingt, sich mit anderen Nutzern fiber die Inhalte austauschen zu kSnnen. Dies betrifft z.B. Kinofilme, Fernsehsendungen, Musik und Romane. Aber auch Nachrichten fiber das Weltgeschehen (,~Stammtischgesprtiche") oder fiber Prominente (,,Regenbogenpresse") kSnnen diese Form von Netzwerkeffekten hervorrufen. In der Regel sind Informationsanbieter Monopolisten. Allerdings kSnnen sie aus dieser Stellung nur dann 5konomischen Gewinn ziehen, wenn es gesetzliche Regelungen gibt, die es anderen Akteuren, die bereits ein Exemplar des Informationsgutes erworben haben, verbieten, dieses ihrerseits zu vervielf'eiltigen und damit in Konkurrenz zu dem urspriinglichen Anbieter zu 62Vgl. Samuelson und Nordhaus, 1992, S. 8. 63Vgl. Hop f, 1983, der das Beispiel des Bankiers Nathan Rothschild zitiert, der friiher als andere Marktteilnehmer an der Londoner BSrse fiber Napoleons Niederlage bei Waterloo informiert war. 64Vgl. Hirshlei.fer, 1971, S. 565.
2.2 Eigenschaften yon Informationsgfitern
29
treten. Solche gesetzlichen Regelungen existieren ffir viele Typen von Informationsgiitern in Gestalt des Urheberrechts. Die Entwicklung derselben Techniken, die die Fragestellung dieser Arbeit fiberhaupt interessant gemacht haben, ermSglichen es allerdings auch, zu geringeren (technischen) Kosten als je zuvor gegen das Urheberrecht zu verstof~en und damit die Monopolstellung des Urhebers und die 5konomische Verwertbarkeit von Informationsgiitern generell infrage zu stellen. Im Folgenden werden die hiermit verbundenen schwierigen Probleme ausgeklammert, indem unterstellt wird, dass entweder technische LSsungen existieren, um das geistige Eigentum des Urhebers zu schfitzen, z.B. in Form sog. Digital Rights Management-Systeme, oder dass im Zuge einer fortschreitenden Sensibilisierung des Rechtssystems fiir die Urheberrechtsproblematik die Entdeckungswahrscheinlichkeit bei Zuwiderhandlungen oder das zu erwartende Strafmag derart erhSht werden, dass potenzielle T~iter in ausreichendem Maf~e abgeschreckt werden. Tendenzen in beide Richtungen sind gegenw~irtig erkennbar.
2.2.3 Typen yon Informationsgiitern Das im vorigen Abschnitt entwickelte, abstrakte und welt gefasste Verst~indnis yon Informationsgiitern wird in diesem Abschnitt mit konkreten Beispielen gef/illt, gleichzeitig werden einige Kriterien zur Typisierung solcher Giiter diskutiert. Informationsgiiter kSnnen danach klassifiziert werden, ob sie unmittelbar der Befriedigung yon Bed/irfnissen dienen, oder ob sie bei der Herstellung bzw. beim Erwerb yon anderen Giitern eingesetzt werden. Im ersten Fall kann man yon konsumptiver Verwendung sprechen, im zweiten Fall yon produktiver Verwendung. Konsumptiv verwendete Informationsgiiter dienen h~iufig der Unterhaltung oder der Befriedigung eines Bildungsbediirfnisses, sofern letzteres nicht bereits als Investition in das HumanvermSgen des Informationsnutzers betrachtet wird. Oft geht es um kiinstlerische Produkte, aber auch redaktionelle Erzeugnisse wie Tageszeitungen, Zeitschriften, Magazine oder Fernsehnachrichten werden nicht selten zur direkten Befriedigung bestimmter Bediirfnisse eingesetzt. Eine produktive Verwendung liegt z.B. bei Bbrsenkursen vor, an denen ein H~indler seine Kauf- und Verkaufsentscheidungen ausrichtet, oder dann, wenn eine Unternehmung technische Dokumentationen beschafft, die zur Produktion einer neuen Produktver-
30
2 Information als Wirtschaftsgut
sion oder -kategorie benStigt werden. Die Einteilung in konsumptive und produktive Verwendung ist jedoch situationsgebunden und l~st nur in eingeschr~inktem Ma~e Rfickschlfisse auf die Natur der Informationsgfiter selbst zu, die der einen oder anderen Verwendung zugeffihrt werden. Informationsgfiter kSnnen auch danach klassifiziert werden, ob sie mit der Zeit an Aktualit~it verlieren oder ob sie keinen unmittelbaren Aktualit~tsbezug aufweisen. W~ihrend z.B. Nachrichten, BSrsenkurse und Wetterinformationen ffir die meisten Nutzer kurz nach dem Zeitpunkt, auf den sie sich beziehen, kaum noch von Interesse sind, ist z.B. die technische Dokumentation zu einer Maschine fiir die gesamte Lebensdauer der Maschine nfitzlich. Andere Informationsgfiter verlieren fiber viele Jahrzehnte oder gar Jahrhunderte hin kaum an Bedeutung oder unterliegen zyklischen bzw. modischen Schwankungen in dem Interesse, das ihnen entgegen gebracht wird. Auch die Kategorie des Aktualit~itsbezuges ist jedoch situationsabh~ingig. So mag fiir die meisten Personen das Wetter von vor zehn Jahren absolut bedeutungslos sein, ein Klimaforscher wird dagegen gerade an solchen und noch ~ilteren Wetterdaten sehr interessiert sein, ~ihnlich wie fiir einen charttechnisch orientierten Analysten die BSrsenkurse vergangener Monate oder Jahre keinesfalls wertlos sind. Eine weitere Facette des Aktualit~itsbezuges von Informationsgfitern besteht in der Frage, ob sie ffir ein Individuum wertlos werden, wenn es sie einmal zur Kenntnis genommen hat, oder ob sie auch mehrfach genutzt werden kSnnen. Nachrichten sind in der Regel nur interessant, wenn sie ffir das Individuum neu sind, eine zweite oder dritte Wiederholung ist redundant, es sei denn, das Individuum h~itte den Inhalt der Nachricht inzwischen wieder vergessen. Anders ist es mit vielen kfinstlerischen Produkten, die auch bei mehrfacher Betrachtung bzw. Vorffihrung nicht an Faszination verlieren. Ein relativ eindeutiges Merkmal zur Typisierung von Informationsgiitern stellt deren Repr~isentation dar. Im wesentlichen sind die vier Formen Text, Bild, Ton und Video zu unterscheiden. Nicht selten werden gleiche oder ~ihnliche Inhalte in verschiedenen Repr~entationsformen publiziert, z.B. Nachrichten als Zeitungsartikel, Radiobeitr~ige und Fernsehbeitr~ige, oder Konzertmitschnitte als reine Tonaufnahme und als Videoaufnahme. Die unterschiedlichen Repr~entationsformen unterscheiden sich stark darin, welche Bandbreiten bzw. Speicherkapazit~iten zu ihrer Ubertragung bzw. Lagerung erforderlich sind. ~
2.2 Eigenschaften yon Informationsgiitern
31
Schlieglich sei noch das Medium als Unterscheidungsmerkmal erw~hnt, auf bzw. in dem Informationsgfiter angeboten werden. In der Regel unterscheidet man zwischen Printmedien, Rundfunk, Ton- und Bildtdigern sowie Onlinemedien. Diese Arbeit konzentriert sich ausschlieglich auf digitalisierbare Informationsgfiter, ffir die alle Schritte der Beschaffung einschlieglich der Lieferung des Gutes fiber Onlinemedien- damit ist heute in den allermeisten F~illen das Internet gemeint- abgewickelt werden kSnnen. 65
2.2.4 Digitale Informationsgiiter In dieser Arbeit werden ausschlief~lich digitale, fiber Computernetzwerke vertriebene Informationsgfiter betrachtet. Digitale Informationsgfiter sollen hier, in der oben erSrterten Terminologie der Semiotik, als Folgen von ausschlief~lich zwei Zeichen aufgefasst werden, die meist als '0' und '1' geschrieben werden. 66 Die Darstellung ist also zweiwertig oder bin~ir. Ein Element einer solchen Folge wird als Bit bezeichnet. Der Grund der Konzentration auf digitale Informationsgfiter liegt darin, dass ausschlief~lich diese Art von Giitern sich ffir eine Speicherung in Computersystemen und einen Transport fiber Computernetzwerke eignet. 67 Diese Lagerungs- und Vertriebsform stellt die bestmSgliche Ann~iherung an eine der Grundannahmen dieser Arbeit dar, nfimlich dass Herstellung und Vertrieb einer zus/itzlichen Kopie eines Informationsgutes marginale Kosten in der Nfihe von Null verursachen. Lagerhaltungskosten fallen nicht an, da jede abgesetzte Kopie unmittelbar im Augenblick der Auslieferung von einer einzigen Vorlage auf dem zur Auslieferung verwendeten Computersystem (Server) hergestellt wird. Die dabei benStigte Rechenkapazit~it muss im Voraus zur Verfiigung gestellt werden und kann daher nicht zus~itzlichen Kopien angelastet werden. Gleiches gilt 65Vgl. Alpar, 1998, S. 254. 66Auch bei dieser Darstellung handelt es sich um einen Vorgang der Signifikation, denn tats~ichlich werden die beiden Zeichen in den Systemen, in denen sie gespeichert und verarbeitet oder durch die sie fibertragen werden, auf sehr unterschiedliche Arten physisch repr~sentiert. Das Spektrum der MSglichkeiten reicht dabei von zwei unterschiedlichen Ladungszust~inden in den mikroskopisch kleinen Kondensatoren von Speicherbausteinen fiber dynamische Variationen in elektromagnetischen Feldern bis zu winzigen mechanischen Vertiefungen in optischen Speichermedien. 67Auch andere Arten von Informationsgfitern werden fiber Netzwerke vertrieben, z.B. existiert zur Zeit (Ende 2004) noch analoges Fernsehen sowohl in terrestrischer Funkfibertragung als auch in Fernsehkabelnetzen. Keine dieser Ausstrahlungsformen kann jedoch als Computernetzwerk bezeichnet werden.
2 Information als Wirtschaftsgut
32
A
r
B
C
T
T
T
65
66
67
~
~
01000001
r
~
01000010
r
01000011"
Abbildung 2.1" Signifikationsebenen (eigene Darstellung) ~176
im Prinzip fiir die notwendige Ubertragungskapazit~it des zur Auslieferung verwendeten Computernetzes. 6s Bevor eine Folge von Bits fiir menschliche Benutzer interpretierbar wird, durchl~iuft sie in der Regel mehrere Ebenen der maschinellen Interpretation, die als sehr praise semiotische Zeichenbeziehungen aufgefasst werden kSnnen. Der erste Schritt ist h~iufig eine Zusammenfassung mehrerer Bits, z.B. 8 oder 16, zu einem Zahlenwert im Bin~system. Die Zahlenwerte bezeichnen dann, je nach Art des Informationsguts, sehr unterschiedliche Gegenst~inde. Bei textuellen Informationsgiitern in Schriftform wird ein Code eingesetzt, der jedem Zahlenwert einen bestimmten Buchstaben (oder ein Interpunktionszeichen) zuordnet, wie es in Abbildung 2.1 dargestellt ist. Akustische A ufzeichnungen werden im einfachsten Fall in Form von sog. Samples abgelegt: Die Amplitude des kontinuierlichen Ausgangssignals, einer elektrischen Spannung, die analog zu den urspriinglichen Schallwellen verl~iuft, wird in regelm~igen Zeitabst~inden gemessen und in einen Zahlenwert umgewandelt. Die Pr~ision der Messung bestimmt, wie viele Bits benStigt werden, um einen einzelnen Messwert zu speichern; im Fall der CD werden z.B. 16 Bit verwendet. Im Prinzip in fi~hnlicher Weise lassen sich die Farb- und Helligkeitswerte von Fotos bzw. von Videosequenzen digitalisieren. Der Speicherbedarf solcher digitalisierter akustischer und insbesondere visueller Aufzeichnungen ist sehr groig. Auch bei den aktuell verfiigbaren Speicher- und Obertragungstechniken wiirde die Nutzung des digitalen Rohmaterials noch in vielen F~illen prohibitive Kosten verursachen. Die Verbrei68Tats~ichlich entstehen in beiden F~illen sprungfixe Kosten je nach GrSgenordnung der (erwarteten) Nachfrage.
2.3 Zahlungsbereitschaft f//r Informationsgiiter
33
tung von Audio- und Videoaufzeichnungen fiber Computernetze in kommerziellem Ma~stab wird erst durch Verfahren mSglich, mit deren Hilfe der Speicherbedarf erheblich reduziert werden kann. Auf die Funktionsweise dieser Verfahren soll hier nicht im Einzelnen eingegangen werden; als verbindendes Prinzip aller dieser Techniken l~st sich jedoch festhalten, dass sie die Grenzen der Wahrnehmungsf'~higkeit der menschlichen Sinnesorgane nutzen, um nicht bzw. kaum wahrnehmbare Informationsbestandteile aus dem Ausgangsmaterial zu entfernen. Aus der komprimierten bzw. reduzierten Bitfolge 1/isst sich das urspriingliche Signal nicht exakt rekonstruieren, weshalb auch von verlustbehafteten Kompressionsverfahren bzw. von Datenreduktion gesprochen wird. Diese Kompressionsverfahren funktionieren zwar gut, aber je hSher das angestrebte Kompressionsverh~ltnis ist, desto mehr fallen Qualit~itsverluste gegen/iber unkomprimierten bzw. schw~icher komprimierten Informationsgiitern auf. Daraus ergibt sich fiir die Anbieter bestimmter Informationsg/iter eine MSglichkeit, verschiedene Qualit~itsstufen anzubieten.
2.3 Z a h l u n g s b e r e i t s c h a f t f'tir I n f o r m a t i o n s g t i t e r
Von besonderer Bedeutung im Rahmen der Fragestellung dieser Arbeit ist es, wie die Zahlungsbereitschaft eines Nachfragers f/ir ein Informationsgut zustande kommt und welche Faktoren sie beeinflussen. In Abschnitt 2.3.1 werden zwei Konzepte betrachtet, die den Informationsgehalt von Nachrichten bzw. Aussagen zu quantifizieren versuchen. Es zeigt sich jedoch, dass diese Versuche einer immanenten Messung des Informationsgehalts nicht geeignet sind, den Wert einer bestimmten Information fiir ein bestimmtes Wirtschaftssubjekt zu bestimmen, da dieser stets vom Kontext abh~ingig ist, also der Situation, in der sich das Wirtschaftssubjekt gegenw~irtig befindet. F/Jr konsumptiv genutzte Informationsgiiter stellt die Bestimmung der Zahlungsbereitschaft aus 5konomischer Sicht einen Anwendungsfall der mikroSkonomischen Nachfragetheorie des Haushalts dar, deren Grundz/ige in Abschnitt 2.3.2 erl~iutert werden. F/Jr viele Informationsg/iter gilt, dass ihr Nutzen ffir ein Individuum abh~ingig ist von dessen Vorkenntnissen oder dessen GewShntsein an den Konsum solcher Gfiter. Autgerdem erfordert der Konsum der meisten Informationsgiiter einen gewissen Aufwand an Zeit. Beide Aspekte kSnnen mit Hilfe der Theorie der Haushaltsproduktion in
34
2 Information als Wirtschaftsgut
den Rahmen der mikroSkonomischen Nachfragetheorie integriert werden, die daher kurz in Abschnitt 2.3.3 dargestellt wird. Erg/inzend zu der mikro5konomischen Sicht, die das Verhalten von Wirtschaftssubjekten betrachtet, fiir die vollkommene Rationalit/it angenommen wird, geht Abschnitt 2.3.4 auf das eher betriebswirtschaftlich orientierte Kaufverhaltensmodell tier Marketingliteratur ein. Wesentlich besser als die konsumptive Nach~age nach Informationsgiitern ist die Bewertung von Informationen untersucht, wenn diese zur Verbesserung von Entscheidungen eingesetzt werden. Einige diesbeziigliche Ergebnisse werden in Abschnitt 2.3.5 dargestellt. Einige besondere Eigenschaften yon Informationsgiitern, die deren 5konomische Bewertung durch die Wirtschaftssubjekte erschweren, werden in den bislang erSrterten Theorien jedoch nicht explizit beriicksichtigt. Abschnitt 2.3.6 widmet sich diesen Problemen und zeigt einige MSglichkeiten auf, wie diese in der Praxis iiberwunden werden kSnnen.
2.3.1 Quantitative Aspekte yon Information Versuche, den von Informationsquellen produzierten bzw. in Nachrichten enthaltenen Informationsgehalt quantitativ zu bestimmen, lassen sich nach MacKay in zwei Kategorien einteilen: Mage fiir den selektiven Information~ gehalt fragen danach, wie viel Information bei der Auswahl einer Nac~icht bzw. der Bestimmung eines Zustands aus einer Menge prinzipiell bekannter Nadmchten bzw. Zust~inde vermittelt wird. 69 Der deskriptive Informationsgehalt quantifiziert dagegen den Beitrag, den eine empfangene Information, z.B. aus einer wissenschaftlichen Beobachtung, dazu leistet, beim Empffinget Wissen fiber einen bisher unbekannten Zustand zu konstruieren.
2.3.1.1 Entropie Der erste und bis heute einflussreichste Versuch, Information quantitativ zu erfassen, wurde im Rahmen der mathematischen Kommnnikationstheorie unternommen. TM Wie oben bereits erSrtert, wird Information hier als Folge 69Vgl. MacKay, 1950, sowie MacKay, 1954. 7~ Shannon und Weaver, 1949. Shannon grfindet seine Theorie auf Arbeiten von Nyquist, 1924, 1928 und Hartley, 1928.
2.3 Zahlungsbereitschaft /fir InformationsgSter
35
von Symbolen aufgefasst, deren Bedeutung ausdriicklich nicht beriicksichtigt wird. Das Grundmodell der Theorie von Shannon besteht darin, dass eine Informationsquelle Nachrichten aus einer endlichen Menge X auswSahlt, die dann von einem Sender fiber einen 0bertragungskanal zu einem EmpfAnger geschickt werden. Ist jede Nachricht gleich wahrscheinlich, so stellt eine monoton steigende Funktion der Anzahl mSglicher Nachrichten ein quantitatives Mag fiir die Information dar, die durch die Informationsquelle produziert wird, wenn eine bestimmte Nachricht ausgew~ihlt wird. Wird der Logarithmus zur Basis 271 als funktionaler Zusammenhang gewfildt, dann ergibt sich daraus als Einheit der Information das Bit (yon engl. binary dig~t).72 Wird eine yon zwei mSglichen Nachrichten iibertragen, so betr~igt die iibertragene Information ein Bit (log 2 2 = 1). Stehen zehn Nachrichten zur Verfiigung, ergeben sich ca. 3,32 Bit (log 2 10 ~ 3, 32). Sind die einzelnen Nachrichten jedoch nicht gleich wahrschein!ich, so wird der Informationsgehalt einer ausgewfilflten N ~ c h t als u m ~ grSger betrachtet, je weniger wahrscheinlich ihre Auswahl ist. Sei xi eine Nachricht aus der Menge X -- { x l , . . . , x n } und sei Pi = P(xi) mit ~']~ P(xi) = 1 (fie Wahrscheinlichkeit, dass xi ausgewfilllt wird, so besitzt xi den ShannonInformationsgehalt 73 1
h(xi) - log2 --. pi Neben dem Informationsgehalt einer bereits ausgewfilxlten Nachricht ist auch der Informationsgehalt der Informationsquelle von Bedeutung. Dieser ergibt sich als Erwartungswert des Shannon-Informationsgehaltes H(X)-
1 Z p , log--, i Pi
(2.1)
indem die Shannon-Informationsgehalte der einzelnen Nac/u'ichten mit der Wahrscheinlichkeit ihres Auftretens gewichtet werden. Der Ausdruck in Gleichung 2.1, der auch als Entropie bezeichnet wird, gibt an, welcher Informationsgehalt yon einer Informationsqueile mit bekannten Eigenschaften, also Wahrscheinlichkeiten der einzelnen N ~ c h t e n , erwartet werden kann, be71Kfinftig wird der Logarithmus zur Basis n a l s logn geschrieben. 72Vgl. Shannon und Weaver, 1949, S. 3f. 73Vgl. MacKay, 2003, S. 32.
36
2 Information als Wirtschaftsgut
1
'
~
~
..-(p Id'p + q Id q)
0.9 0.8 0.7 0.6 0.5 0.4 0.3 0.2
/
0.1 0 0
i 0.2
!
0.4
;.6
' 0.8
Abbildung 2.2: Informationsgehalt einer Nachrichtenquelle mit zwei mSglichen Nachrichten (MacKay, 2003, S.2) vor eine Nachricht empfangen wurde. TM An einem Beispiel mit zwei mSglichen Nachrichten Xl,X2 l ~ s t sich das Prinzip verdeutlichen, pl sei die Wahrscheinlichkeit, mit der die eine Nachricht gesendet wird, w~ihrend die andere Nachricht mit der Wahrscheinlichkeit P2 - Pl - 1 auftritt. Die Entropie der Nachrichtenquelle ist nun H -- Pl log ~1 + P2 log2 ~ . Die Abbildung zeigt, wie sich der Informationsgehalt mit steigendem pl, also sinkendem P2 entwickelt. 2.3.1.2 Logon und Metron Ein Konzept deskriptiver Ma~e fiir den Informationsgehalt wurde von MacKay entwickelt, der es zun~ichst auf die quantitative Messung des Informationsgehaltes wissenschaftlicher Informationen beschr~i~kte. 75 Sp~iter versuchte er, sein Konzept auch auf den allgemeineren Zusammenhang menschlicher Kommunikation anzuwenden. 76 Den Ausgangspunkt seiner 0berlegun74In der Nachfolge Shannons wurden in der Informationstheorie mehrere Familien strukturell ~ihnlicher Informationsma$e entwickelt. Die hier knapp erl~iuterte ShannonEntropie steUt ein spezielles Exemplar einer solchen Familie dar. Einen 0berblick fiber neuere Entwicklungen der mathematischen Informationstheorie geben Ebanks et al., 1998. 75Vgl. MacKay, 1950. 76Vgl. MacKay, 1954.
2.3 Zahlungsbereitschaft fSr Informationsgiiter
37
gen stellt die von Wittgenstein in seinem Tractatus Logico-Philosophicus vertretene These dar, sprachliche Aussagen, insbesondere wissenschaftliche Aussagen, lief~en sich stets auf eine Reihe grundlegender, atomarer Aussagen reduzieren, die lediglich wahr oder falsch sein kSnnen. Die Grundlage idealer wissenschaftlicher Aussagen bilden in MacKays Verst~i~dnis Beobachtungen, die das Ergebnis definierter Experimente darstellen. Der a priori bzw. strukturelle Informationsgehalt ist die Anzahl atomarer grundlegender Aussagen, die benStigt werden, um eine Beobachtung beschreiben zu kSnnen. Die Einheit des strukturellen Informationsgehaltes bezeichnet MacKay als ,,Logon''77 und definiert sie als ,,that which enables us to .formulate one independent proposition, describing one independent feature of the result". 7s Als Beispiel fiir den Logon-Gehalt eines Experiments kann eine mikroskopische Beobachtung dienen. Das Mikroskop hat einerseits eine begrenzte Auf15sung, zum anderen kann bei der Beobachtung ffir jeden unterscheidbaren Bildpunkt nur eine begrenzte Anzahl von Helligkeits- oder Farbwerten unterschieden werden. Zusammengenommen 1/isst sich daraus eine Kette von elementaren Aussagen formulieren, die den Logon-Gehalt des Experiments angeben. Dem strukturellen Informationsgehalt stellt MacKay den metrischen Informationsgehalt gegeniiber. Dieser quantifiziert die empirische Evidenz, durch die eine Aussage gestiitzt wird und stellt somit ein a posteriori Mafb dar. Die Einheit der metrischen Information nennt MacKay ,,Metron". Jede elementare Aussage, also jedes Logon, kann unterschiedlich gut durch Beobachtungen gestiitzt sein und besitzt demnach einen unterschiedlichen Metron-Gehalt. Der Metron-Gehalt der Gesamtaussage w~ichst, je h/iufiger ein Experiment ausgeffihrt wird. 79 In einer geometrischen Formulierung des Konzepts kann der Informationsgehalt einer Aussage als Vektor in einem /-dimensionalen Raum interpretiert werden, wobei 1 den Logon-Gehalt der Aussage angibt. Der Informationsgehalt stellt nun den Vektor vom Ursprung des Raums zu dem Punkt dar, der durch den Metron-Gehalt der einzelnen Elementaraussagen bestimmt wird. Die L/inge des Vektors gibt den MetronGehalt der Gesamtaussage an. s~ 77MacKay iibernimmt diesen Ausdruck von Gabor, vgl. Gabor, 1946. 7SMacKay, 1950, S. 296, Hervorhebung im Original. 79Vgl. MacKay, 1950, S. 294. S~ MacKay, 1950, S. 298.
38
2 Information als Wirtschaftsgut
2.3.2 MikroSkonomische Nachfragetheorie 2.3.2.1 Pr/iferenzen und Nutzenfunktionen Die mikroSkonomische Nachfragetheorie untersucht, wie Nachfrager ihr Einkommen auf die am Markt verfiigbaren Giiter verteilen. Giiter werden definitionsgem~ erworben, um Bediirfn_isse zu befriedigen. Welche Giiter die Bediirfnisse eines konkreten Individuums befriedigen, h/iagt von dessen Pr/iferenzen ab. Da diese einer direkten Beobachtung nicht zug~nglich sind, sl geht die mikroSkonomische Nachfragetheorie yon einigen sehr allgemeinen Annahmen fiber die Pr~ferenzordnung aus, die ftir alle Individuen gelten sollen. Wean insgesamt n Giiter existieren, dann steUt die Menge aller Giiterbiindel X eine Tei!menge des nicht-negativen Orthanten von R n dar, d.h. es gilt X C_ R~+. Formal ausgedriickt stellt die Pr/iferenzordnung eines Nachfragers eine Relation ,,wird vorgezogen gegeniiber" fiber der Menge X dar, fiir die im Folgenden das Symbol >- benutzt wird. Fiir die Relation >- wird Asymmetrie angenommen, d.h. fiir zwei Giiterbiindel -~, i ] E X gilt hie zugleich 2~ >- i ] mad i ] >- -~. Diese Annahrae bedeutet, dass Nachfrager sich in ihren Pr/iferenz/iugerungen konsequent verhalten, also hie zugleich das Biindel -~ dem Biindel ~i] vorziehen und umgekehrt. Damit wird jedoch nicht ausgeschlossen, dass sich ein Konsument auf keine der beiden MSglichkeiten festlegen kann. In diesem Fall wird iiblicherweise davon ausgegangen, dass die Giiterbiindel -~ und i ] gleichwertig sind, wofiir das Symbol ,,~ verwendet wird. s2 Augerdem wird angenommen, dass >- negativ traasitiv ist, d.h. wenn gilt -~ ~- i], dann gilt fiir jedes :Z* E X entweder -~ ~- ~ oder :2' ~- i ] oder SXAussagen fiber die Pr~ferenzen lassen sich bestenfalls indirekt aus den nachgefragten Gfitermengen ableiten. Im Rahmen der Theorie der offenbarten Pr~ferenzen wird zum einen untersucht, inwieweit empirisch beobachtete, nachgefragte Preis-MengenKombinationen mit einer Nutzenmaximierung bei stabilen Pr~ferenzen vereinbar sind, zum anderen werden Methoden erforscht, wie aus einzelnen Beobachtungen konsistente Nutzenfunktionen abgeleitet werden kfnnen. Einen Uberblick fiber die Entwicklungen auf diesem Gebiet gibt I/arian, 2005. Zu einer neueren Methode der e m p ~ e n Untersuchung yon Pr~ferenzen vgl. Bagnoli et al., 2004. S2Formal gilt also -~ ,,~ ~ r -~(-~ >- ~ ) A -~(i] >- -~). Streng genommen existiert aber auch die Mfglichkeit, dass zwei Gfiter als unvergleichbar betrachtet werden. Kreps stellt in Anlehnung an Fishburn dar, wie die PrMerenzrelation definiert werden kann, ohne diese Mfglichkeit auszuschliegen, vgl. Kreps, 1990, S. 22.
2.3 Zahlungsbereitschaft [fir Informationsgiiter
39
beides. 83 Demnach kann ein Konsument nicht nur gesonderte Paare von Giiterbiindeln bewerten, sondern ist auch zu einer konsequenten Reihung mehrerer Giiterbiindel in der Lage. Beide Annahmen werden in der Literatur einer ausfiihrlichen Kritik unterzogen. In der Hauptsache bezieht sich diese Kritik darauf, dass die Annahmen in bestimmten F~llen empirisch wiederlegt werden kSnnen. Auf die Kritik wird hier nicht weiter eingegangen, da im Rahmen der Fragestellung dieser Arbeit das empirische Verhalten menschlicher Entscheidungstr~iger eine untergeordnete Rolle spielt. Das Konzept der Pr'~ferenzordnung kann auf zwei Arten dargesteUt wetden, um es fiir die Untersuchung der Nachfrage des Individuums nach einzelnen Giitern zu nutzen. Die lndi~erenzkurvendarstellung fragt danac~, welche Giiterbiindel ein N a d ~ a g e r als gleichwertig betrachtet. Fiir eine Zwei-Giiter-Welt lassen sich die gleichwertigen Biindel in einem Koordinatensystem abtragen, dessen Achsen die Quantit~iten der beiden verfiigbaren Giiter angeben. Ein gleichwertiges Biindel bildet dann eine (im Standardfall konkave) Kurve in dem Koordinatensystem, die als Indifferenzkurve bezeichnet wird. Ffihrt man die zusiitzliche Annahme ein, dass Individuen grunds~tzlich grSgere Mengen von Giitern ldeineren vorziehen, s4 so liegen Indifferenzkurven, die einen hSheren Grad von Bediirfnisbefriedigung verschaffen, stets weiter augen im Koordinatensystem. Eine Indifferenzkurve gibt dariiber hinaus an, welche Menge des Gutes Xl ein Konsument freiwillig bereit ist, fiir eine bestimmte Menge des Gutes x2 aufzugeben. Das Verh~iltnis, in dem Xl gegen x2 eingetauscht wird, wird als Grenzrate der Substitution bezeichnet. In der Regel nimmt diese zu, je mehr der N achfrager bereits von dem Gut x lbesitzt. Die andere MSglichkeit, die Pr'Aferenzordnung eines Individuums darzu83H~ufig wird anstelle der strikten Pr~ferenz ~ zungchst die schwache Pr~ferenz eingefiihrt (vgl. z.B. Feess, 1997, S. 191), die den Fall der Indifferenz des Konsumenten zwischen zwei Gfiterbfmdeln einschliegt. Diese wird als transitiv angenommen, d.h. -~ ~_ 3] A i] ~ T ~ ~ ~ T . Davon ausgehend wird dann die strikte Pr~Lferenz als Negation der entgegengesetzten schwachen Pr~ferenz definiert, d.h. ~2~ >- if ~ --(~] ~_ 2i~). Hier wird der Darstellung yon Kreps gefolgt, der zungchst >- einfiihrt und davon ausgehend ~ Ms Abwesenheit einer strikten Pr~ferenz fiir das Gegenteil definiert, also ~ ~_ if ~ --(~ >- -~). Negative Transitivit~t yon >- ist dann ~luivalent zur Transitivit~t yon ~_. Die h~ufig zus~tzlich flit ~ getroffene Annahme der Vollst~ndigkeit ist durch die Asymmetrie yon >- bereits impliziert. Vgl. Kreps, 1990, S. 24. 84Diese Annahme wird auch als Nicht-S~ttigungsaxiom bezeichnet, vgl. Feess, 1997, S. 192.
40
2 Information als Wirtschaftsgut
stellen, besteht in der Formulierung einer Nutzenfunktion u : X --, R, die jedem Giiterbfindel aus X einen reellen Zahlenwert zuordnet. Gelegentlich wird auch der Ausdruck N u t z e n i n d e x f u n k t i o n verwendet, dem die Vorstellung zugrundeliegt, dass jeder der (unendlich vielen) Pr/iferenzkurven eines Individuums ein Index zugeordnet wird, der um so hSher ist, je weiter aufoen im Koordinatensystem die Kurve liegt. In der heute iiblichen Interpretation handelt es sich bei dem Nutzen somit um eine ordinale Gr5tge: s5 gr5fgere Nutzenwerte bezeichnen stets ein h5heres Matg an Bedfirfnisbefriedigung als niedrigere, aber der Abstand zwischen den Nutzenwerten ist nicht interpretierbar, da die PrMerenzkurven ebenso gut mit beliebigen anderen aufsteigenden Indizes versehen werden kSnnten. Nutzen kann somit nicht kardinal gemessen werden, d.h., ein doppelter Nutzenwert bedeutet nicht, dass der Nachfrager doppelt so zufrieden ist. Auch ein Vergleich von Nutzenwerten zwischen verschiedenen Personen ist nach dieser Vorstellung nicht m6glich. Formal 1/isst sich zeigen, dass die oben angefiihrten Annahmen eine ordinale Nutzenfunktion bestimmen, allerdings nut bis zu einer monoton steigenden (ordnungserhaltenden) Transformation, d.h., wenn u(-~) fiir eine Nutzenfunktion steht, die eine bestimmte PrMerenzordnung abbildet, dann bildet z.B. auch v(-~) -- u(Eff)3 dieselbe Pr~ferenzordnung at). s60ffensichtlich bleiben bei einer solchen Transformation die Verh/iltnisse zwischen den Nutzenwerten nicht erhalten. Hinsichtlich der Gestalt einer Nutzenfunktion sind nur wenige allgemeine A ussagen m6glich. In der Regel wird angenommen, dass Konsumenten grStgere Mengen desselben Gutes kleineren Mengen vorziehen. Der Grenznutzen jedes Gutes xi ist demnach positiv, und fiir die partiellen Ableitungen der Nutzenfunktion nach x~ gilt ou > 0 ffir i = 1, ..., n. Auigerdem wird oft die Gfiltigkeit des ersten Gossenschen Gesetzes 87 angenommen, das besagt, dass der Grenznutzen einer zus~itzlichen Menge desselben Gutes abnimmt, je mehr yon diesem Gut bereits konsumiert wurde. Somit gilt ffir die zweiten 85Frfihere Vertreter der Nutzentheorie hingen einer kardinalen Theorie an, d.h. sie hielten es im Prinzip fiir mSglich, den Nutzen einer Person zu messen. Vgl. Fehl und Oberender, 2002, S. 307f. S6Vgl. Giith, 1992, S. 10. STVgl. Fehl und Oberender, 2002, S. 307. Urspriinglich wurde das erste Gossensche Gesetz im Zusammenhang einer kardinalen Nutzentheorie formuliert. Streng genommen ist die Bildung von Ableitungen einer nicht kardinalen Nutzenfunktion nicht mSglich, da der Differenzenquotient, der ja auf Verh~iltnisse von Funktionswerten abstellt, keine sinnvolle Definition besitzt.
2.3 Zahlungsbereitschaft fiir Informationsgfiter
41
partiellen Ableitungen ~r57 fi Giitern monoton steigt. Damit ist, unter den gesetzten Annahmen, 47Vgl. Bakos und Brynjol#son, 1999, S. 1616. 48Die Annahme lautet formal P([xn- ~n[ < e) < P([xn+l- jun+l[ < e), wobei 1 die Zahlungsbereitschaft pro Gut ffir ein Biindel mit n Giitern bezeichnet. Angenommen wird damit faktisch, dass die spezifischen Zahlungsbereitschaften gr6f,erer Biindel stii.rker um den jeweiligen Mittelwert konzentriert sind als die kleinerer. Bakos und Brynjolfsson halten fest, dass diese Annahme fiir die meisten iiblichen Nachfragefunktionen wie lineare, logarithmische und auf einer Normalverteilung der Zahlungsbereitschaften basierende erfiillt sei, vgl. Bakos und Brynjolfsson, 1999, S. 1618.
89
3.4 B i i n d e l u n g u n d A b o n n e m e n t s
die Profitabilit~it endlicher Bfindel gesichert. Unter der restriktiveren Annahme unabhiingig und identisch verteilter Zahlungsbereitschaften vni mit dem Mittelwert #n und der Varianz a,~2 lautet die Untergrenze der Gewinne pro Gut 7r(n) ffir ein Biindel mit n Giitern 49
7r(n) > #n
1- 2
an
n
+
/
...... n
.
In dem Modell von B a k o s und B r y n j o l f s s o n reduziert eine substitutive Beziehung zwischen den Informationsgiitern c.p. den Anreiz zur Bfindelung, w~ihrend eine komplement~ire Beziehung ihn verstMkt. Budgetrestriktionen der Konsumenten ffihren dazu, dass die Varianz der Zahlungsbereitschaften ffir das Biindel rascher mit der BfindelgrSf~e abnimmt, wobei die gesamte Zahlungsbereitschaft ffir das Bfindel gegen die Budgetrestriktion konvergiert. Wird die Annahme identischer #n und a,~2 der Verteilungen der Reservationspreise fiir die Einzelgiiter aufgehoben, so ist es ffir den Anbieter nicht in jedem Fall vorteilhaft, ein weiteres Gut zum Biindel hinzuzufiigen: Existiert ffir ein fragliches Gut i z.B. eine hohe durchschnittliche Zahlungsbereitschaft #il beim Einzelverkauf, so kann es profitabler sein, diese Zahlungsbereitschaft durch einen separaten Verkauf abzuschSpfen. Aui~erdem kann das Hinzuffigen eines Gutes mit einer hohen Varianz der Zahlungsbereitschaften den varianzreduzierenden Effekt des bereits bestehenden Biindels konterkarieren und damit das Bfindel insgesamt weniger profitabel machen. 5~ Die Aufhebung der Annahme unabhiingiger Verteilung der Zahlungsbereitschaften ffihrt B a k o s und B r y n j o l f s s o n zu zwei F~illen: Einerseits kSnnen die Zahlungsbereitschaften korrelieren, ohne dass gemeinsame zugrunde liegenden Variablen existieren, andererseits ist es auch mSglich, dass es solche Variablen gibt. Der erste Fall kann am Beispiel eines BSrsenhiindlers verdeutlicht werden: Dieser interessiert sich besonders fiir aufeinander folgende Meldungen zu bestimmten Branchen, so dass eine starke Korrelation zwischen seinen Bewertungen dieser Meldungen zu erwarten ist. Je weiter sich die Thematik einer Meldung jedoch vom Zentrum seines Interesses entfernt, desto geringer wird die Korrelation. In diesem Fall l ~ s t sich die Kernaussage 49Vgl. Bakos und Brynjolfsson, 1999, S. 1620. 5~ Bakos und Brynjolfsson, 1999, S, 1621ff.
90
3 Vermarktung von Informationsgfitern
der Varianzreduktion durch VergrSf~erung des Biindels weiterhin aufrechterhalten. ~x Korrelieren dagegen die Bewertungen mit einer gemeinsamen zugrunde liegenden Variablen, z.B. ob es sich bei dem Nachfrager um eine Privatperson oder ein Unternehmen handelt, dann gilt die zentrale Aussage nicht mehr: Die Verteilung der Biindelbewertungen wird in diesem Fall zwei H/iufungspunkte aufweisen, die den jeweiligen Nachfragertyp repr/isentieren. Hier ist, wenn die unterliegende Variable identifizierbar ist, eine Preisdiskriminierung dritten Grades mSglich, wobei die Biindel den verschiedenen Nachfragergruppen zu unterschiedlichen Preisen angeboten werden. Eine weitere MSglichkeit besteht darin, eine Selbstselektion der Nachfrager zu veranlassen, indem verschiedene Biindel angeboten werden, von denen jedes die fiir eine Nachfragergruppe essenziellen Informationsgiiter enth~ilt, die jeweils in den iibrigen Biindeln nicht enthalten sind. Schlief~lich existieren einige Ans/itze, die die Effekte der Biindelungsstrategie unter Wettbewerbsbedingungen analysieren. Diese werden hier nur kurz betrachtet, da auch das in dieser Arbeit entwickelte Verhandlungsmodell von einem monopolistischen Informationsanbieter ausgeht. Fishburn und Odlyzko beschreiben die Konkurrenz zwischen zwei Informationsanbietern, von denen einer seine Inhalte immer in Form eines Abonnements, also eines zeitlich gestreckten Biindels, anbietet, w/ihrend der andere stets ungebiindelte Giiter verkauft. Die Konsumenten haben in jeder Periode die M6glichkeit, den Anbieter und damit das Preismodell zu wechseln. Die Nachfrager unterscheiden sich in ihrer Nutzungsrate, d.h. der Anzahl der Informationsg/iter, die sie pro Periode erwerben bzw. nutzen, sind aber indifferent zwischen den Giitern des einen und des anderen Anbieters. 52 H~iufig kommt es in diesem Modell zu einem ruinSsen Preiskampf zwischen den beiden Anbietern, sofern kollusives Verhalten ausgeschlossen wird. In den F/illen, in denen stabile Gleichgewichtspreise existieren, liegen die aggregierten Ums/itze beider Firmen unterhalb des Monopolniveaus, und der Anbieter des Abonnements hat einen leichten Vorteil gegen/iber dem Anbieter der Einzelgfiter. 53 Ein deutlicherer Vorteil fiir den Anbieter des Biindels ergibt sich, wenn die Annahmen von Bakos und Brynjolfsson (siehe oben) gelten. 54 51Vgl. Bakos und Brynjolfsson, 1999, S. 1623. 52Vgl. Fishburn und Odlyzko, 1999, S. 449ff. 53Vgl. Fishburn und Odlyzko, 1999, S. 469. 54Vgl. Bakos und Brynjol#son, 2000, S. 72.
3.5 Zusammenfassung
91
In der Konkurrenz zweier Verleger, die nicht in direkter Konkurrenz um Nachfrager stehen, sich aber einen Preiskampf um weitere Inhalte von Zulieferern, z.B. Autoren, liefern, gewinnt unter den Voraussetzungen des oben dargestellten Modells von Bakos und Brynjolfsson derjenige Verleger die Oberhand, der bereits das grSgere Gfiterbfindel anbietet, da er stets bereit ist, mehr an die Produzenten der Informationsgfiter zu zahlen. 55 Kephart und Fay simulieren eine Reihe von Anbietern, die jeweils ein Bfindel anbieten und fiber die Zeit hinweg sowohl die Zusammensetzung als auch den Preis ihres Bfindels variieren kSnnen. Die einzelnen Elemente der Biindel sind Informationsgfiter bestimmter Kategorien, die direkt gegeneinander substituierbar sind, w~i~hrend Gfiter aus unterschiedlichen Kategorien nicht substituierbar sind. Die Anbieter kSnnen entscheiden, welche Kategorien in ihrem jeweiligen Bfindel enthalten sind. Abweichend von den Annahmen der bisher dargestellten Modelle entstehen den Konsumenten hier Kosten ffir jedes einzelne erworbene Informationsgut, ,,zu vier' erworbene Gfiter kSnnen also nicht kostenfrei auger Acht gelassen werden. Wenn die Anbieter eine myopische Strategie verfolgen, also in jeder Periode ihre individuell optimale Antwort auf den Zustand des Marktes in der Vorperiode als neues Verhalten annehmen, in der Annahme, dass sich das Verhalten der fibrigen Marktteilnehmer nicht ~indert, dann kommt es h~iufig zu zyklischen Bewegungen in der Zusammensetzung der Bfindel und in den Preisen. Insgesamt kSnnen aber fiber die Zeit hinweg positive Profite realisiert werden. 56 3.5 Z u s a m m e n f a s s u n g Nach einer kurzen Einffihrung in die Begriffiichkeit der Preisdifferenzierung wird das Grundproblem dargestellt, mit dem ein Monopolist als Anbieter dauerhafter Gfiter konfrontiert ist. Es wird erSrtert, wie Coase zu der nach ihm benannten Vermutung gelangt, in einer solchen Situation sei der Anbieter nach kurzer Zeit gezwungen, seine Preise auf das Niveau eines Wettbewerbsmarktes zu senken. Anschlie~end werden einige formale Modelle dargestellt, die detaillierter das Verhalten eines Monopolisten mit dauerhaften Gfitern analysieren. Diese best~itigen weitgehend die Gfiltigkeit der CoaseVermutung. 55Vgl. Bakos und Brynjolfsson, 2000, S. 69. 56Vgl. Kephart und Fay, 2000, S. 118 sowie S. 122ff.
92
3 Vermarktung yon Informationsgiitern
Die daraufhin untersuchte Literatur zur Bfindelungsstrategie als einer alternativen MSglichkeit, eine Selbstselektion der Nachfrager zu induzieren, hat bislang keine einfachen Kriterien f/ir die Profitabilit~it bzw. die gesamtwirtschaftliche Vorteilhaftigkeit von B/indeln hervorgebracht. Dies gilt selbst dann, wenn der Einfluss der marginalen Kosten und eventuell vorhandener substitutiver oder komplement/irer Beziehungen zwischen den G/item nicht betrachtet wird. W/ihrend unter bestimmten Annahmen fiber die Verteilung der Reservationspreise der Nachfrager gro~e Vorteile hinsichtlich beider Aspekte realisierbar erscheinen, existieren andere Umst~inde, unter denen eine B/indelung sowohl die Profite des Anbieters als auch die insgesamt realisierten Tauschgewinne reduziert. Offenbar benStigen Anbieter eine recht genaue Kenntnis des Nachfragepotenzials, um eine optimale Bepreisungsstrategie w/ihlen zu kSnnen.
4 Spieltheoretische Verhandlungsmodelle
Verhandlungen werden in mehreren wissenschaftlichen Disziplinen untersucht, u.a. in der Politologie, der Soziologie, den Wirtschaftswissenschaften und in jfingerer Zeit im Forschungsgebiet der Multiagentensysteme. 1 Viele dieser Ans~itze behandeln den Gegenstand in seiner ganzen Komplexit~it, indem sowohl soziale und psychische Faktoren Berficksichtigung finden als auch die MSglichkeit mehrdimensionaler Verhandlungen, in denen eine Einigung nicht nur entlang einer einzigen Dimension gesucht wird, sondern eine Vielzahl von Faktoren umfasst. Auch Verhandlungen zwischen mehr als zwei Teilnehmern werden in den genannten Disziplinen erSrtert. Fiir die Fragestellung dieser Arbeit sind jedoch die Einflussfaktoren von besonderer Bedeutung, die sich auf die Ergebnisse reiner Preisverhandlungen zwischen zwei Akteuren auswirken. Daher konzentriert sich dieses Kapitel auf die Ergebnisse einer Reihe von spieltheoretischen Modellen, in denen Verhandlungssituationen zwischen zwei Akteuren untersucht werden. Da die Spieltheorie nicht zu den Standardmethoden der Wirtschaftsinformatik gehSrt, wird in Abschnitt 4.1 eine kurze Einfiihrung in deren Methodik gegeben, um ein grundlegendes Verst~indnis der anschliet~end dargestellten Modelle zu vermitteln. Abschnitt 4.2 erSrtert das Grundproblem der 5konomischen Untersuchung von Verhandlungen, n~imlich das Bestehen eines beidseitigen Monopols bzw. das Fehlen von alternativen Vertragspartnern, deren Vorhandensein in anderen F~illen eine wichtige Grundlage des 5konomischen Erkl~irungsmodells bildet. In den folgenden Abschnitten wird zun~ichst die VerhandlungslSsung von Nash dargestellt (Abschnitt 4.3), bevor anschiiet~end sequenzielle Verhandlungsmodelle bei vollst~indiger (Abschnitt 4.4), einseitig unvollst~indiger (Abschnitt 4.5) und beidseitig unvollst~indiger Information (Abschnitt 4.6) betrachtet werden.
1Ergebnisse aus diesem Gebiet werden unten in Abschnitt 5.2 referiert.
94
4 Spieltheoretische Verhandlungsmodelle
4.1 Grundbegriffe der Spieltheorie 4.1.1 "Spiele" und rationales Verhalten
Die Idee, 5konomische Situationen mit Hilfe einer "Mathematischen Theorie der Gesellschaftsspiele''2 zu modellieren, geht zurfick auf John yon Neumann und Oskar Morgenstern. 3 Ziel dieses Vorgehens ist es, pr/izise theoretische Vorhersagen f/ir eine Klasse von Situationen zu ermSglichen, die mit dem bis dahin verf~gbaren Instrumentarium der 5konomischen Theorie nur unzureichend behandelt werden konnten. Es handelt sich um solche Situationen, in denen sich lediglich eine kleine Zahl von Individuen gegen/ibersteht, im Extremfall nur zwei. Um die besondere Komplexit/it dieser F/ille zu begr/inden, die, betrachtet man die Summe aller sozialen bzw. 5konomischen Interaktionen, eher die Regel als die Ausnahme sein d/irften, rekurrieren die Autoren auf das allgemeine Erkl/irungsprinzip der 5konomischen Theorie, die Annahme rationalen Verhaltens. Diese Annahme besagt, dass sich ein Konsument, der sich vor die Wahl zwischen verschiedenen Alternativen gestellt sieht, so entscheiden wird, dass seine Bediirfnisse bestmSglich befriedigt werden. Ist von einem Unternehmer als Entscheidungstr/iger die Rede, wird eine Entscheidung postuliert, durch die dessen Gewinn maximiert wird. Fiihrt man zur Bestimmung des Grades der Bediirfnisbefriedigung eine Von-Neumann-Morgenstern-Nutzenfunktion ein, wie sie oben in Abschnitt 2.3.2.2 dargestellt wurde, wird auch das Problem des Konsumenten zu einem Maximierungsproblem, in seiner Struktur analog dem Problem des Unternehmers. Im Prinzip werden theoretische Vorhersagen in der neoklassischen 0konomik dann nach folgendem Muster abgeleitet: Ffir ein Modell der zu untersuchenden Situation, das die Zusammenh~inge zwischen den (Nutzen- bzw. Gewinn-)Positionen der Akteure exakt abbildet, wird ein Zustand der Entscheidungsvariablen gesucht, in dem das eben beschriebene Optimierungsproblem fiir alle Akteure simultan gelSst ist. In einem solchen Zustand, so er existiert, hat keiner der Akteure ein Interesse, seine Entscheidung zu revidieren, da ihn dies schlechter stellen wiirde gegeniiber dem Zustand, in dem alle Optimierungsprobleme gelSst sind. Da ein solcher Zustand also stabil ist, solange keine Anderung ~iui~erer Umst~inde eintritt, wird er als o.
2yon Neumann, 1928. 3yon Neumann und Morgenstern, 1953.
4.1 Grundbegriffe der Spieltheorie
95
Gleichgewicht bezeichnet. Gleichzeitig ist dies der Zustand, der, ausgehend vonder Hypothese rationalen Verhaltens, als wahrscheinliches Ergebnis der untersuchten Situation prognostiziert wird. Die Existenz eines Gleichgewichts ist es auch, die es erlaubt, das individuelle Verhalten der Akteure auf dem Weg zu einem Gleichgewicht schliet~lich durch die Nutzen- bzw. Gewinnposition der Akteure nach dem Erreichen des Gleichgewichts zu charakterisieren. Solange sich alle Akteure rational verhalten, ist die Nutzenposition 4 eines Akteurs im Gleichgewicht das Maximum dessen, was er erreichen kann. Die Handlungen, die er unternehmen muss, um diese Position zu erreichen, wird er also unternehmen, sofern er nach diesem Maximum strebt. Gleichzeitig existiert in der Regel nur eine einzige Kette von Entscheidungen, die dem Akteur das Erreichen einer bestimmten Gleichgewichtsposition sichert. Damit ist also durch die Gleichgewichtsposition auch die Reihe der vorher getroffenen Entscheidungen bzw. der ausgefiihrten Aktionen determiniert, was die Gleichsetzung von erwartetern Wert einer Situation ffir die Beteiligten und Vorhersage des Verhaltens der Beteiligten in dieser Situation ~ gestattet. Wie sp~iter zu erSrtern sein wird, impliziert rationales Verhalten, wie es bis hierher beschrieben wurde, jedoch keineswegs, dass jede denkbare Situation nur ein oder mindestens ein Gleichgewicht zul~st. Im Gegenteil wird ein erheblicher Teil der sp~teren Diskussion in diesem Kapitel damit befasst sein, den plausibelsten einer (teilweise sehr grot~en) Anzahl mSglicher Gleichgewichtspunkte zu identifizieren. Dabei wird insbesondere eine erhebliche Verfeinerung des Konzepts der Rationalit~it notwendig werden. Von Neumann und Morgenstern weisen nun auf folgende Schwierigkeit hin, die bei der Anwendung rationalen Verhaltens als Erkl~ungsprinzip auftritt: Im Allgemeinen setzt rationales Verhalten aus Sicht der Akteure mehr voraus als die LSsung eines Optimierungsproblems im iiblichen Sinne. Denn die jeweilige Entscheidungssituation eines Akteurs wird in diesem Fall u.a. dutch das Verhalten aller iibrigen Akteure determiniert. Da dies ffir alle Akteure gilt, muss jeder Akteur die Verhaltens~nderungen der iibrigen 4Da es sich sowohl bei dem hier betrachteten Nutzenkonstrukt, als auch bei monet~rem Gewinn um kardinal messbare GrS~en handelt, wird in Zukunft der Kiirze halber nur noch von Nutzen gesprochen, wenn tats~ichlich Nutzen oder Gewinn betrachtet werden kSnnte. In den sp~iter diskutierten Verhandlungsmodellen wird der Verhandlungsgegenstand ohnehin als monet~ire GrSge modelliert, womit der Unterschied zwischen Konsument (Nutzen) und Unternehmer (Gewinn) noch weniger ins Gewicht f'~llt. 5Vgl. Abschnitt4.2.
96
4 Spieltheoretische Verhandlungsmodelle
Akteure beriicksichtigen, die durch sein eigenes Verhalten induziert werden. 6 Die Autoren stellen diese Situation der einer sog. Robinson-CrusoeOkonomie gegeniiber, in der eine einzelne Person vor dem Problem steht, die ihr zur Verfiigung stehenden Ressourcen optimal zur Befriedigung ihrer Bedfirfnisse einzusetzen, ohne jegliche Form des Austausches mit anderenNot a single datum with which he [i.e., the Robinson-Crusoeactor; SP] has to deal reflects another person's will or intention of an economic kind-based on motives of the same nature as his own. A participant in a social exchange economy, on the other hand, faces data of this last type as well: they are the product of other participant's actions and volitions (like prices). His actions will be influenced by his expectations of these, and they in turn reflect the other participants' expectation of his actions. 7 Der letzte Teil dieser Aussage entspricht genau jenem Problem, vor dem die Spieler in Strategiespielen wie Schach, aber auch in Spielen mit einem Zufallselement wie Backgammon, SLut oder Doppelkopf stehen. Um diese Schwierigkeit zu umgehen, macht sich die 5konomische Theorie oft das "Gesetz der grof~en Zahr' zunutze: 8 Wenn die Zahl der Akteure gro~ genug wird, dann wird der Einfluss der Entscheidungen eines einzelnen Akteurs auf jeden anderen Akteur gering genug, um ihn g~inzlich auSer Acht zu lassen. Am deutlichsten ist dieses Prinzip im Modell der vollkommenen Konkurrenz (engl. perfect competition) verkSrpert: Die Annahme einer atomistischen Marktstruktur sowohl auf der Angebots- als auch auf der Nachfrageseite schlief~t eine Anderung des Marktpreises durch eine _~nderung der von einem einzelnen Anbieter angebotenen Menge oder der von einem einzelnen Nachfrager nachgefragten Menge aus. Der Marktpreis kann somit von den Akteuren als Datum betrachtet werden, wenn sie ihre individuellen Produktions- bzw. Nachfrageentscheidungen treffen. In der Theorie des (einseitigen) Monopols sind die einzelnen Nachfrager ebenfalls gezwungen, den Preis des Monopolisten als Datum zu betrachten, da eine Anderung oo
6In der Tat ist bereits friiher, insbesondere in der Oligopoltheorie, bemerkt worden, dass
solche Situationen Eigenschaften aufweisen, die Strategiespielen ~ihneln. Die Rede ist hier vonder sog. Aktions-Reaktionsverbundenheit, vgl. Fehl und Oberender, 2002, S. 69f. 7yon Neumann und Morgenstern, 1953, S. 12. 8Vgl. yon Neumann und Morgenstern, 1953, S. 13ft.
4.1 Grundbegriffe der Spieltheorie
97
ihres individuellen Nachfrageverhaltens nicht genfigend Einfluss auf die aggregierte Nachfrage hat, um den Monopolisten zu einer .Anderung seiner Preispolitik zu veranlassen. Der Monopolist sieht sich zwar einer Reaktion der Nachfrager auf seine Preisentscheidung gegeniiber, deren Parameter jedoch nicht von seiner Entscheidung abh~ingen, sondern von ihm als Datum betrachtet werden kSnnen. In der Oligopoltheorie dagegen ~indert sich die Nachfrage, der sich ein Anbieter gegeniibersieht, mit ji.nderungen in den Preis- bzw. Mengenentscheidungen der anderen Anbieter. Gleichzeitig wissen die fibrigen Anbieter, dass dieser eine Anbieter auf ihre Entscheidungen reagieren wird. Hier ist also bereits genau die oben beschriebene Situation einer strategischen Interaktion gegeben, obgleich ffir die Nachfrageseite noch das "Gesetz der grot~en Zahr' gilt. Reduziert man die Zahl der Akteure weiter, wird die Verflechtung der gegenseitigen Abh~i~gigkeiten immer grS~er und die Pr~ision der Aussagen der 5konomischen Theorie nimmt ab. Von Neumann und Morgenstern hoffen nun, mit Hilfe einer pr~zisen mathematischen Formulierung dieser Spiele, also solcher Situationen, in denen strategische Abh~ngigkeit zwischen den Entscheidungen der Handlungstr~iger vorliegt, den Grundstein ffir eine fundamentalere und damit, jedenfalls auf lange Sicht, zu pr~iziseren Aussagen fiihrende Theorie zu legen. 9 Das Fundament ihrer Theorie bildet die Ableitung des oben erl~iuterten Erwartungsnutzens. Rationales Handeln wird in dieser Arbeit kiinftig mit der Wahl von Handlungsalternativen gleichgesetzt, durch die der in diesem Sinne definierte (Erwartungs-)Nutzen eines Individuums im Rahmen der gegebenen MSglichkeiten maximiert wird. 1~
4.1.2 Kooperative und nicht-kooperative Spieltheorie Nash trifft als erster eine Unterscheidung zwischen den zwei grundlegenden spieltheoretischen Methoden:ll Die nicht-kooperative Methode untersucht, wie sich rationale Spieler verhalten, wenn sie keinerlei MSglichkeit haben, 9 Von Neumann und Morgenstern entwickeln ihre Theorie zun~chst fiir Spiele mit zwei Teilnehmern und weiten sie anschlie~,end auf mehrere Teilnehmer aus. In dieser Arbeit wird allerdings der Fokus auf 2-Personen-Spiele gelegt, die der in Abschnitt 4.2 dargestellten Verhandlungssituation entsprechen. l~ Handeln in diesem Sinne ist streng genommen nur in abstrahierten Modellwelten mSglich. Vgl. z.B. Simon, 1996, S. 25f. llVgl. Nash, 1950, 1953, fiir eine weitergehende ErSrterung vgl. auch Binmore und Dasgupta, 1987, S. 4ft.
98
4 Spieltheoretische Verhandlungsmodelle
w~hhrend des Spiels auf~erhalb des in den Spielregeln gestatteten Rahmens zu kommunizieren bzw. zu kooperieren. Die kooperative bzw. axiomatische Methode ermittelt eine LSsung, ohne die konkrete Formulierung der Regeln des Spiels zu betrachten. Es werden vielmehr bestimmte Kriterien als Axiome postuliert, die fiir jede denkbare LSsung gelten sollen. Jedes Axiom schr~i~kt die Menge der in Betracht kommenden LSsungen ein, und mit einer ausreichenden Anzahl sinnvoll gewfi~hlter Axiome bleibt lediglich eine LSsung iibrig. Natiirlich sollten die Axiome eine sachliche Rechtfertigung besitzen, um die so gewonnene LSsung akzeptabel erscheinen zu lassen. Die Axiome kSnnen als allgemeine Vernunftprinzipien aufgefasst werden, auf die sich die Akteure berufen, w ~ r e n d sie im Vorfeld des eigentlichen Spiels dariiber verhandeln, wie sie sich im Spiel verhalten werden. 12 In dieser Arbeit stehen Ergebnisse der nicht-kooperativen Spieltheorie im Vordergrund, da es nicht p r i m ~ um die Vorhersage von Verhandlungsergebnissen geht, sondern um ein pr~iziseres Verst~indnis rationalen Verhaltens im Rahmen gegebener Verhandlungsprotokolle. Dennoch wird zum einen zur Illustration der Unterschiede zwischen den beiden Mehtoden die Ableitung der sog. Nash-VerhandlungslSsung sowohl auf axiomatische als auch auf nicht-kooperative Weise dargestellt (vgl. Abschnitt 4.3), zum anderen wird kurz auf die mit der axiomatischen Methode verwandte Theorie anreizkompatibler Mechanismen eingegangen, die es erlaubt, Grenzf'eille fiir Verhandlungsergebnisse unter unvollst~diger Information zu ermitteln (vgl. Abschnitt 4.7).
4.1.3 Formale Darstellung yon Spielen An einem Spiel nehmen I Spieler teil, die mit arabischen Zahlen 1,2, ..., I bezeichnet werden. 13 Ein Spiel besteht aus einer endlichen Anzahl von Ziigen. 14 Ein Zug konfrontiert jeweils einen Spieler mit einer genau abgegrenz12Vgl. Binmore, 1992, S. 195. 13Unter der Perspektive dieser Arbeit werden allerdings in den folgenden Abschnitten ausschlief,lich Zwei-Personen-Spiele betrachtet. 14Das bedeutet nicht, dass die Anzahl der tats/ichlich durchlaufenen Ziige zu Beginn des Spiels feststeht. Fiir die Endlichkeit der Ziige geniigt es, dass ein Abbruchkriterium existiert, durch das das Spiel in jedem Fall zu einem Endpunkt gelangt, vgl. z.B. yon Neumann und Morgenstern, 1953, S. 58f. und Kuhn, 1997, S. 49. Im Schachspiel, das prinzipiell durch die Wiederholung von Stellungen unendlich viele Ziige lang fortgesetzt
99
4.1 Grundbegriffe der Spieltheorie 1
1,0
2,3
0,1
-1,0
Abbildung 4.1: Baumstruktur eines Spiels (eigene Darstellung) ten Auswahl von Alternativen, die entweder zu weiteren Ziigen desselben oder eines anderen Spielers ffihren oder zu einem Endpunkt des Spiels, an dem jeder Spieler eine A uszahlung in Form von Nutzeneinheiten bzw. Geld erh~lt. Manche Zfige sind keinem der Spieler zugeordnet, sondern repr~isentieren Zufallsereignisse im Spielverlauf, bei denen die Alternativen mit bestimmten, feststehenden Wahrscheinlichkeiten eintreten. Es wird vorausgesetzt, dass diese Wahrscheinlichkeiten allen Spielern bekannt sind. Diese Beschreibung eines Spiels entspricht einer Baumstruktur, wie sie exemplarisch in Abb. 4.1 gezeigt wird. Die Abbildung ist folgendermat~en zu interpretieren: Die Zahl neben einem Knoten steht fiir den Spieler, der am Zug ist. Das Spiel beginnt an dem nicht ausgefiillten Knoten, der mit "1" beschriftet ist. Spieler 1 beginnt also das Spiel und muss seine Wahl zwischen den Alternativen L und R treffen. W~ihlt er L, wird das Spiel bei dem Knoten fortgesetzt, der auf die mit "L" beschriftete Kante folgt, w~ihlt er R, geht es bei dem rechten Knoten weiter. Spieler 2 muss sich nun zwischen den Alternativen a und b bzw. c und d entscheiden, je nachdem, welche Alternative Spieler 1 gewfi~hlt hat. Mit der Entscheidung von Spieler 2 endet das Spiel und die Spieler erhalten die Auszahlungen, die am Ende der Kanten verzeichnet sind. Die Auszahlung, die Spieler 1 erh~ilt, wird durch den ersten Wert repr~isentiert, diejenige fiir Spieler 2 durch den zweiten. Diese Darstellung eines Spiels gibt dessen Regeln wieder, nicht den Verlauf einer konkreten Partie, denn es werden jeweils die MSglichkeiten aufgezeigt, die sich den Spielern bei ihren Ziigen erSffnen, aber es wird keine Aussage fiber die tats~ichlich getroffenen Entscheidungen gemacht. Im Englischen werden kSnnte, besteht z.B. bei Vorliegen solcher Wiederholungen die M5glichkeit der Beendigung durch ein Remis.
100
4 Spieltheoretische Verhandlungsmodelle 1
B
/ -5, -5
\ 3, - 8
S
/ -8, 3
\ 0,13
Abbildung 4.2: Gefangenendilemma (eigene Darstellung) wird hier zwischen game fiir ein Spiel im Sinne eines Satzes von Spielregeln und play fiir einen konkreten Spielverlauf unterschieden. 15 Im Folgenden wird fiir diese Unterscheidung das Begriffspaar Spiel und Pattie verwendet. Spielregeln enthalten oft Elemente, die den Informationsstand der Spieler bei ihren Entscheidungen betreffen. In dem Spiel in Abb. 4.1 weig Spieler 2 im Augenblick seines Zuges, welche Alternative Spieler 1 gew~ihlt hat. In einem der bekanntesten Spiele, dem in Abb. 4.2 gezeigten Gefangenendilemma, 16 ist dies nicht der Fall. Spieler 1 und 2 sind eines Verbrechens angeklagt. Sie stehen beide vor der gleichen Entscheidung, den anderen Spieler zu beschuldigen (B bzw b) oder zu schweigen (S bzw. s). Beschuldigen beide Spieler einander, erhYt jeder eine Strafe von 5 Jahren, ausgedriickt als ein negativer Nutzen von-5. Schweigen beide, kommen sie ohne Strafe davon, ausgedriickt als ein Nutzen von 0. Beschuldigt schlieglich einer seinen Kumpanen, der hartn~ickig schweigt, so wird er freigelassen und kann sich einen grSgeren Anteil an der Beute sichern (Nutzen 3), w~ihrend der andere eine l~iaagere Strafe von 8 Jahren erh~ilt. Entscheidend fiir den Ausgang des Spiels ist, dass Spieler 2 nicht weit~, wie Spieler 1 entschieden hat, bevor er seine Entscheidung trifft. Dies wird durch die mit "2" beschriftete gestrichelte Linie zwischen den beiden Knoten symbolisiert, die auf den Zug von 1 folgen. Sie besagt, dass Spieler 2 seine Entscheidung treffen muss, ohne zu wissen, an welchem der durch die gestrichelte Linie verbunden Knoten er sich befindet. 17 Man sagt, diese
15yon Neumann und Morgenstern, 1953, S. 49. 16vgl. z.B. Kreps, 1990, S. 503f. 1TAuch die Alternativen an allen in einem Informationsbezirk zusammengefassten Knoten miissen identisch sein, da der Spieler sonst in der Lage w~ire, die Knoten anhand der verfiigbaren Alternativen zu unterscheiden.
101
4.1 Grundbegriffe der Spieltheorie
1
o
c
~a
N
~0
-- 1 I)
z t!
N
-- 1 I)
-- 1 11
.'~(41)
-- 1 I)
-- I fl
-- 1 fl
9.~1
Abbildung 4.3: Vereinfachtes Roulette-Spiel (eigene Darstellung) Knoten befinden sich im selben In formationsbezirk, is Viele Spiele enthalten darfiber hinaus Zufallselemente. Auch diese werden als Knoten im Spielbaum abgebildet, die jedoch keinem der Spieler 1, 2, ..., I zugeordnet sind, sondern der "Natur", reprfisentiert durch das Symbol N. Ein Spiel eines einzelnen Spielers gegen N wird in Abb. 4.3 dargestellt. Es handelt sich um ein Roulette-Spiel, in dem der Spieler jedoch darauf beschr~inkt ist, auf "Rot", "Schwarz" oder "Null" zu setzen. Anschlie~end wird das Roulette gedreht und eine der drei MSglichkeiten, hier mit R, S und 0 bezeichnet, tritt ein. Bei Zufallsereignissen werden die Eintrittswahrscheinlichkeiten der mSglichen Ergebnisse jeweils in geschweiften Klammern angegeben, im Beispiel also { ~is} fiir "Rot" und "Schwarz", sowie {~7} fiir "Null". Die Auszahlungen in der Abbildung beziehen sich auf einen Einsatz von 10 Geldeinheiten. Die graphische Darstellung eines Spiels kann, in allgemeiner Form, in ein mathematisches Modell gefasst werden. 19 Ein Spiel besteht dann aus folgenden Komponenten: 1. Eine Menge von Spielern, bezeichnet mit 1, 2, ..., I fiir ein I-Personen18Der englische Begriff information set w~ire im mathematischen Sinne mit Informationsmenge zu fibersetzen. Um die sich im Deutschen aufdr~ingenden Assoziationen mit einer bestimmten Quantit/it von Informationen zu vermeiden, die insbesondere angesichts des Themas dieser Arbeit Verwirrung stiften kSnnte, wird im Folgenden in Anlehnung an Giith, 1992, S. 37f., der Begriff Informationsbezirk verwendet. 19Die geometrische Formulierung eines Spiels als Baum wird in Kuhn, 1997, eingefiihrt, w/ihrend yon Neumann und Morgenstern, 1953, diese MSglichkeit der Darstellung zwar kurz erw~ihnen, vgl. S. 77f., sonst aber eine etwas andere Darstellung w~ihlen. Die Darstellung in dieser Arbeit ist angelehnt an Kreps, 1990, S. 363-371, wobei einige Symbole ge~ndert wurden, um deren m5glichst einheitliche Verwendung in der gesamten Arbeit zu erreichen.
102
4 Spieltheoretische Verhandlungsmodelle
Spiel. Ein typischer Spieler wird mit i bezeichnet, fiir Zufallsereignisse nimmt die "Natur", bezeichnet mit N, die Rolle eines Spielers ein. 2. Ein Spielbaum, der aus einer Menge K und einer bin/iren Relation -~ auf K besteht. Ein typisches Element von K wird mit k bezeichnet und Knoten genannt. Die Relation -~ wird als '~ist Vorg/inger von" gelesen. -~ ist a) asymmetrisch, d.h. ffir kein Paar k, k t E K gilt gleichzeitig k -~ k ~ und k t -~ k, b) transitiv, d.h. fiir alle k, k t, k" E K gilt, wenn k t -~ k" und k -~ k t, dann gilt auch k -~ k", und es gilt c) wenn k -~ k" und k ~ -~ k", dann gilt entweder k -~ k t oder k t -~ k. Diese Eigenschaften von -~ garantieren, dass der Baum keine Ringe enth/ilt, also Zweige, die wieder in einen ihrer eigenen Vorg~ingerknoten miinden, und dass keine Knoten, die sich auf verschiedenen Zweigen des Baums befinden, gemeinsame Nachfolger besitzen. Jeder Knoten hat unter diesen Bedingungen hSchstens einen unmittelbaren Vorgiinger, der, falls vorhanden, mit p(k) bezeichnet wird. Daneben werden die folgenden Begriffe definiert: 9 P(k) - {k' E K : k' -~ k} bezeichnet die Menge aller VorgSnger eines Knotens, Elemente der Menge 9 W - {k E K : P(k) = q}}, also Knoten, die keine Vorg~inger besitzen, werden Anfangsknoten oder Wurzeln genannt, 2~ 9 S(k) - {k' E K : k -~ k'} ist die Menge aller Nach]olger yon k, s(k) bezeichnet den unmittelbaren Nachfolger und 9 Z - {k E K : S(k) = q}} bezeichnet die Menge aller Endknoten bzw. Ergebnisse des Spiels.
Aus den Bedingungen ffir -~ folgt weiterhin, dass fiir jeden Knoten k it W genau ein Pfad zu genau einem Anfangsknoten w E W existiert. 2~ dieser allgemeinen Formulierung kann ein Spiel mehrere Anfangsknoten besitzen. An welchem der Anfangspunkte das Spiel tats/ichlich beginnt, h~ngt vom Zufall ab, die Wahrscheinlichkeiten sind aber, wie bei Zufallsereignissen im Spielverlauf, bekannt, vgl. Nr. 7. Ebenso gut kSnnte also ein Zug, der N zugeordnet ist, vor diese Anfangsknoten geschaltet werden.
4.1 Grundbegriffe der Spieltheorie
103
3. Eine Funktion ~ : ( K \ Z ) ~ {N, 1, 2, ...,I} ordnet jedem Knoten, der kein Endknoten ist, einen der Spieler oder N zu, der an diesem Knoten entscheidet, welche Alternative ausgew~ihlt wird, d.h., bei welchem Nachfolgeknoten das Spiel fortgesetzt wird. 4. Zu jedem k E (K\Z) existiert eine Menge ausf/ihrbarer Handlungen A(k) sowie eine Funktion a : s(k) ~ A(k), die jedem unmittelbaren Nachfolgeknoten von k einer der Handlungsalternativen zuordnet. Jede Handlung f/ihrt zu einem bestimmten Knoten k, und jeder Nachfolger von k wird wiederum von einer bestimmten Handlung erreicht. 5. Die Partition H teilt die Menge (K\Z) in disjunkte Untermengen auf, wobei ein typisches Element h _C H als Informationsbezirk bezeichnet wird. Fiir ein beliebiges Paar k, k ~ E h sollen folgende Eigenschaften gelten: a) k ~ P(k') und k' ~ P(k), d.h. kein Element von h daft zu den Vorg~ingern eines anderen Elements aus h gehSren, b) ~(k) = ~(k'), d.h. alle Elemente von h sind demselben Spieler bzw. der Natur zugeordnet, und c) A(k) = A(k'), d.h. an allen Knoten in h stehen dieselben Alternativen zur Auswahl. Wegen der Bedingungen b) und c) wird auch ~(h) f/ir den Spieler geschrieben, dem die Knoten des Informationsbezirks h zugeordnet sind, sowie A(h) fiir die dort verf/igbaren Handlungsalternativen. Jeder Entscheidungsknoten k E (K\Z) gehSrt zu einem Informationsbezirk. Manche Informationsbezirke enthalten nur einen Knoten. Es besteht eine Verbindung zwischen einem Informationsbezirk und dem Verlauf des Spiels bis zu diesem Informationsbezirk: Aus der Sicht eines Spielers i, der keine vollst~indigen Informationen fiber alle im Spielverlauf getroffenen Entscheidungen besitzt, repr~sentiert ein Informationsbezirk genau den Informationsstand, den i fiber den bisherigen Verlauf des Spiels hat, d.h. i weif~ nicht mehr, als dass er sich an einem der Knoten k E h befindet, h wird deshalb unten auch als Symbol fiir den Verlauf bzw. die Geschichte (history) einer Partie verwendet.
104
4 Spieltheoretische Verhandlungsmodelle
6. Eine Funktion U 9 {1,2, ...,I} • Z -~ R ordnet jedem Spieler den Nutzen U(i,z) zu, den er erh~ilt, wenn das Spiel an dem Endknoten z E Z endet. Kfinftig wird statt U(i,z) auch die Schreibweise Ui(z) verwendet. 7. Eine Wahrscheinlichkeitsfunktion p existiert fiber der Menge von Anfangsknoten W, und fiber den Alternativen A(k) jedes Knotens k E ( K \ Z ) mit e(k) = N ist eine Wahrscheinlichkeitsfunktion Pk definiert. p(w) gibt die Wahrscheinlichkeit an, dass das Spiel im Knoten w beginnt, und pk(a) gibt die Wahrscheinlichkeit an, dass die Alternative a E A(k) eintritt. Mit diesen Elementen ist die Definition eines Spiels vollst~iadig. Sie sind ausreichend, um eine sehr breite Klasse von Spielen bzw. 5konomischen Situationen zu modellieren, von denen in dieser Arbeit nur ein kleiner Ausschnitt betrachtet wird. Ein in dieser Form beschriebenes Spiel wird auch als extensives Spiel bezeichnet. Im folgenden Abschnitt wird kurz auf die MSglichkeit eingegangen, extensive Spiele in die sog. strategische Form oder Normalform zu fiberffihren, wobei von den Einzelheiten des Spielverlaufes abstrahiert wird und lediglich die Ergebnisse verschiedener Spielverliiufe betrachtet werden. Die Verhandlungsmodelle, die den eigentlichen Grund zu einer Beschiiftigung mit der Spieltheorie in dieser Arbeit darstellen, sind jedoch zumeist als extensive Spiele formuliert.
4.1.4 Strategien und die strategische Form eines Spiels Die im vorigen Abschnitt beschriebene Darstellung eines Spiels legt die Regeln des Spiels fest und die Auszahlungen, die die Spieler erhalten, wenn das Spiel an einem bestimmten Endpunkt endet. Das Verhalten der Spieler unter den Bedingungen eines bestimmten Spiels wird in Form von Strategien erfasst. Eine Strategie des Spielers i gibt ffir jeden Informationsbezirk h mit ~(h) = i an, welche der mSglichen Handlungen A(h) beim Erreichen von h ausgeffihrt wird. Sei Hi die Menge aller Informationsbezirke, an denen i handelt, Hi - {h e H[~(h) = i}, und Ai die Menge aller Handlungen an Informationsbezirken in Hi, Ai - {a E A(h)lh E Hi}, dann kann eine Strategie als Funktion 7ri(h) : Hi ~ Ai formuliert werden. Eine Strategiekombination -i? = (Tri,~r2, ..., rI) enthiilt genau eine Strategie ffir jeden Spieler.
4.1 Grundbegriffe der Spieltheorie
105
Strategien in der gerade definierten Form werden als reine Strategien bezeichnet, da an jedem Informationsbezirk h genau eine Alternative gewfi~hlt wird. Ein Spieler kann jedoch auch eine gemischte Strategie formulieren. 21 In diesem Fall existiert eine Wahrscheinlichkeitsfunktion ai fiber allen reinen Strategien 7ri des Spielers, so dass ai(Tri) die Wahrscheinlichkeit angibt, mit der in einer Partie die Strategie 7ri gespielt wird. Es gilt ~-~., ai(n~) = 1, d.h. mit Sicherheit wird eine der Strategien 7ri gew~ihlt. Wird ~i in einer Partie angewendet, dann gilt diese Strategie ffir alle Ziige der Partie, die Mischung erfolgt also zwischen vollst~indigen reinen Strategien. Reine Strategien sind ein Sonderfall der gemischten Strategien, in dem ai(~vi) = 1 ffir ein beliebiges hi. Eine Strategiekombination gemischter Strategien ist = (~1, ~2, ..., ~ I ) .
In sog. Verhaltensstrategien 22 existiert eine gesonderte diskrete Wahrscheinlichkeitsverteilung 3h fiber den Alternativen A(h) an jedem einzelnen Informationsbezirk h, wobei 3h(a) die Wahrscheinlichkeit angibt, dass Alternative a E A(h) g e w ~ l t wird. Es gilt ~'~eA(h) 3h(a) = 1, d.h. mit Sicherheit wird eine der Handlungen a E A(h) gewiihlt. Fiir Informationsbezirke, in denen ein Zufallsereignis stattfindet, ffir die also gilt t(h) - N, ist 3h(a) = pk(a) mit k E h. Eine Verhaltensstrategie des Spielers i ist ein n-Tupel -~i E I-IhEH~ ~h mit n = [Hi[. Eine Strategiekombination von Verhaltensstrategien ist -~ = (-~1,-~2, ...,-~I). Reine Strategien sind als Sonderfall in den Verhaltensstrategien enthalten. Ffir alle Informationsbezirke mit ~(h) = 1,...,I, also ffir alle Zfige, die persSnlichen Spielern zugeordnet sind, ist dann die Wahrscheinlichkeit der Ausffihrung der in der reinen Strategie 7ri vorgesehenen Handlungen 1, w~hrend die aller fibrigen 0 ist, demnach gilt also 1, ~i(h) = a /3h(a) = O, ~i(h) ~ a " Der Erwartungswert der Auszahlung des Spielers i in einer Partie, in der die Kombination von Verhaltensstrategien -~ gespielt wird, kann ermittelt werden, indem die Summe der Erwartungswerte aller Endknoten z E Z gebildet wird. Der Erwartungswert eines Endknotens ist das Produkt der Wahrscheinlichkeiten, mit der die auf dem Pfad zu diesem Endknoten liegenden Handlungen ausgeffihrt werden, und der Auszahlung, die i an diesem 21Vgl. yon N e u m a n n und Morgenstern, 1953, S. 143ff. 22Vgl. Kuhn, 1997, w
106
4 Spieltheoretische Verhandlungsmodelle
Endknoten erhglt. Wie oben definiert, gibt a(k) die Handlung an, die gewfiJllt wurde, um zu Knoten k zu gelangen. P(z) ist die Menge aller Knoten auf dem Pfad, der zu dem Ergebnis z ffihrt. Es sei ~k = ~hlk3h. Ffir den Erwartungswert gilt dann
Schlieiglich ist auch eine gemischte Verhaltensstrategie denkbar, bei der eine Wahrscheinlichkeitsfunktion ~i fiber mehrere 7 i existiert, so dass ~i (-gi) die Wahrscheinlichkeit angibt, dass in einer Partie die Verhaltensstrategie -~i gew~ihlt wird. Wieder gilt ~ - g ~ ~i = 1. Der Ausgang einer Partie h~hngt letztlich von den Strategiekombinationen ~ , ~ , -~ oder ~ ab, also von der Interaktion der von den Spielern gewfi,hlten Strategien. Kuhn zeigt, dass in Spielen mit vollkommener Erinnerung 23 der Spieler ffir jede gemischte Verhaltensstrategie ~i eine fiquivalente Verhaltensstrategie 7 i existiert. 24 Daher ist es mSglich, die 0berlegungen in den Abschnitten 4.4 und 4.5 auf Verhaltensstrategien zu beschr~inken. In der strategischen bzw. Normalform eines Spiels werden lediglich die Strategiekombinationen der Spieler und die resultierenden erwarteten Auszahlungen jedes Spielers betrachtet. Ffir Zwei-Personen-Spiele kSnnen sog. Auszahlungsmatrizen aufgestellt werden. Abbildung 4.4 zeigt das Gefangenendilemma aus Abbildung 4.2 in der Normalform. Es existiert zwar, wie eben erSrtert, eine eindeutige Vorschrift zur Ableitung der Normalform aus einem Spiel in der extensiven Form. Umgekehrt kann aber eine Normalform fiir eine Vielzahl extensiver Spiele stehen. Es findet also beim 0bergang auf die Normalform ein Verlust an P r ~ i s i o n der Modellierung statt. W~ihrend diese VergrSberung in manchen F~llen unproblematisch ist, kommt es 23Spiele mit vollkommener Erinnerung sind dadurch gekennzeichnet, dass die Spieler, wenn sie am Zug sind, wissen, wie sie an jedem vorigen Informationsbezirk, an dem sie am Zug waren, entschieden haben. Gegenbeispiele sind Spiele wie Bridge oder Doppelkopf, in denen im Normalfall jeweils zwei Teilnehmer gemeinsam spielen. Diese Spiele kSnnen als Zwei-Personen-Spiele aufgefasst werden, in denen jeder Spieler auf zwei sog. Agenten aufgeteilt ist. In solchen Spielen kommt es vor, dass ein Spieler bei seinem folgenden Zug (der yon einem anderen Agenten ausgefiihrt wird) nicht weir,, was er bei seinem vorigen Zug wusste; z.B. kennt der eine Agent nicht die Karten des anderen. Vgl. yon Neumann und Morgenstern, 1953, S. 53. 24Vgl. Kuhn, 1997, w5.
107
4.1 Grundbegriffe der Spieltheorie
Spieler 1 Spieler 2 b s
-5,-5 3,-8
-8,3 0,0
Abbildung 4.4: Gefangenendilemma in Normalform (eigene Darstellung) in den hier untersuchten Verhandlungsmodellen sehr auf die dynamischen Details des Verhandlungsverlaufs an. Daher sind diese als extensive Spiele modelliert. 4.1.5 Gleichgewichte, Gleichgewichtspunkte und L5sungen
Das Ziel der Spieltheorie ist es, aus der formalen Darstellung eines Spiels, wie sie in den vorangehenden Abschnitten erl/iutert wird, eine Vorhersage fiber das Verhalten rationaler Akteure in einer solchen Situation abzuleiten, d.h. welche Strategien die Spieler w/ihlen, und damit, welche Auszahlungen realisiert werden. Das am h/iufigsten genutzte Kriterium ist das sog. Nash-Gleichgewicht. 2~ Ein Nash-Gleichgewicht liegt dann vor, wenn jeder Spieler eine Strategie verfolgt, die gegeniiber den gew~hhlten Strategien der iibrigen Spieler optimal ist. Solange also keiner der anderen Spieler seine Strategie/indert, hat ein Spieler keine Veranlassung, seinerseits eine andere Strategie zu w~ihlen. Gilt dieses Kriterium gleichzeitig fiir die Strategie jedes einzelnen Spielers, so hat kein Spieler eine Veranlassung, seine Strategie zu/indern. Damit befinden sich die Strategien aller Spieler in der Tat in einem Gleichgewicht. Formal kann das Nash-Gleichgewicht folgendermaf~en formuliert werden: Sei (-Y, o~) _- (O'1,a2, ..., Oi, ..., aI) fiir i = 1, ..., I, also eine Kombination gemischter Strategien -~, in der die Strategie des /-ten Spielers durch oi ersetzt ist. Ein Strategieprofil -~ ist ein (Nash-)Gleichgewichtspunkt genau dann, wenn ffir jedes i gilt 26 -
-
oi
25Vgl. Nash, 1951. 26Vgl. Nash, 1951, S. 287.
108
4 Spieltheoretische Verhandlungsmodelle
Dies entspricht genau dem oben beschriebenen Sachverhalt: durch Ersetzen der (gemischten) Strategie ai durch eine beliebige andere Strategie oi kann i keine hShere Auszahlung erzielen. Als Gleichgewichtspunkt wird das Tupel (U1, U2, ..., UI) von Erwartungswerten bezeichnet, das durch die Strategiekombination -~ induziert wird, wenn -~ ein Nash-Gleichgewicht darstellt. Nash zeigt, dass jedes n-Personen-Spiel mindestens einen Gleichgewichtspunkt in gemischten Strategien besitzt. 27 Der Begriff ,,LSsung" kann im Kontext der Spieltheorie einerseits als Vorhersage fiber das tats~ichliche Verhalten 5konomischer Akteure in einer so charakterisierten Situation verstanden werden, andererseits als eine Bestimmung des Wertes, den ein Akteur der MSglichkeit beimessen wird, an einer solchen Verhandlungssituation teilzunehmen. 2s 4.2 Verhandlungen aus 5konomischer Perspektive Die Situation, die in diesem Kapitel untersucht wird, definiert John Nash in seinem grundlegenden Beitrag "The Bargaining Problem" folgenderma~en: A two-person bargaining situation involves two individuals who have the opportunity to collaborate for mutual benefit in more than one way. 29
Zwei Elemente sind es, die eine Verhandlungssituation kennzeichnen. Zum einen kann ein bestimmtes Nutzenpotenzial ffir beide Akteure erschlossen werden, wenn diese bestimmte Handlungen aufeinander abstimmen. Zum anderen gibt es mehrere Kombinationen von Handlungen, die das Nutzenpotenzial erschliet~en. Die Frage ist nun, welche Kombination von Handlungen die Akteure realisieren werden. Dabei ist zu beachten, dass neben dem Kooperationspotenzial in der Regel auch ein Konflikt besteht, nfimlich darum, wie das durch die Kooperation gewonnene Nutzenpotenzial verteilt wird. In dieser Arbeit interessiert ausschlie~lich ein spezieller Fall der Verhandlungssituation: Ein Anbieter und ein Nachfrager stehen sich gegenfiber und verhandeln fiber den Preis eines Gutes. Beide kSnnen gewinnen, wenn sie 27Vgl. Nash, 1951, S. 288. 2SVgl. z.B Nash, 1950, S. 155; yon Neumann und Morgenstern, 1953, S. 31 ft. 29Nash, 1950, S. 155, Hervorhebung im Original.
4.2 Verhandlungen aus 6konomischer Perspektive
109
sich auf einen Preis einigen und der Tausch stattfindet. Allerdings h~agt die Verteilung des mSglichen Tauschgewinns zwischen den beiden Parteien davon ab, zu welchem Preis der Tausch tats~ichlich stattfindet. Lange Zeit sah sich die 5konomische Theorie auf~er Stande, n~here Vorhersagen fiber diesen Preis zu machen. Es schien, als sei er mehr von psychologischen oder soziologischen Faktoren wie dem individuellen Verhandlungsgeschick bzw. der Verhandlungsmacht der Parteien bestimmt, als von Faktoren, die dem g~ingigen 5konomischen Rationalwahlmodell zug~inglich sind. Von Neumann und Morgenstern schr~inken auf der Grundlage spieltheoretischer 0berlegungen die mSglichen LSsungen auf die Menge pareto-optimaler und individuell rationaler Einigungen ein, ermitteln aber keine eindeutige LSsung. 3~ Nash gelingt es als erstem, eine eindeutige LSsung ffir das Verhandlungsproblem abzuleiten. 31 Diese LSsung wird im Abschnitt 4.3 beschrieben.
In den darauf folgenden Abschnitten werden spieltheoretische Verhandlungsmodelle dargestellt, in denen einige der restriktiven Annahmen des Modells von Nash schrittweise ausgeweitet werden. In Abschnitt 4.4 werden Modelle diskutiert, in denen der Einfluss der Struktur des Verhandlungsprozesses auf dessen Ergebnis untersucht wird. Unter anderem spielt es eine Rolle, ob Angebote und Gegenangebote von beiden Verhandlungspartnern abwechselnd abgegeben werden kSnnen oder ob nur ein Partner Angebote machen kann, die der andere lediglich annehmen oder ablehnen kazan. Auch die Zeit, die zwischen den Angeboten vergeht bzw. die zur 0bermittlung der Angebote benStigt wird, hat einen Einfluss auf das Ergebnis. Die Modelle gehen vonder Annahme aus, dass die Akteure eine positive Zeitpr~ferenzrate aufweisen, also eine frfihere Einigung einer sp~teren vorziehen. Der Unterschied in der "Geduld" der Akteure, also die Relation der ZeitprMerenzraten, hat einen entscheidenden Einfluss auf das Ergebnis. Abschnitt 4.5 behandelt Modelle, in denen die Informationen der Akteure in dem Sinne unvollst~indig sind, dass eine oder beide Parteien einzelne Determinanten der Situation zu Beginn der Verhandlungen nicht genau kennen. Dabei handelt es sich um Faktoren wie die GrSf~e des zu verteilenden Tauschgewinns und die Zeitpr~ferenzrate des anderen Akteurs.
Binmore, 1992, 176ff. 31Nash, 1950, 1951, 1953.
3~
110
4 Spieltheoretische Verhandlungsmodelle
4.3 E i n s t u f i g e V e r h a n d l u n g s m o d e l l e
Nash pr/isentiert als erster spieltheoretische LSsungen ffir ein Modell des in Abschnitt 4.2 beschriebenen 5konomischen Problems. In den folgenden drei Abschnitten wird zun~ichst gezeigt, wie Nash die Verhandlungssituation in ein formales Modell fasst, anschlief~end werden die beiden LSsungsmethoden dargestellt.
4.3.1 Modell der Verhandlungssituation Es existieren zwei Akteure, ein Nachfrager B und ein Anbieter S, die fiber den Preis eines zu tauschenden Gutes verhandeln. B ist bereit, maximal einen Preis b ffir das Gut zu bezahlen. S entstehen Kosten in HShe von s, um das Gut herzustellen. Der Tauschgewinn betr~igt also b - s. Der Preis p bestimmt die Aufteilung des Tauschgewinns. Die Verhandlung kann entweder mit einer Einigung auf einen Preis p enden, oder damit, dass keine Einigung zustande kommt. Formal ist die Menge der mSglichen Ergebnisse X _= {p [p E ]R } U {| wobei das Symbol | ffir die Situation steht, in der kein Tausch stattfindet. 33 Die Akteure sind aber auch in der Lage, Lotterien im Sinne von Abschnitt 2.3.2.2 fiber den Elementen der Menge X als Einigung zu formulieren. Konkret bedeutet dies, dass sie sich z.B. auch darauf einigen kSnnen, mit einer Wahrscheinlichkeit a zum Preis p zu tauschen, w~ihrend mit einer Wahrscheinlichkeit von 1 - a kein Tausch stattfindet. Auch kompliziertere Lotterien mit mehreren Preisen sind mSglich. Der VNM-Nutzen der Akteure ist dann Ui(w), wobei w E W ( X ) fiir die ausgewfihlte Lotterie steht. Die Menge mSglicher Auszahlungen entspricht dann Z =_ {(UB(w),Us(w))[w E W}. Wird weiterhin angenommen, dass die Akteure risikoavers oder hSchstens risikoneutral sind und ihre VNMNutzenfunktionen daher konkav verlaufen, so ergibt sich, dass Z konvex 32Diese Menge enth~lt bewusst auch Ergebnisse, die auf den ersten Blick wenig wahrscheinlich sind, n~imlich sowohl negative Preise als auch Preise, die grSf~er sind als b. Solche Einigungen von vornherein auszuschlief~en, hief,e jedoch, bereits bestimmte Annahmen fiber das Verhalten der Akteure vorauszusetzen, die im Folgenden erst schrittweise eingeffihrt werden. 33In Nashs ursprfinglicher Formulierung ist das Modell nicht auf monet~re Verhandlungen beschr~nkt, es kann ebenso gut auf Naturalgfiter bezogen sein. Im Rahmen dieser Arbeit steht der Fall von Preisverhandlungen im Vordergrund.
4.3 Einstufige Verhandlungsmodelle
111
Us ~
"!..
Abbildung 4.5: Menge der mSglichen Verhandlungsergebnisse (in Anlehnung an Binmore, 1992, S. 180) und
kompakt ist. a4
In Abbildung 4.5 ist die Menge X der gesamte Bereich links unterhalb der schwarzen Kurve. Auf der vertikalen Achse sind die Nutzenwerte von B abgetragen, auf der horizontalen Achse die von S. Zus/itzlich ist der Punkt -~ - (Us (| Us (| abgebildet. Er zeigt den Nutzen, der den Akteuren bleibt, wenn sie sich nicht einigen kSnnen. Dieser muss nicht zwangsl/iufig im Ursprung liegen, da die Akteure fiber alternative HandlungsmSglichkeiten verffigen kSnnen, die anderweitig Nutzen stiften, wenn der infrage stehende Tausch nicht zustande kommt. Der Punkt -~ wird auch als Drohpunkt bezeichnet, da jeder der Verhandlungspartner glaubhaft machen kann, dass er keiner Einigung zustimmen wird, die ihn schlechter stellt als der Verzicht auf eine Einigung. Ein Nash-Verhandlungsproblem besteht nun darin, der Kombination aus einer Menge mSglicher Verhandlungsergebnisse und einem Drohpunkt eine bestimmte Kombination von Nutzenwerten als Verhandlungsergebnis zuzu34Eine Menge von Tupeln ist konvex, wenn alle Tupel auf der Strecke, die zwei beliebige Tupel aus dieser Menge verbindet, ebenfalls Elemente dieser Menge sind. Da die Wahrscheinlichkeits- bzw. Linearkombinationen beliebiger Tupel aus X per Definition der VNMN ebenfalls in X liegen, ist X konvex. Eine Menge von Tupeln ist kompakt, wenn sie begrenzt (alle Elemente kiinnen von einem geniigend gro~en Quadrat in der Fl~iche umschlossen werden) und geschlossen (alle konvergierenden Folgen von Elementen der Menge konvergieren gegen ein Element der Menge) ist.
112
4 Spieltheoretische Verhandlungsmodelle
ordnen.
4.3.2 Axiomatische L6sung Mit Hilfe einer Reihe von Axiomen, die zu den Annahmen der VNMN hinzutreten, ist es mSglich, einen einzelnen Punkt -~ E Z als LSsung zu isolieren. 35 Die erste Annahme besteht darin, dass jede VerhandlungslSsung individuell rational sein soll, d.h. kein Akteur 1/isst sich auf eine Einigung ein, bei der er sich individuell schlechter stellt. Formal lautet das Axiom wie
folgt" A n n a h m e 4.3.1. Fiir jede Lb'sung -~ muss gelten -~ > ~ . s 6 In Abbildung 4.6 a) wird die Wirkung dieses Axioms durch die beiden vom Drohpunkt ausgehenden gepunkteten Linien verdeutlicht: Die LSsung muss sich in dem Bereich innerhalb von Z befinden, der rechts der senkrechten und oberhalb der waagerechten gepunkteten Linie liegt. Augerdem soll jede VerhandlungslSsung pareto-effizient sein, d.h. eine LSsung kann kein Punkt sein, an dem es mSglich ist, einen der beiden Akteure besser zu stellen, ohne dass der andere verliert. Als formales Axiom heigt dies: A n n a h m e 4.3.2. Wenn ein Punkt -~t E Z existiert, fiir den gilt -~' > -~,
dann gilt - ~ = -~. In der Abbildung 4.6 (a) bleiben nach Anwendung dieses Axioms nur die Punkte in dem fett dargestellten Abschnitt der Grenze von Z zwischen deren Schnittpunkten mit den gepunkteten Linien fibrig. Um aus diesem Bereich einen Punkt als eindeutige LSsung zu bestimmen, werden drei weitere Annahmen herangezogen: Zun/ichst soll das Ergebnis der Verhandlungen ausschlieglich von den relativen Pr/iferenzen der Akteure in Bezug auf die mSglichen Ergebnisse abh/ingen. Wenn eine Anderung der numerischen Nutzenwerte das Ergebnis beeinflussen wiirde, dann w/iren die Nutzenfunktionen durch weitere Faktoren determiniert, die nicht 35Vgl. Nash, 1950, 1951. Die Darstellung hier stiitzt sich auf,erdem auf Binmore, 1992, S. 180if, wobei die dortige Diskussion in einigen Punkten vereinfacht wird. 36Fiir zwei Vektoren ~ = (xo, xl, ...,xn), -ff = (Yo,Yl, ...,Yn) wird hier und im Folgenden -~ > ~ geschrieben, wenn gilt xi :> yi, Vi - 0.... , n, wenn also jedes einzelne Element des Vektors -~ grSf~er oder gleich dem entsprechenden Element im Vektor ~ ist.
4.3 Einstufige Verhandlungsmodelle
113
uB,
iii!iiiiiiii;
(b)
\
.....
:
\
....%~i.. ~iil~ . ....
~-~1.... \\\ i
Us
Abbildung 4.6: Axiomatische Ableitung der Nash-LSsung (in Anlehnung an Binmore, 1992, S. 187) durch die VNMN erfasst werden. Aus der VNMN abgeleitete Nutzenfunktionen sind, wie in Abschnitt 2.3.2.2 er5rtert, nur determiniert bis zu affinen Transformationen. Das folgende Axiom besagt, dass auch die Eigenschaft eines Punktes, ein L5sungspunkt des Verhandlungsproblems zu sein, bei einer affinen Transformation erhalten bleibt. A n n a h m e 4.3.3. Lineare Trunsformationen der Nutzenfunktionen in der Form Ti(Ui) = aiUi + b~ mit as > 0 fiir i e {B, S}, bei denen die Reihenfolge der PrSferenzen erhalten bleibt, haben keinen Einfluss au] die relative Position der L5sung. Wenn -~ E Z die LSsung des Verhandlungsproblems (Z, ~ ) ist, dann ist -~' = (TB(SB),TS(SS)) die L6sung des Verhandlungsproblems (Z', (Ts(ds), ~'s(ds))), wobei Z '=_ {(TB(ZB), Ts(Zs)), I-F e Z}. Diese Annahme l ~ s t es zu, wie in Abbildung 4.6 (b) gezeigt, die urspriingliche Menge Z so zu transformieren, dass der Drohpunkt -~ im Ursprung zu liegen kommt und die Diagonale, die durch den Punkt (0, 1) auf der horizontalen Achse und den Punkt (1, 0) auf der vertikalen Achse verl/iuft, eine Unterstiitzungslinie der Bildmege Z I bildet. Die Menge Z I liegt somit vollst/indig links und unterhalb dieser Linie. Nun wird zus/itzlich angenommen, dass die L5sung symmetrisch ist. Sie wird durch keine mit den Spielern verbundenen Faktoren beeinflusst aut~er denen, die in dem Verhandlungs/
problem (Z, ~ \
\
/
enthalten sind. Insbesondere bestehen keine Unterschiede
114
4 Spieltheoretische Verhandlungsmodelle
in der F~ihigkeit der Spieler, die in dieser Beschreibung enthaltenen Informationen zu interpretieren und optimal ffir sich zu nutzen. A n n a h m e 4.3.4. Die LSsung ist symmetrisch im Hinblick auf das Spiel,
d.h. sie hSngt nicht davon ab, welcher der Spieler als Spieler B bzw. S bezeichnet wird. s7 Schliet~lich wird angenommen, dass wegfallende alternative Einigungen, die selbst keine LSsungspunkte darstellen, keinen Einfluss auf die Lage des LSsungspunktes haben. Dieses Axiom wird auch als ,,Unabh~i~gigkeit von irrelevanten Alternativen" bezeichnet, as A n n a h m e 4.3.5. Sei-~ die LSsung eines Verhandlungsproblems ( Z ~, ~ ) ,
c I
Z t"
Wiirde die Menge m6glicher Einigungen den gesamten Bereich links unterhalb der Diagonalen (0, 1)(1,0) umfassen, dann w ~ e offenbar die einzige LSsung, die die Annahmen 4.3.1, 4.3.2 und 4.3.4 erfiillen wfirde, der Punkt -~' = (1, 1), an dem die Nutzenwerte beider Spieler vertauscht werden kSnnen, ohne dass dies einen Einfluss auf die Lage der LSsung hat. Da aber die transformierte Einigungsmenge Z t eine Untermenge dieser Menge ist, stellt - ~ gem~it~ Axiom 4.3.5 auch die LSsung fiir diese Menge dar. Von dem LSsungspunkt - ~ der transformierten Menge Z t gelangt man durch Anwendung der Umkehrfunktionen zi = T[I(z~) = z~-b, ~ zum LSsungspunkt der ursprfinglichen Menge Z. Die entscheidende Folgerung aus den vorhergehenden Uberlegungen besteht darin, dass die Nash-LSsung 7 dort liegt, wo das Produkt der Nutzen der beiden Spieler maximal ist, d.h.
-~ = max ZBZS. --Zez 37Die von Nash eingefiihrte Annahme der Symmetrie ist keine positive Annahme fiber die Rationalit~it der Spieler, sondern entspricht der Annahme, dass die nicht n~iher in der Definition des Spiels beriicksichtigte ,,Verhandlungsmacht" der Akteure gleich sei. Asymmetrische Nash-LSsungen sind ebenfalls mSglich, vgl. Binmore, 1987a, S. 35. 3sNash weist darauf hin, dass die Rechtfertigung fiir Axiom 4.3.5 weniger offensichtlich ist als fiir die iibrigen. Vgl. Nash, 1950, S. 159 sowie Nash, 1953, S. 138.
4.3 Einstufige Verhandlungsmodelle
115
fiir (PB, PS) ~- X fiir (PB, PS) ~ X
Abbildung 4.7: Nash-Verhandlungsprozess als extensives Spiel (eigene Darstellung, vgl. Nash, 1953, S. 130f.)
4.3.3 Nicht-kooperative L6sung Die Ableitung der LSsung aus einem nicht-kooperativen Spiel erfordert eine exakte Spezifikation des Spielablaufs und der Alternativen der Spieler. Nash modelliert den Verhandlungsprozess als extensives Spiel, das in Abbildung 4.7 gezeigt wird. Das Spiel enth/ilt ein bisher noch nicht erl/iutertes Darstellungselement: Die dreieckigen grauen F1/ichen repr/isentieren jeweils ein Kontinuum von Alternativen, die darin eingezeichnete schwarze Linie stellt einen repr/isentativen Zug des jeweiligen Spielers dar. Spieler B beginnt das Spiel und w/ihlt eine Drohung dB, d.h. er verkiindet, welche Handlung er ausfiihren wird, wenn keine Einigung zustande kommt. Spieler S w/ihlt ebenfalls eine Drohhung ds. Die Wahl der Drohungen kann auch gleichzeitig erfolgen, in keinem Fall spielt es eine Rolle, ob einer der Spieler zuerst fiber die Wahl des anderen informiert wird oder ob beide diese Information gleichzeitig erhalten. Diese Stufe des Spiels beriicksichtigt, dass die Handlungen, die die Akteure ausfiihren, wenn keine Einigung erreicht wird, durchaus Einfluss auf die Nutzenposition des jeweils anderen Akteurs haben kSnnen. So kann z.B. ein Akteur mit einer juristischen Auseinandersetzung drohen, falls die Verhandlung ergebnislos bleibt. Dieser Aspekt wird in der axiomatischen LSsung nicht explizit betrachtet. Anschlief~end stellen beide Spieler eine Preisforderung Pi, zu der sie zu einer Einigung bereit sind. Wie die senkrechte gestrichelte Linie beim zweiten Zug von Spieler S andeutet, kennt dieser die Forderung von Spieler B nicht, wenn er seine Wahl trifft; das Kontinuum von Knoten, das auf den zweiten Zug von B folgt, befindet sich im selben Informationsbezirk. Falls es einen Punkt -F E Z gibt, ffir den gilt z~ >_ U~(p~) fiir i e {B, S}, dann erh~lt
116
4 Spieltheoretische Verhandlungsmodelle
jeder Spieler i seine Forderung. Falls solch ein Punkt nicht existiert, erh~ilt jeder Spieler den Nutzen, den er aus der Umsetzung seiner Drohstrategie di erh~lt, wenn der andere Spieler ebenfalls seine Drohung umsetzt. Die zweite Phase des Spiels, in der beide Spieler ihre Forderungen festlegen, kann als ein eigenes Spiel betrachtet werden, dessen Auszahlungsfunktion in der ersten Phase durch die Wahl der Drohungen bestimmt wird. Allerdings besitzt dieses Spiel eine unbegrenzte Anzahl von Gleichgewichten: Jedes Paar von Forderungen (PB, PS) stellt eine gleichgewichtige Strategiekombination dar, wenn das zugehSrige Nutzentupel (UB(PB),Us(PS)) auf der oberen rechten Begrenzung von Z und weder links noch unterhalb von -~ liegt. Ein Nash-Gleichgewicht muss auf der oberen rechten Begrenzung von Z liegen, da ansonsten einer der Spieler nicht seine optimale Strategie gegenfiber dem anderen anwenden wfirde. Individuell rationale Spieler wfirden sich auf~erdem nie mit einer Einigung zufrieden geben, die ihnen weniger Nutzen verschafft als sie ohne Einigung erhalten kSnnten. Bis hierher verl~iuft die Argumentation also analog zu derjenigen in der axiomatischen Variante des Spiels. Um eine einzige LSsung abzuleiten, wird das Spiel "gegl~ittet". Dazu wird eine kontinuierliche Funktion h(zs, zs) definiert: solange gilt (Zs, ZS) E Z, nimmt h den Wert 1 an, jenseits der Grenze von Z f'~illt h schnell gegen 0, ohne allerdings je 0 zu erreichen. Auf~erdem werden die Nutzenfunktionen der Akteure so transformiert, dass (UB(-~), Us(-~)) im Ursprung zu liegen kommt. 39 Die Auszahlungsfunktionen des gegl~itteten Spiels sind nun kontinuierlich: Ui = hzi. Der Grenzwert dieses gegl~itteten Spiels ffir jenseits von Z immer schneller gegen Null fallende Funktionen h ist das ursprfingliche Spiel (mit in den Ursprung verschobenen Drohpunkten). Ein Punkt (ZB,ZS) stellt ein (Nash-)Gleichgewicht dar, wenn in diesem Punkt Us = hzB gegen ein konstantes zs und gleichzeitig Us = hzs gegen eine konstante Forderung zs maximiert wird. Ein Punkt P, in dem das Produkt zszsh ffir die gesamte Region positiver Zs und zs maximiert ist, stellt ein Gleichgewicht dar. Es bleibt zu zeigen, dass die Bedingungen ffir P nur in einem einzigen Punkt erffillt sind. Wenn h jenseits von X streng monoton f~illt, existiert in jedem Fall nur 39Dies ist mSglich, da VNM-Nutzenfunktionen nur bis zu einer linear-affinen Transformation definiert sind.
4.4 Sequentielle Verhandlungsmodelle mit vollstfmdiger Information
117
ein Punkt, in dem ZBzsh maximal sind. Fiir allgemeinere h verl~iuft die Argumentation wie folgt: Es soll gelten p - max(UBUs) fiir (Us, Us) e Z und Us, Us _> 0. In P gilt dann ZBzS >_ p, da 0 < i~ < 1 und h = 1 auf X. Q ist der Punkt, ffir den UBUs maximal ist. Je schneller nun h jenseits von X gegen Null f'~illt, desto n~her miissen alle Punkte, ffir die die Bedingungen fiir P gelten, an Q rficken. Damit stellt Q den Grenzwert des gegl~itteten Spiels und eine plausible LSsung fiir das urspriingliche Spiel dar. Eine Eigenschaft der Nash-LSsung verdient besondere Beachtung: Um aus dem Kontinuum von Nash-Gleichgewichten des Spiels eine einzelne LSsung auszuwfihlen, war es nStig, die Auszahlungsfunktionen durch die Einfiihrung der Gl~ittungsfunktion kontinuierlich zu machen. Erst dadurch wird es mSglich, die Prominenz der Nash-LSsung zu demonstrieren. Die Gl~ittungsfunktion kann so verstanden werden, dass sich die Akteure fiber die Lage der Grenze von Z nicht vollkommen sicher sind und daher Punkten, die weiter von der vermuteten Grenze entfernt liegen, absteigende subjektive Wahrscheinlichkeiten (die Werte von h) zuordnen. In dieser Interpretation handelt es sich bei dem Nash-Verhandlungsspiel streng genommen um ein Spiel mit unvollst~indiger Information. 4.4 M o d e l l e s e q u e n t i e l l e r V e r h a n d l u n g e n m i t vollst~indiger Information
4.4.1 Grundmodell sequentieller Verhandlungen mit abwechselnden Angeboten Das Nash-Verhandlungsspiel beinhaltet zwar einige wichtige Aspekte der Verhandlungssituation, wirkt aber nicht sehr realistisch. In realen Verhandlungen haben die Teilnehmer in aller Regel nicht nur eine Chance, simultan ihre Angebote zu machen, sondern die Verhandlung besteht aus einer Folge von Angeboten und Gegenangeboten. Solche Situationen lassen sich in spieltheoretische Modelle fassen, die als sequentielle Verhandlungsmodelle bezeichnet werden. Durch die konkretere Modellierung kommt eine Reihe von Parametern hinzu, deren Einfluss auf das Verhandlungsergebnis jetzt untersucht wird. 4~ 4~ Uberblick fiber die Literatur zu nicht-kooperativen Verhandlungsmodellen, insbesondere zu den sequentiellen Verhandlungen, geben Binmore, 1987b,Binmore et al., 1992 und Sutton, 1986.
118
4 Spieltheoretische Verhandlungsmodelle
Das anschliegend dargestellte Modell geht auf Rubinstein zuriick 41 und bildet den Rahmen ffir sfimtliche in diesem und im folgenden Abschnitt diskutierten Modelle. Wie in dem Modell von Nash steht den Verhandlungspartnern eine Reihe verschiedener Einigungen zur Verfiigung, die von beiden unterschiedlich bewertet werden. Es geht also wieder um die Aufteilung des Gesamtnutzens, der im Fall einer Einigung erreicht wird. Ein Spieler beginnt die Verhandlung, indem er eine mSgliche Aufteilung vorschl/igt. Der jeweils andere Spieler hat unmittelbar im Anschluss an ein Angebot die MSglichkeit, es anzunehmen oder abzulehnen. Nimmt er an, endet das Spiel mit der angebotenen Aufteilung. Lehnt er ab, kann er nach einer bestimmten Zeit ein Gegenangebot machen. Dann steht der Spieler, der das urspriingliche Angebot gemacht hat, vor der Situation, das Gegenangebot anzunehmen oder, wieder nach einer gewissen Zeit, ein weiteres Gegenangebot zu machen. Die Prozedur wird fortgesetzt, bis die Spieler zu einer Einigung finden. Der Zeithorizont des Spiels ist also unbegrenzt. 42 Die Verhandlungspartner sind ungeduldig im Hinblick auf eine Einigung, d.h. sie ziehen eine frfihere Einigung einer sp/iteren vor. Kfinftig wird der aufzuteilende Einigungsgewinn auf eine VNM-Nutzeneinheit normiert. Wird Risiko-Neutralit/it der Akteure angenommen, entspricht dies einem monet/iren Einigungsgewinn von einer Geldeinheit. Das Modell bildet eine Situation ab, in der ein K/iufer B mit einer maximalen Zahlungsbereitschaft von 1 einem Verki4ufer S mit (marginalen) Kosten von Null gegeniibersteht und beide fiber den Preis verhandeln, zu dem eine Einheit des Gutes an B verkauft wird. Die Menge aller mSglichen Aufteilungen ist dann X = { (XB, XS) E R 2 IXB, XS _~ 0, XB -~- XS _~ 1 }.43 Die Zeitpunkte, zu denen die Spieler Angebote machen kSnnen, stammen aus der Menge T = {to, t l , t 2 , ...}, mit to - 0 und tn+l > tn. Der zeitliche Abstand zwischen zwei Zeitpunkten sei T = tn+l -- tn, fiir n >_ 0. Zun~ichst wird angenommen, dass T = 1 gilt, womit T = No. 44 41Vgl. Rubinstein, 1982. ~ihnliche Verhandlungsmodelle mit endlichem, durch die Regeln des Spiels definiertem Zeithorizont, vgl. Stdahl, 1972. Die Konsequenzen eines endlichen Zeithorizontes werden kurz in Abschnitt 4.4.7 erSrtert. 43Die Notation wurde gegenfiber der in Rubinstein, 1982, abgewandelt, um eine einheitliche Notation innerhalb dieser Arbeit zu gew~ihrleisten. Die hier verwendete Notation ist angelehnt an Mauleon und Vannetelbosch, 1999. 44Nosteht in dieser Arbeit fiir die Menge der positiven ganzen Zahlen einschlieglich Null, also 1% = {0} U N. In Rubinstein, 1982 wird nur der Fall T = No untersucht. Die
42St/aaahl untersucht
4.4 Sequentielle Verhandlungsmodelle mit vollstfindiger Information
119
In jeder Periode tn wghlt einer der Spieler eine Alternative a(n) E A -= X U {akzeptiere}, wobei Spieler B zu den Zeitpunkten t2n, n E No, also den "geraden" Zeitpunkten, am Zug ist, wghrend Spieler S bei t2~+l, n c No, also den "ungeraden" Zeitpunkten, handelt. In to steht die Alternative "akzeptiere" nicht zur Verfiigung, da ja noch kein Angebot vorliegt, a5 Der Verlauf einer Partie bis zum Zeitpunkt tk wird mit -~k bezeichnet. -~0 _ 0 u n d ~ k _ ( a ( O ) , . . . , a ( k - 1 ) ) E H k =- l-Ikn-lo X fiir k > 0. Wenn eine Partie bis zum Zeitpunkt tk fortgesetzt wurde, kann die Handlung "akzeptiere" bis zu diesem Zeitpunkt noch nicht aufgetaucht sein, da eine Partie ja mit dieser Handlung endet. Daher enth~ilt das kartesische Produkt der bis tk-1 vorgeschlagenen Aufteilungen die Geschichten aller noch nicht beendeten Partien. Es kann daher auch -~k = (xO, xl ' ..., x k _ l ) geschrieben werden, wobei x m die im Zeitpunkt tm vorgeschlagene Aufteilung bezeichnet. Die Menge HB -- UnC~__oH2n,n E No, aller Spielverl~iufe, nach denen Spieler B am Zug ist, fasst alle Geschichten zusammen, die vor einem geraden Zug liegen. Umgekehrt fasst die Menge Hs U,~~176 0 H 2n+1 aller Spielverlgufe, nach denen Spieler S handeln kann, die Geschichten zusammen, die vor einem ungeraden Zug liegen. H = HB U Hs ist die Menge aller mSglichen Spielverlgufe. Eine Strategie si : Hi -+ A fiir Spieler i, i E {B, S} ordnet jeder mSglichen Geschichte, nach der i am Zug ist, eine Handlung zu. Die Menge aller Strategien eines Spielers ist Si und die Menge aller Strategiekombinationen ist S = SB x Ss. Der Gegenspieler von Spieler i wird auch mit - i bezeichnet. Ein Ergebnis des Spiels ist dann ein Tripel -~(-g) = ( X B ( - g ) , x s ( - g ) , t ( - g ) ) , was bedeutet, dass die Strategiekombination -g zu einer Aufteilung ( ( z s ( - g ) , x s ( - g ) ) zum Zeitpunkt t(-g) fiihrt. Die Menge hier verwendete Formulierung wird aus Binmore, 1987b iibernommen, um sp~tter den Einfluss einer Variation von T untersuchen zu kSnnen. Vgl. auch Binmore et al., 1992. 45Diese Formulierung (vgl. Mauleon und Vannetelbosch, 1999, S. 243) beinhaltet eine unwesentliche Vereinfachung der oben verbal beschriebenen und in Rubinstein, 1982, sowieBinmore, 1987b, modellierten Situation: Anstelle zweier aufeinanderfolgender Handlungen in tn (vorliegendes Angebot akzeptieren oder ablehnen) und in tn+l (im Fall einer Ablehnung neues Angebot unterbreiten) w~thlt ein Spieler direkt in tn ein neues Angebot. Beide Formulierungen sind jedoch ~tquivalent, solange angenommen wird, dass beide Spieler w~thrend des Ablaufs von T, also der Zeit zwischen zwei Ziigen, zur Unt~ttigkeit gezwungen sind, der andere also mit Sicherheit erst in tn+l reagieren kann. In diesem Fall spielt es keine Rolle, wann ein Spieler das n~ichste Gebot seines Gegeniibers erf'~thrt.
120
4 Spieltheoretische Verhandlungsmodelle
a: akzeptiere . .......
S ? B
....
:
9
. . . . .
.
. . . .
:: Z : E : X : : '
:! ii
(o,o, oo)
, "
s
Abbildung 4.8: Verhandlungsprozess mit abwechselnden Angeboten (vereinfachtes Rubinstein-Modell; eigene Darstellung) aller Ergebnisse ist Z - ~-~es-~(-~)" Mit (0, 0, c~) wird eine Situation gekennzeichnet, in der die Spieler dauerhaft keine Vereinbarung erreichen. Abbildung 4.8 stellt das so formulierte Spiel graphisch dar.
4.4.2 Zeitpr~ferenzen und Auszahlungsfunktionen der Akteure Die entscheidende Rolle bei der Ableitung von LSsungen ffir sequentielle Verhandlungsmodelle kommt den Zeitprgerenzen der Akteure zu. Wie oben bereits angedeutet, wird unterstellt, dass die Akteure ungeduldig sind, also eine frfihere Einigung einer sp/iteren vorziehen, sofern sie in beiden F/fllen denselben Anteil erhalten. Bevor konkrete zeitabh/ingige Nutzenfunktionen formuliert werden, sollen wieder die Annahmen im Einzelnen betrachtet werden, die diesen zugrunde liegen. 46 Dazu werden zwei Pr/iferenzrelationen N-B und >-s auf Z deftniert. 47 Die beiden Relationen symbolisieren die Zeitpr/iferenzen der Spieler B und S, die explizit unterschiedlich sein kSnnen. Folgende Axiome gelten 46Das Vorgehen ist hier analog zu A b s c h n i t t 2.3.2.1. 47Die Relationen >'B und >-s werden auf Z und nicht auf X definiert, da die E l e m e n t e von Z den fiir die Relation relevanten E i n i g u n g s z e i t p u n k t enthalten.
4.4 Sequentielle Verhandlungsmodelle mit vollstgindiger Information
121
fiir --~, 7 E Z,s, t E T und i E {B, S}. 4s Annahme
4.4.1. Fiir --2* - (ZB, zs, t) und -~ = (yB, YS, t) mit z~ > y~ gilt
Von zwei im selben Zeitpunkt t erreichten Ergebnissen zieht ein Spieler also dasjenige vor, bei dem er einen grSfberen Anteil erh~ilt. 4 . 4 . 2 . Fiir 7 = (ZB, zs, tn) und ~ = (Ze, zs, tm) mit ZB, ZS > 0 und tm < tn gilt -ff ~-~ ~ ~-i (0, O, C~).
Annahme
Eine Einigung auf eine beliebige Aufteilung, bei der beide Spieler wenigstens einen minimalen Anteil erhalten (zs und zs sind grS~er als 0), wird von beiden Spielern zu einem friiheren Zeitpunkt derselben Aufteilung zu einem sp~iteren Zeitpunkt vorgezogen. Eine solche Einigung, zu welchem Zeitpunkt auch immer, wird von beiden Spielern dem dauerhaften Ausbleiben einer Einigung vorgezogen. A x i o m 4.4.3. Fiir zwei Zeitpunkte tm ~ tn gilt (ZB, Zs, tin) )"i (YB, YS, tm + T) dann und nur dann, wenn (ZB,ZS, tn) ~-i (YB,YS,tn + T). Wenn ein Spieler die Aufteilung (ZB, ZS) ZU einem bestimmten Zeitpunkt der Aufteilung (YB, YS) zu einem um r sp~iteren Zeitpunkt vorzieht oder zwischen beiden indifferent ist, dann zieht er auch zu keinem anderen Zeitpunkt die um 7 sp~iter erzielte Aufteilung (YB, YS) der Aufteilung (zs, zs) vor.
4.4.4. Wenn YB --~ y~und (ys,1 -- y s , t m ) ~_i (ZB,1 -- Zs,tn), dann gilt auch (y~, 1 - y~, tin) ~ (Zs, 1 - ZB, tn).
Annahme
Diese Annahme fordert Kontinuit~it in den Zeitpr~iferenzen und wird aus technischen Grfinden benStigt, um die Existenz bestimmter Gleichgewichtspunkte zu sichern, stellt aber keine besonders starken Behauptungen auf. Wenn YB beliebig nah an y~ heranriicken kann, ohne dass sich etwas daran ~indert, dass die Aufteilung (YB, 1 - YB) im Zeitpunkt tm einer Aufteilung (ZK, 1 -- Zg) im Zeitpunkt tn vorgezogen oder als gleichwertig betrachtet wird, dann sollte auch die Aufteilung (y~, 1 - y~) vorgezogen oder als gleichwertig eingesch~itzt werden. 4sVgl fiir die hier verwendeten Formulierungen der Axiome B i n m o r e et al., 1992, S. 184ff.
122
4 Spieltheoretische Verhandlungsmodelle
A n n a h m e 4.4.5. Je grb'fler der Anteil yon i an einer Auszahlung, desto mehr Kompensation ist erforderlich, wenn die A uszahlung sparer erfolgt.
Eine Reihe von Nutzenfunktionen ist mit diesen Axiomen vereinbar. Zwei wichtige werden hier betrachtet: 9 Konstante Diskontierungsfaktoren: Eine Funktion
bildet Opportunit/itskosten des Wartens auf eine Einigung ab, z.B. durch entgangene Zinsgewinne. 9 Konstante Verhandlungskosten: Eine Funktion der Form Ui(XB,XS,tn) = Xi - ( n -
1 ) , ci
repr/isentiert feste Verhandlungskosten ci pro Periode, die z.B. durch den Einsatz von Anw/ilten oder einfach durch die fiir die Verhandlung aufgewendete Zeit entstehen. Beide Funktionen bediirfen einer kurzen ErSrterung hinsichtlich der verwendeten Diskontierungsfaktoren. Im Fall der konstanten Diskontierungsfaktoren werden die Auszahlungen in Periode tl nicht, bzw. mit dem Faktor 5to _ 1, abgezinst, diejenigen in Periode t2 mit dem Diskontierungsfaktor 5t~ usw. Einleuchtender mag zun/ichst eine Diskontierung mit dem der jeweiligen Periode korrespondierenden Faktor erscheinen. Allerdings geht es bei der Diskontierung darum, die Kosten zu erfassen, die den Akteuren aus einer verzSgerten Einigung entstehen. In t l, dem ersten Zeitpunkt, zu dem nach den Regeln des Spiels iiberhaupt eine Einigung mSglich ist, tritt jedoch noch keine VerzSgerung ein. Anders ausgedriickt: (Xs, xS, tl) ist das friihste Ergebnis, das die Spieler erreichen kSnnen. 49 Gleiches gilt fiir die festen Verhandlungskosten, d.h. bei einer Einigung in Periode t l werden noch keine festen Verhandlungskosten berficksichtigt. 49Diese nicht ganz intuitive Gestalt der Auszahlungsfunktion stellt ein Zugest~ndnis an die vereinfachte Konstruktion des Spiels gegenfiber dem ursprfinglichen Rubinsteinschen Spiel dar. Dort wfirde die Nutzenfunktion ui(z) -- X-i O ~'~ lauten da die i Entscheidung fiber Annahme oder Ablehnung eines Angebots unmittelbar nach dem Angebot, also im selben Zeitpunkt tn, erfolgt.
4.4 Sequentielle Verhandlungsmodelle mit vollstiindiger Information
123
4.4.3 Nash-Gleichgewichte des sequentiellen Verhandlungsmodells Fiir das gerade beschriebene Verhandlungsmodell existiert, fi~hnlich wie ffir das Nash-Verhandlungsmodell, 5~ ein Kontinuum von Nash-Gleichgewichten: Spieler B legt sich darauf fest, in jeder Runde eine bestimmte Aufteilung -~ - (Xs, XS) mit :~S d-XS -- 1 vorzuschlagen, es sei denn, S hat ein Angebot unterbreitet, das ihm einen mindestens gleich grot~en Anteil verschafft wie sein eigenes Angebot (xs _> ;~S); ein solches Angebot wird B akzeptieren. Spieler S verfolge die analoge Strategie, jedes Angebot anzunehmen, fiir das gilt xs _> xs, und ansonsten seinerseits ~ anzubieten. Formal lautet die Strategie von Spieler i also 51 akzeptiere,
x~ > xi
Alle Strategien dieser Form bilden ein Nash-Gleichgewicht, da jeder Spieler mit der Ablehnung seines Gegeniibers rechnen muss, wenn er versucht, ein fiir sich giinstigeres Angebot als -~ zu machen. In diesem Zusammenhang kommt die Annahme zum Tragen, dass -~ eine effiziente Aufteilung mit :~S + XS -- 1 darstellt, bei der kein potenzieller Einigungsgewinn unausgeschSpft bleibt. Auf ein ineffizientes Angebot kSnnte ein Spieler i mit einem Gegenangebot antworten, das fiir beide vorteilhaft ist, und das der andere gem/it~ seiner Strategie s-i in jedem Fall annehmen wird. Die angegebenen Gleichgewichtsstrategien lassen also die Aussage zu, dass sich die Spieler bereits in t l auf eine beliebige effiziente Aufteilung einigen werden. Das Konzept des Nash-Gleichgewichts erlaubt es nicht, eine eindeutige LSsung fiir die Verhandlungssituation zu bestimmen. Nicht alle Gleichgewichtspunkte in Strategiekombinationen -~ = (ss, sS) sind jedoch bei n/iherer Betrachtung plausibel. Das Problem mit einem Teil der oben abgeleiteten Nash-Gleichgewichte besteht darin, dass beide Spieler in ihren Strategien Festlegungen fiir sp/itere Zeitpunkte des Verhandlungsprozesses treffen, die, wenn diese Zeitpunkte einmal tats/ichlich erreicht werden, nicht mehr optimal sind. Die mit den Gleichgewichtsstrategien ver5~ Abschnitt 4.3.1. 51Die Angebote werden abwechselnd unterbreitet, da der Definitionsbereich von si oben als Hi definiert wurde. HB enth/ilt lediglich die Geschichten mit einer geraden Anzahl yon Ziigen (einschliet~lich 0), w/ihrend Hs lediglich Geschichten mit einer ungeraden Anzahl von Ziigen enth/ilt.
124
4 Spieltheoretische Verhandlungsmodelle
bundene Drohung, nur ein einziges Angebot, n~imlich -~, anzunehmen, ist unglaubwfirdig. Nachdem beispielsweise Spieler S in tl eine effiziente Aufteilung ~ abgelehnt hat, weil xs < xs, und statt dessen, wie es seiner Strategie ~s entspricht, -~ angeboten hat, muss er mindestens bis t2 warten, bis diese Einigung von Spieler B akzeptiert werden kann, d.h. das Ergebnis w~ire in diesem Fall (XB, &S, t2). Annahme 4.4.2 besagt, dass Spieler S dieselbe Aufteilung in tl strikt vorziehen wiirde, also (~B,&S, tl) >-2 (:~S,I~S,t2)- Gem~i~ Annahme 4.4.4 existiert dann ein ~ * mit x~ = XB + e und x~ = x s - e, fiir das gilt (~*, tl) ~s (-~, t2). 52 Mit anderen Worten, aufgrund der Ungeduld seines Gegeniibers kann Spieler B ein Angebot machen, das ihm einen etwas grS~eren Anteil als -~ zuweist, n~imlich ~*, und das S nicht ablehnen wird, weil der geringere Anteil, den er erhfilt, dadurch aufgewogen wird, dass er ihn friiher erhtilt. Dasselbe gilt umgekehrt natiirlich ebenfalls in Zeitpunkten, zu denen ein Angebot von Spieler S vorliegt, also z.B. in t2. Spieler B wird sich iiberlegen, ob er dieses ablehnt, da ein Gegenangebot seinerseits erst eine Periode sp~iter angenommen werden kann. Im folgenden wird eine Verfeinerung des Gleichgewichtskonzepts von Nash dargestellt, in der diese Art unglaubwiirdiger Drohungen ausgeschlossen wird.
4.4.4 Teilspiel-perfekte Gleichgewichte Als Teilspiel wird ein Spiel bezeichnet, dessen Spielbaum K' ein Teilbaum von K ist, der in einem Entscheidungsknoten k' beginnt und in dem alle Entscheidungsknoten zu Informationsbezirken gehSren, die ausschlieglich Nachfolger von k' umfassen. 53 Ein Teilspiel kann also als vollst~indig unabh~ingiges Spiel interpretiert werden, dessen Auszahlungen unabh~ingig vom urspriinglichen Spiel ermittelt werden kSnnen. Abbildung 4.9 verdeutlicht dieses Konzept grafisch. In Spiel a) bildet der eingekreiste Teilbaum ein Teilspiel, w~rend in b) und c) jeweils fiber Informationsbezirke Abh~ingigkeiten zu anderen Teilbtiumen bestehen. In b) gehSrt der markierte Startknoten des Teilbaums zu einem Informationsbezirk von Spieler 2, der au~erdem einen Knoten des linken Teilbaums umfasst. In c) besteht die Abh~ingigkeit erst eine Stufe sp~iter, in dem Informationsbezirk von Spieler 3. Weder in b) noch in c) kSnnen 52Vgl. Rubinstein, 1982, S. 104.
53Das Konzept eines Teilspiels wird zuerst von Kuhn, 1997, definiert, vgl. S. 56.
4.4 Sequentielle Verhandlungsmodelle mit vollst~diger Information
(a)
1
(b)
~!lspieI
1
~ k e i n
(c)
125
1
Teilspiel ~ k e i n
Teilspiel
9 9
9
.
Abbildung 4.9: Teilspiele und abhkngige Teilb/iume (eigene Darstellung) die markierten Teilb~iume als separate Spiele aufgefasst werden, denn Spieler 2 bzw. Spieler 3 gewinnen durch den Wegfall des anderen Teilbaums wesentliche Informationen hinzu, fiber die sie im urspriinglichen Spiel nicht verfiigen. Im Fall des hier betrachteten Verhandlungsmodells (vgl. Abbildung 4.8) beginnt in jedem Zeitpunkt, also mit jeder HandlungsmSglichkeit der Spieler, ein neues Teilspiel. In einem Teilspiel-perfekten Gleichgewicht (TPG) muss die Strategie jedes einzelnen Spielers nicht nur die beste Antwort auf die vollst~indigen Strategien der anderen Spieler sein, 54 sondern dies muss auch fiir jedes einzelne Teilspiel gelten. Insbesondere gilt dies auch fiir Teilspiele, die in einer Partie gar nicht erreicht werden, wenn alle Spieler ihre geplanten Strategien exakt umsetzen. 55 Damit wird genau der Umstand berficksichtigt, aus dem sich oben das Problem einer Vielzahl von Nash-Gleichgewichten fiir das sequentielle Verhandlungsmodell ergab. Es folgt eine formale Definition des TPG fiir das hier behandelte Modell. 56 (sil-~ k) ist die Strategie des Spielers i, die aus der Strategie si fiir das Teilspiel folgt, das im Zeitpunkt tk beginnt, wenn der bisherige Verlauf der Partie der Geschichte -~k entspricht.
(sil~ k) wird auch als induzierte Strategie bezeichnet. 57 54Dies ist die Bedingung fiir das Nash-Gleichgewicht (vgl. Abschnitt 4.1.5). 55Streng genommen wird damit die Interpretation der Strategien als Handlungspliine der Akteure fragwfirdig, da sie fiir Umst~inde planen, deren Eintreten sie selbst ausschlietgen kSnnen. Eine mSgliche Interpretation besteht darin, dass die Akteure mit einer gewissen Wahrscheinlichkeit mit Fehlern bei der Umsetzung der eigenen oder einer fremden Strategie rechnen. Dies fasst Selten, 1997, in sein Konzept des 'q'remblingHands-Equilibrium". Rubinstein, 1991, schl~igt vor, die Strategie eines Spielers als dessen Pl~ine zu interpretieren, wie sie in der Wahrnehmung der anderen Spieler bestehen. 56Vgl. Rubinstein, 1982, wobei die Schreibweise den in diesem Text geltenden Konventionen angepasst wurde. Fiir eine allgemeine Darstellung des Konzepts des TPG vgl. Selten, 1965, 1997. 57Vgl. Selten, 1997, S. 326f.
4 Spieltheoretische Verhandlungsmodelle
126
Definition 4.4.{}. Eine Strategiekombination ) wenn fiir alle ~ k gilt
=
(SBSS)ist
ein TPG,
UB((~BI-~ k) ($Sl'~k)) = max (UB(SB, (~Sl-~k))) '
8B6SB
und US((~BI-~ k) (~sl~k))-- max (Us((~BI-~ k) sS)). '
ssGSs
'
Die induzierte Strategie eines Spielers muss also nach jeder mSglichen Geschichte einer Partie die bestmSgliche Antwort auf die induzierte Strategie des anderen Spielers darstellen.
4.4.5 TPG fiir sequentielle Verhandlungsmodelle- allgemeiner Fall Rubinstein zeigt als erster, dass fiir das sequentielle Verhandlungsmodell mit abwechselnden Angeboten generell TPG existieren und dass es in einer Reihe von wichtigen F/illen genau einen TPG-Punkt gibt. Im Folgenden wird das Grundprinzip eines vereinfachten Beweises ffir diese Feststellung dargestellt, der auf Binmore zuriickgeht. 5s Die nachstehenden Ergebnisse sind unabh/ingig vonder Identit/it des Akteurs, also B oder S, und hfiaagen lediglich davon ab, welcher Akteur das erste Angebot macht. Dieser Akteur wird daher im Folgenden als Spieler 1 bezeichnet, der Akteur, der als zweiter am Zug ist, als Spieler 2. Ausgangspunkt der 0berlegungen ist die Tatsache, das alle aufeinander folgenden Teilspiele des urspriinglichen Verhandlungsmodells in ihrer Struktur identisch sind, sich jedoch in zwei Punkten unterscheiden: Zum einen macht zu den geraden Zeiten to, t2, ... Spieler I das erste Angebot, zu den ungeraden Zeiten t t, t3, ... jedoch Spieler 2. Zum anderen unterscheidet sich, aufgrund der ZeitprMerenzen der Akteure, der aufzuteilende Nutzen, betrachtet aus der Perspektive des Zeitpunktes to. Fiir den hier diskutierten allgemeinen Fall werden zuniichst nur die Annahmen 4.4.1 und 4.4.2 benStigt. Im Folgenden soll X k ffir die Menge der Aufteilungen stehen, die in einem im Zeitpunkt tk beginnenden Teilspiel aus der Sicht des Zeitpunktes to, also nach Beriicksichtigung der Zeitpr~iferenzen, zur Verfiigung stehen, 58Vgl. Binmore, 1987b, S. 78ff. wo sich ausfiihrliche graphische Erl~iuterungen finden, sowie ~ihnlich auch Shaked und Sutton, 1984.
4.4 Sequentielle Verhandlungsmodelle mit vollstgndiger Information
127
es gilt also X k - {(U1,U2)IU1 = U I ( - ~ , k ) ; U 2 = U 2 ( ~ , k ) ; - ~ E X)}. Darfiber hinaus sei mit -Ek die Menge aller effizienten Aufteilungen bezeichnet, die in tk verfiigbar sind, also derjenigen, bei denen kein Spieler einen hSheren Nutzen erzielen kann, ohne dass der Nutzen des anderen Spielers sinkt. Formal gilt also F.k - {-~ e X k l v l > ul A v2 > u2 =~ -ff r X k } 9 Aufgrund der identischen Struktur der Teilspiele kann ein TPG mittels eines rekursiven Vorgehens bestimmt werden: Welche Aufteilungen in einem Teilspiel, das in tk-1 beginnt, TPG-Punkte darstellen, h~ingt davon ab, welche Aufteilungen TPG-Punkte in dem darauf folgenden, in tk beginnenden Teilspiel sind. Denn der Spieler, der in tk-1 am Zug ist, wird jedes Angebot annehmen, das ihm bereits zu diesem Zeitpunkt einen Anteil garantiert, der gem~if~ seinen Zeitpr~iferenzen ~quivalent zu dem maximalen Anteil ist, den er in tk erhalten kann. Andererseits wird er jedes Angebot ablehnen, das fiir ihn nicht mindestens ~iquivalent zu der ungiinstigsten Aufteilung ist, die einen TPG-Punkt in tk bildet. Es wird damit mSglich, zwei Folgen zu definieren, die der Ober- und Untergrenze der Menge der TPG-Punkte bzw. den Ober- und Untergrenzen der Anteile jeweils eines Spielers in jedem Zeitpunkt tk-1 entsprechen. Fallen die Werte beider Folgen im Zeitpunkt to zusammen, so existiert genau ein TPG-Punkt fiir das urspriingliche Spiel. Die folgenden S~itze zeigen das Vorgehen bei der Herleitung dieser Folgen. Satz 4.4.7. Wenn Spieler 1 in tk-1 (k E N, k ~ 1) am Zug ist, und wenn flit jeden TPG-Punkt w des in tk beginnenden Teilspiels m < w2 0, existiert ein eindeutiges station~es Gleichgewicht. 79 Im anderen Fall besteht ein Kon77Vgl. Ausubel et al., 2002, S. 1913. 78Ein Angebot p < P(be) akzeptiert der K~iufertyp be definitionsgem~i~ sofort, w~hrend er bei einem Angebot p > P(be) die n~ichste Periode abwartet. 79Vgl. Fudenberg et al., 1985, S. 81.
146
4 Spieltheoretische V e r h a n d l u n g s m o d e l l e
tinuum sowohl von station~en als auch von nicht-station~en sequentiellen Gleichgewichten. s~ Die intutitive Begrfindung fiir die Existenz eines eindeutigen station~en Gleichgewichts bei sicheren Einigungsgewinnen liegt darin, dass ein rationaler Verkiiufer S niemals einen Anreiz hat, ein Gebot unterhalb der niedrigsten mSglichen Zahlungsbereitschaft b abzugeben, da ein Angebot in dieser HShe jeden existierenden K~iufertyp zu einer Einigung bewegt. Wenn nicht friiher eine Einigung erzielt wird, kommt also im Laufe der Verhandlungen eine Periode N, in der der erwartete Gewinn des Verkiiufers aus einer weiteren Verhandlungsrunde geringer ausf'~llt als der Gewinn aus einer sofortigen Einigung zu einem Preis von b. Ist dieses ,~etzte Angebot" von S bekannt, kann von hier aus die Folge optimaler Angebote riickw~irts konstruiert werden. Die Umkehrfunktion zu der Funktion in Gleichung 4.7 fiir den Fall, dass das Gebot der Folgeperiode auf b fixiert ist, lautet ~e(p) = p-~b 1-5" Der ex ante Erwartungswert des Verkiiufers mit der Erwartung be in der Vorperiode ergibt sich dann in Anlehnung an Gleichung 4.5 als V(b~) = max ([F(b~) - F ( ~ e ( p ) ) ] p + 5 F ( ~ e ( p ) ) b } . (4.8) p In Gleichung 4.8 bleibt die Erwartung b~ zu bestimmen, die sich aus dem n~ichst-friiheren Angebot ergibt, sl Eine wesentliche Eigenschaft des eben untersuchten Falles b > 0 besteht darin, dass die C o a s e - V e r m u t u n g gilt: Je kiirzer die Zeitabst~inde zwischen den Angeboten werden bzw. je grS~er die Diskontierungsrate 5, desto nfiher riickt bereits das erste Angebot von S an b, desto geringer f'eillt also der Anteil des Einigungsgewinns aus, der dem Verl54ufer zuf~illt, s2 Wenn b = 0 und somit keine sicheren Einigungsgewinne zu erwarten sind, kann kein eindeutiges station~ires Gleichgewicht bestimmt werden. Aut~erdem existieren neben den station~iren auch nicht-station~ire sequentielle Gleichgewichte. s3 Der Grund fiir die fehlende Eindeutigkeit besteht darin, dass in diesem Fall jede noch so geringe Chance, in der aktuellen Periode eine Einigung bei pn > 0 zu erzielen, fiir S vorteilhafter ist als ein sicher akzeptiertes Angebot pn+l = 0 in der folgenden Periode. Es existiert also 8~ Gul et al., 1986, S. 167. 81Fiir die genaue Ableitung der Folge von Angeboten vgl. Fudenberg et al., 1985, S. 81ft. 82Vgl. Gul et al. 1986, S. 168. 83Im Fall b > 0 ist das einzige existierende sequentielle Gleichgewicht zugleich station~ir, somit ist Stationarit~it in diesem Fall keine Annahme, sondern eine Implikation.
4.5 Verhandlungsmodelle mit einseitig unvollstiindiger Information
147
keine Erwartung be = b*, bei der S sofort b = 0 bietet und somit gibt es auch keine Periode .N, in der mit Sicherheit sp~itestens eine Einigung erzielt wird. Damit fiillt das sichere ,,letzte Angebot" von S weg, und es besteht kein Anknfipfungspunkt fiir die oben geschilderte Rfickw~ixtsinduktion der optimalen vorhergehenden Angebote. s4 Ffir jedes Gleichgewicht aus dem Kontinuum existierender station~er Gleichgewichte gilt wiederum die Coase-Vermutung. Die Coase-Vermutung gilt dagegen nicht unbedingt fiir die nicht-station~iren sequentiellen Gleichgewichte, die bei b = 0 ebenfalls existieren. Ausubel und Deneckere leiten einen Typ von sequentiellen Gleichgewichten ab, in dem die Strategie von S vorsieht, seinen Angebotspreis so lange langsamer zu senken als in den station~en Gleichgewichten, bis es zu einer Abweichung von diesem Angebotspfad kommt. Nach einer Abweichung wird auf den (vonder Coase-Vermutung betroffenen) Preispfad eines station~iren Gleichgewichts fibergewechselt. B passt sein Verhalten der vorgegebenen Strategie von S an. Die Strategie von S ist glaubwfirdig, da sie fiir ein Abweichen von dem anfangs eingeschlagenen Kurs langsamer Angebotssenkungen eine Art Selbstbestrafung von S vorsieht, indem auf den station~en Pfad fibergewechselt wird, der mit geringeren Gewinnen verbunden ist. Dieser Typ von Gleichgewicht l~st sich so interpretieren, dass S versucht, eine Reputation als starker Anbieter aufzubauen, die jedoch zusammenbricht, wenn er einmal einen Preis unterhalb des angekiindigten Angebotsverlaufs wfi~hlt,s5 In diesem Typ von Gleichgewicht kann der Anbieter jeden Profit bis hin zum statischen Monopolgewinn erzielen, indem er die Rate der Senkung seiner Angebote, die Zeit zwischen den Angeboten sowie das erste Angebot kontinuierlich variiert, s6
4.5.5 Exkurs: Weitere Ergebnisse zum Monopol mit dauerhaften Giitern Die Situation von S bei einer Verhandlung mit einem K~iufer, dessen Zahlungsbereitschaft er nicht kennt, ist strukturell ~ihnlich zu der bereits in Abschnitt 3.3 diskutierten Situation eines Monopolisten, der ein dauerhaftes Gut an eine Menge von Nachfragern verkauft. Der bekannten Verteilung der mSglichen K~iufertypen im Fall der Verhandlung entspricht die als bekannt 84Vgl. Ausubel et al., 2002, S. 1926 sowie Fudenberg et al., 1985, S. 80. 85Vgl. Ausubel und Deneckere, 1989, S. 513. 86Vgl. Ausubel und Deneckere, 1989, S. 519 sowie das Theorem 6.4 auf S. 523.
148
4 Spieltheoretische Verhandlungsmodelle
vorausgesetzte Nachfragefunktion im Fall des dynamischen Monopols. 87 Allerdings bestehen zwischen beiden Situationen auch Unterschiede, die im Folgenden diskutiert werden sollen. Fiir die Verteilung mSglicher Nachfragertypen stellt eine kontinuierliche Verteilung ein realistisches Modell dar, da kein Grund besteht, anzunehmen, dass im Voraus von einer bestimmten Stufung der Zahlungsbereitschaften der Nachfrager ausgegangen werden kann. Fiir den Fall des dynamischen Monopols stellt dagegen die Annahme einer kontinuierlichen Nachfragefunktion immer eine Vereinfachung dar. In einem Modell mit einer bekannten, diskreten Nachfragefunktion zeigen Bagnoli et al., dass diese Vereinfachung nicht ohne Konsequenzen fiir die mSglichen Gleichgewichte ist. In dem Modell mit diskreter Nachfragefunktion existiert unter bestimmten Bedingungen ein TPG, das die Autoren als Pacman-Gleichgewicht bezeichnen und das, bei einer Diskontierungsrate nahe Eins, zu einer ann~i~hernd vollkommenen Preisdifferenzierung fiihrt. 88 Es l ~ s t sich dariiber hinaus zeigen, dass dieses Gleichgewicht eindeutig ist. 89 In dieser Variante des Modells wird eine diskrete Menge von Konsumenten B - {bl, b2, ..., bN} mit bg -'- b angenommen, deren Reservationspreise nach dem Index absteigend sortiert sind. Insgesamt weisen die Nachfrager L _< N verschiedene Reservationspreise auf. Der Vektor -ff = ( n l , . . . , n L ) gibt an, wie viele Nachfrager, n&rnlich nt, den/-ten Reservationspreis aufweisen. Auf~erdem wird ein Vektor -fit = (0, ...,0,nt, ..., nL) definiert, in dem die ersten l - 1 Reservationspreisstufen entfernt wurden. Die Strategien, die ein Pacman-Gleichgewicht bilden, sind recht einfach. Der Monopolist verlangt in jeder Periode den Preis p(t) = bmax(t), also den hSchsten Reservationspreis eines Nachfragers, der vor dieser Periode noch nicht gekauft hat. Jeder Nachfrager i akzeptiert immer dann, wenn gilt p(t) ~1 muss daher den Verhandlungsprozess erst ffir eine oder mehrere Perioden durch sehr hohe, nicht ernst gemeinte Angebote in die L~hlge ziehen, um die tats~ichliche HShe seines Reservationspreises glaubhaft zu machen. 1~ Wie immer, wenn nur der Verki4ufer Angebote macht, hat der K~iufer keine MSglichkeit zu Handlungen, die vom Gleichgewichtspfad abweichen und dennoch zu einer Fortsetzung der Verhandlung fiihren. Seine einzige realistische Abweichung besteht in der ,,verfriihten" Annahme eines Angebots, mit der die Verhandlung beendet ist. Der Verkiiufer dagegen kann im Laufe der Verhandlung Angebote unterbreiten, die dem urspriinglich eingeschlagenen Gleichgewichtspfad zuwider laufen. Dabei sind zwei F/ille zu unterscheiden: Zum einen die Phase, bevor der Verkiiufer seinen Reservationspreis s glaubhaft offenbaren konnte. In dieser Phase vermutet der K~iufer im Gleichgewicht, dass s E [st,~]. Jedes folgende Angebot pt >_ pt(st+l) wertet B entsprechend dem dargestellten Gleichgewichtspfad als nicht ernst l~ l~
Cramton, 1984, S 585. Cramton, 1984, S. 587.
4 Spieltheoretische Verhandlungsmodelle
156
gemeintes VerzSgerungsangebot und aktualisiert seine Vermutungen auf s E [st+t,~]. Bietet der Verl~ufer jedoch pt < pt(st+t), so interpretiert B dies als eine (versp~itete) Offenbarung des Verl6iufers und vermutet von nun an s = p~-t(p), wobei r der Periode entspricht, in der der Verl~ufer im Gleichgewicht ein Gebot gemacht h~itte, das p am n~ichsten liegt. Ist der K~iufer sicher, dass er einen Verlgiufer s - st vor sich hat, und weicht dieser von dem erwarteten Angebot pt(st) nach oben ab, also p > pt(st), so l~st sich der K~iufer nicht von seiner ursprtinglichen Vermutung abbringen und vermutet weiterhin s = st. Bei einer Abweichung nach unten, p < pt(st), passt B jedoch seine Vermutung nach der Regel s = p~-t (p) an, wertet das Angebot also als nachtr~igliches Eingest~indnis einer tats~ichlich schw~heren Position des S.
4.7 Anreizkompatible Verhandlungsmechanismen In den bisherigen Abschnitten dieses Kapitels wurde stets von einem gegebenen Spiel ausgegangen, das als Modell einer Situation betrachtet wurde und fiir das eine Prognose fiber das Verhalten rationaler Akteure in der gegebenen Situation abgeleitet wurde. Ein anderer Zweig der Spieltheorie besch~iftigt sich mit der umgekehrten Fragestellung: Welche Regeln milssen gesetzt werden, damit Akteure in einer bestimmten Situation ein bestimmtes Verhalten zeigen? 1~ Auf diesen Zweig soll hier aus zwei Griinden kurz eingegangen werden. Erstens stellen die bisherigen Anwendungen spieltheoretischer Methoden auf Verhandlungen zwischen Softwareagenten, wie sie unten in Abschnitt 5.2.3.2 dargestellt werden, auf Uberlegungen zu anreizkompatiblen Mechanismen. Zweitens zeigen die im Folgenden erSrterten Mechanismen auf, dass bei unvollst~indiger Information vollkommene Effizienz der Verhandlungsergebnisse auch bei freier Gestaltung der Spielregeln nicht erreichbar ist. Bereits oben wurde das Grundproblem asymmetrischer Informationen dargestellt- Die Tauschpartner sind unsicher fiber die Position ihres jeweiligen Gegeniibers. Im einfachsten Fall kennt der Verldiufer nicht die tats~ichliche Zahlungsbereitschaft des K~iufers, der umgekehrt nicht den tats~ichlichen Reservationspreis des Verldiufers kennt. Auf blof~e Behauptungen der einen oder anderen Partei fiber ihre eigene l~
Jackson, 2001, S. 656.
4.7 Anreizkompatible Verhandlungsmechanismen
157
Situation ist kein Verlass, denn jede Partei hat offensichtlich ein Interesse daran, die andere glauben zu machen, ihre "Schmerzgrenze" sei mit einem bestimmten Angebot erreicht und mehr Zugest~dnisse an die andere Partei seien unter keinen Umst~inden mSglich. Da eine solche Darstellung ohne direkte Kosten und ohne kiinftige negative Konsequenzen fiir denjenigen bleibt, der sie vermittelt, handelt es sich um eine bloke Behauptung, die dem eigenen Vorteil dient und h~iufig als "cheap talk" bezeichnet wird. Glaubwfirdige Informationen fiber die Situation des Kontrahenten kSnnen die Spieler daher nur dann aus dessen Handlungen beziehen, wenn sie ihm tats~chlich Kosten verursachen. Solche Handlungen kSnnen z.B. darin bestehen, eine Einigung hinauszuzSgern, oder, im Fall eines Tarifkonfliktes, in Streiks oder Aussperrungen. Tats~ichlich dienen solche Ma~nahmen also dazu, dem Kontrahenten glaubwiirdige Signale fiber die eigene Situation zu fibermitteln. In der Implementierungstheorie i~ wird unter dem Stichwort Anreizkompatibilit~it (incentive compatibility) die Frage untersucht, welche generellen Beschr~kungen fiir die mSglichen Ergebnisse von Verhandlungen bei asymmetrischen Informationen gelten, unabh~ingig davon, welche Verhandlungsprozedur verwendet wird. i~ Im Zentrum steht der Zusammenhang zwischen dem Verhandlungsergebnis und den Angaben der Akteure fiber ihre jeweilige private Information. An einem einfachen Modell kSnnen die Bedingungen verdeutlicht werden, unter denen es fiir beide Parteien vorteilhaft ist, ihre privaten Informationen wahrheitsgem~it~ zu berichten. Als Mechanismus wird ein Paar von Funktionen (p, 7r) bezeichnet, die den (von den Akteuren angegebenen) privaten Informationen, also der Zahlungsbereitschaft b des K~iufers und dem Reservationspreis s des Ver154ufers, einen Preis p(s, b) sowie die Wahrscheinlichkeit r(s, b) zuordnen, dass es zu diesem Preis zu einem Abschluss kommt. Entsprechend wird mit einer Wahrscheinlichkeit von 1 - ~(s, b) keine Einigung erzielt. Ein Mechanismus kann als Verhaltensregel eines Vermittlers betrachtet werden, dem beide Parteien ihre jeweilige private Infromation mitteilen und der dann entsprechend Englischen auch als mechanism design bezeichnet. Ffir eine Einffihrung vgl. z.B. Jackson 2001, fiir eine 0bersicht z.B. Corchon, 1996. i~ der Literatur zur Implementierungstheorie wird eine allgemeinere Klasse von Situationen untersucht als die zweiseitigen Verhandlungen, die hier von Interesse sind. Die folgenden Ausfiihrungen zu zweiseitigen Verhandlungen stiitzen sich haupts~ichlich auf Kennan und Wilson, 1993, S. 66ff. sowie Binmore et al., 1992, S. 217ff. i~
158
4 Spieltheoretische Verhandlungsmodelle
den Funktionen p und 7r bekannt gibt, ob und zu welchem Preis ein Tausch zustande kommt. 1~ Ist ein Mechanismus (p, 7r) gegeben, so lassen sich die erwarteten Nutzengewinne der beiden Akteure in Abh~gigkeit von der jeweils eigenen privaten Information als U ( s ) = EbTr(S, b)(p(s, b ) - s) fiir den Anbieter bzw. V(b) = E87r(s,b)(b- p(s,b)) fiir den Nachfrager angeben. 11~ Jeder Mechanismus, der von den Akteuren akzeptiert werden soll, muss mindestens individuell rational sein, d.h. es muss fiir alle s und b gelten U(s) >_ 0 und V(b) >_ O. Damit jeder Akteur seine privaten Informationen wahrheitsgemiit~ offenbart, muss dariiber hinaus da~ Kriterium der Anreizkompatibilitiit erfiillt sein: Fiir alle s, s', b und b~ mit s ~= s ~ und b ~ bt muss gelten V(s) > Ebr(S', b)(p(s', b) - s) sowie Y(b) >_ 7r(s, b')(b - p(s, b')). Fiir einen Anbieter mit dem Reservationspreis s darf es sich also nicht lohnen, einen anderen Reservationspreis s ~ anzugeben, und ein Nachfrager mit der Zahlungsbereitschaft b daft keinen Anreiz besitzen, eine Zahlungsbereitschaft bt zu behaupten. Eine wichtige Fragestellung der Theorie anreizkompatibler Mechanismen zielt auf deren Effizienz. Ein effizienter Mechanismus ffihrt stets zu einer Einigung, wenn ein positiver Einigungsgewinn besteht, wenn also b > s gilt. Ein Ergebnis der Theorie besagt, dass kein effizienter, individuell rationaler und anreizkompatibler Mechanismus existiert, wenn s mit positiver Dichte fiber dem Intervall Is, ~] und b mit positiver Dichte fiber dem Intervall [b, b] verteilt ist, wobei sich die beiden Verteilungen iiberlappen (d.h., es gilt s < b < ~ _< b) und es somit unsicher ist, ob fiberhaupt ein Tauschgewinn realisiert werden kann. 111 Im Umkehrschluss kann ein effizienter, individuell rationaler und anreizkompatibler Mechanismus also nur existieren, wenn beide Akteure im Voraus sicher sind, dass ein positiver Tauschgewinn existiert, dass also in jedem Fall b > s gilt. 112 l~ Ausubel und Deneckere, 1993, S. 438. 11~ Fall korrelierter Bewertungen, in dem die Bewertung eines Akteurs nicht nur von der eigenen, sondern auch von der Information des anderen abh~ingt und in dem sich somit Bewertungsfunktionen u(s, b) und v(s, b) ergeben, wird hier nicht n~her betrachtet, da er fiir die Fragestellung dieser Arbeit von untergeordneter Bedeutung ist. In der Theorie anreizkompatibler Mechanismen spielt er jedoch eine wichtige Rolle, da sich bei korrelierten Bewertungen die Bedingungen fiir eine wahrheitsgemiit~e Offenbarung der privaten Informationen erheblich anspruchsvoller gestalten, vgl. Kennan und Wilson, 1993, S. 69ff. 111Vgl. Myerson und Satterthwaite, 1983, S. 273. 112Vgl. Ausubel et al., 2002, S. 1903.
4.8 Zusammenfassung 4.8
159
Zusammenfassung
Aus der vorangehenden Untersuchung von Verhandlungen mit spieltheoretischen Methoden ergibt sich fiir das Vorhaben dieser Arbeit ein mehrdeutiges Fazit. In Verhandlungsmodellen mit vollst~indiger Information kommt es grunds~tzlich ohne VerzSgerung zu einer Einigung. Der Preis wird dabei im Wesentlichen durch die- beiden Seiten annahmegem~g bekannten- Bewertungen der Akteure, ihre ZeitprMerenzraten und die HShe eventueller Verhandlungskosten bestimmt. Im Fall unvollst~indiger Information fiber die Bewertung des Tauschobjekts durch den K~iufer wird das Bild komplizierter. Zun~ichst zeigt sich, dass es bei exogen vorgegebener Dauer der einzelnen Verhandlungsperioden regelm~t~ig zu einer verzSgerten Einigung kommt. Die VerzSgerung dient dazu, die verschiedenen K~iufertypen voneinander zu trennen, indem ihre unterschiedliche Bereitschaft genutzt wird, auf eine Einigung zu warten: K~iufer mit einer hSheren Bewertung des Tauschobjekts haben durch das Warten mehr zu verlieren als solche, deren Zahlungsbereitschaft geringer ist. In Gleichgewichten dieses Typs wird zwar In der Regel immer eine Einigung erzielt, wenn ein positiver Einigungsgewinn vorliegt, so dass die Ergebnisse in dieser Hinsicht effizient sind. Andererseits fiihrt aber die VerzSgerung selbst zu Nutzeneinbut~en bei den Akteuren. Die Vorstellung einer fixen Periodendauer lfisst sich aber vor dem Hintergrund der Coase-Vermutung nicht ohne Weiteres halten, da der Verl54ufer stets einen Anreiz hat, die Periodendauer zu verkiirzen, um schneller einen niedrigeren Preis bieten zu kSnnen und damit schneller einen grSt~eren Umsatz zu realisieren. Dieser Mangel an Selbstbindungsf'~ihigkeit hat aber die fiir den Verki4ufer unangenehme Konsequenz, dass sein erstes Angebot mit kiirzer werdender Periodendauer immer n~iher an die geringste in der Population der K~iufer vorhandene Zahlungsbereitschaft heranriickt und damit an das niedrigste Angebot, zu dem ein rationaler Verkiiufer iiberhaupt bereit ist. Im Fall eines Verkiiufers mit Grenzkosten von Null wiirde das erste Angebot also ebenfalls in die N~ihe von Null riicken. Damit wiirde zwar nahezu sofort ein effizientes Ergebnis erreicht, allerdings stiinde das langfristige 0berleben des Verki4ufers am Markt in Frage, da er mit ErlSsen nahe Null kaum seine fixen Kosten zu decken in der Lage w~ire. Werden die Ergebnisse der Verhandlungsmodelle auf den Fall eines mo-
160
4 Spieltheoretische Verhandlungsmodelle
nopolistischen Anbieters dauerhafter Giiter iibertragen, scheinen diese zun~ichst der Vermutung von Coase zu entsprechen, dass der Preis schnell auf das Niveau der Grenzkosten sinkt und eine wirkungsvolle intertemporale Preisdifferenzierung nicht mSglich ist. Allerdings muss der Verkiiufer dieses Ergebnis nicht zwangsl~iufig akzeptieren. Wie A usubel und Deneckere zeigen, existieren neben den station~en Gleichgewichten, die ausnahmslos die Coase-Vermutung best~itigen, auch Reputationsgleichgewichte, in denen sich der Verkiiufer einen Anteil am Einigungsgewinn sichern kann, der ungef'~ihr dem entspricht, den er erhalten wiirde, wenn er sich fiir alle Zeiten auf seinen urspriinglichen Monopolpreis festlegen kSnnte. Wird dariiber hinaus beriicksichtigt, dass es sich, jedenfalls im Fall eines Monopolisten, der mehrere Nachfrager zu unterschiedlichen Preisen bedienen mSchte, um eine diskrete Menge von Nachfragern handelt, so gilt die Coase-Vermutung ebenfalls nur zum Teil, wie Bagnoli et al. zeigen. Unter Umst~inden ist in dieser Situation sogar eine voUkommene Preisdifferenzierung zwischen s~ntlichen Nachfragern mSglich. Insbesondere auf die Uberlegungen dieses Modells wird in Abschnitt 6.2 zurfickgegriffen, wenn die Verhandlungsstrategien der Softwareagenten des in der vorliegenden Arbeit entwickelten Systems spezifiziert werden. ,o
5 Automatisierte
Verhandlungen
zwischen
Softwareagenten Ziel dieses Kapitels ist es, einen 0berblick fiber den Stand der Forschung zu Verhandlungen zwischen Softwareagenten zu vermitteln. Der Abschnitt 5.1 ffihrt in die generelle Thematik der Softwareagenten und der Multiagentensysteme (MAS) ein. Abschnitt 5.2 untersucht, welche Rolle Verhandlungen bei der Koordination in MAS spielen, bevor in Abschnitt 5.2.3 die in einigen konkreten Implementierungen verwendeten Entscheidungsmodelle vorgestellt werden.
5.1 Softwareagenten und Multiagentensysteme 5.1.1 Der Begriff Softwareagent Der Begriff Softwareagent, gelegentlich auch nur Agent, manchmal kombiniert mit Adjektiven wie intelligent oder autonom, wird in einer ganzen Reihe von Fachgebieten im Rahmen der Informatik und der Wirtschaftsinformatik verwendet. Eine einheitliche Definition des Begriffs existiert aus diesem Grund nicht. 1 Es handelt sich am ehesten um einen Sammelbegriff, 2 wobei sich jedoch keineswegs widerspruchsfrei eine Schnittmenge aller existierenden Definitionen bilden l~st. Im folgenden sollen zun~chst Gemeinsamkeiten zwischen den verschiedenen Agentenbegriffen herausgearbeitet werden, um anschliet~end die Unterschiede in den Konzepten der verschiedenen Forschungsrichtungen zu identifizieren. Eine erste (triviale) Gemeinsamkeit aller Softwareagenten besteht darin, dass es sich um Computerprogramme handelt. Dadurch kSnnen sie von menschlichen Agenten (z.B. dem Mitarbeiter eines Reisebfiros, engl. travel agent) und von Hardwareagenten, also Robotern, abgegrenzt werden. 3 Die verschiedenen Definitionen kSnnen in zwei Klassen eingeteilt werden. In der einen Klasse gilt der Begriff als eine Zuschreibung, w~ihrend die an1Eine umfangreiche Zusammenstellung verschiedener Definitionen findet sich z.B. in Franklin und Graesser, 1997. 2Vgl. Nwana, 1996, S. 208f. 3Vgl. Brenner et al., 1998, S. 21.
162
5 Automatisierte Verhandlungen zwischen Softwareagenten
dere Klasse ihn als eine (zusammenfassende) Beschreibung verschiedener Eigenschaften eines damit belegten Systems betrachtet. 4 G e m ~ Definitionen, nach denen der Begriff Agent eine Zuschreibung ist, sind darunter darunter solche Systeme zu verstehen, deren kompliziertes Verhalten am ehesten erkl~t werden kann, wenn man ihnen gewisse mentale Eigenschaften wie Ziele, Wissen, Rationalit~it und aus deren Kombination gewonnene Intentionen zuschreibt, unabh~ingig davon, welche Mechanismen tats~ichlich hinter dem beobachteten Verhalten stehen. 5 Die andere Klasse von Definitionen listet jeweils bestimmte Eigenschaften eines Programms auf, die entscheidend dafiir sind, dass es als Softwareagent bezeichnet werden kann. Brenner et al. nennen z.B. die folgenden Eigenschaften: 6
Reaktivit~it Ein Agent reagiert auf Vedinderungen in seiner Umgebung. Er verffigt einerseits fiber Sensoren, um solche Ver~derungen wahrzunehmen, und andererseits fiber MSglichkeiten, direkt auf die Umgebung einzuwirken. Die Umgebung kann dabei aus anderen Agenten, sonstigen Programmen, die selbst keine Agenten darstellen, sowie menschlichen Benutzern bestehen. Die Eigenschaft der Reaktivit~it weisen z.B. traditionelle Expertensysteme nicht auf, da diese ihre Informationen immer durch einen Menschen erhalten und auf ihre Umgebung auch nut indirekt wirken, indem sie ihre Ergebnisse einem menschlichen Benutzer fibermitteln, der dann evtl. aufgrund dieser Ergebnisse handelt. 4Vgl. Bradshaw, 1997, S. 5. 5Ein Beispiel fiir eine solche Definition findet sich im Konzept der agentenorientierten Programmierung, vgl. Shoham, 1993, S. 53f. Diese Richtung der Defintion geht zuriick auf den Philosophen Daniel Dennet, der drei verschiedene Haltungen (engl. stances) unterscheidet, die Menschen gegenfiber Systemen einnehmen kSnnen. Menschen nehmen Systeme demnach entweder so wahr, als verhielten sie sich gem~ig physikalischen Gesetzen (physical stance) oder gem~g ihrer Konstruktion (design stance) oder als handelten sie gem~g ihren eigenen Intentionen (intentional stance). Welche Haltung Menschen zu einem bestimmten System einnehmen, h~.ngt davon ab, auf welcher Grundlage sie das Verhalten des Systems am einfachsten und verl~slichsten erkl~iren kSnnen, vgl. Bradshaw, 1997, S. 7 sowie Dennet, 1987. 6Vgl. Brenner et al., 1998, S. 26ff. und, sehr ~ihnlich, Franklin und Graesser, 1997, S. 25. Weitere, in Einzelheiten abweichende Listen finden sich u.a. in Bradshaw, 1997, S. 8, Etzioni und Weld, 1995, S. 3f., He und Leung, 2002, S. 258f., Jennings und Wooldridge, 1998, S. 3f., Jennings et al., 1998, S. 8f., Ollmert und Schinzer, 2001, S. 93 und Tolle und Chen, 2000, S. 366.
5.1 Softwareagenten und Multiagentensysteme
163
Proaktivitlit und Zielorientiertheit Handlungen von Agenten mfissen nicht immer die unmittelbare Folge von beobachtbaren Vergnderungen in ihrer Umgebung sein. Ein Agent, der zum einen fiber ein Modell der relevanten Elemente seiner Umwelt verffigt und zum anderen bestimmte Ziele verfolgt, kann auch selbstgndig aktiv werden, wenn z.B. ein bestimmter Zeitpunkt erreicht ist oder das Ergebnis einer internen Berechnung vorliegt, die zu einem neuen Handlungsplan gefiihrt hat, um das Ziel des Agenten zu erreichen. Der Zusammenhang zwischen Proaktivit/it und Zielorientiertheit liegt darin, dass ein proaktives Handeln ohne explizit definierte Ziele nur zuf'~lig sein kSnnte. Die Eigenschaften der Reaktivit/it und der Proaktivit/it werden teilweise auch unter Begriffen wie Einbettung (engl. situatedness) oder Bewusstsein von der Umwelt (engl. environmental awareness; hier sicherlich ohne 5kologische Konnotation zu versetehen) zusammengefasst.
Schlussfolgerungs- und Lernfiihigkeit Die bisher genannten Eigenschaften sind, mindestens in ihrer Grundform, auch in vielen anderen technischen Systemen anzutreffen, die traditionell nicht als Agenten bezeichnet werden, z.B. bei Thermostaten (Reaktivit/it) oder bei einfachen Zeitsteuerungen (Proaktivit/it). Hgufig wird daher als Eigenschaft ffir Softwareagenten zus/itzlich erwartet, dass sie fiber ein gewisses Mat~ an (kfinstlicher) Intelligenz verffigen. Dazu gehSrt eine Wissensbasis und die Fghigkeit, aus den Inhalten der Wissensbasis Schlussfolgerungen zu ziehen. Diese Fghigkeiten werden hgufig mit in der Forschung zur kfinstlichen Intelligenz verbreiteten Methoden erzielt, in denen zumeist eine explizite Repr/isentation des Wissens in Form von symbolischen Regeln vorliegt. Andere Ans/itze nutzen jedoch auch implizite Repr/isentationen von Wissen in Form von Algorithmen. Die Lernbzw. Anpassungsf/ihigkeit besagt, dass ein Agent sein Verhalten im Laufe der Zeit selbst durch Beobachtung des Verhaltens der Umgebung verbessern kann.
Autonomes Handeln Eine wesentliche Eigenschaft eines Agenten besteht darin, bis zu einem gewissen Grad selbstst/indige Entscheidungen treffen zu kSnnen, ohne dass der Benutzer oder ein anderer Agent jeden einzelnen Schritt anstSf~t bzw. autorisiert. Nur auf diese Weise kSnnen
164
5 A utomatisierte Verhandlungen zwischen Softwareagenten Agenten den Benutzer tats~ichlich entlasten. Eine technische Voraussetzung fiir Autonomie (ebenso wie fiir die oben genannte Proaktivit~it) besteht darin, dass das Agentenprogramm dauerhaft l~iuft und nicht nur zu bestimmten Zeitpunkten fiir eine bestimmte, klar umgrenzte Aufgabe gestartet wird. Autonomie eines Agenten gegeniiber anderen Agenten driickt sich darin aus, dass diese nicht einfach bestimmte Funktionen des Agenten aufrufen, wie es in anderen Arten von verteilten Softwaresystemen geschieht, sondern dass ein Agent, der einen anderen zu etwas veranlassen mSchte, diesem eine N achricht mit einer Aufforderung schickt. 0ber die Ausfiihrung der Aufforderung entscheidet jedoch der empfangende Agent nach seinen eigenen Kriterien, z.B. danach, ob er gerade andere, wichtigere Aufgaben zu erledigen hat oder ob der Preis, den der andere Agent evtl. fiir die Ausfiihrung geboten hat, hoch genug ist. 7 Daher ist auch die zuvor genannte Schlussfolgerungs- und Lernf'~ihigkeit wichtige Voraussetzung fiir zielgerichtetes autonomes Handeln des Agenten. Die gelegentlich genannte F~ihigkeit, sich selbst zu reproduzieren, kann als ein weiterer Aspekt der Autonomie aufgefasst werden.
Mobilitiit Mobile Agenten verfiigen fiber die F~ihigkeit, sich selbstst~indig fiber Computernetzwerke von einem Rechner zum anderen zu bewegen, um dort jeweils bestimmte Teile ihrer Aufgaben zu erffillen. Station~ire Agenten sind dagegen an den Rechner gebunden, auf dem sie urspriinglich installiert wurden, und kSnnen lediglich Nachrichten fiber ein Netzwerk an Agenten oder Benutzer an anderen Rechnern versenden.
Kommunikation und Kooperation Agenten sollen in der Lage sein, zur Erfiillung ihrer Aufgaben mit anderen Agenten zu kommunizieren und zu kooperieren. Die Koordination und Kommunikation in Agentensystemen wird unten n~iher erSrtert (vgl. Abschnitt 5.1.4). Charakter Ein eigener Zweig der Forschung zu Softwareagenten beschMtigt sich damit, welche Rolle Anthropomorphismen ffir die Funktion von Softwareagenten spielen. Einerseits bezieht sich diese Frage auf das soziale Verhalten von Agenten bei der Kommunikation und Kooperation mit anderen Agenten. Je grSfoer der Grad der Autonomie, 7Vgl. Jennings und Wooldridge, 1998, S. 4.
5.1 Softwareagenten und Multiagentensysteme
165
der Agenten zugebilligt wird, desto mehr scheint eine Begrenzung ihres Verhaltens durch allgemeine ethische Normen notwendig, da nicht alle Entscheidungssituationen des Agenten vorhergesehen werden kSnnen und es daher nicht mSglich ist, Verhaltensregeln ffir jeden Einzelfall aufzustellen. Der andere Aspekt der Frage bezieht sich auf die Kooperation mit dem menschlichen Benutzer. Hier werden insbesondere Eigenschaften wie Ehrlichkeit, Vertrauenswiirdigkeit und Zuverl~sigkeit als Voraussetzungen fiir die Akzeptanz von Agenten in ffir den Benutzer wichtigen Aufgabenbereichen genannt. Die F~higkeit, emotionale Zust~inde auszudriicken und den emotionalen Zustand des Benutzers zu modellieren, kann die Kommunikation zwischen Agent und Benutzer verbessern. 5.1.2 Typologie yon Softwareagenten
Je nach Fehlen oder Vorhandensein der aufgez~hlten Eigenschaften werden in der Literatur verschiedene Typologien von Agenten aufgestellt. Als Beispiel soll hier die Typologie von Nwana dargestellt werden, der die sieben Typen kollaborative Agenten, Schnittstellenagenten (engl. interface agents), mobile Agenten, Informations- bzw. Internetagenten, reaktive Agenten, hybride Agenten und schlieglich, als bisher nicht realisierte Vision der Agentenforschung, schlaue Agenten (engl. smart agents) unterscheidet, s Kollaborative Agenten sind reaktiv und proaktiv und besitzen die F~ihigkeit zu autonomem Handeln und zur Kommunikation und Kooperation. Die grundlegende Hypothese bei der Entwicklung kollaborativer Agenten liegt darin, dass ein Verbund von Agenten bei der LSsung bestimmter Probleme eines Benutzers einen hSheren Mehrwert liefern kann als jeder einzelne beteiligte Agent. Dabei kann der Mehrwert in verschiedenen Aspekten liegen, z.B. in der Geschwindigkeit der ProblemlSsung, der Zuverl~issigkeit oder der Genauigkeit. Bei Schnittstellenagenten liegt der Schwerpunkt auf der Zusammenarbeit eines Agenten mit dem Benutzer, wobei den Eigenschaften der Autonomie und der Lernfiihigkeit besondere Bedeutung zukommt. 9 Schnittstellenagenten unterstiitzen den Benutzer z.B. beim Erlernen der Benutzung eines 8Vgl. Nwana, 1996, S. 211ft. 9Eine Einfiihrung in die Forschung zu Schnittstellenagenten gibt u.a. Maes, 1994.
166
5 Automatisierte Verhandlungen zwischen Softwareagenten
Computerprogramms. Dazu beobachtet der Agent das Verhalten des Benutzers und schl~igt mSgliche bessere bzw. schnellere Wege zur Erledigung einer bestimmten A ufgabe vor. Schnittstellenagenten lernen auf vier verschiedene Arten: 9 durch Beobachten und Imitieren des Benutzers, 9 durch positive und negative Bewertungen seitens des Benutzers, 9 durch explizite Anweisungen des Benutzers und * indem andere Agenten um Rat gefragt werden, wobei die Zusammenarbeit mit anderen Agenten typischerweise im Vergleich zu kollaborativen Agenten nur in beschr~inktem Mafge stattfindet. Mobile Agenten besitzen neben der begriffspr~igenden Eigenschaft der Mobilit~it die weiteren Eigenschaften Autonomie und Kooperationsf'~higeit. Auf ihrem Weg durch ein Computernetzwerk kSnnen sie z.B. Informationen einsammeln, die sie schlie~lich beim Benutzer abliefern, oder sie kSnnen unterwegs mit anderen Agenten zusammentreffen, um mit ihnen Informationen auszutauschen oder bestimmte Aufgaben von ihnen erledigen zu lassen. Softwareagenten Mobilit~it zu ermSglichen, stellt hohe Anforderungen an die zugrunde liegende Infrastruktur, aber auch im Bereich der Sicherheit und des Datenschutzes. Der wesentliche Vorteil mobiler Agenten wird in einer Verringerung der Netzbelastung gesehen. Ein station~er Agent, der mit der Suche in einer bestimmten Datenbank beauftragt ist, miisste theoretisch den Inhalt der gesamten Datenbank fiber das Netzwerk anfordern, um sie lokal zu durchsuchen, obgleich vermutlich der grS~te Teil der transportierten Daten fiir den Agenten irrelevant ist. Ein mobiler Agent kSnnte sich dagegen zu der Datenbank begeben, dort die benStigten Inhalte heraussuchen und dann auf das System des Benutzers zuriickkehren. Dabei benStigt der Benutzer nicht w~ihrend des gesamten Vorgangs eine aktive Netzverbindung. Im Gegensatz zu den ersten drei Agentengruppen definiert Nwana Informations- bzw. Internetagenten nicht in erster Linie anhand ihrer Eigenschaften, sondern anhand ihrer Aufgabe: Informationsagenten helfen menschlichen Benutzern, mit der Informationsfiberfrachtung umzugehen, die aus der groi~en Menge verfiigbarer Informationen in Computernetzwerken wie
5.1 Softwareagenten und Multiagentensysteme
167
dem Internet, bzw. dem darauf aufsetzenden WWW resultiert. In der Regel nutzen Informations- bzw. Internetagenten die Dienste von WWWSuchdiensten wie Google und bereiten deren Ergebnisse filr den Benutzer weiter auf. Reaktive Softwareagenten sind, wie es der Begriff nahelegt, im Wesentlichen durch die Eigenschaft der Reaktivit~it gekennzeichnet. Sie zeigen in der Regel kein proaktives Verhalten, besitzen keine explizite Wissensrepr~entation, keine Schlussfolgerungsf'~higkeit und lernen nicht. Nfitzliche Aufgaben ffir Benutzer sollen reaktive Agenten dadurch erbringen, dass sich aus dem Zusammenwirken der einfachen Verhaltensmuster vieler einzelner Agenten ein komplexes Verhalten des Systems als Ganzes ergibt. Beispiele filr Systeme reaktiver Agenten sind in der Natur zu finden, z.B. bei Ameisen, denen es trotz eines sehr beschr~inkten Verhaltensrepertoires des einzelnen Exemplars gelingt, komplizierte Behausungen zu konstruieren. In der Literatur wird filr Ph~inomene dieser Art auch der Begriff Emergenz verwendet. Schlief~lich unterscheidet Nwana hybride Agenten, die sich dadurch auszeichnen, dass sie sich aus Komponenten zusammensetzen, die, einzeln betrachtet, einer der bisher genannten Gruppen zugeordnet werden kSnnen. Hybride Agenten verffigen in der Regel fiber mehrere Verhaltensschichten mit zunehmender Komplexit~it. So ist es z.B. sinnvoll, eine reaktive Komponente, die schnell, ohne komplizierte Folgerungsketten durchlaufen zu milssen, auf bestimmte Umweltreize reagieren kann, mit einer kollaborativen Komponente zu kombinieren, die ffir die l~ingerfristige Planung der Handlungen des Agenten zust~ndig ist. i~ Natfirlich existieren in der Literatur zahlreiche weitere Typologien. Brenner versucht eine Unterteilung, die ausschlieiglich an den Aufgaben der Agenten ausgerichtet ist und unterscheidet so Informationsagenten, Kooperationsagenten und Transaktionsagenten. i i
i~
typische Architektur fiir hybride Agenten ist die sog. InteRRaP-Architektur, vgl.
Fischer et al., 1994. iivgl. B r e n n e r et al., 1998, S. 21f.
168
5 Automatisierte Verhandlungen zwischen Softwareagenten
5.1.3 Systeme mit mehreren Agenten
5.1.3.1 Verteiltes ProblemlSsen vs. Multiagentensysteme Wie die oben erwfihnte Eigenschaft der Kommunikations- und Kooperao tionsf'~ihigkeit bereits zeigt, werden Softwareagenten h~iufig nicht einzeln, sondern gemeinsam mit anderen Agenten in einem Verbund eingesetzt. Dadurch wird es mSglich, die inh~ent dezentrale Natur bestimmter Probleme, mehrere Kontrollzentren eines Systems, mehrere Perspektiven oder mehrere konkurrierende Interessen abzubilden. 12 Das gesamte Arbeitsgebiet, das sich mit Systemen dieser Art befasst, wird als verteilte kiinstliche Intelligenz (distributed artificial intelligence; DAI) bezeichnet. Immer, wenn mehrere Softwareagenten interagieren, bedarf es einer Methode um ihre jeweiligen Aktivit/iten zu koordinieren. Ein Charakteristikum aller Systeme mit mehreren Agenten besteht darin, dass keine zentrale Instanz existiert, die die Koordination iibernimmt. 13 Sie erfolgt vielmehr zwischen den einzelnen Agenten. Eine wichtiges Kriterium bei der Klassifizierung von Systemen mit mehreren Agenten bildet die Interessenlage der Agenten bzw. ihrer Benutzer oder Entwickler. Zwei unterschiedliche Perspektiven existieren in der Literatur: Arbeiten zur Problematik des verteilten Probleml6sens (engl. distributed problem solving; DPS) und Arbeiten zu sog. Multiagentensystemen (MAS). 14 In der Forschung zu DPS-Systemen wird davon ausgegangen, dass die Agenten von einem einzelnen Entwicklungsteam zur LSsung eines bestimmten globalen Problems entworfen werden. Das System wird verteilt angelegt, um seine Leistungsf'&higkeit, seine Skalierbarkeit, seine Modularit/it oder seine Zuverl/issigkeit zu verbessern. Auigerdem kann eine Verteilung der Kontrolle im System auf mehrere autonome Entscheidungseinheiten sinnvoll sein, um einer funktionalen oder geographischen Verteilung von Daten bzw. Wissensbest~iaden Rechnung zu tragen. Teilaufgaben werden von spezialisierten Agenten iibernommen, unter denen das aufgabenspezifische Wissen aufgeteilt werden kann. Dadurch kann die notwendige Komplexit~it der einzelnen Agenten reduziert werden. 15 Aufgerdem lassen sich DPS-Systeme fie12Vgl. Jennings et al., 2001, S. 200. 13Vgl. Jennings et al., 1998, S. 17. 14Vgl. Durfee und Rosenschein, 1994, S.101f. 15Vgl. Sycara et al., 1996, S. 37.
5.1 Softwareagenten und Multiagentensysteme
169
xibel an Anderungen der Aufgabenstellung oder der Umgebung anpassen, indem Agenten hinzugeffigt oder weggelassen werden. Die zentrale Fragestellung in der Forschung zu DPS-Systemen liegt darin, wie eine koh~irente Zusammenarbeit der Agenten bei der LSsung des globalen Problems erreicht werden kann. Die Kommunikationsaktivit~iten sollen so gering wie mSglich gehalten werden, Agenten sollten keine Arbeiten doppelt verrichten, sich nicht gegenseitig stSren und Aufgaben und Teilresultate in einer produktiven Weise teilen. Die Forschung zu MAS geht nicht davon aus, dass die Agenten, aus denen ein System besteht, zentral entworfen wurden und ein gemeinsames Globalziel teilen. Die Agenten werden als individuelle Nutzenmaximierer betrachtet, die nur dann miteinander kooperieren, wenn sie von dieser Zusammenarbeit profitieren kSnnen. 16 Auch im Bereich der MAS ist das Ziel eine Kooperation der Agenten. Allerdings kann das Vorhandensein von MSglichkeiten zur Zusammenarbeit nicht wie in den Systemen der DPS-Richtung vorausgesetzt werden, sondern diese MSglichkeiten zu identifizieren ist eine der Aufgaben, die die einzelnen Agenten in MAS bew~iltigen miissen. Au~erdem kann es, da die Agenten nicht einem Globalziel untergeordnet sind, sondern jeweils individuelle Ziele aufweisen, zu Konflikten kommen. Die Frage, wie die Agenten solche Konflikte autonom 15sen kSnnen, ist ein zentrales Thema fiir die MAS-Forschung. Auch in der Forschung zu DPS kSnnen Konflikte zwischen den Agenten auftreten, wenn diese aufgrund unterschiedlicher Kenntnisse fiber die Umwelt zu unterschiedlichen Folgerungen fiber die richtige Methode zur Erreichung des globalen Ziels gelangen. Hier kSnnen die im Rahmen der MAS-Forschung gewonnenen Erkenntnisse ebenfalls von Nutzen sein. Insgesamt sollten die beiden Forschungsrichtungen also als Extrempunkte eines Kontinuums mSglicher Sichtweisen aufgefasst werden. 17 5.1.3.2 Koordinationsbedarf Die Notwendigkeit zur Koordination in MAS geht in der Regel auf eine der folgenden vier Ursachen zurfick: is 16Dies schlief~t allerdings nicht aus, dass die Nutzenfunktionen der Agenten so gestaltet wurden, dass die Erreichung bestimmter globaler Ziele in das individuelle Nutzenkalkfil eingeht. 17Vgl. Zlotkin und Rosenschein, 1996a, S. 152. lSVgl, z.B. Jennings, 1995, S. 224f.
170
5 A utomatisierte Verhandlungen zwischen Softwareagenten
1. Koordination ist erforderlich, wenn Interdependenzen zwischen den Aktionen einzelner Agenten bestehen, wenn also die Aktionen eines Agenten einen direkten Einfluss auf diejenigen eines anderen haben. 2. Die Handlungen der Agenten mfissen abgestimmt werden, um globale Randbedingungen des Systems zu erfiillen. Wenn z.B. ein verteilt geplantes Projekt insgesamt innerhalb eines bestimmten Budgets realisiert werden soll, mfissen die einzelnen Agenten informiert sein, wieviel von dem Budget bereits durch andere Agenten verbraucht wurde, wenn sie ihre eigenen Planungsentscheidungen treffen. 3. Manchmal reichen die Ftihigkeiten eines einzelnen Agenten nicht aus, um dessen individuelle Ziele zu erreichen, so dass er sich der Hilfe anderer Agenten versichern muss. 4. Es gibt Situationen, in denen ein einzelner Agent sein Ziel im Prinzip allein erreichen kSnnte, das Ziel aber erheblich leichter bzw. schneller erreichen kann, wenn er mit anderen kooperiert. Ein Beispiel hierfiir sind verteilte Suchvorg~inge, die umso schneller abgeschlossen werden kSnnen, je mehr unabh~iagige Agenten sich daran beteiligen. Eine Koordination zwischen den Agenten setzt in jedem der genannten F~ille voraus, dass ein einzelner Agent die Handlungen der iibrigen Agenten bei der Planung seiner eigenen Handlungen antizipieren kann. 19 5.1.3.3 Koordinationsmodelle In der weiteren, nicht auf Agentensysteme beschrfiakten Forschung zur Koordination verteilter Softwaresysteme wird der Begriff des Koordinationsmodells verwendet, um verschiedene Koordinationstechniken miteinander zu vergleichen. 2~ Ein Koordinationsmodell besteht aus drei Komponenten, n~imlich 1. den Koordinationseinheiten, also den zu koordinierenden Einzelelementen des Systems, 2. dem Koordinationsmedium, fiber das sich die Kommunikation zwischen den Agenten vollzieht sowie 19Vgl. Gmytrasiewicz und Durfee, 2000, S. 320. 2~ Ciancarini, 1996, S. 300f. sowie Bergenti und Ricci, 2002, S. 367.
5.1 So[twareagenten und Multiagentensysteme
171
3. den Koordinationsgesetzen, die regeln, wie die Koordination fiber das gegebene Koordinationsmedium erfolgt. Bei den Koordinationseinheiten kann es sich um Prozesse auf Betriebssystemebene, um Threads, z.B. innerhalb einer Java-Virtual Machine, um Objekte oder um Softwareagenten handeln. Im Zusammenhang dieser Arbeit ist nur die Koordination zwischen Softwareagenten von Interesse. Im folgenden werden die Aspekte des Koordinationsmediums und der Koordinationsgesetze n~i~her erSrtert. Als Koordinationsmedium werden insbesondere zwei Verfahren diskutiert. In dem einen Verfahren legen Agenten sowohl gemeinsam zu nutzende Daten als auch Nachrichten an andere Agenten in einem ffir alle Agenten zug~nglichen Datenspeicher ab. Dieser Datenspeicher wird in ~teren Systemen als Blackboard bezeichnet, in jfingeren Systemen, die als Ablageformat ffir die zu speichernden Daten eine Tupelstruktur aus einem Bezeichner und einem zugeordneten Wert vorschreiben, wird er als Tupelraum (tuple space) bezeichnet. 21 Das andere Verfahren setzt eine direkte Datenverbindung zwischen den Agenten voraus und basiert auf dem Austausch von Nachrichten. Hier l~st sich weiter danach unterscheiden, ob die Nachrichten im Rahmen eines festgelegten Protokolls ausgetauscht werden, oder ob die Semantik der einzelnen Nachrichten alle nStigen Informationen enth~ilt, um die Menge geeigneter Antwortnachrichten zu bestimmen. 22 Darfiber hinaus gibt es F~ille von Koordination, in denen kein gesondertes Koordinationsmedium existiert, sondern die Koordination ausschliefAich fiber die Beobachtung der Umgebung und evtl. der Handlungen der fibrigen Agenten in der Umgebung geschieht. Tupelr~iume stellen aus der Sicht des Entwurfs einzelner Agenten in einem verteilten Agentensystem eine gegenfiber der direkten Kommunikation vorteilhafte LSsung dar, insbesondere wenn die Agenten mobil sind, also zur Laufzeit von einem Rechnersystem zu anderen wechseln kSnnen. Aus der Sicht des einzelnen Agenten erfordern Tupelr/iume keine direkte Kopplung zwischen den Agenten, weder in Bezug auf das A uffinden eines Kommunikationspartners (,,Wer ist der Kommunikationspartner?", ,,Wo befindet sich der Kommunikationspartner?") noch in zeitlicher Hinsicht, d.h., wann be21Vgl. Ciancarini et al., 1999, s. 222. 22Vgl. Bergenti und Ricci, 2002, S. 368ff.
172
5 Automatisierte Verhandlungen zwischen Softwareagenten
stimmte Interaktionsschritte stattfinden kSnnen. 23 Allerdings setzt diese Betrachtungsweise voraus, dass auf den gemeinsamen Tupelraum stets zugegriffen werden kann. Aus der Sicht des Entwurfs eines Gesamtsystems kann dies jedoch keinesfalls immer vorausgesetzt werden. Im Sinne einer weitgehenden Unabh~ingigkeit von Infrastrukturen, die in der Regel von Dritten bereitgestellt werden miissten, wird daher in den meisten praktischen Umsetzungen von Agentensystemen eine direkte Kommunikation zwischen den Agenten vorgezogen. 24 Die Koordination durch Verhandlungen, die das Thema dieser Arbeit ist, setzt den direkten Austausch von Nachrichten voraus, daher wird dieses Koordinationsmedium unten detaillierter dargestellt. Die Koordinationsgesetze bestimmen, in welcher Weise die Koordinationseinheiten das Koordinationsmedium nutzen. Dies kann auf der Ebene der Softwarearchitektur festgelegt sein, wie es z.B. in Client-Server-Systemen der Fall ist, in Form expliziter Regeln definiert werden oder allein von dem individuellen Verhalten der einzelnen Agenten abh~iagen. Auch Mischformen sind mSglich, in denen die Koordination teilweise auf expliziten Regeln und teilweise auf den individuellen Entscheidungen der Agenten beruht. So ist es z.B. denkbar, dass sich die Agenten darauf einigen, fiir einen Teil der zu koordinierenden Handlungen auf ein vorher definiertes Protokoll zuriickzugreifen. 25 5.1.4 Direkte Kommunikation zwischen Softwareagenten Fiir die Kommunikation zwischen Softwareagenten wird ein Prinzip genutzt, das h/iufig in technischen Kommunikationssystemen eingesetzt wird, nLnalich die Aufteilung des gesamten Kommunikationsvorgangs in einzelne Funktionsbereiche, die durch verschiedene, hierarchisch angeordnete Schichten erfiillt werden. 26 Jede Schicht kommuniziert mit den benachbarten Schichten fiber festgelegte Schnittstellen. Damit ist es im Prinzip mSglich, das 23Vgl. Ciancarini et al., 1999, S. 221. 24Insbesondere beruht das von der Foundation for Intelligent Physical Agents, FIPA, vorgeschlagene Standardmodell zur Agentenkommunikation auf der direkten Kommunikation zwischen Softwareagenten; vgl. FIPA, 2002a. 25Vgl. z.B. die verschachtelten Konversationsrichtlinien in Hanson et al., 2002a, S. 68f. 26Bekannte Beispiele fiir solche Schichtenmodelle sind die Protokolle der TCP/IPFamilie, die die Grundlage des Internet bilden, sowie der ~ihnliche, yon der International Organization for Standardization (ISO) verabschiedete Standard Open Systems Interconnection (OSI).
5.1 Softwareagenten und M u l t i a g e n t e n s y s t e m e
173
auf einer Schicht eingesetzte Verfahren gegen ein anderes, ffir einen speziellen Anwendungsfall geeignetes zu ersetzen, ohne dass die Funktionsf~ihigkeit der fibrigen Schichten beeintr~ichtigt wird. Ffir den Bereich der Kommunikation zwischen Softwareagenten existiert bislang kein offiziell standardisiertes Schichtenmodell. Hier wird auf eine Einteilung zurfickgegriffen, die sich in der Spezifikation der Agentenkommunikationssprache KQML 27 (vgl. Abschnitt 5.1.5.2) findet und die ~iahnlich z.B. auch in der Spezifikation einer abstrakten Architektur ffir Agentensysteme durch die Foundation for Intelligent Physical Agents (FIPA) vorgenommen wird. 28 Nach dieser Einteilung existiert eine Transportschicht, eine Sprachschicht, eine Konversationsschicht sowie eine Architekturschicht, die in den folgenden Abschnitten erl~iutert werden. 5.1.4.1 Transportschicht Die Transportschicht ist ffir die (~bermittlung von Nachrichten von einem Agenten zu einem oder mehreren anderen zust~indig. Sie muss dazu eine Reihe von Anforderungen erffillen. Im Rahmen der KQML-Spezifikation werden diese Anforderungen beispielsweise in den folgenden Punkten zusammengefasst: 29 9 Agenten sind durch unidirektionale Kommunikationskan~ile verbunden, die diskrete Nachrichten transportieren, 9 auf dem Transport fiber diese Kan~ile kSnnen Nachrichten verz5gert werden, 9 wenn ein Agent eine Nachricht empf'~ngt, kann er den Kanal identifizieren, auf dem sie eingetroffen ist, 9 wenn ein Agent eine Nachricht versendet, kann er den Kanal bestimmen, auf dem die abgehende Nachricht transportiert wird, 9 Nachrichten an eine einzelne Zieladresse kommen in der Reihenfolge an, in der sie abgesendet wurden und 27Vgl. Finin et al., 1993, S. 4. 28Vgl. FIPA, 2002a. 29Vgl. Finin et al., 1993, S. 6.
174
5 Automatisierte Verhandlungen zwischen Softwareagenten * die Ubermittlung von Nachrichten ist zuverl~sig, d.h. der Absender erh~ilt eine Fehlermeldung, wenn eine Nachricht nicht oder nicht vollstfiaadig an den Empf'~nger geliefert werden konnte.
Je nach der r~iumlichen Verteilung der Agenten und den zur Verfiigung stehenden Kommunikationskan~ilen kSnnen auf dieser Schicht unterschiedliche Techniken zum Einsatz kommen. Befinden sich z.B. alle Agenten des Systems auf demselben Rechner, kSnnen klassische Techniken der Interprozesskommunikation wie sog. Pipes oder gemeinsam genutzte Speicherbereiche verwendet werden. Sind die Agenten fiber mehrere Rechner innerhalb eines schnellen lokalen Netzwerks verteilt, kSnnen z.B. Techniken wie CORBA (Common Object Request Broker Architecture) oder MPI (Message Passing Interface) eingesetzt werden. Bei einer regionalen oder globalen Verteilung der Softwareagenten bieten sich verschiedene Protokolle aus der Familie der Internetprotokolle zur Nachrichteniibermittlung an, insbesondere das im WWW genutzte HTTP (Hypertext Transfer Protocol) sowie das fiir die Ubertragung von E-Mail-Nachrichten genutzte SMTP (Simple Mail Transport Protocol). Die auf dieser Schicht eingesetzten Verfahren haben insgesamt ein hohes Maf~ an Stabilit~it erreicht, fiir die Zukunft sind eher graduelle technische Verbesserungen als grundlegende Ver~inderungen zu erwarten. 5.1.4.2 Sprachschicht Auf der Ebene der Sprache geht es um die Gestalt der einzelnen zwischen den Agenten ausgetauschten Nachrichten. Eine Mindestvoraussetzung ist, dass zwischen den unmittelbar an einem Kommunikationsvorgang beteiligten Agenten Einigkeit fiber das Format der Nachrichten besteht. Bei der Entwicklung von agentenbasierten Softwaresystemen wird allerdings das Ziel verfolgt, dass Systeme dynamisch durch die Zusammenarbeit dezentral entwickelter Agenten erweitert werden kSnnen. Dies setzt voraus, dass eine systemiibergreifende, evtl. durch ein anerkanntes Gremium standardisierte Spezifikation von Nachrichten existiert, an der sich alle potenziell kooperierenden Agenten orientieren. 3~ Inzwischen gibt es eine Vielfalt von Sprachen zur Kommunikation zwischen Softwaresystemen oder spezieller zwischen Softwareagenten. Einige 3~
Dignum, 2000, S. lf.
5.1 Softwareagenten und Multiagentensysteme
175
dieser Sprachen beschr/inken sich auf jeweils einen bestimmten Einsatzbereich, z.B. die Kommunikation zwischen Unternehmen innerhalb bestimmter Branchen oder den elektronischen Gesch~iftsverkehr im Allgemeinen. Mit anderen Sprachen wird das Ziel verfolgt, in mSglichst vielen, wenn nicht gar allen denkbaren Kommunikationssituationen einsetzbar zu sein. Auf die Agentenkommunikationssprachen wird in Abschnitt 5.1.5 n~iher eingegangen. 5.1.4.3 Kommunikationsrichtlinien und Protokolle Die wenigsten Kommunikationsvorg~inge sind mit dem erfolgreichen Versand und Empfang einer einzelnen Nachricht abgeschlossen. Meist ist vielmehr eine Folge von Nachrichten erforderlich, wobei jeder der beteiligten Agenten sowohl Sender als auch Empf~inger einiger Nachrichten ist. Eine solche Folge wird als Konversation oder Dialog bezeichnet. Vorschriften zur Strukturierung von Dialogen werden Konversationsrichtlinien (engl. Conversation Policy; CP) oder Protokolle genannt. H~iufig sind Nachrichten, die im Verlauf eines Kommunikationsvorganges auftreten, nur sinnvoll im Kontext der vorher versandten Nachrichten interpretierbar. Daraus ergibt sich ein Wechselverh/~ltnis zwischen der Komplexit~it der benStigten Nachrichten und der SpezifiQit der befolgten Konversationsrichtlinie. Je genauer die Konversationsrichtlinie Typ und erwarteten Inhalt der folgenden Nachricht vorgibt, desto weniger Kontext m/issen die Nachrichten selbst enthalten. Die in einer ACL formulierten Nachrichten reichen unter Umst~inden nicht aus, um die Agenten in die Lage zu versetzen, ohne Missverst/indnisse komplexere Konversationen zu fiihren. Denn der Zusammenhang, in dem eine Nachricht gesendet wird, also die vorausgehenden, aber auch die erwarteten nachfolgenden Nachrichten, bildet einen wesentlichen Teil des Kontextes, in dem die Interpretation einer einzelnen Nachricht erfolgen muss. 31 Hinzu kommt, dass ACL wie KQML, FIPA-ACL oder auch FLBC sehr komplexe Nachrichteninhalte erlauben und es h~iufig mehrere Wege gibt, eine bestimmte Intention durch eine syntaktisch korrekte Nachricht auszudr/icken. Gleichzeitig kann eine Nachricht auch mehrere Intentionen ausdriicken. 32 31Vgl. Moore, 2001, S. 43. 32Vgl. Greaves et al., 1999, S. 119. Die Autoren sprechen dort auch von dem ,,Grundlegenden Problem" der Agentenkommunikation.
176
5 A u t o m a t i s i e r t e V e r h a n d l u n g e n zwischen S o f t w a r e a g e n t e n
Um Mehrdeutigkeiten zu vermeiden, bedarf es Regeln, welche Abfolgen von Nachrichtentypen in einer bestimmten Situation zul~sig sind. Diese Regeln werden als Konversationsrichtlinien (conversation policies) oder auch als Protokolle bezeichnet. Am einfachsten erscheint es, fiir einzelne Anwendungsf'~ille genau zu spezifizieren, welche Abfolgen von Nachrichten mSglich sind. Eine solche Spezifikation kann z.B. in Form von Petri-Netzen 33 oder, einfacher, in Form von endlichen Zustandsautomaten 34 formuliert werden. Eine Reihe von Autoren ist der Ansicht, dass solche starren Spezifikationen nicht die optimale Form fiir Konversationsrichtlinien darstellen. 35 Insbesondere wird kritisiert, dass es diese Form der Spezifikation erschwert, alle Annahmen fiber die Kommunikation zwischen den Agenten explizit zu machen, die der Spezifikation zugrunde liegen. Anstelle spezifischer Ausffihrungsmodelle sollten Konversationsrichtlinien demnach als Mengen von einzelnen Beschr~inkungen formuliert werden, die keiner der beteiligten Agenten bei der Formulierung seiner Nachrichten verletzen daft. Diese Beschr~inkungen betreffen u.a. die Bedingungen zur Beendigung einer Konversation, die Reihenfolge, in der Nachrichten gesendet werden, die Frage, ob auf jede Nachricht eine Empfangsbest~itigung folgen soll, die Ausnahmebehandlung und die Frage der Auswahl aus semantisch equivalenten Nachrichten. Dagegen soll die Konversationsrichtlinie nicht unmittelbar in den Prozess der Nachrichtengenerierung der einzelnen Agenten eingreifen. 38 5.1.4.4 Architektur Die Architektur eines Agentensystems enstpricht etwa der Struktur einer Organisation von menschlichen Individuen. Einerseits wird festgelegt, welche Agenten mit welchen anderen Agenten direkt kommunizieren. Dabei reicht das Spektrum von Strukturen, in denen jeder Agent direkt jeden anderen erreichen kann, bis hin zu strikten hierarchischen Organisationsformen, bei denen eine Kommunikation ausschliei~lich entlang der ,,Linie" zwischen hSherrangigen und niederrangigen Agenten erfolgt. Aui~erdem muss im Rahmen der Architektur die Frage beantwortet werden, wie sich neu hinzukommende Agenten dem System anschlie~en kSnnen. 33Vgl. z.B. Cost et al., 2000, S183ff. 34Vgl. z.B. Barbuceanu und Fox, 1995, S. 20f., Greaves et al., 1999, S. 120 und Hanson et al., 2002b, S. 794. 35Vgl. z.B. Greaves et al., 1999, S. 124. 36Vgl. Greaves et al., 1999, S. 124f.
5.1 Softwareagenten und Multiagentensysteme
177
Dazu sind z.B. bestimmte Registrierungsinstanzen und Verzeichnisdienste vorzusehen. Verzeichnisdienste dienen Agenten dazu, anhand bestimmter Kriterien die Namen bzw. Adressen von anderen Agenten in Erfahrung zu bringen, die in der Lage sind, bestimmte gewfinschte Dienstleistungen zu erbringen. Agenten kSnnen in einem MAS drei Rollen einnehmen: Anbieter (engl. provider) ,die fiber bestimmte F~ihigkeiten verffigen, Nachfrager (engl. requester), die durch bestimmte PrMerenzen charakterisiert sind, und Vermittleragenten (engl. middle-agent), die Nachfrager und Anbieter zusammenbringen, deren Prfiferenzen und Ffiahigkeiten zueinander passen. 37 Der Informationsfluss fiber den Vermittler kann in zwei Richtungen verlaufen. Entweder stellt der Anbieter dem Vermittler von sich aus Informationen zur Verffigung (,,push"), w~ihrend sich der Nachfrager Anfragen nach bestimmten F~ihigkeiten an den Vermittler stellt (,,pull"), oder die Informationen flief~en in die umgekehrte Richtung. 3s Verschiedene Typen von Vermittlern lassen sich im Hinblick auf die Informationen unterscheiden, die den Agenten der drei RoUen zu Beginn des Vermittlungsprozesses zur Verffigung stehen. Tabelle 5.1 illustriert die mSglichen Kombinationen: Die Zeile, in der ein Vermittlertyp in der Tabelle aufgeffihrt ist, weist darauf hin, wer beim Einsatz dieses Typs fiber die Pr~ferenzen der Nachfrager informiert ist. Die Spalte, in der ein Vermittlertyp steht, gibt an, Agenten welche Agenten die F~higkeiten der Anbieter kennen. Wenn weder Anbieter noch Nachfrager einen Vermittler fiber ihre PrKferenzen bzw. F~ihigkeiten informieren wollen oder kSnnen, kann offensichtlich kein Vermittler eingesetzt werden, daher ist das entsprechende Feld der Tabelle leer. 39 In der realen Welt findet eine Vermittlung h~iufig durch Aush~nge an einem viel frequentierten Platz statt, die z.B. Gesuche nach einem Babysitter oder einer Wohnung mit bestimmten Eigenschaften darstellen. In diesem Fall, in dem die Pr~ferenzen der Nachfrager 5ffentlich gemacht werden, w~ihrend zun~ichst nut die Anbieter ihre jeweiligen F~igkeiten kennen (Zeile 3, Spalte 1), wird bzw. werden der oder die Vermittleragenten 37Vgl. Decker et al., 1997. 3sVgl. Wong und Sycara, 2000, S. 465. 39Im linken oberen Feld der Matrix, in der Anbieter und Nachfrager nur jeweils ihre eigenen F~ihigkeiten bzw. Pr~iferenzen kennen, steht im Original in Klammern der engl. Begriff broadcaster (dt. etwa Rundfunksender bzw. Rundfunksprecher), ohne dass dies im Text n~her erl~utert wfirde. Dem Verfasser erscheint in diesem Fall keine T~itigkeit eines Vermittlungsagenten mSglich; deshalb wird das Feld hier leer gelassen.
178
5 Automatisierte Verhandlungen zwischen Softwareagenten
Kenntnis der Pr~iferenzen haben anfangs... ...nur d i e Nachfrager ...Nachfrager u. V e r m i t t l e r ... N a c h f r a g e r , V e r m i t t l e r u. Anbieter
Kenntnis der F~ihigkeiten haben anfangs... ...nur d i e ...Anbieter u . . . . Anbieter, Anbieter Vermittler V e r m i t t l e r u. Nachfrager
,,Front-Agenten"
Matchmaker
Annonymisierer
Makler
Empfehlungsgeber
schwarzes Brett
Gew~ihrsmaun/ Leibw~ichter
Schlichter
Tabelle 5.1" Typen von Vermittleragenten (Decker et al., 1997, S. 579, eigene Ubersetzung, leicht modifiziert) als ,,schwarzes Brett" (engl. blackboard) bezeichnet. Der umgekehrte Fall, in dem die F~ihigkeiten der Anbieter 5ffentlich gemacht werden, w~ihrend die Nachfrager ihre PrMerenzen zun/ichst ffir sich behalten (Zeile 1, Spalte 3), wird als ,~VIatchmaker" (dt. etwa ,,Ehestifter") bezeichnet. Dem Vermittler kommt hier eher beratende Funktion zu, da der Nachfrager im Prinzip auch selbst eine Auswahl unter den 5ffentlich gemachten F~ihigkeiten der Anbieter treffen kSnnte. Die dritte wichtige Kategorie der Vermittlungsagenten bilden die ,,Makler", die Pr/iferenzen und F~higkeiten von beiden Seiten erfahren und mit diesem Wissen geeignete Paare von Transaktionspartnern ausw~ihlen. Ein ,flmonymisierer" (Zeile 2, Spalte 1) leitet Anfragen eines Nachfragers nach bestimmten F~ihigkeiten eines Anbieters weiter, ohne, dass der Nachfrager seine Identit/it preisgeben muss. Ein ,~ront-Agent" (Zeile 1, Spalte 2) kann z.B. durch eine Art Katalog mit den F~hhigkeiten verschiedener Anbieter realisiert sein, der selbst nicht fiber eine spezifische Kenntnis der Bedfirfnisse einzelner Nachfrager verffigt. Die Kategorie ,,Gew~ihrsmann" (engl. introducer) bzw. ,~Leibw~ichter" (engl. bodyguard) schfitzt Nachfrager, deren Pdiferenzen allgemein bekannt sind, die aber ihrerseits keinen Uberblick fiber die F~i~higkeiten der Anbieter haben davor, auf ,,Quacksalber", also Anbieter mit unzureichenden Qualifikationen, hereinzufallen. Eine weitere Unterscheidung 1/isst sich hinsichtlich des Ablaufs des eigentlichen Vermittlungsvorganges treffen. So fiben Makler ihre Vermittlerrolle in
5.1 Softwareagenten und Multiagentensysteme
179
der Regel w~ihrend der gesamten Transaktionsabwicklung aus, d.h. Anbieter und Nachfrager kommunizieren ausschlief~lich fiber den Makler. Matchmaker hingegen stellen lediglich den ersten Kontakt zwischen geeignet erscheinenden Partnern her, die eigentliche Transaktion wird jedoch in direkter Kommunikation abgewickelt. 4~
5.1.5 Agentenkommunikationssprachen 5.1.5.1 Exkurs: Theorie der Sprechakte Einen wichtigen Einfluss auf die Entwicklung von Sprachen zur Kommunikation zwischen Agenten hat die linguistische Theorie der Sprechakte ausgefibt. Deshalb sollen Grundzfige dieser Theorie hier kurz dargestellt werden. In der Sprechakttheorie wird jede sprachliche .~uf~erung als eine Folge von Handlungen bzw. Akten aufgefasst. Insgesamt werden vier aufeinanderfolgende Akte unterschieden, die gemeinsam einen Sprechakt ausmachen: 41
Ji.ugerungsakt: 42 Die Hervorbringung einer Lautfolge (oder einer Zeichenkette etc.) in einer bestimmten Sprache. Lokutionfirer Akt: Die 0bermittlung der wSrtlichen Bedeutung des Gesagten an den HSrer. 43 IIIokution~irer Akt: Die 0bermittlung der vom Sprecher der .~uJ~erung verfolgten Absicht. Perlokution~irer Akt: Der Einfluss, den die .~ugerung auf das weitere Handeln des HSrers ausfibt. Damit der .~ufgerungsakt gelingt, genfigt es, dass der HSrer iiberhaupt wahrnimmt, dass der Sprecher etwas gesagt hat, selbst wenn jener dabei eine dem HSrer unbekannte Sprache verwendet. Der lokution~ire Akt kann dagegen nur gelingen, wenn der HSrer die Sprache versteht, in der der Sprecher 4~ Sycara et al., 2004, S. 67. 4zVgl. Moore, 2001, S. 40. 43W~ihrend die linguistische Sprechakttheorie im engeren Sinne auf gesprochene Auf~erungen abstellt, wird in der Literatur zu Agentenkommunikationssprachen in der Regel auf in elektronischer Form iibermittelte schriftliche Nachrichten Bezug genommen. Anstelle der Begriffe 'HSrer' und 'Sprecher' kSnnen daher in den folgenden Ausfiihrungen auch die Begriffe 'Empf'~nger' und 'Sender' eingesetzt werden.
180
5 A utomatisierte Verhandlungen zwischen Softwareagenten
seine ji.uf~erung formuliert. Die fiir die Entwicklung von Sprachen zur Agentenkommunikation wichtigste Erkenntnis der Sprechakttheorie besteht nun darin, dass die im Zuge des lokution~en Aktes/ibermittelte Aussage keinen Hinweis auf die eigentliche Absicht des Sprechers enthalten muss. So kann die .~uf~erung ,,Morgen komme ich." eine neutrale Mitteilung sein, aber auch ein Versprechen, eine Warnung oder eine Drohung. 44 Es h~iaagt von der Situation ab, in der diese ./kuf~erung hervorgebracht wird, welchem Zweck sie dient. Der illokution/ire Akt besteht nun genau darin, dem HSrer einer Nachricht den Zweck der Nachricht zu vermitteln. Die Haltung, die mit einer bestimmten Augerung verbunden ist, wird als illokution~ire Rolle (engl. illocutionary force) bezeichnet. Der illokution~e Akt gelingt dann, wenn der Empfiinger der Nachricht die Intention des Senders erkennt, also z.B. realisiert ,,er teilt mir mit", ,,er verspricht mir", ,,er warnt mich" oder ,,er droht mir". Eine abgeschlossene und unumstrittene Liste der mSglichen illokution/iren Rollen existiert in der Linguistik jedoch nicht, wenngleich eine Reihe von Versuchen unternommen wurden, eine solche Liste zusammenzustellen. Wichtige und in vielen Listen enthaltene Rollen sind z.B. ,,Mitteilung", ,,Frage", ,,Aufforderung", ,~Angebot", ,,Versprechen" und ,,Vorhersage". Vom illokution~en Akt sind die Konsequenzen zu unterscheiden, die der Empf'~hager der Nachricht daraus zieht. Wenn der Empf'Rnger gewarnt wird, mag er sich auf den Gegenstand der Warnung einrichten, wenn ihm gedroht wird, mag er sich auf seine Verteidigung vorbereiten etc. Diese mittelbaren Effekte der Auf~erung werden als perlokution~er Akt bezeichnet. Die Aufteilung in Aussage und illokution~ire Rolle wird auch als F(P)Schema bezeichnet, wobei F die illokution~e Rolle (force) bezeichnet, und P die Aussage (proposition). Im Abschnitt 5.1.5.3 wird n~iher auf Methoden zur Formulierung der Aussage P eingegangen, w~hrend im Abschnitt 5.1.5.2 dargestellt wird, wie die illokution~ire Rolle in Agentenkommunikationssprachen reprhsentiert wird. 5.1.5.2 Nachrichtentypen in Agentenkommunikationssprachen In nat/irlichen Sprachen wird die illokution~re Rolle in vielen F~len nicht direkt sprachlich kodiert, sondern der HSrer erschliegt sie aus dem Kontext einer Unterhaltung sowie aus Elementen des /ibrigen Verhaltens des
44Vgl. Austin, 2002, S. 9f.
5.1 Softwareagenten und Multiagentensysteme
181
Sprechers w~hrend der Auf~erung wie Tonfall, Mimik und Gestik. Au~erungen, die die intendierte illokution~ire Rolle, also Mitteilung, Warnung, Aufforderung etc. unmittelbar in sprachlicher Form enthalten, werden als performative .&uI~erungen bezeichnet. Beispiele hierfiir sind ,Ich teile Dir mit, dass...", ,,Ich warne Dich vor..." oder ,,Ich fordere Dich auf...". 45 Die verhaltensbezogenen Anhaltspunkte existieren in der Kommunikation zwischen Softwareagenten in der Regel nicht. Das SchlieI~en auf die illokution~re Rolle einer AuJ~erung aus dem Kontext ist ebenfalls nur bedingt mSglich. Zudem ist es mit grof~en Unsicherheiten verbunden und setzt erhebliche F~higkeiten beim Empfiinger voraus, die, soweit fiberhaupt softwaretechnisch realisierbar, fiir die meisten Agentensysteme zu aufw~ndig w~iren. Daher wird in der Mehrzahl der Agentenkommunikationssprachen die illokution~re Rolle explizit iibermittelt. Dazu wird eine Menge von Nachrichtentypen definiert, die jeweils einer bestimmten illokution~ren Rolle entsprechen. Die Aussage, auf die sich die illokution~ire Rolle bezieht, wird dann in einer sog. Wissensrepr~entationssprache formuliert (vgl. Abschnitt 5.1.5.3). In der Terminologie der Sprechakttheorie handelt es sich also bei den Nachrichten einer Agentenkommunikationssprache um performative .&uI~erungen. Die Nachrichten der meisten in der Literatur vorgeschlagenen bzw. als (Quasi-)Standard definierten Agentenkommunikationssprachen sind nach dem F(P)-Schema aufgebaut. Gro~e Unterschiede gibt es jedoch hinsichtlich der Anzahl und der Art der definierten Nachrichtentypen. Im folgenden werden die beiden meistgenutzen Agentenkommunikationssprachen KQML sowie FIPA-ACL sowie die jiingere Weiterentwicklung FBLC beschrieben. Einige weitere Ans/itze zu Agentenkommunikationssprachen werden im Anschluss kurz genannt. ..
KQML Die Knowledge Query and Manipulation Language (KQML) geht auf die Knowledge Sharing Initiative der Defense Advanced Research Projects Agency (DARPA), einer Forschungsagentur des Verteidigungsministeriums der USA, zufiick. Rechnet man verschiedene Abwandlungen und Erweiterungen hinzu, handelt es sich um eine der verbreitetsten ACL. Die Struktur der Nachrichten folgt dem F(P)-Schema der Sprechakttheorie, indem eine Nachricht (F) als Einstellung zu einem Wissensfragment (P) ver45Vgl. Austin, 2002, S. 29.
182
5 A utomatisierte Verhandlungen zwischen Softwareagenten
standen wird. Die Nachrichten werden als Performative 46 bezeichnet. Das Wissensfragment wird in einer Wissensrepr~sentationssprache dargestellt, z.B. in dem ebenfalls im Rahmen der Knowledge Sharing Initiative entwickelten Knowledge Interchange Format (KIF). Im Gegensatz zu AGENT-0 ist aber explizit auch die Verwendung anderer Wissensrepr~entationssprachen zur Formulierung der Aussage P vorgesehen. Aus der Sicht von KQML sind Agenten durch ihre jeweilige Wissensbasis (Knowledge Base; KB) repr~entiert. Jede KQML-Nachricht stellt eine Handlung in Bezug auf die Wissensbasis eines Agenten dar. 47 Es kann sich z.B. um die Frage nach einem Inhalt der Wissensbasis handeln, die Mitteilung fiber einen Satz, den eine Wissensbasis enth~ilt, die Aufforderung, S~itze zu einer Wissensbasis hinzuzuftigen oder daraus zu 15schen oder die Aufforderung, das in einer Wissensbasis vorhandene Wissen zu nutzen, um Nachrichten an geeignete andere Agenten weiterzuleiten. Syntaktisch besteht eine KQML-Nachricht aus verschachtelten Klammerausdr/icken. Die ~uf~erste Ebene enth~ilt den Namen des Performativs, gefolgt von einer Reihe von obligatorischen und optionalen Parametern. 48 F/ir die meisten Performative ist der Parameter :content obligatorisch, der das Wissensfragment bezeichnet, auf das sich die mit der Nachricht beabsichtigte Handlung bezieht. Der Parameter :language gibt an, in welcher Sprache der Wert des Parmeters :content formuliert ist, falls es sich dabei nicht um KIF, sondern eine andere Wissensrepr~entationssprache handelt. Das benutzte Vokabular wird mit dem Parameter :ontology angegeben. Die Parameter :reply-with und :in-reply-to geben an, ob eine Antwort auf eine Nachricht erwartet wird und welcher Performativname ggf. erwartet wird, bzw. auf welchen Performativnamen eine Nachricht antwortet. Einige einfache Beispiele, die lediglich den Performativnamen und den Parameter :content beinhalten, sollen die Struktur von KQML illustrieren: 49 Wenn Agent A dem Agenten B mitteilen mSchte, dass er davon/iberzeugt ist, dass drei grSf~er als zwei ist, wird er ihm die KQML-Nachricht ( t e l l (> 3 2)) senden. Das gewtinschte Ergebnis aus Sicht von A besteht in diesem 46In KQML erfiillt das Performativ, genauer gesagt der Name des Performativs, die
Funktion eines Operators, dessen Parameter die Inhalte der Nachricht bilden, vgl. Covington, 1998, S. 207. 47Vgl. Finin et al., 1993, S. 8. 4sVgl. Finin et al., 1993, S. 9f. 49Vgl. Genesereth, 1994, S. 52.
5.1 Softwareagenten und Multiagentensysteme
183
Fall lediglich darin, dass B zu seiner Wissensbasis die Aussage ,~A glaubt, dass drei gr6i~er zwei" hinzuffigt. MSchte A erreichen, dass B infolge der tibermittelten Nachricht, d.h. infolge des Sprechaktes von A, ebenfalls an die genannte Aussage glaubt, wiirde seine KQML-Nachricht ( i n s e r t (> 3 2)) lauten. Das Performativ mit dem Namen ,,insert" dr/ickt die Absicht von A aus, dass B die durch den Parameter :content ausgedrfiickte Aussage, also ,,drei ist grSi~er als zwei", zu seiner Wissensbasis hinzufiigt. Ob B dies tut, bleibt ihm aber letztlich tiberlassen, da Autonomie ein kennzeichnendes Merkmal fiir Softwareagenten darstellt. Ein einfacher Dialog, in dem Agent A von Agent B erfahren mSchte, ob ein bestimmter Mikrochip grSi~er ist als ein anderer, und B dies best~itigt, wiirde wie folgt lauten: A an B: (ask-if (> (size chipl) (size chip2))) B an A: (reply true)
Die drei Performativnamen t e l l , a s k - i f und r e p l y gehSren zu den reservierten Namen in KQML. Dabei handelt es sich um eine Liste von 41 Namen, 5~ deren Bedeutung eindeutig und systemiibergreifend definiert ist. Jeder Agent, der der KQML-Spezifikation entsprechen soll, muss Performative mit diesen Namen exakt nach der vorgegebenen Definition interpretieren, aber ein KQML-konformer Agent muss nicht alle reservierten Performativnamen interpretieren kSnnen. Auf~erdem ist es zul~sig, fiir konkrete Systeme weitere Performativnamen zu vereinbaren. Die reservierten Performativnamen stellen also keine abgeschlossene Liste dar. Betrachtet man die Liste der reservierten Performative, so zeigt sich, dass sie keine direkten Aufforderungen zu Handlungen in der physischen Umgebung der Agenten enthiilt. Alle Performative sind, wie oben bereits erw~ihnt, so ausgelegt, dass sie sich auf die Wissensbasis des Agenten beziehen. Lediglich (achieve :content), das den Empf~nger auffordert, daf/ir zu sorgen, dass die im Parameter :content enthaltene Aussage wahr wird, legt eine Handlung in der physischen Umwelt nahe, wenn sich die Aussage auf diese Umwelt bezieht. Die Aufforderung, das Licht einzuschalten, falls es gerade ausgeschaltet ist, wiirde also in KQML ungef~hr so lauten: (achieve 5~ Finin et al., 1993, S. 11. In einem Vorschlag filr eine neue Spezifikation von KQML wird eine Liste von 36 Namen genannt, die in drei Gruppen eingeteilt sind, vgl.Labrou und Finin, 1997, S. 7f.
184
5 Automatisierte Verhandlungen zwischen Softwareagenten
( l i g h t on)). Kritisch wird zu diesem Performativ in der Literatur angemerkt, dass es eigentlich auf den Effekt des Sprechaktes zielt und nicht den Sprechakt selbst charakterisiert. 51 Ein weiterer Kritikpunkt an KQML besteht darin, dass die Sprache kein explizites Performativ fiJr Versprechen bereitstellt. Versprechen zukiinftiger Handlungen (oder Unterlassungen) bilden abet die Grundlage jedes Vertrages, also auch der Vertriige, die im elektronischen Gesch~iftsverkehr geschlossen werden. In diesem wichtigen Bereich, der auch das Anwendungsfeld dieser Arbeit umfasst, wird KQML also nur unter Schwierigkeiten einzusetzen sein. Dariiber hinaus wird kritisiert, dass die Menge der Performative zu grof~52 und nicht allgemein genug sei, um als abgeschlossen betrachtet werden zu kSnnen. 53 Aus der in KQML vorgesehenen MSglichkeit, weitere Performative zu definieren, resultiert aber die Schwierigkeit, deren eindeutige Interpretation fiber verschiedene Systeme von verschiedenen Entwicklergruppen hinweg sicherzustellen.
FIPA ACL Die wohl umfassendsten bislang verfiigbaren Spezifikationen zur Kommunikation zwischen Agenten stammen von der FIPA, einer internationalen Organisation mit dem Ziel, durch die offene Entwicklung von Spezifikationen die Interoperabilit~it zwischen Agenten und agentenbasierten Anwendungen zu fSrdern. In frfiheren Versionen der FIPA-Spezifikationen wurde eine Sprache zur Agentenkommunikation (FIPA Agent Communication Language; ACL) geschlossen in einem Dokument dargestellt. 54 Inzwischen wurden die Spezifikationen aufgeteilt in eine Bibliothek von Kommunikationsakten (communicative acts), die den Nachrichtentypen entsprechen, mehrere Sprachen zur Repfiisentation von Wissensinhalten (content languages) und Interaktionsprotokolle (interaction protocols), die die Abfolge von Nachrichten regeln. Letztere werden im Abschnitt 5.1.4.3 n~iher erSrtert. 55 Die Zahl definierter Nachrichtentypen ist mit 22 geringer als in KQML, 51Vgl. Cohen und Levesque, 1995, S. 67. 52Vgl. Covington, 1998, S. 209, wo als LSsung angeregt wird, bestimmte in KQML als unterschiedliche Performative behandelte F~ille statt dessen durch zusatzliche Parameter zu unterscheiden. Vgl. zum Fehlen eines selbstbindenden Performativs ebenfalls Cohen und Levesque, 1995, S. 67. 53Vgl. Moore, 2001, S. 37. 54Vgl. FIPA, 1997. 55Vgl. FIPA, 2002a,c,b.
5.1 Softwareagenten und Multiagentensysteme
185
die Liste der Typen wird jedoch als abgeschlossen betrachtet, eine anwendungsspezifische Erweiterung wie in KQML ist nicht vorgesehen. Die Nachrichtentypen lassen sich in die ffinf Kategorien Informationsfibergabe, Informationsanforderung, Verhandlung, Handlungsdurchfiihrung und Fehlerbehandlung einteilen. Zu einigen Nachrichtentypen gibt es zur Vereinfachung erweiterte Typen, die auch durch die Grundversionen desselben Typs ausgedriickt werden kSnnten. So existieren neben dem Typ Inform auch die Typen Inform If, um den Wahrheitswert einer Aussage zu fibermitteln, und Inform Ref, um einen Namen einem bestimmten Objekt zuzuordnen. Ahnliche Abwandlungen finden sich zu den Typen Query und Request. Die Entwickler der FIPA-Spezifikation gehen damit einen Kompromiss ein zwischen weitgehender Orientierung an der Sprechakttheorie, nach der die genannten Erweiterungen eigentlich keine gesonderten illokutioniiren Kr~fte bilden, und der praktischen Erw~igung, bestimmte Komplikationen in den inhaltlichen Ausdrficken zu vermeiden, indem einzelne erweiterte Nachrichtentypen zugelassen werden. Moore kritisiert mit Blick auf die FIPA ACL zwei Punkte. Zum einen sei die Semantik der Sprache so komplex, dass eine akkurate Implementation in realen Systemen in niiherer Zukunft nicht zu erwarten sei. Zum anderen sei trotz der vollst~indig formalen Definition der Nachrichtentypen eine konsistente Interpretation der Nachrichten durch Systeme verschiedener Entwicklungsteams nicht gewiihrleistet, da ein formales Modell der Interpretation der Nachrichten fehle. 56 FLBC Auch die Formal Language for Business Communication (FLBC) basiert auf der Theorie der Sprechakte, nutzt aber dariiber hinaus weitere Erkenntnisse aus der Linguistik. Als syntaktisches Format der Nachrichten der FLBC wird die Extensible Markup Language (XML) gewiihlt. Die Grundstruktur einer FLBC-Nachricht ist im Folgenden dargestellt: 57
<simpleAct speaker="speaker" hearer="hearer"> content 56Vgl. Moore, 2001, S. 37. 57Vgl. Moore, 2001, S. 44.
186
5 A utomatisierte Verhandlungen zwischen Softwareagenten context
Die Attribute speaker und hearer im Element simpleAct stehen dabei fiir den Sender und den Empf~inger einer Nachricht. Das Element i l l o c t c t kapselt den illokution~en Akt, wobei das Attribut f o r c e den Nachrichtentyp angibt, der hier in enger Anlehnung an die Sprechakttheorie als illokution~ire Rolle bezeichnet wird, mit der die Aussage im Inhaltsbereich content versehen werden soll. Eine Besonderheit des FLBC-Formates besteht in dem separaten Element context, das genutzt wird, um flexible Informationen fiber den Zusammenhang einer Nachricht zu transportieren. Ein Attribut newConv gibt beispielsweise an, ob mit der Nachricht ein neuer Dialog erSffnet wird oder ob es sich um die Fortsetzung eines bereits laufenden Dialoges handelt. Im zweiten Fall gibt das Element inResponseTo an, auf welche friihere Nachricht diese Nachricht antwortet. Auf~erdem sieht FLBC die Nutzung ungeplanter Unterdialoge vor, z.B. um Nachfragen oder Korrekturen beziiglich bestimmter Aspekte eines laufenden Dialoges zu ermSglichen. Hierzu kSnnen, ebenfalls innerhalb des context-Elements, die Elemente interruption, subordination sowie correction genutzt werden. 5s Die Nachrichtentypen der F L B C umfassen neben iiblichen Typen wie inform, offer, question und request auch in anderen A C L uniibliche Typen wie z.B. promise zur expliziten Ubernahme yon Verpflichtungen, advise zur Erteilung yon Ratschl~igen, describe zur ~)bermittlung yon Beschreibungen sowie permit und prohibit zur Erteilung yon Erlaubnissen und Aufstellung yon Verboten. Aufgrund seines hohen Abstraktionsgrades muss der Satz an Nachrichtentypen bzw. illokution~irenKr~ten nach Einsch~itzung des Autors nur in seltenen F~illenan die Erfordernisse neuer Applikationen angepasst werden. 59 Die wesentliche Neuerung in F L B C besteht aber gegenfiber den bisher dargestellten Sprachen zur Agentenkommunikation in der Spezifikation eines formalisierten Mechanismus zur Interpretation der Nachrichten. 6~ Dieser basiert auf einem yon Bach und Harnish entwickelten Sprechaktszenario
58Vgl. Moore, 2001, S. 51.
59Vgl. Moore, 2001, S. 54. 6~
Moore, 2001, S. 45ff.
5.1 Softwareagenten und Multiagentensysteme
187
(Speech Act Scenario; SAS) und wird als FL-SAS bezeichnet. Es handelt sich um eine Folge von Schritten, die jede eingehende Nachricht durchl~uft und w~ihrend derer die Nachricht auf verschiedene Typen von Fehlern gepriift und anschliet~end das Verst~ndnis der Nachricht auf verschiedenen Ebenen gesichert wird. Treten auf einer bestimmten Ebene Probleme auf, kann direkt auf dieser Ebene eine LSsung gesucht werden. Eine Ebene der Prfifung besteht z.B. darin, zu verifizieren, ob alle Begriffe im Inhalt der Nachricht bekannt sind. Ist dies nicht der Fall, kann bereits auf dieser Ebene eine Riickfrage eingeleitet werden. Erst wenn alle Stufen durchlaufen sind, geht das empfangende System davon aus, dass der illokution~ree Akt gegliickt ist und es nun die Intention kennt, die der Sender mit der Nachricht verfolgt. Erst jetzt beginnt der Prozess, in dem der Empf~nger entscheidet, in welcher Weise er auf diesen illokution~ren Akt reagiert, welcher perlokution~re Akt also erfolgt. Den perlokution~ren Akt unterteilt Moore in zwei Phasen, indem er Standardeffekte und erweiterte Effekte unterscheidet. Standardeffekte treten in jedem Fall ein, wenn ein illokutioniirer Akt gegliickt ist. Lautet er z.B. ,~imm an, dass C", so wird der Empf~nger zwei Dinge in seine Wissensbank aufnehmen: zum einen wird er annehmen, dass der Sender will, dass der Empf~nger glaubt, dass die Aussage C wahr ist. Dies gilt in jedem Fall, wenn als Randbedingung des Kommunikationssystems angenommen wird, dass die Agenten immer wSrtlich meinen, was sie sagen. Eine zweites Faktum, das der Empfiinger im Rahmen der Standardeffekte fiir seine Wissensbank in Betracht zieht, ist, dass der Sender glaubt, dass C war ist. Eine ganz andere Frage, die erst im Rahmen der erweiterten Effekte beantwortet wird, besteht darin, ob der Emf~nger kfinftig seinerseits glaubt, dass die Aussage C zutrifft. Weitere A CL Frfihe Vorl~iufer in der Anwendung der Sprechakttheorie im Bereich der Informationssysteme sind die Systeme Coordinator 61 sowie Information Lens. 62 Beide Systeme dienen der Unterstiitzung der Bfirokommunikation, stellen also erweiterte E-Mail-Systeme dar. In beiden F~illen werden jedoch keine autonom handelnden Softwareagenten eingesetzt, sondern es handelt sich um halbautomatische Systeme.
61Vgl. Flores et al., 1988. 62Vgl. Malone et al., 1987.
188
5 Automatisierte Verhandlungen zwischen Softwareagenten
Eine der frfihesten Anwendungen der $prechakttheorie im Bereich der Softwareagenten ist die Sprache AGENT-0, die von Shoham im Rahmen seines Konzepts der agentenorientierten Programmierung diskutiert wird. 63 Dabei handelt es sich um eine interpretierte Programmiersprache fiir Agenten, die zugleich Elemente zum Austausch von Nachrichten zwischen den Agenten vorsieht, wobei davon ausgegangen wird, dass alle an einem System beteiligten Agenten in AGENT-0 programmiert sind oder zumindest darin kommunizieren kSnnen. AGENT-0 enthfilt sowohl Elemente zur Formulierung der Aussage P, n~imlich die sog. Tatsachenaussagen (fact statements), als auch Elemente zur Beschreibung von Handlungen, die sog. Handlungsaussagen (action statements). Die auf die Kommunikation zwischen Agenten ausgerichteten Elemente von AGENT-0 werden als 5ffentliche Handlungen (public actions) bezeichnet und beschr~inken sich auf die vier illukotiven Kr~ifte INFORM, um eine neutrale Information zu iibermitteln, REQUEST, um einen anderen Agenten zu einer Handlung auzufordern, UNREQUEST,um eine Aufforderung zuriickzunehmen und REFI~IN zur Ablehnung einer Verpflichtung, wenn diese nicht erffillt werden kann. 5.1.5.3 Nachrichteninhalte in Agentenkommunikationssprachen Zwei Arten von sprachlichen Konventionen sind zur Repr~entation einer Aussage P erforderlich. Zum einen bedarf es eines Vokabulars, mit dem die Elemente der Systemumwelt benannt werden kSnnen. Solche Vokabulare werden in der kiinstlichen Intelligenz auch als Ontologien bezeichnet. Zum anderen wird ein System von Operatoren benStigt, mit denen einzelne Begriffe zu Aussagen verkniipft werden kSnnen. Als grundlegende Begriffssysteme miissen Ontologien einerseits weit genug gefasst sein, um den Agenten eine Kommunikation fiber alle notwendigen Aspekte der Systemumwelt zu ermSglichen, andererseits miissen die Definitionen mSglichst von allen an einem System beteiligten Agenten gleich interpretiert werden. Es existiert eine Vielzahl von Versuchen, fiir einzelne Fachgebiete oder Branchen allgemein giiltige Ontologien zu spezifizieren. In FBCL, FIPAACL und KQML enthalten die Nachrichten ein Feld, in dem die verwendete 63Vgl. Shoham, 1993, S. 70ft. Unter agentenorientierter Programmierung versteht dieser Autor in erster Linie ein Paradigma fiir die Programmierung, das einen Spezialfall der objektorientierten Programmierung darstellt, vgl. Shoham, 1993, S. 55ff.
5.1 Softwareagenten und Multiagentensysteme
189
Ontologie bzw. das Vokabular angegeben werden kann. Allerdings ist die Bedeutung dieser Felder in den jeweiligen Spezifikationen nicht festgelegt, sondern wird als anwendungsspezifische Vereinbarung betrachtet. 6a
5.1.5.4 Zur Anwendbarkeit von ACL in automatisierten Verhandlungen Bei der Konzeption von ACL muss grunds~itzlich abgewogen werden zwischen dem Umfang und dem Allgemeinheitsgrad der Liste der Nachrichtentypen bzw. illokution~en Rollen und der Komplexit~it der genutzten Wissensrepr~isentationssprache. 65 Eine umfangreichere Liste von Nachrichtentypen ermSglicht einfacher formulierte Aussagen, wfi~hrend wenige, sehr allgemein gehaltene Nachrichtentypen in manchen F~illen komplexere Aussagen erfordern, um der Intention eines Agenten gerecht zu werden. Dariiber hinaus wird auch bei den ACL deutlich, dass sich die ursprfingliche Forschung zu agentenbasierten Systemen haupts~ichlich mit dem Problem des verteilten, aber kooperativen ProblemlSsens beschMtigt. Erst allmfi~hlich werden die zus~itzlichen Probleme beriicksichtigt, die sich bei der Kommunikation zwischen Agenten ergeben, die teilweise oder vollst~indig unterschiedliche Ziele anstreben und ausschlief~lich zur Verfolgung ihrer eigenen Interessen die Kooperation mit anderen Agenten suchen. Eine wesentliche Forderung aller hier vorgestellten ACL besteht darin, dass Agenten nur Nachrichten senden, an deren Inhalt sie selbst glauben. Ffir viele Anwendungen im Bereich des Electronic Commerce geht diese Forderung jedoch zu weit, da es in 5konomischen Situationen h~iufig nStig ist, andere Agenten wenn nicht direkt zu beliigen, so doch fiber die eigenen Ziele und Intentionen im Unklaren zu lassen, um diese bestmSglich verfolgen zu kSnnen. 66 Im konkreten Fall des in dieser Arbeit entwickelten Systems wird ein Nachfrageragent keinerlei Interesse daran haben, seine tats~ichliche Zahlungsbereitschaft dem Anbieteragenten zu offenbaren. Selbst wenn das Verhandlungsprotokoll einen solchen Akt der Pr~iferenzoffenbarung nicht vorsieht, ist es fraglich, ob die Ablehnung eines Angebots, das unterhalb der eigenen Zahlungsbereitschaft liegt, nicht bereits einen Bruch der ,,Ehrlichkeitsbedingung" bedeutet. 64Vgl. Dignum, 2000, S. 8. 65Vgl. Moore, 2001, S. 37ff. 66Vgl. Dignum, 2000, S. 5f. sowie Pitt und Mamdani, 1999, S. 339.
190
5 A utomatisierte Verhandlungen zwischen Softwareagenten
Verdeutlicht man sich noch einmal den urspriinglichen Entstehungszusammenhang der diskutierten ACL, n~imlich Systeme, deren wesentliches Ziel die verteilte LSsung gemeinsamer Probleme ist, dann wird jedoch deutlich, dass die ,,Ehrlichkeitsbedingun~' in diesem Zusammenhang lediglich eine unkritische Vereinfachung der Interpretation eingehender Nachrichten ist. Im Zusammenhang des hier entwickelten Systems beriicksichtigen jedoch beide Seiten, dass sie nicht mit der Ehrlichkeit der Gegenseite rechnen kSnnen, und beziehen dies in ihre Handlungsstrategien ein. Daher ist es im Prinzip mSglich, syntaktische und auch Teile der semantischen Spezifikationen einer bestehenden ACL zu iibernehmen, solange explizit die Einschr~inkung gemacht wird, dass fiir Performative wie inform, request etc. keine ,,Ehrlickeitsbedingung" gilt. 5.2 V e r h a n d l u n g e n zur K o o r d i n a t i o n in M u l t i a g e n t e n s y s t e m e n
Verhandlungen stellen eine der wichtigsten Arten der Koordination in solchen MAS dar, in denen die Agenten vorwiegend an der Erreichung ihrer individuellen Ziele interessiert sind und gemeinsame Ziele keine oder nur eine untergeordnete Rolle spielen. In einem solchen System kSnnen die Agenten nicht ohne Weiteres mit der Kooperation anderer Agenten rechnen, sondern miissen fiir Dienste oder Giiter, die sie von anderen fordern, eine Kompensation bieten. Verhandlungen ermSglichen es den Agenten, sich auf eine f~r alle Seiten akzeptable Transaktion zu einigen. In der Literatur zu Multiagentensystemen wird eine Vielzahl unterschiedlicher Verhandlungssituationen untersucht. Die in Abschnitt 5.2.1 dargestellte Taxonomie gibt einen ersten Uberblick. Anschliet~end wird in Abschnitt 5.2.2 die spezifische Rolle von Verhandlungsprotokollen untersucht, die fiber die Rolle der Konversationsrichtlinien in allgemeinen Dialogen zwischen Agenten hinausgeht.
5.2.1 Taxonomie automatisierter Verhandlungen Ein Schema zur Klassifizierung der verschiedenen Arten von Verhandlungen, die prinzipiell innerhalb von MAS stattfinden kSnnen, liefern Lomuscio, Wooldridge und Jennings. Sie beschreiben sechs Gruppen von Parametern, die einen vieldimensionalen Verhandlungsraum aufspannen; jede Kombination von Auspr~igungen der Parameter charakterisiert einen bestimmten Typ
5.2 Verhandlungen zur Koordination in Multiagentensystemen
191
von Verhandlung. 67
5.2.1.1 Kardinalit~it der Verhandlung Die erste Gruppe von Parametern bezeichnen die Autoren als Kardinalitlit der Verhandlung. Automatisierte Verhandlungen werden in der Literatur als ein verteilter Suchprozess in einem Raum mSglicher Einigungen aufgefasst. 68 Dieser R a u m kann eindimensional sein, also z.B. den Preis als einzige Dimension enthalten, oder viele Dimensionen umfassen, die mSglichen Variationen des Verhandlungsgegenstands und der Konditionen wie z.B. Lieferund Zahlungsbedingungen der angestrebten Transaktion umfassen. Formal ausgedriickt, geht es um die Dimension des Raums der mSglichen Einigungen, den Lomuscio, Wooldridge und Jennings als Verhandlungsdom~ne bezeichnen. Augerdem ist die Kardinalit~it der Interaktion von Bedeutung. Hier ist zu unterscheiden, ob sich lediglich zwei Agenten gegen/iberstehen (Verhandlung im engeren Sinne), ob ein Agent mehreren Kontrahenten konfrontiert ist (z.B. bei einer Auktion) oder ob viele Agenten auf beiden Seiten miteinander verhandeln (z.B. auf einem elektronischen Marktplatz). Dieses Kriterium entspricht, jedenfalls fiir Verhandlungen, die einen Kauf zum Gegenstand haben, 69 der in der Okonomie gebr~iuchlichen Differenzierung der Marktformen in beidseitiges Monopol, Monopol bzw. Monopson sowie Oligopol oder Polypol.
67Vgl. Lomuscio et al., 2003, S. 36ff. Ein anderes Klassifikationsschema ist die von StrSbel und Weinhardt entwickelte Montreal Taxonomy, die such Methoden der elektronischen Unterstiitzung menschlicher Agenten bei Verhandlungen umfasst, vgl. Str6bel und Weinhardt, 2003. 6SVgl. Jennings et al., 2000, S. 24. In der Literatur zu automatisierten Verhandlungen in Multiagentensystemen wird der Begriff Verhandlung in der Regel weiter gefasst als in der Okonomie. Eine Definition von Jennings et. al. lautet z.B. ,,[...] negotiation- the process by which a group of agents come to a mutually acceptable agreement on some matter.", Jennings et al., 2001, S. 199, Hervorhebung im Original. Insbesondere werden such Auktionen unter den Begriff Verhandlung subsummiert, die in der (~konomie meist gesondert betrachtet werden. 69Das hier dargestellte Konzept bezieht sich auch auf F~ille, in denen z.B. Verhandlungen dariiber stattfinden, wie ein gemeinsames Ziel am besten erreicht werden kann, die also nicht unmittelbar in eine Verkaufstransaktion mfinden.
192
5 Automatisierte Verhandlungen zwischen Softwareagenten
5.2.1.2 Merkmale der Agenten In der zweiten Gruppe fassen die Autoren Merkmale der Agenten zusammen. Jeder Agent nimmt eine oder mehrere Rollen im Verhandlungsprozess ein. Ein Agent kann z.B. als K~iufer oder Verk~ufer auftreten oder auch je nach Situation beide Funktionen wahrnehmen. Eine weitere Rolle ist der Intermedi/ir, der lediglich Vermittlungsdienste leistet, ohne selbst K/iufer oder Verldiufer zu sein. Die Rationalit~it der Agenten kann, entsprechend der in der Okonomie fiblichen Unterscheidung, vollkommen oder beschr~inkt sein. Verhandlungssituationen sind auch durch das Wissen unterschieden, das die Agenten fiber den Verhandlungsgegenstand sowie die Pdiferenzen der iibrigen beteiligten Agenten besitzen. Bereits bei der Diskussion spieltheoretischer Verhandlungsmodelle wurde deutlich, dass die F~ihigkeit zur Selbstbindung (engl. commitment), z.B. der Verzicht darauf, ein abgegebenes Angebot sp/iter noch einmal zu revidieren, eine wichtige Eigenschaft der Agenten darstellt. Auch das soziale Verhalten der Agenten auf einer Skala von rficksichtslosem Egoismus fiber ein Verhalten, das einen Ausgleich zwischen eigenen und fremden Interessen sucht, bis hin zu purem Altruismus stellt einen Parameter der Verhandlungssituation dar. In engem Zusammenhang zu den bisher genannten Merkmalen der Agenten steht die Strategie, die ihrem Verhandlungsverhalten zugrunde liegt. MSgliche Annahmen bzw. normative Forderungen hinsichtlich der Strategie sind z.B. individuelle Rationalit/it, also die Vermeidung von Handlungen, die zum eigenen Nachteil sind, oder zeitliche Konsistenz, also die Ausrichtung mehrerer aufeinander folgender Handlungen auf ein bestimmtes Ziel.
5.2.1.3 Merkmale der Umgebung und der Gfiter Die Umgebung der Verhandlung kann statisch oder dynamisch sein, je nachdem, ob sich wichtige Zustandsvariablen im Verlauf der Verhandlung ~kndern oder nicht. Zur Umgebung gehSrt auch die Beschaffenheit der Gfiter, fiber die verhandelt wird, und ihr privater Wert fiir die einzelnen Agenten sowie ihr 5ffentlicher Wert, also der Wert fiir die Gesamtheit der Agenten.
5.2 Verhandlungen zur Koordination in Multiagentensystemen
193
5.2.1.4 Ereignisparameter Zu den Aspekten, die Lomuscio, Wooldridge und Jennings in der Gruppe der Ereignisparameter zusammenfassen, geh6ren Regeln darfiber, welche Gebote als gfiltig betrachtet werden, ob Gebote in einer Verhandlung mit mehr als zwei Agenten ffir andere Agenten sichtbar sind, fiber zeitliche Vorgaben, wann Ergebnisse erreicht werden miissen und wann Informationen fiber den gegenw/irtigen Stand einer Verhandlung an andere Marktteilnehmer weitergegeben werden. 5.2.1.5 Informationsparameter
Informationsparameter beziehen sich auf die MSglichkeit, vor oder w~i~hrend der Verhandlungen neben den Geboten weitere Informationen zu iibermitteln. Dabei kann es sich z.B. um unverbindliche Richtpreise handeln, die ein Verl54ufer auf Anfrage eines K~iufers vor Beginn der eigentlichen Verhandlung nennt. Auch vergangenheitsbezogene Informationen wie die Geschichte bereits abgeschlossener Transaktionen stellen wichtige Informationsquellen dar, allerdings bedarf es zus/itzlicher institutioneller Vorkehrungen in einem Verhandlungssystem, um solche Informationen zu sammeln, z.B. in Form einer unparteiischen Instanz, der jeder erfolgreiche Abschluss gemeldet werden muss. Schlie~lich beziehen die Autoren in die Kateogrie der Informationsparameter auch solche Mitteilungen ein, die als Argumente in Verhandlungen zwischen Menschen eine Rolle spielen kSnnen und mit denen z.B. begrfindet wird, warum ein bestimmtes Angebot nicht angenommen wird (,,Letztes Mal habe ich auch einen besseren Preis bekommen, warum diesmal nicht?"). 5.2.1.6 Allokationsparameter In Verhandlungen mit mehr als zwei Teilnehmern, insbesondere bei Auktionen, werden Regeln benStigt, nach denen ermittelt wird, welche Gebote zum Zuge kommen und wie der tats~ichliche Transaktionspreis ermittelt wird.
5.2.2 Verhandlungsprotokolle Verhandlungsprotokolle legen fest, welche Typen von Teilnehmern eine bestimmte Verhandlung umfasst, welche verschiedenen Zust~inde die Verhand-
194
5 Automatisierte Verhandlungen zwischen Softwareagenten
lung einnehmen kann, welche Ereignisse die Verhandlung veranlassen, in einen anderen Zustand zu wechseln, und schlief~lich, welche Aktionen die Teilnehmer in welchem Zustand der Verhandlung ausffihren kSnnen, also wer welche Nachrichten an wen in welcher Phase senden darf. Auf die allgemeine Funktion solcher Konversationsrichtlinen in der Kommunikation zwischen Softwareagenten wurde bereits im Abschnitt 5.1.4.3 eingegangen. In Verhandlungen kommt dem Protokoll noch eine weitere wichtige Funktion zu. In manchen F~illen ist es mSglich, durch eine geeignete Ausgestaltung des Protokolls bestimmte erwfinschte Ergebnisse eines Verhandlungsprozesses sicherzustellen. Die Grundlage dieser Uberlegungen bildet der im Rahmen der Spieltheorie entwickelte Entwurf von Mechanismen. Zu den wfinschenswerten Eigenschaften von Protokollen gehSren u.a. die folgenden: 70
Garantierter Erfolg Verhandlungen unter einem Protokoll mit dieser Eigenschaft ffihren immer zu einer Einigung. Maximierung der sozialen Wohlfahrt Die Summe der Nutzen der einzelnen Agenten ist bei Einigungen, die unter einem Protokoll mit dieser Eigenschaft zustande kommen, immer maximal. Paretoefiizienz Einigungen, die unter einem Protokoll mit dieser Eigenschaft erzielt werden, kSnnen nicht so ver~indert werden, dass ein einzelner Agent einen grSf~eren Nutzen erh~lt, ohne dass gleichzeitig mindestens ein anderer Agent schlechter gestellt wird. Individuelle Rationalit~it Protokolle mit dieser Eigenschaft werden von den Agenten im eigenen Interesse befolgt. Ohne diese Eigenschaft wfirden sich Agenten an einer Verhandlung unter diesem Protokoll nicht freiwillig beteiligen.
Stabilit~it Das Protokoll gibt jedem Verhandlungsteilnehmer Anreize, sich in einer bestimmten Weise zu verhalten. Eine Verhandlung ist z.B. stabil, wenn ein (ffir die Agenten identifizierbares) Nash-Gleichgewicht exisitert. Wenn ein Protokoll stabil ist, kSnnen die Strategien der Agenten bereits beim Entwurf eines Systems vorgegeben werden. 7~
Sandholm, 1999, S. 202ff. sowie Rosenschein und Zlotkin, 1994, S. 20f.
5.2 Verhandlungen zur Koordination in Multiagentensystemen
195
Einfachheit Ein Protokoll mit dieser Eigenschaft erlaubt es den Agenten, mit ihrer verffigbaren beschr/inkten Rechenkapazit/it eine optimale Strategie zu ermitteln. Verteiltheit Ein Protokoll sollte es vermeiden, einen einzelnen Agenten in eine zentrale Position zu riicken, so dass die Fortsetzung der Verhandlung bei einem eventuellen Ausfall dieses Agenten gef~hrdet w~e. Auf~erdem sollte der Kommunikationsanfwand zwischen den Agenten minimiert werden.
5.2.3 Entscheidungsmodelle fiJr Agenten in automatisierten Verhandlungen 5.2.3.1 Handlungsoptionen Ziel einer Verhandlung ist es, im Einigungsraum dieser Verhandlung einen Punkt zu finden, in dem die Auspr/igungen s~xntlicher Parameter der Transaktion fiir alle Beteiligten akzeptabel sind. Jeder Teilnehmer an der Verhandlung betrachtet eine bestimmte Region des Einigungsraums zu Beginn als akzeptabel. Im Gegensatz zu den oben dargestellten spieltheoretischen Verhandlungsmodellen wird hier aber nicht angenommen, dass diese Region fiber die gesamte Dauer der Verhandlung hinweg fixiert ist, sondern sie kann sich im Verlauf der Verhandlung ausdehnen, zusammenziehen oder verschieben, z.B. wenn die Agenten Ver/inderungen in der Umwelt wahrnehmen oder wenn sie sich durch Argumente iiberzeugen lassen, ihre Ansichten zu/indern. Die minimalen F~ihigkeiten, die Agenten besitzen miissen, um an einer Verhandlung teilzunehmen, bestehen zum einen darin, einen Ausschnitt des Einigungsraums als akzeptabel vorzuschlagen, also ein Angebot zu unterbreiten, und zum anderen darin, anf ein solches Angebot zu antworten und mitzuteilen, ob das Angebot akzeptabel ist. 71 Angebote k6nnen dabei entweder yon friiher w/ihrend der Verhandlung abgegebenen Angeboten abh/ingig sein, oder vollkommen unabh~ngig voneinander formuliert werden. In manchen F/illen kann die Effizienz des Verhandlungsprozesses gesteigert werden, wenn die Agenten weitere F~aigkeiten besitzen. So ist es, besonders bei einem mehrdimensionalen Einigungsraum, vorteilhaft, wenn die Antwort auf 71Vgl. Jennings et al., 2000, S. 25f.
196
5 Automatisierte Verhandlungen zwischen Softwareagenten
ein Angebot nicht nur in einer Zustimmung oder Ablehnung besteht, sondern auch angibt, welcher Aspekt des Einigungsvorschlags aus Sicht des antwortenden Agenten nicht akzeptabel ist. Dazu existieren zwei MSglichkeiten: eine Kritik des aktuellen Angebots oder ein Gegenangebot. Eine Kritik macht zum einen Beschr~inkungen beziiglich bestimmter Dimensionen des Einigungsraums deutlich und signalisiert zum anderen Zustimmung oder Ablehnung in Bezug auf einzelne Aspekte des aktuellen Angebots. Ein Agent kann so z.B. ausdriicken, dass er mit dem geforderten Preis einverstanden ist, aber ein friiheres Lieferdatum wiinscht. Ein Gegenangebot bezeichnet dagegen einen anderen Punkt bzw. eine andere Region im Einigungsraum, die fiir den antwortenden Agenten vorteilhafter sind als das urspriingliche Gebot. Auch daraus kann der Sender des urspriinglichen Angebots Rfickschlfisse fiir die Formulierung weiterer Gegenangebote ziehen. In einem Teil der Literatur zu automatisierten Verhandlungen werden Agenten mit noch weiter gehenden F~i~higkeiten betrachtet, wobei versucht wird, typische Verhaltensweisen menschlicher Agenten in Verhandlungen auf die Softwareagenen zu iibertragen. 72 Einerseits kann eine von einem Agenten signalisierte BeschrKnkung des Einigungsraums hinsichtlich einer bestimmten Dimension von seinem Gegeniiber unter UmstKnden leichter akzeptiert werden, wenn eine Rechtfertigung dafiir vorliegt. Eine Rechtfertigung kann z.B. in bestimmten objektiven Gegebenheiten bestehen, etwa dass ein Produkt momentan nicht auf Lager ist und daher ein Liefertermin vor einem bestimmten Datum ausscheidet oder dass eine bestimmte Bedingung, z.B. eine bestimmte Form der Rabattgew~ihrung, gesetzeswidrig w~ire. Eine weitere mSgliche F~ihigkeit eines Agenten besteht darin, die fiir den Verhandlungspartner akzeptable Region des Einigungsraumes im eigenen Sinne zu ver~indern, indem er dessen Wahrnehmung der Verhandlungssituation beeinflusst. Dies kann z.B. dadurch geschehen, dass neue Aspekte f~r die Beurteilung des Einigungsraumes durch den Kontrahenten in die Diskussion gebracht werden, indem z.B. neben der Motorleistung auch die Sicherheitsausstattung eines Autos hervorgehoben wird, oder indem den Konditionen neue Aspekte hinzugefiigt werden, z.B. der kostenlose Einbau eines Radios bei sofortigem Gesch~iftsabschluss. 72Vgl. z.B. Kraus et al., 1998, S. 2f. und S.62ff. sowie Sierra et al., 1998.
5.2 Verhandlungen zur Koordination in Multiagentensystemen
197
5.2.3.2 Spieltheoretisch motivierte Entscheidungsmodelle Dom~nenorientiertes Modell Rosenschein und Zlotkin gehSren zu den ersten, die spieltheoretische ~Iberlegungen auf das Problem der Koordination in MAS anwenden. 73 Die Basis ihrer Arbeit bilden die oben bereits dargestellten 0berlegungen zum Entwurf anreizkompatibler Mechanismen (vgl. Abschnitt 4.7). Ihre Vorstellung ist, dass Vertreter der verschiedenen Unternehmen, die an der Entwicklung von Agenten ffir eine bestimmte Verhandlungsdom~ine interessiert sind, ein Gremium bilden, dessen Ziel es ist, Verhandlungsmechanismen ffir die Interaktion der zu entwickelnden Agenten festzulegen. Das Ziel ihrer eigenen Arbeit sehen die Autoren darin herauszuarbeiten, welche Verhandlungsmechanismen ffir bestimmte Typen von Verhandlungsdom~nen geeignet sind. Mit diesem Wissen kSnnen Agentenentwickler bei der Auswahl passender Mechanismen beraten werden. TM Wenn einmal eine Festlegung auf einen bestimmten Mechanismus erfolgt ist und das in diesem Mechanismus angewandte Protokoll die Eigenschaft der Stabilit~t (vgl. Abschnitt 5.2.2) aufweist, also ffir jeden Agenten jeweils eine optimale Strategie existiert, vorausgesetzt, die anderen Agenten wenden ihre optimale Strategie an, und wenn die optimalen Strategien bereits zum Zeitpunkt des Entwurfs bekannt sind, dann geniigt es, die Agenten jeweils mit der optimalen Strategie zu programmieren, statt sie mit der wesentlich komplizierteren F~ihigkeit auszustatten, eine optimale Strategie w~ihrend der Laufzeit des Systems zu ermitteln. Bei der Ableitung ihrer Ergebnisse treffen die Autoren eine Reihe von Annahmen: 7~
1. Nutzenmaximierung: Die Agenten versuchen, ihren Erwartungsnutzen zu maximieren. 2. Vollst~ndige Information: 76 Die Agenten verffigen fiber alle relevanten 73Ffir einen umfassenden 0berblick fiber ihre Arbeit vgl. Rosenschein und Zlotkin, 1994. Bestimmte Aspekte werden in einer Reihe von Artikeln n~her ausgeffihrt, vgl. Zlotkin und Rosenschein, 1989, 1991, 1996b,a,c. 74Vgl. Rosenschein und Zlotkin, 1994, S. 4f. 75Vgl. Zlotkin und Rosenschein, 1996a, 162. 76Die Autoren verwenden den der Terminologie der KI entsprechenden Ausdruck ,,vollst~ndiges Wissen", der hier aber ~iquivalent zu dem in der Okonomie gebr~iuchlichen Begriff der Information ist.
198
5 Automatisierte Verhandlungen zwischen Softwareagenten
Informationen. 3. Isolierte Verhandlung: Ein Agent kann sich in einer laufenden Verhandlung nicht zu einem bestimmten Verhalten in kiinftigen Verhandlungen verpflichten. Auf~erdem kann er nicht erwarten, dass sein gegenw~tiges Verhalten zukiinftige Verhandlungen bzw. das Verhalten anderer Agenten in zukiinftigen Verhandlungen beeinflusst. 4. Zweiseitige Verhandlung: In Situationen, in denen mehrere Agenten aufeinander treffen, finden die Verhandlungen immer paarweise zwischen zwei Agenten statt. 5. Symmetrische F~ihigkeiten: Alle Agenten sind in der Lage, dieselbe Menge von Operationen zu identischen Kosten auszufiihren. 6. Vergleichbarkeit von Nutzeneinheiten: Die Nutzeneinheiten eines Agenten sind mit denen des anderen Agenten vergleichbar. 77 oo
7. Keine explizite Ubertragung von Nutzen: Die betrachteten Einigungen kommen ohne explizite Zahlungen des einen Agenten an den anderen zustande. Eine 13bertragung von Nutzen kann aber implizit dadurch stattfinden, dass ein Agent zur Erreichung eines Endzustandes mehr beitr~igt als der andere. Rosenschein und Zlotkin unterscheiden drei verschiedene Typen von Verhandlungsdom/inen, wobei der erste Typ eine Untermenge des zweiten und der zweite eine Untermenge des dritten Typs darstellt: 7s
Aufgabenorientierte Domlinen (engl. task oriented domains) Jeder Agent hat eine bestimmte Menge von Aufgaben auszufiihren und verfiigt fiber die dazu benStigten F~ihigkeiten und Ressourcen. Es gibt keine negative Beeinflussung der Handlungen der Agenten untereinander (Skonomisch ausgedrfickt also keine externen Effekte). Allerdings gibt es F~ille, in denen ein bestimmter Agent ohne oder mit geringem Zusatzaufwand Aufgaben anderer Agenten mit erffillen kann. Verhandlungen finden in dieser Situation ausschlief~lich dazu statt, eine gegenseitig vorteilhafte Verteilung der Aufgaben zwischen den Agenten auszuhandeln. 77Vgl. Rosenschein und Zlotkin, 1994, S. 126. 78Vgl. Rosenschein und Zlotkin, 1994, S. 19f.
5.2 Verhandlungen zur Koordination in Multiagentensystemen
199
Zustandsorientierte Domiinen (engl. state oriented domains) Jeder Agent hat die Aufgabe, die Umwelt von einem bestimmten Anfangszustand in einen gewiinschten Zielzustand zu bringen. In dieser Art von Dom~inen existiert die MSglichkeit von Konflikten zwischen den Agenten. Diese kSnnen sich sowohl auf den Einsatz der verfiigbaren Ressourcen beziehen als auch auf den angestrebten Zielzustand. Eine Variante besteht darin, dass zwar ein Zielzustand existiert, der alle Agenten zufrieden stellt, dass die Erreichung dieses Zustands aber von einzelnen Agenten mehr Aufwand verlangt, als sie leisten miissten, um einen Zustand zu erreichen, der sie individuell zufrieden stellt. Uber die Aufgabenverteilung hinaus wird hier auch dariiber verhandelt, welchef Zustand tats~ichlich realisiert werden soll. Wertorientierte Domlinen (engl. worth oriented domains) Hier ordnen die Agenten jedem potenziellen Zustand der Umwelt einen bestimmten Wert 79 zu, womit von den drei Typen dieser Typ die grSt~te Ahnlichkeit zur 5konomischen Nutzentheorie aufweist. Es handelt sich um eine Generalisierung der zustandsorientierten Dom~inen, in denen allen Zust~inden aui~er den unmittelbaren Zielzust~inden der Agenten der Wert 0 zugeordnet ist. In wertorientierten Dom~inen kSnnen die Agenten entscheidungstheoretische Verfahren anwenden. Aut~erdem haben sie die MSglichkeit, Kompromisse hinsichtlich des Erreichungsgrades ihrer Ziele einzugehen. Fiir zustandsorientierte Dom~inen identifizieren die Autoren vier verschiedene Situationen, die sich darin unterscheiden, ob die Agenten von der Anwesenheit eines anderen Agenten profitieren oder nicht: 8~ 9 Eine symmetrisch kooperative Situation liegt vor, wenn beide Agenten v o n d e r Zusammenarbeit profitieren. In aufgabenorientierten Dom~inen ist dies der Normalzustand. 9 Eine symmetrische Kompromisssituation liegt vor, wenn eine oder mehrere Einigungen existieren, die fiir beide Agenten individuell ra79Die Autoren definieren Weft (engl. worth) als die maximalen erwarteten Kosten, die ein Agent zu tragen bereit ist, um ein bestimmtes Ziel zu erreichen, Nutzen (engl. utility) definieren sie als die Differenz zwischen Wert und tats~ichlichen Kosten, vgl. Rosenschein und Zlotkin, 1994, S. 104. S~ Rosenschein und Zlotkin, 1994, S. 105.
200
5 A utomatisierte Verhandlungen zwischen Softwareagenten
tional sind, aber beiden einen geringeren Nutzen bringen, als wenn sie allein w~ren. 9 In einer asymmetrischen Situation profitiert der eine Agent von der Anwesenheit des anderen, wfihrend der andere lieber allein w~e. 9 Ein Konflikt besteht, wenn keine individuell rationale Einigung ffir die Agenten existiert. Die Autoren konzentrieren sich auf Verhandlungsmechanismen, die zu Einigungen fiihren, bei denen das Produkt der Nutzen maximiert wird, die den Agenten aus der Verhandlung entstehen. Dieses Kriterium entspricht der Nash-LSsung, die in Abschnitt 4.3 diskutiert wurde, sl Sollte es mehrerere mSgliche Einigungen geben, die das Produkt der Nutzen maximieren, wird diejenige ausgew~ihlt, die gleichzeitig die Summe der Nutzen maximiert. Genfigen auch diesem Kriterium mehrere Einigungen, so wird eine dieser Einigungen per Zufall ausgewfi~hlt.82 Das dom~nenorientierte Modell wird vervollst~indigt durch eine Hierarchie von Einigungstypen, 83 die auf ihre Eigenschaften in den oben dargestellten vier Situationen hin untersucht werden. Der einfachste Einigungstyp sind sog. reine Einigungen (engl. pure deals), in denen jeder Agent i seinen Teilplan Pi eines sog. verbundenen Plans (P1,P2) ausfiihrt. Ein Teilplan bezeichnet eine Folge von auszufiihrenden Aktionen. Neben den Teilpl~iaen ffir beide Agenten enth~lt ein verbundener Plan eine Vereinbarung fiber die zeitliche Koordination der Handlungen, damit wirklich der angestrebte Zustand erreicht wird. 84 In kooperativen Situationen existiert immer ein verbundener Plan, der effizient ist. 85 Allerdings kann der Fall eintreten, dass ein effizienter Plan nicht indivduell rational ist, da einer der beiden Agenten mehr leisten muss, damit der Zustand erreicht wird, in dem die Ziele 81Zlotkin und Rosenschein heben hervor, dass sie in ihren Arbeiten, im Gegensatz zum iiblichen Vorgehen in der Spieltheorie, eine diskrete Verhandlungsdom~ne annehmen, vgl. Zlotkin und Rosenschein, 1989, S. 912f. Allerdings fiihren sie einige Seiten sp~iter (S. 915) sog. gemischte Einigungen ein, die eine Randomisierung zwischen zwei diskreten Einigungen darstellen, womit die Menge mSglicher Einigungen kontinuierlich wird. 82Vgl. Rosenschein und Zlotkin, 1994, S. 50f. 83Vgl. Rosenschein und Zlotkin, 1994, S. 125f. 84Vgl. Zlotkin und Rosenschein, 1991, S. 1318. 85Falls keine bessere Kooperationsm6glichkeit besteht, kSnnen die Agenten einfach ihre jeweiligen Ziele getrennt voneinander realisieren, da ein Zielkonflikt in dieser Situation ja per definition nicht besteht.
5.2 Verhandlungen zur Koordination in Multiagentensystemen
201
beider Agenten erreicht werden, als er leisten mfisste, wenn er nur sein eigenes Ziel erreichen wollte. Diese Schwierigkeit l~st sich, unter Rfickgriff auf die Annahme, dass die Agenten fiber identische F~ihigkeiten verffigen, durch sog. gemischte Einigungen (engl. mixed deals) fiberwinden. Eine gemischte Einigung (P1, P2) : p besagt, dass mit der Wahrscheinlichkeit p der verbundene Plan (P1, P2) ausgeffihrt wird und mit der Wahrscheinlichkeit (1 - p ) der verbundene Plan (P2, P1). In jedem Fall wird somit derselbe Zustand erreicht. Die erwarteten Kosten kSnnen aber durch den Parameter p kontinuierlich zwischen den Agenten aufgeteilt werden. Die tats~ichliche Verteilung der Kosten erfolgt symmetrisch in Bezug auf die von den Agenten ffir ihre jeweiligen Ziele behaupteten Nutzen. In Situationen, in denen einer der Agenten oder beide einen Kompromiss eingehen mfissen, sind weder reine noch gemischte Einigungen mSglich. In diesen F~illen mfissen die Agenten auf sog. halbkooperative Einigungen (eng. semi-cooperative deals) zurfickgreifen. Eine solche Einigung weist die Struktur (t, (P1, P2), q) auf, wobei t einen Zwischenzustand bezeichnet, den beide Agenten gemeinsam durch die Ausffihrung des verbundenen Plans (P1, P2) erreichen, bevor mit der Wahrscheinlichkeit q das Ziel von Agent 1 realisiert wird und mit Wahrscheinlichkeit (1 - q ) das Ziel von Agent 2. Die Kooperation bis zum Zustand t i s t ffir beide Agenten individuell rational, wenn ihre Chance grofg genug ist, dass anschliefoend ihr Ziel realisiert wird. Die allgemeinste Form von Einigungen stellen sog. Mehrplan-Einigungen (engl. multi-plan deals) dar. Der Nachteil von halbkooperativen Einigungen liegt darin, dass nach dem Zufallsereignis, das entscheidet, wessen Ziel schliefglich realisiert wird, keine Kooperation mehr stattfindet. Es kann aber ffir beide Agenten wfinschenswert sein, dass der jeweils andere ihnen bei der Realisierung des eigenen Ziels hilft. In Mehrplan-Einigungen wird vorab per Zufall zwischen zwei gemischten Einigungen 51 und 52 entschieden, wobei 51 das Ziel von Agent 1 realisiert und 52 dasjenige von Agent 2. Solange an allen oben getroffenen Annahmen festgehalten wird, existiert aufger in der Konfliktsituation immer eine effiziente Mehrplan-Einigung, die stabil und individuell rational ist. Die Autoren weisen jedoch selbst darauf hin, dass insbesondere die Annahme vollst~indiger Informationen problematisch ist. Es zahlt sich n~imlich ffir einen Agenten aus, den Wert, den ein bestimmtes Ziel ffir ihn hat, zu untertreiben, da er auf dieser Weise erwarten kann, dass ihm in der resultie-
202
5 A utomatisierte Verhandlungen zwischen Softwareagenten
renden Einigung ein geringerer Anteil an der Verwirklichung des verbundenen Plans zugewiesen wird. 86 Daher untersuchen die Autoren auch den Fall unvollstgndiger Informationen. Sie ffihren dazu eine weitere Verhandlungsrunde vor dem produktmaximierenden Mechanismus ein, in der die Agenten simultan ihre Ziele und die ihnen zugeordneten Werte offenlegen sollen. Auf der Grundlage der Ergebnisse dieses Offenbarungsmechanismus wird dann eine Einigung mittels des produktmaximierenden Mechanismus getroffen. In einigen F~illen haben die Agenten einen Anreiz, in der vorgeschalteten Offenbarungsrunde nicht die Wahrheit zu sagen. Im Idealfall gleichen sich die Ergebnisse der Falschaussagen beider Agenten vollkommen aus, so dass weder die Symmetrie noch die Effizienz des Mechanismus leidet. In anderen Fgllen wird zwar die Verteilung vergndert, aber dennoch ein effizientes Ergebnis erzielt. Schlieglich existieren auch Situationen, in denen bei unvollstgndiger Information kein effizientes Ergebnis mehr erreicht wird. Im Rahmen der in dieser Arbeit diskutierten Fragestellung fiihrt die Theorie von Rosenschein und Zlotkin nicht weiter als die spieltheoretischen 0berlegungen zum Entwurf anreizkompatibler Mechanismen. Der hauptsgchliche Beitrag dieser Theorie liegt in der Anwendung der spieltheoretischen Uberlegungen auf abstrakte Problemsituationen, wie sie fiblicherweise im Bereich der KI untersucht werden. Dazu gehSren z.B. die Optimierung der Aufgabenverteilung bei der Auslieferung von Sendungen (ein graphentheoretisches Problem) und eine sog. Blockwelt, in der die Agenten bestimmte Muster aus B15cken auf einer Menge von Abstellflgchen erzeugen miissen. Unvollstgndige Information wird hier nur fiir symmetrische Situationen untersucht, in denen ein Offenlegungsmechanismus zumindest in einigen F~illen eine Verbesserung bringen kann.
Nicht-kooperative mehrstufige Verhandlungsmodelle Die Arbeiten von Sarit Kraus und einigen anderen Autoren sind ebenfalls direkt von spieltheoretischen Modellen beeinflusst, in diesem Fall von Rubinsteins oben diskutiertem Verhandlungsmodell mit abwechselnden Geboten (vgl. Abschnitt 4.4). 87 Auch hier liegt der wesentliche Beitrag der Forschung in der 0bertragung der sehr abstrakten spieltheoretischen Konzepte auf bestimmte re86Vgl. Rosenschein und Zlotkin, 1994, S. 131ft. 87Vgl. Kraus, 2001, S. 17ft.; diese Monographie liefert auch einen umfassenden 0berblick fiber diese Forschungsrichtung.
5.2 Verhandlungen zur Koordination in Multiagentensystemen
203
alt/itsn~ihere, wenngleich in der Regel noch immer vereinfachte Problemstellungen. Kraus untersucht u.a. die Aufteilung von Datenbest/inden in verteilten Datei- bzw. Datenbanksystemen, die Allokation von Ressourcen mit einem und mehereren relevanten Attributen und die Verteilung von Aufgaben. W~ihrend Rosenschein und Zlotkin, ihre Ergebnisse mittels formaler Beweise und einfacher Beispiele demonstrieren, nutzt Kraus zus/itzlich Simulationen zum Vergleich von Implementierungen der verschiedenen diskutierten Verhandlungsmechanismen. Besonderen Wert legt Kraus auf die Konstruktion der Nutzenfunktionen der Agenten, die in friiheren Arbeiten meist nicht nfi~her diskutiert, sondern als bekannt vorausgesetzt worden seien, ss Sie untersucht die Entwicklung von Nutzenfunktionen am Beispiel der einzelnen untersuchten Verhandlungsdom/inen, wobei sie folgende grunds/itzliche Kategorien unterscheidet: 9 Feste Kosten bzw. Gewinne pro Zeiteinheit, 9 eine konstante Diskontierungsrate, 9 ein extern (durch das Finanzsystem) vorgegebener Zinssatz sowie 9 feste Kosten pro Zeiteinheit bei einem endlichen Zeithorizont. Ihre Ergebnisse beziiglich m6glicher Einigungen in diesen F~illen entsprechen weitgehend dem, was bereits in Abschnitt 4.4.6 diskutiert wurde. Den Fall unvollst/indiger Informationen behandelt die Theorie ebenfalls, s9 Auch hier wird dem Verhandlungsmechanismus mit vollst/indiger Information ein Offenbarungsmechanismus vorangestellt und untersucht, in welchen Situationen die Agenten Anreize zu Falschaussagen haben und wie sich diese auf die Eigenschaften des Verhandlungsmechanismus auswirken. Der wesentliche Beitrag der Forschungen von Kraus liegt ebenfalls in der konkretisierenden Anwendung bekannter spieltheoretischer Konzepte auf die Problemstellungen und in der Terminologie der verteilten KI. Wesentliche neue Erkenntnisse fiir die spezifische Fragestellung dieser Arbeit lassen sich auf der inhaltlichen Ebene nicht identifizieren. Allerdings wird auch in der vorliegenden Arbeit die Methode der Simulation genutzt, um die Ergebnisse eines bestimmten Verhandlungsmechanismus' zu evaluieren. 88Vgl. Kraus, 2001, S. 20f. 89Vgl. Kraus, 2001, S. 57-59, S. 64-66, S. 80-93 und S. 192-207.
204
5 Automatisierte Verhandlungen zwischen Softwareagenten
5.2.3.3 Heuristische Entscheidungsmodelle
Kasbah Einer der frfihesten Prototypen eines MAS, in dem Agenten miteinander in Kontakt treten, um fiber den Austausch von Gfitern zu verhandeln, ist Kasbah, das am Media Lab des Massachussets Institute of Technology entwickelt wurde. Die Entwickler stellen das System als eine Art Weiterentwicklung des Kleinanzeigenteils in einer Zeitung dar, bei dem die ,,Anzeigen" Agenten sind, die aktiv nach mSglichen Austauschpartnern suchen. Ein menschlicher Benutzer erzeugt einen Agenten, indem er eine Reihe von Parametern angibt, die seine Pr~iferenzen hinsichtlich des angestrebten Gesch~ifts charakterisieren. Zun~chst ist der angebotene bzw. gesuchte Gegenstand zu beschreiben. In dem Prototypen von Kasbah werden die Tauschobjekte durch Spielkarten repr~entiert, die sich durch zwei Angaben, Wert und Farbe, vollst~indig beschreiben lassen. Seine Preisvorstellungen gibt ein Benutzer dem Agenten in Form von zwei Werten bekannt: der Preis, den der Benutzer gerne erzielen bzw. bezahlen wfirde und der minimale Verkaufs- bzw. der maximale Kaufpreis, den er gerade noch akzeptieren wfirde. Darfiber hinaus gibt der Benutzer den Zeitpunkt an, zu dem der Agent sp~itestens eine Einigung erzielen soll, sowie eine Verhandlungsstrategie, die beschreibt, wie der Agent im Zeitablauf seine Preisgebote anpassen soll. Hier wird zwischen einem linearen, quadratischen oder kubischen Verlauf unterschieden, der ffir einen Verk;4uferagenten jeweils fallend, ffir einen K~iuferagenten dagegen steigend verl~iuft. Der Agent gibt dann Angebote ab, die sich entsprechend dem vom Benutzer gew~ihlten Verlauf mit fortschreitender Zeit dem gerade noch akzeptablen Preis ann~ihern. Eine Modifikation des Verlaufs der eigenen Angebote in Reaktion auf die Angebote des anderen Agenten erfolgt nicht.
A VALANCE Das System AVALANCHE (Agent Based Value Chain Experiment) stellt eine Testumgebung zur Erprobung marktlicher Koordination in MAS dar. Ziel ist es, im Sinne des Hayek'schen Katallaxieansatzes Verhandlungen zwischen einzelnen Marktteilnehmern als Ausgangspunkt der Koordination zu untersuchen. 9~ Darin unterscheidet sich das System von solchen elektronischen Marktpl~tzen, bei denen eine zentrale Instanz den Preis 9~
Eymann, 2001, S. 136.
5.2 Verhandlungen zur Koordination in Multiagentensystemen
205
bestimmt, der Angebot und Nachfrage ins Gleichgewicht bringt. AVALANCHE bezieht sich daher normalerweise nicht auf monopolistische Angebotssituationen, sondern wird zur Abbildung einer polypolistischen Marktstruktur eingesetzt. In diesem Fall haben Agenten die MSglichkeit, einen anderen Transaktionspartner zu suchen, sollte in der Verhandlung mit einem bestimmten Agenten keine Einigung erzielt werden kSnnen. Bei dem Entscheidungsmodell der Agenten handelt es sich um eine stochastische Strategie, bei der das Angebotsverhalten der Agenten durch die Parameter Acquisitiveness, deltaChange, deltaJump, Satisfaction und WeightMemory bestimmt ist. 91 Acquisitiveness gibt die Wahrscheinlichkeit an, dass ein Agent in einer beliebigen Verhandlungsperiode eine Konzession macht, also sein Angebot erhSht, wenn es sich um einen K~iufer handelt oder em~igigt, wenn es sich um einen Verkiiufer handelt. Die prozentuale HShe einer Konzession legt der Parameter deltaChange fest, wobei sich der Prozentsatz auf die Differenz zwischen den Startgeboten beider Parteien bezieht. Geht ein Agent in einer Periode keine Konzession ein, so entscheidet anschliegend sein Gegeniiber, ob er die Verhandlung weiterffihrt oder sie abbricht, wobei der Parameter Satisfaction die Wahrscheinlichkeit eines Abbruchs angibt. Der Wert deltaJump dient dazu, nach dem Erreichen einer Einigung das Verhalten eines Agenten in sp~iteren Verhandlungen anzupassen, indem das kfinftige Einstiegsangebot der in der aktuellen Verhandlung erreichten Einigung angepasst wird. Dabei stellt das kfinftige Einstiegsangebot den um den Prozentsatz deltaJump erhShten (Verkiiufer) bzw. reduzierten (Kiiufer) Einigungspreis der aktuellen Verhandlung an. Neben den bisher erl~iuterten Elementen bilden die Agenten in AVALANCHE eine Erwartung des Marktpreises, indem sie jedes Gebot, das sie von einem anderen Agenten erhalten, mittels einer Gl~ittungsfunktion gewichten und mit dem zuvor erwarteten Marktpreis verkniipfen. Das Gewicht der neu hinzukommenden Information wird durch den Parameter WeightMemory festgelegt. Der erwartete Marktpreis wird von den Agenten genutzt, um nicht ernst gemeinte Gebote zu identifizieren. ,,In AVALANCHE werden Gebote, die offensichtlich fiber das Doppelte des fiblichen Marktpreises hinausgehen, als unseriSs betrachtet und ein einseitiger Verhandlungsabbruch eingeleitet. ''92 Bei Angeboten, die zwischen dem Marktpreis und der genann91Vgl. Eymann, 2001, S. 92Eymann, 2001, S. 159.
156 sowie S. 161.
206
5 Automatisierte Verhandlungen zwischen Softwareagenten
ten Obergrenze liegen, wird die Verhandlung mit der durch den Parameter Satisfaction festgelegten Wahrscheinlichkeit gleich zu Beginn abgebrochen, ohne dass ein Gegenangebot abgegeben wird.
sMESS In einer Erweiterung des AVALANCHE-Ansatzes wird das sogenannte marktplatzspezifische Verhandlungsverhalten ermittelt und bei der Festlegung der konkreten Angebotsfolge berficksichtigt. Das marktplatzspezifische Verhandlungsverhalten wird dabei durch die drei GrSt~en Verhandlungsspielraum, Verhandlungssymmetrie sowie Verhandlungsabbruch repr~isentiert. 93 Unter dem (individuellen) Verhandlungsspielraum wird der Betrag der Differenz zwischen dem Anfangsangebot eines Agenten und dem schliet~lich erreichten Einigungspreis verstanden, die Verhandlungssymmetrie gibt an, wie der gesamte Verhandlungsspielraum, d.h. die Summe der individuellen VerhandlungsspielHiume, auf die beiden Agenten aufgeteilt wird und der marktplatzspezifische Verhandlungsabbruch betrachtet die typischen Verhandlungsspieldiume der Agenten, wenn die Verhandlung abgebrochen wird, indem den abgebrochenen Verhandlungen fiktive Transaktionspreise zugeordnet werden, die erreicht worden w~iren, wenn die Verhandlung fortgesetzt worden w~re. Es wird unterstellt, dass auf einem bestimmten Marktplatz ein statistischer Zusammenhang zwischen jeder der drei eben beschriebenen GrSf~en und dem schlieglich erzielten Transaktionspreis besteht. Die Parameter des Zusammenhangs zwischen Transaktionspreis und den individuellen Verhandlungsspielr~iumen werden in sMESS mittels linearer Regression gesch~itzt.94 Die gesch~itzten Parameter erlauben dann die Berechnung der beiden iibrigen GrSt~en. Als Quelle fiir die benStigten Daten friiherer Transaktionen kommt ein zentraler Dienstleister, ein Bezug von anderen Akteuren oder die eigene Transaktionsgeschichte in Frage. Die Kenntnis des marktplatzspezifischen Verhandlungsverhaltens erlaubt es einem Agenten, ein diesem typischen Verhalten entsprechendes Initialangebot abzuleiten, indem er sein angestrebtes Verhandlungsergebnis als unabh~ingige Variable in die Sch~itzgerade des Zusammenhangs zwischen Transaktionspreis und individuellem Verhandlungsspielraum einsetzt. 95 Umgekehrt kann ein Agent, der ein Initial93Vgl. Sackmann, 2003, S. 107ff. 94Vgl. Sackmann, 2003, S. 108. 95Vgl. Sackmann, 2003, S. 124.
5.2 Verhandlungen zur Koordination in Multiagentensystemen
207
angebot erh~lt und davon ausgeht, dass sich sein Gegeniiber nach der hier beschriebenen Strategie verh~lt, dessen angestrebten Einigungspreis sch~tzen. Dies wiederum erlaubt es, ein erstes Gegenangebot zu ermitteln, das einerseits den marktplatzspezifischen Verhandlungsspielraum voll ausschSpft und andererseits nicht zu einem Abbruch der Verhandlung ffihrt. 96 Das beschriebene Verfahren als Erg~inzung verschiedener Verhandlungsstrategien, z.B. der zuvor beschriebenen Strategie im AVALANCHE-System, genutzt werden, um ein geeignetes Anfangsangebot bzw. ein erstes Gegenangebot zu ermitteln.
Bazaar Eine prototypische Implementierung eines Verhandlungssystems, die dem in dieser Arbeit entwickelten relativ iihnlich ist, ist das System Bazaar, das am Robotics Institute der Carnegie-Mellon-Universit~t entwickelt wurde. Das System orientiert sich an spieltheoretischen Untersuchungen von Verhandlungssituationen, wie sie oben in Kapitel 4 dargestellt wurden, indem der strategische Aspekt der Situation, also die Abh~ingigkeit der Optimalit~t der Entscheidungen eines Agenten von den kfinftigen Handlungen seines Kontrahenten, explizit beriicksichtigt wird. Besonders die Bedeutung sequentieller Modelle von Verhandlungen mit unvollstiindiger Information (vgl. Abschnitte 4.5 und 4.6) wird betont. 97 Den Autoren von Bazaar kommt es darauf an, ein Modell zu schaffen, das zum einen Lernen in Multiagentensystemen und zum anderen Verhandlungen mit komplexeren Dom~inen als reine Preisverhandlungen abbilden kann. Fiinf Punkte halten sie dabei fiir wichtig: 9s (1) Das Modell soll auf eine pr~zise und gleichzeitig effektive Weise den Kontext einer Verhandlung abbilden. (2) Das Modell soll pr~iskriptiv sein, also als Anleitung ffir den Entwurf konkreter Systeme dienen kSnnen. (3) Die benStigte Rechenkapazit~it, um vernfinftige Angebote bzw. LSsungen zu finden, soll sich in durch reale Systeme erreichbaren Grenzen halten, auch wenn daffir evtl. analytische Strenge und die Optimalit~it der gefundenen LSsungen geopfert werden muss. (4) Die Dynamik von Verhandlungen, also ihr zeitlicher Verlauf, soll abgebildet werden, im Gegensatz zu Verfahren, die aus den Anfangsbedingungen einer Verhandlung direkt mSgliche Ergebnisse ableiten, und 96Vgl. Sackmann, 2003, S. 126. 97Vgl. Zeng und Sycara, 1998, S. 127. 98Vgl. Zeng und Sycara, 1998, S. 128.
208
5 Automatisierte Verhandlungen zwischen Softwareagenten
schliet~lich (5) soil das Modell die MSglichkeit bieten, die Lernf'~ihigkeit der beteilitgten Agenten zu beriicksichtigen. Die formale Beschreibung des Bazaar-Modells weist groge ti.hnlichkeit zu einem spieltheoretischen Modell auf. Ein Tupel mit zehn Elementen (N, M, A, A, H, Q, ~, P, C, G)beschreibt eine Verhandlung. Dabei steht N fiir die Menge aller Agenten und M fiir die Menge aller Themen bzw. Aspekte des Verhandlungsgegenstandes, die in den Verhandlungen berficksichtigt werden. Die Menge A bezeichnet eine Menge von Vektoren, die jeden Aspekt einer mSglichen Einigung definieren, die Menge A umfasst alle Angebote, die im Verlauf der Verhandlung mSglich sind. Die Menge H bezeichnet die mSglichen Verhandlungshistorien, wobei Z die Menge der Geschichten ist, die eine Verhandlung beenden. Q : H \ Z ~ N ist eine Funktion, die bestimmt, welcher Spieler nach einer bestimmten Geschichte als n~ichster ein Angebot abgeben darf, in Q manifestiert sich also das Verhandlungsprotokoll. ~ bezeichnet die Menge relevanter Informationsaspekte der Verhandlung, und jeder Agent i E N unterh~ilt nach jedem Verlauf h E H eine subjektive Wahrscheinlichkeitsverteilung Ph,i fiber ~, die sein Wissen zu diesem Zeitpunkt der Verhandlung repr~entiert. Macht Spieler i nach dem Verlauf h ein Angebot a E A, entstehen ihm Kosten in HShe von Ci,h,a, die als Kommunikationskosten oder durch die Handlung verursachte Wartekosten interpretiert werden kSnnen. Gi : ~ • Z ~ R stellt schlie~lich die PrMerenzfunktion des Agenten i dar. Nach einer Geschichte h E H erwartet Agent i den Zustand x E ~ mit der subjektiven Wahrscheinlichkeit Ph,i(x). Damit ergibt sich sein Erwartungsnutzen als E(xh'i) [Gi(X, h)]. Ein Agent, der k Angebote abgegeben hat, bestimmt sein folgendes Angebot in zwei Schritten: Zun~ichst nutzt er die Bayes'sche Regel, um seine subjektive Wahrscheinlichkeitsverteilung fiber die Elemente von ~, also sein Wissen, an die neuesten verfiigbaren Fakten anzupassen. Dann w~ihlt er die Handlung, die - bezogen auf die neue subjektive Wahrscheinlichkeitsverteilung- den maximalen Erwartungswert verspricht. Die Autoren zeigen auf zwei verschiedene Arten, dass die Nutzung der Bayes'schen Regel vorteilhaft ist. Zum einen zeigen sie analytisch, dass ein Agent, der die Bayes'sche Lernstrategie anwendet, in keinem Fall ungiinstigere Ergebnisse erzielt als ein Agent, der dies nicht tut. 99 Zum anderen fiih99Vgl. Zeng und Sycara, 1998, Proposition 1 auf S. 135.
5.2 Verhandlungen zur Koordination in Multiagentensystemen
209
ren sie ein Computerexperiment durch, bei dem sie Paare von K~ufern und Verld4ufern gegeneinander antreten lassen, deren Zahlungsbereitschaft und Reservationspreis jeweils zuf'~lig bestimmt werden, jedoch so, dass ein Einigungsgewinn garantiert ist. Sie untersuchen drei F~lle- ein nicht-lernender K~ufer gegen einen nicht-lernenden Verk~ufer, ein lernender K~ufer gegen einen nicht-lernenden Verkiiufer und ein lernender K~ufer gegen einen lernenden Verki4ufer. Es ergibt sich, dass die Nutzensumme am grSi~ten ist, wenn beide Agenten lernen. Lernt nur der K~iuferagent, ist die Nutzensumme am geringsten. Die Zahl der Verhandlungsrunden ist ebenfalls am geringsten, wenn beide Agenten lernen, sie ist jedoch dann am gr5t~ten, wenn keiner der beiden Agenten lernt. 100 Im Unterschied zu spieltheoretischen Modellen, die mit der Annahme vollkommener Rationalit~t arbeiten, wird in Bazaar lediglich eine Rationalit~t erster Ordnung angenommen: Die Agenten verffigen zwar fiber ein Modell der relevanten Eigenschaften der fibrigen Agenten, das eine Teilmenge von Ft1~ bildet, und passen dieses Modell entsprechend der Aktionen des jeweiligen Agenten an. 1~ Sie berficksichtigen jedoch nicht den Einfluss eigener Handlungen auf die Modelle der fibrigen Agenten. Insbesondere schliet~t diese Annahme Versuche aus, andere Agenten dutch eigene Aktionen in die Irre zu ffihren, wie sie in den oben diskutierten spieltheoretischen Modellen explizit zugelassen werden. Umgekehrt braucht damit auch kein Agent mit solchen Versuchen seiner Kontrahenten zu rechnen.
I-Help Mudgal und Vassileva beschreiben ein Multiagentensystem, das den Teilnehmern einer universit~iren Lehrveranstaltung dabei unterstfitzen soll, geeignete Helfer bei Problemen mit dem Stoff zu finden und gleichzeitig den Preis ffir die Hilfeleistung in Form virtueller Wiihrungseinheiten pro Zeiteinheit auszuhandeln. Jeder Agent repdisentiert einen Studierenden, der fiber bestimmte Kompetenzen verffigt und evtl. in anderen Bereichen Hilfe benStigt. Der Prozess beginnt mit einer Anfrage des Agenten eines Hilfe suchenden Studierenden bei einer zentralen Instanz, die eine Liste potenl~176 Zeng und Sycara, 1998, S. 139. l~ dariiber hinaus andere ffir die Verhandlung relevante Zustandsparameter, z.B. gesamtwirtschaftliche GrS~en oder GrSt~en,die die Nachfrage nach den Produkten eines Agenten betreffen. l~ Zeng und Sycara, 1998, S. 131f.
210
5 Automatisierte Verhandlungen zwischen Softwareagenten
zieller Helfer liefert, sortiert nach deren Kompetenzen im Hinblick auf das Thema, zu dem Hilfe gebraucht wird. 1~ Aut~erdem liefert die als matchmaker bezeichnete zentrale Instanz einen Standardpreis zur Orientierung, der aus der aktuellen Relation von Angebot und Nachfrage in Bezug auf Hilfeleistungen zu dem gewiinschten Thema sowie dem Schwierigkeitsgrad des Themas berechnet wird. 104 Die Agenten in I-Help entwickeln ein Modell ihrer Situation, indem sie die verschiedenen Faktoren, die den Nutzen aus einer bestimmten Entscheidung im Verlauf der Verhandlung beeinflussen, in einem sog. probabilistischen Einflussdiagramm abbilden. Zu den Einflussfaktoren z~hlt zum einen das eigene Pr/iferenzprofil eines Agenten. Es umfasst dessen maximale Zahlungsbereitschaft, bei einem K/iufer die Dringlichkeit des Hilfegesuchs bzw. bei einem Verl~ufer die Dringlichkeit der gegenw/irtigen T/itigkeit, die unterbrochen werden miisste, um einem anderen zu helfen, die Wichtigkeit, die fiir den jeweilige Benutzer Geld besitzt, sowie das Risikoverhalten des Benutzers (risikoavers oder risikofreudig). Zum anderen bezieht das Modell der I-Help-Agenten auch die mutmaglichen Aktionen des Agenten des Verhandlungspartners in die Ermittlung des eigenen Nutzens ein. Um dessen Handlungen voraussagen zu kSnnen, wird ein analoges Einflussdiagramm, wie es fiir die eigenen Entscheidungen verwendet wird, auch fiir die Entscheidungen des anderen Agenten gebildet. Es werden also Annahmen fiber dessen Geld- und Risikopr~iferenz sowie fiber die Dringlichkeit seiner gegenw/irtigen Entscheidung gemacht. Anfangs werden dabei die mSglichen Auspr/igungen der einzelnen Faktoren als gleich wahrscheinlich betrachtet und die erwartete Antwort des anderen Agenten auf ein eigenes Angebot aufgrund dieser Wahrscheinlichkeiten ermittelt. Weicht die tats/ichliche Antwort des Gegenfibers v o n d e r Erwartung ab, werden, ~hnlich wie im Bazaar-System, mit Hilfe der Bayes'schen Regel die bedingten Wahrscheinlichkeiten der einzelnen Einflussfaktoren angepasst. l~ l~
Mudgal und Vassilera, 2000, S. 108. Mudgal und Vassilera, 2000, S. 112, wo die Autoren den so ermittelten Standardpreis als ,~in Mar, fiir den tats~ichlichen Wert der Ressource" bezeichnen. Unter anderem dieses Detail l~st erkennen, dass die Autoren aus dem Feld der kiinstlichen Intelligenz stammen und wohl nicht tiber tiefere 8konomische Kenntnisse verfiigen, da heutige (Skonomen in der Regel einen rein subjektivistischen Wertbegriff bevorzugen, der dem Schwierigkeitsgrad des Themas bestenfalls eine mittelbare Rolle l~st, indem fiir Hilfe zu schwierigeren Themen eine grSgere Nachfrage bestehen mag, die aber ohnehin schon in den Standardpreis eingeht.
5.3 Zusammenfassung
211
In Simulationsexperimenten zeigen die Autoren, dass Agenten, die in der beschriebenen Weise ein Modell ihres Verhandlungspartners formen, in der Regel zu besseren Verhandlungsergebnissen kommen als solche, die eine simple Verhandlungsstrategie mit festen Preisanpassungen nutzen. Wenn lediglich die eigene Situation, aber nicht die des Kontrahenten mittels eines Einflussdiagramms modelliert wird, wobei die HandlungsmSglichkeiten des Kontrahenten als gleich wahrscheinlich betrachtet werden, sind die erzielten Abschlfisse ebenfalls weniger gut, als wenn ein Modell des Gegners existiert. Wenn die Agenten beider Seiten, K~iufer und Verkiiufer, jeweils ihre Verhandlungsstrategie mit Hilfe eines Modells des Gegeniibers entwickeln, besteht ein gewisser Vorteil ffir den Verk;4ufer, insofern der K~iufer in diesem System das erste Gebot abgibt und der Verkiiufer dadurch bei dessen Modellierung einen Schritt Vorsprung erh~ilt. Die erste Handlung des Verkiiufers beruht also bereits auf einem besseren Informationsstand als das erste Gebot des K~iufers.1~ 5.3 Zusannnenfassung Nach einer Einffihrung in die Grundlagen der Forschung zu autonomen Agenten und MAS werden in diesem Kapitel einige Ergebnisse herausgearbeitet, die fiir die weiteren Oberlegungen in dieser Arbeit festzuhalten sind. Zum einen sind die bislang existierenden, auf der Sprechakttheorie beruhenden Standardisierungsvorschl~ige fiir Agentenkommunikationssprachen wegen ihrer auf kooperative Systeme ausgerichteten Grundannahme der Wahrhaftigkeit nur bedingt in einem System einsetzbar, das eine wettbewerbliche Verhandlungssituation abbilden soll. Neben diesem grunds~itzlichen Problem sprechen auch praktische Erw~igungen hinsichtlich des Aufwands, der zur ambivalenzfreien Interpretation m~ichtiger Nachrichtentypen erforderlich ist, gegen einen Einsatz dieser Sprachen in dem hier zu entwickelnden System. Zum anderen zeigt die Darstellung einiger bisher (im Forschungsstadium) existierender Verhandlungssysteme, dass die dort verwendeten Entscheidungsmodelle nicht unmittelbar auf die im Zusammenhang dieser Arbeit infrage stehende Verhandlungssituation iibertragbar sind. Einerseits stimmt die Marktform der implementierten Verhandlung nicht mit der hier geforderten fiberein: W~ihrend in den untersuchten Systemen im l~
Mudgal und Vassileva, 2000, S. 116.
212
5 A utomatisierte Verhandlungen zwischen Softwareagenten
Regelfall ein Polypol mit mehreren Anbietern und Nachfragern unterstellt wird, geht es im Rahmen dieser Arbeit explizit um eine Monopolsituation. Wie zu Beginn des vierten Kapitels erSrtert wurde, tritt die strategische Verbundenheit der Akteure in diesem Fall wesentlich deutlicher zutage als im Polypol, wo eine solche im Extremfall gar nicht vorliegt. Andererseits sind in den vorgestellten Systemen ausnahmslos physische Gtiter oder Dienste Gegenstand der Verhandlungen, die inherent knapp sind. Dies gilt aber ftir digitalisierte Informationsgiiter, die in der vorliegenden Arbeit zum Gegenstand der Verhandlungen werden sollen, nicht.
6 A u t o m a t i s i e r t e Verhandlungen" eine S i m u l a t i o n 6.1 Spezifikation des Verhandlungsprotokolls 6.1.1 Nachrichtentypen In der in dieser Arbeit entwickelten Simulation wird auf den Einsatz einer Standard-ACL (vgl. Abschnitt 5.1.5) verzichtet. Dies geschieht aus zwei Griinden, die im Folgenden kurz erSrtert werden sollen: Die in Abschnitt 5.1.5.4 dargestellte Problematik erschwert es, die Semantik klassischer ACL auf (nicht-kooperative) Probleme des elektronischen Gesch~iftsverkehrs zu iibertragen. Obgleich es sicherlich wiinschenswert ist, dieses Problem langfristig zu 15sen und zu einer standardisierten, problemlos auf nicht-kooperative Transaktionen anwendbaren ACL zu gelangen, ist dies nicht die Fragestellung dieser Arbeit. Erste Versuche, die Nachrichtentypen der FIPA-ACL semantisch korrekt und standardkonform auf die Verhandlungssituation in dieser Arbeit anzuwenden, fiihrten nicht zu befriedigenden Ergebnissen. 9 Die Interpretation der komplexen Nachrichten einer Standard-ACL erfordert einigen Aufwand bei der Entwicklung der Agenten, der fiir die Fragestellung dieser Arbeit nicht mit einem zus~itzlichen Erkenntniswert verbunden ist. Aus diesen Griinden wurden fiir die hier entwickelte Simulation eine Reihe einfacher, speziell auf den Anwendungsfall bezogener Nachrichtentypen definiert, die in Tabelle 6.1 aufgelistet sind.
6.1.2 Ablauf der Verhandlung Aus der Analyse der spieltheoretischen Verhandlungsmodelle bei einseitiger unvollst~indiger Information (vgl. Abschnitt 4.5.4) geht hervor, dass Angebote der informierten Seite keinen Beitrag zur Einigungsfindung leisten, da der informierte Agent keinen Anreiz hat, seine private Information, d.h. seine wahre Zahlungsbereitschaft, vorzeitig preiszugeben. Ein informierter
214
6 Automatisierte Verhandlungen: eine Simulation
Tabelle 6.1: Nachrichtentypen in InfoBargain Nachrichtentyp advertise agree
decline
failure offer
quit request
Beschreibung Angebot eines neuen Informationsgutes Annahme einer zuvor mit einer offer Nachricht fibermittelten Preisforderung Ablehnung einer zuvor mit einer offer Nachricht fibermittelten Preisforderung Mitteilung fiber einen Fehler in der Kommunikation Preisangebot bzw. Preisforderung ffir ein zuvor mittels advertise angebotenes Informationsgut Beendigung der Verhandlung Nachfrageragent signalisiert Interesse an einem mittels advertise angebotenen Informationsgut und erbittet ein Preisangebot
Parameter Objekt vom Typ Inf oGoodDe script i on
Objekt vom Typ String mit Fehlerbeschreibung Objekt vom Typ Double mit gefordertem bzw. gebotenem Preis -
Akteur wird also stets Angebote machen, die so niedrig sind, dass er selbst nicht mit ihrer Akzeptanz durch den uninformierten Akteur rechnet. Erst wenn dieser ein Angebot macht, das der informierte Agent tats~ichlich anzunehmen bereit ist, wird er diesem zustimmen. Daher wird fiir die hier entwickelte Simulation ein Protokoll verwendet, das ausschliet~lich Angebote des uninformierten Agenten vorsieht. Abbildung 6.1 zeigt das Verhandlungsprotokoll in Form eines Zustandsdiagramms. Die Ovale stehen fiir die sieben Zust~inde, in denen sich der Verhandlungsprozess befinden kann. Die von einem Oval ausgehenden Pfeile bezeichnen die Nachrichten, die in dem jeweiligen Zustand erlaubt sind, wobei die voranstehende Zahl angibt, welcher Agent die Nachricht sendet (0: Anbieteragent, l:Nachfrageragent). Jede Nachricht bringt den Verhandlungsprozess in den Zustand, zu dem der jeweilige Pfeil fiihrt. Die drei Zust~iade in der untersten Reihe stellen Endzust~iade des Pro-
6.1 Spezifikation des Verhandlungsprotokolls
215
zesses dar. Der Zustand ,~ailed" wird erreicht, wenn einer der Agenten w~iahrend des Prozesses ein Problem entdeckt, also z.B. eine Nachricht des anderen Agenten nicht korrekt interpretieren kann. Er informiert den anderen Agenten dariiber, indem er die Nachricht failure sendet. Wird der Zustand ,agreement reached" erreicht, ist die Verhandlung zu einem erfolgreichen Ende gekommen. Der Zustand ,dao agreement reached" wird erreicht, wenn einer der Agenten die Verhandlung willentlich abbricht, ohne dass ein technisches Problem aufgetreten w~e. Die Verhandlung beginnt mit der Bekanntmachung eines neu angebotenen Informationsgutes durch den Anbieteragenten, der dazu eine advertise Nachricht an alle registrierten Nachfrageragenten sendet. Anhand der in dieser Nachricht enthaltenen Beschreibung des angebotenen Informationsgutes in Form eines Objekts vom Typ InfoGoodDescription entscheiden die
O:advertise role I responsepending 1:request O:failure
/
(,. roleOoffer pending l:failure ~ O:failure
\ O:offer \ l:decline ~
~ l:quit
(,._ rolel agreementpending l:failure [ 1:agree agreement reached
no agreementreached
Abbildung 6.1" Zustandsdiagramm des Verhandlungsprotokolls (eigene Darstellung)
216
6 Automatisierte Verhandhmgen: eine Simulation
Nachfrageragenten, ob sie in eine Verhandlung fiber dessen Preis eintreten mSchten und senden im positiven Falle eine Nachricht vom Typ request an den Anbieteragenten. Ffir jeden interessierten Nachfrager erzeugt der Anbieteragent einen Hilfsagenten der Objektklasse SellerDelegate, der die eigentliche Verhandlung mit einem einzelnen Nachfrager durchfiihrt. Der Hilfsagent sendet anschliegend eine erste offer Nachricht an den ihm zugeordneten Nachfrageragenten. Dieser nimmt das Angebot entweder mit agree an, lehnt es mit decline ab oder beendet die Verhandlung ergebnislos mittels quit. Empf~ingt der Hilfsagent des Anbieteragenten ein decline, so kann er entweder erneut eine offer Nachricht schicken, oder er beendet seinerseits die Verhandlung mit quit. Abbildung 6.1 zeigt den Verhandlungsprozess als Zustandsdiagramm. Nach Beendigung einer Verhandlung informiert der Hilfsagent den Anbieter, der daraufhin diese Information den weiteren Hilfsagenten, die mit anderen Nachfrageragenten verhandeln, weiterleitet. Der in der Abbildung gezeigte Zustandsautomat ist jedoch in den Agenten nicht statisch kodiert. Statt dessen liest jeder Agent bei seiner Initialisierung eine Datei im CpXML-Format, die das zu verwendende Protokoll enth/ilt. Augerdem wird eine weitere Datei in einem ad-hoc ffir diese Anwendung entworfenen Format gelesen, die den einzelnen Zust/inden des Protokolls jeweils ein Objekt der Klasse Behavior zuordnet. Dieses Objekt enth/ilt die Anweisungen, die der Agent bei Erreichen dieses Zustands auszuffihren hat. 6 . 2 0 p e r a t i o n a l i s i e r u n g der Verhandlungsstrategien
6.2.1 Strategie des Anbieters Aus Sicht des Verk/iufers ist die oben in Abschnitt 4.5.5 dargestellte PacmanStrategie ideal. Bei dieser Strategie bietet der Verldiufer in jeder Periode der Verhandlung den Preis, der dem hSchsten Reservationspreis eines oder mehrerer K/iufer entspricht, die zu diesem Zeitpunkt noch nicht gekauft haben. In dem Modell von Bagnioli et al. folgen die K/iufer der ,,Get-it-while-youcan" (GIWYC)-Strategie, d.h. sie akzeptieren diesen Preis sofort, wenn er das erste Mal geboten wird. Unter den in diesem Modell gemachten Annahmen fiber die Verteilung der Reservationspreise aller K/iufer, insbesondere der Abst~inde zwischen den einzelnen Reservationspreisen, bilden Pacmanund GIWYC-Strategie ein TPG. In diesem TPG werden erstens alle mSglichen Tauschgewinne realisiert, zweitens fallen diese Gewinne vollst/indig
6.20perationalisierung der Verhandlungsstrategien
217
dem Verkiiufer zu. Neben den Bedingungen fiber die Abst~inde zwischen den einzelnen in der Gesamtnachfrage vorhandenen Reservationspreisen setzt dieses TPG jedoch voraus, dass der Verkiiufer perfekte Kenntnis der Verteilung der Reservationspreise in der Nachfrage besitzt. 1 Nur unter dieser Voraussetzung ist seine Drohung glaubwfirdig, den Preis erst dann zu senken, wenn alle K~iufer mit dem entsprechenden Reservationspreis gekauft haben. Diese Drohung ist jedoch notwendig, damit das Strategiepaar Pacman und GIWYC ein TPG bildet. Kennt der Verkiiufer die Nachfrage nicht exakt, kann es vorkommen, dass er einen Preis bietet, der hSher ist als der hSchste Reservationspreis eines K~iufers, der noch nicht gekauft hat. In diesem Fall w~ire es aus Sicht des Verkiiufers selbstsch~digend, auf diesem Preis unbegrenzt lange zu beharren, da kein rationaler K~iufer je zu diesem Preis kaufen wird. In jeder realen Situation ist die Annahme einer perfekten Kenntnis der Verteilung der Reservationspreise nicht sinnvoll haltbar. Der Algorithmus, den der Verl54uferagent zur Ermittlung seiner Angebotspreise einsetzt, muss daher die MSglichkeit beinhalten, Anpassungen vorzunehmen, wenn sich bestimmte anfangs gehegte Erwartungen fiber die Verteilung der Nachfrage nicht best~itigen.
6.2.1.1 Einfaches Modell der Nachfrage Das im folgenden dargestellte einfache Modell der Verteilung der Reservationspreise der Nachfrager lehnt sich an das Modell von Bagnioli et al. an. Aus diesem Modell werden zwei Parameter fibernommen, zum einen die Anzahl der Nachfrager N und zum anderen der hSchste vorhandene Reservationspreis b. W~hrend die Anzahl der Nachfrager dem Anbieter bekannt ist, da sich jeder Nachfrager vor Beginn des Verhandlungsprozesses beim Anbieter registrieren muss, indem er sein prinzipielles Interesse an dem angebotenen Informationsgut signalisiert, ist der Verkiiufer hinsichtlich des hSchsten vorhandenen Reservationspreises b auf eine Sch~itzung angewiesen, der z.B. lWie oben bereits diskutiert wurde, entspricht die Situation, in der die Verteilung der Zahlungsbereitschaften auf der Nachfrageseite bekannt ist, jedoch nicht die Zuordnung der einzelnen Akteure zu den bekannten Zahlungsbereitschaftsklassen der Situation einer zweiseitigen Verhandlung mit einem einzelnen Akteur, dessen Zahlungsbereitschaft unbekannt ist, yon der jedoch bekannt ist, dass sie aus einer bestimmten Verteilung stammt.
218
6 Automatisierte Verhandlungen: eine Simulation
frfihere Erfahrungen beim Angebot fi~hnlicher Informationsgfiter zugrunde liegen kSnnen. In Anlehnung an das Modell yon der Fehrs und Kiihns wird auf~erdem eine kleinste W~ihrungseinheit k berficksichtigt, die ebenfalls als allgemein bekannt betrachtet wird. Au~erdem wird die Funktion I(y) definiert als
I(y) - max (vk{v e N; vk < y).
(6.1)
I(y) ist also der n~ichstkleinere in ganzen W~rungseinheiten darstellbare Betrag zu einem Wert y E ]R. Ausgehend von den drei Parametern unterteilt der Anbieter die Gesamtnachfrage in M Klassen bo, bl, ...,bM-1. Im Folgenden wird davon ausgegangen, dass die Reservationspreis- bzw. Nachfragerklassen in absteigender Reihenfolge indiziert sind, so dass gilt b0 > bl > ... > bM-1. Bei der Aufteilung der Nachfrager auf die Klassen sind zwei F~ille zu unterscheiden: Es gilt entweder 9 M = N, falls b/k>_ N oder aber
9 M = I(b)/k, falls b/k < N. Die Anzahl der Nachfrager in den einzelnen Klassen wird mit no, nl, ..., nM-1 bezeichnet. Jede Klasse enth~t genau einen Nachfrager, solange ffir jeden Nachfrager eine eigene Klasse gebildet werden kann. Ubersteigt andererseits die Anzahl der Nachfrager die Anzahl der in ganzen W~ihrungseinheiten darstellbaren Preise, werden so viele Klassen gebildet, wie separate Preise darstellbar sind. In diesem Fall kSnnen in einzelne oder alle Klassen mehrere Nachfrager fallen. Zun~ichst werden alle Klassen mit gleich vielen Nachfragern bestiickt. Bleibt anschliei~end eine Anzahl r < M Nachfrager iibrig, so werden diese auf die r hSchsten Klassen, also b0, bl, ..., br verteilt. Dieses Vorgehen ist aus Sicht des Anbieters optimistisch, denn es geht davon aus, dass die angenommene Gleichverteilung der Nachfrager im Zweifelsfall zum Bereich der hSheren Reservationspreise hin abweicht. Da aber auf~er den Werten der drei Parameter keinerlei Wissen fiber die tats~ichliche Verteilung der Nachfrage vorhanden ist, kann ebenso gut diese optimistische Annahme getroffen werden wie jede andere. Eine Alternative w~ire eine zuf'~illige Verteilung der iibrigen Nachfrager auf die Klassen. Dies wiirde jedoch bereits
6.20perationalisierung der Verhandlungsstrategien
219
in einfachen Ftillen dazu ffihren, dass Simulationsl~iufe mit gleichen Parametern keine reproduzierbaren Ergebnisse erbrtichten. Da der Unterschied zwischen der in zwei beliebigen Klassen bi und bj befindlichen Anzahl von Nachfragern nicht grSger als eins werden kann, fiillt er bei grSgeren N kaum ins Gewicht. Die einzelnen Reservationspreisklassen werden nach der Formel bi = I ( b ) i ( I ( b ) / M ) ermittelt, wobei i = 0, . . . , M - 1. Ffir die Werte b = 100, M = 10 sowie k = 0, 01 ergeben sich z.B. die Klassen bo = 100, bl = 90, b2 - 80 usw. bis b9 --- 10. _
6.2.1.2 Ermittlung der Gebote und Anpassungsmechanismus Der Anbieter bietet so lange den Preis, der der hSchsten Reservationspreisklasse entspricht, bis alle no Nachfrager in dieser Klasse gekauft haben. Anschlie~end bietet er den Preis der zweithSchsten Reservationspreisklasse, bis alle Nachfrager in dieser Klasse gekauft haben usw., bis er bei der niedrigsten Klasse angelangt ist und alle Nachfrager bedient hat. Solange die Nachfrager sich entsprechend den Erwartungen des Anbieters verhalten, entspricht dessen Verhalten also der Pacman-Strategie. Da der Anbieter jedoch keine perfekte Kenntnis der Nachfrage besitzt, muss er zustitzlich fiber einen Anpassungsmechanismus verfiigen, der in dem Fall aktiviert wird, dass sich seine ursprfinglichen Erwartungen als falsch erweisen. Zwei Probleme sind hinsichtlich des Anpassungsmechanismus zu 15sen. Zum einen muss der Anbieter fiber eine Methode verffigen, um festzustellen, dass seine Erwartungen falsch sind, also nicht der tatstichlichen Nachfrage entsprechen. Zum anderen muss er in der Lage sein, neue Erwartungen zu bilden, wenn sich seine gegenw~tigen Erwartungen als falsch herausgestellt haben. Zuntichst wird die Frage der Feststellung einer Diskrepanz zwischen erwarteter und tatstichlicher Nachfrage diskutiert. Um festzustellen, ob seine Erwartungen falsch sind, verfolgt der Anbieter zum einen die Zahl der bisher gettitigten Verld4ufe fi und zum anderen die Zahl der Ablehnungen di, die er bereits auf ein Gebot bi hin erhalten hat. Er kann sptitestens dann sicher sein, dass sich seine Erwartung nicht mehr erffillen kann, wenn N - ~ - di < ni gilt. In diesem Fall haben so viele Nachfrager das Angebot abgelehnt, dass die Gesamtzahl der ffir diese Klasse erwarteten angenommenen Angebote in jedem Fall unterschritten wird.
220
6 Automatisierte Verhandlungen: eine Simulation
Ein einfaches Verfahren, neue Erwartungen zu formulieren, wenn dies notwendig wird, besteht darin, den erwarteten maximalen Reservationspreis um einen festen Faktor a mit a < 1 nach unten zu korrigieren und anschliegend die Erwartungen wie oben beschrieben zu ermitteln. Die nach der /-ten Anpassung erwarteten Nachfragerklassen seien mit bi,l bezeichnet. Der hSchste urspriinglich erwartete Reservationspreis ist dann b0,0 = b, nach der/-ten Anpassung wird als maximaler Reservationspreis b0,t erwartet. Fiir die Anpassung des maximalen erwarteten Reservationspreises gilt bo,~+1 = I(abo,l). Ausgehend von dem neuen Maximalwert werden die weiteren Klassen dann wie oben nach der Vorschrift bi,t+l = b0,1+l - i(bo,t+l/M) ermittelt, wobei i -- 1, ..., M - 1. Es ist zu beachten, dass der Index l, der die Anpassungen z~ihlt, nicht mit der Verhandlungsperiode t identisch ist. Solange sich in einer Periode t die Erwartungen des Anbieters erfiillen, ist keine Anpassung erforderlich und somit erhSht sich auch der Index 1 nicht. Der Faktor a kann in einem solchen Modell als ein zusammenfassendes Mag ffir die St~ke des Anbieters interpretiert werden. Verschiedene Einzelfaktoren tragen dazu bei, ob ein Anbieter grSgere oder kleinere Korrekturen an seinen Erwartungen vornehmen wird. Zum einen ist vorstellbar, dass der Anbieter andere, im Modell nicht direkt beriicksichtigte Griinde hat, die seine Erwartungen bezfiglich der Nachfrage beeinflussen. Dabei kSnnte es sich z.B. um friihere Erfahrungen mit der Nachfrage nach fi,hnlichen Informationsgiitern handeln. Den zweiten wichtigen Aspekt, der in den Parameter a einfliegt, bilden die Opportunit~itskosten des Wartens, denen sich der Anbieter gegeniibersieht.
6.2.2 Strategie der Nachfrager 6.2.2.1 Ermittlung der Erwartungen Im Rahmen eines Verhandlungsprotokolls, in dem Preisgebote ausschlieglich vom Anbieter ausgehen, besteht fiir den K~iufer das Problem darin, in Abh~ingigkeit von seinem eigenen Reservationspreis die optimale AngebotshShe zu ermitteln, bei der er zustimmt. In dem Modell von Bagnoli et al., in dem der Anbieter die Nachfrage perfekt kennt und die Pacman-Strategie anwendet, haben die Nachfrager keine rationale Alternative zur GIWYCStrategie, bei der sie das erste Angebot annehmen, das gleich ihrem oder geringer als ihr jeweiliger Reservationspreis ist. Denn wenn der Anbieter
6.20perationalisierung der Verhandlungsstrategien
221
einen bestimmten Preis bietet, wird er erst dann ein besseres Angebot unterbreiten, wenn alle Nachfrager, deren Reservationspreis gr5f~er oder gleich diesem Preis ist, das Angebot angenommen haben. Ist der Anbieter dagegen unvollkommen fiber die Verteilung der Reservationspreise informiert, besteht aus Sicht der Nachfrager die Chance, ein besseres Angebot als den eigenen Reservationspreis zu erhalten. Wie im vorigen Abschnitt dargestellt, korrigiert der Anbieter seine Erwartung hinsichtlich der Nachfrage, wenn er davon ausgeht, dass diese nicht der Realit~it entspricht. Daraus folgt fiir die Nachfrager ein gewisser Spielraum, ihre tats~ichliche Zahlungsbereitschaft zu verbergen. Die GrS~e dieses Spielraums h~ingt einerseits von der St~irke der Position des Anbieters ab, die in dem oben dargestellten Modell in dem Parameter a zusammengefasst wurde, andererseits vonder Zeitpr~iferenzrate des Nachfragers. Damit ein rational agierender Nachfrager das Angebot ermitteln kann, dem er zustimmen sollte, muss er zuniichst die Folge der Angebote antizipieren, die der Anbieter unterbreiten wird. Zu Beginn des Verhandlungsprozesses kennt ein Nachfrager jedoch nicht alle Parameter, die die Folge der Angebotspreise determinieren. Daher mfissen auch die Nachfrager im Laufe des Verhandlungsprozesses ihre Erwartungen hinsichtlich der Folge der Angebotspreise mit den tats~ichlich gebotenen Preisen vergleichen und im Falle einer Abweichung Korrekturen vornehmen. Konkret verfiigen die einzelnen Nachfrager fiber das im Folgenden beschriebene Modell des Anbieters.
st bezeichnet das Angebot, das der Nachfrager in Periode t erwartet. Seine Erwartungen bildet der Nachfrager ausgehend yon dem ersten Angebot so = Po, durch das der Anbieter seine hSchste urspriinglich erwartete Zahlungsbereitschaft offenbart. Die Gesamtzahl der Nachfrager ist einem einzelnen Nachfrager jedoch nicht bekannt. Daher kann er nicht einfach das im vorigen Abschnitt beschriebene Vorgehen des Anbieters zur Ermittlung der Angebotsfolge nachvollziehen. Wird unterstellt, dass die Nachfrager wissen, dass der Anbieter stets von einem linearen Verlauf der Nachfragefunktion ausgeht und anschliet~end versucht, die Pacman-Strategie zu realisieren, so ben5tigt ein Nachfrager lediglich einen Parameter /3, der seine Erwartung bezfiglich des Betrages der Steigung der vom Anbieter erwarteten Nachfragefunktion angibt. Die anfiingliche Sch~itzung des Nachfragers beziiglich dieses Parameters sei mit/30 bezeichnet. Nachdem ein Nachfrager das erste Preisgebot so = p0
222
6 A u t o m a t i s i e r t e Verhandlungen: eine Simulation
des Anbieters empfangen hat, ermittelt er seine Erwartungen beziiglich der folgenden Preisgebote nach der Formel si = I ( s o ) - I(~0)i, wobei die Funktion I(.) wie in Gleichung 6.1 auf Seite 218 definiert ist. Da der Nachfrager jedoch unvollkommene Informationen fiber die Anzahl der Nachfrager und fiber die die St~irke des Anbieters, ausgedriickt in dessen Parameter a, besitzt, muss er seine Erwartung ~0 anpassen, sobald er beobachtet, dass die daraus ermittelte erwartete Angebotsfolge nicht den tats~ichlichen Angeboten entspricht. Diese Anpassung wird im hier dargestellten Algorithmus vorgenommen, indem der gleitende Durchschnitt der Abstfiade der letzten q tats~ichlichen Angebote gebildet wird. In den ersten q - 1 Angebotsrunden wird jeweils der Durchschnitt der Abst~nde aller Angebote genutzt. Das tats~ichliche Angebot in der Verhandlungsrunde t sei mit Pt bezeichnet. Es gilt dann =
bzw.
_
t
t
q. q
Ffir diesen Anpassungsmechanismus spielt es keine Rolle, ob er in jeder Periode durchgeffihrt wird oder nur dann, wenn der Nachfrageragent tats/ichlich ein von seinen Erwartungen abweichendes Angebot erh/ilt, denn solange die tats~ichlichen Angebote den auf der Basis von ~t-1 erwarteten entsprechen, gilt ~t = ~t-1. 6.2.2.2 Entscheidungsmechanismus Die Entscheidung, welches der fiir die kiinftigen Verhandlungsperioden erwarteten Angebote der Nachfrager annimmt, trifft er anhand eines einfachen dynamischen Programms. Ein rationaler Anbieter wird nie zu einem Preis unterhalb der kleinsten W~ihrungseinheit k anbieten. 2 Aus der Preissenkungsrate f~t und dem ersten angebotenen Preis p0 ergibt sich die Periode, 2Zu einem Preis von Null und marginalen Produktionskosten von Null ist der Anbieter streng genommen indifferent zwischen Verkaufen oder nicht Verkaufen. Allerdings kann davon ausgegangen werden, dass in der Realit~it minimale marginale Kosten durch einen weiteren Verkauf entstehen. Es ist also realistisch, dass der Anbieter mindestens den Preis k verlangt. Aul~erdem wird hier davon abgesehen, dass je nach dem eingesetzten Zahlungsverfahren allein fiir die Zahlungsabwicklung Transaktionskosten anfallen kSnnen, die erheblich hiiher als ein realistisches k von z.B. 0,01 Euro liegen.
6.3 Architektur und Implementierung der Simulation
223
in der der Nachfrager ein Angebot in HShe von k erwartet, als Tt = - k I-(p~ ot ) " Bei einer Zeitpr~iferenzrate von ~B und einem tats~ichlichen Reservationspreis von b* erh~ilt der Nachfrager einen erwarteten Wert von VTL = ( b * - k ) . Der Wert in jeder frfiheren Periode ergibt sich rekursiv als Vt = max {b* - Pt, ~sVt+l }, da in jeder Periode die Entscheidung zwischen Annahme oder Ablehnung des aktuellen Angebots getroffen werden muss. Vom Zeitpunkt des Verhandlungsbeginns her betrachtet ist der optimale Zeitpunkt, das Angebot anzunehmen, die erste Periode in der gilt b* - p t >_ ~ s Y t + l . 6.3 A r c h i t e k t u r u n d I m p l e m e n t i e r u n g der Simulation 6.3.10"bersicht Ziel dieses Abschnittes ist es, dem Leser einen LTberblick fiber das ffir diese Arbeit entwickelte System InfoBargain zu geben. Das System wurde unter Nutzung der Multiagentenumgebung MadKit 3 erstellt. Dabei handelt es sich um ein Basisgerfist ffir Multiagentenanwendungen, das auf einem Agent-Gruppe-Rolle-Organisationsmodell beruht: Agenten kSnnen systemweit anhand einer spezifischen Adresse, der ZugehSrigkeit zu einer Gruppe sowie einer ihnen zugewiesenen Rolle identifiziert werden. Aufgerdem bietet MadKit Funktionen zur Kommunikation von Agenten, die ohne Modifikation der einzelnen Agenten auch in verteilten Systemen eingesetzt werden kSnnen. In dieser Arbeit werden darfiber hinaus von MadKit bereitgestellte Funktionen zur Unterstfitzung von Simulationssystemen eingesetzt, die die Ablaufkoordination der Agenten auf einem einzelnen Rechner fibernehmen und eine transparente Beobachtung der internen Zust~inde von Agenten erlauben. Die Beobachtungsfunktionen erlauben es, ohne Eingriff in den Programmcode der Agenten die Daten zu sammeln, die ffir die Evaluation des Systems benStigt werden. Abbildung 6.2 zeigt ein Klassendiagramm4 des Systems. Der lJbersicht3Vgl. F e r b e r und G u t k n e c h t , 2002. InfoBargain basiert momentan auf der zur Zeit seiner Programmierung aktuellen Version 3.1b5, im Oktober 2004 wurde Version 4 verSffentlicht. 4Klassendiagramme stellen einen von mehreren in der Unified Modeling Language (UML) enthaltenen Diagrammtypen dar. Auf eine ausffihrliche ErSrterung der UML
6 Automatisierte Verhandlungen: eine Simulation
224
lichkeit h a l b e r w u r d e die D a r s t e l l u n g auf die K l a s s e n n a m e n beschr~inkt. Wichtige A t t r i b u t e u n d M e t h o d e n werden in den folgenden B e s c h r e i b u n g e n der wesentlichen Klassen erSrtert.
Die Klasse A b s t r a c t A g e n t
Die Klasse A b s t r a c t A g e n t ist Teil der M a d K i t -
P l a t t f o r m . Sie kapselt g r u n d l e g e n d e F u n k t i o n e n eines M u l t i a g e n t e n s y s t e m s . I m Wesentlichen h a n d e l t es sich u m F u n k t i o n e n z u m Versand von Nachricht e n an a n d e r e A g e n t e n sowie u m ein Rollenmodell, das es e r l a u b t , a n d e r e A g e n t e n ausfindig zu m a c h e n . Die in I n f o B a r g a i n g e n u t z t e n M e t h o d e n sind:
9 sendMessage(address,message):
Versendet eine Nachricht m e s s a g e
an den A g e n t e n mit der Adresse a d d r e s s .
9 getAgentWithRole(communityName, groupName, roleName): Liefert einen Agenten in der Community mit dem Namen communityName und der Gruppe mit dena Namen groupName, der die Rolle mit der Bezeichnung roleName ausfSllt.Diese Funktion wird yon Agenten der Klasse B u y e r g e n u t z t , u m einen Verkiiufer (einen A g e n t e n der Klasse S e l l e r )
zu finden.
wird hier verzichtet, da es sich um eine weit verbreitete Methode der Modellierung handelt. Stattdessen seien einige knappe Hinweise zur Interpretation der Abbildung gegeben: 9 Umrahmte K~ten stehen fiir Objektklassen, die verschiedenen Verbindungslinien stellen verschiedene Typen von Beziehungen zwischen den Klassen dar. 9 Verbindungen, die in einem nicht gefiillten Dreieck enden, stellen Generalisierungen dar, d.h. die Klasse, auf die das Dreieck zeigt, stellt eine Oberklasse zu der Klasse dar, vonder die Verbindung ausgeht. 9 Verbindungen, die in einem ausgefiillten Rhombus enden, stellen Komponentenbeziehungen dar, d.h. die Klasse, von der die Verbindung ausgeht, ist eine Komponente der Klasse, bei der sich der Rhombus befindet. Komponenten sind zur Funktion der enthaltenden Klasse notwendig. 9 Verbindungen, die in einem nicht gefiillten Rhombus enden, stellen Aggregationen dar. Der Unterschied zu einer Komponentenbeziehung besteht darin, dass die aggregierten Klassen nicht ohne die aggregierende Klasse existieren kSnnen. 9 Zahlenwerte an den Verbindungen bezeichnen die Anzahl der Instanzen, die yon der jeweiligen Klasse vorhanden sein miissen bzw. kSnnen. So bedeutet '1', dass genau eine Instanz existieren muss. '2..*' bedeutet, dass es mindestens zwei Instanzen geben muss, es kSnnen aber beliebig viele sein.
... w e i t e r e S t r a t e g y - K l a s s e n
... w e i t e r e B e h a v i o r - K l a s s e n
t~
i,,,=.
oz.
o~
r
OZ.
r
6 Automatisierte Verhandlungen" eine Simulation
226
Die Klasse FSMhgent Dies ist die Basisklasse aller in InfoBargain genutzten Agenten. Die Klasse FSMAgent erbt die Eigenschaften der Klasse A b s t r a c t Agent und stellt zus~itzlich die Funktionalit~it eines finiten Automaten (engl. finite state machine, FSM) zur Verffigung. 5 Das wichtigste Attribut dieser Klasse stellt eine Kollektion s t a t e s dar, die Objekte der Klasse S t a t e beinhaltet. Diese reprfisentieren die einzelnen Zust~nde des finiten Automaten. Jeder Instanz von S t a t e ist eine Instanz der Klasse Behavior zugeordnet. Auf~erdem existieren Felder fiir den Anfangszustand sowie fiir den gegenw~rtigen Zustand des Automaten. Eine Methode d o T r a n s i t i o n ( a c t i o n ) 15st den Ubergang vom gegenw~rtigen Zustand zu einem der mSglichen Folgezust~inde aus, wobei die Transition gewfi~hlt wird, die den Namen a c t i o n tr~igt. Anschlief~end wird das dem neuen Zustand zugeordnete Verhalten ausgeffihrt, das in dem entsprechenden Behavior-Objekt gekapselt ist. o.
Die Klasse Behavior Die abstrakte 6 Klasse Behavior implementiert die Schnittstelle Runnable aus dem Java-Standardpaket j a v a . lang. Diese dient dazu, Fragmente von ausffihrbarem Programmcode zu kapseln. Die einzige Methode, die von der Schnittstelle verlangt wird, ist r u n ( ) und dient dem Aufruf des gekapselten Programmcodes. Daneben enth~ilt Behavior ein Attribut agent, das eine Instanz der Klasse FSMhgent referenziert. Innerhalb der Implementierung der Methode r u n ( ) in einer Unterklasse kSnnen dadurch Methoden des jeweiligen Agenten aufgerufen werden. Aut~erdem ist ein Mechanismus vorgesehen, der die Aufteilung der fiir ein Verhalten notwendigen Berechnungen in mehrere Schritte erlaubt, um die Laufzeit bei einem einmaligen Aufruf der Methode r u n ( ) zu begrenzen. 7 Die Klasse ProtocolAgent Diese abstrakte Klasse beerbt FSMAgent. Sie erweitert deren Eigenschaften um eine Referenz auf eine Instanz der abstrak5Als finiter Automat wird ein System bezeichnet, das eine endliche Menge definierter Zust~inde einnehmen kann. Das System wechselt von einem Zustand in einen anderen, wenn eine entsprechende Verbindung (Transition) aktiviert wird. 6In Java bezeichnet das Schliisselwort abstract Klassen, die nicht direkt instantiiert werden k6nnen, sondern lediglich der Generalisierung von Subklassen dienen. 7Diese Form des kooperativen Umgangs mit der verfiigbaren Rechenleistung ist ein Zugest~indnis an die Tatsache, dass InfoBargain auf Einprozessorsystemen lauff~hig sein soll, auf denen ein wirklich paralleles Arbeiten der Agenten nicht mSglich ist. Zudem bietet das Thread-Modell der Sprache Java keine ausreichenden Garantien in Bezug auf pr~temptives Multitasking, um eine faire Behandlung der Agenten durch den Thread-Scheduler sicherzustellen.
6.3 Architektur und Implementierung der Simulation
227
ten Klasse Strategy. Dariiber hinaus beinhaltet sie Funktionen zum Senden und Empfangen aller in InfoBargain zul~sigen Nachrichtentypen. Die Sendefunktionen dienen dazu, die in den Instanzen der Klasse Behavior enthaltene Logik des Agentenverhaltens mSglichst iibersichtlich zu halten, indem technische Aufgaben wie das Zusammensetzen einer giiltigen Nachricht vor dem Versand in diese Klasse ausgelagert werden. Die Namen der Sendefunktionen folgen dem Schema sendNachrichtentyp (Empf~inger, Parameter), wobei tIachri ch t entyp ftir die einzelnen zul~issigen Typen steht und Parameter ftir evtl. notwendige zus~itzliche Informationen. Ein neues Preisangebot z.B. wird mit der Methode send0ffer(Empf~inger,Preis) versandt. Die Empfangsfunktion sorgt zun~ichst dafiir, dass die der empfangenen Nachricht entsprechende Transition des finiten Automaten ausgelSst wird. Anschlie~end wird, soweit erforderlich, die empfangene Nachricht in der zugeordneten Instanz der Klasse History registriert. Dadurch stehen die Informationen den iibrigen Komponenten des Agenten zur Verfiigung. Insbesondere die Unterklassen der Klasse S t r a t e g y greifen darauf zu. Die Klasse Buyer Die Klasse Buyer stellt den eigentlichen Nachfrageragenten dar. Es handelt sich um eine Unterklasse von ProtocolAgent. Zus~itzlich zu dessen Eigenschaften enth~i/t Buyer Referenzen auf je eine Instanz der Klassen P r e f e r e n c e S t r u c t u r e und Strategy. Die Klasse P r e f e r e n c e S t r u c t u r e dient der Abbildung der PrMerenzen des Nachfragers, wobei das in Abschnitt 6.2.2 dargestellte Modell zum Einsatz kommt. Die Klassen S e l l e r und S e l l e r D e l e g a t e Diese Klasse repr~entiert den eigentlichen Anbieteragenten. Seine Aufgabe besteht darin, eine Nachicht vom Typ a d v e r t i s e an alle Buyer-Agenten zu senden. Fiir jeden Buyer, der mit einer request-Nachricht reagiert, erzeugt der S e l l e r eine Instanz der Klasse SellerDelegate, an die er die Adresse des betreffenden Agenten tibergibt. Diese Agenten ftihren den Hauptteil der Verhandlung mit dem jeweiligen Buyer. Die Klasse S t r a t e g y und ihre Unterklassen Die wichtigste Methode der Klasse S t r a t e g y ist getNextAction(agent ). Diese Funktion wird von den Unterklassen tiberladen und dient dazu, die folgende Handlung des Agenten zu bestimmen. Je nach Protokoll und Situation kann es sich dabei um einen
228
6 Automatisierte Verhandlungen: eine Simulation
Preis fiir das n~ichste Gebot bzw. Gegengebot, um eine Ablehnung des aktuellen Angebots der Gegenseite oder einen Abbruch der Verhandlung handeln. Der Riickgabewert der Methode ist in der aktuellen Implementierung eine reelle Zahl (Java-Datentyp double), wobei die Aktionen Ablehnung und Abbruch der Einfachheit halber durch bestimmte negative Werte dargestellt werden. In den unten beschriebenen Simulationsl~iufen werden im Wesentlichen die Strategietypen PacmaaSellerStrategy fiir den Anbieteragenten und DyaProgBuyerStrategy fiir den Nachfrageragenten verwendet. Zum Vergleich werden noch C o u r n o t S e l l e r S t r a t e g y und GIWYCBuyerStrategy herangezogen. Diese vier Klassen werden im Folgenden nfi~her erSrtert. Hierbei handelt es sich um eine Implementierung der in Abschnitt 6.2.1 beschriebenen Strategie fiir den Anbieter. Die wichtigsten Attribute dieser Klasse sind die drei Arrays buyerClasses [], buy-
PacmanSellerStrategy
erClassPopulations[] und buyerClassDeclines[]. Bei erstererhandelt es sich um eine Liste reeller Zahlen, die die erwarteten Reservationspreise der K~iuferklassen repr~entieren. Die zweite und dritte Liste enthalten ganze Zahlen, wobei die Elemente der zweiten die erwartete Anzahl von K~iufern in der entsprechenden Klasse angibt und die dritte die Anzahl der K~iufer, die das entsprechende Angebot bereits abgelehnt haben. Die drei gerade beschriebenen Listen werden durch die Methode setupBuyerClasses() in Abh~i~gigkeit von der GrSi~e des Parameters maxWillToPay initialisiert, s Riickmeldungen fiber den Verlauf der Verhandlungen erhalten die Klassen durch die Methode n o t i f y D e c l i n e ( ) , die vonder Behavior-Unterklasse S e l l e r 0 n e s i d e d 0 f f e r P e n d i n g aufgerufen wird, wenn von dem zugeordneten Buyer eine Nachricht vom Typ d e c l i n e gesendet wurde. DynProgBuyerStrategy Diese Klasse implementiert die in 6.2.2 beschriebene Strategie fiir den Nachfrager. Die wichtigsten Attribute dieser Klasse sind die reellen Werte beta, d e l t a und willToPay sowie die Liste reeller Werte contValues[]. Letztere enth~ilt die Erwartungswerte des Nachfrageragenten bei einer Fortsetzung der Verhandlungen und wird durch die maxWillToPay() entspricht dem Parameter b in dem abstrakten Modell in Abschnitt 6.2.1. Die Initialisierung der Listen erfolgt, wie in dem angegeben Abschnitt beschrieben.
6.4 Simulationsergebnisse
229
Methode getContValues() in Abh~i~gigkeit yon der Erwartung der (negativen) Steigung der Grade der Angebote (beta), seiner Zeitprgerenzrate (delta) und seiner wahren Zahlungsbereitschaft (willToPay) aktualisiert. Die Methode u p d a t e B e l i e f s ( ) wird nach jedem Gebot des Anbieteragenten aufgerufen, um den Parameter b e t a anzupassen. 6.4
Simulationsergebnisse
6.4.1 Struktur der Ergebnisse In jedem Durchlauf der Simulation bietet der Verk/iuferagent ein Informationsgut an. Die Zahl der Nachfrageragenten und in der Regel auch deren Zahlungsbereitschaften werden vorab festgelegt. Als Ergebnis eines Durchlaufs ergeben sich die Preise, denen die Nachfrageragenten schlief~lich zugestimmt haben, sowie die Anzahl der Perioden, die bis zu diesen Einigungen jeweils vergangen sind. 9 Abbildung 6.3 stellt als Beispiel die Ergebnisse eines einzelnen Simulationslaufs im Uberblick dar. In diesem Durchlauf wurden 100 Nachfrageragenten simuliert, deren Zahlungsbereitschaften linear von 100 Geldeinheiten (GE) bis 1 GE verlaufen. Fiir jeden Nachfrageragenten gilt ein Zeitdiskontierungsfaktor delta=0.9 und ein Ged/ichtnisparameter q=l. Hier und, wenn nichts anderes angegeben ist, auch in den folgenden Abschnitten wird angenommen, dass die Anfangserwartungen des Anbieteragenten hinsichtlich des Verlaufs der Nachfrage korrekt sind, d.h. er antizipiert eine hSchste vorhandene Zahlungsbereitschaft von 100 GE und einen linearen Verlauf. Als kleinste W/ihrungseinheit wird stets c-0.01, also ein ,,Cent", verwendet. Jede Einheit der horizontalen Achse steht fiir einen Agenten. An der linken vertikalen Achse sind Zahlungsbereitschaften (Symbol '+') und Einigungspreise (Symbol 'x') in GE abgetragen. Die rechte vertikale Achse ist mit einer zweiten Skala versehen, an der die Verhandlungsdauer in Perioden (Symbol '~') abgetragen ist. Zwischen Einigungspreisen und Verhandlungsdauer besteht, wie deutlich zu erkennen ist, eine gegenl/iufige Beziehung: je niedriger der Einigungspreis, desto 1/inger hat die Verhandlung gedauert. Weiterhin sieht man, dass Einigungen auf denselben Preis immer in 9Im Folgenden werden s/imtliche Angaben zur Verhandlungsdauer ausschlief~lichin Perioden angegeben. Die tats~ichliche Zeit, die bis zur Einigung vergeht, h~.ngt nahezu ausschlief~lich vonder verwendeten Hardware ab und ist daher wenig aussagekr~ftig.
230
6 Automatisierte Verhandlungen: eine Simulation
~oo
i§247247247 . . . . . .
zah,un~;.~ch..'
90~: