h‹ ‒› ·¦ ›‹ ?
?? c¡?a›¡¦¤?t‹ ¡‒
"? ?l" ⁄› ¡ ?E?q¡¦⁄¡‒¦⁄¡ ?
QOOTNP? fi\£¡ ?T?Ÿ?X hrrm?
LLLLLLLLLLLLLLLLLLLLLLLLLLLLLLL...
25 downloads
1721 Views
3MB Size
Report
This content was uploaded by our users and we assume good faith they have the permission to share this book. If you own the copyright to this book and it is wrongfully on our website, we offer a simple DMCA procedure to remove your content from our site. Start by pressing the button below!
Report copyright / DMCA form
h‹ ‒› ·¦ ›‹ ?
?? c¡?a›¡¦¤?t‹ ¡‒
"? ?l" ⁄› ¡ ?E?q¡¦⁄¡‒¦⁄¡ ?
QOOTNP? fi\£¡ ?T?Ÿ?X hrrm?
LLLLLLLLLLLLLLLLLLLLLLLLLLLLLLLLLLLLLLLLLLLLLLLLLLLLLLLLLLLLLLLLLLLLLLLLLLLLLLLLLLLLLLLLLLLLLLLLLLLLLLLLLLLLLLLLLLLL `‒ ¦ ¡?
fi›‹
¡?¡‹? £‹¡?Ÿ? F\ ‒¡
⁄ fiYNN•••M¦\ ‒‹M ‹¢›N \L ¡¦
¡Y
›‹L·‹¡L\fifi‒›¦⁄¡Lfi ·‒
¦ fi ‹\ ‒¡LLXVWQWOSPSWVQOLfi\£¡LTM⁄ «
LLLLLLLLLLLLLLLLLLLLLLLLLLLLLLLLLLLLLLLLLLLLLLLLLLLLLLLLLLLLLLLLLLLLLLLLLLLLLLLLLLLLLLLLLLLLLLLLLLLLLLLLLLLLLLLLLLLL LLLLLLLLLLLLLLLLLLLLLLLLLLLLLLLLLLLLLLLLLLLLLLLLLLLLLLLLLLLLLLLLLLLLLLLLLLLLLLLLLLLLLLLLLLLLLLLLLLLLLLLLLLLLLLLLLLLL o›·‒?¦ ¡‒?¦¡ ?\‒ ¦ ¡?Y ??Ah‹ ‒› ·¦ ›‹AK?l" ⁄› ¡ ?E?q¡¦⁄¡‒¦⁄¡ K??QOOTNP??fiM?TLXM
LLLLLLLLLLLLLLLLLLLLLLLLLLLLLLLLLLLLLLLLLLLLLLLLLLLLLLLLLLLLLLLLLLLLLLLLLLLLLLLLLLLLLLLLLLLLLLLLLLLLLLLLLLLLLLLLLLLL
c
‒ · ›‹?" ¡¦ ‒›‹ fl·¡?b\ ‒‹M ‹¢›?fi›·‒?c¡?a›¡¦¤?t‹ ¡‒
Å?c¡?a›¡¦¤?t‹ ¡‒
"M?s›· ? ‒›
"M
?‒" ¡‒ " ?fi›·‒? ›· ?fi\„ M
k\ ‒¡fi‒› ·¦ ›‹ ›· ‒¡fi‒" ¡‹ \ ›‹ ¡ ¦¡ \‒ ¦ ¡K ‹› \««¡‹ fi\‒ fi⁄› ›¦›fi ¡K ‹F¡ \· ›‒ "¡ fl·¡ \‹ ¡ « ¡ ¡ ¦›‹ ›‹ £"‹"‒\ ¡ F· \ ›‹ · ¡ ›·K ¡ ¦\ "¦⁄"\‹ K ¡ ¦›‹ ›‹ £"‹"‒\ ¡ ¡ \ ¦¡‹¦¡ ›· ¦‒ ¡ fi\‒ › ‒¡ "\ ¡«¡‹ M s›· ¡ \· ‒¡ ‒¡fi‒› ·¦ ›‹ ›· ‒¡fi‒" ¡‹ \ ›‹K ¡‹ ›· ›· fi\‒ ¡K ›· fl·¡ fl·¡ ¢›‒«¡ ¡ ¡ fl·¡ fl·¡ «\‹ !‒¡ fl·¡ ¦¡ › K ¡ ‹ ¡‒ ¡ \·¢ \¦¦›‒ fi‒"\ \ ¡ ¡ "¦‒ ¡ F" ¡·‒K ¡‹ ¡⁄›‒ ¡ ¦\ fi‒" · fi\‒ \ "£ \ ›‹ ¡‹ £·¡·‒ ¡‹ e‒\‹¦¡M h ¡ fi‒"¦ " fl·¡ ›‹ ›¦¤\£¡ \‹ ·‹¡ \ ¡ ¡ ›‹‹"¡ ¡ "£\ ¡«¡‹ ‹ ¡‒ M¹¹¹¹¹¹¹¹¹¹¹¹¹¹¹¹¹¹¹¹¹¹¹¹¹¹¹¹¹¹¹¹¹¹¹¹¹¹¹¹¹¹
Introduction Bénédicte VIDAILLET, Véronique D’ESTAINTOT et Philippe ABECASSIS Toute la vie est une affaire de choix. Cela commence par : « la tétine ou le téton ? » Et cela s’achève par : « le chêne ou le sapin ? ». Pierre DESPROGES
Nous sommes tous des décideurs. Qu’il s’agisse du domaine personnel ou professionnel, de la vie politique, économique et sociale, nous avons tous été conduits à faire des choix, c’est-à-dire à prendre conscience de la nécessité de décider, à formuler des problèmes, à envisager plusieurs options, à renoncer à certaines, puis à faire face aux conséquences de nos choix. Décideurs nous-mêmes, nous sommes également affectés par les choix d’autres décideurs. Il peut s’agir du médecin qui effectue un diagnostic et décide d’un traitement ; du comité de direction de l’entreprise dans laquelle nous travaillons qui décide de fermer un site de production ; du gouvernement et du parlement qui modifient le mode de calcul de notre retraite ou la durée du temps de travail ; du conseil municipal qui autorise l’implantation d’une usine de traitement des déchets à proximité de notre habitation, etc. Et pourtant, que savons-nous de la décision ? Que savons-nous de notre mode de fonctionnement lorsque nous sommes amenés à prendre une décision ? Sommesnous réellement rationnels et mus par la volonté de maximiser notre profit personnel comme le soutiennent certaines conceptions ? Sommes-nous également affectés par nos émotions, notre expérience et notre histoire personnelle ? Et finalement, décidons-nous vraiment ? Quand nous votons, notre choix a-t-il réellement un impact sur la vie collective ? et dans ce cas, de quelle nature est-il ? Quand un groupe décide de fermer un site industriel, les dirigeants ont-ils réellement le choix ou bien la décision découle-t-elle de la manière dont le problème a été formulé ? Comment comprendre que les dirigeants et les responsables syndicaux préconisent des solutions parfois si différentes ? Les groupes auxquels nous appartenons nous influenceraient-ils ? Dans
6
La décision
ce cas, de quelle manière ? Jusqu’à quel point ? Et tout compte fait, pourrions-nous prendre de meilleures décisions ? Toutes ces questions, nous nous les posons plus ou moins consciemment, notamment lorsque nous sommes interpellés par les décisions d’autrui : pourquoi Bush a-t-il décidé de déclarer la guerre à l’Irak en 2003 ? Comment comprendre les décisions prises envers les juifs sous le régime nazi ? Pourquoi les dirigeants de Vivendi se sont-ils à la fin des années 90 si rapidement éloignés du cœur de métier de cette entreprise en se diversifiant vers l’industrie de la communication et des média ? Derrière ces interrogations se profile un questionnement très ancien : celui de la place de la liberté humaine dans l’exercice de la décision, liberté qui serait la condition première à toute forme de rationalité. Qu’il s’agisse d’Aristote, de Descartes, de Spinoza, de Marx, de Darwin ou de Freud, nombreux sont les penseurs qui ont contribué en leur temps à ce débat, témoignant ainsi de la nature profondément anthropologique de la décision. Certaines disciplines, relativement récentes, se sont fondamentalement construites autour de la problématique de la décision humaine. C’est notamment le cas pour l’économie, qui, dans ce débat autour de la rationalité et de la liberté humaine à l’œuvre dans la décision, s’est clairement positionnée. Capable d’exercer sa liberté à travers les choix qu’il fait, non entravé par des déterminismes ou des limites intellectuelles, affectives ou sociales, l’homo oeconomicus déciderait de manière à maximiser son résultat, compte tenu des contraintes qui sont les siennes lorsqu’il doit faire un choix. Force est de constater que la théorie économique de la décision — dite théorie du choix rationnel — a progressivement réussi à imposer ses modèles de référence pour juger de la qualité d’une décision, qu’elle soit individuelle, mais également sociale ou collective. Deux raisons au moins peuvent être trouvées à cette domination. D’une part, les économistes ont systématiquement cherché à formaliser, à l’aide notamment du langage mathématique, des modèles de décision adossés à ces postulats qui, comme nous l’avons souligné, sont eux beaucoup plus anciens. En ce sens, ils ont tiré profit d’un courant de réflexion développé depuis l’Antiquité, auquel ils ont ajouté la légitimité et la modernité des mathématiques. Le caractère relatif et discutable de ces postulats s’est ensuite effacé devant la complexité et le raffinement croissants des modèles développés. D’autre part, les économistes, à partir d’une théorie centrée sur le décideur individuel face à un environnement inerte, ont su développer leur réflexion sur des décisions plus sophistiquées, impliquant notamment d’autres décideurs — en théorie des jeux et en économie politique. Il semble alors que ce soit la cohérence et la capacité d’évolution de la théorie du choix rationnel qui soient à l’origine de son succès. Si nous revenons cependant aux postulats même de cette théorie, d’autres disciplines que l’économie ont permis au cours du vingtième siècle d’étayer précisément des postulats différents relativement au comportement humain en matière de décision. C’est ce qu’illustre avec force l’attribution du Prix Nobel 2002 d’économie à Daniel Kahneman 1, psychologue réputé pour ses travaux sur les processus humains de jugement et de choix, menés avec son collègue Amos Tversky depuis quarante ans. Il 1
Vernon L. Smith a conjointement obtenu ce prix en 2002.
Introduction
7
s’agissait là, pour l’économie, de reconnaître publiquement l’importance des recherches qui ont notamment montré à quel point le décideur pouvait parfois s’éloigner, dans la réalité, du modèle de l’homo oeconomicus ! Par exemple, il est très influencé par la représentation qu’il s’est faite du problème et ses choix peuvent être manipulés par la manière dont on lui présente l’information. Ses comportements en matière de risque varient selon qu’il s’agit de perdre ou de gagner, le décideur ayant tendance à prendre des risques en cas de pertes et à les éviter en cas de gains. Ces travaux en psychologie du choix bien connus des spécialistes étaient restés relativement confidentiels et peu diffusés auprès d’un public plus large. Ce courant, et c’est ce qu’explore cet ouvrage, n’est pas le seul qui ait des choses à nous apprendre sur la manière dont l’individu décide : la psychanalyse, la psychologie sociale, la sociologie des organisations, ont également leur mot à dire ! Mais il ne s’agit pas de faire front contre la théorie du choix rationnel et ses dérivés. L’enjeu est bien plutôt de cerner ce que chaque conception — théorie du choix rationnel comprise — peut nous apporter pour comprendre comment nous décidons et comment nous pouvons améliorer nos choix. Au-delà, l’objectif, certes ambitieux, est de dépasser les postulats de telle ou telle théorie pour essayer d’embrasser l’essence proprement anthropologique de la décision humaine. 2 Ce livre essaie de contribuer à cet objectif. Il est le fruit d’une réflexion commune entre des spécialistes de la décision issus de domaines aussi variés que l’analyse économique, la théorie des jeux, l’économie politique, la psychanalyse, la psychologie du choix, la psychologie sociale et la sociologie des organisations. Nos points communs, outre notre intérêt pour la décision dans notre domaine de compétence, étaient la curiosité et le goût pour l’interdisciplinarité. Notre démarche s’est appuyée sur un effort constant pour essayer de comprendre ce que chaque domaine avait à apporter à la problématique de la décision. Un dialogue de plusieurs années a été nécessaire : tout d’abord pour dépasser le vocabulaire spécifique à chacun, condition fondamentale à la compréhension mutuelle (le lexique à la fin de cet ouvrage est une conséquence directe de ce besoin de comprendre ce que disaient « les autres ») ; pour faire ensuite émerger les postulats implicites de chaque approche, ses apports, ses méthodologies d’investigation, ses limites ; pour créer, enfin, des comparaisons, des liens féconds entre ces approches, situer leurs points aveugles et leurs complémentarités respectives. C’est ainsi que nous avons par exemple pris conscience de l’impact des choix théoriques et méthodologiques des différentes approches. Alors que l’économie est dans une approche plutôt normative de la décision, la psychologie du choix, la psychologie sociale, la psychanalyse et la sociologie des organisations cherchent à décrire comment l’être humain prend ses décisions… avec cependant des méthodes d’investigation très différentes. La psychologie du choix et la psychologie sociale utilisent des méthodes expérimentales, afin de manipuler certaines variables très précises dont elles cherchent à isoler les effets, au prix parfois du réalisme des situations de décision étudiées. Psychanalyse et sociologie des organisations se rejoignent dans le recours à des méthodes cliniques, qui essaient de saisir les processus réels dans 2 Le lecteur intéressé par la physiologie de la décision pourra se référer à l’ouvrage de Berthoz (2003).
8
La décision
leur complexité, quitte à ne pas savoir démêler l’impact respectif des multiples facteurs en jeu. Ce qui importait pour nous, lorsqu’une approche atteignait ses limites sur un questionnement en raison de ses présupposés théoriques et de ses choix méthodologiques, était d’identifier le biais par lequel une approche différente pouvait prendre le relais. Par exemple, en voulant expliquer la coopération en théorie des jeux, des économistes ont introduit la notion de confiance, sans pouvoir en approfondir la justification théorique. Dans nos débats, il est apparu l’espoir d’une justification à travers les résultats des jeux expérimentaux en psychologie sociale. Or ces résultats ne répondent pas directement à la question, le concept de « confiance » ne pouvant se traduire de façon incontestable en variable opérationnelle. Par contre, ils abordent la confiance sous un angle différent, montrant comment une relation interpersonnelle conduisant à une coopération durable peut se construire au fil du temps, à condition que certaines caractéristiques du jeu et de son contexte, identifiées de façon expérimentale, soient présentes. Aucun d’entre nous n’aurait été capable, seul, d’entreprendre ce travail. Nous ne prétendons cependant pas être exhaustifs, d’autres disciplines ayant certainement également leur pierre à ajouter à l’édifice, mais nous souhaitons jeter les fondements d’une réflexion interdisciplinaire sur la décision. Chacun des chapitres a été travaillé en commun, la structure du livre également, afin de donner une grande cohérence à l’ensemble. Nous nous adressons principalement à trois publics. Tout d’abord, nous espérons aider tous ceux qui décident à prendre du recul par rapport à leurs propres décisions ainsi qu’à mieux comprendre les décisions du monde qui les entoure. Il ne s’agit cependant pas d’un manuel d’aide à la décision mais bien d’un ouvrage susceptible de favoriser la réflexion et la prise de recul. Nous nous adressons également à ceux qui, comme nous, sont spécialistes d’un des domaines cités précédemment et sont curieux de se familiariser avec le regard que d’autres disciplines portent sur le décideur et la décision… sans pour autant passer eux-mêmes par le long processus de dialogue interdisciplinaire qui a été le nôtre. Enfin, nous espérons interpeller ceux qui, conscients du caractère à la fois rationnel et irrationnel de l’être humain, capable de discernement comme d’erreurs, voire de folie, dans ses activités de décision, ont envie d’approfondir leur réflexion à ce sujet. Cet ouvrage s’articule autour de trois parties, qui permettent d’enrichir progressivement la réflexion sur la décision, envisagée sous l’angle du décideur. La première partie est dédiée au décideur individuel, seul devant ses choix. Elle permet de présenter la théorie du choix rationnel, pivot, en économie, de la modélisation du comportement du décideur. Les chapitres 2 et 3, issus respectivement de la psychologie des choix et de la psychanalyse, viennent enrichir la représentation que l’on peut se faire du décideur. Le chapitre 2 s’intéresse particulièrement à son mode de fonctionnement mental lorsqu’il prend une décision, mode de fonctionnement susceptible de le conduire à des erreurs de raisonnement, de jugement et d’évaluation. Quant au chapitre 3, il met en évidence la subjectivité du décideur dans ses choix, en intégrant en particulier des composantes affectives, identitaires et émotionnelles, ainsi que la dimension inconsciente de ses motivations.
Introduction
9
La deuxième partie met en scène un décideur qui n’est plus seul puisqu’il est face à un autre décideur. Il doit donc s’adapter. Mais comment ? Le chapitre 4 montre de quelle manière la théorie des jeux modélise le comportement idéal qu’il devrait adopter dans cette situation. Les chapitres 5 et 6, issus respectivement de la théorie des jeux et de la psychologie sociale, mettent en évidence les multiples facettes du décideur, tiraillé entre ses aspirations profondes à la coopération et la sauvegarde de ses intérêts personnels immédiats. Ils conduisent à réfléchir à la fragilité des fondements sur lesquels repose toute vie en société, animée par les forces antagonistes de l’altruisme et de l’opportunisme. Enfin, la troisième partie s’intéresse à un décideur collectif, lorsque la décision est prise par un groupe, un état, une organisation. Comment le décideur individuel est-il conduit à s’effacer au profit du collectif ? Dans le chapitre 7, l’économie aborde le problème de façon normative, en s’intéressant aux conditions qui font qu’un décideur rationnel accepte de déléguer son pouvoir de décision à un collectif. Elle aboutit cependant à la conclusion que le choix collectif est en toutes circonstances imposé aux décideurs individuels. Le chapitre 8, issu de la psychologie sociale, efface la distinction entre décideur individuel et décideur collectif, en montrant à quel point l’un et l’autre se déterminent mutuellement par le jeu de processus d’influence, au travers de normes, de débats ou d’échanges dynamiques. Enfin, le chapitre 9 utilise les apports de la sociologie des organisations pour montrer comment le décideur peut disparaître dans certains processus collectifs, qui peuvent éventuellement aboutir à produire des décisions…sans décideurs ! Un lexique, en fin d’ouvrage, aidera le lecteur à se repérer dans le vocabulaire utilisé. Nous gageons que chacun, au fil de sa lecture, reconnaîtra des situations familières, qu’il pourra alors envisager selon de nouvelles perspectives…
PARTIE 1
Le décideur face à ses choix : quand l’homo oeconomicus se dévoile
SOMMAIRE Chapitre 1
Chapitre 2
Chapitre 3
Au cœur du débat : la théorie économique de la décision
13
Le décideur en action : comportements et processus psychologiques
43
Le décideur sur le divan : quand l’inconscient entre en scène
75
12
Le décideur face à ses choix
INTRODUCTION À LA PREMIÈRE PARTIE La problématique de la décision est à l’origine et au cœur de la science économique, qui envisage la décision individuelle comme guidée par une recherche de maximisation sous contrainte. Les postulats sur lesquels s’appuie cette conception de la décision concernent autant la motivation même du décideur lorsqu’il décide, que son mode de fonctionnement — son processus de décision. Le décideur est en effet supposé poursuivre systématiquement son intérêt égoïste et indépendant, et ce en adoptant une démarche méthodique et rationnelle qui le conduit in fine à opérer le meilleur choix possible dans un ensemble donné d’alternatives. Le premier chapitre de cet ouvrage expose cette théorie du choix rationnel, sur laquelle se fonde l’approche économique pour analyser des choix plus complexes impliquant d’autres décideurs (chapitre 4 et 5) ou soulevant la question de la coordination entre les choix individuels (chapitre 7). Cependant, ainsi que le chapitre 2 s’efforce de le mettre en évidence, le décideur est susceptible, lorsqu’il fait un choix, d’obéir à une psychologie plus élaborée que ne le suppose la théorie économique de la décision. En particulier, c’est son fonctionnement mental interne qui est complexe et particulièrement sollicité dans la construction même du processus qui aboutit à une décision. Ce processus commence par la représentation qu’il s’est faite du problème et dépend donc des mécanismes qui le conduisent à focaliser son attention sur certains aspects de ce problème. L’accent est mis ici sur une caractéristique essentielle de la décision humaine : les problèmes de décision n’existent pas « en soi » dans l’environnement du décideur ; ils doivent être formulés, construits par ce dernier. Ce processus dépend également des spécificités du contexte dans lequel il se trouve, ce qui introduit le caractère dynamique et adaptatif du jugement humain. Enfin, il dépend de la dose d’effort cognitif que le décideur est, plus ou moins consciemment, prêt à mettre dans sa décision, ce qui renvoie à la grande variété des processus de jugement et de choix. Tandis que le chapitre 2 s’attaque essentiellement au présupposé de la théorie du choix rationnel relatif au mode de fonctionnement du décideur, le chapitre 3 remet surtout en cause le présupposé lié à ses motivations. La psychanalyse, mobilisée dans cette réflexion, permet ici de développer l’hypothèse que le sens et l’origine de certaines de ses décisions sont susceptibles d’échapper au décideur. La complexité de ses mobiles apparaît : certains sont conscients, d’autres inconscients, et des contradictions, des ambivalences et des conflits entre ces différents mobiles sont susceptibles d’intervenir dans ses choix, souvent à l’insu du décideur. Plus largement, ce chapitre invite à envisager la subjectivité du décideur dans ses choix, en intégrant en particulier des composantes affectives, identitaires et émotionnelles.
Chapitre 1
Au cœur du débat : la théorie économique de la décision Fabrice TRICOU
Sommaire 1 La rationalité maximisatrice en univers objectif et certain
17
2 La rationalité maximisatrice en univers objectif et incertain
26
3 La rationalité maximisatrice en univers intersubjectif et incertain
32
4 Conclusion : conditions, limites et substituts à la rationalité maximisatrice
39
14
Le décideur face à ses choix
INTRODUCTION : LA DÉCISION ÉCONOMIQUE RATIONNELLE Du point de vue de la théorie économique, la décision individuelle est essentiellement conçue comme un choix rationnel. Le concept de rationalité maximisatrice est l’expression analytique privilégiée de cette décision économique rationnelle. Avant d’étudier cette rationalité maximisatrice, ses trois grandes déclinaisons et ses limites, nous allons d’abord présenter la notion générale de décision économique rationnelle, en définissant tout d’abord ce que nous entendons par économie puis par décision. Il existe deux façons différentes de définir l’économie ou de distinguer les phénomènes économiques : la définition matérielle et la définition formelle. La seconde approche de l’économie détermine la théorie économique comme une théorie particulière de la décision. La définition matérielle ou substantielle de l’économie isole une sphère particulière de la vie sociale et la qualifie d’économique. Ce sous-système social a pour objet le bien-être matériel. Dès lors, les actes et les institutions qui sont économiques ont pour spécificité de participer à la satisfaction des besoins, de concourir à la lutte contre la pauvreté. Les catégories fondamentales de la sphère économique sont alors la production et la consommation, médiatisées par la distribution et par l’échange 1. Et l’économie ainsi entendue est justifiée par la nécessité d’assurer la reproduction de la vie : tout individu (ou toute société) doit répondre à la question de ses besoins matériels. Alors que la définition matérielle identifie l’économie par un contenu particulier, la définition formelle distingue quant à elle comme économique une disposition ou une attitude. Cette forme de comportement a pour spécificité d’être efficace, c’està-dire économe en moyens. Le comportement économique se décline alors soit comme obtention de la plus grande satisfaction possible à montant de ressources donné, soit comme utilisation du moins de ressources possible à niveau de satisfaction fixé. Dans ces deux configurations de calcul, il s’agit de dépenser au mieux les moyens, d’affecter de manière optimale les ressources 2. Et l’économie ainsi entendue est justifiée par la rareté des ressources : le choix économique est appelé par la confrontation entre des fins virtuellement illimitées et des moyens foncièrement limités. Sous la définition formelle de l’économie 3, il y a confusion entre décision économique et choix rationnel ou encore comportement efficace. La décision éco1 Les conceptions de l’économie politique comme science de l’enrichissement développent une vision substantiellement économique. On peut ici renvoyer tant aux économistes classiques et marxistes (thème du développement capitaliste) qu’aux économistes keynésiens (thème du circuit) et aux économistes néo-classiques quand ils appliquent le choix rationnel aux phénomènes (tels l’échange marchand) économiques en substance. 2 Dans cette perspective formelle, L. Robbins a défini la science économique comme « la science qui étudie le comportement humain en tant que relation entre les fins hiérarchisables et les moyens rares à usages alternatifs ». Cette définition est particulièrement bien adaptée, mais de façon non exclusive, à l’économie néo-classique. 3 L’application de la théorie du choix rationnel à l’ensemble des décisions humaines se lit ici comme une extension du choix économique (sens formel) hors de son ancrage économique (sens substantiel) originel.
Au cœur du débat : la théorie économique de la décision
15
nomique rationnelle est la question première de la science économique, qui commande ensuite une question dérivée : celle de la coordination sociale entre les choix individuels indépendants 4. Mais cette question seconde, qui est essentiellement celle du marché (et de son aptitude à faire émerger une allocation socialement optimale des ressources à partir des choix rationnels individuels), n’a de sens que dans le prolongement de la vision d’un individu qui poursuit égoïstement son intérêt indépendant et qui est méthodique ou rationnel dans cette poursuite, c’est-à-dire économe dans le choix d’affectation de ses ressources. La théorie économique associée au sens formel du terme est primordialement une théorie de la décision. Grossièrement, trois grandes conceptions de la décision ou du choix peuvent être distinguées, trois visions qu’on pourrait associer aux noms de Freud, de Kant et de Smith. La décision économique rationnelle relève spécifiquement de cette troisième approche. Nous allons présenter ces trois paradigmes sur la base de deux questions générales. ■
Décide-t-on vraiment ? L’économiste néo-classique ou le philosophe rationaliste répondent positivement à ce genre de question. Mais il est alternativement possible de concevoir l’être humain comme une victime de ses passions. Dans cette perspective, l’homme est soumis à des déterminismes sociaux ou mentaux qui le dépassent et se jouent de lui. Sujet opaque à lui-même, l’homme ici n’est qu’illusoirement l’auteur de ses choix. De sorte que la rationalité individuelle tombe, ou ne subsiste éventuellement que comme rationalisation a posteriori (Pareto). Jeter le soupçon sur la souveraineté ou l’autonomie du décideur ne projette pas pour autant dans l’irrationnel. Car les théories en cause mettent en évidence des forces inconscientes (Freud, cf. le chapitre 3 à ce sujet) ou sociétales (Marx) qui dominent l’individu et le poussent à décider sans qu’il le veuille ou sans qu’il le sache. Bref, il ne décide pas vraiment puisque « ça » décide pour lui. Sous ce paradigme, la théorie de la décision devient paradoxalement une théorie de la non-décision, ou de la décision illusoire.
■
Si on décide vraiment, alors qu’est-ce qu’un choix rationnel ? Si les décisions ne sont pas illusoires mais volontaires, alors le choix relève de la raison d’un être libre et conscient, mais le choix rationnel peut signifier deux choses. Kant nous apprend que le sujet peut choisir en étant soumis soit à un impératif catégorique soit à un impératif hypothétique. Dans le premier cas, je fais cela parce que tel est mon devoir. Dans le second cas, je fais cela parce que si je le fais, alors j’arriverai à cette situation que je vise. Cette distinction kantienne recoupe largement une distinction proposée par Weber, qui pose que l’action rationnelle peut être guidée par des valeurs (Wertrationalität) ou alternativement par l’adéquation des moyens employés aux fins visées (Zweckrationalität). Chacune à leur façon, ces deux distinctions opposent deux types de décisions rationnelles : le choix moral d’un côté, émanant d’un
4 Les données du problème marchand sont les fonctions individuelles d’offre et de demande, qui découlent du comportement rationnel du producteur (maximisation du profit sous contrainte technologique) et de celui du consommateur (maximisation de l’utilité sous contrainte budgétaire).
16
Le décideur face à ses choix
acteur autonome désintéressé ; le choix économique de l’autre, émanant d’un individu indépendant intéressé. In fine, trois grandes visions de la décision humaine viennent d’être présentées à gros traits : le choix illusoire (position déterministe), le choix rationnel moral (raison éthique) et le choix rationnel économique (rationalité instrumentale). Le territoire de la décision économique rationnelle est ainsi globalement déterminé, à l’intersection des deux approches de l’économie et des trois approches de la décision, c’est-à-dire dans le champ de l’économie formelle ou de la décision rationnelle calculée. Il convient maintenant de préciser l’expression analytique que prend la décision économique rationnelle en théorie économique : la maximisation. Les présentations usuelles 5 de la décision individuelle comme maximisation sous contrainte distinguent choix individuel, en déclinant la prise de décision d’abord en univers certain et ensuite en univers incertain, et choix interactif, en présentant la prise de décision face aux autres. Nous allons reprendre ces trois temps, mais en les problématisant de façon spécifique. Notre thèse essentielle est que la décision maximisatrice suppose un environnement objectif (ou objectivé). La détermination du choix optimal ou rationnel n’est en effet possible que si le contexte de la prise de décision est stable (ou stabilisé), au sens où chacun des choix possibles du décideur doit pouvoir être associé à un résultat, ainsi qu’à la valorisation de ce résultat par le décideur. Alors, et alors seulement, le choix rationnel ou optimal est précisément celui qui fait émerger l’issue la plus valorisée par le décideur, ou encore celle qu’il préfère parmi toutes celles qu’il peut atteindre (en considérant tous ses choix possibles). En conséquence, la maximisation est pleinement opératoire et se déploie magistralement lorsque la décision se prend face à une nature connue avec certitude, dans un univers objectif et certain (section 1). Qu’en est-il maintenant en univers incertain ? Pour répondre à cette question, il faut distinguer deux types d’incertitude… Il y a d’une part l’incertitude exogène, externe au monde social car liée à une nature extérieure qui peut prendre des valeurs différentes : demain il peut pleuvoir ou faire beau. L’extension de la maximisation à un univers objectif et incertain est possible dès lors que l’on suppose que l’incertitude exogène est une incertitude probabilisable : je ne sais pas si demain il pleuvra ou s’il fera beau, mais il y a une chance sur trois qu’il pleuve et deux chances sur trois qu’il fasse beau, et sur cette base je peux prendre la décision rationnelle de prendre ou de ne pas prendre mon parapluie. Sous ce traitement probabiliste, l’incertitude est pour ainsi dire domestiquée, de sorte que la maximisation peut encore fonctionner. Mais nous verrons qu’elle suppose un critère de décision dont la détermination ouvre un vaste champ de controverses (section 2). Il y a d’autre part l’incertitude endogène, interne au monde social car provenant d’autrui 6 : au prochain coup l’autre peut bouger sa tour ou son fou. L’application 5 Voir par exemple la structure de l’excellent ouvrage de Heap et al. : The Theory of Choice : a Critical Guide (1992). 6 « Cet autre moi qui n’est pas moi » comme le définit Sartre.
Au cœur du débat : la théorie économique de la décision
17
de la maximisation à l’univers de l’incertitude endogène est plus problématique, dans la mesure où elle exige une objectivation de l’autre. Nous verrons que celle-ci peut prendre la forme d’une fixation du choix de l’autre, ou d’une parfaite anticipation de sa réaction à mon choix, ou encore d’une confusion entre le niveau individuel et le niveau social. En tout cas et selon nous, la qualité et la quantité des contributions émanant de la théorie des jeux 7 ne doit pas tromper : l’application de la maximisation à l’univers intersubjectif et incertain pose problème, dès lors qu’est reconnue l’autonomie de l’autre, qui entraîne (dans un cadre individualiste) une incertitude radicale difficile à gérer pour le décideur confronté à autrui (section 3). La structure des trois parties qui suivent sera la même : nous partirons d’un même exemple illustratif inspiré de la célèbre tragédie de Shakespeare, Roméo et Juliette, où les protagonistes bravent les querelles ancestrales de leurs familles respectives pour pouvoir se rencontrer. Nous déclinerons successivement cet exemple de trois façons différentes, pour ouvrir à une formalisation simple de la configuration décisionnelle en cause. Puis nous développerons chacune des trois formes maximisatrices en associant aux précisions théoriques nécessaires la présentation des configurations exemplaires correspondantes et/ou des applications économiques privilégiées. La conclusion sera spécifiquement consacrée aux limites de la prise de décision maximisatrice et aux formes non-maximisatrices que peut prendre la décision rationnelle.
1. La rationalité maximisatrice en univers objectif et certain 1.1
LE CHOIX EN UNIVERS CERTAIN ET SA FORMALISATION
Dans le premier scénario, Juliette a deux options de choix possibles : la première est de ne pas aller voir Roméo et la seconde d’y aller. Si elle décide de ne pas y aller, alors elle ne bénéficie pas du plaisir de rencontrer son amoureux, mais elle ne doit supporter aucun coût de transport. Autrement dit, la situation découlant du choix (1) est associée à un avantage nul (0 point) et à un coût nul (0 point), de sorte que l’avantage net de coût lié au choix (1) est de 0 point. Si elle décide d’y aller, alors elle bénéficie du plaisir de rencontrer son amoureux, mais elle doit supporter un coût de transport. Autrement dit, la situation découlant du choix (2) est associée à un avantage positif (qu’elle évalue à 8 points) et à un coût positif (le prix d’un allerretour en métro, soit 2 points), de sorte que l’avantage net de coût lié au choix (2) est de 6 points. La situation (2) présentant un solde « avantages moins coûts » supérieur à celui de la situation (1), Juliette prend la décision d’aller voir son cher et tendre. Précisons que le « point » constitue la commune mesure des avantages et des coûts associés à chaque option, et que cette commensurabilité est absolument nécessaire à l’exercice de la décision rationnelle. Elle peut cependant se révéler problématique : soit le point est une unité d’utilité, et alors il faut traduire ou mesu7 Cette théorie s’intéresse au contexte stratégique, aux décisions qui se prennent et aux interactions (supposées mener à un équilibre dit de Nash) qui s’opèrent dans un tel cadre. Voir le chapitre 4 de cet ouvrage.
18
Le décideur face à ses choix
rer le « coût de transport » en points négatifs d’utilité (ou unités de désutilité) ; soit le point est une unité de monnaie, et alors il faut exprimer ou évaluer le « plaisir de rencontrer son amoureux » en unités monétaires. En généralisant ce petit exemple, il est possible de proposer une formalisation sommaire du choix certain. Les données du problème pour l’individu sont ses choix possibles (ses options), qui déterminent les états accessibles, ainsi que ses préférences (son intérêt), qui portent sur les états concevables. D’une part, l’individu j se trouve face à un ensemble de choix possibles. On note sj une option quelconque pour j et Sj l’ensemble de ces options possibles sj. Sélectionner une option, c’est engager une action spécifique, c’est mobiliser ses ressources d’une façon particulière. D’autre part, l’individu j est capable de définir ses préférences, c’est-à-dire d’ordonner tous les états a priori envisageables. Cet ordre, qui exprime son intérêt, peut être représenté par une fonction d’évaluation uj, qui associe à tout état possible em une valeur (sous la forme d’un nombre réel). La fonction uj permet ainsi de classer tous les états concevables em : on dira que j préfère eo à en si uj(eo) > uj(en). On note Ej l’ensemble des états envisageables em. Le choix rationnel est celui qui permet la maximisation de l’utilité, c’est-à-dire l’obtention de la valeur ui la plus grande « possible », en prenant en compte les contraintes pesant sur l’individu. Ces contraintes sont telles que tous les états a priori envisageables ne sont pas accessibles : l’individu ne peut atteindre que les états qui sont des résultats, les états qui découlent d’un de ses choix ouverts. Partons des options possibles de j. Tout choix sj mène à un résultat rj et on note Rj l’ensemble des états accessibles. Rj est un sous-ensemble de Ej, lequel regroupe, outre les états accessibles, les états a priori envisageables mais que les contraintes empêchent d’atteindre. Définissons une fonction f, application de Sj dans Rj, qui à tout choix possible sj associe un résultat accessible rj. Quand une décision est prise, le choix validé sj mène à un résultat réalisé rj = f(sj), qui est un état réalisable évalué à hauteur de uj(rj). De sorte qu’il est possible de « remonter » de l’évaluation des états réalisables vers l’évaluation des options qui leur sont associées : uj(rj) = uj[f(sj)]. Le choix optimal est alors déterminé comme celui qui permet de faire émerger l’état préféré parmi tous ceux qui sont accessibles. Dit autrement : le choix rationnel sj* est l’élément de Sj qui est tel que uj[f(sj*)] > uj[f(sj)], sj étant un élément quelconque de Sj. De façon générale mais moins formalisée, la prise de décision rationnelle en univers objectif et certain se décompose analytiquement en quatre temps : – liste initiale exhaustive des options possibles : l’individu connaît toutes les options possibles, c’est-à-dire l’ensemble des choix respectant les contraintes auxquelles il est soumis ; – descente vers les situations possibles : l’individu connaît la situation qui découle de chaque option, de sorte qu’il connaît l’ensemble des états accessibles ;
Au cœur du débat : la théorie économique de la décision
19
ENCADRÉ 1
Les deux conceptions de l’utilité en économie Dans le cadre de la conception cardinale de l’utilité, qui était celle des fondateurs « marginalistes » de l’école néo-classique, tout état concevable em peut être associé à une valeur uj(em) qui exprime intrinsèquement l’intensité de la satisfaction ressentie par l’individu j, au cas où cette situation envisageable em se réaliserait. L’utilité relève ici d’une conception substantialiste. Dans le cadre de la conception ordinale de l’utilité, qui s’est historiquement substituée à la première, l’individu n’est plus supposé attribuer des valeurs intrinsèques aux états : il est supposé classer ou ordonner les états. La relation de préférences exprime cette hiérarchie relative des états aux yeux de l’individu. L’utilité relève ici d’une conception formaliste. Dans l’optique cardinaliste, la fonction d’utilité mesure véritablement la satisfaction éprouvée ou le plaisir ressenti pour chaque état concevable, les valeurs négatives de l’utilité (les désutilités) exprimant d’ailleurs une peine ou un déplaisir. Si uj(eo) = 6 points et si uj(en) = 12, alors on peut en déduire que j est deux fois plus satisfait ou content sous en que sous eo. Dans l’optique ordinaliste, une fonction d’utilité n’est qu’un procédé d’expression commode de la relation de préférence. Si uj(eo) = 6 points et si uj(en) = 12, alors cela ne signifie qu’une chose : j préfère en à eo. Alors que l’hypothèse ordinale s’exprime précisément par la position d’une relation de préférence, cet ordre de préférence peut être déduit de l’hypothèse cardinale : si j est deux fois plus satisfait sous en que sous eo (proposition large), alors j préfère en à eo (proposition stricte). De sorte que l’hypothèse ordinale peut apparaître plus « économique ». Enfin, quand la vision cardinale reste très liée au domaine de la consommation matérielle et garde des connotations psychologiques concrètes, la vision ordinale est plus formaliste ou abstraite, plus adéquate à la définition formelle de l’économie et par conséquent plus facilement généralisable à tout type de décision.
– détermination de la situation optimale : en fonction de ses préférences sur l’ensemble des situations concevables, l’individu détermine la situation qu’il préfère parmi toutes celles qui lui sont accessibles ; – remontée vers l’option optimale : l’individu déduit son choix optimal, qui est l’option associée à la situation optimale. La prise de décision optimale ne pose aucun problème dans cette configuration d’univers objectif et certain. Dans ce monde transparent, la décision économique rationnelle revêt presque l’allure de l’évidence. De sorte qu’une éventuelle mise en question ne porterait pas sur la décision économique rationnelle dans cet univers, mais sur la pertinence de cet univers, dont la possibilité tient à de nombreuses hypothèses restrictives, comme on le rappellera en conclusion.
20
1.2
Le décideur face à ses choix
LE CHOIX OPTIMAL DU CONSOMMATEUR
En théorie micro-économique, la décision économique rationnelle prend la forme canonique de la maximisation sous contrainte. Le modèle ou le prototype de ce calcul d’optimisation est fourni par le consommateur qui maximise son utilité sous sa contrainte budgétaire. Dans la configuration la plus simple, le consommateur est doté d’un revenu donné (ou « exogène »). Grâce à ce revenu, il va acheter un « panier de biens », c’est-à-dire une certaine quantité de pommes (q1) et une certaine quantité de poires (q2). Il doit donc résoudre un problème d’allocation de ressources rares (puisque son budget est limité) à usages alternatifs (puisque tout euro consacré à l’achat de pommes ne peut être utilisé pour acquérir des poires). Pour résoudre ce problème économique, le consommateur va considérer ses fins d’une part et ses moyens d’autre part. Les fins du consommateur sont exprimées par sa relation de préférence, qui porte sur tous les paniers de biens 8 (q1 ; q2) concevables. Celle-ci prend la forme d’un « préordre complet 9 ». Cette expression signifie trois choses. Premièrement, la relation de préférence est un ordre, et cela tient à la propriété de transitivité : si le panier de biens A est préféré au panier de biens B et que le panier de biens B est préféré au panier de biens C, alors le panier de biens A doit être préféré au panier de biens C. Il est essentiel que la relation de préférence soit transitive, dans la mesure où cette propriété garantit la cohérence des fins du consommateur. Deuxièmement, cet ordre est en fait un préordre, car la relation considérée n’est pas exactement « préféré à », mais précisément « préféré ou indifférent à ». Troisièmement, ce préordre est complet (ou total), ce qui veut dire que face à deux paniers de biens quelconques D et E, le consommateur doit être capable de donner une des trois réponses suivantes : je préfère D à E, je préfère E à D, je suis indifférent entre E et D. Est ainsi exclue la réponse : je ne sais pas comment classer D et E. Cette complétude de la relation permet d’assurer la commensurabilité des fins, en assurant que l’individu classe tous les paniers de biens sur une même échelle. Notons enfin que la relation de préférence étant lourde à manier, on lui substitue souvent une fidèle représentante : la fonction d’utilité u, qui associe à chaque panier de biens A un nombre u(A) 10 tel que si A est préféré à B alors u(A) > u(B) et si A et B sont jugés indifférents alors u(A) = u(B). On sait maintenant ce que le consommateur veut faire : obtenir le panier de biens classé le plus haut possible dans sa relation de préférence. Le sens du mot « possible » est précisé par l’analyse de la contrainte budgétaire, qui va distinguer les paniers de biens que le consommateur a les moyens d’acquérir et ceux qu’il ne peut pas s’offrir. Soit R le revenu (en euros) dont dispose le consommateur. Soit p1 et 8 Le consommateur ne préfère pas un bien à un autre (« la pomme » à « la poire »), mais un panier de biens à un autre (« une pomme et deux poires » à « deux pommes et une poire »). 9 Exemple : (3 pommes ; 2 poires) préféré à (3 pommes ; 1 poire) préféré à (2,5 pommes ; 1,5 poire)… 10 Ce nombre n’a de sens que comparé à d’autres nombres, conformément à la perspective moderne de l’utilité ordinale. Dans la perspective des fondateurs néoclassiques (Walras, Jevons et Menger), l’utilité associée à un panier de biens est cardinale : elle a un sens intrinsèque, elle exprime le degré de satisfaction consommatoire.
Au cœur du débat : la théorie économique de la décision
21
p2 les prix unitaires (en euros) de la pomme et de la poire. Le consommateur peut s’offrir le panier de biens (q1 ; q2) si et seulement si la valeur de ce panier de biens ne dépasse pas son revenu, soit : p1.q1 + p2.q2 < ou = R. On dira alors que le panier de biens (q1 ; q2) est accessible au consommateur. Du fait de cette contrainte budgétaire, les possibilités d’acquisition du consommateur sont restreintes aux paniers de biens accessibles (aux prix en vigueur). Les fins et les moyens du consommateur étant précisés, le choix rationnel du consommateur peut être déterminé. Le consommateur part de sa relation de préférence et élimine tous les paniers de biens inaccessibles. Il sélectionne alors le panier de biens accessible situé le plus haut dans sa relation de préférence. Il obtient ainsi le panier de biens qu’il préfère (maximisation de l’utilité…) parmi tous ceux qui lui sont accessibles (… sous contrainte budgétaire) 11.
1.3
DU CHOIX SPÉCIFIQUE DU CONSOMMATEUR AU CHOIX GÉNÉRAL DE L’AGENT RATIONNEL
Le consommateur constitue une véritable figure prototypique, dans la mesure où son calcul, initialement consacré et cantonné aux choix de consommation classiques, a été étendu à d’autres types de décisions économiques (au sens substantiel), puis généralisé par certains auteurs à tout type de décision humaine. Deux extensions importantes et directes du calcul du consommateur méritent mention. Le consommateur reste ici le décideur, mais les « biens » entre lesquels il arbitre (en déterminant leur quantité) sont réinterprétés, de sorte que le domaine du choix rationnel du consommateur est étendu. La première extension transforme le choix entre la pomme et la poire en choix entre la pomme et le loisir. Un bien de consommation traditionnel (unique ou représentatif d’un panier de biens classiques) est ainsi conservé, et mis ici en balance avec le loisir, entendu comme le temps qui n’est pas consacré au travail salarié. Dans cette perspective, le loisir est traité comme un bien de consommation : d’une part il est censé procurer une utilité intrinsèque (je consomme du loisir comme je consomme des pommes) et d’autre part il est associé à un prix indirect, le manque à gagner d’une heure de travail, soit le taux de salaire horaire. On appelle ce manque à gagner le « coût d’opportunité » du loisir, qui évalue la valeur d’une heure de loisir par ce dont on se prive en choisissant de consommer une heure de loisir, c’est-à-dire le salaire d’une heure de travail ou de non-loisir 12. Dans cette analyse, le temps est transformé en une ressource économique, une ressource rare et à usages alternatifs : il n’y a pas plus de 24 heures dans une journée et chaque heure disponible est affectée soit au travail soit au loisir. Bref le choix d’affectation du temps, l’arbitrage travail-loisir, est ramené à un choix de consommation entre un bien standard et le bien 11 L’identification du choix du consommateur à la formalisation générale du choix certain proposée plus haut est directe : sj est ici le choix d’acheter tel panier de biens accessible, rj est la consommation de ce panier de biens et uj(rj) est la satisfaction ou l’utilité tirée de la consommation de ce panier. 12 Le prix du loisir n’a ici rien à voir avec la notion de dépenses (directes) de loisir. Dans cette analyse, le temps de loisir est simplement le temps de non-travail, qui ne coûte rien directement mais coûte indirectement le salaire d’une heure de travail salarié.
22
Le décideur face à ses choix
loisir, formellement traités de la même façon 13. À partir de cette réinterprétation du loisir chosifié en bien de consommation, il est possible d’appliquer la problématique standard du choix du consommateur. D’un côté, les préférences portent sur des paniers de biens qui sont ici des couples (quantité de pommes ; nombre d’heures de loisir). De l’autre, la contrainte budgétaire découle de l’égalité entre les ressources salariales et les dépenses d’achat de pommes 14. Il en découle un choix rationnel, sous la forme d’un panier de biens optimal (quantité de pommes ; nombre d’heures de loisir). On peut déduire l’offre de travail optimale du consommateur-salarié, qui est le complément entre le temps de loisir optimal et le stock de temps disponible. La seconde extension transforme le choix entre la pomme et la poire en choix entre la pomme aujourd’hui et la pomme demain. Le choix rationnel est ainsi étendu à l’arbitrage intertemporel, qu’il est possible d’assimiler simplement à l’arbitrage consommation-épargne (cf. encadré 2). Dans la perspective néo-classique, l’épargne est en effet ramenée à une consommation différée. Je touche aujourd’hui un revenu (r0) et j’en toucherai un demain (r1). Je consomme aujourd’hui des pommes (en quantité c0) et j’en consommerai demain (en quantité c1) 15. En l’absence d’opérations financières, on aura simplement r0 = c0 et r1 = c1. Mais l’emprunt permet de sur-consommer aujourd’hui (r0 < c0) en sous-consommant demain (r1 > c1). Et le prêt permet de sous-consommer aujourd’hui (r0 > c0) en sur-consommant demain (r1 < c1). Avant de déployer la machine bien huilée du calcul rationnel, pour précisément déterminer la désépargne de la cigale emprunteuse (r0 – c0 < 0) ou l’épargne de la fourmi prêteuse (r0 – c0 > 0), il faut ici régler un problème liminaire. Toute perspective intertemporelle engageant des variables de dates différentes, il est nécessaire de ramener toutes les grandeurs de dates différentes à une date unique, par convention pratique la date courante, pour pouvoir effectuer sans biais des comparaisons intertemporelles. L’opération d’actualisation assure cette comparabilité, en ramenant chaque valeur future à son équivalent actuel 16. Alors et alors seulement, il est possible d’appliquer la problématique standard du choix du consommateur. Le choix rationnel intertemporel, soit le panier de biens (c0* ; c1*), découle ainsi classiquement de la confrontation des préférences intertemporelles et de la contrainte budgétaire intertemporelle. 13 Je dispose de h heures à consacrer soit au travail (t heures) soit au loisir (h – t heures). Le travail me procure un revenu salarial qui me permet d’acheter des biens de consommation classiques, d’où une utilité. Le loisir me procure quant à lui directement une utilité. Bref, choisir entre travail et loisir, c’est arbitrer entre deux biens de consommation : les pommes (achetées grâce à mon salaire) et le loisir. 14 Soient h le temps disponible, t le temps de travail, l le temps de loisir et c la quantité de pommes. Soient p le prix unitaire de la pomme et w le taux de salaire horaire, qui est aussi le prix indirect du loisir. La contrainte budgétaire est wt = pc, qui peut se réécrire w(h – l) = pc, soit encore wh = pc + wl, ce qui fait apparaître les deux emplois de la ressource potentielle wh (si je travaillais toute la journée) : l’achat de pommes c au prix p d’une part et l’achat de loisir l au prix w d’autre part. 15 La pomme aujourd’hui et la pomme demain sont deux biens différents qui valent chacun soit comme bien de consommation unique, soit comme bien synthétique représentatif d’un panier de biens composite. 16 Si a est le taux d’intérêt, une valeur A d’aujourd’hui vaudra demain A+aA = (1 + a)A. De sorte qu’en sens inverse une valeur D de demain vaut aujourd’hui D/(1 + a), valeur actualisée de D.
Au cœur du débat : la théorie économique de la décision
23
ENCADRÉ 2
Arbitrages intertemporels … Qui n’a pas craqué un jour, faisant une entorse sérieuse à un régime pourtant suivi avec application jusqu’alors, ou rechutant brusquement dans ses habitudes de fumeur après plusieurs mois d’efforts méritoires … Il faut une bonne dose de self-control pour résister à la tentation d’une consommation immédiate, même si le bénéfice futur qui se trouve dans la balance est de toute évidence bien supérieur dans l’absolu ! L’analyse économique d’une consommation différée rapporte la valeur d’un bien futur à son équivalent actuel en l’actualisant, selon la formule proposée par Samuelson (1937), qui demeure le modèle normatif de référence. Sur ces bases, tout choix effectué entre des biens disponibles à des moments différents dans le temps s’appuie sur la comparaison de la valeur actualisée de ces biens et ne peut donc qu’être rationnel et cohérent. Mais l’observation révèle que les choix intertemporels n’obéissent pas toujours à ces principes, étant déterminés par des processus psychologiques particuliers. Les arbitrages intertemporels sont parfois sources de conflits intérieurs et d’incohérences dans les décisions a : la tension retombe si l’horizon de toutes les options de choix est lointain… mais il suffit que l’une des options devienne imminente, si minime soit elle, pour que la tentation devienne irrésistible, sauf à mettre en œuvre des mécanismes imparables pour lui résister. Ulysse obturant les oreilles de son équipage avec de la cire, mais demandant à ce qu’on l’attache au mât de son navire, de façon à pouvoir entendre le chant des sirènes sans aller se fracasser contre les rochers, en est une illustration classique ! En référence à ce que suppose la théorie économique, qui postule un taux de dévalorisation constant et insensible au contexte, les choix intertemporels sont sujets à des « anomalies » caractéristiques b, dont voici un bref aperçu : gains et pertes ne sont pas dévalorisés de façon symétrique ; le retard de l’échéance d’un bien initialement attendu à un moment donné est douloureux, tandis que la perspective d’en avancer la consommation ne procure qu’une satisfaction très minime en proportion ; les taux de dévalorisation varient en fonction du délai considéré – ce qui explique qu’on préfère généralement une pomme aujourd’hui à deux pommes demain, tout en préférant deux pommes dans un an et un jour à une pomme dans un an ; enfin, l’attente et l’anticipation s’accompagnent souvent d’émotions diverses – anxiété, impatience ou excitation –, et parfois également de la perception d’un risque implicite, qui influencent les choix. Véronique d’Estaintot a. Ainslie (1975), d’Estaintot (1996 ; 2001). b. Loewenstein et Thaler (1989).
La théorie du choix rationnel part d’un domaine d’analyse particulier : les choix de consommation. De là, elle s’étend d’abord à tous les choix substantiellement économiques du consommateur, qui est aussi épargnant (arbitrage consommationépargne) et éventuellement salarié (arbitrage travail-loisir). Elle se généralise ensuite à l’ensemble des choix humains, substantiellement économiques ou non, chez les auteurs qui l’appliquent à la décision criminelle, au choix du conjoint, etc. Le grand
24
Le décideur face à ses choix
artisan de cette tentative est G. Becker, qui pose que « l’approche économique est une approche complète, applicable à tout comportement humain, qu’il s’agisse d’un comportement impliquant des prix monétaires ou des prix occultés imputés, des décisions répétées ou peu fréquentes, des fins émotionnelles ou mécaniques, des personnes riches ou pauvres, des hommes ou des femmes, des adultes ou des enfants, des personnes brillantes ou stupides, des patients ou des thérapeutes, des politiciens ou des hommes d’affaires, des enseignants ou des étudiants » 17. On peut louer la clarté, la plasticité et l’universalisme de cette approche économique formelle généralisée ; on peut aussi critiquer l’impérialisme et le réductionnisme de cette vision qui « économicise » d’un seul coup tout le social. A nos yeux, la rational choice theory à la Becker ne doit être ni acceptée d’emblée comme allant de soi, ni refusée a priori comme impertinente ou choquante. Il s’agirait plutôt d’ouvrir au cas par cas la question de la pertinence de cette approche, qui est en tout cas digne d’intérêt du fait de sa cohérence... Nous allons illustrer cette vision économique généralisée par l’évocation de la théorie du capital humain. Ce choix est doublement motivé. D’une part, il s’agit d’un pan important de l’édification beckérienne. D’autre part, la pertinence de l’approche du choix rationnel pour traiter la question des choix de formation est une question intéressante, du fait de la concurrence entre plusieurs théories explicatives. Pourquoi s’éduque-t-on ? Une réponse classique est fournie par la philosophie idéaliste : par amour de la connaissance ou pour la beauté du savoir. La sociologie déterministe propose une autre réponse : par atavisme social, dans le cadre d’une reproduction sociale générale. La théorie du choix rationnel apporte une troisième réponse : par calcul intéressé. Dans cette perspective, la formation est vue comme un investissement en capital humain. Le savoir et le savoir-faire d’un individu sont ici réinterprétés comme un capital humain valorisable, qui détermine le potentiel productif de l’individu, et au-delà sa rémunération salariale. Les choix éducatifs d’un individu prennent alors la forme d’un investissement : ils exigent des dépenses aujourd’hui 18, mais permettent des recettes demain 19. L’individu rationnel choisira dès lors de s’éduquer si cela lui permet de dégager un solde « avantage moins coûts » positif. Si plusieurs types de formations sont intéressants pour l’individu, alors il choisira rationnellement celle qui dégage l’avantage net de coûts maximal 20. L’extension puis la généralisation du calcul particulier de maximisation de l’utilité sous contrainte budgétaire a fait émerger le calcul général de la maximisation de l’avantage net de coûts, développé systématiquement par « l’analyse coûts/ 17 The Economic Approach of Human Behavior (traduction personnelle). 18 Il s’agit évidemment de coûts directs : frais d’inscription, achat de livres, etc. Mais il s’agit aussi de coûts indirects (coût d’opportunité) : opter pour une année d’étude, c’est se priver d’un revenu salarial annuel. 19 L’investissement en capital humain accroissant ou améliorant les capacités productives de l’individu, il est justifié qu’il bénéficie a posteriori d’un surcroît de revenu, la rémunération salariale augmentant avec la productivité du travail. 20 Notons enfin que les années de formation précédant les années de rendement de l’investissement, les coûts et les avantages apparaissent à des dates différentes, de sorte que le calcul rationnel de l’individu exige une actualisation, comme dans le cadre de l’arbitrage consommation-épargne (et comme dans le cadre d’un investissement classique).
Au cœur du débat : la théorie économique de la décision
25
ENCADRÉ 3
La figure du producteur La figure épurée de l’agent rationnel ne subsume pas seulement le consommateur traditionnel comme cas particulier : le second personnage de la microéconomie standard, le producteur rationnel, en relève tout autant. Le calcul de ce producteur est la maximisation du profit sous contrainte technologique. Cette contrainte permet de déterminer une fonction de coût total CT(q), qui donne la valeur minimale du coût de production permettant de produire le niveau de production q a. Par ailleurs, si la production q est intégralement écoulée au prix unitaire p (qu’on suppose donné en concurrence parfaite), le producteur engrange une recette totale RT(q) = pq. Écart entre les recettes et les coûts, le profit total peut donc s’écrire pq – CT(q). Et le producteur rationnel choisira son niveau de production optimal comme étant celui qui dégage le profit le plus grand possible b. De façon tout à fait transparente, le calcul rationnel du producteur s’apparente à la recherche de l’avantage net de coûts (recettes moins coûts) le plus grand possible. Tout choix d’un niveau de production engendre des recettes et des coûts et détermine ainsi un certain niveau de profit. Le choix rationnel est celui qui permet de maximiser le profit, sous la contrainte de la fonction de coût (qui dépend de la technologie disponible). Le calcul du producteur a donné lieu à de nombreux développements : détermination optimale du niveau des facteurs de production, calcul de minimisation des coûts (à court terme et à long terme), comportement intertemporel d’investissement (sur lequel s’appuie la théorie du capital humain). a. Cette fonction de coût total peut être établie sur la base du calcul de minimisation du coût total sous contrainte technologique. Ce calcul optimisateur intermédiaire est justifié par la recherche du profit le plus grand possible : le profit total est d’autant plus grand que le coût total est petit (et ce pour tout niveau de production). b. Cette recherche aboutira à des résultats différents selon la configuration de la fonction de coût total, qui dépend elle-même de la nature des rendements. Par exemple, des rendements décroissants (difficulté croissante à produire) déterminent une fonction de coût total croissante à taux croissant : le coût total accélère quand le niveau de production augmente.
avantages ». Toutes les amarres économiques substantives étant maintenant larguées, la figure forte et simple de l’agent rationnel s’impose désormais comme évidente et logiquement première. Expression chronologiquement initiale de l’agent rationnel, le consommateur n’en est plus aujourd’hui qu’une incarnation parmi tant d’autres, qui vaut dans le champ particulier mais sans spécificité des choix de consommation. À l’instar de la figure du consommateur, celle du producteur a contribué à faire émerger la notion générale d’agent rationnel, dont elle n’est plus maintenant elle aussi qu’une déclinaison particulière et non spécifique. Si l’agent rationnel s’est d’abord incarné et développé sous les traits du consommateur et du producteur néo-classiques, il s’est affranchi de ces expressions particulières pour devenir un modèle pur, sans ancrage et applicable à tout choix humain. La prétention universelle de la figure de l’agent rationnel nie en effet toute limite à son application, et corrélativement toute spécificité à ses champs d’application 21… 21 Si l’on voulait à tout prix conserver une spécificité au consommateur et au producteur, on pourrait dire que le consommateur est le prototype de l’agent rationnel utilitariste (qui compte en satisfaction), alors que le producteur est le prototype de l’agent rationnel capitaliste (qui compte en monnaie, rentabilisant et accumulant son capital).
26
Le décideur face à ses choix
2. La rationalité maximisatrice en univers objectif et incertain 2.1
LE CHOIX EN UNIVERS INCERTAIN ET SA FORMALISATION
Dans le second scénario du choix de Juliette, celle-ci se trouve toujours devant les deux options présentées au premier scénario, mais elle n’a plus de certitude quant à la présence de Roméo chez lui (et il n’a pas de téléphone). Il y a deux « états du monde » possibles : Roméo est chez lui ou il est sorti. Plus précisément, Juliette est ici plongée dans un univers d’« incertitude probabilisable », ce qui veut dire qu’elle sait que Roméo est chez lui avec une probabilité objective p (comprise entre 0 et 1) et qu’il est absent avec la probabilité complémentaire (1 – p). Pour prendre sa décision dans cet univers, Juliette peut recourir à un critère simple : l’espérance de gains. Il s’agit de choisir l’option associée à la moyenne des avantages nets de coûts (liés à tous les états du monde possible), cette moyenne étant pondérée par les probabilités d’occurrence des états du monde possibles. L’option 1 est ainsi évaluée par G1 = 0.p + 0.(1 – p) = 0, alors que l’option 2 est évaluée par G2 = 6.p + (–2).(1 – p) = 8.p – 2. Juliette décide en conséquence d’aller rendre visite à Roméo si G1 < G2, c’est-à-dire si p > 1-- . 4
En généralisant ce petit exemple, il est possible de proposer une formalisation sommaire du choix incertain. Les données du problème pour l’individu sont toujours ses choix possibles et ses préférences. D’une part, l’individu j se trouve face à un ensemble Sj de choix possibles sj. On note J le nombre de décisions possibles pour j. D’autre part, l’individu j est capable de définir ses préférences, c’est-à-dire d’ordonner toutes les situations envisageables, et en particulier toutes les issues possibles. Cet ordre peut être représenté par une fonction d’évaluation uj, qui associe à toute situation concevable une valeur. La fonction uj permet ainsi de classer toutes les issues possibles. De l’univers certain à l’univers incertain, un problème nouveau émerge : un choix quelconque ne fait pas émerger une issue unique 22, mais autant d’issues possibles qu’il y a d’états du monde possibles. Si on note edmi un état du monde quelconque et I le nombre d’états du monde possibles, alors toute issue possible résulte d’une part du choix effectué sj et d’autre part de l’état du monde prévalant edmi, de sorte qu’on notera rji une issue possible, et qu’il y a IJ issues possibles. Le choix rationnel ne peut être celui du rij associé à la valeur ui(rij) la plus grande de toutes (soit IJ possibilités), car l’individu j ne maîtrise pas la détermination de l’état du monde prévalant. Il ne peut s’agir non plus du choix du rij associé à la valeur ui(rij) la plus grande sous l’edmi prévalant (soit J possibilités), car l’incertitude signifie ici précisément qu’au moment de faire son choix, l’individu ne sait pas 22 L’application f définie à la section précédente n’est plus ici définissable, chaque action pouvant engendrer non plus un seul résultat mais plusieurs résultats différents.
Au cœur du débat : la théorie économique de la décision
27
quel état du monde prévaudra. L’exercice du choix rationnel demande dès lors le recours à un critère de décision. Il s’agit d’une fonction C qui, à tout choix possible sj, associe une évaluation unique C(sj), qui va constituer une valeur synthétique des I valeurs émergentes possibles dès lors que le choix sj aurait été arrêté : uj(r1j), uj(r2j), …, uj(rij), …, uj(rIj). Le choix rationnel sj* est alors l’élément de Sj qui est tel que Cj(sj*) > Cj(sj), sj étant un élément quelconque de Sj. La prise de décision optimale reste possible dans cette configuration d’univers incertain, mais sa solidité est moindre qu’en univers certain. Le problème tient évidemment à la définition du critère de décision, qui est en même temps nécessaire à la prise de décision optimale et équivoque ou discutable, dans la mesure où, nous allons le voir, aucun critère de décision particulier ne s’impose absolument. La réalisation a posteriori de tel ou tel état du monde est exogène : elle est indépendante de la décision prise et tombe en quelque sorte du ciel. De sorte que l’environnement de la décision est toujours objectif, mais sa transparence se trouble, la décision économique rationnelle perdant alors son allure d’évidence. La question cruciale est celle du critère de décision. Elle se décompose en deux problèmes : celui de la pondération des différents états du monde dans l’évaluation de chaque issue possible et celui de la sélection du critère de décision.
2.2
LA PONDÉRATION DES ÉTATS DU MONDE SELON LEUR PROBABILITÉ D’OCCURRENCE
Dans la configuration de choix certain, une décision donnée menait sans équivoque à une seule issue possible. La difficulté essentielle qui émerge sous la configuration de choix incertain est la disparition de ce lien univoque : chacune de mes J options possibles peut mener à I résultats différents. Mettons pour l’instant de côté la question qui nous retiendra au cours du développement suivant, celle de l’évaluation de chacune des IJ issues possibles rij par une valeur uj(rij). La question qui se pose alors, pour chaque option possible sj, est celle du passage de I valeurs uj(r1j), uj(r2j), …, uj(rij), …, uj(rIj) à une unique valeur synthétique C(sj). L’idée vient vite à l’esprit de recourir à une moyenne, et plus précisément à la moyenne arithmétique. En conséquence, les critères de décision seront des critères de maximisation d’une espérance mathématique. Mais quel système de pondération choisir ? La solution habituellement avancée est la distribution des poids relatifs aux I valeurs selon la probabilité des événements associés. Il semble en effet indiqué d’accorder un poids plus (ou moins) important à la valeur uj(rij) si l’edmi correspondant est plus (ou moins) probable. C’est ainsi la distribution de probabilité (p1, p2, …, pi, …, pI) sur les événements possibles (edm1, edm2, …, edmi, …, edmI) qui va servir de système de pondération pour la plupart des critères de décision 23. Chaque action possible sj sera alors évaluée par C(sj) = p1 × uj(r1j) + … + pi × uj(rij) + … + pI x uj(rIj). Et le choix optimal sj* est évidemment associé à la valeur C(sj*) maximale. 23 Certains critères de décision sophistiqués ne prennent pas en compte directement la distribution de probabilité, mais une fonction de cette distribution, notamment pour surévaluer le poids de faibles probabilités (telles les petites chances de réussite dans certains jeux de hasard).
28
Le décideur face à ses choix
In fine, la problématique du choix optimal peut encore s’appliquer en univers incertain et objectif à condition de traiter l’incertitude exogène, extérieure au monde humain, comme une incertitude probabilisable. Cette probabilisation atténue l’incertitude, et la rend compatible avec la perspective maximisatrice 24.
2.3
DU CRITÈRE DE L’ESPÉRANCE DE GAINS AU CRITÈRE DE L’UTILITÉ ESPÉRÉE
Considérons un agent dont le revenu R est incertain, ce qui signifie que ce revenu prendra différentes valeurs selon la réalisation de tel ou tel état du monde. On dit que le revenu est une variable aléatoire. Supposons que deux événements soient possibles : E1 et E2. On appelle p1 la probabilité d’occurrence de E1 et p2 la probabilité d’occurrence de E2. Si E1 et E2 décrivent les deux seuls états du monde possibles, alors on a p1 + p2 = 1. Le revenu R prend la valeur R1 si E1 se réalise, et il prend la valeur R2 si E2 se réalise. Le couple (R1 ; R2) représente les gains de l’individu dans les deux cas possibles. On dit que (R1 ; R2) constitue une loterie associée à la distribution de probabilité (p1 ; p2). Un exemple classique consiste à considérer le propriétaire d’une forêt, laquelle peut soit brûler (événement 1) avec une probabilité p1, soit ne pas brûler (événement 2) avec une probabilité p2. Le revenu d’exploitation perçu est nul (R1 = 0) sous le premier état du monde et positif (R2 > 0) sous le second état du monde. L’application du choix rationnel en univers incertain suppose que l’agent ait des préférences sur ces loteries. La question se pose donc de savoir à quelle condition un individu va préférer une loterie (R1 ; R2) à une loterie (R1’ ; R2’). La première réponse est fournie par le critère de l’espérance de gains, qui suppose que l’agent n’est sensible qu’à l’espérance mathématique de son revenu. Dès lors, (R1 ; R2) sera préféré à (R1’ ; R2’) si p1R1 + p2R2 > p1R1’ + p2R2’. Ce critère simple et intuitif permet la détermination du choix optimal : parmi toutes les loteries accessibles, l’individu rationnel choisira celle qui est associée à l’espérance de gains la plus forte. La procédure de maximisation de l’espérance de gains a cependant été critiquée, dans la mesure où elle suppose un comportement spécifique vis-à-vis du risque, à savoir une indifférence ou une neutralité que l’expérience semble contredire. Explicitons cela sur la base d’un petit exemple, en considérant les deux loteries (9 ; 9) et (10 ; 0), toutes deux associées aux probabilités (0,9 ; 0,1). La première loterie est associée à des gains certains, alors que la seconde est associée à des gains incertains. L’espérance de gains de la première loterie est EG1 = 0,9 × 9 + 0,1 × 9 = 9, et celle de la seconde est EG2 = 0,9 × 10 + 0,1 × 0 = 9. Le recours au critère de l’espérance de gains nous amène alors à conclure que l’individu est indifférent entre ces deux loteries. Or, des expériences 25 ont montré que beaucoup d’individus préfèrent, à espérance de gains égale, une loterie à gain certain à une loterie à gain incertain. On parle alors d’« aversion pour le risque ». 24 De façon subsidiaire, on distingue les distributions objectives (connues du décideur) et les distributions subjectives (conjecturées par le décideur). 25 Voir chapitre 2.
Au cœur du débat : la théorie économique de la décision
29
L’objection soulevée à l’encontre du critère de l’espérance de gains a conduit à promouvoir un critère alternatif : celui de l’espérance de l’utilité des gains. Cette utilité est à distinguer de l’utilité consommatoire associée à un panier de biens : elle est une valeur associée à un niveau de revenu. On parle de fonction d’utilité VNM, en référence aux deux auteurs qui l’ont promue 26 : Von Neumann et Morgenstern. Si U(R) décrit la fonction d’utilité VNM, alors l’espérance d’utilité associée à la loterie (R1 ; R2) est donnée par EU = p1U(R1) + p2U(R2), ce qui permet de classer les loteries par EU croissante, et de déterminer le choix rationnel : il s’agit bien sûr de la loterie accessible associée à l’EU la plus grande. À propos de la forme de la fonction d’utilité VNM, on peut évidemment dire qu’elle est croissante, l’utilité augmentant avec le revenu (la dérivée de la fonction d’utilité est positive, U’ > 0). Pour le reste, la dérivée seconde de U (qui donne le sens de variation du sens de variation) est a priori indéterminée, ce qui ouvre toute une palette d’attitudes différenciées vis-à-vis du risque. Plus précisément, il est possible d’établir trois résultats 27. Si U ralentit 28, alors l’individu présente une aversion pour le risque : il est en quelque sorte prudent. Si U accélère 29, alors l’individu présente un goût pour le risque : on pourrait dire qu’il est téméraire. Si U croît à taux constant 30, alors l’individu présente une neutralité ou une indifférence vis-à-vis du risque. Reprenons la loterie certaine (9 ; 9) et la loterie incertaine (10 ; 0), associées aux probabilités (0,9 ; 0,1) et donnant lieu à une même espérance de gains (9). L’individu prudent préférera la première à la seconde ; l’individu téméraire préférera la seconde à la première ; l’individu neutre au risque sera indifférent entre les deux. Si l’on considère le développement général de la théorie de la décision risquée, il peut apparaître qu’elle progresse de deux façons différentes mais complémentaires, de manière assez conforme à la démarche scientifique dans la mesure où elle articule déduction et induction. D’une part, chaque critère de décision est mis en question par des « paradoxes » 31 qui lui sont opposés : tout comme l’aversion pour le risque a été objectée au critère de l’espérance de gains 32, le critère de l’espérance d’utilité doit lui aussi affronter certains paradoxes 33. D’autre part, les critères de décision sont approfondis logiquement par des tentatives d’axiomatisation, ce qui vaut exemplairement pour la théorie de l’utilité espérée, construite par Von Neumann et Morgenstern puis étendue par Savage au contexte des probabilités subjectives (cf. encadré 4). Le mouvement logique d’axiomatisation et le mouvement falsificateur d’expérimentation sont en fait articulés, dans le cadre d’une progression générale de la théorie du choix 26 En 1944, dans Theory of Games and Economic Behavior. 27 Sur ce point, on peut par exemple consulter Kast (2002), pages 83 à 87. 28 U’ > 0 et U’’ < 0 : fonction croissante concave. 29 U’ > 0 et U’’ < 0 : fonction croissante convexe. 30 U’ > 0 et U’’ = 0 : fonction croissante linéaire. 31 Non pas au sens de contradiction logique, mais au sens étymologique d’opposition au sens commun, mise en évidence par une falsification expérimentale. 32 Objection formulée par Bernoulli dans le cadre du « paradoxe de Saint Pétersbourg ». Pour une présentation pédagogique, voir par exemple Guerrien (1996), pages 375 et 376. 33 Et tout particulièrement le « paradoxe d’Allais », simplement présenté dans Guerrien (1996), page 375. On peut aussi mentionner le « paradoxe d’Ellsberg », évoqué dans Kast (2002), pages 107 et 108.
30
Le décideur face à ses choix
ENCADRÉ 4
L’axiomatique de Savage Le critère de VNM a la particularité de s’appliquer aux situations risquées mais pas absolument incertaines. L’axiomatique de Savage a généralisé le critère de VNM à toutes les situations, risquées ou radicalement incertaines. La décision basée sur le critère de VNM n’est réalisable qu’à condition de disposer d’une distribution de probabilité a priori sur les états du monde. Mais que faire lorsque cette probabilité a priori n’existe pas ? Léonard Savage a montré que l’on pouvait surmonter ce problème et étendre le critère de VNM aux situations incertaines en attribuant des probabilités subjectives aux états de la nature. Cette distribution de probabilité reflète alors le jugement de l’individu sur les occurrences possibles des différents états de la nature. Pour aboutir à cette relation, Savage considère l’ensemble S des états de la nature, dont les sous-ensembles sont notés E1, E2, ..., l’ensemble A des actes possibles et l’ensemble C des conséquences de ces actes. Un acte est une fonction de S dans C. On note a (s) la conséquence de l’acte a si l’état de la nature s se réalise.
– Dans ces conditions, si la relation ≤, définie comme « n’est pas préféré ou est indifférent à » sur l’ensemble des actes A, respecte 7 conditions a :
1. ≤ est un préordre complet sur A, c’est-à-dire que tous les actes possibles sont connus et tous sont comparables entre eux. 2. Le principe de la chose sûre est vérifié : si une option est meilleure qu’une autre dans un état du monde et au moins aussi bonne dans d’autres états, cette option dominante devrait être choisie. 3. Il existe dans C une relation qui reflète la relation de préférence définie sur A. En d’autres termes, l’ordre sur les conséquences est induit par celui des actes. 4. Il existe dans S une relation, nommée « pas plus probable que », qui reflète la relation de préférence définie sur A. Ainsi l’ordre sur les états de la nature est induit par celui des actes. 5. Les conséquences ne sont pas triviales. 6. Les préférences sont continues. 7. Si les conséquences d’un acte a1 quand l’événement E1 se réalise sont toujours préférées à celles d’un acte a2, quand E1 se réalise, alors a1 est préféré à a2.
– Alors, il existe une seule distribution de probabilité subjective notée P sur l’ensemble des événements et une fonction d’utilité u sur l’ensemble C des conséquences (définie à une transformation affine positive près) permettant de représenter les préférences de l’agent par la maximisation de l’utilité espérée. Ainsi, le développement de Savage définit simultanément une fonction de probabilité et une fonction d’utilité et montre que, si les préférences respectent une certaine cohérence interne, les individus choisissent en situation d’incertitude comme s’ils maximisaient une utilité espérée, construite sur le jugement qu’ils portent sur les différentes occurrences des états de la nature. Philippe Abecassis a. Pour une description formelle et détaillée des 7 conditions, voir Luce et Raiffa (1957) et Savage (1954).
Au cœur du débat : la théorie économique de la décision
31
incertain. Ceci a été exemplairement illustré par Allais qui, après avoir développé son paradoxe en objection à la théorie de l’utilité espérée, a mis en cause un principe de base de cette théorie (l’axiome d’indépendance), et à partir de là a proposé un critère de décision alternatif.
2.4
DEUX DOMAINES D’APPLICATION DE LA DÉCISION RISQUÉE L’ASSURANCE ET LA FINANCE
:
Il est possible de distinguer deux champs privilégiés d’application de la décision rationnelle en univers objectif et incertain 34. Le premier concerne la demande optimale d’assurance et le second le choix optimal de portefeuille. L’assurance est un comportement réactif de gestion de l’incertitude, ce qu’on peut illustrer simplement en reprenant l’exemple classique du dommage incendie éventuellement subi par le propriétaire d’une forêt. Le premier événement possible est l’incendie, associé à une faible probabilité p1 et engendrant un revenu d’exploitation R1 nul ; et la seconde éventualité est l’absence d’incendie, associée à une forte probabilité p2 et engendrant un revenu R2 positif. Il en découle la distribution de revenu (R1 ; R2) en l’absence d’assurance. Avec une assurance totale, l’agent souscrit une police d’assurance qui est associée à une prime P et qui rembourse tous les dommages en cas d’incendie sous la forme d’indemnités I = R2. L’incertitude inhérente au revenu disparaît alors complètement, puisque le revenu sous E1 (soit 0 – P + I) et le revenu sous E2 (soit R2 – P + 0) sont identiques. Entre les deux cas polaires de nonassurance et d’assurance totale, toute une gamme d’assurances partielles est possible, chaque police d’assurance étant alors caractérisée par une prime P’ inférieure à P et, en cas de dommage, par un remboursement I’ lui aussi inférieur à I. Ces contrats permettent de réduire l’incertitude 35. On peut alors conjecturer que plus l’agent a une aversion au risque, plus le contrat d’assurance souscrit sera proche de l’assurance totale. On peut aussi plus précisément déterminer la demande optimale d’assurance, en s’appuyant sur la fonction d’utilité VNM de l’individu : chaque police d’assurance (P ; I) étant associée à une loterie (r1 ; r2), l’agent rationnel peut calculer l’espérance d’utilité correspondante 36, et de là sélectionner la loterie (r1* ; r2*) associée à l’espérance d’utilité la plus grande, ce qui permet de déterminer le contrat d’assurance optimal (P* ; I*). En marge de l’assurance, la finance est l’autre grand domaine d’application du choix rationnel en univers incertain (et objectif). L’individu épargnant est souvent confronté à un dilemme : acheter des actifs financiers à rendement fort mais incertain (comme certaines actions), ou alternativement acquérir des actifs financiers à rendement faible mais assuré (comme les titres publics). L’agent risque-tout est évidemment porté vers les premiers types de placement, alors que l’agent précautionneux se 34 Comme le souligne Picard (1994), dont nous reprenons la présentation didactique (pages 109 à 121). 35 Sous E1, le revenu avec assurance partielle (0 – P’ + I’) est plus grand qu’en l’absence d’assurance et plus petit qu’avec une assurance totale : 0 < –P’ + I’ < –P + I. Sous E2, le revenu avec assurance partielle (R 2 – P’) est plus petit qu’en l’absence d’assurance et plus grand qu’avec une assurance totale : R2 > R2 – P’ > R2 – P. 36 EU = p1U(r1) + p2U(r2).
32
Le décideur face à ses choix
tourne vers les seconds. Entre ces deux profils extrêmes, des agents vont opter pour la voie moyenne d’un arbitrage entre rendement et sécurité, ce qui les amènera à une diversification de leur patrimoine mobilier. De fait, chaque portefeuille financier envisageable, c’est-à-dire chaque combinaison possible de titres, peut être associé à une loterie, soit une distribution de revenu associée à une distribution de probabilité. Là encore, la maximisation de l’espérance d’utilité (associée à une fonction VNM) peut permettre de déterminer le choix optimal, en l’occurrence de portefeuille. Si les applications de la décision rationnelle risquée à l’assurance et à la finance ont donné lieu à des résultats opératoires, la question de la pertinence de ces applications, et plus précisément la question de leur condition de possibilité, méritent également d’être posées. Dans le cas de l’assurance, la maximisation de l’espérance d’utilité suppose que l’occurrence du dommage soit un fait exogène. Or on sait que la « fatalité » cache parfois des comportements humains intentionnels. De même, dans le cas de la finance, la maximisation de l’espérance d’utilité suppose une objectivité des grandeurs marchandes financières et une extériorité de la conjoncture économique. Or on sait que celles-ci sont largement déterminées par l’opinion moyenne que les acteurs se font du futur. Dans les deux cas, l’exogénéité de l’état du monde prévalant est ainsi à discuter, l’univers naturel-objectif pouvant se révéler comme univers humain-objectivé, ce qui nous invite évidemment à considérer maintenant la décision rationnelle en univers intersubjectif.
3. La rationalité maximisatrice en univers intersubjectif et incertain 3.1
LE CHOIX EN UNIVERS INTERINDIVIDUEL ET SA FORMALISATION
Dans le troisième scénario du choix de Juliette, celle-ci se trouve toujours devant les deux options présentées aux deux premiers scénarii. Comme dans le deuxième scénario, elle n’a pas de certitude quant à la présence de Roméo chez lui. Mais on quitte l’univers d’« incertitude probabilisable » pour un univers d’« incertitude radicale », dans la mesure où le comportement de Roméo n’est plus objectivement probabilisable. De fait, Roméo est comme Juliette un sujet autonome : il peut décider de rester chez lui (option 1) ou d’aller chez Juliette (option 2). La configuration obtenue est intersubjective : c’est une configuration de jeu. Si chacun reste chez soi, alors la satisfaction de chacun est à 0. Si chacun décide d’aller chez l’autre, alors chacun obtient un « paiement » de –2. Si Juliette va chez Roméo qui est resté chez lui, alors elle reçoit 6 et lui 8. Si Roméo va chez Juliette qui est restée chez elle, alors il reçoit 6 et elle 8. Cette configuration particulière s’appelle la « bataille des sexes » 37. En généralisant ce petit exemple, il est possible de proposer une formalisation sommaire du choix en univers interindividuel, ou encore du choix stratégique 38. Les 37 Cette configuration de jeu est « résolue » et commentée dans le paragraphe 3 de la présente section. 38 La partie 2 de ce livre développe particulièrement ces aspects.
Au cœur du débat : la théorie économique de la décision
33
données du problème pour l’individu sont toujours ses choix possibles (ou stratégies) et ses préférences. D’une part, l’individu j se trouve face à un ensemble Sj de choix possibles sj. On note J le nombre de décisions possibles pour j. D’autre part, l’individu j est capable de définir ses préférences, c’est-à-dire d’ordonner toutes les situations envisageables, et en particulier toutes les issues possibles. Cet ordre peut être représenté par une fonction d’évaluation uj, qui associe à toute situation concevable une valeur. La fonction uj permet ainsi de classer toutes les issues possibles. En univers stratégique comme en univers incertain, un choix quelconque peut faire émerger plus d’une issue. Et c’est en cela que ces deux configurations impliquent l’incertitude. Mais alors qu’en univers objectif incertain l’incertitude vient de la nature, elle vient de l’autre en univers intersubjectif incertain. Plus précisément, le choix de sj par j ouvre plusieurs issues possibles non plus en fonction de l’état de la nature qui prévaudra, mais en fonction du choix que l’autre individu aura arrêté. Appelons i cet autre individu et notons Si l’ensemble de ses choix possibles si, qui sont en nombre I. Une issue possible résulte ainsi d’une part du choix sj de j et d’autre part du choix si de i, et on notera rji une issue possible parmi IJ pouvant émerger. Le choix rationnel ne peut être celui du rij associé à la valeur uj(rij) la plus grande de toutes (soit IJ possibilités), car l’individu j ne dicte pas le choix de l’autre. Et le recours à un critère de décision n’est plus ici envisageable, du fait de l’impossibilité de saisir le choix de l’autre par une distribution de probabilité. Cette impossibilité tient à la spécificité du contexte d’interdépendance stratégique inhérent à la relation interindividuelle. Sous incertitude objective, la maximisation de uj dépend d’un état de la nature edmi inconnu au moment de la prise de décision de j, mais déterminé indépendamment de sj. Sous incertitude interindividuelle, la maximisation de uj dépend d’un choix si inconnu au moment de la prise de décision de j, mais normalement déterminé en fonction de sj, dans la mesure où le choix sj de j influence le bien-être ui de i qu’il s’efforce, de son côté, de maximiser 39… La prise de décision optimale rencontre des difficultés sérieuses dans cette configuration d’univers intersubjectif et endogènement incertain. Comme un état de la nature, la décision de l’autre m’échappe alors même qu’elle influence mon choix. Elle ne peut cependant être assimilée à un état de la nature, dans la mesure où elle est influencée en retour par mon choix, dans une logique circulaire. Dans ces circonstances, l’application de la problématique individualiste du choix rationnel ne peut se faire qu’au prix d’une dé-subjectivisation ou objectivation de l’autre : seule cette opération peut assurer le cadrage du choix de l’autre nécessaire à l’exercice maximisateur. La détermination du choix optimal n’est pas possible sans stabilisation de l’environnement, qui prend en univers interindividuel la forme d’une naturalisation de l’autre, c’est-à-dire d’une réduction du sujet libre et incertain qu’il est a priori en agent prévisible et en cela « gérable ». 39 Quand l’incertitude tombe du ciel, elle est indépendante du choix du décideur : qu’il fasse beau ou qu’il pleuve ne dépend pas de ma décision de prendre ou non un parapluie. Quand l’incertitude vient de l’autre, elle risque fort de dépendre du choix du (premier) décideur : que Roméo reste chez lui ou aille chez Juliette dépend de la décision de Juliette d’aller chez Roméo ou de rester chez elle.
34
3.2
Le décideur face à ses choix
TROIS MODALITÉS FONDAMENTALES DE L’OBJECTIVATION DE L’AUTRE
Il est selon nous possible d’isoler trois grandes modalités de cette réduction objectivante de l’autre. Par ordre de complexité croissante, ces trois formes de saisie réifiante de la stratégie de l’autre sont l’objectivation substantielle, l’objectivation procédurale et l’objectivation systémique 40. Au moyen de l’objectivation substantielle, l’autre est directement saisi par son choix, qui m’est ici donné en substance : « i joue si ». La décision rationnelle apparaît alors comme le choix sj correspondant à l’issue rij associée à la valeur uj(rij) la plus grande parmi les J valeurs possibles, le choix si de l’autre étant donné (et fixé à si) 41. Cette paramétrisation du choix de l’autre annihile brutalement l’incertitude stratégique et restaure ipso facto un univers certain dans lequel la prise de décision rationnelle peut aisément s’exercer. Cette objectivation substantielle peut être introduite de deux façons. On peut d’une part supposer que l’autre a décidé avant que je ne décide, et que de surcroît sa décision est connue de moi au moment ultérieur où je prends ma décision 42. On peut d’autre part introduire un tiers bienveillant, qui annonce le choix de l’autre dans le cadre d’une médiatisation de la relation bilatérale qui rappelle l’organisation sous-jacente à la concurrence parfaite 43. Dans les deux cas, mon choix rationnel est simplement celui de ma « meilleure réponse » au choix fixé de l’autre. Par une position seconde dans le jeu ou grâce à l’entremise d’un commissaire priseur, je suis informé du choix de l’autre, un choix qui prend la forme d’une information donnée (ou du moins considérée comme telle), un choix objectivé dont ma décision optimale peut découler. Au moyen de l’objectivation procédurale, l’autre est saisi par sa façon de choisir, qui m’est ici donnée comme sa règle de décision. Et cette procédure par laquelle l’autre arrête sa stratégie est réactive, puisque l’autre est supposé choisir sa meilleure réponse à mon choix (qu’il prend comme donné) : « i joue sa meilleure réponse à ma stratégie ». Sachant cela, pour chacune de mes stratégies possibles sj, je détermine la meilleure réponse si que me ferait l’autre, et j’en déduis, via l’issue rij qui émergerait alors, la valeur uj(rij) qui découlerait finalement de ce choix possible. Parmi ces J valeurs de mon bien-être ainsi calculées, je sélectionne la plus grande, qui détermine mon choix optimal 44. La connaissance de la loi de fonctionnement de l’autre réduit ici l’incertitude sur son comportement, de sorte que la détermination rationnelle de mon choix est possible, comme meilleure réponse à la meilleure 40 Ces trois expressions ne sont pas consacrées par l’usage, mais proposées ici par nous. Nous nous en tiendrons dans ce deuxième paragraphe à l’exposé des formes d’objectivation, sans développer les problèmes de cohérence ou de pertinence qu’elles soulèvent. 41 Pour le dire de façon ramassée : Max uj(rij) = uj(si ; sj) = uj(si ; sj) = uj(sj), si étant fixé à la valeur si. 42 Dans les termes de la théorie des jeux, je suis alors second joueur (ou suiveur) dans le cadre d’un jeu séquentiel, que l’on peut aisément représenter par un arbre de décisions. 43 Par analogie au tâtonnement walrassien, B. Walliser a d’ailleurs proposé de parler de « commissaire priseur nashien » à propos de ce crieur de la stratégie de l’autre. L’adjectif nashien est défini un peu plus loin, dans l’exposé de l’objectivation systémique (troisième point de ce paragraphe). 44 Pour le dire de façon ramassée : Max uj(rij) = uj(si ; sj) = uj[MRi(sj) ; sj] = uj(sj), MRi étant la fonction de meilleure réponse de i à j : si = MRi(sj).
Au cœur du débat : la théorie économique de la décision
35
réponse qu’il choisira mais que je peux prévoir. Cette objectivation procédurale convient particulièrement au cadre de jeu séquentiel : je décide avant l’autre, tout en étant capable d’anticiper parfaitement et d’intégrer à mon calcul sa réaction optimale, car je connais sa règle de décision (qui est réactive). L’objectivation procédurale est moins brutale que l’objectivation substantielle, dans la mesure où l’autre n’est plus réduit pour moi à une valeur paramétrique, mais reconnu comme autre agent rationnel que moi. Ma parfaite connaissance de sa totale réactivité à ma décision lui enlève cependant toute imprévisibilité et me permet ainsi de déterminer le choix rationnel pour moi. Au moyen de l’objectivation systémique, l’autre est saisi par une aptitude qu’il partage avec moi (et avec le modélisateur) : celle d’avoir une intelligence complète de l’interaction, soit une vue synoptique du jeu et des joueurs. On parle à ce propos d’hypothèse de common knowledge 45, qui implique non seulement que je sache et qu’il sache, mais aussi que je sache qu’il sait et qu’il sache que je sais, etc. Cette hypothèse de connaissance totale pourrait égarer, pour autant qu’elle ouvre une diabolique spécularité infinie. L’objectivation systémique consiste d’une certaine façon à mobiliser cette hypothèse mais en la contenant, en jouant sur deux niveaux. Au niveau individuel, mon action rationnelle est la meilleure réponse à l’action de l’autre ; et l’action rationnelle de l’autre est la meilleure réponse à mon action. Au niveau global, il en ressort que les seules issues rationnelles sont des intersections de meilleure réponse, ce qu’on appelle des équilibres de Nash 46. En supposant l’existence et l’unicité de l’équilibre, on pose alors que les joueurs se coordonnent sur l’équilibre de Nash (en considérant tout le jeu du point de vue synoptique), et par conséquent jouent chacun leur stratégie nashienne (en considérant leurs stratégies de leur seul point de vue). Autrement dit, partant de l’idée que l’autre va jouer sa stratégie nashienne, je joue la mienne ; et partant de l’idée que je vais jouer ma stratégie nashienne, il joue la sienne. Cette vue d’ensemble est cohérente ; mais l’expression de « stratégie nashienne » révèle bien la confusion ou le rabattement ici à l’œuvre entre le plan individuel des stratégies et le plan social des issues, ma stratégie n’étant nashienne que si la stratégie de l’autre l’est aussi (et réciproquement), de sorte que l’expression « stratégie nashienne » associe un nom individuel et un adjectif social. Sous cette objectivation systémique, l’autre est véritablement un autre moi calculateur. L’imprévisibilité qu’il pourrait représenter pour moi (et que je pourrais représenter pour lui) est dissipée par l’hypothèse d’une capacité partagée à avoir sur l’interaction un point de vue objectivant global (considérant toutes les issues) et identique (sélectionnant le[s] seul[s] équilibre[s] de Nash).
45 Ainsi nommée par Lewis, et présentée par Guerrien (1996), pages 91 et 92. 46 Très simplement, (si ; sj) est un équilibre de Nash si si = MRi(sj) et sj = MRj(si). Cette double condition réciproque révèle le caractère autoréférentiel de ce concept d’équilibre, situation d’intersection des meilleures réponses ou, pour le dire négativement, issue caractérisée par l’absence d’intérêt à la déviation unilatérale. À un équilibre de Nash, si l’autre s’en tient à sa stratégie, alors je n’ai pas intérêt à changer la mienne (et réciproquement) : bref, si on y est, alors on y reste.
36
Le décideur face à ses choix
ENCADRÉ 5
Quelques configurations stratégiques typiques sous forme de paraboles Dans le « dilemme du prisonnier », l’équilibre de Nash est unique (c’est d’ailleurs un équilibre en stratégies dominantes), mais sous-optimal : il est dominé par une autre issue (dite coopérative) a. Le problème ici soulevé est le défaut de coopération, puisque les intérêts privés ne font pas émerger l’intérêt social, contrairement à la thèse philosophique centrale du libéralisme économique. Certains auteurs ont d’ailleurs qualifié le dilemme du prisonnier d’« anti-théorème de la main invisible ». Cette configuration peut se retrouver dans de nombreuses circonstances, telles le financement d’un bien public : tout le monde a intérêt à son existence, mais chacun préfère se dégager de son financement (problème dit du passager clandestin), de sorte que ce bien public n’est finalement pas produit du fait de ce défaut de financement. Dans ces circonstances, pour éviter que l’intérêt individuel ne finisse par se retourner contre lui-même, l’émergence de la coopération est recherchée par une modification du cadre individualiste (introduction de l’État) ou par une modification de la rationalité individuelle (introduction de l’exigence morale, ou alternativement de la réciprocité sociale comme don-contredon) b. Dans le « jeu du rendez-vous », le problème n’est plus la sous-optimalité de l’équilibre de Nash, mais la multiplicité de ces équilibres, un des deux équilibres étant ici socialement meilleur que l’autre. Le bon sens voudrait alors que soit sélectionné l’équilibre dominant. Une coordination spontanée peut à cet égard faire émerger ce « bon » équilibre, éventuellement grâce à l’appui sur une convention partagée. Mais le scénario inverse d’apparition du « mauvais » équilibre est tout aussi possible, soulevant un problème de défaut de coordination, ce qui peut être illustré par une économie bloquée sur un équilibre bas (ou de sous-emploi) du fait d’un pessimisme généralisé, alors même qu’un optimisme partagé aurait pu faire émerger l’équilibre haut (ou de plein emploi). Dans la « bataille des sexes », le problème est encore la multiplicité des équilibres de Nash, aucun équilibre n’étant ici socialement meilleur que l’autre c. Le problème ici soulevé est la coordination conflictuelle : il y a un intérêt mutuel à se coordonner, mais il est associé à un conflit sur les termes précis de cette coordination. Roméo et Juliette ont un intérêt commun à se retrouver, mais Roméo préfère que ce soit chez lui et Juliette préfère que ce soit chez elle. Et si chacun adopte une position maximaliste, ils risquent fort de ne pas se rencontrer du tout. La coordination conflictuelle est aussi au cœur de l’échange marchand : toute une gamme de prix permettrait aux deux partenaires de gagner à l’échange, mais le vendeur veut un prix bien haut et l’acheteur un prix bien bas, ce qui peut faire échouer la transaction. Dans ces circonstances, pour éviter l’échec de coordination, deux voies sont possibles. On peut donner la préséance à un des deux protagonistes, en transformant le jeu simultané en jeu séquentiel avec un initiateur (qui fera émerger l’équilibre qui l’avantage) et un suiveur d. On peut aussi inscrire la relation dans le temps, en transformant le jeu à un coup en jeu répété avec équilibre alterné e. a. Pour une présentation pédagogique, on peut se reporter au premier chapitre de la deuxième partie du présent ouvrage, ou à Guerrien (1996), pages 154 à 156. b. La solution politique et la solution éthique peuvent s’illustrer dans l’exemple du financement du bien public : l’État contraint les individus au paiement des impôts et le bon citoyen les paie de lui-même. c. Pour reprendre l’exemple qui a ouvert cette section : d’une part « Roméo reste chez lui (8) et Juliette vient à lui (6) » et d’autre part « Juliette reste chez elle (8) et Roméo vient à elle (6) ». Pour une présentation pédagogique de cette configuration stratégique, on peut se reporter au premier chapitre de la deuxième partie du présent ouvrage. d. Roméo le macho disant à Juliette, ou Juliette la fausse ingénue disant à Roméo : « Je reste chez moi ; est-ce que tu viens ? ». e. Roméo va chez Juliette les jours pairs et Juliette va chez Roméo les jours impairs.
Au cœur du débat : la théorie économique de la décision
3.3
37
CONCEPTS D’ÉQUILIBRE STRATÉGIQUE
La théorie des jeux 47 explore de façon systématique la question de l’interaction stratégique, en s’appuyant sur des concepts d’équilibre et en s’intéressant à des configurations typiques. Nous allons en évoquer quelques uns et quelques unes, avant de présenter dans le paragraphe qui suivra les grandes applications de la théorie des jeux en économie. Une première configuration stratégique simple est donnée par la combinaison de deux façons évidentes de jouer. Admettons que ma meilleure réponse soit la même quelle que soit la stratégie de l’autre : on dit alors qu’il s’agit d’une stratégie dominante. Admettons encore que l’autre aussi ait une stratégie dominante. L’équilibre émergent sera en conséquence le croisement de ces deux stratégies, appelé équilibre en stratégies dominantes 48. L’existence d’une stratégie dominante est un phénomène rare : la plupart du temps, ma stratégie optimale dépend du choix stratégique de l’autre. Dans ces circonstances, il est une façon faiblement maximisatrice de jouer, soutenue par l’idée que le choix de l’autre est imprévisible. Sous cette hypothèse d’incertitude radicale, il peut apparaître indiqué de se contenter de limiter les dégâts, en sélectionnant une stratégie prudente 49. Pour chacune de mes stratégies, je considère le pire résultat auquel elle peut me mener parmi les I issues possibles (uj min), puis je choisis parmi les J actions possibles la stratégie associée « au meilleur résultat pire » (max [uj min]) : on parle alors de stratégie « maximin » 50. Et si de son côté l’autre agit de même, alors on peut définir un équilibre en stratégies maximin. Dans les circonstances où ma stratégie optimale dépend du choix stratégique de l’autre, l’attitude dominante en théorie des jeux a cependant été le maintien de la façon fortement maximisatrice de jouer, ce qui exige une des trois formes d’objectivation de l’autre qu’on a vues. La détermination de la stratégie optimale des joueurs et celle de l’issue émergente du jeu sont alors fondées sur le concept d’équilibre de Nash. Cet équilibre simple et usuel permet la résolution de nombreuses configurations de jeux. Il peut cependant rencontrer certains problèmes comme la sous-optimalité, l’inexistence ou à l’inverse la multiplicité. Mentionnons en outre le problème général de la formation de l’équilibre : comment émerge-t-il ? Comment se joue pratiquement le jeu ? 47 Pour une introduction à la théorie des jeux, ainsi que pour des précisions terminologiques, on peut se reporter au chapitre 4 et au lexique de cet ouvrage et à Guerrien (1996), et notamment aux pages 490 à 493. 48 On peut à partir de là définir une famille de concepts d’équilibre, et notamment l’équilibre (parfois qualifié de sophistiqué) obtenu par élimination des stratégies dominées, c’est-à-dire celles qu’on n’a jamais intérêt à jouer. 49 L’autre est ici objectivé, mais d’une manière très spécifique. Il ne s’agit pas d’essayer de prévoir son comportement mais de s’en tirer le moins mal possible, dès lors qu’on considère que cette prévision est impossible. Il est cependant question d’une objectivation de l’autre, puisque je considère que sa stratégie m’apparaîtra de façon exogène ou objective. 50 Cette stratégie prudente (ou maximin) peut d’ailleurs être définie non seulement dans un univers interindividuel (jeux face aux autres), mais encore dans les jeux « contre la nature » (univers objectif incertain).
38
3.4
Le décideur face à ses choix
LES DÉVELOPPEMENTS CONTEMPORAINS DE LA « NOUVELLE MICROÉCONOMIE »
Au cours des deux dernières décennies, l’usage de la théorie des jeux s’est pour ainsi dire généralisé en analyse micro-économique, ce qui s’est accompagné d’un changement substantiel de perspective, au point que l’on parle d’une « nouvelle microéconomie » 51. L’emploi de la théorie des jeux s’est souvent accompagné d’une utilisation de l’économie de l’information, laquelle revient sur l’hypothèse d’information parfaite, en développant notamment la notion d’information asymétrique, qui peut générer de l’antisélection 52 ou du risque moral 53. Cette association de la théorie des jeux et de la théorie de l’information n’a rien d’artificiel : toute configuration de jeu repose sur des hypothèses informationnelles ; et les situations d’informations asymétriques engendrent des comportements stratégiques. Le recours à cet outillage informationnel et stratégique a notamment permis de reconsidérer le vaste champ des relations marchandes (développement de la concurrence imparfaite) et organisationnelles (développement de l’économie des contrats). La microéconomie traditionnelle a privilégié une structure marchande : la concurrence parfaite, qu’on définit usuellement par quatre hypothèses : (1) l’atomicité 54 ; (2) l’homogénéité du produit ; (3) la transparence de l’information et (4) la fluidité du marché. La nouvelle microéconomie a développé les situations de concurrence imparfaite, qui relâchent au moins une des quatre hypothèses du cadre référentiel. Elle a ainsi par exemple repris et développé l’analyse (1) des monopoles et des oligopoles, (2) de la différenciation des produits, (3) de l’information imparfaite sur la qualité des produits, (4) des barrières à l’entrée. Ces situations sont très diverses, mais elles ont en commun d’engager des comportements stratégiques, et de mettre au premier plan les problèmes informationnels. Pour montrer comment l’analyse de la concurrence imparfaite a recours à la théorie des jeux, on peut prendre l’exemple du duopole. Dans le duopole de Cournot, chaque offreur choisit la quantité qu’il apporte au marché, en supposant que celle de l’autre est donnée (objectivation substantielle) ; et l’équilibre dit de Cournot-Nash qui en découle est l’intersection des fonctions de réaction (ou de meilleure réponse) de l’un à l’autre. Dans le duopole de Stackelberg, le jeu simultané de Cournot est transformé en jeu séquentiel avec producteur-initiateur (qui objective procéduralement l’autre) et producteur-suiveur (qui objective substantiellement l’autre) ; et on peut en déduire un équilibre asymétrique dit de Stackelberg. Corrélativement à son intérêt privilégié pour la concurrence parfaite, la microéconomie traditionnelle partitionnait nettement les relations marchandes d’une part, objet essentiel de ses investigations, et les relations organisationnelles d’autre part, 51 Voir Cahuc (1993), dont on reprend ici la présentation. 52 Sur l’antisélection (adverse selection), voir le chapitre 4 du présent ouvrage ou Guerrien (1996) pages 29 et 30, ou encore Cahuc (1993) pages 56 à 63. 53 Sur le risque moral (moral hazard), voir chapitre 4 du présent ouvrage ou Guerrien (1996) page 436, ou encore Cahuc (1993) pages 63 à 74. 54 L’idée n’est pas exactement qu’il y a beaucoup d’agents sur le marché, mais plutôt qu’il y en a tellement qu’aucun n’est en mesure d’influencer ou de manipuler le prix, qui dès lors apparaît comme une donnée pour chaque agent.
Au cœur du débat : la théorie économique de la décision
39
considérées comme hors champ d’analyse car strictement technologiques ou dévolues à la sociologie. La nouvelle microéconomie atténue cette distinction et étend son champ d’analyse grâce à la notion de contrat (explicite ou non), qui subsume relations marchandes et relations organisationnelles. Cette voie a été ouverte par Coase 55, qui applique la notion de coûts de transaction (notamment liée à l’information imparfaite) aux décisions de faire ou de faire faire (make or buy decisions), c’està-dire au problème de l’arbitrage entre l’organisation interne et le marché externe. Selon cet auteur, la solution est donnée dans le cadre d’un calcul rationnel de minimisation des coûts globaux, la transaction choisie (organisationnelle ou marchande) étant la moins coûteuse. Cette perspective fondatrice a autant ouvert sur une économie des organisations aux accents hétérodoxes 56 que sur la nouvelle microéconomie. Celle-ci en est venue à proposer une vision de la firme comme « nœud de contrats » (entre employeurs et employés, entre actionnaires et managers, etc…). Du fait de l’impossibilité fréquente de décrire exhaustivement toutes les éventualités, ces contrats sont souvent incomplets, ce qui appelle des modes de gestion spécifiques mais ici toujours conformes à la rationalité maximisatrice.
4. Conclusion : conditions, limites et substituts à la rationalité maximisatrice Avant d’évoquer les formes non-maximisatrices de la rationalité, nous allons rappeler le principe de la rationalité maximisatrice et ses trois modalités, ainsi que les limites associées.
4.1
LE PRINCIPE MAXIMISATEUR ET SES TROIS MODALITÉS
Nous l’avons souligné en introduction : la décision maximisatrice repose sur un environnement objectif ou objectivé, sur un contexte stable ou stabilisé. Le sens précis de cette affirmation est le suivant : chaque choix possible « sj » du décideur j doit être associé à un résultat « rj », via une fonction 57 causale f. En outre, le décideur doit associer chaque issue rj à un indice de satisfaction Uj, via une fonction d’évaluation uj. Par conséquent, on a rj = f(sj) d’une part et Uj = u(rj) d’autre part, d’où l’on tire que Uj = uj[f(sj)] = gj(sj), la fonction gj étant la fonction composée de uj et de f, qui relie directement les choix possibles aux niveaux d’utilité associés. Le choix optimal est alors évidemment donné par le calcul de maximisation de Uj, c’est-à-dire par la recherche de l’option possible qui engendre la satisfaction la plus grande possible. Si la rationalité maximisatrice est si solide en univers objectif et certain, cela tient à la possibilité d’associer un résultat unique à chaque choix possible, possibilité exprimée par l’existence de la fonction (à une variable) f : rj = f(sj). 55 Dans un célèbre article : The Nature of the Firm, Economica, 1937. Pour un développement, voir le chapitre 7. 56 Notamment avec Williamson, quand il met en avant une hypothèse de « rationalité limitée » (voir le troisième paragraphe de la conclusion). 57 En fait, il doit s’agir d’une application, qui associe à toute action possible un (et un seul) résultat émergent.
40
Le décideur face à ses choix
En univers objectif et incertain, les choses se compliquent un peu, puisque le résultat émergent ne dépend plus seulement de sj, mais aussi de l’état de la nature edmi, qui est une valeur exogène. La fonction f devenant une fonction à deux variables, rij = f(sj ; edmi), ma satisfaction ne dépend plus seulement de ma décision, mais aussi de l’état de la nature qui prévaudra : Uj = gij(sj ; edmi). L’exogénéité de l’état de la nature permet cependant de conserver la problématique maximisatrice, grâce à une objectivation probabilistique : en mobilisant la distribution de probabilité des événements possibles comme système de pondération, il est possible de maximiser l’utilité en moyenne. En univers intersubjectif et incertain, les choses se compliquent beaucoup. Comme en univers objectif et incertain, le résultat émergent ne dépend pas seulement de sj, mais aussi d’une autre variable. La difficulté supplémentaire est que cette autre variable n’est pas exogène, comme un état de la nature, mais a priori endogène : il s’agit de la stratégie si de l’autre, avec lequel je suis en interdépendance stratégique. La fonction f étant encore une fonction à deux variables, rij = f(sj ; si), ma satisfaction ne dépend pas seulement de ma décision, mais aussi de celle de l’autre : Uj = gij(sj ; si), avec interdépendance entre sj et si 58. L’objectivation probabilistique n’est plus ici adaptée, et seules les objectivations substantielles, procédurales et systémiques, qui posent toutes problème 59, permettent de conserver (souvent artificiellement) la problématique maximisatrice, sous la forme de la réponse optimale à l’autre.
4.2
LES LIMITES DE LA RATIONALITÉ
Évoquer les conditions d’exercice de la rationalité maximisatrice amène directement à aborder la question de ses limites opérationnelles, qui nous semblent pouvoir être de trois ordres. Formellement, la première limite tient à la fonction uj, la deuxième à l’ensemble Sj des actions possibles sj et la troisième à la fonction f. Premièrement, et indépendamment de l’univers considéré, la rationalité maximisatrice exige des fins commensurables et hiérarchisables. La recherche de la « meilleure » situation suppose en effet une aptitude à classer toutes les issues accessibles. Sans commensurabilité 60 de ces issues à mes yeux, la définition d’un ordre de préférence est impossible et le calcul rationnel est impossible. Sans hiérar58 Rappelons que dans la configuration précédente, edmi ne dépend pas de sj. 59 L’objectivation substantielle exprime une conjecture fausse : je prends la décision de l’autre comme donnée, alors qu’en fait elle dépend de ma décision (il joue sa meilleure réponse à ma décision). L’objectivation procédurale par le leader est spécifique, dans la mesure où elle appelle un complément (l’objectivation substantielle du suiveur) et des connaissances excessives sur l’autre (ainsi dans un duopole de Stackelberg, on suppose que le leader connaît la fonction de coût du suiveur). L’objectivation systémique est contradictoire (confusion du point de vue d’acteur et du point de vue d’observateur) et corrélativement exige des connaissances excessives (identité du savoir des agents et de celui du modélisateur). 60 Dans le cadre d’un calcul coût-avantage, cela exige qu’il y ait une commune mesure possible à tous les coûts et à tous les bénéfices. C’est parfois évident (cas du producteur qui « compte » ses recettes et ses coûts en euros), mais pas toujours (cas de Juliette qui doit trouver une commune mesure entre le coût du ticket de métro et le bénéfice de retrouver son amoureux).
Au cœur du débat : la théorie économique de la décision
41
chie 61 de ces issues à mes yeux, l’ordre de préférence n’est pas transitif et cette incohérence rend défaillant le calcul rationnel. Deuxièmement, la rationalité maximisatrice exige une connaissance exhaustive des choix possibles. Le choix rationnel étant le meilleur des choix possibles, la détermination de l’élu exige évidemment la considération de tous les candidats éligibles. Si certains seulement des choix possibles sont considérés, le meilleur parmi eux peut très bien être moins bon qu’un des choix oubliés ou restés dans l’ombre, de sorte que le prétendu choix rationnel de fait ne le serait pas 62. Troisièmement, et nous allons ici retrouver la différenciation que nous avons introduite entre les trois univers, la rationalité maximisatrice exige l’existence et la connaissance du lien de cause à effet qui doit relier tout choix décisionnel possible au résultat qu’il produit. Autrement dit : elle demande un environnement stable et connu. S’il y a instabilité du lien ou s’il y a lien stable mais méconnu, alors la maximisation chancelle. Il est en outre évident que ces problèmes risquent peu de se poser quand l’issue ne dépend que du choix (univers objectif et certain) 63 et qu’en revanche ils risquent fort de se poser quand l’issue ne dépend pas seulement du choix (univers incertain). Et ces problèmes sont plus sensibles encore si l’incertitude est endogène (gestion de si en univers intersubjectif) 64, l’objectivation étant alors plus délicate que sous incertitude exogène (gestion de edmi en univers objectif) 65.
4.3
RATIONALITÉ LIMITÉE, RATIONALITÉ SATISFAISANTE ET RATIONALITÉ PROCÉDURALE
Aborder la question des limites de la rationalité maximisatrice amène directement à évoquer le thème de la « rationalité limitée ». En mettant en avant les limites cognitives 66 que l’individu rencontre empiriquement, Simon a promu (dès 1947) la notion critique de rationalité limitée, qui s’oppose à la rationalité pleine ou illimitée. Corrélativement, l’individu ne pouvant déterminer son choix optimal, il se contente de solutions satisfaisantes 67 : on parle alors de rationalité satisfying, par opposition à la rationalité maximizing. Il est cependant apparu que la notion de rationalité limitée présentait ellemême des limites. D’une part, ses promoteurs hétérodoxes ont éprouvé des difficultés 61 Si je préfère A à B, B à C mais C à A, alors il n’y a pas d’ordre de préférence entre A, B, et C, et il est impossible de choisir rationnellement entre les trois situations, du fait de cette « boucle » qui rompt la transitivité. 62 Juliette s’interroge : aller chez Roméo ou rester chez elle ? Elle oublie peut-être la possibilité, éventuellement meilleure, de le retrouver au parc qui est à mi-distance entre leurs deux domiciles… 63 Le problème ne peut alors être que strictement informationnel, comme si par exemple Juliette ignore le prix du ticket de métro. Mais il n’est pas structurel, le résultat n’émergeant que de la décision prise. 64 Le problème est alors informationnel et structurel, résumé dans la saisie de la variable endogène si. 65 Le problème est alors informationnel et structurel, résumé dans la saisie de la variable exogène edmi. 66 Et donc moins structurelles qu’informationnelles (au sens large du recueil et du traitement de l’information).
42
Le décideur face à ses choix
à s’accorder sur une définition unique et sur une formalisation commune. D’autre part, d’autres auteurs ont ramené cette notion dans le cadre orthodoxe, en réinterprétant la rationalité limitée comme un développement de la rationalité optimisatrice, obtenu lorsqu’on ajoute aux contraintes externes usuelles des contraintes internes à l’agent (telles des capacités limitées de traitement de l’information). Par la suite, Simon a repris et affiné son projet, qui était moins d’étudier une rationalité affaiblie et sous-maximisatrice que de promouvoir une forme de rationalité alternative à la rationalité standard car adaptée à une autre vision du contexte décisionnel et du décideur. C’est en 1976 qu’il a dans cet esprit proposé la notion de rationalité procédurale, qui s’oppose à la rationalité substantielle. Selon cette conception, la « bonne » décision n’est pas la meilleure en termes de résultats, mais celle qui découle de la procédure délibérative adaptée, ou du processus réflexif pertinent. Ce basculement du plan de la décision intrinsèque à celui de la façon de décider 68 (notamment en conformité à certaines règles) est autant justifié par une conception de l’incertitude externe comme radicale que par une conception du fonctionnement mental interne comme complexe, l’idée de « traitement » de l’information exigeant de véritables activités de reconnaissance et de distinction, de hiérarchisation et de classement. À l’aune des analyses initiées par Simon, la rationalité néo-classique peut être qualifiée de pleine, de maximisatrice et de substantielle. Et paradoxalement, l’adhésion à cette rationalité mécanique ne se présente pas comme une décision rationnelle. Car il ne s’agit pas de mettre en balance les bénéfices certains de la cohérence avec certains coûts en pertinence. Il s’agit simplement de constater d’un côté les attraits de la construction de la transparence sociale, et de l’autre les dommages de l’élimination de l’opacité humaine, qu’il s’agisse de la révocation des processus mentaux ou de l’objectivation de l’autre. Des attraits et des dommages qui ne sont pas commensurables.
67 On peut prendre l’exemple d’un acheteur cherchant à acquérir un bien défini au prix le plus bas possible. Ne pouvant accéder à la connaissance de tous les prix proposés par l’ensemble des vendeurs de ce bien, il définit arbitrairement un prix critique (notion de seuil de satisfaction) et part découvrir des prix proposés (notion de search). Son critère de décision l’amène alors à conclure sa transaction avec le premier vendeur rencontré qui lui propose un prix inférieur ou égal au prix critique qu’il a au préalable défini (et éventuellement révisé au cours de sa recherche). 68 Cf. à ce sujet le chapitre 2 dans cet ouvrage.
Chapitre 2
Le décideur en action : comportements et processus psychologiques Véronique D’ESTAINTOT et Bénédicte VIDAILLET
Sommaire 1 Préférences et choix : une instabilité qui dérange
44
2 Biais cognitifs et décision
54
3 Règles de décision et stratégies de choix
66
4 Conclusion
73
44
Le décideur face à ses choix
De manière générale, ainsi que cela a été exposé dans le premier chapitre, la théorie économique de la décision appréhende le comportement décisionnel comme l’optimisation d’une fonction d’utilité construite sur des critères de parfaite cohérence. En un sens, cette approche de la décision caractérise un individu désincarné, en possession de toute l’information nécessaire, doté de préférences stables et de capacités de jugement fiables. Dans les années 1950, l’émergence de données nouvelles a profondément remis en question cette vision du comportement décisionnel. Un exemple classique illustre cette remise en cause. En 1957, L.B. Lusted et R.S. Ledley, respectivement chercheur clinicien et dentiste, entreprirent d’informatiser le processus de diagnostic médical 1. À cet effet, s’appuyant sur les axiomes standards de la théorie économique de la décision, ils conçurent un algorithme qui, à partir d’un ensemble de données cliniques, devait permettre de produire un diagnostic spécifique. Par la suite, en confrontant les diagnostics obtenus par cette méthode avec ceux établis par des cliniciens de renom à partir des mêmes données, ils relevèrent, non sans quelque surprise, des divergences fondamentales. Ainsi, même des experts s’écartaient des normes du comportement décisionnel idéal ! Comment expliquer un tel décalage ? Que doit-il inciter à remettre en cause : la théorie du choix rationnel, pour son irréalisme apparent, ou le comportement humain, pour sa faillibilité ? Cette question est au cœur du développement de l’analyse comportementale de la décision, dont les observations ont permis de mettre à jour les multiples déterminants psychologiques des processus de décision.
1. Préférences et choix : une instabilité qui dérange 1.1
LE RENVERSEMENT DES PRÉFÉRENCES
La façon dont se présente l’information concernant un même problème peut déboucher sur des choix fondamentalement contradictoires. Deux exemples classiques en psychologie de la décision serviront à illustrer ce phénomène : ils révèlent le renversement problématique des préférences, lié de façon systématique à des facteurs qui, en théorie, devraient être neutres dans la décision. Nous proposons maintenant au lecteur de répondre aux questions qui seront posées et de rester attentif à ses propres processus de fonctionnement. Voici le premier exemple 2. 1 2
Décrit dans Palmarini (1995, p. 209). Proposé par Lichtenstein et Slovic (1971).
Le décideur en action : comportements et processus psychologiques
45
PROBLÈME 1 Choisissez la loterie que vous préférez entre A et B 3 Loterie A Loterie B 35/36 chances de gagner 4,00 € 11/36 chances de gagner 16,00 € 1/36 chances de perdre 1,00 € 25/36 chances de perdre 1,50 € Votre réponse :.............. PROBLÈME 2 Pour chacune des loteries suivantes, indiquez la valeur de la somme qui vous rendrait indifférent entre participer à la loterie ou recevoir une telle somme (cette somme s’appelle la valeur certaine équivalente) : Valeur Certaine Equivalente : Loterie A 35/36 chances de gagner 4,00 € 1/36 chances de perdre 1,00 € ……………………….€. Loterie B 11/36 chances de gagner 16,00 € 25/36 chances de perdre 1,50 € ………………………..€ Comparez vos réponses aux deux problèmes.
Les individus interrogés sur ces deux problèmes manifestent généralement une forte tendance à choisir la loterie A dans le problème 1, tout en attribuant une valeur certaine équivalente plus élevée à la loterie B dans le problème 2. Or, en théorie, les réponses devraient indiquer une préférence pour la même loterie dans les deux problèmes, puisque les loteries présentées sont identiques. Ainsi, lorsqu’on demande à des individus de choisir entre deux loteries dont les valeurs monétaires espérées sont équivalentes 4 (problème 1), caractérisées l’une par une forte probabilité de réalisation d’un gain modéré — loterie A —, et l’autre par une faible probabilité de réalisation d’un gain important — loterie B —, ils ont tendance à choisir la loterie présentant la plus forte probabilité de gagner, soit A. Si, par contre, on demande aux mêmes individus de déterminer le prix minimum auquel ils accepteraient de vendre chacune de ces deux loteries, c’est-à-dire leur « équivalentcertain » (problème 2), paradoxalement, ils ont tendance à attribuer une valeur supérieure à la loterie permettant d’obtenir le gain le plus important (loterie B). Dans la mesure où choix (problème 1) et mesure d’équivalence (problème 2) conduisent à des résultats inversés, l’ordre de préférence des individus semble donc fortement déterminé par la forme de la question posée. Le second exemple 5 illustre un deuxième facteur susceptible de faire varier les choix. PROBLÈME 3 Imaginez que les États-Unis se préparent à l’arrivée d’une maladie asiatique rare dont on peut supposer qu’elle fera 600 victimes. Deux programmes A et B sont proposés 3 Afin que les énoncés soient plus adaptés au lecteur français, nous avons transformé les dollars de l’expérience initiale en euros. 4 Selon la théorie de l’Utilité Espérée, le gain moyen de la loterie A est 3,86 € (= 35/36 × 4 € – 1/36 × 1 €) et celui de la loterie B est 3,85 € (= 11/36 × 16 € - 25/36 × 1,5 €). 5 Kahneman et Tversky (1979b).
46
Le décideur face à ses choix
pour combattre cette maladie. Selon les estimations scientifiques des experts, l’adoption de chacun des programmes aura les conséquences suivantes : Adoption du programme A : 200 personnes seront sauvées. Adoption du programme B : il y a une chance sur trois pour que les 600 personnes soient sauvées et deux chances sur trois pour qu’aucune ne le soit. Pour lequel de ces programmes vous prononceriez-vous ? Avant de continuer, essayez de réfléchir et de faire votre choix. PROBLÈME 4 Imaginez que les États-Unis se préparent à l’arrivée d’une maladie asiatique rare dont on peut supposer qu’elle fera 600 victimes. Deux programmes C et D sont proposés pour combattre cette maladie. Selon les estimations scientifiques des experts, l’adoption de chacun des programmes aura les conséquences suivantes : Adoption du programme C : 400 personnes mourront. Adoption du programme D : il y a une chance sur trois pour que personne ne meure et deux chances sur trois pour que les 600 personnes meurent. Pour lequel de ces programmes vous prononceriez-vous ? Bien qu’il ne soit pas très indiqué de donner les deux versions l’une derrière l’autre, nous suggérons de nouveau au lecteur de réfléchir et de faire son choix.
Comme on peut le constater en comparant attentivement les deux énoncés, les programmes A et C sont les mêmes, ainsi que les programmes B et D. La seule différence entre les deux énoncés consiste à décrire les résultats des programmes en termes de vies sauvées dans le problème 3, et de vies sacrifiées dans le problème 4. Cette différence suffit à provoquer une inversion systématique des choix : – Dans le problème 3, s’agissant d’un gain (vies sauvées), le choix de la majorité des personnes interrogées (72 % d’un échantillon de 152 personnes) va à l’encontre du risque : la majorité des personnes préfère l’option A, qui exprime une certitude. – Au contraire, dans le problème 4, s’agissant d’une perte (vies sacrifiées), le choix de la majorité (78 % d’un échantillon de 155 personnes) consiste à accepter le risque : la majorité préfère l’option D qui exprime une incertitude. Ainsi, selon que les conséquences sont présentées en terme de gain ou de perte, les individus seront plus ou moins sensibles au risque perçu : ils auront tendance à préférer une conséquence certaine lorsqu’il s’agit d’un gain tandis qu’ils seront prêts à prendre un risque quand il s’agit d’une perte. En fait, d’un point de vue strictement « mathématique », les options A, B, C et D sont équivalentes. En effet, les options B et D « valent » : 2/3 × 600 + 1/3 × 0 = 400 morts (soit 200 personnes sauvées). La théorie de la décision (cf. chapitre 1) prédirait donc que nous devrions être indifférents non seulement au choix entre A et B et au choix entre C et D, mais également entre ces 4 possibilités. Or ce n’est pas du tout ce que l’on observe, puisque dans chaque problème, la majorité des individus exprime une préférence pour une des deux options. D’un point de vue psychologique, il n’est pas du tout choquant, ni irrationnel, que nous n’accordions pas la même valeur à une option certaine et à une option incertaine, et que nous préférions A à B, par exemple, ou D à C. Par contre, en toute logique, si nous préférons l’option certaine dans le problème 3, nous devrions conti-
Le décideur en action : comportements et processus psychologiques
47
ENCADRÉ 6
Pièce de théâtre et effet de cadrage On joue au théâtre une pièce que vous aimez beaucoup. Le billet coûte 50 euros. Imaginez maintenant les deux situations suivantes : Vous avez acheté votre billet à l’avance. Lorsque vous arrivez au théâtre, vous vous rendez compte que vous l’avez perdu. Vous n’aviez pas de fauteuil réservé et le billet ne peut être récupéré. Allez-vous payer 50 euros pour acheter un autre billet (vous avez la somme sur vous) ? Vous ne prenez pas votre billet à l’avance. Lorsque vous arrivez au théâtre, vous vous rendez compte que vous avez perdu 50 euros échappés de votre porte-feuille. Allezvous payer 50 euros pour acheter un billet (vous avez la somme sur vous) ? Dans cette expérience réalisée sur un large échantillon, 38 % des personnes ne sont pas prêtes à aller voir la pièce dans le premier cas, contre 17 % dans le second a. Ainsi, la seconde formulation incite plus que la première à acheter quand même un billet. Il n’y a aucune rationalité économique à ce choix, dans la mesure où dans les deux cas, vous vous retrouvez avec 50 euros de moins et vous devez décider si vous allez ou non en dépenser 50 autres. La différence entre les deux situations résulte de ce que dans un cas, vous avez l’impression d’avoir déjà utilisé le « budget théâtre » et pas dans l’autre. Là encore, cela renvoie à la manière dont vous avez cadré le problème, et en particulier au fait que vous ayez considéré que la perte des 50 euros et l’achat d’un billet faisaient partie du même problème ou étaient dissociés. a. cf. Kahneman, Slovic et Tversky (1982).
nuer à préférer l’option certaine dans le problème 4. Or nous changeons d’avis selon que les options sont exprimées en termes de vies sauvées ou de morts. Ce problème de la maladie asiatique peut apparaître assez « épuré » et même peu réaliste. Cependant, le phénomène qu’il permet de mettre en évidence (connu sous le nom d’« effet de cadrage ») a été observé dans de multiples circonstances et en particulier dans des exemples cliniques beaucoup plus concrets et de ce fait plus préoccupants. Par exemple, une étude réalisée auprès de médecins et fondée sur des données cliniques réelles montre que la majorité des praticiens est sujette à l’effet de cadrage. Ainsi, si on leur dit qu’une intervention chirurgicale « entraîne une mortalité moyenne de 7 % dans les cinq années suivant l’opération », ils hésiteront à la recommander à leurs patients, alors que si on leur dit que « l’on note une survie moyenne de 93 % cinq ans après l’opération », ils auront nettement plus tendance à la recommander 6. Cet effet de cadrage, qui sera évoqué plus en détail dans la suite de ce chapitre, révèle que les processus de décision sont différents pour les gains et pour les pertes, et que les individus sont influencés par le contexte dans leur attitude face au risque. Le renversement systématique des préférences en fonction du contexte décisionnel est problématique car il suggère que les éléments sur lesquels sont fondées les décisions ne sont pas stables et bien établis. Or ceci est contraire aux postulats de 6
Mc Neil, Paulker, Sox et Tversky (1982).
48
Le décideur face à ses choix
la théorie économique de l’utilité espérée, tenus pour garants d’un choix rationnel 7. Ces postulats supposent que les individus sont capables de manifester à la fois des croyances cohérentes — qui s’expriment par des jugements prédictifs concernant des événements futurs — et des préférences cohérentes — qui s’expriment par des jugements de valeur. Qui plus est, ces croyances et ces préférences doivent rester indépendantes les unes des autres, dans la mesure où il serait insensé que le fait de désirer un événement influence le jugement porté sur la probabilité que cet événement se produise, et réciproquement. Ces postulats ont une traduction opérationnelle. Pour être cohérents, les jugements prédictifs, exprimés sous la forme de probabilités, doivent respecter les règles mathématiques de la théorie des probabilités. Ainsi, par exemple, si on estime que la probabilité qu’il neige demain est de 0,4, alors on doit nécessairement estimer que la probabilité qu’il ne neige pas demain est de 0,6. En ce qui concerne les préférences, dire qu’elles sont cohérentes revient à dire que l’individu est capable d’établir un ordre de préférence cohérent sur un ensemble d’options : il doit pouvoir les classer en fonction de la valeur croissante (ou décroissante) qu’elles ont à ses yeux. Trois propriétés en découlent : la transitivité 8, la dominance 9 et l’invariance 10. Or ces propriétés sont violées quand on observe des inversions dans les choix comme celles qui ont été mises en évidence ci-dessus. Ces constats ont conduit à l’investigation des processus de formation des jugements et à la proposition de modèles de choix alternatifs au modèle de l’utilité espérée. Nous restons toujours pour le moment dans le cadre des choix en situation d’incertitude.
1.2
LA « THÉORIE DES POSSIBILITÉS » 11 : UN MODÈLE FONDATEUR
Pour rendre compte de phénomènes comme ceux qui sont observés ci-dessus, Kahneman 12 et Tversky ont proposé en 1979 un modèle baptisé la « théorie des possibilités ». La théorie des possibilités distingue deux phases dans le processus de choix : une phase d’interprétation et de reformulation des données, puis une phase d’évaluation. La première phase consiste à analyser les éléments du problème en les interprétant. L’interprétation donnée est influencée par la manière dont le problème est présenté, ainsi que par les normes, les habitudes et les attentes du décideur. Ensuite, les « possibilités », telles qu’elles sont désormais considérées, peuvent être évaluées pour aboutir au choix de celle qui a la valeur la plus élevée — soit par com7 Voir chapitre 1 pour plus de détails. 8 Transitivité : l’ordre des préférences est transitif pour les options A, B et C si, A étant préféré à B et B étant préféré à C, alors A est préféré à C. 9 Dominance : dans un ensemble d’options, si l’option A est préférable à l’option B sur chacune de leurs caractéristiques comparées une à une, alors on dit que l’option A domine l’option B. L’option B peut donc être éliminée de l’ensemble car elle ne pourra jamais être préférée à l’option A, du fait de cette dominance. 10 Invariance : si l’option A est préférée à l’option B, alors cette préférence doit persister indépendamment d’une part de la façon dont sont présentées les options et d’autre part de la façon dont on demande d’exprimer les préférences (classement, notation, évaluation monétaire …). 11 Cette théorie est connue en anglais sous le nom de Prospect Theory (Kahneman et Tversky, 1979a). Certains la traduisent en français par « théorie des perspectives ». 12 C’est pour les apports de ses travaux en matière de décision et de choix que Daniel Kahneman a obtenu le prix Nobel d’économie en 2002.
49
Le décideur en action : comportements et processus psychologiques
paraison de leurs valeurs respectives, soit par identification de la possibilité dominante. La théorie des possibilités comporte deux dimensions : une fonction d’évaluation qui joue un rôle similaire à celui de la fonction d’utilité du modèle de l’utilité espérée, et une fonction de pondération qui s’applique à la valeur des options, et qui correspond aux poids attachés aux probabilités qui les caractérisent. Ainsi, la comparaison finale entre les perspectives qui s’offrent au décideur (soit les différentes possibilités) s’effectue sur la base d’une comparaison de leur valeur finale, qui intègre les évaluations pondérées de leurs composants. La fonction d’évaluation de la théorie des possibilités présente trois caractéristiques spécifiques, qui apparaissent dans la figure 1.
0 Pertes
Gains
Pondération de la probabilité
Valeur subjective 1
0,5
0
1 0,5
Probabilité fournie au sujet
FIGURE 1 – Les fonctions de valeur subjective et de pondération des probabilités dans la théorie des possibilités
Premièrement, il est supposé que les individus, plutôt que d’évaluer les états finaux, adoptent un point de référence à partir duquel ils considèrent les options comme des gains ou comme des pertes (en termes de richesse ou de bien-être par exemple). Cette approche est basée sur l’idée que les gens sont généralement plus sensibles aux différences qu’aux valeurs absolues. Le changement des points de référence induit des comportements différents : par exemple, les courtiers tendent à fuir le risque s’ils ont gagné la veille, mais prennent davantage de risques s’ils ont perdu la veille 13. La plupart du temps, le point de référence naturellement utilisé est la situation dans laquelle se trouve le décideur au moment du choix, mais d’autres points de référence tout aussi subjectifs peuvent également être adoptés, comme par exemple la valeur de ce que possède autrui. En déplaçant le point de référence, on peut faire en sorte qu’une même option soit perçue de façon plus ou moins prononcée comme un gain ou comme une perte. Par exemple, lorsqu’un article est en promotion, si le consommateur prend comme point de référence la valeur initiale de l’article, il a l’impression de faire un gain en achetant, alors que s’il prend comme point de réfé13 Shapira (1999).
50
Le décideur face à ses choix
rence le prix d’un produit équivalent mais d’une autre marque, et moins cher que celui qui est en promotion, il a l’impression de faire une perte en achetant, et aura moins tendance à acheter le produit en promotion. Deuxièmement, la forme de la fonction d’évaluation de la théorie des possibilités — concave pour les gains et convexe pour les pertes — traduit le fait que les individus sont d’autant plus sensibles aux différences entre les options qu’elles sont proches du point de référence. Eprouverez-vous la même satisfaction à gagner 10 euros, si cela vous fait passer de 10 euros à 20 euros, ou de 110 euros à 120 euros ? Pour la plupart des gens, la valeur subjective accordée aux 10 euros est supérieure quand elle permet de passer d’un avoir de 10 à 20 euros. Posez-vous la question symétrique lorsqu’il s’agit d’une perte ? Ne seriez-vous pas plus furieux d’avoir perdu 10 euros s’il vous reste 10 euros plutôt que 110 euros ? La troisième caractéristique de la fonction d’évaluation de la théorie des possibilités tient au fait que sa pente est plus forte du côté des pertes que du côté des gains : psychologiquement, une perte de 150 euros est ressentie plus intensément qu’un gain de 150 euros. Enfin, la fonction de pondération des probabilités montre que les faibles probabilités sont trop fortement pondérées alors que les fortes probabilités le sont insuffisamment, ce qui conduit à des distorsions dans l’évaluation des options. De plus, elle n’est définie que pour des probabilités comprises entre 0 et 1, prenant respectivement les valeurs 0 et 1 pour des probabilités de 0 et 1. C’est ainsi qu’on observe un biais en faveur de la certitude : des individus seront prêts à payer plus cher une police d’assurance éliminant totalement un risque qu’une police réduisant le risque dans les mêmes proportions, mais sans ôter au résultat final son caractère aléatoire. La théorie des possibilités fournit donc un cadre général pour décrire les choix en situation d’incertitude. Elle s’inscrit dans la lignée de travaux antérieurs qui ont permis de caractériser les processus psychologiques sous-jacents à la formation du jugement porté sur les éléments d’une décision. Ces travaux ont conduit, notamment, à s’interroger sur la capacité des individus à traiter l’information qui leur est présentée, sur la façon dont ils sont influencés par l’environnement et sur les stratégies adoptées lorsque la tâche leur semble trop ardue ou qu’ils sont soumis à diverses contraintes.
1.3
OÙ SONT LES VRAIES PRÉFÉRENCES ?
L’un des premiers à avoir souligné les limites des capacités cognitives individuelles fut Herbert Simon en 1955 (cf. également la dernière partie du chapitre 1). Ces limites structurelles du cerveau humain affectent tant la qualité des informations brutes qui sont traitées, que celle du traitement et de l’intégration de ces informations. Pour une meilleure compréhension de ce qui va suivre, la figure 2 présente le schéma général du processus de formation du jugement humain, tel que le représente la psychologie cognitive, qui étudie l’individu dans son activité de traitement de l’information.
Le décideur en action : comportements et processus psychologiques
ENCADRÉ 7
Quand l’incertitude porte sur l’incertitude … Nous avons évoqué l’attitude face au risque quand les probabilités sont définies avec précision. Qu’en est-il maintenant lorsque les probabilités sont elles-mêmes incertaines ? Considérez le problème suivant a : Une urne contient 90 boules : 30 boules rouges et 60 boules qui sont soit noires soit jaunes, sans que l’on sache exactement combien sont noires ni combien sont jaunes. On tire une boule au hasard. Le jeu consiste à parier sur la couleur de la boule tirée. Les gains sont déterminés par la couleur de la boule tirée. Dans chacun des cas ci-dessous, vous devez choisir entre deux paris. Les résultats sont spécifiés pour chaque pari, en fonction de la couleur de la boule tirée au sort. Cas n° 1 : Choix (a) : parier sur rouge Choix (b) : parier sur noir Quel pari choisissez-vous ? Cas n° 2 : Choix (c) : parier sur rouge et jaune Choix (d) : parier sur noir et jaune Quel pari choisissez-vous ?
Rouge (30 boules) $ 100 $0
Noir Jaune (60 boules) $0 $0 $ 100 $0
Rouge (30 boules) $ 100 $0
Noir Jaune (60 boules) $0 $ 100 $ 100 $ 100
En général, on observe une tendance à choisir le pari (a) dans le cas n° 1 et le pari (d) dans le cas n° 2. Or, si l’on regarde les deux cas de plus près, on s’aperçoit que les choix devraient en théorie être plus cohérents : le choix (a) dans le cas 1 devrait aller de pair avec un choix (c) dans le cas 2, de même que le choix (b) devrait aller de pair avec le choix (d). En effet, les enjeux liés à la couleur jaune ne devraient en toute logique pas influencer les choix, puisqu’ils donnent lieu au même résultat au sein de chaque cas. Or les choix observés ici traduisent une préférence pour un gain dont la probabilité est connue avec certitude. Que se passe-t-il donc ? De toute évidence, ce ne sont ni les montants en jeu, ni les probabilités globales qui leur sont affectées qui déterminent les choix. C’est une autre dimension qui intervient : il s’agit de la nature de l’information concernant la probabilité relative des événements. Ici, elle est ambiguë. L’ambiguïté correspond à une situation intermédiaire entre l’ignorance (aucune distribution de probabilité n’est éliminée) et le risque (seule une distribution de probabilité est envisagée) : elle provient d’une incertitude quant à la distribution de probabilités à considérer dans une situation donnée. Dans l’exemple ci-dessus, on observe une tendance à éviter l’ambiguïté, mais il est des cas où elle est recherchée b. L’ambiguïté, c’est-à-dire l’incertitude quant à l’incertitude, incite les individus à violer, une fois de plus, les principes de la théorie économique … a. Tiré de Ellsberg (1961). b. Pour plus de détails, voir Einhorn et Hogarth (1985).
51
52
Le décideur face à ses choix
(1) Contexte
(2) Mémoire information
(3) Acquisition
(4) Traitement Rétroaction (5) Sorties
(6) Action
(7) Résultats
FIGURE 2 – Schéma de représentation du jugement humain
Selon Simon, la limitation des capacités cognitives individuelles affecte les diverses étapes du processus de jugement. Il en résulte que l’individu ne saurait avoir pour objectif de maximiser son utilité, contrairement aux présupposés de la théorie économique de l’utilité espérée. En effet, conscient de l’effort trop important qu’une telle stratégie exigerait, il se contente d’une stratégie visant à lui assurer une « satisfaction relative ». Aussi traite-t-il l’information jusqu’au moment où il aboutit à une solution qui lui paraît satisfaisante. Cet objectif de simplification s’applique à tous les stades du processus de décision, que ce soit au niveau de l’acquisition, de l’évaluation ou de l’intégration de l’information. Les capacités d’attention de l’individu étant limitées, la sélection d’une information dans l’environnement est en partie guidée par la signification qui lui est donnée, et par les attentes dont elle fait l’objet. C’est même la condition pour qu’elle s’intègre sans effort à la structure des informations déjà présentes en mémoire. Il est plus difficile, par exemple, pour un joueur d’échecs novice, de retenir la disposition des pièces sur un échiquier que pour un joueur expert qui, lui, a accès au schéma général du jeu 14. Aussi, la perception de l’information est-elle sélective et incomplète. D’autre part, les capacités de stockage et de rétention de la mémoire humaine sont également réduites, notamment celles de la mémoire à court terme, dont le rôle 14 Chi, Glaser et Rees (1982).
Le décideur en action : comportements et processus psychologiques
53
est de stocker provisoirement l’information. En outre le retrait des informations stockées dans la mémoire à long terme est induit par le contexte ou par la nature de la tâche à accomplir, ce qui ne garantit ni son accessibilité, ni sa pertinence par rapport au problème. En définitive, il est rare que l’individu soit en mesure de traiter de façon exhaustive l’ensemble de l’information concernant les alternatives faisant l’objet d’une décision. À cela, il faut ajouter le fait que les capacités cognitives du cerveau humain opèrent dans un contexte qui détermine en partie la formation du jugement et des préférences. L’information dont disposent les individus est rarement complète et utilisable en l’état. Son déploiement intervient généralement de façon séquentielle, surtout lorsqu’elle doit être acquise à partir de sources extérieures. Le consommateur courant d’un magasin à l’autre illustre de façon concrète ce mode d’acquisition de l’information. Souvent, l’information doit être inférée à partir des éléments présents dans le contexte. Par exemple, la description technique d’appareils photo perfectionnés fournit des indications sur la qualité et les performances de ces appareils qui pourront être exploitées par l’acheteur ; deux photographes, l’un expert et l’autre amateur, auront tendance à appréhender et à pondérer ces informations de façon très différente. De plus, des modifications mineures et a priori neutres dans la présentation de l’information ou dans la façon dont sont mesurés les jugements ou les préférences produisent des changements systématiques dans les réponses obtenues. Ces phénomènes sont largement répandus, puisqu’ils concernent aussi bien les jugements de similitude et de différence, que l’estimation de fréquences absolues ou relatives, ou encore l’expression des préférences 15. Ils manifestent donc l’influence des caractéristiques du contexte ou de la nature de la tâche sur le processus de jugement lui-même. Les individus ne sont, en général, pas conscients de l’influence du contexte sur leurs jugements. Lorsqu’on leur demande de justifier leurs choix, ils adoptent des arguments qui leur paraissent « rationnels », même si leur comportement montre qu’ils ont subi l’influence du contexte. Ainsi, dans un grand magasin, on a demandé à des clients d’examiner des articles de lingerie puis d’exprimer leurs préférences ; alors qu’ils avaient généralement tendance à préférer les articles disposés vers la droite du rayon, quels qu’ils soient, ils prétendaient tous avoir fondé leur évaluation sur la qualité relative des divers articles 16. Les exemples illustrant l’influence du contexte sur les jugements sont légion, et viennent étayer l’argumentation de certains chercheurs 17 selon laquelle les jugements et les préférences sont déterminés de manière ad hoc par le contexte. Ainsi donc, les préférences se construiraient-elles en fonction des caractéristiques globales de la décision. L’ensemble de ces observations montre que les décisions s’appuient sur des préférences et des jugements qui ne sont ni stables ni durables. Outre le fait que ce constat soit problématique au regard de la théorie économique de la décision, il soulève plusieurs questions. Comment avoir accès aux préférences réelles des individus, et quelle méthodologie employer ? Dans quelle mesure les processus de simplification 15 Cf. Hilton (1995). 16 Nisbett et Wilson (1977). 17 Par exemple, Payne et al. (1992).
54
Le décideur face à ses choix
sont-ils performants ou faillibles ? Quels critères appliquer pour en évaluer la pertinence ? La suite de ce chapitre examinera plus en détail les procédures simplificatrices utilisées par les individus afin de rendre les décisions et les choix plus gérables, compte tenu de l’ensemble des contraintes à prendre en compte. Ces procédures, appelées « heuristiques », sont nombreuses et concernent tant les décisions comportant une incertitude quant à la réalisation d’événements futurs, que les choix entre des options certaines et clairement définies.
2. Biais cognitifs et décision 2.1
LA NATURE DES BIAIS COGNITIFS
Les options de choix en contexte d’incertitude sont rarement décrites avec précision, notamment en ce qui concerne leurs probabilités de réalisation. Pour comparer différentes alternatives en présence, les individus doivent donc commencer par estimer ces probabilités. On observe qu’ils utilisent à cet effet une multitude d’heuristiques, qui leur permettent de simplifier la représentation des problèmes et d’alléger l’effort cognitif requis pour les traiter. Or les heuristiques conduisent souvent, et de façon systématique, à une distorsion des probabilités associées aux différentes alternatives. L’utilisation persistante et inappropriée de ces heuristiques est problématique dans la mesure où elle introduit des biais dans la comparaison des options de choix. Certains chercheurs autour notamment de Daniel Kahneman 18 ont identifié un certain nombre d’erreurs systématiques caractérisant le raisonnement humain, se rapportant surtout à l’évaluation et à l’interprétation d’informations quantitatives. Ces erreurs, appelées « biais cognitifs » 19 pourraient laisser croire que l’individu est un piètre statisticien, incapable d’établir des prédictions fiables : nous verrons cependant que certains de ces biais ont des propriétés fonctionnelles et adaptatives. Une grande variété de biais cognitifs a été identifiée, en particulier les biais d’ordre « statistique » : pour évaluer des informations quantitatives, les individus utilisent rarement les outils probabilistes à vocation normative, comme par exemple le théorème de Bayes 20 ; ils aboutissent, de ce fait, à des évaluations souvent erronées. En outre, les biais sont nombreux concernant le traitement de l’information dans les processus d’inférence 21, dans les jugements de causalité et de covariance, dans la représentation mentale des problèmes, ou encore dans la perception par chacun de ses propres modes de fonctionnement. Les conséquences des biais cognitifs sont problématiques à plus d’un titre. Outre le fait d’aboutir à des jugements de probabilités et de fréquences faussés, de façon plus générale, les biais cognitifs entravent les processus d’apprentissage en réduisant la recherche et l’utilisation de l’information tant quantitative que qualita18 Kahneman et al. (1982). 19 Un biais cognitif est une déviation ou une erreur systématique dans la façon d’appréhender une tâche, en référence à une procédure normative. 20 Voir chapitre 5. 21 L’inférence est l’opération intellectuelle qui consiste à construire, à partir d’un fait ou d’observations, une règle qui permette d’expliquer les faits constatés.
Le décideur en action : comportements et processus psychologiques
55
tive. Par ailleurs, les biais dans la perception des relations de causalité, de diagnosticité ou de covariance affectent la qualité du raisonnement en rendant plus difficile l’identification de l’origine des phénomènes, ainsi que des règles ou des lois explicatives 22. En raison de la multitude des biais cognitifs répertoriés, seuls les plus significatifs seront traités en détail ici.
2.2
ESTIMATION DE LA PROBABILITÉ D’UN ÉVÉNEMENT
Pour évaluer la probabilité d’un événement, l’individu aura recours, le plus souvent, à l’une des trois heuristiques suivantes, conduisant aux biais du même nom et dites respectivement : d’« accessibilité », d’« ancrage et ajustement » et de « représentativité ». L’heuristique d’accessibilité, mise en évidence par Amos Tversky et Daniel Kahneman 23 consiste pour un individu à s’appuyer, pour estimer la probabilité d’un événement, sur la rapidité avec laquelle des exemples de manifestation de cet événement lui viennent à l’esprit. Plus les exemples lui sont spontanément accessibles en mémoire, et plus la probabilité d’occurrence qu’il va attribuer à l’événement sera élevée. Par exemple, si l’on demande à une femme d’estimer le nombre de femmes de son âge actuellement enceintes, elle va penser aux exemples qu’elle connaît autour d’elle, et répondre en fonction de la facilité avec laquelle ces exemples lui viennent à l’esprit. Si un grand nombre de femmes autour d’elle sont enceintes ou ont de très jeunes enfants, elle en déduira que les gens de son âge sont très fertiles. Bien que généralement ce type de raisonnement conduise rapidement à des réponses correctes, il peut également donner lieu à des biais non négligeables. Par exemple, si une femme est enceinte, elle aura tendance à fréquenter des lieux où elle est plus susceptible de rencontrer d’autres femmes enceintes (cabinets de gynécologie ou d’obstétrique, maternités), et à remarquer plus que de coutume les autres femmes enceintes. Par conséquent, les exemples lui viendront plus facilement à l’esprit, ce qui peut la conduire à surestimer la probabilité demandée. Par ailleurs, la facilité avec laquelle on peut imaginer des événements particuliers peut biaiser l’estimation. Lorsque par exemple on demande à des personnes de deviner les causes majeures d’accident dans leur pays, elles surestiment la fréquence des morts violentes telles que celles dues à des accidents, des incendies, des meurtres... À l’inverse, la fréquence des décès associés à des causes plus communes (accidents cardiaques, maladies respiratoires...) est sous-estimée. La raison essentielle de cette distorsion tient à la médiatisation de la première catégorie de causes de décès et au caractère très marquant des images qui leur sont liées, qui rend facilement accessibles à la mémoire de tels exemples. L’heuristique d’ancrage et d’ajustement permet de réduire l’ambiguïté en contexte d’incertitude. Elle consiste, pour l’individu, à s’attacher à un point de référence, ou point d’ancrage, à partir duquel il va s’ajuster pour donner une estimation de probabilité 24. Si, par exemple, on demande à un individu d’estimer le nombre de 22 Ross et Leper (1980). 23 Tversky et Kahneman (1974). 24 Tversky et Kahneman (1974).
56
Le décideur face à ses choix
personnes ayant assisté au dernier concert des Rolling Stones à Paris, il peut lui sembler utile de savoir que leur concert à Londres avait attiré 90 000 personnes. Estimant que les Français sont moins susceptibles d’aduler le groupe que les Anglais, la réponse pourra être « 70 000 ». À travers cet exemple, on se rend compte que la fonction essentielle de cette heuristique est de permettre à l’individu interrogé de répondre, bien qu’il ne connaisse pas la réponse exacte a priori, en s’appuyant sur des informations et des connaissances qu’il possède, même si elles ne concernent pas exactement la question posée. Très souvent, la personne interrogée se prend elle-même comme point de référence. Ainsi, si l’on demande à un individu d’estimer le nombre de personnes pratiquant telle activité (par exemple : la voile), c’est lui-même qu’il utilisera comme référence immédiate. Chacun a tendance à estimer ce que font les autres à partir de son propre comportement. Ainsi, lorsque l’on demande à des patients greffés d’estimer le taux de réussite sur l’ensemble des personnes greffées, les réponses des patients ayant bien toléré ou au contraire rejeté la greffe, sont respectivement sur- et sous-évaluées 25. De même, le jugement que l’on porte sur les qualités ou les défauts d’autrui est fréquemment une inférence ajustée à partir de la note que nous nous attribuons à nous-mêmes sur les mêmes critères. Les jugements peuvent être fortement affectés par le point d’ancrage choisi. Des expériences réalisées dans le domaine juridique 26 montrent que le verdict rendu par les jurés est très dépendant du point d’ancrage donné initialement par les juges : quand ceux-ci conseillent au jury de considérer en premier lieu le verdict le plus sévère, le verdict rendu est beaucoup plus dur que lorsqu’on les encourage à commencer par le verdict le plus clément. Le choix de points d’ancrage s’observe ainsi dans de nombreux jugements formulés en contexte d’incertitude, dont la majorité des situations sociales qui sont généralement ambiguës et dépourvues de critères d’évaluation objectifs. Un point d’ancrage commode à adopter sera souvent son propre comportement, et lorsque celui-ci lui-même est ambigu, celui des autres. Or, les biais et les erreurs de jugement issus de ce mode de raisonnement sont importants, en particulier lorsque les références choisies sont inappropriées, erronées, ou peu représentatives de l’univers considéré (cf. encadré 8). Enfin, l’heuristique de représentativité apparaîtra probablement très familière au lecteur. Considérons la description suivante 27 : « Steve est très timide et en retrait par rapport à son environnement. Il est toujours serviable, mais il s’intéresse peu aux autres ou au monde extérieur. Très doux, il aime l’ordre et les choses structurées. Il a une passion pour les détails. Quel est le métier qui semble le plus probable pour Steve ? Est-il agriculteur, trapéziste, libraire, maître nageur secouriste, ou chirurgien ? » Qu’allez-vous répondre ? La réponse qui vient le plus spontanément à l’esprit est « libraire ». 25 Mc Cauley et al. (1985). 26 Greenberg et al. (1986). 27 Tversky et Kahneman (1974).
Le décideur en action : comportements et processus psychologiques
57
ENCADRÉ 8
La crise de Nantes : un point d’ancrage inadapté qui contribue à faire prendre une décision disproportionnée a En 1987, à Nantes, une cellule de crise réunie pour gérer l’événement, décide de déclencher un plan Orsec et d’évacuer 40 000 personnes, pour un nuage qui se révèlera finalement non toxique. Cette décision a été fortement influencée par l’interprétation qui a été faite de la mesure du taux d’acide nitrique du nuage. Cette mesure était de 5 ppm (particules par millions) et une question importante pour la cellule de crise a été d’évaluer si ce taux était ou non dangereux pour la population. Comme aucun des experts présents dans la cellule ne savait précisément répondre à cette question, une fiche de l’INRS (Institut National de la Recherche Scientifique) a été utilisée comme « point d’ancrage ». Cette fiche mentionne que : « En France, le Ministère du Travail a fixé respectivement à 4 ppm et à 2 ppm le niveau maximal et le niveau moyen d’exposition à l’acide nitrique, en contexte de travail. » Elle stipule également qu’aux États-Unis, le taux maximal indiqué par le département du travail est de 25 ppm. Les membres de la cellule de crise, et en particulier le préfet, ont considéré que le taux de 5 ppm était supérieur au taux maximal de 4 ppm indiqué dans la fiche (point d’ancrage), ce qui était un indice de la dangerosité du nuage. En fait, l’ajustement a été insuffisant puisque le taux de 4 ppm correspondait à une exposition chronique et non aiguë, en contexte confiné et non à l’air libre. De plus, l’utilisation du taux américain (25 ppm) comme point d’ancrage aurait conduit à modérer là encore le diagnostic de toxicité. a. Vidaillet (2001).
Si l’on avait l’information requise sur la fréquence avec laquelle sont exercés ces différents métiers et sur les traits de personnalité caractérisant les individus pour chacun d’entre eux, il serait possible d’en déduire la probabilité de rencontrer un chirurgien timide, un trapéziste serviable etc., de manière à pouvoir estimer la probabilité pour Steve d’appartenir à l’une de ces catégories. Cependant, cette opération nécessiterait beaucoup de temps et un coût d’obtention de l’information élevé. Dans de tels cas, l’heuristique de représentativité est commode et aide à donner une réponse rapide. Il s’agit d’estimer dans quelle mesure Steve est en moyenne représentatif du profil considéré dans chaque catégorie, et de procéder au jugement uniquement en fonction du métier. Ainsi, la réponse donnée par la majorité des personnes indique que Steve doit être libraire, puisque les caractéristiques données correspondent au stéréotype de ce métier. L’heuristique de représentativité est donc un jugement porté sur une relation de similarité (i.e. dans quelle mesure les caractéristiques de A correspondent-ils à la catégorie B ?), qui conduit à l’estimation d’une probabilité. Elle est fréquemment utilisée pour répondre à des questions telles que : quelle est la probabilité pour que tel événement ou telle personne A appartienne à la catégorie B ? (par exemple, Pierre est-il un joueur de rugby ?), ou encore : l’événement A est-il à l’origine du processus B ? (par exemple : la séquence de lancer d’une pièce Pile-Pile-Face-Face est-elle due
58
Le décideur face à ses choix
au hasard ?). L’utilisation de cette heuristique aboutit généralement à des réponses correctes, parfois aussi valables que celles qui sont obtenues par une analyse plus exhaustive de toute l’information disponible. Cependant, en procédant de la sorte, le décideur peut être conduit, en situation de choix, à négliger certains facteurs susceptibles d’affecter la probabilité recherchée. Son jugement se trouve alors biaisé au sens où l’individu ne prend pas en compte la probabilité initiale de chaque option. Si Steve vit à la campagne, dans une région dans laquelle vivent très peu de libraires et beaucoup d’agriculteurs, ce facteur modère nécessairement l’estimation finale. Par ailleurs, en procédant à un jugement sur le critère de représentativité, le décideur ignore la taille de l’échantillon. Considérons l’énoncé suivant : « Si vous venez d’ouvrir un magasin et que quatre clients sur les cinq de la première journée sont ingénieurs, avec quelle assurance pouvez-vous penser que le prochain client risque d’être ingénieur ? Et si, au cours de la première journée, vous avez eu non pas cinq mais trente clients, et que douze d’entre eux étaient ingénieurs, dans quelle mesure serez-vous plus ou moins certain, par rapport au cas précédent, que le prochain client sera un ingénieur ? » En général, les individus interrogés estiment plus probable que le client suivant soit un ingénieur dans le premier cas que dans le second. Pourtant, la théorie de l’échantillonnage démontre que les estimations issues d’un grand échantillon sont plus fiables que celles issues d’un échantillon restreint : douze sur trente est un indicateur plus fiable que quatre sur cinq. Le recours à l’heuristique de représentativité comporte également l’inconvénient de ne pas tenir compte de la valeur prédictive de l’information donnée, c’est-àdire de sa pertinence ou de sa qualité. Ainsi, selon que l’information sur la timidité de Steve a été donnée par sa nourrice il y a trente ans, ou par son épouse avec qui il est marié depuis dix ans, sa valeur prédictive pour le jugement donné est plus ou moins grande. Enfin, les a priori sur la notion de hasard et sur la manière dont les choses sont sensées se produire peuvent biaiser le jugement. Par exemple, dans un jeu de pile ou face, la majorité des personnes interrogées jugeront que la séquence Pile-Face-FacePile-Face-Pile a plus de chances d’être liée au hasard que la séquence Pile-Pile-PileFace-Face-Face, alors que les deux séquences ont statistiquement autant de chances de se produire. Par conséquent, bien que l’heuristique de représentativité soit pratique et permette généralement d’estimer rapidement une probabilité, elle peut conduire à des biais de raisonnement et à des jugements erronés.
2.3
L’INDIVIDU FACE À LA FIABILITÉ DE SON PROPRE JUGEMENT : SÛR DE LUI OU… SUFFISANT ?
La plupart des individus ont tendance à accorder une confiance excessive à la valeur de leur propre jugement. De plus, ils ont des difficultés à distinguer les situations sur lesquelles ils ont prise de celles dont le contrôle leur échappe. Enfin, ils sont souvent pénalisés par les erreurs qu’ils commettent en voulant vérifier les fondements de leurs hypothèses.
Le décideur en action : comportements et processus psychologiques
59
Le plus souvent, face à des questions de culture générale comme, par exemple : « en quelle année le Général De Gaulle est-il mort ? », ou bien encore « quelle est la durée de gestation d’un éléphant d’Asie ? », les individus interrogés manifestent une forte tendance à accorder une confiance excessive dans la performance de leur propre jugement 28. Pour évaluer l’ampleur de ce phénomène, on procède de la façon suivante. Après avoir demandé à une personne de répondre à la question posée, on lui demande de préciser son degré de confiance dans sa propre réponse. Pour traduire son degré de certitude (ou d’incertitude), elle doit indiquer la probabilité que, selon elle, sa réponse soit juste. En reprenant l’exemple ci-dessus, cela revient à indiquer que la réponse : « De Gaulle est mort en 1974 » a, par exemple, 80 % de chances d’être vérifiée. Il faut bien comprendre que la validité de ce jugement de probabilité ne se mesure pas en fonction de la véracité de la réponse : ce n’est pas parce que De Gaulle est mort en 1970 que l’on peut dire que l’individu a tendance à surestimer la valeur de son jugement. Ce constat permet seulement de dire a posteriori qu’il s’est trompé dans sa réponse. La mesure utilisée pour évaluer la fiabilité du jugement d’un individu est son degré de « calibration ». Pour obtenir cette mesure, il faut d’abord poser à cet individu une série de questions du même type, en lui demandant, par exemple, d’indiquer la date du décès d’une centaine de personnalités connues et de préciser son degré de certitude en la réponse qu’il donne. Ensuite, il faut considérer le nombre de réponses correctes. Si, pour toutes les réponses communiquées avec un degré de certitude de 80 %, il s’est trompé dans plus de 20 % des cas, on dira que son jugement est mal calibré et qu’il accorde une trop grande confiance à l’exactitude de son jugement. De même, s’il a raison dans plus de 80 % des cas, on dira également que son jugement est mal calibré parce qu’il sous-estime la validité de son jugement. Un jugement fiable est donc un jugement bien calibré. Or, de nombreuses études 29 montrent que les individus ont souvent tendance à mal calibrer leur jugement et surestiment leurs capacités de jugement dans la plupart des domaines. Cette tendance est très générale et a été observée dans de nombreuses professions (médecins, managers, scientifiques, par exemple). Ce biais s’observe même lorsque l’on demande aux individus s’ils seraient prêts à parier des espèces sonnantes et trébuchantes sur l’exactitude de leur réponse, ce qui montre à quel point ils sont peu conscients de la mauvaise calibration de leur jugement, qui pourrait cependant les conduire à perdre beaucoup d’argent dans ce cas. Cette tendance est d’autant plus prononcée que l’information disponible est cohérente et importante en quantité, indépendamment de sa qualité et de sa pertinence 30. Slovic et ses collègues ont par exemple réalisé des expériences impliquant des pronostiqueurs professionnels de courses de chevaux. 8 pronostiqueurs devaient estimer les probabilités de victoire de chaque cheval à partir d’informations données sur chaque cheval et sur son histoire. Tout d’abord, ils n’ont été autorisés à utiliser 28 Oskamp (1965). 29 Cf. par exemple Slovic et al. (1977). 30 Idem.
60
Le décideur face à ses choix
que 5 données par cheval, choisies par eux. Ensuite, ils ont fait les mêmes prédictions en utilisant 10, puis 20 puis 40 données. Ils devaient également pour chaque prédiction estimer leurs chances de tomber juste. Et qu’a-t-on observé ? Alors que leur assurance augmente fortement au fur et à mesure qu’ils utilisent plus d’informations, leur précision (c’est à dire la corrélation entre leur prédiction et la performance du cheval) reste pratiquement stable.
Performances
40 % L’assurance augmente
30 % 20 %
La précision n’augmente pas 10 % 5
10
20
40
Nombre d’informations utilisées
FIGURE 3 – Information et assurance
Plus préoccupant encore est le constat selon lequel l’écart entre la justesse du raisonnement et le degré de confiance augmente lorsque l’individu en sait plus. Lorsqu’il se considère comme compétent dans un domaine, l’individu a en effet encore plus tendance à surestimer la qualité et la pertinence de son jugement, alors que le degré d’exactitude n’augmente pas proportionnellement à cette confiance (qui se transforme alors réellement en « suffisance »). Cette tendance à la suffisance est donc susceptible d’atteindre son maximum dans les domaines dans lesquels nous sommes considérés comme experts, c’est-à-dire dans lesquels nous risquons de créer les dommages les plus sérieux ! Un autre aspect de cette tendance à surestimer les capacités de son jugement personnel concerne les appréciations portées après coup sur la probabilité qu’un événement passé avait de se réaliser. Il s’agit du biais rétrospectif 31, qui consiste à penser qu’un événement donné avait de plus grandes chances de se produire qu’il n’en avait en réalité. En ce sens, un événement passé apparaît, après coup, avoir été relativement inévitable et sans surprise. Ce biais est problématique dans la mesure où il incite les individus à ne pas remettre en cause leurs schémas mentaux. De fait, n’ayant pas conscience de la différence entre les probabilités a priori et les probabilités a posteriori d’un événement, ils ont tendance à penser qu’ils avaient bien prédit l’événement en question et que leur jugement était par conséquent très sûr... et le resterait à l’avenir. C’est ce biais que l’on retrouve dans l’analyse historique, lorsque des événements peuvent, lorsqu’ils sont mis en évidence bien des années après, nous apparaître bien plus prévisibles qu’ils ne l’étaient réellement dans le contexte de l’époque. Plus fréquemment, c’est ce biais qui nous conduit dans la vie quotidienne à 31 Fischhoff (1975).
Le décideur en action : comportements et processus psychologiques
61
tenir des propos tels que : « J’en étais sûr », « C’était évident ! » ou « Il fallait bien que ça arrive ! », une fois seulement que l’événement s’est produit. Deux questions se posent alors : Pourquoi cette tendance à accorder une confiance excessive aux capacités de son propre jugement ? Comment faire pour remédier à ce biais systématique et pour améliorer les capacités prédictives des individus ? Plusieurs explications concernant ces distorsions ont été envisagées. D’une part, les individus semblent considérer que leur mémoire est une copie fidèle de leurs expériences, sans réaliser que le fonctionnement de la mémoire est basé sur un processus de reconstruction dans lequel des erreurs peuvent s’introduire. D’autre part, les processus psychologiques leur permettant d’aboutir aux estimations exprimées sont eux-mêmes biaisés puisqu’il s’agit bien souvent des processus de représentativité, d’accessibilité ainsi que d’ancrage et d’ajustement ! De même que ces biais, la mauvaise calibration du jugement humain et le « biais rétrospectif » sont des phénomènes très persistants, qu’il est difficile de corriger ou d’atténuer, même en attirant l’attention des individus sur leur existence 32. On peut néanmoins améliorer la performance des individus en modifiant la structure de l’information disponible. En effet, lorsque, d’une part, les individus connaissent la distribution conditionnelle des événements a priori, et que, d’autre part, ils peuvent savoir après coup si les événements prédits se sont réalisés ou non, ils sont en mesure d’améliorer leur calibration. Les météorologues, par exemple, sont réputés pour leur excellente calibration. Par ailleurs, les individus deviennent meilleurs juges de la qualité de leur propre jugement, quand on les incite à réfléchir aux raisons justifiant la négation d’une proposition ou la non-réalisation d’un événement à prédire. 33
2.4
POUR RENFORCER LE TOUT : ILLUSION DE CONTRÔLE ET TENDANCE À LA CONFIRMATION !
Une autre difficulté liée à la perception des situations conduit à l’illusion de contrôle : les individus ont du mal à distinguer les situations dans lesquelles ils exercent un contrôle sur les événements des situations dans lesquelles les événements sont le pur fruit du hasard. Ce biais se traduit par une perception accrue de leurs chances de succès dans les situations de hasard, qui provient de leur conviction d’avoir une influence personnelle sur l’issue des événements. De fait, il leur suffit, pour avoir l’impression de contribuer à augmenter leurs propres chances de succès, d’avoir la possibilité d’intervenir dans le déroulement du processus, par le biais d’une action semblable à celles que l’on utilise dans les situations où les capacités individuelles déterminent effectivement les chances de succès. Les exemples suivants illustrent le cas extrême où, dans une loterie dont seul le hasard détermine le résultat, les individus agissent comme s’ils étaient persuadés que le résultat était en partie lié à leur compétence personnelle et à leur comportement. Dans un jeu de hasard, les individus en concurrence avec quelqu’un qui leur semble moins doué et plus timide qu’eux ont tendance à parier plus que si l’autre participant avait affiché une grande assurance. De même, les participants à une loterie qui ont pu choisir eux-mêmes leur 32 Voir Koriat et al. (1980). 33 Idem.
62
Le décideur face à ses choix
ticket demandent un prix plus élevé pour la revente de ce ticket que ceux à qui on a tendu un ticket sans le leur faire choisir. Outre la compétition et la possibilité de choisir, la familiarité avec les éléments du jeu (par exemple, utilisation de lettres de l’alphabet par opposition à des signes cabalistiques) et le degré d’implication dans l’opération sont des facteurs qui induisent également une « illusion de contrôle » 34. Ce biais a pour conséquence principale de masquer la relation de cause à effet entre l’origine réelle des événements et leur réalisation, de même qu’il favorise la superstition. Il pourrait s’expliquer par la volonté intrinsèque des individus de contrôler leur environnement et d’éviter les conséquences négatives liées au fait de ne pas exercer de contrôle sur les événements, telles que, par exemple, la passivité ou l’abandon devant l’épreuve ou face à l’échec. Il est possible, en outre, que les individus éprouvent de réelles difficultés à distinguer les situations de hasard des situations requérant leur compétence : de fait, rares sont les situations où l’origine des événements est déterminée exclusivement par le hasard ou par les compétences individuelles. Cependant, l’illusion de contrôle présente le grand avantage d’être bénéfique en termes de motivation, car elle prévient le défaitisme ! On constate enfin que les individus sont de bien piètres raisonneurs, sujets à un biais de confirmation très fréquent lorsqu’ils vérifient des hypothèses concernant la véracité d’une proposition ou l’explication d’un phénomène. Supposons qu’on vous demande de découvrir la règle spécifique qui permet de générer la séquence de chiffres « 2, 4, 6 ». Pour ce faire, vous devez proposer des séquences de trois chiffres et demander si elles sont conformes à la règle ou non 35. La personne qui connaît la règle répond par oui ou par non. Vous devez énoncer la règle dès que vous pensez l’avoir trouvée. Pour procéder à cette opération, il est possible de générer deux types de séquences : soit des séquences qui visent à confirmer une hypothèse (par exemple, « 8, 10, 12 », si vous pensez que la règle consiste à générer trois chiffres pairs consécutifs), soit des séquences qui infirment cette même hypothèse (par exemple, s’agissant de la même règle, « 8, 11, 12 »). La plupart des sujets vont avoir tendance à proposer de nombreuses séquences du type « 8, 10, 12 » telles que « 12, 14, 16 », « 36, 38, 40 », dès lors que la personne qui connaît la règle va dire « oui » à leurs premiers énoncés. Cependant, les deux types de séquences (« 8, 10, 12 » et « 8, 11, 12 ») sont nécessaires pour valider la règle testée. De plus, les séquences qui infirment l’hypothèse retenue sont plus puissantes, dans la mesure où elles permettent d’éliminer rapidement les hypothèses fausses. En effet, il est impossible de définir la bonne règle si vous ne proposez que des séquences qui y sont conformes. Si, par exemple, la vraie règle consiste à « prendre trois chiffres en ordre croissant », toutes les séquences susceptibles d’être proposées seront conformes à la fois à l’hypothèse retenue (trois chiffres pairs consécutifs) et à la vraie règle ; il est donc impossible de distinguer parmi les deux. Le fait d’énoncer rapidement la séquence « 8, 11, 12 » permet d’éliminer aussitôt la règle de « trois chiffres pairs consécutifs ». Mais comme la plu34 Cf. Langer (1975). 35 Cet exemple est dû à Wason (1960).
Le décideur en action : comportements et processus psychologiques
63
ENCADRÉ 9
Le parti pris de la confirmation L’exemple qui suit est un avatar d’un test proposé par Wason a. Il permet d’illustrer, comme dans l’exemple de la séquence de chiffres « 2,4,6 », la tendance des individus à chercher systématiquement à confirmer leur hypothèse sans chercher à l’infirmer. Essayez-vous à le faire, et voyez si vous tombez dans le piège ! « On vous demande de vérifier l’hypothèse suivante : Les personnes atteintes de manie de persécution tendent à dessiner les visages humains avec des yeux particulièrement grands et prononcés. Pour vérifier la justesse de cette hypothèse, vous pouvez examiner une série de profils psychologiques auxquels correspondent les dessins spontanément exécutés par les sujets décrits. Imaginons qu’il s’agisse de fiches cartonnées : d’un coté se trouve le profil psychologique d’un sujet et de l’autre, un dessin caractéristique qu’il a exécuté. Quatre types de fiches sont posées devant vous sur une table, de façon à ce que vous ne puissiez voir qu’une face à la fois : a) b) c) d)
profil psychologique suggérant une manie de persécution ; profil psychologique ne suggérant pas de manie de persécution ; dessins de visages aux yeux très prononcés ; dessins de visages aux yeux normaux.
Quelles sont les fiches qu’il faut absolument retourner pour contrôler l’exactitude de l’hypothèse ? Il vous est demandé de ne retourner que les fiches indispensables afin de minimiser le nombre de vérifications. » Presque toutes les personnes interrogées choisissent de retourner les fiches de type a, qui sont jugées cruciales ; beaucoup indiquent que les fiches de type c sont elles aussi importantes ; peu mentionnent les fiches de type b ; et les fiches de type d sont quasiment ignorées (seulement 6 % des sujets les retournent). Or seules les fiches a et d doivent être retournées. En effet, l’hypothèse est vérifiée si, derrière les fiches a, on trouve des dessins aux yeux très prononcés et elle est contredite si derrière les fiches de type d, on trouve des profils psychologiques dénotant une manie de persécution. Les deux autres catégories de fiches n’ont aucune pertinence. En effet, elles n’indiquent pas que seuls les sujets atteints de manie de persécution dessinent des visages aux yeux très prononcés, ni que tous les dessins de visages aux yeux très prononcés sont le fait de sujets atteints d’une manie de persécution. a. Wason (1960, 1968).
part du temps, les individus ne pensent pas à ce type de séquences et énoncent des séquences telles que « 8, 10, 12 » puis « 12, 14, 16 », puis « 36, 38, 40 », ils deviennent de plus en plus sûrs d’avoir trouvé la règle, au fur et à mesure que leur interlocuteur leur répond que ces séquences sont conformes à la règle (puisqu’il s’agit bien de trois chiffres croissants). Ils sont alors bien déroutés lorsqu’ils découvrent que la règle n’est pas « trois chiffres pairs consécutifs ». D’une manière générale, les individus interrogés à ce sujet ont tendance à générer des séquences conformes à leurs hypothèses, sans penser à proposer des séquences pouvant les infirmer (cf. aussi encadré 9). Ils accumulent donc des infor-
64
Le décideur face à ses choix
mations en concordance avec leurs hypothèses, ce qui accroît d’autant leur confiance dans la validité de celles-ci, et ne peut ainsi que renforcer la tendance à l’excès de confiance exposée précédemment. Ce biais de confirmation qui s’exerce dans des activités de jugement très diverses, conduit en général à l’inefficacité et à l’erreur, sauf lorsqu’il s’agit d’expliquer des phénomènes rares ou lorsque l’incertitude qui les caractérise est forte 36. Les heuristiques et les biais associés que nous avons présentés ci-dessus — et qui ne sont pas les seuls ! — ont pour principal effet de permettre à l’individu de faire des choix en situation d’incertitude. Comme nous l’avons souligné au fur et à mesure, ils présentent un certain nombre d’avantages : ils permettent par exemple de simplifier le problème, de choisir malgré l’incertitude des options, d’économiser temps et effort cognitif. Cependant, ils peuvent également aboutir à de réelles catastrophes en situation réelle, lorsqu’ils agissent de concert et que les enjeux des choix réalisés sont importants. C’est ce qu’illustre l’encadré suivant. ENCADRÉ 10
Catastrophe aérienne et biais cognitifs Le cas suivant illustre de quelle manière certains biais cognitifs peuvent non seulement se manifester en situation réelle, mais également se renforcer mutuellement et aboutir à des catastrophes. Voici le récit des événements telle qu’ils ont été reconstitués à partir de la boîte noire. « Le 8 janvier 1989, le biréacteur Boeing de British Midland Airways, qui avait décollé à 19 h 52 de Londres Heathrow avec 156 passagers, se dirige vers Belfast. A 20 h 05, à la verticale de Birmingham, un bruit sourd se fait entendre, l’appareil se met à vibrer violemment, de la fumée entre par les conduits d’air conditionné avec une forte odeur de brûlé. Les passagers et les hôtesses à l’arrière de l’appareil voient sortir du réacteur gauche des « étincelles », des « flammes », des « éclairs », qui embrasent la nuit environnante. Il s’agit du moteur numéro 1 (à gauche). L’une des ailettes du rotor extérieur s’est cassée, provoquant de graves détériorations sur toutes les autres ailettes et les autres pièces du réacteur. Au poste de pilotage, les pilotes perçoivent l’odeur de brûlé et ressentent les soudaines vibrations. Aussitôt, le commandant de bord désactive le système de pilotage automatique et reprend les commandes en mode manuel. Comme la fumée vient de la cabine, compte tenu du système de circuit d’air conditionné, il émet intérieurement l’hypothèse que le réacteur défectueux est, non pas le numéro 1 à gauche, mais le numéro 2 à droite. Simultanément, le copilote observe avec attention les indications données par les instruments. Le commandant de bord demande : « C’est quel moteur qui ne va pas ? « Le second hésite une fraction de seconde et répond : « C’est celui de g…celui de droite. « (It’s the le…it’s the right one.) « Mets-le au ralenti », demande le commandant de bord. Le second désactive le fonctionnement automatique du moteur numéro 2, celui de droite, et le met au ralenti (c’est le moteur numéro 1, celui de gauche, qui est en train de rendre l’âme). Les pilotes ont l’impression que les vibrations et l’émission de fumées s’atténuent. Et le commandant ordonne l’acte terrible : « Arrête le numéro 2 ! » Aussitôt le second entame la check-list d’incident et d’arrêt du moteur numéro 2. 36 Voir Klayman et Ha (1987).
Le décideur en action : comportements et processus psychologiques
65
L’avion se déroute alors vers la piste la plus proche et le personnel de bord commence à préparer la cabine pour l’atterrissage. Le ralentissement du moteur numéro 1 pour la descente entraîne une réduction des vibrations, amélioration que les pilotes attribuent à l’arrêt du moteur numéro 2. Cela les confirme dans l’idée que c’était bien le moteur numéro 2 (de droite) qui était défectueux. Ils remarquent néanmoins toujours de la fumée. Intervient alors un épisode paradoxal. Devant la panique des passagers, le commandant de bord leur fait une annonce pour les informer que le réacteur de droite a été endommagé, ce qui a produit la fumée dans la cabine, mais qu’il a été arrêté et qu’ils vont atterrir dans quelques minutes. De nombreux passagers au fond de la cabine, qui ont bien vu que les gerbes de feu sortaient du réacteur gauche, et non du droit, écoutent l’annonce du commandant et sont stupéfaits. Ils discutent entre eux de la contradiction. De plus, ils perçoivent encore les vibrations. Mais aucun ne porte cette contradiction à l’attention du personnel de bord (selon les témoignages des passagers devant la commission d’enquête). Alors que l’appareil se trouve à 4 km de la piste et à une altitude de 300 m, le réacteur défectueux numéro 1 tombe complètement en panne et s’arrête. L’alarme d’incendie du moteur numéro 1 se déclenche. Le commandant de bord demande alors au copilote de relancer le moteur numéro 2 malencontreusement stoppé. Mais on ne relance pas en quelques secondes une telle machine. L’avion s’écrase. 47 passagers trouvent la mort et 84 sont grièvement blessés. » a On voit à l’œuvre dans cet épisode tragique plusieurs des biais cognitifs décrits dans ce chapitre. À l’origine on trouve un jugement faux (« c’est le moteur droit »), lié essentiellement au fait qu’une information va être principalement utilisée : la fumée vient de la cabine et compte tenu du système de circuit d’air conditionné que le commandant de bord connaît sur d’autres avions, il va émettre l’hypothèse que le réacteur défectueux est celui de droite. Or il se trouve que sur ce type d’avions, le circuit d’air conditionné est lié non pas au réacteur droit mais au gauche. Même si l’hypothèse de départ est fausse, l’équipage avait les moyens de la corriger : un certain temps (court, certes, mais suffisant), ainsi que d’autres informations (celles détenues par certains passagers, ainsi que les informations visuelles liées à l’observation directe des réacteurs et de la fumée). Cependant, ces informations ne seront pas utilisées, essentiellement parce qu’au départ, le jugement du commandant de bord est très assuré et n’intègre pas la possibilité d’une erreur (mauvaise calibration du jugement et excès de confiance en son propre jugement). A cela s’ajoute une tendance à la confirmation : le ralentissement du moteur gauche pour la descente entraîne une réduction des vibrations, amélioration que les pilotes attribuent à l’arrêt du moteur droit. Cela les conforte dans l’idée que c’était bien le moteur droit qui était défectueux. Par contre, le fait d’observer encore de la fumée, qui ne cadre pas avec leur hypothèse, n’est pas interprété, car cela conduirait à remettre complètement en cause leur jugement initial. On peut remarquer de plus un phénomène que nous n’avons pas encore abordé dans ce chapitre et qui sera développé au chapitre 8 : les passagers n’osent pas remettre directement en question le commandant de bord, ce qui est bien connu dans les groupes et relève de la tendance des individus à se soumettre à l’autorité, en particulier lorsque le leader du groupe est ressenti comme directif. Ainsi, l’ensemble de ces biais, liés à l’urgence et à l’irréversibilité de la décision prise (arrêter le seul moteur valable), conduisent à une réelle catastrophe. a. Morel (2002, p 19-21).
66
Le décideur face à ses choix
3. Règles de décision et stratégies de choix La partie précédente nous a permis d’aborder certains des processus de raisonnement utilisés dans des situations caractérisées par l’incertitude. Cependant, il est également intéressant de prendre conscience des nombreux processus de simplification opérant dans les choix dont les enjeux sont définis sans incertitude, processus qui montrent là encore l’originalité, la subtilité et les limites du fonctionnement humain en matière de décision. C’est l’objet de ce qui suit. Rappelons que le décideur est censé, en théorie, évaluer toutes les options de choix, afin de les comparer et de sélectionner l’option lui permettant de maximiser son utilité espérée. Lorsque les options sont caractérisées avec certitude, aucun jugement de probabilité n’intervient, et la tâche du décideur se réduit à valoriser chacun des éléments de la décision pour effectuer cette comparaison Or l’observation des choix a révélé un certain nombre de stratégies mises en œuvre par les décideurs, stratégies leur permettant d’effectuer des choix sans s’investir excessivement en effort ou en temps. Ces stratégies ont pour finalité d’obtenir une solution satisfaisante à moindre coût. Elles conduisent néanmoins à des réponses qui ne sont pas nécessairement optimales ou rationnelles. Les stratégies de choix présentées ci-dessous montrent comment sont prises en compte les caractéristiques des options dans la décision, et en quoi cela peut conduire à des choix sous-optimaux. L’attention portera ensuite sur le contexte plus général de la décision, pour mettre en évidence l’influence multiforme de la présentation de l’information sur les choix opérés.
3.1
RÈGLES COMPENSATOIRES ET RÈGLES NON COMPENSATOIRES
Nous l’avons vu, l’individu a des capacités limitées de traitement de l’information. Aussi a-t-il recours à des méthodes particulières de résolution des problèmes qui lui permettent de simplifier les situations de choix et de comparer les alternatives envisageables. De nombreux modèles ont été proposés pour décrire ces règles de décision, dont la plupart s’intéressent à trois aspects du processus de choix. Le premier aspect renvoie au mécanisme par lequel un individu affecte une valeur à une alternative 37. Cette valeur correspond au degré d’attractivité que la personne attribue à l’alternative en question. Pour choisir entre deux modèles d’automobile, elle donnera par exemple une note de 7/10 à l’un et de 9/10 à l’autre. Le second aspect concerne les critères de choix utilisés par cette personne pour se déterminer entre plusieurs alternatives. Ainsi, elle pourra considérer que seuls la sécurité et le prix sont importants, auquel cas elle effectuera son choix en fonction de ces seuls critères (ou « attributs »). Le troisième aspect est lié au fait que la personne opère son choix en portant son attention soit sur des alternatives, soit sur des attributs. Dans le premier cas, chaque alternative est considérée et évaluée comme un 37 Dans le langage des théories économique ou psychologique de la décision, une alternative est une option, une possibilité de choix, et non, comme dans le langage ordinaire, un choix possible entre deux options (comme lorsque l’on dit : « je suis face à une alternative »).
Le décideur en action : comportements et processus psychologiques
67
ensemble : chaque voiture va être notée globalement en fonction des évaluations faites sur les différents attributs et le choix sera finalement porté sur celle qui a la note globale maximum. Auquel cas, le processus est dit « interdimensionnel ». Dans le second cas, les alternatives sont comparées tour à tour sur chaque attribut : par exemple, chaque modèle est comparé sur l’attribut prix, puis sur l’attribut sécurité. Le processus est alors dit « intradimensionnel ». Nous présenterons ici deux catégories de règles de décision parmi les plus courantes : les méthodes compensatoires et les méthodes non compensatoires. Par souci de simplicité, nous développerons les principales règles de décision à travers l’exemple fictif du choix d’un véhicule : trois alternatives (les modèles A, B et C) sont évaluées sur la base de trois attributs (le prix, la sécurité et la consommation du véhicule). Le tableau 1 présente la performance des modèles A, B et C pour chacun des attributs. TABLEAU 1 – Choix entre trois modèles automobiles Attribut
Prix (en euros)
Sécurité croissante (de 1 à 10)
Consommation (l/100 km)
Modèle A
5 000
2
13,5
Modèle B
10 000
6
11,5
Modèle C
12 000
7
7
Alternative
Supposons que, préalablement à son choix, le décideur émette le souhait d’acquérir une voiture qui ne coûte pas plus de 11 000 euros, qui ait au minimum une note de 5 sur l’échelle de sécurité, et qui ne consomme pas plus de 12,5 l/100 km. Dans ce cas, il va choisir le modèle B, dans la mesure où les autres modèles n’atteignent pas le niveau exigé sur les critères respectifs de sécurité et de consommation pour A, et de prix pour C. Cette règle est dite conjonctive. Selon cette règle, le décideur ne tient pas compte du fait que certains modèles puissent être performants sur certains critères de choix, à partir du moment où ils ne satisfont pas au niveau minimum exigé sur d’autres critères. Par exemple, si un modèle D coûte 11 200 euros, obtient 8 sur l’échelle de sécurité et consomme 4 l/100 km, il sera quand même exclu parce qu’il est trop cher et ce, malgré une excellente performance en terme de consommation et de sécurité. Si, en utilisant cette règle, le décideur trouve un modèle satisfaisant, il peut le choisir et mettre fin au processus de choix. Il peut également affiner sa recherche en élevant le niveau des exigences requises sur certains critères, ou en faisant appel à d’autres règles de décision. Le décideur peut également, après avoir défini ses niveaux d’exigence minimum sur chaque attribut, sélectionner toute voiture qui dépasse le point d’exigence sur au moins un attribut. Si son seuil minimal d’acceptation est toujours de 11 000 euros pour le prix, 5 pour la sécurité et 12,5 l/100 km pour la consommation, il éliminera dans ce cas le modèle A, qui n’est satisfaisant sur aucun des attributs. Si ses niveaux d’exigence avaient été plus élevés, s’il avait par exemple considéré que le
68
Le décideur face à ses choix
modèle choisi devait soit avoir une note d’au moins 8 en matière de sécurité, au lieu de 5, soit ne pas consommer plus de 6 l/100 km, soit ne pas coûter plus de 6 000 euros, il aurait sélectionné A (pour son prix) et rejeté les deux autres modèles, qui sont tous deux trop onéreux, consomment trop et ne sont pas assez sûrs. La règle mise en œuvre dans ce cas est disjonctive. Selon les règles conjonctive et disjonctive, il n’y a pas d’ordre de classement ou de notation des attributs. Cependant, notre décideur aurait également pu avoir un ordre de préférence en ce qui concerne ces derniers : ayant des difficultés financières, il aurait pu par exemple considérer que le prix était le critère le plus important, puis la consommation et enfin la sécurité. En comparant les trois modèles sur le critère prix, il aurait sélectionné le véhicule A. Imaginons qu’un modèle D coûte le même prix que A (soit 5 000 euros), mais ait une consommation de 11 et une note de 1 sur l’échelle de sécurité. Dans ce cas, le décideur aurait, dans un premier temps, sélectionné A et D (les véhicules les moins chers à égalité sur le critère le plus important), puis les ayant comparé sur le critère de consommation, il aurait retenu D. Cette règle est la règle lexicographique. Selon elle, les alternatives sont comparées sur la base du critère le plus important : l’alternative ayant la valeur la plus élevée sur le critère le plus important est choisie, quelles que soient les valeurs prises sur les autres dimensions. Toutefois, si plusieurs alternatives ont la même évaluation sur l’attribut le plus important, elles sont comparées sur l’attribut qui suit en terme d’importance. Le procédé peut ainsi être répété jusqu’à ce qu’une alternative soit dominante sur un critère. Une dernière règle de décision courante peut être décrite ici. Supposons que le décideur ait classé les attributs selon un ordre d’importance tel que le prix est plus important que la consommation, elle-même plus importante que la sécurité. De plus, admettons que pour chaque attribut, il fixe une valeur d’exigence minimale : par exemple, 11 000 euros pour le prix, 12 pour la consommation. Il va d’abord comparer les voitures sur le premier attribut : le prix. Le modèle C va être éliminé parce qu’il est trop onéreux (12 000 euros). II va ensuite comparer A et B sur le second attribut, la consommation, et éliminer alors le modèle A qui consomme trop. B sera donc le modèle choisi. Ce processus de choix est la règle de l’élimination par aspects 38. Cette règle est analogue à la règle conjonctive dans la mesure où elle assigne des valeurs minimales aux attributs. Cependant, le processus est intradimensionnel. Toutes les règles que nous avons évoquées jusqu’ici appartiennent à la catégorie des règles dites non compensatoires : le décideur ne procède pas par compensation entre plusieurs dimensions. Ces règles sont donc utiles dès lors que les dimensions sont incommensurables 39. À l’inverse, lorsque la commensurabilité entre les dimensions est possible, le décideur peut procéder de manière plus complexe, en attribuant à chaque alternative une note globale obtenue par une combinaison compensatoire des notes obtenues sur chaque dimension. Ainsi, les valeurs obtenues sur un attribut sont compensées ou 38 Tversky (1972). 39 La commensurabilité exprime le degré avec lequel différentes alternatives partagent des dimensions communes. Elle renvoie donc à la possibilité de ramener différentes alternatives à des outils de mesure, d’évaluation, communs.
Le décideur en action : comportements et processus psychologiques
RÈGLES NON COMPENSATOIRES
DÉFINITION
69
PROCESSUS
Conjonctive
• Le décideur fixe une valeur minimale pour chaque attribut. • Si une alternative n’atteint pas la valeur minimale exigée sur toutes les dimensions, elle est rejetée.
interdimensionnel
Disjonctive
• Le décideur fixe une valeur minimale pour chaque attribut. • Si une alternative atteint la valeur minimale exigée sur au moins un attribut, elle est sélectionnée. Une alternative n’est donc rejetée que si elle n’atteint la valeur minimale sur aucun attribut.
interdimensionnel
Lexicographique
• Les attributs sont classés par ordre d’importance (« ordre lexicographique »). • L’alternative ayant la valeur la plus élevée sur le critère le plus important sera choisie. • Si des alternatives sont ex-aequo sur le premier critère, elles sont comparées sur le second critère, et ainsi de suite.
intradimensionnel
Élimination par aspect
• Les attributs ont un poids relatif à leur importance. • Les attributs sont sélectionnés avec une probabilité proportionnelle à leur importance. • Les alternatives dont les valeurs ne sont pas satisfaisantes sur un attribut sélectionné sont éliminées. Un autre attribut est sélectionné et le processus est répété jusqu’à ce qu’il ne reste plus qu’une seule alternative.
intradimensionnel
RÈGLE COMPENSATOIRE
• Les valeurs prises sur un attribut sont compensées par ou ajoutées aux valeurs prises sur un autre attribut. • Une valeur globale est attribuée à chaque alternative en tenant compte des valeurs prises sur chaque attribut et de l’importance relative de chaque attribut.
interdimensionnel
TABLEAU 2 – Principales règles de décision
ajoutées aux valeurs obtenues sur un autre attribut. Dans notre exemple du choix d’un modèle de voiture, le décideur peut sacrifier une somme plus importante pour un gain en sécurité ou accepter une consommation supérieure pour un modèle dont le prix lui semble attractif. Il s’agit donc d’un processus interdimensionnel dans lequel il attribue une valeur globale à chaque alternative. Le degré de sophistication de ce processus est susceptible de varier. Ainsi, la personne peut s’engager dans un calcul compensatoire rapide impliquant des comparaisons ordinales (« un prix peu élevé de 7 000 euros est plus important qu’un score de sécurité de 7 ») ou procéder à des comparaisons plus élaborées nécessitant une représentation cognitive de l’attrait par le recours à des échelles d’intervalles (« pour chaque amélioration d’un point de la sécurité, je suis prêt à mettre 1 000 euros supplémentaires »). Cependant, le recours à des règles compensatoires requiert un effort cognitif important de la part du décideur, en particulier lorsque le nombre d’alternatives et d’attributs est élevé. Il a donc fréquemment recours à des règles non compensatoires.
70
3.2
Le décideur face à ses choix
CONTEXTE DE CHOIX ET UTILISATION DES RÈGLES DE DÉCISION
Souvent, le décideur ne choisit pas selon une seule règle, mais dispose d’un répertoire de règles de décision, qu’il utilisera en fonction des caractéristiques du contexte de la décision. Ces caractéristiques exercent une influence sur la manière dont l’individu traite l’information, sur le choix qu’il opère parmi les différentes règles de décision et, finalement, sur l’issue décisionnelle. Nous exposerons les principales caractéristiques du contexte décisionnel ci-dessous 40. Si l’on considère que l’individu a des capacités cognitives limitées, il est raisonnable de penser qu’il aura naturellement tendance à simplifier le processus de choix. Un premier facteur auquel sera donc sensible le décideur est la complexité de la décision. Un aspect de cette complexité est lié au nombre d’informations dont dispose le sujet concernant les attributs et les alternatives. Il semble que la proportion d’informations utilisées ainsi que la complexité des règles de décision adoptées soient d’autant plus faibles que le nombre d’informations mises à la disposition du décideur soit important, qu’il y ait incertitude ou non. Cette tendance est plus marquée si l’on augmente le nombre d’attributs plutôt que le nombre d’alternatives. Ainsi, en accroissant le nombre d’alternatives et en diminuant le nombre d’attributs de manière à maintenir un nombre d’informations constant, on remarque que la personne utilise proportionnellement un plus grand nombre d’informations disponibles. Ce phénomène reflète probablement le fait que l’individu a le plus souvent recours à des règles non compensatoires. Une autre manière de moduler la base d’informations traitée par le sujet consiste à faire varier le délai dont il dispose pour effectuer un choix. Ainsi, plus ce délai est court, moins le décideur utilise d’informations proportionnellement à l’ensemble des informations disponibles, notamment en ayant recours à des règles conjonctives. De plus, la pression temporelle semble rendre le décideur plus prudent : il accorde plus de valeur à l’information défavorable qu’à l’information favorable. L’influence de la quantité d’informations à la disposition de l’individu sur la qualité de ses choix n’est pas négligeable. De manière générale, le nombre d’informations dont il dispose influe sur le choix du décideur de deux manières : d’une part, il a tendance à utiliser des règles de décision d’autant plus simples et plus éloignées de l’optimum que ce nombre augmente ; d’autre part, la fiabilité avec laquelle il utilise des règles de choix a tendance à diminuer quand le nombre d’informations s’accroît. Un autre aspect de la complexité de la situation de décision concerne la commensurabilité entre dimensions. En effet, moins les alternatives ont de dimensions communes, et plus la complexité décisionnelle augmente. Afin d’éviter de se lancer dans des calculs compensatoires trop compliqués, le décideur a alors tendance, dans la majorité des cas, à ne tenir compte que des dimensions communes aux alternatives 41. Ainsi, dans un cadre expérimental, on demande à des sujets de comparer des étudiants, dont les dossiers sont présentés par paires. Ces étudiants sont évalués selon deux dimensions : une dimension commune (niveau d’anglais) et une dimension spécifique (aptitude mathématique pour l’un et besoin de réussir pour l’autre). Il est demandé aux sujets de comparer les deux étudiants de chaque paire, afin de leur 40 Cf. en particulier Payne et al. (1992) pour une revue. 41 Voir Slovic et Mac Phillamy (1974).
Le décideur en action : comportements et processus psychologiques
71
attribuer un rang dans le classement scolaire. Le résultat montre que les sujets ont tendance à tenir compte essentiellement des dimensions communes aux deux étudiants, même lorsqu’ils ont été mis en garde contre cette tendance. D’autres expériences confirment ce résultat, mettant en évidence le fait que les individus cherchent à éviter l’utilisation de règles compensatoires. Dans le cas cité précédemment, il est aisé d’envisager les conséquences négatives de tels procédés lorsque les dimensions communes à différentes alternatives sont peu pertinentes au regard du choix à effectuer. C’est ainsi que la publicité comparative peut inciter le consommateur à comparer des produits sur des dimensions moins importantes que d’autres. Par exemple, certains opérateurs de téléphonie mobile vont mettre en avant des attributs annexes tels que le nombre et la couleur des boîtiers de téléphone, sur lesquels ils peuvent facilement se comparer avantageusement à leurs concurrents, et parallèlement, en prenant soin de différencier leur offre, faire en sorte qu’il soit difficile de les comparer sur des informations concernant des caractéristiques plus importantes (en particulier sur les types de forfaits et les conditions associées à chacun). La manière dont on présente l’information peut également affecter le type de règles utilisées par un individu. Ainsi, lorsque les alternatives sont présentées de manière séquentielle, le traitement sera effectué alternative par alternative. À l’inverse, dans le cas où l’on donne simultanément, sur plusieurs alternatives, des informations relatives à des attributs, le traitement se fera plutôt par attribut. Des propositions intéressantes ont été avancées et testées pour expliquer ce phénomène. La manière dont l’information est représentée dans la mémoire à court terme aurait une influence sur le processus 42. Ainsi, par exemple, l’information concernant la location d’un appartement peut être enregistrée sous deux formes : soit sous la forme appartement X (location, 1000 euros), soit sous la forme location (appartement 1, 1000 euros). Le premier cas, où l’on présente l’alternative à laquelle on affecte un attribut et une valeur, inciterait à un traitement interdimensionnel de l’information. En revanche, le second, pour lequel on présente l’attribut que l’on relie à une alternative et à une valeur, inciterait à un traitement intradimensionnel de l’information.
3.3
EFFORT COGNITIF ET OPTIMALITÉ
Les exemples évoqués ci-dessus mettent en évidence une propriété essentielle des processus de choix adoptés dans la réalité : les individus procèdent par adaptation cognitive aux caractéristiques de la situation de choix qui leur est présentée. Cette adaptation s’effectue en utilisant des règles qui permettent d’obtenir un choix satisfaisant en minimisant l’effort cognitif déployé. Souvent, le décideur s’adapte en utilisant successivement différentes règles de décision. Cette stratégie de décision est prise en compte par des modèles dits séquentiels. D’après ces modèles, une décision est une suite de séquences, au sein desquelles le décideur mobilise différentes règles. Par exemple, pour sélectionner un restaurant, le décideur pourra d’abord décider qu’il souhaite manger chinois (et éliminer ainsi tous les autres types de restaurant), puis effectuer un choix entre les restaurants chinois qu’il connaît. Pour décider du choix d’un candidat, un recruteur pourra 42 Cf. Payne et al. (1992).
72
Le décideur face à ses choix
dans un premier temps éliminer tous les curriculum vitae qui n’ont pas de photo, puis parmi ceux-ci ne retenir que les candidats qui ont plus de 5 ans d’expérience et un niveau d’études au moins égal à la maîtrise. Il pourra enfin appliquer une règle compensatoire sur les candidats restants, en utilisant des critères de sélection soigneusement étudiés et pondérés. De manière générale, les modèles séquentiels considèrent que l’individu va suivre la « règle du moindre effort cognitif », en n’augmentant son effort cognitif que si le recours à des règles simples ne lui permet pas de faire un choix satisfaisant. Ainsi, dans un premier temps, il va essayer de réduire très rapidement le nombre d’alternatives à examiner. Il peut pour cela avoir recours à la règle de dominance - une alternative est-elle meilleure que les autres sur toutes les dimensions ?-, à une règle conjonctive classique, ou encore à une règle conjonctive « améliorée ». Dans ce dernier cas, le décideur élimine les alternatives dont les scores insatisfaisants sur des dimensions préalablement définies ne sont pas compensés par des valeurs élevées sur des dimensions essentielles 43. Dans un second temps, si la personne n’a pas réussi à réduire le nombre d’alternatives au nombre n requis par le choix (en général n=1), elle utilisera des règles de type conjonctive, disjonctive, ou lexicographique, et éventuellement des règles plus complexes. Elle pourra par exemple modifier les niveaux minimaux d’attractivité sur les critères de la décision, ou même utiliser en dernier ressort des règles nécessitant des compensations entre attributs. Alors que les modèles séquentiels s’appuient sur le principe du moindre effort cognitif, d’autres modèles dits modèles de la contingence 44 ont l’avantage de prendre en compte le rôle d’autres facteurs dans la mobilisation -consciente ou non- de règles de décision. Le choix dépendrait d’un compromis entre le coût d’investissement en temps et en effort cognitif, et la recherche d’une solution optimale. Ainsi, les règles de décision ont tendance à devenir plus complexes avec l’éloignement temporel des conséquences du choix, avec l’importance du problème de décision et avec le degré d’irréversibilité des conséquences du choix final. L’intérêt de ces modèles est indéniable pour décrire les stratégies de choix utilisées par les individus dans des situations expérimentales. Cependant, leur pertinence en contexte naturel, est sujette à critique. Ainsi, dans une situation réelle, il peut être délicat de calculer les coûts et avantages de telle ou telle stratégie. De plus, ces modèles ne prennent pas en compte la familiarité de la personne avec la situation de décision, qui peut la conduire à adopter systématiquement certaines règles dans une situation donnée. Face à la diversité des règles de décision utilisées par les individus, il est judicieux de se poser la question de l’optimalité de ces règles. Les résultats d’expériences dans lesquelles il est possible de définir a priori l’alternative optimale montrent que certaines règles qui font un usage incomplet des informations disponibles peuvent conduire à des choix sous-optimaux et au non respect de principes tels que la transitivité (voir chapitre 1). C’est en particulier le cas des règles non compensatoires, et plus spécifiquement de celles qui utilisent un processus intradimensionnel, telles que les règles lexicographique ou d’élimination par aspects. 43 Cf. Park (1978). 44 Voir Beach et Mitchell (1978) et Christensen-Szalanski (1980).
Le décideur en action : comportements et processus psychologiques
73
Certains chercheurs suggèrent cependant que, dans la plupart des situations courantes, les limites de beaucoup de règles simples ne prêtent pas à conséquence. Par exemple, dans une série d’expériences 45 où les sujets étaient face à des choix binaires, les individus avaient fortement tendance à utiliser des règles de décision intradimensionnelles. Or ce comportement n’avait que des conséquences négligeables en termes d’erreur : tandis que le taux d’erreur lié à l’utilisation de règles simples non compensatoires, plutôt que d’une règle fondée sur le critère de maximisation de l’utilité espérée, n’augmentait que de 8 à 14 %, le temps de décision diminuait fortement (15 secondes au lieu de deux minutes). Cependant, on ne peut conclure que le recours à des règles de décision sousoptimales soit sans risque dans la réalité, en particulier lorsque le coût de l’erreur est très important. Même si certaines règles ont l’avantage de permettre une décision rapide et économique en termes d’effort cognitif, leur utilisation peut entraîner des biais de raisonnement et des choix erronés.
4. Conclusion Nous avons pu apercevoir, à travers ce chapitre, à quel point nos choix obéissent à une psychologie complexe, bien plus complexe du moins que ne l’envisageait initialement la théorie économique de la décision. Le regard de la psychologie conduit finalement à envisager autrement ce que signifie « décider ». En effet, alors que dans la perspective économique, décider consiste essentiellement à opérer le meilleur choix possible dans un ensemble donné d’alternatives (voir le chapitre 1), les travaux que nous avons présentés montrent que l’effort cognitif du décideur se situe surtout dans la construction du processus qui aboutit à une décision. Ce processus commence par la représentation que l’on s’est faite du problème et dépend donc des mécanismes qui conduisent à focaliser son attention sur les différentes caractéristiques de ce problème. Il dépend également des spécificités du contexte dans lequel se trouve le décideur, ce qui introduit le caractère dynamique et adaptatif du jugement humain. Enfin, il dépend de la dose d’effort cognitif que le décideur est, plus ou moins consciemment, prêt à mettre dans sa décision, ce qui renvoie à la multiplicité des processus de jugement. La grande caractéristique de l’être humain en matière de prise de décision pourrait finalement être cette fascinante capacité à produire à la fois des procédures rationnelles du point de vue de la normativité économique, avec des raisonnements complexes, formels mais coûteux en énergie cognitive, mais également de multiples processus quasi-automatiques, rapides à mobiliser, pertinents dans un certain nombre de cas bien que faillibles dans d’autres. L’enjeu ne serait-il pas alors, pour le décideur, de savoir « jouer » avec ces différents types de processus, plutôt que de les utiliser automatiquement, ce qui suppose un travail constant sur et avec les limites de sa propre rationalité.
45 Décrites par Abelson et Levi (1985).
Chapitre 3
Le décideur sur le divan : quand l’inconscient entre en scène Bénédicte VIDAILLET
Sommaire 1 Psychologie de la décision et psychanalyse : deux approches différentes de la « rationalité » humaine
76
2 Une étude de cas : un décideur sur le divan
79
3 L’hypothèse de l’inconscient : un nouveau déterminisme pour la prise de décision ?
82
4 La complexité de nos choix : ambivalence et conflit
91
5 La décision : une production du sujet, un scénario déjà écrit
96
6 Conclusion
102
76
Le décideur face à ses choix
On rougirait bientôt de ses décisions, si l’on voulait réfléchir sur les raisons pour lesquelles on se détermine. VOLTAIRE (Œdipe, La Pléiade)
C’est souvent que l’on trouve cités les propos de Freud quant au coup porté par la psychanalyse au narcissisme humain : Copernic aurait montré que la terre n’était pas le centre de l’univers, puis Darwin aurait révélé que l’homme était un maillon dans la chaîne de l’évolution, plutôt qu’une espèce unique et distincte, et enfin, lui-même, à travers la psychanalyse, aurait remplacé la représentation d’un homme rationnel par celle d’un être gouverné par des forces contradictoires, en partie inconscientes, qu’il s’efforce à grand peine de maîtriser 1. Le chapitre précédent a permis de dégager certaines caractéristiques du comportement humain en matière de prise de décision, de jugement et de choix et de montrer, en particulier, que ces comportements s’écartent fréquemment de la rationalité au sens où l’entendent les économistes. L’inertie cognitive, le manque de logique, le recours parfois trop rapide à des règles de décision simples et inadéquates par rapport à l’objet de la décision, sans compter certains facteurs environnementaux susceptibles de restreindre les aptitudes intellectuelles du décideur, entrent en jeu dans certaines décisions, observées la plupart du temps lors d’expériences contrôlées en laboratoire. Il est pertinent de penser que les mécanismes décrits sont également susceptibles de se reproduire dans certaines circonstances de la vie quotidienne. L’intérêt essentiel de ces recherches est de nous permettre d’accéder à ce qui fait l’intelligence spécifiquement humaine en matière de décision, en mettant en lumière son originalité mais également ses failles. Mais, plus largement, qu’en est-il des capacités de jugement et de décision de l’homme lorsque ses choix, ses décisions et ses actes prennent place dans sa trajectoire personnelle, dans son histoire de vie, et intègrent des composantes affectives, identitaires, émotionnelles ? La citation de Freud rappelée ci-dessus permet justement de mettre l’accent sur l’existence de motivations inconscientes et donc de raisons à nos choix susceptibles de ne pas pouvoir être expliquées par notre seul fonctionnement intellectuel. La voie proposée dans ce chapitre est donc d’élargir la réflexion entamée dans le chapitre précédent, à l’aide de concepts et de théorisations empruntés pour la plupart à la psychanalyse.
1. Psychologie de la décision et psychanalyse : deux approches différentes de la « rationalité » humaine Contrairement à la psychologie de la décision, qui prend explicitement pour objet les processus mentaux qui interviennent dans la prise de décision, et se structure clairement autour des concepts de « décision » et de « choix », ces termes ne sont pas des concepts-pivots en psychanalyse. On ne les trouve pas référencés dans les dictionnaires et encyclopédies de psychanalyse 2, et les seuls termes de « choix de 1
Freud (2001a).
Le décideur sur le divan : quand l’inconscient entre en scène
77
névrose » ou « choix d’objet » qui apparaissent ne renvoient pas au concept de choix tel que nous l’entendons dans cet ouvrage. Cependant, assez paradoxalement, l’œuvre de Freud, fondateur de la psychanalyse, est traversée par la problématique de la décision et du choix, à travers un questionnement permanent relatif à la rationalité humaine : le constat des difficultés de l’homme à être rationnel, la recherche de ce qui peut entraver cette rationalité, l’identification des résistances psychologiques à ce projet, la question de la possibilité et/ou de l’impossibilité pour l’homme de décider et d’agir librement, la problématique du déterminisme et du libre-arbitre, sont autant de thématiques récurrentes chez Freud. Bien qu’un seul texte de Freud 3 ait pour objet spécifique l’analyse d’un choix, une étude de l’index de ses œuvres complètes confirme que le lexique freudien intègre cette préoccupation, manifeste dans la richesse des termes qui s’y réfèrent. On y trouve en effet : « décision », « choix », « perplexité », « rationalisation », « libre arbitre », « jugement », « incertitude », « paralysie de la décision », « repousser la décision » 4. De même que la psychologie de la décision cherche d’abord à décrire comment l’individu fait ses choix, décide et juge, pour en tirer des théorisations relatives à nos processus de décision, ce sont les comportements réels qui intéressent en premier lieu la psychanalyse, plutôt que les comportements de l’homme « idéal », censé agir ou décider de telle ou telle manière. La recherche expérimentale en psychologie de la décision a mis en évidence le fait que notre raisonnement intuitif recourait à différents types de stratégies, dont certaines sont relativement proches des normes de la rationalité économique, tandis que d’autres s’en éloignent nettement. Ces stratégies coexistent dans notre esprit, ce qui permet, en généralisant peut-être abusivement, de dire que nous sommes à la fois naturellement rationnels et naturellement irrationnels, phénomène qui renvoie à la complexité des processus de la pensée humaine. Une autre manière d’envisager ce point est de considérer que c’est la notion même de rationalité qui est complexe et de penser qu’il puisse y avoir différentes formes de rationalité. Cet intérêt pour la coexistence de différents types de processus, renvoyant à différentes formes de rationalité dans l’esprit humain est également central pour la psychanalyse. Un des points de départ essentiels de la psychanalyse est l’intérêt que Freud va porter aux « ruptures » de la logique, au « non-sens », aux discontinuités, dans les lapsus, où il semble ne pas y avoir de raisons au remplacement d’un mot par un autre, mais également dans les rêves, qui mettent en scène des scénarios apparemment illogiques dans la rationalité habituelle. Derrière cette apparente irrationalité peuvent se cacher des raisons inconscientes. Une finalité commune à la psychanalyse et aux recherches en psychologie du choix est de permettre à l’individu de prendre conscience de processus inconscients qui lui font produire des réponses presque automatiques, aux effets tangibles et parfois indésirables, pour réintroduire une forme de maîtrise dans ses décisions et dans ses actes. 2 Cf. par exemple : Laplanche et Pontalis (1967) ou de Mijolla et al. (2002). 3 Freud (2001b). 4 Ces termes se trouvent dans l’index allemand : Entscheidung (décision), Entschluss (décision), Wahl (choix), Urteil (jugement), beurteilen (juger), Ratlosigkeit (perplexité), Entschlusslähmung (paralysie de la décision), Willensfreiheit (libre arbitre), Willensfreiheit als Illusion (le libre-arbitre comme illusion), Willensfreiheitgefühl (sentiment de libre arbitre), Rationalisierung (rationalisation), Determinismus (déterminisme). In Gesammelte Werke, Vol. 18, Fischer Verlag.
78
Le décideur face à ses choix
Enfin, les travaux en psychologie de la décision n’ont pas manqué de souligner à quel point la plupart des biais cognitifs étaient ancrés et difficiles à améliorer, du fait des nombreuses résistances à surmonter, la plus importante étant notre tendance à considérer comme justes nos stratégies intuitives et nos pseudo-raisonnements. De même en psychanalyse, notre tendance à ne pas admettre l’existence et l’importance de processus inconscients constitue un obstacle majeur à toute amélioration. Au-delà de ces convergences, qu’il importe cependant de ne pas forcer, la psychologie de la décision et la psychanalyse poursuivent des finalités bien différentes et divergent profondément dans leurs conceptions et dans leurs méthodes d’investigation des processus mentaux. Au plan théorique tout d’abord, ainsi que nous le soulignions précédemment en analysant le vocabulaire freudien, les processus de prise de décision et de choix sont au cœur même de la psychologie de la décision alors que la psychanalyse ne les isole pas comme objets de recherche en soi. Autre différence majeure dans leur délimitation respective, le programme des recherches en psychologie du choix vise à étudier les processus mentaux de l’homme, sans parasitage par les émotions, les motivations, l’agressivité, etc. Les situations présentées sont assez idéales au plan des émotions, les sujets étudiés sont détendus, attentifs, bien disposés et les enjeux de leurs choix sont relativement faibles. Ces recherches montrent que même dans ces conditions particulièrement propices à ce que les capacités de jugement ne soient pas troublées, les illusions cognitives sont susceptibles de biaiser notre jugement. En psychanalyse, les situations analysées font intervenir, parfois au plus haut point, les passions, les motivations, l’envie, l’orgueil, l’agressivité, elles sont en lien avec l’histoire du sujet, et comportent des enjeux importants pour lui. La conséquence en est alors que les écarts par rapport à la « rationalité » classique sont susceptibles de prendre des proportions bien plus importantes encore. Alors que la psychologie de la décision s’efforce surtout de caractériser l’incomplétude et plus largement la spécificité des processus mentaux en matière de choix, l’investigation psychanalytique conduit plutôt à essayer de comprendre l’origine de conduites humaines qui à première vue pourraient paraître incohérentes et irrationnelles. À cet égard, l’hypothèse de l’inconscient réintroduit une causalité aux comportements, causalité qui, bien qu’elle n’apparaisse pas spontanément au sujet, peut lui être en partie accessible par un travail de réflexivité et d’analyse. Au plan méthodologique également, les écarts sont importants. Les recherches relatives à la psychologie de la décision ont lieu en laboratoire, via des expériences soigneusement contrôlées, permettant de mesurer précisément le rôle de facteurs spécifiques dont les effets sont manipulables. De manière bien différente, les données cliniques, l’observation et l’introspection constituent la matière première de la psychanalyse, et ce dès son origine, puisque Freud lui-même prenait pour point de départ à ses théorisations l’observation et l’analyse de ses malades, de ses proches, de luimême ou même de personnages célèbres pour l’analyse desquels il utilisait leur production artistique (textes, tableaux) et des éléments biographiques (cf. par exemple Léonard de Vinci ou le cas Schreber 5). 5
Freud (1954a).
Le décideur sur le divan : quand l’inconscient entre en scène
79
Soulignons enfin que la psychanalyse s’est clairement positionnée dès son origine dans un double objectif : un objectif thérapeutique tout d’abord, et une volonté de comprendre le fonctionnement du psychisme humain. Aussi, même si elle permet de dégager des théorisations relatives au fonctionnement psychique de l’homme en général, son objectif thérapeutique la conduit d’une part à respecter la dimension singulière de l’histoire de chacun, d’autre part à partir de l’analyse de personnes malades pour théoriser les processus psychiques en général — donc y compris ceux des individus qui ne présentent pas de pathologie particulière. En psychologie du choix, au contraire, des tendances générales susceptibles d’être observées sur la plupart des individus sont dégagées de l’étude de groupes composés de sujets sans pathologie particulière. Elle vise d’emblée à identifier des processus généraux — se produisant chez la majorité des personnes —, systématiques — pouvant être reproduits à l’identique dans des situations de nature et de complexité comparables —, et manipulables par un expérimentateur extérieur susceptible de les renforcer ou de les atténuer selon la nature et la formulation des problèmes posés. Ces différences explicitées, nous proposons d’entrer dans la théorie psychanalytique pour mettre en évidence ses apports bien spécifiques à notre exploration des capacités et processus humains en matière de jugement, de choix et de décision. Nous partirons d’une étude de cas pour ancrer notre réflexion.
2. Une étude de cas : un décideur sur le divan Monsieur X, 44 ans, père de quatre enfants, est entrepreneur. Il possède et dirige son entreprise depuis plus de quinze ans, mais depuis peu, éprouve des difficultés à travailler et à faire des choix. Il en vient à vouloir vendre son entreprise, dont la situation financière est préoccupante. Il se plaint de divers maux et s’est séparé de sa femme il y a quelques mois. Cette séparation a eu également des conséquences importantes sur l’entreprise car sa femme occupait un poste important dans celle-ci. C’est à ce moment-là qu’il entreprend une analyse avec Manfred Kets de Vries, psychanalyste et spécialiste du leadership à l’Insead 6. Le travail d’analyse va progressivement faire émerger plusieurs thématiques et processus fondamentaux dans le parcours de M. X. Les éléments d’analyse qui sont exposés par la suite proviennent d’un travail introspectif, dans lequel M. X joue un rôle prépondérant, puisque c’est lui qui est à l’origine des associations d’idées qui permettent progressivement de faire émerger des interprétations. C’est lui également qui formule une partie importante de ces interprétations, aidé en cela par l’analyste, qui peut également lui proposer ses propres interprétations. Dans tous les cas, seul M. X est susceptible de reconnaître ou non l’intérêt de certaines interprétations pour mieux comprendre son comportement, ses décisions et ses actions. Avant de progresser dans ce cas, essayons d’imaginer comment une approche plus classique de la prise de décision aurait pu traiter les problèmes de M. X. Tout d’abord, un consultant « classique » lui aurait vraisemblablement conseillé de bien 6
Kets de Vries (1996).
80
Le décideur face à ses choix
identifier les différents problèmes — problèmes conjugaux, problèmes stratégiques, question de la vente de l’entreprise, décision de recruter un nouveau cadre pour remplacer sa femme — et d’en traiter la résolution avec des spécialistes de chaque domaine. La décision de recrutement aurait pu suivre la démarche classique allant de la définition de poste, au choix final du candidat, en passant par l’explicitation des critères de décision et de leur pondération pour aboutir à l’analyse des candidatures en fonction de ces critères. La question de la vente de l’entreprise aurait demandé une évaluation financière conduisant à une estimation de sa valeur et une mise à plat des avantages et des inconvénients à vendre ou à garder l’entreprise, pouvant être associée à une réflexion sur le choix d’une période pour vendre (court, moyen ou long terme). Chaque option aurait pu être évaluée sur la base de critères à identifier avec M. X : gain financier, risques (en fonction par exemple de l’évolution de l’entreprise et de la plus ou moins grande probabilité de renouer avec la croissance), existence de repreneurs et intérêts de ceux-ci vis-à-vis de l’entreprise, envie ou non de transmettre l’entreprise à ses enfants lorsqu’ils seraient en âge, etc. Enfin, les difficultés stratégiques de l’entreprise auraient pu être analysées avec les outils classiques de l’analyse stratégique, mettant en évidence les incohérences dans son développement, les risques pris par M. X et leurs conséquences, une mauvaise anticipation des évolutions sur certains marchés, la prise en compte insuffisante des actions des concurrents. Cette analyse aurait pu se doubler d’une étude des biais cognitifs à l’œuvre dans ces processus : erreurs de cadrage, excès de confiance en son propre jugement, mauvaise analyse du risque, etc. Le travail entrepris entre M. X et son analyste sera tout autre : il permettra, entre autres, de suggérer des liens profonds entre la dynamique psychique de M. X et la plupart de ses choix et comportements passés, et de mettre en évidence des mécanismes se répétant dans des domaines a priori très distincts. C’est ainsi que M. X va prendre conscience du point auquel sa relation avec sa mère et sa place dans la famille ont été déterminantes dans ses choix professionnels et privés — cette distinction professionnel-privé est d’ailleurs peu pertinente pour lui dans la mesure où sa femme travaillait dans son entreprise ; plus fondamentalement, son analyse révèlera à quel point ses choix professionnels et privés sont liés aux mêmes raisons. Dernier de 6 enfants, M. X a été élevé par une mère dominatrice, très exigeante, contrôlant tout. Il a souffert d’être le dernier, ce à quoi il associait le sentiment de ne pas avoir été désiré — un « accident » — et la colère d’avoir été tourmenté par ses frères et sœurs, en particulier par son frère aîné, qui avait cherché à prendre la place de son père, après le décès de celui-ci lorsque M. X avait 8 ans. La mort de son père l’a aussi extrêmement marqué, entre autres pour le mystère qui en a entouré les causes — il pense maintenant qu’il est probable qu’il se soit suicidé —, et pour les conséquences qui en ont découlé pour la famille : pauvreté, pessimisme accrû de la mère, tensions entre les frères et sœurs. Il comprend que le fait de posséder son entreprise, choix qu’il avait fait très tôt dans sa carrière, représentait pour lui la possibilité de gagner de l’argent et d’être dans une position de pouvoir, afin de combler des besoins narcissiques (avant tout le
Le décideur sur le divan : quand l’inconscient entre en scène
81
besoin d’être reconnu aux yeux de sa mère et de se sentir aimé par elle) auxquels sa mère n’avait jamais répondus, pas davantage que son père absent ou ses frères et sœurs qui, d’après lui, l’avaient plutôt dévalorisé en tant que dernier. Sa mère, par ses exigences fortes, avait également développé chez lui des idéaux de réussite élevés, associés à un besoin de compétition pour se démarquer de ses frères et sœurs. Son déficit narcissique le conduisait cependant à avoir sans cesse peur d’échouer, ce qu’il masquait par de nouvelles décisions de développement et une activité incessante. Posséder une entreprise lui permettait aussi de gagner de l’argent, ce qui pour lui constituait une revanche sur une enfance dominée par la peur de manquer et les frustrations liées aux privations. Etre entrepreneur le mettait également en position de ne pas avoir de supérieur hiérarchique, et plus largement de ne dépendre de personne, de ne pas être soumis aux volontés et aux désirs d’autrui, ce qu’il finit par interpréter, grâce au travail analytique, comme une volonté d’échapper au contrôle extrêmement castrateur de sa mère. Ses décisions stratégiques et ses choix en matière d’organisation étaient eux aussi très liés à son développement antérieur. Ainsi, ses choix de croissance avaient été assez radicaux, dans la mesure où il cherchait à se développer rapidement dans des domaines d’activité permettant une rentabilité forte, moyennant une prise de risque importante. Son entreprise avait fini par avoir une structure conglomérale peu cohérente et financièrement fragile, du fait d’investissements qui s’étaient avérés peu judicieux, car décidés trop rapidement. Ce mode de développement était très lié à sa recherche de « grandeur » et à son besoin d’« épater », l’analyse mettant en évidence à quel point sa fragilité narcissique et son désir d’être reconnu par sa mère, mais également son envie de la défier puisqu’elle valorisait la sécurité, y avaient contribué. Une autre prise de conscience fut pour lui de comprendre que ses prises de risques et son activité incessante lui avaient pendant longtemps permis d’éviter de sentir ses sentiments dépressifs et ses conflits psychiques. Son besoin de tout contrôler et d’être le meilleur l’avait conduit à construire une organisation très centralisée dans laquelle peu d’autonomie était laissée à ses collaborateurs, dont beaucoup finissaient par partir. Le turn over de l’encadrement était anormalement élevé. Il comprit également que son envie de se valoriser auprès de sa mère le conduisait à vouloir vendre son entreprise, afin d’être nettement plus fortuné que ses frères et sœurs, d’avoir plus de « valeur » qu’eux, espérant de la sorte devenir enfin l’enfant « préféré ». En ce qui concerne sa vie privée et en particulier sa décision de se séparer de sa femme, son analyse le conduisit à mieux comprendre ses relations avec les femmes. Il prit progressivement conscience de l’animosité et de l’hostilité qu’il éprouvait à l’égard de sa mère, sentiments qui remontaient à l’enfance, et coexistaient avec la culpabilité qui résultait de ses désirs d’agression vis-à-vis d’elle, mais aussi avec la peur de la perdre et de se retrouver ainsi orphelin. Ses relations avec les femmes étaient fortement marquées par ce rapport à sa mère : en particulier, il les associait à une menace potentielle et avait tendance à instaurer systématiquement un rapport de force pour éviter de tomber sous leur emprise. Sa décision de se séparer de sa femme était liée au moment où elle avait pris de plus en plus d’importance au sein de l’entreprise et où son attitude à l’égard de son mari avait évolué de la soumission et de l’admiration initiales à une compétitivité plus ouverte corrélée à son désir de s’affirmer. S’était ajoutée à cette évolution une attirance de sa
82
Le décideur face à ses choix
femme pour un collègue plus jeune que lui, ce qui avait ravivé chez M. X des angoisses et des souvenirs des rivalités vécues au sein de la fratrie. La peur paranoïaque de voir ces deux « conspirateurs » s’emparer de l’entreprise avait atteint son paroxysme lorsqu’il avait décidé de se séparer d’elle, ce qui avait également entraîné le départ du collègue plus jeune. Nous arrêterons là la description de ce cas, plus long et plus complexe que cette description ne le laisse paraître. Que pouvons-nous en tirer pour comprendre les mécanismes psychiques en jeu dans certaines décisions ?
3. L’hypothèse de l’inconscient : un nouveau déterminisme pour la prise de décision ? 3.1
L’ORIGINE INCONSCIENTE DE CERTAINES DÉCISIONS
Si ce cas nous intéresse, c’est tout d’abord qu’il illustre à quel point certaines décisions sont loin d’être le fruit d’un raisonnement conscient. Pourtant, les décisions de création d’entreprise, les choix d’investissement, les choix de structure et de mode de fonctionnement, la décision de revendre son activité, sont classiquement abordés comme des décisions faisant appel à l’analyse et à la réflexion. Cette représentation est bien rassurante, puisqu’elle laisse penser à une objectivité possible dans des choix aussi importants et renvoie à un idéal de contrôle et de rationalité. Elle évacue la profonde subjectivité à l’œuvre dans certains choix et serait finalement bien commode si la réalité ne nous montrait en permanence l’intervention de l’étrange et du non expliqué dans la plupart des choix qui y sont faits. Le cas de Monsieur X nous montre que de nombreuses décisions qu’il a pu prendre ont une origine inconsciente. Elles prennent racine sur une scène psychique invisible a priori, que seul son travail d’analyse lui permet de faire émerger 7. Gageons que, s’il n’avait pas fait appel à Manfred Kets de Vries, à la fois psychanalyste et spécialiste des organisations, cette scène aurait eu toutes les chances de rester inconsciente, et pourtant… terriblement agissante. Les difficultés rencontrées par son entreprise l’auraient peut-être mené à la faillite, ou il aurait pu la revendre avant d’en arriver à cette extrémité et la conclusion classique aurait vraisemblablement été qu’il n’avait pas su analyser correctement le marché, recruter les bonnes personnes, anticiper les évolutions, mesurer les risques liés à ses choix d’investissement, etc. Cette explication fait jouer à la pensée, à l’attention, au raisonnement et au jugement un rôle essentiel. Elle présuppose qu’un « bon » décideur est capable d’exercer une réflexion, d’introduire les paramètres qu’impose la prise en compte du contexte, de décomposer un problème en éléments distincts, de comparer plusieurs solutions… a contrario, le « mauvais » décideur est celui qui faillit sur ces aspects. L’analyse faite à la lumière de la théorie psychanalytique met au contraire en évidence l’origine inconsciente des choix de M. X et des difficultés consécutives. 7 Le travail d’analyse s’est fait pendant 4 ans, à raison de 5 séances de cinquante minutes par semaine. Le travail s’est donc réalisé de manière très approfondie, avec une grande richesse de matériaux que la restitution du cas ne permet pas ici de rendre.
Le décideur sur le divan : quand l’inconscient entre en scène
83
Qu’est-ce qui détermine ses choix ? Certainement de multiples facteurs. Mais cette analyse fait ressortir comme essentiels un fantasme de grandeur, un besoin de réparation narcissique, un rejet de tout contrôle, une peur très archaïque d’échouer. Ces éléments s’articulent autour d’un conflit entre d’une part le désir d’être reconnu et même préféré par sa mère, d’autre part, celui d’échapper à son emprise et à son contrôle. À ce niveau d’analyse, la « rationalité » de Monsieur X n’est pas limitée par ses capacités cognitives, elle est limitée par des facteurs émotionnels très profonds, archaïques et tellement inconscients qu’il se retrouve « pris » dans un scénario qui lui échappe, mais dans lequel il joue néanmoins un rôle essentiel. Il se trouve prisonnier de son propre psychisme. On est loin, dans cette conception, d’un décideur doté d’un libre-arbitre, libre de choisir au mieux de ses intérêts. L’apport majeur de la psychanalyse pour la compréhension des décisions est de mettre en évidence le fait que le passé détermine en partie le présent, et plus particulièrement, que certaines décisions sont intimement liées à l’histoire personnelle du décideur, sans, la plupart du temps, qu’il en ait conscience. C’est d’ailleurs une explication intéressante pour comprendre un phénomène qui a souvent été mis en évidence dans l’étude des décideurs : les changements sont difficiles, les individus tendent à répéter les mêmes types de décision et les mêmes types d’erreurs. Alors que ces répétitions sont souvent analysées comme étant le fruit de capacités cognitives limitées qui poussent à répéter ce que l’on sait faire ou ce qui a donné des résultats satisfaisants par le passé, l’éclairage psychanalytique nous fait envisager la répétition comme la manifestation, souvent coûteuse en termes de résultats, d’un scénario inconscient qui cherche à se faire reconnaître à travers ses manifestations. C’est ainsi que Monsieur X va répéter des choix de développement risqués et potentiellement très rentables, avec cependant la possibilité d’une incohérence stratégique et de conséquences négatives à terme. Cette analyse peut s’appliquer à de nombreux cas de dirigeants. Kets de Vries 8 cite, entre autres, celui de Robert Maxwell, qui avait développé un empire dans le secteur de la communication. Après sa mort, il s’avéra que cet empire était bâti en partie sur des illusions, sur le mensonge et l’escroquerie. L’étude du développement obsessionnel de son entreprise et de ses modes de fonctionnement met à jour un fantasme de toute-puissance extrêmement fort, qui conduisit ce dirigeant à donner satisfaction à ses propres désirs narcissiques, au mépris des lois et de la prudence, et à manipuler son entourage avec génie. Des cas plus récents et fortement médiatisés tels que le développement très rapide de Vivendi ou la faillite du fond d’investissement LTCM (cf. encadré 11) mettent également en évidence les besoins narcissiques développés de dirigeants animés par un fantasme de toute-puissance.
8
Kets de Vries (1995).
84
Le décideur face à ses choix
ENCADRÉ 11
Le cas LTCM a : narcissisme collectif et « irrationalité illimitée »
▲
Long Term Capital Management (LTCM) était un fond d’investissement américain créé en 1994 par John Meriweather, ancien cadre de Salomon Brothers qui avait la réputation d’être un des meilleurs traders de Wall Street. A son départ de cette banque, il entraîna avec lui plusieurs des cadres les mieux rémunérés de l’établissement, et recruta David Mullins, qui avait été professeur d’économie à Harvard et vice-président de la banque centrale américaine (US Federal Reserve Bank). Deux brillants économistes de renommée internationale, Robert Merton de l’université d’Harvard et Myron Scholes de Stanford, les rejoignirent. Ceux-ci avaient développé une célèbre formule — la formule Black-Scholes — permettant de mesurer et d’évaluer le risque des options de placement. Cette formule était au centre du fonctionnement de LTCM, en permettant de calculer des niveaux de risque, qui déterminaient les pires scénarii à horizon temporel et degré de confiance donnés. Essentiel était dans cette approche le ratio dettes/capital. LTCM était extraordinairement endettée, avec, en 1998, un ratio calculé par la SEC (Securities and Exchange Commission) de 50 pour 1, contre une moyenne de 2 pour 1 pour la plupart des fonds d’investissement. Au départ, LTCM sembla se développer avec succès : des investisseurs de grande renommée y avaient placé des fonds importants (Crédit Suisse, Merryl Lynch, Dresdner Bank, etc.) ; leurs profits avaient plus que doublé entre 1994 et 1996 ; et Merton et Scholes obtinrent le Prix Nobel d’économie en 1997, pour leurs travaux sur le risque. Peu après l’obtention de ce prix, les dirigeants de LTCM s’engagèrent dans une réflexion stratégique majeure, qui aboutit, entre autres, à rendre 2,7 milliards de dollars sur les 7 milliards de capital à ses investisseurs, au grand dam de ces derniers. À cette époque, ils avaient terriblement confiance dans le succès de leur entreprise : elle opérait sur de très nombreux marchés, sur lesquels elle n’avait pour la plupart pas d’expertise, et investissait des sommes énormes. Au même moment — fin 1997, début 1998 — commençait à se profiler la crise asiatique et les marchés financiers étaient marqués par le pessimisme et la crainte. En mai 1998, LTCM perdit 312 millions de dollars et 461 en juin. Malgré ces pertes, il fut décidé lors d’une réunion en juin qu’il n’y avait pas besoin de faire grand chose, hormis solder certaines positions plus liquides pour récupérer du capital. Au même moment, la crise asiatique se propagea au Brésil et à la Russie, entraînant un désastre financier et la faillite pour de nombreuses institutions financières. LTCM perdit le 21 août plus d’un demimilliard de dollars. En septembre, le désastre fut ébruité et, devant les risques de déstabilisation de toute la place new-yorkaise qu’une telle faillite pouvait entraîner, le congrès américain décida de débloquer la somme de 3,6 milliards de dollars pour sauver l’entreprise. Alors qu’un désastre majeur était évité, les conséquences furent quand même catastrophiques : de nombreux investisseurs perdirent des sommes colossales, le portefeuille de LTCM fut réduit de 90 % en un an, pendant que la majeure partie des troupes partait. Ultérieurement, l’entreprise déposa le bilan. Ainsi que le souligne Mark Stein, ce qui pose le plus problème dans ce cas est la constance avec laquelle les dirigeants de LTCM ont ignoré de manière flagrante les signaux d’alarme sur l’état du marché en 1997 et 1998. L’hypothèse cognitive semble ici peu crédible : d’une part, l’enquête ultérieure a montré que l’information était largement disponible chez LTCM, sur la nature de ses positions, les niveaux de couverture et de risque, la nature de ses marchés et le caractère global et inter-relié de l’économie et des marchés financiers ; d’autre part, l’organisation avait largement les capacités cognitives pour traiter l’information disponible : ses membres étaient tous considérés comme brillants, sortis des
Le décideur sur le divan : quand l’inconscient entre en scène
85
meilleures universités américaines et des meilleures institutions financières de Wall Street, prix Nobel pour certains, équipés du matériel informatique le plus sophistiqué et d’une formule considérée comme la « théorie la plus réussie non seulement en finance mais dans toute l’économie » (The Economist, 16 février 1991, in Stein, 2003). LTCM était dotée d’une expertise unique en matière de risque systémique et de crash boursier en la personne de David Mullins, ancien vice-président de la banque centrale américaine et membre de la commission Brady qui avait investigué, en 1987, mandatée par le gouvernement américain, sur l’effondrement des marchés financiers. Dès lors que l’hypothèse cognitive semble ne pas tenir la route, quelle explication alternative peut permettre de comprendre ce qui pu se passer dans le cas LTCM ? Mark Stein (2003) développe une analyse ancrée dans la théorie psychanalytique en postulant que l’organisation était une organisation narcissique et que ses caractéristiques narcissiques ont conduit ses membres à prendre des risques illimités, à contre-courant du marché financier. Les caractéristiques sur lesquelles il s’appuie pour caractériser LTCM de narcissique sont les suivantes : 1) L’organisation est ressentie par ses membres comme unique, sans défaut, dotée de qualités exceptionnelles. C’est ce qui semblait s’être développé chez LTCM, d’une part du fait de la notoriété et des cursus exceptionnels des associés, d’autre part par le retour que leur faisaient leurs investisseurs, eux-même prestigieux et investissant des sommes colossales, l’ensemble de la communauté financière de Wall Street et la presse spécialisée. 2) Cet orgueil démesuré est associé à un sentiment d’omnipotence inconscient, dans lequel tout ce qui a du pouvoir est soit détenu par l’organisation soit sous son contrôle, ce qui conduit à croire en la détention d’un pouvoir illimité. 3) Un sentiment d’omniscience est également développé, selon lequel les membres de l’organisation pensent détenir toute l’information pertinente susceptible d’être disponible et avoir ainsi une connaissance exhaustive, sans faille, de leur environnement. Robert Merton, lors de la conférence qu’il donna lors de la remise du prix Nobel, prétendit que la théorie de Black et Scholes permettait de faire des prescriptions qui constituaient un « rempart parfait contre les incertitudes du marché ». Les dirigeants de LTCM étaient persuadés qu’avec très peu de capital, l’entreprise pouvait faire des paris pratiquement illimités sur le marché. Sentiments d’omniscience et d’omnipotence renforçaient chez les associés la conviction qu’ils maîtrisaient parfaitement les risques auxquels ils s’exposaient. 4) Ces caractéristiques favorisent un sentiment de mépris triomphant vis-à-vis des autres, et donc vis-à-vis des autres entreprises du secteur. Cette attitude conduit à se sentir sans lien de dépendance avec les autres, à penser que les problèmes qui apparaissent dans son environnement ne concernent que les autres, même lorsqu’ils mettent en lumière la vulnérabilité ou les risques qu’affronte l’organisation, et à souhaiter démontrer sa supériorité de manière triomphale à travers l’échec apparent des autres. C’est ce qui explique que les associés de LTCM aient pu par exemple restituer plus d’un tiers de leur capital à leurs investisseurs à un moment où le marché commençait à donner de sérieux signes de faiblesse, ou aient pris les positions les plus risquées sur des marchés qu’ils ne connaissaient pratiquement pas, en pleine période de turbulence. Il semble que les informations sur l’état du marché aient plus été interprétées comme preuve de la faiblesse des autres que comme un sérieux danger pour LTCM. 5) Ces caractéristiques sont profondément enracinées dans la culture et le fonctionnement de l’organisation. Elles l’étaient chez LTCM, où la théorie de Black et Scholes servait de pivot au calcul du risque, et conduisait ses membres à croire en un fantasme de gains illimités. Cette analyse, qui s’appuie sur de très nombreuses données, a le mérite de montrer en quoi une approche psychodynamique de l’organisation permet de mieux comprendre une série de décisions qui ont mené LTCM à la faillite et qui semblent a priori complètement aberrantes, inexplicables dans une perspective d’analyse en psychologie sociale ou cognitive. a. Stein (2003).
86
Le décideur face à ses choix
3.2
LES MANIFESTATIONS DE L’INCONSCIENT
Le concept d’inconscient est au cœur de la psychanalyse. L’ensemble du système conceptuel freudien s’appuie en effet sur la découverte essentielle de la place de l’inconscient dans le psychisme humain et de son fonctionnement. Freud tient la conscience pour une donnée de l’expérience individuelle, qui s’offre à l’intuition immédiate. Il la décrit comme « un fait sans équivalent qui ne se peut ni expliquer, ni décrire (…). Cependant, lorsqu’on parle de conscience, chacun sait immédiatement, par expérience, de quoi il s’agit. » 9 Mais aussitôt que la conscience est acceptée par la théorie psychanalytique comme inhérente au psychisme humain, c’est pour être détrônée de son statut dominant au profit de l’inconscient. « La division du psychique en un psychique conscient et un psychique inconscient constitue la prémisse fondamentale de la psychanalyse (…). La psychanalyse se refuse à considérer la conscience comme formant l’essence même de la vie psychique, mais voit dans la conscience une simple qualité de celle-ci, pouvant coexister avec d’autres qualités ou faire défaut. » 10 C’est bien parce que la conscience est une donnée si immédiate de l’expérience humaine, que l’hypothèse de l’inconscient est très difficile à admettre : « La vanité de la conscience, qui repousse si dédaigneusement le rêve, par exemple, est un des obstacles les plus forts à la pénétration des complexes inconscients : c’est pourquoi il est si difficile de persuader les hommes de la réalité de l’inconscient et de leur enseigner une nouveauté qui contredit les notions dont s’est accommodée leur conscience. » 11 La première difficulté qui se pose est bien, en effet, de « prouver » l’existence d’une activité mentale inconsciente, et qui, de plus, aurait un impact sur nos comportements (pourquoi en effet s’en préoccuper si ces phénomènes inconscients n’agissaient pas à notre insu ?) Certains processus psychiques inconscients sont plus faciles à admettre que d’autres. L’attention et la réflexion ne pourraient avoir lieu s’il fallait à tout moment enregistrer la totalité des perceptions disponibles. L’activité ordinaire de concentration présuppose donc que l’on soit capable de filtrer perceptions, idées et pensées afin qu’elles ne viennent pas perturber nos processus mentaux conscients. Les idées, les perceptions, les sentiments existant à la périphérie du conscient, que l’on peut qualifier de latents, sont rapidement mobilisables dans le champ de l’attention et représentent une partie de l’activité inconsciente. Cependant, il s’agit d’une partie infime de cette activité, et il s’agirait plutôt de ce que Freud appelle le « préconscient ». L’inconscient renvoie alors, dans la terminologie freudienne, à « tout processus psychique dont l’existence nous est démontrée par les manifestations, mais dont, par ailleurs, nous ignorons tout, bien qu’il se déroule en nous (…). Si nous voulons être plus précis encore, nous modifierons cette définition en disant que nous appelons inconscient tout processus dont nous admettons qu’il est présentement activé sans que nous sachions, dans le même moment, rien d’autre sur son compte. » 12 9 10 11 12
Freud (1970, p 18). Freud (1927, p 177). Freud (1953, p 155). Freud (1936, p 99).
Le décideur sur le divan : quand l’inconscient entre en scène
87
Comment prouver l’existence d’une vie mentale inconsciente ayant lieu en dehors de la maîtrise de l’individu et difficilement portée à sa connaissance ? En s’intéressant aux manifestations ou aux productions de l’inconscient. C’est d’abord l’étude d’états mentaux dissociés, et en particulier celle de cas d’hystérie 13, qui va fournir le matériau nécessaire pour analyser les contenus et le fonctionnement de l’inconscient. Mais c’est le rêve qui a été pour Freud la voie royale d’accès à l’inconscient 14 et les mécanismes dégagés dans le rêve sont retrouvés dans d’autres formations de l’inconscient : actes manqués, lapsus, oublis, répétitions. « Le rêve total constitue une substitution déformée d’un événement inconscient et l’interprétation des rêves a pour tâche de découvrir cet inconscient. 15 » L’accès à l’inconscient à travers le rêve se fait par le travail de dégagement de son contenu latent. Le contenu manifeste d’un rêve prend la forme d’un récit en images, la plupart du temps incohérent, confus, lacunaire, parfois absurde, transcription dans une autre langue d’un contenu latent que l’analyse permet de dévoiler progressivement, par un travail d’associations libres et d’interprétation. Le contenu latent est composé de restes diurnes –restes de pensées, de désirs ou de préoccupations que le sujet a élaborés ou ressentis pendant la journée et qui resurgissent souvent sous une forme déplacée ou symbolique-, de souvenirs de l’enfance, d’impressions corporelles, etc., autant d’éléments dont la mise à jour permet de remonter à des désirs jusque-là inconscients. Il s’ensuit que le rêve est considéré dans la théorie psychanalytique comme un moyen qu’utilise le désir inconscient pour s’exprimer et se manifester dans le champ de la conscience, sous une forme masquée, habituellement incomprise par le sujet. Pourquoi l’inconscient doit-il ainsi se travestir, se transformer, pour essayer de parvenir à la conscience ? Pourquoi un mécanisme puissant jouant comme une censure, le refoulement, empêche-t-il la plupart des contenus de l’inconscient d’émerger dans le champ de la conscience. Que contient l’inconscient ? La réponse à ces questions est clairement dégagée dans la conception plus tardive de l’appareil psychique que propose Freud. Il va en effet redéfinir la structure et l’élaboration du psychisme autour d’une trilogie faisant intervenir le Ça, le Moi et le Surmoi. On peut approximativement tenir pour équivalentes la place que le Ça tient dans cette nouvelle définition du psychisme et celle que tenait auparavant l’inconscient. Dans cette conception, cependant, ce contre quoi s’exerce la censure est moins défini comme le pôle inconscient que comme le pôle pulsionnel de la personnalité. Le Ça est considéré comme le constituant initial de notre psychisme, il est défini comme le pôle pulsionnel de notre personnalité, le réservoir des pulsions fondamentales de l’être humain. Il est commode pour définir les pulsions de considérer que les excitations auxquelles est soumis l’organisme sont de deux sortes. Les unes sont extérieures et circonstancielles ; on peut y échapper par la fuite. Les autres sont endogènes et exercent une pression plus ou moins continue. Il n’y a aucune possibilité de s’y soustraire. C’est à ce type d’excitations que renvoie le terme de pulsion. C’est « un concept limite entre le psychique et le somatique, comme le représentant psychique des excitations issues de l’intérieur du corps et parvenant au psychisme, comme une mesure de l’exigence du travail qui est imposé au psychisme en conséquence de sa liaison au 13 Breuer et Freud (1956). 14 Freud (1967a). 15 Freud (2001, p 128).
88
Le décideur face à ses choix
corporel. » 16 Le concept de pulsion s’ancre donc dans le corps et est constitutif de notre expérience d’humain, puisque, bien avant la mise en place de la pensée et du langage, l’existence de l’individu est liée à ses besoins physiologiques : la faim, la soif, l’élimination. Ces besoins, associés aux premières pulsions caractéristiques de l’être humain, demandent à être régulièrement assouvis, leur satisfaction est pour le nourrisson source de plaisir. Cette description des pulsions initiales met en évidence une propriété fondamentale de la pulsion en général : son aspect dynamique, moteur. La pulsion est par définition active, elle entraîne l’action, elle a pour but d’être satisfaite, assouvie, sans se préoccuper d’y parvenir par un moyen plutôt que par un autre. En psychanalyse, on parlera d’objet pour désigner un moyen par lequel la pulsion essaie de se satisfaire. Le Ça, défini comme réservoir des pulsions, est explicitement défini comme étant à l’origine du psychisme : « À l’origine, tout était Ça. Le Moi s’est développé à partir du Ça sous l’influence persistante du monde extérieur. » 17 Les travaux ultérieurs de psychanalystes qui ont travaillé avec des nourrissons et des enfants, comme Mélanie Klein, ont confirmé l’importance de la vie pulsionnelle dès la naissance et dans les premières années de développement de l’individu, pulsions associées à des désirs de possession et de destruction très violents, à des affects extrêmement forts, tels que l’envie et l’agressivité, et potentiellement conflictuelles et ambivalentes. Le Moi est alors défini comme une partie du psychisme qui va progressivement se différencier du Ça 18. Cette différenciation se fait autour du noyau originel représenté par le système conscient, au fur et à mesure que l’être humain, au fil de son expérience, se construit par identifications successives et est soumis aux contraintes de la réalité extérieure et aux exigences du Surmoi — brièvement défini ici, comme l’intériorisation d’un ensemble d’impératifs et d’interdits fondamentaux, héritage de l’éducation et de la culture. Le Moi se voit attribuer dans cette définition les fonctions les plus diverses : contrôle de la perception, anticipation, pensée rationnelle, mais également, rationalisation, défense contre les revendications pulsionnelles, etc.
3.3
UN PSYCHISME RÉGI PAR DEUX TYPES DE PROCESSUS RADICALEMENT DIFFÉRENTS : LES PROCESSUS PRIMAIRES ET LES PROCESSUS SECONDAIRES
L’étude de la formation des symptômes névrotiques et l’analyse des rêves conduisent Freud à reconnaître un type de fonctionnement mental présentant des mécanismes particuliers, très différents des processus de pensée investis par l’observation psychologique traditionnelle. « Les règles de la pensée logique ne jouent pas à l’intérieur de l’inconscient et on peut appeler ce dernier le royaume de l’illogisme. 19 » Cependant, cet « illogisme », particulièrement visible dans les rêves, est caractérisé, non par une absence de sens, comme une observation superficielle le laisserait pen16 Freud (1952). 17 Freud (1970). 18 Une autre approche du Moi le définit comme le produit d’identifications successives à des objets extérieurs qui vont être ainsi intériorisés, incorporés, et constitutifs du Moi. Cependant afin de ne pas alourdir le propos, nous n’explorerons pas plus avant ces approches. 19 Freud (1970, p 33).
Le décideur sur le divan : quand l’inconscient entre en scène
89
ser, mais par un glissement incessant du sens. Les mécanismes mis en évidence, les processus primaires, se caractérisent par le fait que les idées se substituent librement les unes aux autres, le fil de la pensée saute d’une idée à une autre. Des idées disparates paraissent équivalentes. Une idée peut prendre la place d’une autre, investie de la même charge émotionnelle que celle qui a été évacuée. Une idée peut représenter son contraire, comme dans un rêve où l’individu se perçoit en état de sérénité et découvre par association qu’il se trouve en état d’agitation. Le temps ne semble pas y être pris en compte. Tout se déroule au présent. Les processus primaires sont en particulier le déplacement et la condensation. Le déplacement recouvre le mécanisme par lequel une représentation souvent d’apparence insignifiante peut se voir attribuer la valeur psychique, la signification, l’intensité initialement attribuées à une autre. On peut remarquer que le déplacement a toujours une fonction plus ou moins défensive : ainsi, dans le rêve, il permet de faire accéder au Moi des représentations atténuées. Dans la condensation, une représentation unique apparaît comme un point commun à plusieurs chaînes associatives de représentations qui viennent s’y croiser et qui, à l’état conscient, seraient restées séparées. L’autre aspect important du processus primaire est qu’il tend à la recherche d’une identité de perception. À la survenue d’une tension, les traces mnésiques de l’objet et du processus qui ont antérieurement fait disparaître cette tension vont se trouver fortement investies. Le sujet va donc s’efforcer de renouveler, par les voies les plus courtes, l’objet satisfaisant, ou plutôt les perceptions auxquelles l’expérience de satisfaction originelle a conféré une valeur privilégiée. Ce processus met en évidence une caractéristique importante du psychisme humain, dans la conception psychanalytique. En effet, d’après Freud, l’activité psychique inconsciente serait régie par ce qu’il a appelé le principe de plaisir, selon lequel le sujet s’efforcerait toujours inconsciemment d’éviter le déplaisir et de rechercher le plaisir 20. Mais l’expérience conduit à constater que la satisfaction la plus immédiate est souvent décevante, et peut être associée en retour à de pénibles chocs. Il n’y a donc pas, en définitive, de satisfaction durable si l’on persiste à ignorer la réalité extérieure : c’est ce à quoi renvoie le principe de réalité, aménagement du principe de plaisir imposé par l’expérience de la vie. Le principe de réalité met en évidence l’aptitude humaine à tolérer le retard de la satisfaction et à accepter la transformation du désir brut en objectifs qui, tout en apportant la satisfaction recherchée, respecteront les données du monde réel. Un report de la satisfaction doit intervenir pour que l’individu se tourne vers le monde réel et se mette à construire des réflexions compatibles avec la réalité. Pour y parvenir, l’individu utilise des processus qualifiés par Freud de processus secondaires, attribués au Moi, et recouvrant les fonctions classiques décrites en psychologie comme la pensée, l’attention, le raisonnement et le jugement. Le sujet n’est plus tout entier absorbé par son seul désir de reproduire des perceptions agréables, il est capable d’exercer une réflexion, d’introduire les paramètres qu’impose la 20 Le plaisir est entendu par Freud comme une réduction au minimum de la tension énergétique. Le principe de plaisir a donc pour corollaire le principe de constance, selon lequel l’appareil psychique aurait tendance à maintenir aussi constant que possible, la quantité d’excitation (d’énergie) qu’il contient, ce qui impose une capacité d’autorégulation.
90
Le décideur face à ses choix
prise en compte du contexte, de décomposer un problème en éléments distincts, de comparer plusieurs solutions. Cette introduction de la pensée réflexive et de la temporalité entraîne le remplacement du principe de plaisir par celui de réalité. Le principe de réalité suppose donc que les processus secondaires réussissent à dominer l’activité psychique.
3.4
IMPLICATIONS POUR LA DÉCISION
Les longs développements précédents nous ont donc conduit à concevoir que coexistent dans le psychisme humain deux « systèmes » très différents : – l’un, pôle pulsionnel du psychisme, serait antérieur à l’autre dans sa constitution, inconscient, non concerné par la réalité, régulé par le principe de plaisir et régi par des processus primaires ; – l’autre, développé ultérieurement, serait en partie conscient, régulé par le principe de réalité et régi par les processus secondaires qui permettent l’exercice de la pensée logique, du raisonnement, de la décision « rationnelle ». Entre les deux, le refoulement, qui permet la constitution de l’inconscient comme domaine séparé du reste du psychisme, intervient dans les cas où la satisfaction d’une pulsion, susceptible de provoquer du plaisir, risquerait de provoquer du déplaisir à l’égard d’autres exigences (entre autres de la réalité). Quelles sont, pour la compréhension des processus de décision humains — puisque c’est ce qui nous intéresse ici —, les implications de cette conception qui fait coexister chez tout individu deux systèmes aussi différents. À un niveau purement descriptif tout d’abord, cela remet en cause toutes les définitions de l’être humain qui, en psychologie comme en économie, considèrent l’individu essentiellement sous l’angle de ses capacités de jugement et d’analyse. Dans cette perspective, le décideur est capable de définir rationnellement un problème, de rechercher de l’information, de comparer plusieurs alternatives, avant de faire un choix. Même la psychologie de la décision, qui essaie de repérer les écarts par rapport à une telle démarche, reste profondément ancrée dans ce paradigme, puisque l’incomplétude des processus mentaux ou les « biais » identifiés renvoient systématiquement à une déviation par rapport à cette forme de rationalité. Il n’y est pas question d’un autre mode de fonctionnement susceptible de définir également le psychisme humain et d’expliquer certains comportements. Cette omission ne porterait pas à conséquence si l’on pouvait considérer que les deux « systèmes » décrits sont, non seulement étrangers l’un à l’autre, mais surtout parfaitement étanches. Il faudrait alors poser l’hypothèse que les phénomènes de choix, considérés comme appartenant à la catégorie des processus secondaires, ne sont pas pollués par d’autres phénomènes issus d’autres sphères du psychisme, ou que si cela se produit, cela traduit simplement le caractère malade de la personne. Dans ce cas, cela serait du seul domaine de la pathologie mentale et donc du seul ressort de la psychologie clinique, de la psychiatrie ou de la psychanalyse. Les conséquences d’une telle hypothèse seraient simplement, pour l’économie et la psychologie de la décision, de prendre acte d’une conception incomplète des processus mentaux en
Le décideur sur le divan : quand l’inconscient entre en scène
91
général, ce qui finalement est le corollaire habituel et relativement banal de la spécialisation disciplinaire. Les conséquences sont cependant plus importantes si l’on considère, ainsi que nous l’apprend la psychanalyse, que le processus de refoulement n’est jamais parfait, du fait du caractère dynamique de l’inconscient, et qu’il y a suffisamment de preuves de la continuité des effets de l’inconscient et de sa place dans les processus psychologiques normaux. Ce que « l’hypothèse de non pollution » conduirait à considérer comme des épiphénomènes, ou des bizarreries non signifiantes, donc impropres à l’investigation, la psychanalyse invite à l’analyser avec attention. Plus spécifiquement en matière de choix, là où « l’hypothèse de non pollution » conduirait à qualifier certains actes de non intentionnels, d’accidentels, donc ne faisant pas intervenir de choix conscient, la psychanalyse les envisagerait comme susceptibles d’être produits par une intentionnalité inconsciente. Dans le premier paradigme — celui qui n’envisage pas les effets d’un système inconscient dans les processus de pensée et de jugement —, un acte sera considéré comme non signifiant s’il n’y a pas eu de décision délibérée, de choix conscient, à son origine. Il n’a pas de signification, il est accidentel. On n’a pas choisi de le faire. Ou éventuellement, on peut a posteriori rationaliser un acte –qui devient alors une action- en reconstruisant a posteriori une décision, qui le justifierait. Pour la psychanalyse, au contraire, un acte a priori non intentionnel peut renvoyer à une intentionnalité, à des motivations, à des raisons, simplement inconscientes. Cette partie nous conduit donc aux conclusions provisoires suivantes : nos choix et nos actes sont potentiellement la conséquence d’une diversité de mobiles, conscients et inconscients, s’exerçant simultanément ; or une grande partie de nos pensées et de nos mobiles restent inconscients. Dans ce contexte, le sens et l’origine de nombreuses décisions sont susceptibles de nous échapper.
4. La complexité de nos choix : ambivalence et conflit Dans Psychopathologie de la vie quotidienne 21, Freud raconte l’histoire suivante : un romain sortant de chez lui pour quelque importante affaire, fait un faux pas, qu’il interprète comme un signe divin, et renonce alors à son projet, ce en quoi il fait bien. Mais pour arriver à cette conclusion, point n’est besoin d’invoquer le ciel : le faux pas peut être considéré comme le reflet d’un désir inconscient de ne pas entreprendre le projet initial. Une entreprise qui suscite un tel conflit intérieur a peu de chance d’aboutir et il est en effet sage d’y renoncer ou d’y mieux réfléchir. La psychanalyse introduit là un regard original sur un acte apparemment anodin, qui ne serait pas pris en compte dans une approche classique de la décision, la décision de participer à l’entreprise ayant été prise au préalable et n’ayant a priori rien à voir avec le faux pas ultérieur. 21 Freud (1967b).
92
Le décideur face à ses choix
Les travaux sur la psychologie du choix ont fait apparaître la tendance fréquente, chez l’individu, à violer le principe dit de transitivité des préférences. Par exemple, M. Martin pourra déclarer préférer les fraises à la glace et la glace au clafoutis, puis affirmer sans hésiter qu’il préfère le clafoutis aux fraises 22. Ce faisant, il viole allègrement et sans s’en rendre compte le principe de transitivité des préférences, selon lequel il serait supposé préférer les fraises au clafoutis, s’il était doté d’un minimum de logique. Sa réponse sera donc décrite comme « irrationnelle », mettant en évidence une « anomalie » dans ses préférences, pour le moins « farfelues » et « étranges » 23. Pour parvenir à cette conclusion d’« étrangeté » ou d’« anomalie », il faut au préalable s’attendre à ce que l’individu ait des préférences transitives (cf. à ce sujet le chapitre 1. de cet ouvrage), ce qui suppose une série de postulats : 1) on est conscient de ses pensées et sentiments à l’égard d’un objet 24 ; 2) on est capable de les agréger pour produire un résumé synthétique exprimé par « je préfère » ; 3) cet agrégé synthétique peut être ordonné sur une échelle de préférence. Le constat d’intransitivité des préférences ne peut alors s’analyser que comme une bizarrerie, puisqu’en toute logique, il ne devrait pas apparaître. La psychanalyse nous invite au contraire à concevoir ce phénomène comme parfaitement compréhensible dès lors que l’on s’appuie sur d’autres postulats. Le premier, nous l’avons évoqué dans la partie précédente, est que certains de nos sentiments et de nos pensées à l’égard d’un objet sont inconscients alors que d’autres sont conscients. Le second est que, dans cet ensemble conscient et inconscient, il existe des contradictions, des ambivalences et des conflits. Le troisième est que nous évitons de ressentir ces contradictions, ambivalences et conflits, qui nous mettraient mal à l’aise, grâce à différents mécanismes de défense (tels que le refoulement, que nous avons déjà abordé, ou le clivage, mécanisme que nous définirons ultérieurement). Le quatrième est que, bien que nous ne les ressentions pas, ils sont néanmoins actifs. Une conséquence de ces postulats est que l’expression d’une préférence est nécessairement en partie fausse dans la mesure où elle ne tient pas compte de la complexité de nos pensées et sentiments à propos d’un objet ou n’en est qu’une approximation assez éloignée. Dès lors, il devient très difficile d’ordonner plusieurs objets sur la même échelle et l’intransitivité des « préférences » ne fait que traduire cette difficulté. Examinons le second postulat. La psychanalyse considère le conflit psychique 25 comme constitutif de l’être humain. Le terme de conflit renvoie au fait que s’opposent en chaque individu des exigences internes contraires ou inconciliables. Ce conflit peut être abordé selon plusieurs perspectives : conflit entre le désir et la défense, conflit entre les différents systèmes du psychisme, conflit entre les pulsions, conflit oedipien. 22 Exemple repris de Piattelli Palmarini (1995, p 24-26). 23 Ces termes sont ceux employés par Piattelli Palmarini (1995, p 24-25) et sont repris ici car ils expriment bien les remarques habituelles des chercheurs lorsque leurs expériences mettent en évidence l’intransitivité des préférences. 24 Le terme objet pouvant renvoyer tant à une personne, qu’à une situation ou à une chose. 25 La théorie du conflit psychique englobe les notions de contradiction et d’ambivalence. C’est la raison pour laquelle nous parlons surtout ici de conflit, concept plus général.
Le décideur sur le divan : quand l’inconscient entre en scène
93
Dès ses origines, en effet, la psychanalyse a rencontré le conflit psychique, qui est devenu une notion centrale de la théorie des névroses puis de la psychologie freudienne. Les premiers cas d’études de l’hystérie 26 — cf. en particulier les célèbres cas d’Anna O. et de Dora — montrent que Freud rencontre dans la cure une résistance croissante au fur et à mesure qu’il approche des souvenirs pathogènes. Cette résistance n’est elle-même que l’expression d’une défense intrasubjective contre des représentations qui, lorsqu’elles finissent par être retrouvées par le sujet au cours de la cure, se révèlent inconciliables. Cette place fondamentale accordée au conflit psychique dans le développement de la névrose hystérique va être ensuite généralisée par Freud aux autres névroses, le symptôme névrotique se voyant alors défini comme un compromis, au demeurant coûteux, entre des groupes de représentations agissant comme deux forces de sens contraire. Le cas du « petit Hans » en fournit une illustration. Hans est un petit garçon qui craint de sortir de chez lui, par peur des chevaux. Cette phobie est le symptôme d’un conflit intrapsychique, progressivement mis en évidence au cours du travail analytique. Hans désire exercer sur sa mère une domination, désir mêlant pulsions sexuelles et agressives. Il est cependant tout à fait irréaliste qu’il puisse réaliser son désir, d’une part en raison des convenances sociales, d’autre part parce qu’il ne dispose d’aucun moyen pour y parvenir. La peur du châtiment se matérialise par la représentation du cheval (qui renvoie symboliquement à son père) qui risquerait de le mordre s’il le rencontrait. De plus, la restriction qu’il s’impose en ne voulant plus sortir freine son développement en l’empêchant d’accéder aux activités de son âge. Il est donc placé en situation de régression par sa névrose, conflit entre le désir de dominer sa mère et la conscience de l’inconvenance de son désir pour lequel il risque d’être puni. Un autre phénomène vient s’ajouter aux symptômes : comme sa phobie oblige sa mère à rester en permanence auprès de lui pour apaiser ses angoisses, il obtient ce qu’il désire, bien que cela soit sous une forme modifiée et coûteuse. Au fur et à mesure de son développement, la psychanalyse va être conduite à ne plus restreindre le conflit aux névroses et à le considérer comme une donnée majeure du fonctionnement psychique en général, que l’on retrouve à l’œuvre dans les rêves, les lapsus, les actes manqués (ainsi que nous le rappelle l’histoire du Romain décrite ci-dessus). Le conflit peut tout d’abord être abordé comme un conflit entre les différents pôles de la personnalité. Les pulsions à l’œuvre dans le Ça et visant à satisfaire au principe de plaisir, les interdits et les exigences du Surmoi, ainsi que la tendance du Moi à différer le plaisir pour tenir compte de la réalité et de ses contraintes, sont autant de forces susceptibles de chercher à jouer dans des sens différents et d’entrer en conflit. C’est ainsi que le conflit principal du petit Hans s’articule autour d’un antagonisme entre son désir pour sa mère — qui, sous la forme d’une pulsion agressive et sexuelle, émane du Ça — et la conscience de l’inconvenance de son désir — ancrée dans son Surmoi. On remarquera au passage le fait que le désir de l’enfant soit fortement connoté sexuellement et soit à l’origine même du conflit et des symptômes qui s’ensuivent. Ceci n’est pas anodin, et renvoie à l’importance déterminante des pulsions et particulièrement des pulsions sexuelles et agressives dans la genèse des 26 Breuer et Freud (1956).
94
Le décideur face à ses choix
conflits intrapsychiques. En effet, celles-ci ne sont pas forcément compatibles avec les normes sociales, également internalisées par le sujet. La théorie psychanalytique va progressivement dégager l’existence de conflits au sein même de chaque instance psychique. Par exemple, on peut trouver dans le Surmoi les pôles d’identification maternel et paternel, susceptibles d’entrer en conflit. Mais c’est surtout le dualisme invoqué par Freud, celui des pulsions de vie et des pulsions de mort, qui, par l’opposition radicale qu’il met en jeu au sein du Ça, donne un socle à la théorie du conflit. La conception freudienne, apparue tardivement dans sa théorie et reprise largement par ses successeurs (dont Mélanie Klein, cf. infra), considère que les pulsions humaines s’organisent autour de deux tendances contraires : une tendance à créer, maintenir et préserver la vie, à l’œuvre dans la sexualité, l’amour et la recherche d’auto-conservation, et une tendance à la détruire, ce qui renvoie à la haine, à l’agressivité et à la destruction. L’école kleinienne, fondée par la psychanalyste Mélanie Klein, a largement repris et développé cette opposition, en faisant jouer aux pulsions de mort un rôle essentiel dans le développement psychique du nourrisson et plus largement en mettant en évidence l’ambivalence fondamentale de l’être humain dès le début de son développement. D’après Mélanie Klein 27, les premières relations du bébé avec le monde extérieur sont dominées par la crainte de l’anéantissement, et l’angoisse liée à sa position extrêmement dépendante de sa mère, qui en assure la survie via les soins qu’elle lui pourvoit et en particulier l’alimentation. Il semblerait qu’il ressente la perte de l’état intra-utérin, la souffrance et le malaise liés à l’expérience de la faim, comme provenant de forces persécutrices, associées au sein maternel. L’angoisse de persécution entre donc dès le début dans sa relation avec les objets parce qu’il est exposé aux privations. La relation au sein maternel (ou à son substitut), considérée comme la première expérience de relation d’objet de l’enfant, préfigure les relations d’objet ultérieures. Cette première expérience se caractérise par son ambivalence. En effet, le sein est considéré alternativement comme « bon objet », dans la mesure où il gratifie et apaise, et comme « mauvais objet » lorsqu’il se dérobe et est ainsi source de frustration, ce qui donnerait lieu à des fantasmes de destruction très puissants. Ces émotions à l’égard du sein maternel sont extrêmes : le mauvais objet est éprouvé comme un persécuteur terrible alors que le bon objet est idéalisé comme capable de satisfaire le désir le plus vorace. À ce stade, le nourrisson n’est pas capable de faire la synthèse entre les deux et il les maintient soigneusement séparés l’un de l’autre dans son psychisme (il « clive » les deux représentations), ce qui lui permet de faire diminuer l’angoisse persécutrice en remplaçant le mauvais objet par l’objet idéalisé, lorsque la sensation de faim n’est pas trop importante. Le clivage est une défense contre l’angoisse de persécution dont il fait l’expérience dès la naissance avec intensité alors qu’il dispose d’une capacité limitée à supporter une émotion si aiguë. Au fur et à mesure de son développement, sa relation avec le monde extérieur devient plus complexe et plus différenciée, ses capacités à communiquer s’élargissent, le nourrisson devient moins dépendant de son environnement externe, il supporte mieux la frustration et l’angoisse de persécution s’atténue. C’est alors qu’il devient progressivement capable d’intégrer les deux objets en un objet total : la 27 Cf. par exemple Klein (1950, 1968a, 1968b).
Le décideur sur le divan : quand l’inconscient entre en scène
95
synthèse entre les sentiments amoureux et les pulsions destructrices à l’égard d’un unique objet peut se faire. Cette intégration conduit le conflit entre l’amour et la haine à se manifester dans toute sa force. En conséquence, elle contribuerait au développement d’un sentiment de culpabilité et du besoin de réparer l’objet que l’on a voulu endommager. Cette théorie des premiers stades du développement psychique, exposée très partiellement ici, a été reprise et développée par de nombreux psychanalystes, parmi lesquels Winnicott, Bion, Jaques. Elle donne une réelle assise à plusieurs découvertes freudiennes. Ainsi, le conflit psychique et l’ambivalence, que Freud, à travers sa clinique, identifie comme des caractéristiques fondamentales des processus psychiques, sont mis au cœur du développement initial de l’être humain. Nos premières relations d’objets, qui font la trame de nos relations ultérieures, se mettraient en place autour d’une dualité fondamentale entre libido et agression, amour et haine. Quant au clivage, décrit comme un mécanisme qui se met en place pratiquement dès la naissance et permet de se défendre contre l’angoisse persécutrice, il influencerait fondamentalement la façon dont se constitue le processus ultérieur de refoulement. Enfin, un approfondissement de la question du conflit psychique conduit au conflit fondamental qu’est le complexe d’Oedipe : dans celui-ci, le conflit est présent comme lutte entre le désir et l’interdit. Les développements précédents nous conduisent donc à concevoir l’être humain comme se constituant dès son origine autour de conflits psychiques refoulés et de relations ambivalentes à l’égard de ses premiers objets. Dans la théorie proposée par la psychanalyse, ces expériences initiales sont fondamentales et forment une sorte d’empreinte pour nos relations ultérieures, marquées également par des sentiments contradictoires et ambivalents. Le cas de Monsieur X met bien en évidence l’importance de ses conflits psychiques dans certains de ses choix. Ainsi, son analyse fait ressortir la coexistence de sentiments et de motivations jouant dans des sens opposés : le besoin d’être valorisé et aimé par sa mère et celui d’échapper à son emprise ; l’amour et la haine à son égard qu’il transpose sur les femmes et la sienne en particulier ; le besoin d’argent pour ne pas revivre les frustrations liées à la précarité de son enfance et l’envie de défier sa mère qui valorise la sécurité en prenant des risques qui pourraient le conduire à la faillite ; le besoin forcené de réussir et de gagner l’admiration des autres qui le pousse à des choix spectaculaires et l’angoisse d’échouer d’autant plus susceptible de se manifester que les choix sont risqués ; un sentiment de toute-puissance et de domination sur les autres et un sentiment de grande fragilité et d’impuissance. Cependant, il est bien loin d’en avoir spontanément conscience. Seul son long et patient travail d’analyse lui fera accéder à ce nœud de conflits et faire les liens avec ses choix passés. Dans le cas célèbre de « L’homme aux rats » 28, Freud explique comment une névrose obsessionnelle chez un de ses patients a pour origine totalement inconsciente une incapacité à faire un choix, incapacité qui s’ancre dans un conflit psychique ancien et pourtant extrêmement actif dans le développement de son patient. Celui-ci, à l’âge adulte, aime une femme mais ne parvient pas à se décider à l’épouser. L’analyse lui fait d’abord prendre conscience de ses sentiments ambivalents à son égard : il l’aime certes, mais sait également qu’elle est stérile, ce qui le gêne. De plus, 28 Freud (1954b).
96
Le décideur face à ses choix
il éprouve à certains moments des sentiments agressifs, liés à la jalousie. D’un autre coté, il est mis face à la tentation d’épouser une autre femme, présentée par ses parents, issue d’une famille aisée, ce qui, par contraste fait ressortir la situation modeste de la première. L’analyse permet également de mettre en évidence le lien qu’il fait inconsciemment entre son dilemme et le choix qu’a fait son père, avant sa naissance, d’épouser une femme fortunée, sa future mère, plutôt qu’une « jeune fille modeste, pauvre mais jolie » 29 dont il était épris et qu’il connaissait avant de rencontrer l’autre femme. Cette « trahison sentimentale » aurait, entre autres, permis au père d’apurer une dette de jeu, qu’il ne réussit cependant pas à rembourser, faute de retrouver son créancier. Pour le fils, le patient de Freud, choisir la femme plus aisée, la seconde « alternative » (ce terme étant entendu au sens de la théorie de la décision comme une possibilité de choix), se résume inconsciemment, à faire le choix de son père (et ce doublement, puisque ses parents lui ont proposé cette jeune fille, et que son père avait déjà fait ce type de choix lorsqu’il était jeune), tandis que choisir la première femme, l’autre « alternative », reviendrait à choisir l’objet de son propre désir. Ce choix difficile le renvoie à un conflit très ancien que l’analyse permet progressivement de mettre à jour : un conflit entre son attachement très profond à son père et l’hostilité inconsciente qu’il éprouve également à son égard, éléments classiques d’un conflit oedipien non résolu, son père étant vécu comme celui qui l’empêche d’accéder à l’objet de son désir sexuel. Le fait de choisir en fonction de son désir le renvoie à une peur archaïque d’être puni, ainsi qu’à la culpabilité de transgresser les volontés de son père, tandis que le fait de choisir en fonction du souhait paternel réveille une hostilité extrêmement forte — mais refoulée — à l’égard de ce dernier. La maladie qu’il développe (une névrose obsessionnelle) lui évite de résoudre ce conflit en différant le moment du choix, car il a pris du retard dans ses études et n’est pas en situation de se marier donc de choisir. Nous n’avons restitué de ce cas que ce qui nous permet d’illustrer le lien entre la théorie du conflit psychique et la décision. Là où la plupart des théories du choix considèrent que nous serions capables de « mettre à plat » nos critères de choix et de comparer plusieurs objets de jugement en fonction de ces critères, la psychanalyse met en évidence la complexité de nos motivations, complexité qui nous échappe en général, et qui pourtant a un impact sur ce que nous faisons en dernier ressort. Certes, il ne s’agit pas de généraliser abusivement et de considérer que ces phénomènes s’appliqueraient à tout type de choix et de jugement. Nous cherchons essentiellement à comprendre des choix faits en contexte naturel, dans la vie de nombreux individus : choix de métier, de carrière, d’amis, de conjoint, d’activités, etc.
5. La décision : une production du sujet, un scénario déjà écrit En économie et en psychologie expérimentale, les problèmes de choix sont donnés au sujet, ce qui permet ensuite de comparer sur une base commune la manière dont les choix sont effectués. Comme l’a déjà montré le chapitre 2, certaines expériences en psychologie du choix montrent que le décideur est sensible à la manière 29 Freud (1954, p. 228).
Le décideur sur le divan : quand l’inconscient entre en scène
97
dont est formulé le problème, ce qui peut le conduire à un renversement de ses préférences dans certains cas : c’est ce qu’illustrent notamment les expériences liées à l’effet de cadrage. Cependant, dans la réalité, les choses vont bien plus loin encore, puisque les problèmes de choix, pour la plupart, n’existent pas « en soi », et que la première étape du processus de décision, complexe et délicate, est de définir ce qui va faire l’objet d’une décision. Dans une perspective clinique telle que la psychanalyse, ce qui dans la vie d’un individu fait l’objet d’un choix, la manière dont il se représente ce choix et ce qu’il choisit, sont considérés comme très spécifiques au sujet et ancrés dans sa propre histoire. L’objet de la décision est intimement lié à l’histoire de chacun dont il est le produit. C’est ainsi que certaines situations de choix sont même proprement inimaginables a priori. Afin de rendre ces propos plus clairs, nous les illustrerons par un cas clinique, relaté par le psychanalyste J.F. Daubech dans son article sobrement intitulé : « La décision » 30. Il est conduit à recevoir une jeune femme, mère, cadre dans une entreprise, mariée, disposant avec son mari de revenus confortables, qui a décidé d’abandonner son deuxième enfant dont elle a accouché voici quelques semaines, après avoir délibérément caché sa grossesse à son entourage relationnel et professionnel. Elle a parlé de cette décision avec son mari, qui, solidaire, n’a exercé aucune pression sur elle pour qu’elle la modifie. Elle est envoyée par son pédiatre, qui suit son premier enfant, un fils âgé d’à peine un an, et qui, sidéré de découvrir qu’elle a accouché, l’adresse à un confrère psychanalyste pour qu’elle discute de son choix avant la fin du délai légal au terme duquel elle devra confirmer sa décision. Son choix, qu’elle vit comme une nécessité, n’est motivé ni par des raisons financières, ni par des raisons sociales ou professionnelles (elle n’est en rien menacée dans son travail). Elle considère qu’elle n’a pas choisi d’avoir cet enfant, qui serait un « accident », mais que, ayant envisagé puis écarté l’avortement, l’abandon précoce lui semblait la meilleure solution. Au premier entretien, elle explique avoir « accepté de venir parce qu’un doute subsiste en elle et elle souhaite éprouver sa décision au regard de quelques autres. » Une des raisons pour lesquelles ce cas nous intéresse, c’est que la patiente, issue d’un milieu social aisé, est dotée d’une intelligence tout à fait « normale », travaille comme cadre, est bien insérée socialement, d’où la sidération et l’effroi du pédiatre puisque, a priori, rien ne permet de lier son choix à des « nécessités » socioéconomiques. La raison qu’elle invoque est qu’« elle éprouve trop d’amour pour « son » fils et ne peut supporter l’idée d’avoir à le partager avec un deuxième enfant. Elle ne veut rien retirer au premier et n’accepte pas l’idée de ne pouvoir aimer le second avec autant de force ». Au même titre que le psychanalyste qui vit cette rencontre et décrit cette décision, celle-ci, par sa singularité, ne peut manquer de susciter chez nous de multiples interrogations, qui renvoient essentiellement au besoin de comprendre les motivations de la jeune femme. Pourquoi fait-elle ce choix-là ? Pourquoi l’abandon plutôt que l’avortement ? Plus fondamentalement, à quoi renvoie cette décision, qu’exprimet-elle, que dit-elle de cette femme ? Bien que le nombre d’entretiens avec elle 30 Daubech (2001, p. 25).
98
Le décideur face à ses choix
— 3 seulement — ne mettent à disposition que trop peu de matériaux cliniques, nous reprendrons cependant certains éléments de réflexion proposés par J.F. Daubech. La décision de cette femme est prise au nom de l’amour qu’elle porte à son fils aîné et de celui qu’elle estime devoir au second. Cette décision révèle la passion d’une mère pour son enfant, un fils. J.F. Daubech souligne que le deuxième enfant s’annonce avant même le retour de couches, à un moment où l’engagement de la mère à l’égard de son premier enfant est extrêmement élevé et, vraisemblablement, la dépasse. « Elle reste, au moment de sa décision, prisonnière de l’échafaudage fantasmatique animé par l’aîné et incapable de s’en déprendre suffisamment pour bâtir celui qu’impose l’annonce du second. » Dans ce cadre, la venue d’un deuxième enfant est vécue comme une menace : une menace pour le premier qui pourrait se voir priver d’une partie de l’amour de sa mère, une menace pour le second auquel elle estime ne pas être en mesure de donner toute l’affection qu’elle imagine nécessaire à son développement, enfin et surtout une menace pour elle-même, « menacée dans ce qu’elle vit avec le premier ». Les différentes alternatives qu’elle envisage ont pour elle le sens suivant : 1) conserver le second signifie se désinvestir du premier, ce qui, dans son fantasme, correspond à un meurtre symbolique ; 2) avorter serait tuer le second, ce qui la mettrait là encore en position de mère-meurtrière ; 3) abandonner le second permettrait son adoption ce qui le « sauverait », et éviterait de porter préjudice au premier. Son choix et surtout la manière dont elle construit ces différentes alternatives révèle que sa relation à ses enfants se fait sur une base fortement narcissique : elle est incapable de distinguer chacun de ses deux enfants sous l’angle de ce qui leur serait dû (chacun étant supposé avoir besoin de l’amour total de sa mère), et plus fondamentalement, elle s’identifie à chaque enfant et projette sur chacun le besoin d’une relation fusionnelle avec elle-même, qui ne fait que traduire son propre besoin d’une telle relation. Le lien fusionnel qu’elle entretient avec l’aîné, relation totale qui ne tolère aucune perspective de modification, laisse supposer 31 que son premier enfant a pour elle le statut d’un objet chargé de combler ses propres besoins et manques narcissiques. On remarquera la forte ambivalence qu’elle entretient à l’égard du second puisqu’elle rejette l’avortement pour ne pas le « tuer », tout en reconnaissant ne pas être capable de l’aimer « suffisamment ». Son ambivalence se retrouve aussi dans le fait qu’elle dissimule sa grossesse mais la mène à son terme. Ce cas nous permet de mettre en évidence deux idées majeures. Tout d’abord, c’est la manière dont cette femme a construit chaque alternative qui rend sa décision « logique », dans sa logique à elle. D’autres femmes à sa place auraient probablement construit des alternatives différentes ou donné un sens différent aux mêmes alternatives, faisant alors un choix différent. D’autre part, sa décision ne peut être simplement analysée comme une décision. En effet, elle exprime quelque chose qui renvoie à la subjectivité de cette femme, c’est un symptôme du rapport narcissique qu’elle entretient vis-à-vis de son fils et du fait que ses enfants sont l’objet de ses projections et de ses fantasmes (fantasmes de fusion et de mort). 31 Malheureusement, le nombre limité de données ne permet pas d’approfondir cette hypothèse. On se réfèrera au cas de M. X pour comprendre à quel point le travail d’analyse nécessite de nombreuses données.
Le décideur sur le divan : quand l’inconscient entre en scène
99
Bien que ce cas soit singulier par la décision qui s’y trouve traitée, les mécanismes subjectifs en jeu dans la décision prise ne sont cependant pas exceptionnels. Dans le film 12 hommes en colère, un jury composé de 12 hommes doit juger à l’unanimité de la culpabilité ou non d’un jeune homme accusé du meurtre de son père. Au départ, 11 hommes sur 12 le déclarent coupable, sans avoir réellement pris la peine d’examiner l’ensemble des preuves. Le douzième n’est pas sûr de sa culpabilité. Il essaie alors, par un raisonnement rigoureux et patiemment construit, de mettre à l’épreuve l’hypothèse de la culpabilité. Il fait ainsi apparaître les contradictions entre les preuves ou la faiblesse des arguments liés à la culpabilité. Progressivement, les autres jurés tiennent compte de son raisonnement, certains contribuent même à l’enrichir en se remémorant certains détails de l’audience ou en mettant à disposition des autres certaines de leurs connaissances. Finalement, le jury vote à l’unanimité non coupable. Ce cas est en général utilisé pour appuyer des analyses issues de la psychologie sociale, qui montrent par exemple comment un phénomène dit de groupthink a été évité ou comment une minorité peut influencer une majorité (cf. chapitre 8 dans cet ouvrage). Cependant, l’éclairage psychanalytique s’intéresserait dans ce cas à d’autres aspects. En particulier, pourquoi certains jurés manifestent-ils plus de résistance que d’autres à entrer dans le raisonnement plus rationnel que leur propose le douzième juré ? Une explication serait que certains ont projeté sur la situation à juger des éléments de leur propre histoire, ce qui transforme la décision à prendre en autre chose que simplement juger de la culpabilité d’un jeune garçon susceptible d’avoir tué son père. Ce processus est particulièrement flagrant avec le juré qui manifeste le plus de résistances et finit par se rallier à la thèse de non-culpabilité, après tous les autres. Un indice en est l’intensité des affects qu’exprime ce juré tout au long de la discussion : colère, tentatives de faire pression sur les autres, agressivité, pour finir par une crise de larmes, dans laquelle il « craque » et évoque le conflit qui l’oppose à son propre fils, d’un âge similaire à celui de l’accusé et sans contacts avec son père depuis plusieurs années. Sa propre souffrance refoulée s’est transformée en un désir de provoquer également la souffrance de son fils. La situation à juger présente des analogies avec la sienne : elle renvoie à un conflit entre un père et son fils. Le juré la confond alors inconsciemment avec la sienne : l’accusé a tué son père (ce qui renvoie au fait que ce juré, en tant que père, a l’impression d’avoir été tué symboliquement par son propre fils), il doit donc être puni et mourir (puisque ce juré souffre par la faute de son fils, celui-ci doit être puni et mourir). Ce cas illustre à quel point certaines situations de décision n’existent plus « en soi » dès lors qu’elles prennent un sens spécifique pour le sujet qui fait le choix 32. Cela renvoie à une hypothèse très forte en psychanalyse selon laquelle le présent est vécu à la lumière du passé et de l’histoire du sujet, qui viennent y projeter leur ombre. C’est ainsi que des mécanismes de transfert se jouent. On parle de transfert en psychanalyse pour désigner le processus, qui s’opère à l’insu du sujet, par lequel certaines expériences ou certaines personnes du présent sont assimilées à des expériences ou à des personnes liées au passé du sujet et importantes pour lui. Ce qui est 32 On retrouve cette idée du décideur qui doit interpréter, faire sens des problèmes de choix, avant même de décider, dans le chapitre 2, avec l’idée de cadrage et dans le chapitre 6, autour de la coopération et de la négociation. Cependant, en psychanalyse, c’est l’histoire du sujet qui est déterminante dans ce processus.
100
Le décideur face à ses choix
transféré, ce sont le désir inconscient ou les fantasmes profonds, les manifestations transférentielles n’étant pas des répétitions à la lettre mais des équivalents symboliques de ce qui est transféré, qui peut ainsi s’actualiser. Par exemple, dans 12 hommes en colère, le juré transfère sa colère à l’égard de son fils et son désir de le punir sur l’accusé, révélant ainsi qu’il l’assimile à son fils. Son transfert, qui le conduirait à condamner l’accusé, lui permettrait d’actualiser sa colère et son désir de punir qu’il ne peut exercer directement à l’égard de son fils qui refuse tout contact. Si un des jurés n’avait obligé les autres à analyser plus rationnellement la situation à juger, il est probable que ce phénomène de transfert, qui pourtant paralyse les facultés de jugement de cet homme, serait resté inconscient. Le cas de Monsieur X met également en évidence à quel point le transfert joue dans ses décisions. Il transfère sur sa femme et sur ses collaborateurs les relations difficiles qu’il a eues dans sa famille, sa mère en particulier, il transfère dans la conduite de son entreprise des sentiments et des affects liés à ses expériences antérieures. Plus fondamentalement, la psychanalyse nous invite à repérer dans nos décisions les répétitions et les blocages, signe que nos choix ne sont pas libres et sont agis par des phénomènes qui nous dépassent. Le cas de « l’homme aux rats » nous en donne un aperçu. En effet, la névrose de ce patient s’enracine dans une incapacité à choisir. La situation de choix dans laquelle il se trouve non seulement ranime un conflit psychique ancien chez lui, mais s’ancre également dans l’histoire de son propre père. Comme nous l’avons déjà évoqué, celui-ci avait délaissé une jeune fille peu fortunée dont il était épris pour épouser une femme aisée, la future mère du patient, à une période où il avait des dettes. Le patient de Freud se voit mis dans une situation analogue, dans laquelle choisir la jeune fille qu’il aime plutôt que celle que ses parents lui présentent, reviendrait à choisir non seulement l’objet de son propre désir mais également à effacer la trahison du père : là où le père a lâché sur son désir, le fils ne lâchera pas. Il paye par sa névrose une dette contractée par son père 33. Il joue une pièce déjà écrite, d’une certaine manière, dont il est l’acteur principal alors qu’il en ignore tout. Et dans cette pièce, il est conduit à faire un choix dont la signification lui échappe (cf. également l’encadré 12). La thèse lacanienne 34 a fortement développé cette idée d’un sujet « englué » dans une histoire, un rôle, une place qui le dépassent et l’aliènent. Selon Lacan, chaque individu naît à une place qui lui est assignée et qui constitue la base de son identité : avant même sa naissance, on lui donne un nom et il est identifié en tant que « fils », « sœur », « frère de… ». Immergé dans l’histoire de plusieurs générations, dans une culture, dans une position sociale, le sujet existe fondamentalement en référence à sa place dans la chaîne symbolique. Le « je » se constitue dans une expérience langagière, en référence au « tu », dans une relation où l’autre lui manifeste des désirs qu’il doit reconnaître : désir de ses parents, de ses éducateurs, de ses pairs. D’après Lacan, le sujet est dépendant des attributions d’un Autre, attributions 33 On doit à J. Lacan d’avoir insisté sur cet aspect (la dette symbolique qui se transmet d’une génération à l’autre) dans son interprétation de ce cas. 34 On pourra se référer à Lacan (1966). Pour une vision d’ensemble simplifiée de la théorie lacanienne, cf. Dor (1985).
Le décideur sur le divan : quand l’inconscient entre en scène
101
auxquelles il s’identifie et qui constituent les bases de son identité. Lacan évoque les « archives du sujet » qui, s’ancrant au fond de son psychisme, viennent le définir dans sa place et son histoire, jusqu’à le fixer à un endroit dont il ne pourra se déprendre. Dans cette perspective, le sujet ne sait jamais ce qu’il désire ou ce qui le meut vraiment. Ses fantasmes plaquent un sens apparent sur ses choix et ses actions, masquant le fait qu’ils lui viennent toujours de l’ Autre. C’est ainsi que dans le cas « La décision », il resterait à comprendre ce que cette femme joue, à son insu, en abandonnant son deuxième enfant ou dans son attachement fusionnel au premier, en quoi la place qui lui a été assignée dans l’ordre symbolique la conduit à ne pouvoir envisager un autre scénario (malheureusement, et c’est aussi frustrant pour le lecteur du cas que pour le psychanalyste qui l’a vécu, les matériaux cliniques ne permettent pas d’explorer cette voie).
ENCADRÉ 12
Répétition et décision Freud a développe le cas d’un de ses patients ayant comme symptôme l’envie persistante de se séparer de sa femme, sans pour autant se décider à le faire et sans avoir à cela de raison bien valable. « L’homme, écrit Freud, me fit part un jour d’un petit incident qui l’avait profondément effrayé. Il jouait avec l’aîné de ses enfants, celui qu’il aimait le plus. Il le lançait en l’air et le rattrapait jusqu’au moment où l’enfant vint presque se cogner contre le lustre. Il n’arriva rien à l’enfant et pourtant le père en resta figé de stupeur et la mère fit une crise d’hystérie. » Freud interprète cet acte comme exprimant une intention malfaisante à l’égard de cet enfant, pourtant aimé. Mais cette intention n’était plus actuelle puisqu’elle datait de la période où cet enfant ne représentait encore rien pour cet homme, si ce n’est un obstacle à ses désirs de liberté envers sa femme. Freud formule ce désir de mort ainsi : « Si ce petit être qui ne m’intéresse en aucune façon venait à mourir, je deviendrais libre et pourrais me séparer de ma femme. » Mais Freud retrouve ce désir de mort à l’égard d’un enfant dans les souvenirs d’enfance du patient : l’un de ses petits frères était mort et sa mère attribuait cette mort « à la négligence du père », ce qui « avait donné lieu à des explications orageuses entre les époux, avec menaces de séparation. » Freud interprète le désir de se séparer de sa femme chez ce patient comme la répétition, la remise en scène, par ce symptôme, du drame vécu par ses parents. Il semble que son interprétation ait conduit le patient à mettre un terme à son désir de séparation, désir qui finalement ne le concernait en rien, puisqu’il n’était que la répétition d’une autre histoire. La décision de se séparer ou non de sa femme et la difficulté à faire ce choix ne peuvent être ici comprises qu’en référence à l’histoire de cet homme, et le fait de mettre à jour ces liens fait disparaître l’objet de décision. a. Freud (1967b).
102
Le décideur face à ses choix
6. Conclusion En conclusion de ce chapitre, nous espérons avoir contribué à faire comprendre autrement la problématique de la rationalité dans les décisions humaines, en réintroduisant une détermination psychique dans les choix et en mettant en évidence certains mécanismes inconscients et souvent archaïques, susceptibles d’avoir un impact sur les décisions prises. La décision peut être dans ce cadre une émanation du désir, une production fantasmatique du sujet, une répétition du passé, une production de l’ordre symbolique auquel il est assujetti, autant de perspectives qui renouvellent la manière de conceptualiser la « décision ». Il semble assez peu probable que ces perspectives soient utilisées lorsque les choix produisent des résultats satisfaisants, même si ces mécanismes sont certainement tout aussi fréquents dans ces cas-là. En effet, pourquoi alors aller chercher l’origine inconsciente des choix qui sont faits ? D’un point de vue narcissique, il est en effet beaucoup plus valorisant d’y voir par exemple l’effet de l’intelligence, du brio, des capacités d’anticipation des décideurs. Ce n’est que lorsque la dimension psychique en vient à produire des blocages, des répétitions, des dérapages de plus en plus grands, qu’il devient envisageable de s’y intéresser. En comprenant le caractère « étrange » de certaines décisions autrement que comme un problème cognitif, l’approche psychanalytique a le mérite de pouvoir donner une explication à certains « dysfonctionnements » en matière de prise de décision, là où d’autres approches ne permettraient que de les constater et de les déplorer. Conséquence non négligeable, les décideurs y retrouvent leur « âme », leur profonde subjectivité, leur histoire, leurs souffrances, leurs passions, leurs désirs et leurs fantasmes… Ils retrouvent ainsi toute leur humanité.
PARTIE 2
Le décideur face à l’autre : de l’opportunisme à la coopération
SOMMAIRE Chapitre 4
Chapitre 5
Chapitre 6
Le décideur en interaction : égoïste et calculateur
105
Informations asymétriques : l’opportunisme exacerbé
125
Le décideur coopère plus qu’on ne le suppose
151
104
Le décideur face à l’autre : de l’opportunisme à la coopération
INTRODUCTION À LA DEUXIEME PARTIE Quand il se retrouve dans un contexte social, c’est-à-dire face à un autre individu, décideur comme lui dans le cadre d’une décision interdépendante, le décideur individuel doit s’adapter. Les conséquences de ses choix dépendent de l’attitude qui sera adoptée par l’autre décideur. De quelle manière va-t-il tenir compte de cette relation ? Quelles priorités va-t-il mettre en avant ? Quels critères adopter pour que sa décision soit la meilleure possible ? En quoi cela dépend-il des caractéristiques de la situation ? Ce sont quelques unes des questions abordées dans cette partie. On verra, dans le chapitre 4, comment la théorie des jeux modélise, dans cette nouvelle situation, le comportement idéal de l’homo oeconomicus adoptant des stratégies lui permettant de maximiser à coup sûr ses gains personnels. L’individu du chapitre 5, homo oeconomicus toujours, acquiert des informations au fil du jeu et met à jour ses croyances concernant l’autre joueur. Il adopte alors un comportement tactique qui lui permet de préserver au mieux son intérêt et qui passe parfois par une coopération soigneusement calculée. L’individu décrit au chapitre 6 s’inscrit quant à lui dans un contexte relationnel, qui le conduit à dépasser le cadre purement structurel du problème décisionnel pour s’appuyer sur des ressorts liés à la dimension sociale de son comportement : appartenance à un groupe, prise en compte des intentions supposées d’autrui, équité, recherche d’un socle d’aspirations communes conduisant à la coopération. Ainsi, les chapitres 5 et 6 montrent, de façon complémentaire, en quoi l’individu, dans la réalité, est amené à se comporter tour à tour de façon égoïste et opportuniste, ou bien coopérative, mû par le désir de construire une vie en société qui soit, dans la durée, au moins supportable et si possible satisfaisante. L’existence de la coopération et sa fragilité sont en somme le résultat d’un comportement qui oscille entre deux facettes de la nature humaine, poussant un même individu à pouvoir exploiter à son profit la faiblesse d’autrui, quitte à le manipuler, tout en étant capable de sacrifier son intérêt propre avec générosité pour un motif altruiste ou pour une cause collective qui le dépasse. Des garde-fous sont souvent nécessaires pour assurer la pérennité de la coopération …
Chapitre 4
Le décideur en interaction : égoïste et calculateur Philippe BATIFOULIER
Sommaire 1 Dilemme du prisonnier et problème de la coopération
106
2 L’émergence de la coopération
111
3 Décision coopérative et répétition du jeu
117
4 Conclusion
123
106
Le décideur face à l’autre : de l’opportunisme à la coopération
Dans un jeu de société (les cartes par exemple), les individus prennent des décisions en fonction de leurs propres stratégies et de celles des autres joueurs. Ils s’appuient, pour ce faire, sur des règles du jeu fixées à l’avance, et les résultats du jeu s’expriment en gains matériels (paiements financiers) ou immatériels (satisfaction ou utilité). La théorie des jeux est une extension scientifique de ces comportements car elle formalise la prise de décision en interaction stratégique. Ces situations s’observent lorsque les actions des agents — individus, entreprises, décideurs — ont une influence sur les gains des autres agents, contrairement à la situation de marché, où le choix d’un agent n’agit que sur ses propres gains. Les applications de la théorie des jeux sont très nombreuses en sciences sociales. Certains chercheurs vont même jusqu’à affirmer qu’elle est la mère de toutes les sciences humaines car elle formalise le comportement de l’homme en société. La théorie des jeux coopératifs, qui insiste sur l’existence de coalitions et d’ententes, a laissé progressivement place à la théorie des jeux non coopératifs, sous l’impulsion de Nash 1. Cette dernière met en avant les notions de décision et de rationalité individuelle. Un des problèmes les plus intéressants posé par la théorie des jeux non coopératifs est celui de l’émergence de la coopération à partir de comportements égoïstes. Comment la coopération émerge–t–elle des situations de conflits ? Le célèbre jeu du « dilemme du prisonnier » est une illustration de ce problème.
1. Dilemme du prisonnier et problème de la coopération Dans le cas général, le jeu du dilemme du prisonnier décrit une configuration où deux prisonniers ont commis un délit et sont incarcérés séparément. L’alternative pour chacun est de dénoncer ou de ne pas dénoncer son compagnon d’infortune. Si personne ne parle, ils sont libérés. Si chacun accuse l’autre, ils bénéficieront d’une remise de peine. Si l’un dénonce son complice alors que l’autre se tait, le premier est relaxé et l’autre écope du maximum. Dans ce jeu, la solution rationnelle est, pour chacun, de dénoncer l’autre et donc de ne pas bénéficier de la liberté qu’il obtiendrait si aucun des deux ne parlait. En effet, si un joueur se tait, il s’expose à ce que l’autre le dénonce et risque ainsi d’être frappé d’une lourde peine. Sachant cela, sa meilleure stratégie est de dénoncer son acolyte. On le voit clairement, l’équilibre (la solution) du jeu est sous–optimal(e). Quand les deux suspects se laissent guider par leur égoïsme, il en résulte une posture défavorable pour tous. C’est là l’attrait du dilemme du prisonnier. En effet, ce jeu montre que la poursuite du seul intérêt individuel ne conduit pas à l’intérêt collectif. 1
Nash (1951).
Le décideur en interaction : égoïste et calculateur
107
ENCADRÉ 13
Représentation des jeux et diversité des concepts Les jeux peuvent être représentés de deux façons distinctes, soit sous forme normale, c’est-à-dire par la matrice des gains du jeu (c’est la méthode la plus utilisée dans le chapitre 4), soit sous forme extensive c’est-à-dire par un arbre représentant les différentes actions possibles à chaque étape d’un jeu (c’est la représentation la plus utilisée dans le chapitre 5). Ces deux représentations sont équivalentes. La forme extensive peut aussi représenter les sous-jeux d’un jeu ; un sous-jeu correspond en effet à la partie inférieure de l’arbre à partir d’un point donné de cet arbre. Forme normale d’un jeu
Forme extensive d’un jeu J1
J1
A B
X Y (a, b) (c, d) (e, f) (g, h)
B
A
J2
J2 X (a, b)
J2 Y
X
(c, d) (e, f)
Y (g, h)
Ordre de lecture des gains : (gains de J1, Gains de J2)
▲
Dans les représentations sous forme normale, chaque « case » du jeu est une issue ou une solution possible du jeu. Chaque issue est obtenue par croisement des stratégies pures des joueurs. Ainsi, les 2 stratégies pures du joueur J1 sont les actions A ou B, celles du joueur J2 sont les actions X ou Y. Dans la représentation sous forme extensive, les issues sont les extrémités des branches alors que les stratégies pures sont représentées par les flèches partant d’un joueur. Les stratégies mixtes ne sont pas représentées. Elles sont constituées d’un mélange de stratégies pures. Ainsi, jouer A 2 fois sur 3 et B une fois sur 3 (ou A avec une probablité de 2/3 et B avec une probabilité 1/3) est une stratégie mixte du joueur J1. Une solution ou un équilibre d’un jeu est l’issue à laquelle les joueurs aboutissent lorsqu’ils ont joué leurs stratégies. Bien que ces deux termes soient synonymes, on parle plus volontiers d’équilibre lorsqu’il s’agit d’un résultat normatif, et de solution dans le cas contraire. Les notions d’équilibre sont nombreuses car l’équilibre dépend des caractéristiques d’un jeu. Or ces caractéristiques sont elles-mêmes nombreuses. On distinguera ainsi les jeux statiques (ou jeux simultanés) où les joueurs ne se connaissent pas, ne dialoguent pas, jouent simultanément et une seule fois, des jeux séquentiels où les joueurs jouent les uns après les autres et, comme dans les jeux de société, peuvent jouer plusieurs fois au cours d’une partie. Les jeux répétés (ou super-jeux) sont la répétition d’un jeu statique ou séquentiel (appellé « jeu de base »). L’ensemble constitué des jeux séquentiels et des jeux répétés est l’ensemble des jeux dynamiques. Les jeux dynamiques peuvent être à horizon fini (le jeu s’arrête au bout d’un certain temps) ou à horizon infini (le jeu ne s’arrête jamais, ou, ce qui revient au même, personne ne peut jamais savoir quand il s’arrête).
108
Le décideur face à l’autre : de l’opportunisme à la coopération
Une seconde distinction porte sur la nature de l’information : selon que les joueurs divulguent ou non l’information dont ils disposent et selon la nature de cette information, on parlera de jeu à information complète lorsque toute l’information structurelle (comme les règles du jeu) est connue de tous, et de jeu à information parfaite lorsque c’est toute l’information factuelle (comme le choix des autres joueurs) qui est connue de tous. A contrario on parlera de jeu à information incomplète lorsqu’un des joueurs ne dispose pas d’une information structurelle (lorsque dans un jeu d’échecs, par exemple, un joueur ne sait pas si son adversaire est une machine) et de jeu à information imparfaite lorsqu’un joueur ne dispose pas d’une information factuelle, comme dans les jeux simultanés où personne ne sait ce que va jouer l’autre. Philippe Abecassis
1.1
DÉCISION INDIVIDUELLE ET COOPÉRATION
Considérons, dans un premier temps, le problème de la coopération dans l’entreprise 2. Même s’il est, en droit, contrôlable, l’effort des salariés n’est pas directement observable par l’entreprise. Lorsqu’elle recrute un individu, elle ne sait pas vraiment si celui-ci sera véritablement compétent, s’il va s’intégrer dans son groupe de travail, s’il sera ponctuel, etc. Le salarié dispose donc d’une information inconnue de l’entreprise : celle concernant ses véritables capacités. De l’autre côté, l’individu ne connaît rien, a priori, de la bonne volonté de son employeur. Il ne sait pas, en particulier, quelle sera la véritable politique salariale de l’entreprise ni si celle-ci tiendra ses engagements une fois le travail effectué. La relation de travail est donc structurée par une double rente informationnelle : chacun dispose d’une information inconnue de l’autre. Si l’on ne retient (pour simplifier) que des décisions dichotomiques, l’individu a le choix entre fournir un effort élevé ou un effort faible, alors que l’entreprise peut verser soit de hauts salaires ou soit de bas salaires. Il existe donc quatre situations possibles dans l’entreprise, que l’on peut classer par ordre de préférence pour le salarié en donnant un gain (ou utilité) de 3 à la meilleure situation et 0 à la pire. On obtient ainsi : – effort faible pour haut salaire : 3 points ; – effort élevé pour haut salaire : 2 points ; – effort faible pour bas salaire : 1 point ; – effort élevé pour bas salaire : 0 point. Le même raisonnement pour l’entreprise conduit au classement suivant : – bas salaire pour effort élevé : 3 points ; – haut salaire pour effort élevé : 2 points ; – bas salaire pour effort faible : 1 point ; 2 Loin d’être un cas d’école, les configurations de type dilemme du prisonnier sont fréquentes dans les relations sociales. Des raisonnements similaires pourraient être tenus pour décrire le financement d’un bien collectif, les relations inter–entreprises ou entreprises–clients.
Le décideur en interaction : égoïste et calculateur
109
– haut salaire pour effort faible : 0 point. Ces résultats sont donnés sur la figure 4 ci-dessous : La situation A, qui combine haut salaire et effort élevé, rapporte 2 points aux deux acteurs et figure donc, dans le tableau, sous la forme du couple (2,2). Cette situation est la meilleure pour tous dans la mesure où la coopération est totale. La configuration opposée est représentée par la case D. Aucune des deux parties ne veut collaborer. Les employés paressent et les salaires sont bas. Le tableau décrit enfin deux situations intermédiaires possibles : soit l’entreprise adopte une stratégie pacifique en versant de hauts salaires cependant que les salariés agissent toujours négativement par un effort faible (case C), soit c’est l’inverse qui se produit (case B). Ce tableau n’est en fait rien d’autre qu’un jeu du type « dilemme du prisonnier » où la seule solution rationnelle est la situation D, c’est–à–dire la pire collectivement. En effet, si l’entreprise verse de hauts salaires, l’individu a intérêt à répondre par un effort faible (3 points alors qu’un effort élevé ne rapporte que 2 points). Si, au contraire, la stratégie de l’entreprise est de verser de bas salaires, la meilleure réponse du salarié est de produire un effort faible (1 contre 0 pour un effort élevé). Ainsi, quelle que soit la politique salariale de l’entreprise (salaire élevé ou salaire faible), l’individu a une stratégie dominante : fournir un effort faible. Si donc l’individu ne produit qu’un faible effort, la réponse rationnelle de l’entreprise est de verser un faible salaire (1 contre 0). L’équilibre est donc réalisé par le couple de stratégies : (effort faible, salaire faible) c’est–à–dire la case D du tableau. Si l’on adopte l’hypothèse économique orthodoxe selon laquelle chacun cherche, en toutes circonstances, à maximiser son bien-être, alors c’est la solution individualiste (la case D du tableau) qui s’impose. Quoi que fasse l’autre, chacun a toujours intérêt à ne pas coopérer. La non–coopération est la stratégie dominante de chacun des deux joueurs (cf. Encadré 14). Dans le cas contraire, si un joueur coopère, il s’expose à la réponse opportuniste de l’autre. Si le salarié produit un effort élevé, il est de l’intérêt bien compris de
Entreprise Haut salaire
Bas salaire
Effort élevé
(2,2) (A)
(0,3) (B)
Effort faible
(3,0) (C)
(1,1) (D)
Individu
Ordre de lecture : (gain de l’individu, gain de l’entreprise) FIGURE 4 – Le problème de la coopération dans l’entreprise
110
Le décideur face à l’autre : de l’opportunisme à la coopération
l’entreprise de répondre par un salaire faible, ce qui est préjudiciable au salarié. Sachant cela, ce dernier adopte un effort faible et l’entreprise ne peut que répondre par de bas salaires. La non–coopération mutuelle est donc également la meilleure réponse de chacun des deux joueurs aux stratégies de l’autre. C’est ce qu’il est convenu d’appeler un équilibre de Nash (cf. Encadré 14). Ainsi, puisque les deux parties se laissent guider par leur intérêt personnel, il en résulte une posture défavorable pour tout le monde : bas salaire d’un côté, effort faible de l’autre. En théorie, le jeu des décisions individuelles doit aboutir au blocage complet de l’entreprise. Les salariés ne feraient rien et seraient très mal payés. Force est de constater que cela ne correspond pas (toujours) à la réalité.
1.2
LA MODIFICATION DES UTILITÉS
Pour faire coïncider la décision rationnelle (au sens de la théorie économique) représentée ici par la case D du tableau, et la solution raisonnable (la case A), on peut chercher à modifier les utilités ou gains des joueurs (figure 5). On introduit donc, dans le jeu précédent, le paramètre µ qui symbolise les aspirations morales des joueurs. µ représente, en effet, un coût de la non–coopération ou de la mauvaise conscience face à son propre opportunisme.
ENCADRÉ 14
Concepts d’équilibre et d’optimalité en théorie des jeux On appelle équilibre en stratégies dominantes une situation où chaque joueur a une stratégie qui est la meilleure, quelles que soient les stratégies adoptées par les autres joueurs. Dans ce cas, peu importe la décision prêtée aux autres dans la mesure où il existe une stratégie qui domine toutes les autres stratégies possibles. Un équilibre de Nash décrit une configuration où la stratégie de chaque joueur est la meilleure réponse aux stratégies choisies par les autres joueurs (et non plus comme précédemment à toutes les stratégies possibles). Alors qu’en stratégie dominante, peu importe ce que fait l’autre, en équilibre de Nash, chaque joueur détermine sa meilleure stratégie en fonction de ce que joue l’autre. Compte tenu de ces définitions, un équilibre en stratégies dominantes est un équilibre de Nash mais l’inverse n’est pas vrai. Le jeu du dilemme du prisonnier admet un équilibre en stratégies dominantes (D) qui est un équilibre de Nash et qui est également dominé par trois optima de Paréto (A, B et C), c’est–à–dire trois situations qui sont préférables pour au moins un des joueurs. La situation A est, quant à elle, préférable pour les deux joueurs à la situation D puisqu’ils gagneraient 2 au lieu de 1. C’est un optimum collectif. Un optimum de Paréto est une situation où on ne peut pas augmenter l’utilité (ou le gain) d’un individu sans diminuer celle (ou celui) de l’autre. Quand au moins une issue du jeu (une case du tableau) différente de l’équilibre rapporte plus pour au moins un des joueurs sans que l’autre soit lésé, alors l’équilibre est Paréto–dominé. Quand aucune autre issue du jeu ne rapporte plus aux deux joueurs que l’équilibre du jeu, alors ce dernier est dit Paréto–optimal.
Le décideur en interaction : égoïste et calculateur
111
Se conduire en opportuniste, profiter de la bonne volonté de l’autre (par exemple pour l’individu, « tirer au flanc » tout en étant bien payé) rapporte le gain maximal de 3. Mais un tel comportement peut procurer une gêne morale, un mal–être que symbolise ici µ. L’utilité de l’opportunisme est tempérée par la désutilité de la mauvaise conscience. Entreprise Haut salaire
Bas salaire
Effort élevé
(2,2) (A)
(0,3-µ) (B)
Effort faible
(3-µ,0) (C)
(1,1) (D)
Individu
Ordre de lecture : (gain de l’individu, gain de l’entreprise). FIGURE 5 – La coopération avec modification des utilités
Il suffit alors que 3 – µ ≤ 2, c’est–à–dire µ ≥ 1, pour que A devienne équilibre du jeu. La coopération mutuelle est donc rationnelle sous l’effet d’un coût de la non– coopération qui modifie artificiellement les utilités. C’est à ce prix que s’arrête la poursuite suicidaire des seuls intérêts particuliers. La décision coopérative est donc soutenue par un coût de l’opportunisme trop élevé et, par conséquent, par une valorisation de la coopération. Toutefois, D reste un équilibre du jeu possible. En effet, le jeu de la figure 5 admet deux équilibres de Nash : A et D. La décision de coopération n’est donc pas l’unique choix rationnel. Si la distance entre le choix rationnel et le choix raisonnable a pu être diminuée, elle n’est pas, pour autant, supprimée.
2. L’émergence de la coopération L’introduction d’un coût de non–coopération (µ) modifie le résultat de l’interaction stratégique. Le jeu n’a d’ailleurs plus la structure du dilemme du prisonnier (qui, rappelons–le, n’admet qu’un seul équilibre en stratégies dominantes). La combinaison des décisions individuelles révèle désormais deux équilibres. Toutefois, si l’issue coopérative (A) devient un équilibre du jeu, l’issue non–coopérative (D) reste aussi équilibre de Nash du jeu. Dans ces conditions, rien ne garantit que la stratégie coopérative va être suivie par les deux joueurs. Le problème de l’émergence de la coopération reste entier. Pour tenter de le résoudre, il faut faire intervenir d’autres arguments comme la prise en compte de l’incertitude.
2.1
LA DÉCISION INTERACTIVE EN CONTEXTE D’INCERTITUDE
Dans certaines relations sociales, la décision d’un individu s’oppose à celle de l’autre. Il n’y a aucune coopération possible et le jeu est bloqué. C’est le cas, par
112
Le décideur face à l’autre : de l’opportunisme à la coopération
exemple, dans un couple, si le mari veut regarder un match de football à la télévision alors que sa femme préfère le film sur une autre chaîne. Cette configuration, qui constitue certainement un épisode classique de la vie quotidienne, peut être appréhendée par le jeu suivant (figure 6). Femme Film
Match
Match
(1,1) (A)
(3,2) (B)
Film
(2,3) (C)
(0,0) (D)
Homme
Ordre de lecture : (gain de l’homme, gain de la femme). FIGURE 6 – La bataille des sexes
Dans ce jeu, chacun des deux joueurs accorde une utilité de 1 à son spectacle préféré. Les époux ne se détestant pas, valorisent le fait d’être ensemble avec une utilité de 2. Regarder la même chaîne rapporte aux deux joueurs un gain de 2. Auquel s’ajoute 1 pour celui qui regarde son programme favori. D’où les paiements symétriques (3,2) ou (2,3). Regarder seul un programme jugé inintéressant vaut naturellement 0. Enfin, suivre son émission vedette, mais seul, rapporte 1. Les flèches constituent une aide à la détermination des équilibres. Ainsi, l’homme préférera un gain de 2 à un gain de 1. Il passera donc de A à C. La femme préférera un gain de 2 à un gain de 1 et passera de A à B, et ainsi de suite. Ce jeu admet deux équilibres de Nash B et C correspondant, chacun, à un équilibre de Stackelberg 3 pour le joueur qui regarde son émission préférée. Les deux joueurs ont intérêt ici à s’engager le plus vite possible en niant l’engagement de l’autre. Concrètement, le premier qui tient la télécommande a gagné. Il y a lutte pour le premier coup de façon à imposer la politique du « fait accompli ». Puisqu’il y a deux équilibres opposés, les deux joueurs ne peuvent se coordonner sur un même équilibre. Il existe plusieurs équilibres non–coopératifs ce qui révèle une défaillance du jeu. Pour remédier à ce problème, on peut abandonner la notion de stratégie considérée jusqu’ici, à savoir les stratégies pures, pour privilégier la notion de stratégies mixtes. Au lieu de retenir une action déterministe, les joueurs vont prendre leur décision de manière aléatoire. Ils vont former des conjectures. Formellement, cela revient à retenir une distribution de probabilité sur l’ensemble des actions. Les joueurs ne vont plus désormais jouer une stratégie avec une probabilité de 1 (stratégie pure) mais avec une probabilité inférieure à 1 (stratégie mixte). La stratégie maîtresse de l’homme ne sera plus de voir le match de façon 3 Un couple de stratégies constitue un équilibre de Stackelberg si un joueur a une position dominante et se conduit en leader. L’autre joueur est alors condamné à s’adapter.
Le décideur en interaction : égoïste et calculateur
113
certaine, ce qui débouche, comme on l’a vu, sur une impasse, mais de voir le match 1 fois sur 2 ou 1 fois sur 3 etc. 4. Les agents prennent leur décision dans un contexte d’incertitude 5. Ils évaluent donc leurs gains en terme d’espérance mathématique 6. Dans ces conditions, le jeu admet toujours un équilibre en stratégies mixtes alors qu’il n’en existait pas ou trop (comme dans la bataille des sexes) en stratégies pures. C’est là le grand avantage du recours aux stratégies mixtes. Comme l’a montré Nash en 1951, dans tout jeu comprenant un nombre fini d’acteurs, ayant eux-mêmes, un nombre fini de stratégies, il existe au moins un équilibre de Nash en stratégies mixtes 7. Associons donc, dans le cas de la bataille des sexes, la probabilité p1 à la stratégie « match » pour l’homme et 1-p1 à sa stratégie « film ». De même, les probabilités associées aux stratégies « film » et « match » de la femme sont respectivement p2 et 1-p2. Les paiements restent inchangés. L’espérance mathématique E(H) des gains de l’homme s’écrit : E(H) = (p1p2).1 + [p1(1 – p2)].3 + [(1 – p1)p2].2 + [(1 – p1)(1 – p2)].0 ⇔ E(H) = p1p2 + 3.p1 – 3.p1p2 + 2.p2 – 2.p1p2 + 0 ⇔ E(H) = – 4p1p2 + 3p1 + 2p2 = p1(3 – 4p2) + 2p2 Si p2 = 3/4 alors l’espérance mathématique de gain de l’homme est indépendante de la valeur qu’il donne à p1. L’espérance est constante. Elle vaut E(H) = 3/2. Dans ce cas, l’homme ne peut plus augmenter son gain par un changement unilatéral de stratégie. Si p2 > 3/4, pour avoir un gain maximal, l’homme a intérêt à choisir p1 minimal (p1 = 0). À l’inverse, si p2 < 3/4, le meilleur gain est obtenu pour p1 = 1. Comme le jeu est symétrique, le calcul et le raisonnement sont identiques pour la femme. Le graphique de la figure 7 caractérise la situation. Ce graphique fait apparaître trois équilibres de Nash aux points d’intersection des courbes. Aux extrémités (p1 = 0, p2 = 1 d’une part et p1 = 1, p2 = 0 d’autre part), on retrouve les deux équilibres de Nash B et C et un troisième équilibre M apparaît : l’équilibre de Nash en stratégies mixtes. Celui-ci est donc tel que p1 = 3/4 et p2 = 3/4. Dans ce cas, l’homme va jouer sa stratégie « match » trois fois sur quatre et donc sa stratégie « film » une fois sur quatre. Inversement pour la femme. Le gain retiré de l’interaction est de 3/2 pour les deux joueurs. En procédant ainsi, les deux époux éviteront l’affrontement direct ou l’auto–censure d’un des deux. En échappant à une scène de ménage, ils obtiendront une certaine coopération. 4 Il peut aussi subordonner son action à un événement aléatoire. L’homme peut dire à sa femme : « Je regarderai le match mercredi prochain si j’arrive à prendre le bon train » (événement de nature probabiliste). On parlera alors, à la suite d’Aumann (1974), d’équilibre corrélé. 5 Il s’agit d’une incertitude probabilisable. 6 Voir le chapitre 1 de la première partie. 7 Selon Von Neumann, (1953), la notion de stratégie mixte a été formellement introduite par Borel en 1921. Toutefois, cette notion a été largement développée par Von Neumann et Morgenstern (1944) dans leur ouvrage initiateur de la théorie des jeux. Il semble cependant, d’après Sorin (1995) que la première « résolution » en stratégies mixtes d’un jeu puisse être attribuée à Waldegrave dans une lettre citée par P. De Montmort, en 1713.
114
Le décideur face à l’autre : de l’opportunisme à la coopération
p1 (Homme) p1 en fonction de p2
1 Équilibre B
p2 en fonction de p1
Er Équilibre M
Équilibre C 0
Er
p2 (Femme) 1
FIGURE 7 – Bataille des sexes – fonctions de réaction des joueurs
Bien que la notion de stratégies mixtes soit importante d’un point de vue théorique (il existe toujours un équilibre en stratégies mixtes), son interprétation ne va pas sans soulever quelques problèmes. Dans certains cas, les acteurs prennent leurs décisions au hasard. Par exemple, les douaniers qui fouillent les voitures, les joueurs de poker qui bluffent dans certaines mains seulement, les tireurs de penalty qui n’envoient pas toujours le ballon du même côté, etc. Mais il est parfois difficile de donner un sens à une probabilité d’action. En particulier, il apparaîtra suspect, en tout cas aux yeux de son épouse, que l’homme lui dise qu’il regardera le match avec une probabilité de 3/4. Il est vraisemblable que l’amateur de football (ou de film) ne fasse pas un tel calcul pour arrêter son choix. De plus, pour revenir à un cadre uniquement théorique, l’équilibre obtenu en stratégies mixtes s’ajoute aux deux autres équilibres en stratégies pures. Le jeu admet désormais trois équilibres. Même si l’équilibre en stratégies mixtes apparaît plus coopératif que les deux autres, rien ne permet de dire qu’il sera retenu par les joueurs. Dans ces conditions, le problème est donc bien maintenant celui de la sélection de l’équilibre coopératif.
2.2
LA SÉLECTION D’UN ÉQUILIBRE
Les théoriciens des jeux ont proposé de nombreux mécanismes permettant de sélectionner un équilibre et ainsi, de soutenir la coopération quand celle-ci n’émerge pas de décisions rationnelles. Certaines situations qui admettent théoriquement plusieurs résultats possibles débouchent, en fait, sur une solution unique. C’est là un effet de la prudence. Le jeu suivant en est une illustration (figure 8).
Le décideur en interaction : égoïste et calculateur
115
Pour se nourrir, deux individus peuvent chasser le lapin ou le cerf. L’avantage du lapin est qu’il peut être chassé seul alors que pour le cerf, il faut être deux. Toutefois, le cerf a un résultat nutritif plus important (utilité de 3, contre 1 pour le lapin). Si un chasseur chasse le cerf seul, il n’a aucune chance de se nourrir et il meurt (d’où une utilité de moins l’infini).
Chasseur n° 2
Chasseur n° 1
Lapin
Cerf
Lapin
(1,1) (A)
(1,– ∞) (B)
Cerf
(– ∞,1) (C)
(3,3) (D)
Ordre de lecture : (gain du chasseur n° 1, gain du chasseur n° 2). FIGURE 8 – La parabole de la chasse au cerf
Ce jeu admet deux équilibres de Nash A et D, dont un est dominant au sens de Paréto (D). Pourtant ce résultat, meilleur collectivement, est à l’évidence trop risqué. A chasser le cerf, on risque ici tout simplement sa vie si l’autre chasseur n’agit pas de même. C’est pourquoi l’équilibre de prudence du jeu consiste, pour les deux joueurs, à chasser le lapin. La sélection d’un équilibre se fait par aversion pour le risque. Si les joueurs ne sont pas prêts à risquer leur vie, alors ils se coordonneront sur la solution sous– optimale. En vertu du principe « le mieux est l’ennemi du bien », les joueurs préfèrent une bonne solution à la meilleure solution. Cela rejoint le problème posé par les conventions. La convention a pour objet de résoudre un problème de coordination. Un exemple simple va nous permettre d’expliciter cette notion. Deux personnes se sont perdues et cherchent à se retrouver. Deux solutions s’offrent à elles : aller en un point PP ou aller en un point PE, sachant que PE est plus éloigné que PP. Ce jeu (appelé « problème du rendez-vous ») admet deux équilibres de Nash : les deux joueurs vont en PP d’une part, et les deux joueurs vont en PE d’autre part. Seul le premier de ces équilibres est Paréto–optimal car les coûts de déplacement sont moindres. Pourtant, comme dans le cas du jeu précédent (la prudence), il n’y a aucune raison pour que la meilleure solution soit celle adoptée par les joueurs. En effet, les joueurs pourront préférer aller en PE (alors que c’est beaucoup plus éloigné que PP) parce qu’il existe une habitude acquise de se retrouver en PE. L’endroit présente une prégnance ou une réputation particulière et il s’impose naturellement aux agents. C’est le cas, par exemple, des points de rencontre dans les lieux publics (aéroports, gares, etc.), ou de ceux forgés de leur propre chef par un couple d’acteurs 8. 8
Il n’est pas nécessaire que les points de rencontre soient universels.
116
Le décideur face à l’autre : de l’opportunisme à la coopération
La coordination s’effectue sur la base d’une convention définie au sens d’une régularité de comportement. Cette régularité est une convention dans une population donnée si chacun s’y conforme, et si chacun s’attend à ce que les autres en fassent autant. La convention est donc stable, ce qui assure son efficacité. Elle est, en effet, auto–réalisante. Chacun, non seulement, maintient son action si les autres en font autant, mais préfère qu’il en soit ainsi 9. Une autre particularité fondamentale de la convention est qu’elle n’a pas besoin d’être optimale pour s’imposer. On l’a vu avec le problème du rendez-vous. On peut également l’apprécier tous les jours avec les institutions 10 (feux, stop, priorités) qui règlent la circulation routière. La priorité à droite n’est pas meilleure que la priorité à gauche. Pourtant elle est respectée par les conducteurs. On imagine les problèmes de coordination dans le cas contraire. De même, en cas de coupure de la communication téléphonique, c’est la personne qui a appelé la première qui rappelle. Ce n’est pas forcément la meilleure solution. Certaines conventions sont quasi–universelles, comme celles que nous avons citées. D’autres n’appartiennent qu’à une poignée d’individus, à leur histoire personnelle. D’autres encore sont très éphémères et ne concernent que l’instant présent. Considérons, à titre d’illustration, le jeu suivant. Deux joueurs, qui ne se connaissent pas et ne communiquent pas, doivent désigner une seule fois, un chiffre entre 1 et 100. Ils gagneront chacun 1 million d’euros s’ils choisissent le même chiffre. Néanmoins, dans le cas particulier où ils choisiraient le chiffre « 99 », ils recevraient 50 000 euros. Dans ce jeu, il n’est pas impossible que les joueurs choisissent « 99 ». Ils s’accorderaient ainsi sur le seul des 100 équilibres de Nash [(1,1), (2,2), (3,3), ..., (99,99), (100,100)] qui soit sous– optimal, puisqu’il ne rapporte que 50 000 euros, alors que tous les autres présentent un gain de 1 million. « 99 » représente un repère de coordination pour les deux joueurs. L’ajout de la clause concernant le « 99 » a permis de focaliser l’attention des deux joueurs sur ce point et de sélectionner un équilibre. Aussi, la coordination s’effectue sur la base d’un point focal 11. La convention, quel que soit son degré de généralité, assure donc la coordination. En privilégiant des points focaux qui ont le statut de règles coutumières, d’habitudes personnelles ou encore de saillance, les acteurs sélectionnent une solution parmi d’autres. L’accent mis sur les comportements conventionnels dans la prise de décision n’est pas l’apanage de la théorie des jeux. L’originalité ici est de déduire la coutume et l’habitude de la parfaite rationalité des joueurs. Les conventions sont solutions d’équilibre de Nash d’un jeu. Si elles émergent, c’est parce que les acteurs ont intérêt à les accepter puis à les respecter. Si la convention n’est plus utile, ou si une autre lui est supérieure, elle cesse d’être respectée. 9 Le développement de la notion de convention en théorie des jeux revient à D.Lewis (1969). Une telle convention établit un parallèle avec les notions de norme sociale au sens de E.Ullman-Margalit (1978), et d’institution sociale de A.Schotter (1981). Pour des développements plus approfondis sur les conventions en économie, voir Batifoulier (2001). 10 Voir B.Walliser (1989). 11 Voir T.Schelling (1960).
Le décideur en interaction : égoïste et calculateur
117
L’émergence de la convention peut être apparentée à un processus de sélection naturelle. Il existe, en effet, une version « biologique » de l’équilibre de Nash. Dans cette vision de la décision interactive, les individus sont programmés pour jouer certaines stratégies. Seules les meilleures stratégies survivent par un processus de sélection naturelle. De telles stratégies, qualifiées de « Stratégies Évolutionnairement Stables » (SES) sont donc stables d’un point de vue évolutionniste et forment des conventions. S* est une SES si la stratégie SM adoptée par une petite fraction de la population totale (SM est appelée stratégie mutante) ne réussit pas à se propager 12. La stratégie SM, choisie par une petite fraction de la population, est éliminée car elle ne résiste pas à la confrontation avec la stratégie S*. La stratégie SM disparaît car les gains qu’elle engendre sont inférieurs aux gains associés à la stratégie dominante. L’application de cette perspective évolutionniste au problème de la coopération est intéressante. En effet, si S* est une stratégie coopérative, suivie par la majorité de la population, alors la stratégie agressive SM ne peut s’imposer. La pérennité de la coopération est alors assurée 13. Dans le dilemme du prisonnier par exemple, si la coopération est affichée d’emblée comme étant la stratégie suivie par la grande majorité de la population 14, alors la meilleure réponse d’un joueur est de coopérer. Il faut donc supposer l’existence préalable d’une « ambiance » coopérative pour voir émerger la coopération. Ce qui n’est pas pleinement satisfaisant.
3. Décision coopérative et répétition du jeu L’émergence de la coopération en théorie des jeux reste problématique. Il semble, en effet, quel que soit l’exemple choisi, que le jeu des intérêts individuels se solde par des solutions sous–optimales, ou dont la portée opérationnelle est sujette à caution. L’interaction des décisions individuelles aboutit à des solutions malheureuses si les individus sont mus par la seule dimension du calcul, et à des solutions purement théoriques si des hypothèses ad hoc sont adjointes à l’interaction. La conjonction des rationalités individuelles conduit à des résultats qui, selon les points de vue, sont tragiques, irréalistes ou simplement insuffisants. Deux voies de recherche peuvent maintenant être explorées pour assurer l’existence de comportements coopératifs : 12 Formellement, quelle que soit la stratégie S* différente de la stratégie SM, on a, avec U, la fonction de gains ou d’utilité : (1) U(S*,S*) > U(S*,SM) : jouer la stratégie mutante pour un joueur est sous-optimal, ou bien (2) U(S*,S*) = U(S*,SM) et U(S*,SM) > U(SM,SM) : jouer la stratégie mutante est indifférent pour chacun des joueurs mais n’est pas optimal s’ils la jouent tous les deux. 13 Voir J.Maynard Smith (1982) et Axelrod (1984). On retrouve ici tous les ingrédients des processus évolutionnaires darwiniens dans lesquels un groupe de « mutants », pour lequel l’utilité issue de la confrontation est supérieure à celle du groupe dominant, se propage par réplication et finit, grâce à une « sélection naturelle », par devenir temporairement le groupe dominant. 14 C’est donc une convention.
118
Le décideur face à l’autre : de l’opportunisme à la coopération
– En premier lieu, l’intervention du temps. Jusqu’ici, nous avons uniquement raisonné sur des jeux statiques (à un seul coup). Le passage aux jeux dynamiques peut être source d’enseignements tant la durée façonne le contenu d’une interaction. – En second lieu, la prise en compte de l’information. Dans les jeux présentés ci– dessus, chacun des participants connaissait son propre ensemble de décision et celui des autres joueurs, toute la gamme des configurations possibles et les paiements associés, et les préférences de l’autre joueur. En bref, les joueurs évoluaient dans un contexte d’information complète. L’existence d’une information incomplète (incertitude sur les croyances de l’autre joueur) ou imparfaite (incertitude sur les actions passées de l’autre joueur, ou sur la nature si c’est elle qui joue au premier coup 15) modifie, dans certaines conditions, l’issue du jeu.
3.1
LE RÔLE DU TEMPS SUR LA COOPÉRATION
Les relations économiques et sociales sont structurées par la durée. Le temps peut changer les issues d’une interaction. Les individus révisent leur façon de se comporter selon qu’il s’agit d’un contact éclair ou d’une relation durable. La décision de coopération doit certainement être affectée par la durée de l’interaction. Ainsi, dans le dilemme du prisonnier, la solution non coopérative est l’équilibre du jeu statique. La répétition du jeu peut éventuellement remédier à cette solution catastrophique et faire émerger la coopération. Le contrat de travail a été présenté sous forme de dilemme du prisonnier (figure 4) où les joueurs retenaient la solution individualiste. Le renouvellement de ce contrat de travail, jusqu’au départ en retraite du salarié, peut être appréhendé par un « superjeu » Jt où le jeu (toujours du type dilemme du prisonnier) est répété un nombre fini t de fois. La dernière étape du jeu est le moment où le salarié prend sa retraite. On montre alors, en utilisant un raisonnement à rebours, que l’équilibre du jeu Jt est l’équilibre du jeu statique. Le principe de récurrence à rebours ou récurrence arrière 16 consiste à trouver l’équilibre d’un jeu dynamique en horizon fini, par éliminations successives. Il s’agit de remonter le jeu en partant de la dernière étape. En procédant ainsi, on s’interroge implicitement sur l’action du dernier joueur selon le passé (encadré 15 et figure 9). L’équilibre induit par ce mécanisme est appelé équilibre de Nash parfait ou équilibre parfait en sous–jeu. Dans le dilemme du prisonnier répété en horizon fini, c’est toujours la solution non–coopérative qui prévaut. En effet, on voit bien qu’à la dernière étape, l’étape t 15 Comme au poker par exemple. C’est la nature qui distribue les cartes. On peut aussi supposer que c’est la nature qui détermine le type du joueur : agressif ou non, rationnel ou irrationnel, etc. Dans ce cas, on transforme, à la suite d’Harsanyi (1967-1968), un problème d’information incomplète, en un problème d’information imparfaite. 16 Ou encore récurrence vers l’amont. La multiplication des expressions témoigne de la difficulté de traduire la backward induction.
119
Le décideur en interaction : égoïste et calculateur
ENCADRÉ 15
Le mécanisme de récurrence à rebours – l’exemple du jeu du mille-pattes Le jeu du mille-pattes, dû à Rosenthal a, constitue une saisissante illustration du mécanisme et des effets de la « récurrence arrière ». Le jeu consiste à poser 10 euros et 50 centimes sur une table où sont assis César et Rosalie. Rosalie joue la première et a le choix entre deux stratégies : – prendre 10 euros et laisser 50 centimes à César. Le jeu est terminé ; – passer la main et le jeu continue. C’est alors à César de jouer. Il peut prendre 100 euros et laisser 5 euros à Rosalie et ainsi de suite comme le montre le schéma ci-après (d’où l’appellation de mille-pattes). Le jeu se termine dès que l’un des deux joueurs a décidé de prendre. On supposera que la septième étape se termine par un paiement nul pour les deux joueurs. Il apparaît très clairement qu’il vaut mieux poursuivre le jeu, c’est-à-dire gagner 1 million d’euros que 10 euros. Pourtant, le seul équilibre du jeu se situe à la première étape. Rosalie reçoit 10 euros et César 50 centimes alors qu’ils pourraient gagner bien plus en poursuivant le jeu. Ce résultat est paradoxal. Il est pourtant totalement rationnel. En effet, en partant de la fin du jeu et par un raisonnement par récurrence arrière, on voit bien, à chaque étape, que l’un des deux joueurs arrêtera sa décision à l’étape précédente. Ainsi, à la sixième étape, Rosalie a intérêt à choisir 100 000 plutôt que 50 000. Mais sachant cela, César préférera 10 000 au lieu de 5 000, et ainsi de suite jusqu’à la première étape où on ne peut plus reculer. Pour gagner plus, les joueurs ont successivement intérêt à remonter le jeu. Puisqu’ils sont parfaitement rationnels, ils prendront toujours l’argent de la période précédente et reviendront au point de départ. Le jeu n’admet donc qu’un seul équilibre de Nash, celui de la première étape, qui, à l’évidence, est sous–optimal. Nous reviendrons plus longuement sur ce phénomène au chapitre suivant. a. R. Rosenthal (1981).
Le premier joueur est :
R
C
R
C
R
C
R
Gains de Rosalie (R)
10
5
1 000
500
100 000
50 000
0
Gains de César (C)
0.5
100
50
10 000
5 000
1 000 000
0
FIGURE 9 – Approche graphique du jeu du « mille-pattes »
où le jeu est sans suite, les protagonistes ne peuvent retenir que la solution non– coopérative. Dans le cas contraire, ils s’exposeraient, comme dans le jeu à un coup, à une perte non rationnelle de bien-être. Sachant cela, chacun des joueurs agit de même à l’étape t–1 et ainsi de suite, si bien que l’équilibre du jeu répété est l’équilibre du jeu statique, répété t fois. Comme dans le dilemme du prisonnier à un coup, c’est la solution catastrophique qui s’impose dans le dilemme du prisonnier répété un nombre fini de fois.
120
Le décideur face à l’autre : de l’opportunisme à la coopération
Ce raisonnement est transposable au cas du contrat de travail, pour reprendre l’exemple précédent. Si l’un des deux acteurs n’a plus d’engagement dans la période suivante, il peut se dédier de sa promesse de coopération. C’est le cas du salarié qui part en retraite, et qui peut rompre ses engagements en dernière période sans que l’entreprise ait les moyens de réagir : la menace (d’une sanction ou du chômage) ne peut s’exprimer faute de temps. Si la coopération ne peut émerger du jeu fini, c’est qu’il existe, par définition, une dernière période. Dans le jeu à horizon infini ou considéré comme tel (c’est–à– dire fini indéterminé) 17, il en va différemment. La menace de punir l’autre devient crédible puisque le jeu est sans fin. Les joueurs vont coopérer parce que la coopération ne s’arrête pas. Plus exactement, la menace de punir celui qui fait défection, en lui infligeant le pire des résultats possibles, sera toujours effective. C’est là une illustration du folk theorem qui peut s’énoncer formellement ainsi 18 : toute issue du jeu (u1, u2) qui donne à chaque joueur un gain strictement supérieur à son utilité minimale garantie peut être obtenue comme équilibre de Nash du jeu dynamique si les joueurs valorisent davantage le futur. Un éclairage graphique de ce théorème, à partir des paiements du dilemme du prisonnier présentés à la Figure 4, [(u1, u2) = (2,2) ; (0,3) ; (3,0) ; (1,1)], est donné ci-dessous (figure 10). La combinaison des stratégies du jeu indéfiniment répété est représentée par tout point à l’intérieur du losange. L’utilité minimale garantie pour chaque joueur est de 1. Quelle que soit la stratégie choisie par l’autre joueur, chacun est sûr d’obtenir au moins 1. L’intersection entre le losange et l’utilité minimale figure en grisé sur le graphique. Tous les points à l’intérieur de la surface grisée sont des équilibres de Nash du dilemme du prisonnier répété en horizon infini. Concrètement, l’équilibre du jeu à horizon infini repose sur la menace réciproque. Si un joueur fait défection, l’autre en fait autant et ceci jusqu’à la fin des temps. Personne n’a donc intérêt à se conduire en opportuniste maintenant (pour gagner 3), car il sera aussitôt puni et ne recevra que 1 pendant toute la suite du jeu. Il est par conséquent de l’intérêt bien compris de chacun de coopérer pour gagner 2 pendant toute la durée de l’interaction. Les joueurs n’ont plus intérêt à être déviants car la menace est crédible du fait d’une préférence relative faible pour le présent. Pour que la menace fonctionne, il faut que les joueurs accordent un poids suffisant au futur. Ils doivent donc valoriser davantage les gains futurs par rapport aux gains présents (et non pas raisonner en fonction de l’adage « un tiens vaut mieux que deux tu l’auras »). Tant que le déséquilibre présent/futur perdure, la défection rationnelle de l’un ou l’autre joueur est impossible. 17 Il suffit de ne pas en connaître la fin. C’est le cas de beaucoup de relations sociales ou économiques : la construction d’un bien collectif, certains accords de coopération culturels, techniques voire militaires, etc. 18 Ce théorème est ainsi dénommé car l’idée qu’il véhicule circulait bien avant sa théorisation. Il faisait donc parti du folklore des théoriciens des jeux.
Le décideur en interaction : égoïste et calculateur
121
u2 3
B
A
2
1
D
0
1
C 2
3
u1
FIGURE 10 – Dilemme du prisonnier répété et folk theorem
Ainsi, l’équilibre coopératif peut être obtenu dans un dilemme du prisonnier. Pour cela, le jeu doit être répété indéfiniment. Malheureusement, la multiplication des étapes du jeu va de pair avec la multiplication des équilibres. L’observation du graphique montre que la zone d’équilibre grisée comprend un grand nombre d’équilibres. En particulier, si l’issue coopérative A (2,2) devient un équilibre du jeu dynamique, l’issue non coopérative D (1,1) reste aussi équilibre de Nash du jeu. Dans ces conditions, rien ne garantit que la stratégie coopérative va être sélectionnée par les deux joueurs. Les problèmes de sélection d’un équilibre existent aussi en jeu dynamique. Il subsiste la possibilité que, à chaque étape du jeu, un joueur essaie de « tirer la couverture vers lui », et ceci d’autant plus que la rationalité de sa décision est guidée par l’hypothèse du self-interest ou de maximisation du bien-être individuel. C’est donc en terme de définition de la rationalité que peut se poser le problème de la coopération.
3.2
RATIONALITÉ ET PÉRENNITÉ DE LA COOPÉRATION
À ce stade du raisonnement, la coopération dans un jeu du type dilemme du prisonnier répété reste problématique. En effet, dans le jeu à horizon fini, le seul équilibre de Nash dynamique est celui où les deux joueurs font défection. Il n’y a donc pas de coopération. En horizon infini, la coopération est possible mais incertaine. Il existe, en vertu du folk theorem, un grand nombre d’équilibres nouveaux de type coopératif mais aussi non–coopératif. On peut alors, pour faire émerger la coopération, s’interroger sur la rationalité des joueurs en introduisant une hypothèse d’information imparfaite.
122
Le décideur face à l’autre : de l’opportunisme à la coopération
À cette condition, même en horizon fini, il est possible d’obtenir la coopération dans le dilemme du prisonnier répété. Il suffit que chaque joueur ait une incertitude sur la stratégie de son adversaire. Cette incertitude va se manifester par l’introduction d’une dose d’irrationalité (aussi petite soit-elle) 19. Soit donc une probabilité ε que l’adversaire soit irrationnel. Il coopère spontanément, puis fait ce que l’autre fait (coopère si l’autre coopère, ne coopère pas si l’autre en fait autant). C’est la stratégie « tit for tat » ou « donnant-donnant ». Un tel joueur est, en effet, irrationnel pour la théorie des jeux puisque l’on a démontré que la seule issue rationnelle du dilemme du prisonnier statique est la non–coopération. Il existe donc une probabilité 1-ε que le joueur adverse soit rationnel, c’est-àdire qu’il joue la non–coopération. Le simple doute sur la rationalité de l’autre suffit à faire émerger la coopération. Et ceci, même si ε est très petit. Considérons à nouveau le dilemme du prisonnier présenté à la Figure 4. On ne s’intéresse ici qu’au comportement du premier joueur (appelons–le I), celui qui soupçonne l’autre (nommons-le J) d’irrationalité. Deux stratégies s’offrent à I : – S1 : Il coopère au premier coup et observe le comportement de J. Si ce dernier est irrationnel, il coopérera avec une probabilité ε, et s’il est rationnel, il ne coopérera pas avec une probabilité 1-ε – S2 : I ne coopère pas au premier coup et observe également le comportement de J. Les gains engendrés par ces deux stratégies pour I, sur un jeu fini à t étapes, sans actualisation, sont les suivants : Pour S1 : ε.[2 + 2 + 2 + 2 + ...2 + 3] + (1 – ε).[0 + 1+1+1+1+...1], I adopte un comportement coopératif au premier coup. Si J coopère avec une probabilité ε, alors I gagne 2 pendant t-1 étapes. À la dernière étape, I ne coopère plus alors que J a toujours la même stratégie. Il reçoit donc 3. Si J est rationnel avec une probabilité (1-ε), il ne va pas coopérer. I qui a coopéré au début va donc recevoir 0. Étant averti du comportement de J, il sait maintenant qu’il ne faut pas coopérer et va donc recevoir 1 pendant les t – 1 étapes restantes. Pour S2 : ε.[3 + 1 + 1 + 1 + ...1] + (1-ε).[1 + 1 + 1 + ...1], la coopération du premier coup rapporte 3 à I si J est irrationnel (avec une probabilité ε). Les gains des t-1 étapes restantes sont de 1 car J réagit en ne coopérant plus. Si maintenant J est rationnel, avec une probabilité 1 – ε, c’est–à–dire s’il joue la non–coopération, alors I en fait autant et tous les deux gagnent 1 à chaque étape du jeu. La stratégie S1 (coopérer) sera préférée à la stratégie S2 (ne pas coopérer) si la différence (S1 – S2) est positive. On va donc soustraire, étape par étape, les gains engendrés par S2 aux gains engendrés par S1, soit : S1 – S2 = ε.[–1 + 1 (t – 2) + 2] + (1 – ε).[–1 + 0(t – 1)] ⇔ S1 – S2 = –ε + ε (t – 2) +2ε – 1 +ε = ε.t – 1. Donc S1 – S2 > 0 si ε.t -1 > 0, c’est–à–dire si t > [1/ε] 19 La démonstration est due à Kreps, Milgrom, Roberts et Wilson (1982).
Le décideur en interaction : égoïste et calculateur
123
Si le temps t du jeu est suffisamment long, le joueur I a intérêt à coopérer dès le premier coup 20. On obtient donc, enfin, la solution coopérative dans un jeu dynamique fini. L’horizon fini n’est plus un obstacle à l’émergence de la coopération dans un dilemme du prisonnier répété si on raisonne en information imparfaite. Il faut, en effet, supposer un doute (même petit) sur la rationalité de l’adversaire pour que soit assurée la pérennité de la coopération. L’existence préalable d’une réputation coopérative de l’autre conduit à l’optimum collectif.
4. Conclusion La théorie des jeux étudie la prise de décision en contexte d’interaction. Elle suppose, pour ce faire, la parfaite rationalité des joueurs. Or, celle-ci ne débouche presque jamais sur la coopération. La théorie des jeux peine, en effet, à expliquer la coopération à partir de comportements individualistes et calculateurs. Même si, dans la réalité, les individus ont des objectifs divergents, voire conflictuels, ils sont amenés à coopérer pour tisser des relations sociales. Or, la théorie des jeux a du mal à fournir une nécessité théorique à de telles attitudes. Quand elle y parvient, elle doit postuler une vision particulière de la rationalité. Être rationnel, dans l’optique suivie par la théorie des jeux, c’est être égoïste et donc n’être guidé que par son intérêt. Supposer qu’un joueur puisse être animé d’autres valeurs fait de lui un être irrationnel, mais débouche sur la coopération.
20 Si la probabilité d’irrationalité de l’adversaire ε est de 50 %, il suffit de 1/ε = 1/0.5 = 2 étapes du jeu pour assurer la coopération. Si ε vaut 5 %, il faut 1/0.05 soit 20 étapes.
Chapitre 5
Informations asymétriques : l’opportunisme exacerbé Philippe ABECASSIS et Philippe BATIFOULIER
Sommaire 1 Information parfaite et jeux séquentiels
126
2 La hiérarchie de l’information
133
3 Temps, croyances et information
140
4 Conclusion
150
126
Le décideur face à l’autre : de l’opportunisme à la coopération
Le chapitre précédent a permis de s’interroger sur l’émergence de la coopération à partir de comportements individualistes. Pour ce faire, nous avons appréhendé des jeux où l’information (ou le manque d’information) était identique pour l’ensemble des joueurs. Au moment de prendre leur décision, chacun des joueurs connaissait l’information disponible de l’autre. Les joueurs étaient supposés égaux face à l’information. Cette information était en effet complète (connaissance de la structure du jeu) et imparfaite (incertitude, pour les deux joueurs, sur le déroulement du jeu) 1, et n’était pas considérée comme une variable stratégique. Le dilemme du prisonnier et, plus généralement, les jeux simultanés constituent l’archétype de tels jeux. Nous abordons maintenant le cas où l’information est inégalement répartie entre les joueurs. Ils n’ont plus la même information et doivent donc prendre leur décision en contexte d’asymétrie d’information. Cette dernière devient une variable stratégique à part entière. Les joueurs ne sont pas sur un pied d’égalité au départ et en tiennent compte dans leurs décisions. Ils peuvent composer avec cette situation ou au contraire en tirer parti. Deux éléments sont alors susceptibles de modifier le comportement des joueurs : le temps et la nature de l’information cachée. Le temps et la répétition de l’interaction jouent en effet un rôle primordial puisque lorsqu’un joueur connaît les actions passées (ou futures) de l’autre, sa propre décision en est forcément affectée (section 1) ; il en va de même pour la solution qui en découle. La nature de l’information cachée peut elle aussi influencer les décisions des agents car elle exacerbe la notion de risque. Dans un jeu d’échecs, par exemple, il va de soi que l’on n’opte pas pour la même stratégie selon que l’on est en face d’un bon ou d’un mauvais joueur, mais la stratégie adoptée est encore différente si l’on ne sait rien du niveau de son adversaire ou si l’on est en face d’un adversaire réputé bon joueur qui fait des erreurs indignes de son niveau (section 2). Pour répondre au mieux à ces situations d’asymétrie d’information, les agents se forment un ensemble de croyances sur le comportement de l’autre (coopératif ou agressif, fort ou faible, etc.) et les gains des joueurs dépendent de la justesse de ces croyances. Mais, comme tous les joueurs font de même, le « jeu » consiste à tromper l’adversaire, tout en ne se trompant pas soi-même (section 3).
1. Information parfaite et jeux séquentiels Le temps, en tant que tel, a une dimension stratégique. Il influe sur l’interaction. Ce qui ne veut pas dire qu’il change forcément la solution du jeu comme dans le dilemme du prisonnier répété en horizon fini par exemple. Dans cette interaction, c’est le même jeu qui est répété plusieurs fois et les joueurs jouent simultanément dans chaque étape. Le temps ne modifie pas la structure du jeu et l’information dont disposent les joueurs. 1
Nous renvoyons le lecteur au chapitre précédent pour une définition plus précise de ces termes.
Informations asymétriques : l’opportunisme exacerbé
127
Nous nous intéressons maintenant aux jeux dans lesquels le temps bouleverse l’information disponible. C’est le cas des jeux séquentiels où l’incertitude inhérente aux jeux simultanés disparaît. On parle alors d’information parfaite.
1.1
DÉCISION ET TEMPORALITÉ
La prise en considération de la dimension stratégique du temps modifie parfois les résultats de l’interaction. Tout d’abord, certains jeux n’ont de sens que si l’on spécifie l’ordre des coups. Il existe un premier joueur et un second joueur. C’est le cas, par exemple, du « jeu du fournisseur » où un fournisseur souhaite arrêter la production, trop onéreuse, d’un bien. Mais l’acheteur de ce bien est couvert par la garantie (comme la garantie décennale pour la construction d’une maison) et peut donc engager des poursuites pénales si le fournisseur est incapable de réparer ou de remplacer le bien défectueux. L’acheteur est certain de gagner un éventuel procès mais celui-ci est coûteux, donc dissuasif. Il existe ici explicitement une séquence temporelle. Les deux joueurs n’interviennent pas simultanément mais l’un à la suite de l’autre. L’acheteur ne peut envisager de déployer l’une de ses deux stratégies (engager ou renoncer aux poursuites judiciaires) que si le fournisseur a arrêté la production. Pour décrire ce type d’interaction, on représente souvent le jeu sous forme extensive et non sous forme normale ou matricielle comme dans le chapitre précédent 2. La figure 11 dessine donc l’arbre de décision du jeu, appelé arbre de Kuhn. Dans ce jeu, la situation A est fictive car l’acheteur n’a aucune raison d’engager des poursuites si le fournisseur continue de produire.
Continue de produire
Engage des poursuites
Acheteur
Arrête de produire
Fournisseur
Renonce aux poursuites
Engage des poursuites
Acheteur
Renonce aux poursuites
A
B
C
D
(1,1)
(1,3)
(0,0)
(4,1)
Ordre de lecture : (fournisseur, acheteur)
FIGURE 11 – Le jeu du fournisseur, première étape 2 Bien que la représentation sous forme normale soit équivalente, la lecture elle-même séquentielle des représentations extensives du jeu semble mieux adaptée aux jeux séquentiels.
128
Le décideur face à l’autre : de l’opportunisme à la coopération
Quand l’acheteur adopte une stratégie, il connaît les choix précédents du fournisseur. L’introduction de la temporalité est synonyme ici d’information parfaite 3. L’acheteur décide en toute connaissance de cause. Dans ce type de jeu, l’identification de l’équilibre se fait par récurrence arrière : on part de la fin du jeu et on remonte le jeu en éliminant progressivement les stratégies dominées. On cherche donc la meilleure stratégie dans chaque partie de jeu. Plaçons-nous dans la partie de jeu (appelée sous–jeu) où le fournisseur arrête de produire. La meilleure réponse de l’acheteur est, compte tenu des paiements, de renoncer aux poursuites car son utilité dans ce cas est supérieure à celle obtenue en engageant des poursuites (1 > 0). On peut donc éliminer la branche du sous–jeu qui conduit à C. La méthode par récurrence arrière a permis de supprimer la menace non crédible (car trop coûteuse) de l’acheteur, celle d’intenter un procès. Le même raisonnement pour l’autre sous–jeu élimine la branche qui conduit à A car 3 > 1. La figure 12 témoigne de cet élagage progressif.
Continue de produire
Acheteur
Fournisseur
Renonce aux poursuites
Arrête de produire
Acheteur
Renonce aux poursuites
B
D
(1,3)
(4,1)
Ordre de lecture : (fournisseur, acheteur)
FIGURE 12 – Le jeu du fournisseur, deuxième étape
Il ne reste donc que 2 équilibres possibles (B et D) et c’est au fournisseur de jouer puisque l’on remonte le jeu. En B son utilité est de 1. En D, elle est de 4. L’équilibre du jeu est donc D. Dans cette configuration, l’équilibre consiste à arrêter la production et à renoncer aux poursuites. C’est l’équilibre de Nash parfait ou l’équilibre parfait en sous–jeu. L’introduction d’une hiérarchie dans le temps donne un sens à certains jeux et permet d’identifier un équilibre. On peut aussi considérer que l’ordre des coups modifie l’issue du jeu. Pour s’en convaincre, observons le jeu du désarmement (figure 13). Dans ce jeu, qui est présenté à la fois sous forme normale et sous forme extensive, un pays doit décider de s’armer (avec le coût que cette décision impose) ou de désarmer (en libérant des ressources) face à un adversaire qui lui fait la guerre ou la paix. 3 Seule la perfection de l’information change et non sa complétude. Le jeu reste, en effet, en information complète.
Informations asymétriques : l’opportunisme exacerbé
Armer
Adversaire Guerre (0,0) Armer A Pays (1,3) Désarmer C*
Paix (2,2) B (3,1) D
Guerre
Adversaire
Désarmer
Pays
Paix
129
Guerre
Adversaire
Paix
A
B
C
D
(0,0)
(2,2)
(1,3)
(3,1)
Ordre de lecture : (pays, adversaire)
FIGURE 13 – Le jeu du désarmement. Modification de l’équilibre
L’équilibre 4 de Nash du jeu sous forme matricielle est C. En effet, le pays a ici une stratégie dominante : le désarmement. Il se heurte sans doute à un adversaire trop puissant et préfère être battu que mort. Dans le jeu sous forme extensive où le pays joue en premier, l’équilibre est B. En effet, par récurrence arrière, on élimine le chemin qui conduit à A, celui qui conduit à D et enfin celui qui conduit à C. La prise en compte du temps modifie l’équilibre. Si le pays joue en premier, il donne un signal sur ses caractéristiques militaires. Même s’il est plus faible que son adversaire, il peut utiliser la dissuasion. En explicitant l’ordre des coups, on est passé du jeu du désarmement (forme normale ou matricielle) au jeu de la dissuasion (forme extensive). L’ordre des coups a donc une importance stratégique considérable et ce d’autant plus que si l’adversaire avait joué le premier, l’équilibre du jeu sous forme normale (C) n’en aurait été en rien modifié. La dimension hiérarchique du temps modifie l’issue du jeu. Ce n’est pas une règle générale. Pour certains jeux, comme le dilemme du prisonnier, l’introduction d’un ordre des coups ne change rien. L’équilibre est toujours non coopératif. Pour d’autres jeux, la temporalité permet de sélectionner un équilibre. C’est le cas de jeu du type « bataille des sexes » que nous avons présenté au chapitre précédent et qui admet deux équilibres. Quand on passe à la forme extensive, il ne reste plus qu’un seul équilibre (B) qui avantage le premier joueur (l’homme dans la figure 14). Si la femme avait joué la première, le film aurait triomphé du match (équilibre C). Un dernier cas reste à envisager. Celui où le jeu sous forme normale n’admet pas d’équilibre, comme le jeu de l’inspection où l’employeur va décider d’inspecter ou non un employé potentiellement ponctuel ou retardataire (figure 15). À l’inverse, quand il existe un ordre des coups, l’équilibre est bien identifié. Il s’agit de D si l’employé joue le premier 5. La temporalité stratégique et le mécanisme de récurrence arrière qui lui est lié conduisent à l’équilibre. 4 5
On ne considère, dans cette section, que les équilibres en stratégie pure. C si l’employeur joue le premier (non présenté ici).
130
Le décideur face à l’autre : de l’opportunisme à la coopération
Match
Film
Femme
Match Homme Film
Film (1,1) A (2,3) C
Match (3,2) B* (0,0) D
Film
Homme
Match
Film
A
B*
C
D
(1,1)
(3,2)
(2,3)
(0,0)
Femme
Match
Femme
Ordre de lecture : (homme, femme)
FIGURE 14 – La bataille des sexes : sélection d’un équilibre
En introduisant un ordre des coups, les joueurs prennent leur décision en fonction de ce qu’a déjà fait l’autre. Ils ont donc une information parfaite sur la stratégie jouée par l’autre protagoniste. Quand l’employé ne sait pas ce que va faire l’employeur, il doit agir sous ce voile d’ignorance. Par contre, il sait très bien qu’il vaut mieux être ponctuel si l’employeur inspecte et être en retard dans le cas contraire. Il agit en parfaite connaissance de cause, ce qui peut enlever un peu de piment au jeu. En effet, les jeux les plus intéressants sont souvent des jeux à information imparfaite comme les jeux simultanés où les joueurs jouent en même temps et non l’un à la suite de l’autre. Les enfants le savent bien quand ils jouent au jeu « pierre » (P), « ciseaux » (C), « feuille » (F), avec « pierre » préférée à « ciseaux », « ciseaux » préférés à « feuille » mais « feuille » préférée à « pierre » (P > C > F et F > P). Ce jeu n’a pas d’équilibre s’il est joué en même temps par les deux joueurs. C’est pour cela qu’il est intéressant. Par contre si un joueur joue après les autres (il triche, diraient les enfants), le jeu admet trois équilibres : PF, CP et FC. Il faut jouer F si le premier joueur joue P, P si le premier joue C et F si C.
En retard
Ponctuel
Employé
Employeur Inspecte N’inspecte pas En retard
(0,–1) A
(2,–2) B
Ponctuel
(1,1) C
(1,2) D
Employé
Inspecte
Employeur
N’inspecte Inspecte N’inspecte Employeur pas pas
A
B*
C
D
(0,–1)
(2,–2)
(1,1)
(1,2)
Ordre de lecture : (employé, employeur)
FIGURE 15 – Le jeu de l’inspection : existence de l’équilibre
Informations asymétriques : l’opportunisme exacerbé
131
L’affichage de la séquence temporelle et le mécanisme de récurrence arrière permettent donc parfois de résoudre des problèmes d’équilibre mais posent aussi des questions de crédibilité. C’est ce point que nous allons développer à présent.
1.2
SÉQUENCES TEMPORELLES ET CRÉDIBILITÉ DE LA DÉCISION
Si l’introduction de séquences temporelles peut résoudre certains problèmes de la décision en contexte interactif, elle peut également déboucher sur un certain inconfort intellectuel. Le jeu imaginé par Selten 6 est exemplaire à cet égard. Ce jeu met en scène un monopole qui fait face à l’entrée d’une firme sur le marché. Le monopole peut alors dissuader la firme d’entrer en étant agressif. Il lui fait une — coûteuse — guerre des prix par exemple. Le monopole peut aussi partager pacifiquement le marché avec la firme. L’équilibre de Nash parfait de ce jeu est la configuration A où le monopole partage le marché avec la firme (figure 16). Ce résultat coopératif est malheureusement peu crédible car le monopole a intérêt à dissuader l’entrée d’un concurrent. Dans le cas contraire, il s’exposerait aux tentatives d’entrées répétées de plusieurs firmes 7, et à terme il pourrait disparaître du marché. L’exemple de Selten montre que la solution de la guerre est raisonnable pour un monopole qui veut survivre sans dommage au sens où il vaut mieux montrer sa force pour n’avoir pas à s’en servir. Mais cette solution (B) n’est pas adoptée par le monopole 8. Elle n’est pas équilibre du jeu en vertu du principe de récurrence arrière. La menace de faire la guerre n’est pas rationnelle 9. Elle n’est pas crédible pour le monopole et encore moins pour la firme. C’est le paradoxe de Selten.
Entre
Pacifique
Monopole
Entreprise
Agressif
Renonce
C (0,2)
A (1,1)
B (–1,0)
Ordre de lecture : (entreprise, monopole)
FIGURE 16 – Le paradoxe de Selten 6 Ce jeu est connu sous le nom de « paradoxe de Selten » (The Chain Store Paradox) (Selten, 1978). 7 Surtout si le monopole a de multiples succursales. 8 Elle l’est si l’on inverse la séquence temporelle en créant le jeu de la dissuasion où le monopole joue le premier et où la firme ne prend sa décision qu’une fois le choix du monopole effectué. Voir Schmidt (1990). 9 Rappelons qu’une décision est rationnelle pour la théorie économique, si elle relève d’un comportement maximisateur.
132
Le décideur face à l’autre : de l’opportunisme à la coopération
t1 Joueur 1
Donner
t2 Joueur 2
Rendre
t3 (1,1)
Ne pas donner (0,0)
Ne pas rendre (–1,2)
Ordre de lecture : (joueur 1, joueur 2)
FIGURE 17 – Le jeu de la promesse
Le résultat du jeu obtenu par récurrence arrière, à savoir la coopération (le partage du marché), n’est pas raisonnable. Un autre exemple va nous montrer également qu’un résultat, cette fois non coopératif, toujours obtenu par récurrence arrière n’est pas plus raisonnable. Nous nous sommes tous interrogés sur l’opportunité de prêter un objet de valeur (comme un livre) ou une somme d’argent à un individu sans savoir si l’objet serait rendu ou la somme d’argent remboursée comme prévu. Il est en effet de l’intérêt bien compris pour l’autre de partir avec la chose prêtée. C’est le jeu de la promesse 10 (figure 17). L’équilibre du jeu par récurrence arrière est celui de la première étape. Le joueur 1 ne prête rien car la confiance ici est irrationnelle. Si le joueur 2 promet de rendre son dû au joueur 1 en t1, on voit qu’il a intérêt à tricher en t2 (pour gagner 2 au lieu de 1 en t3). La promesse n’est donc pas crédible. Pourtant, force est de constater que la confiance est un aspect élémentaire des relations sociales. Le résultat rationnel au sens de la théorie des jeux est donc contre intuitif. L’explication peut être recherchée dans les supports de confiance. Faire confiance suppose de se lier les mains c’est-à-dire de définir préalablement un protocole contraignant pour être obligé de tenir sa promesse : une reconnaissance de dette, une caution, un abonnement pour être obligé d’aller au théâtre, un contrat d’édition pour rendre un manuscrit, etc. Dès lors, la confiance règne parce qu’elle est inévitable. Une autre explication peut être trouvée dans le mécanisme de récurrence arrière lui-même. Ce mécanisme, qui permet d’identifier l’équilibre dans la temporalité, est sujet à caution. Reny 11 a synthétisé, dans un jeu désormais célèbre, les ambiguïtés du mécanisme. Dans ce jeu, appelé « prendre ou laisser » 12, un maître du jeu dépose 1 euro à chaque étape. A tour de rôle, les deux joueurs peuvent prendre ou laisser l’argent, sachant que le gain augmente d’un euro par itération. Ce jeu peut se poursuivre pen10 Ou jeu du bipède, comme en témoigne sa forme graphique. Le jeu du centipède (mille-pattes), qui débouche aussi sur une solution sous–optimale, a été présenté au chapitre précédent. 11 Reny (1992). 12 Jeu TOL : take or leave.
Informations asymétriques : l’opportunisme exacerbé
t1
Laisser
Joueur 1
t2
Laisser
Joueur 2
t3
Laisser
Joueur 1
133
t4 (0,3)
Prendre
Prendre (1,0)
(0,2)
Prendre (3,0)
Ordre de lecture : (joueur 1, joueur 2)
FIGURE 18 – Le jeu « prendre ou laisser »
dant n étapes c’est-à-dire n euros. On l’a représenté ici sur la base de 3 euros (figure 18). L’équilibre du jeu par récurrence arrière est de prendre à chaque coup. Or, cet équilibre est tout simplement impossible car si on est à l’étape t3, c’est que le joueur 2 a laissé en t2. Mais le joueur 2 a intérêt de prendre en t2. L’étape t3 est donc impossible car le jeu s’est arrêté avant et ainsi de suite. On ne peut donc pas raisonner à partir de la fin du jeu et remonter le jeu, car le passé rend la fin du jeu caduque. Le futur est contingent à un passé qui annule le futur. Il y a auto–réfutation de la récurrence arrière. Si à l’étape n un joueur fait défection, l’autre joueur va faire de même à l’étape n – 1 et ainsi de suite. À l’étape n, le joueur n’a pas la main. Il ne peut pas jouer car cette étape n’existe pas : le jeu s’est arrêté avant 13. Tout le raisonnement de la récurrence arrière repose sur le fait que l’on tient pour vrai une étape (un futur) qui se révélera faux. C’est un raisonnement contrefactuel. On peut donc difficilement décider d’une stratégie en supposant connue la séquence temporelle du jeu. Introduire des séquences temporelles, c’est introduire une hypothèse d’information parfaite sur le jeu. L’ordre des coups étant parfaitement identifié, ce sont des joueurs parfaitement informés qui prennent leurs décisions. Or, si cette hypothèse d’information parfaite peut parfois simplifier le jeu, elle peut aussi le rendre peu crédible. Les joueurs, même en identifiant parfaitement l’ordre des coups, sont dans certains cas condamnés à agir en information imparfaite.
2. La hiérarchie de l’information Supposer que les joueurs connaissent tantôt le passé (ce qu’ont joué les autres) tantôt le futur (ce que vont jouer les autres) soulève de sérieux problèmes. Même en supposant que l’information parfaite soit possible, elle soulève plus de 13 Le raisonnement par récurrence arrière « a rejeté l’échelle qui lui a permis de s’élever jusqu’au niveau de sa conclusion et le voici suspendu dangereusement dans les airs sans plus rien pour le supporter » (Dupuy, 1994 p 91).
134
Le décideur face à l’autre : de l’opportunisme à la coopération
questions qu’elle n’apporte de réponses. Aussi, la temporalité, quand elle existe, doit s’accompagner d’une imperfection de l’information 14. À la hiérarchie du temps se juxtapose alors la hiérarchie de l’information. L’information est inégalement répartie entre les joueurs et devient comme le temps, une variable stratégique à part entière.
2.1
ASYMÉTRIE D’INFORMATION ET MODÈLE DE L’AGENCE
La prise de décision est souvent caractérisée par un processus de délégation. Un acteur définit l’action, un autre acteur la réalise au nom du premier. On parle alors de relation d’agence ou de modèle principal–agent car, dans une telle situation les individus ne sont pas au même niveau décisionnel. L’un, appelé le principal, délègue son pouvoir de choix à l’autre appelé l’agent 15, lui imposant ainsi une règle de décision. La hiérarchie temporelle des niveaux de décision se double ici d’une hiérarchie de l’information. En effet, l’agent disposant d’informations privées, inconnues du principal, peut « tirer la couverture à lui ». Il peut accomplir des actions non décidées par le principal. Ainsi, à un pouvoir de définition correspond un pouvoir de réalisation. C’est le principal qui définit mais c’est l’agent qui accomplit. Or, rien ne garantit que l’agent va se comporter comme le souhaite le principal. Les stratégies personnelles des agents peuvent les amener à prendre des décisions qui vont à l’encontre des souhaits du principal. C’est là le problème de la délégation ou du mandat, qui s’observe sur bien des relations hiérarchiques comme, par exemple, celles qui unissent État et agents de l’État, employeur et employé, actionnaire et manager, patient et médecin, assureur et assuré, client et expert etc. Le premier nommé est en quelque sorte le décideur en chef alors que le second est le décideur en situation donc le décideur réel. Les deux décideurs ne disposent pas de la même information sur le jeu. La décision interactive doit alors tenir compte de cette asymétrie d’information. Pour ce faire, elle doit résoudre deux types de problèmes : le risque moral et l’anti–sélection. Le risque moral (où l’aléa moral) apparaît quand le principal ne peut observer l’action des agents. Cette situation d’action cachée est typiquement celle qui caractérise l’effort de l’agent non contrôlable par le principal. L’agent est en effet le seul à connaître son véritable effort 16. L’employé, une fois embauché peut « tirer au flanc » ; l’assuré peut omettre les efforts de prévention ; l’expert peut travestir sa 14 Beaucoup d’approches différentes, que nous ne développerons pas faute de place, explorent d’autres voies. Par exemple, certains remettent en cause l’hypothèse de rationalité parfaite et la connaissance commune de cette rationalité. C’est d’ailleurs l’opinion de Reny. On peut aussi douter de la traduction automatique des intentions en actions. Au moment du choix, les acteurs peuvent trembler et changer d’avis, ce qui modifie l’équilibre. 15 Ou à plusieurs agents. 16 Il s’agit en fait d’un faisceau d’efforts qui comprend le choix de l’activité, l’intensité de l’action, sa qualité et sa durée. L’effort est donc une variable multidimensionnelle qui dépend à la fois de l’individu et de l’organisation dans laquelle il s’insère (Leibenstein, 1969).
Informations asymétriques : l’opportunisme exacerbé
135
véritable action. Dans ces circonstances, la moralité de l’agent peut être suspecte au sens où il peut aller au moindre effort. Il y a un risque moral 17. L’anti–sélection (ou sélection adverse) décrit un phénomène analogue portant non plus sur l’action mais sur les caractéristiques des agents. L’information peut être manipulée par l’agent, pour avoir plus de moyens par exemple. Le manager peut surenchérir sur les coûts ; l’expert peut donner de fausses informations sur le travail à effectuer ; le médecin peut prescrire au-delà du nécessaire. Ces informations cachées constituent une rente pour celui qui la possède : l’agent 18. Face à cette double asymétrie d’information (risque moral et sélection adverse), une procédure de décision doit être adoptée par le principal. Cette procédure peut, dans un premier temps, être coercitive. Le principal peut développer des moyens de contrôle destinés à décourager la tricherie ou à observer les résultats. La décision de l’agent se fait alors sous contrainte. La solution du contrôle n’est guère satisfaisante car elle comporte trois types de coûts : – les coûts de mise en place du contrôle : il s’agit en effet de contrôler des variables non observables et parfois non mesurables comme l’effort. Même si le principal peut mettre en œuvre des procédures d’acquisition d’information en créant un poste de « contrôleur », rien ne garantit que ce contrôle sera fiable. Dans ces conditions, il faudra contrôler le contrôleur... – les coûts financiers : les coûts de mise en place du contrôle, de surveillance, de remplacement des individus jugés non performants ne doivent pas excéder les bénéfices attendus ; – les coûts de rejet : le contrôle suscite souvent une réaction négative car l’agent se sent suspect. On ne lui fait plus confiance. Cette baisse d’enthousiasme se traduit par une moindre efficacité de l’activité (démotivation, découragement, absentéisme, etc.) Le contrôle n’est donc pas très efficace. La mise en œuvre de l’incitation lui est préférable. L’agent va agir comme le souhaite le principal non pas par la contrainte mais parce qu’il a intérêt à procéder ainsi. Dans ces conditions, l’agent va 17 La notion de risque moral est particulièrement féconde dans le domaine de l’assurance et particulièrement dans l’assurance sociale (Arrow, 1963). Appliqué à la prise en charge du risque maladie, par exemple, le risque moral décrit le comportement de l’individu assuré. La socialisation du système de protection sociale et l’obligation d’assurance découragent l’activité d’auto protection. Dans la mesure où le patient est assuré, il peut avoir un comportement plus risqué. Et ce d’autant plus, que le risque est réparti sur un grand nombre d’individus. Le comportement des uns peut être supporté par les cotisations des autres. Cette notion de risque moral justifie les politiques de taxation des consommateurs. 18 Le mécanisme de sélection adverse a été popularisé par Akerlof (1970) au travers de l’analyse du marché des voitures d’occasion. Sur ce marché, seul le vendeur connaît la qualité réelle de la voiture qu’il souhaite vendre. L’acheteur va anticiper un prix moyen reflétant une qualité moyenne. Il va faire la « part des choses » entre les bonnes et les mauvaises occasions, ce qui va le conduire à un prix moyen. Mais à ce prix là, les vendeurs de bons véhicules ne vendent plus. Il ne reste donc plus que des voitures de mauvaise qualité (appelées lemons aux États-Unis) sur ce marché. Dans ces conditions, le client n’achète plus. Puisqu’il n’y a plus ni vendeurs ni acheteurs, le marché disparaît.
136
Le décideur face à l’autre : de l’opportunisme à la coopération
répondre favorablement aux objectifs du principal tout simplement parce qu’il y trouvera son compte. Tout en conservant leur identité respective et des objectifs divergents, les acteurs vont se retrouver sur une solution coopérative. En effet, grâce à des dispositifs incitatifs, la coopération va émerger du jeu des comportements individuels. Les stratégies différentes des acteurs vont s’accorder sur la base de contrats incitatifs. L’idée de base est simple. Chaque fois que l’agent a intérêt à mentir, le principal lui propose une compensation financière qui l’incite à dire la vérité ou à se conduire honnêtement. L’agent n’a alors plus aucun intérêt à tricher. On retrouve une application de ces contrats incitatifs dans certaines procédures réelles comme le paiement à la commission chez les commerciaux qui permet d’inciter à la performance individuelle 19. De même, la rémunération au rendement est typiquement une réponse à la relation d’agence actionnaires–manager. De nombreuses entreprises proposent, en effet, à leurs dirigeants, un système de primes en plus de la rémunération forfaitaire. Cette prime est sensée mesurer la performance et elle est indexée sur l’évolution d’un critère tel que le profit ou le cours de l’action. On pourrait également citer les rémunérations à l’intéressement ou à la participation ainsi que les procédures incitatives de type bonus–malus dans le domaine de l’assurance. On peut aussi considérer que certaines règles de décision relèvent du contrat incitatif, même si elles ne sont pas explicites. Donnons deux exemples. 1. La gestion de la carrière salariale de ses employés par le principal (employeur public ou privé), sous forme de paiement différé, peut être incitative. En effet, comme l’a montré Lazear 20, il suffit de juxtaposer deux phénomènes. D’un côté le salaire est lié à l’ancienneté. Il croît jusqu’au départ en retraite du salarié. De l’autre, l’individu a une productivité constante tout au long de la vie active. La disponibilité et l’enthousiasme de la jeunesse sont compensés par l’expérience de l’âge mûr. Il en résulte que, dans la première partie de sa vie active, le salaire de l’individu est inférieur à sa productivité. Il est sous-payé. Dans la seconde partie, c’est l’inverse, il est surpayé. Contrairement aux apparences, ce jeu n’est pas un jeu à somme nulle car le salarié ne sera surpayé que s’il reste dans l’entreprise. Il ne rentabilisera son travail que s’il n’est pas licencié. Il n’a donc jamais intérêt à tricher sinon il perd sa mise initiale. Il est donc incité à se conduire honnêtement. Ce paiement différé n’est, en fait, rien d’autre qu’une caution. Tout se passe comme si le salarié versait une caution au début de sa vie active puisqu’il reçoit un salaire inférieur à sa productivité. Il ne récupère son dû que pendant la deuxième partie de sa vie dans l’entreprise, à condition de ne pas être renvoyé. Il va de soi que ce système de caution est totalement invisible. Toutefois, on notera que certaines entreprises pratiquent des politiques qui y ressemblent, comme en attestent le montant important de la prime de départ en retraite versée par l’entreprise au salarié ou encore la 19 Cette procédure de rémunération aux pièces nécessite toutefois l’observabilité du résultat ce qui exclut toutes les activités non mesurables comme la prestation de services intellectuels. 20 Lazear (1981).
Informations asymétriques : l’opportunisme exacerbé
137
participation de l’entreprise aux fonds de retraite dont bénéficient les salariés à la condition de rester dans l’entreprise. 2. La sécurité de l’emploi est aussi un facteur d’incitation très efficace. Outre les bienfaits de la sécurité en général (on travaille moins bien dans l’angoisse de perdre son travail), la sécurité de l’emploi évite des effets pervers. En effet, le recrutement des fonctionnaires est généralement effectué par leurs pairs (pour l’enseignement, notamment). Sans système de garantie d’emploi, ces derniers seraient condamnés à recruter les plus médiocres pour conserver leur travail. Les bons candidats pourraient prendre leur place. La sécurité de l’emploi rend cette menace inopérante et incite au recrutement des candidats dont les compétences sont jugées les meilleures 21.
2.2
DÉCISIONS INTERACTIVES ET PROBABILITÉS
Le modèle de l’agence constitue l’archétype de situations diverses et nombreuses caractérisées par une asymétrie de l’information. Les ventes d’œuvres d’art, de produits innovants ou de produits « d’occasion », les relations de subordination, les expériences de décentralisation, les stratégies concurrentielles, en sont autant d’exemples. Du point de vue de la théorie des jeux, de telles situations sont qualifiées soit de jeux à information incomplète, en présence d’anti–sélection, soit de jeux à information imparfaite, en présence d’aléa moral. Dans le cas où l’information est imparfaite, les joueurs doivent faire face à une incertitude concernant le déroulement du jeu. L’ordre du jeu est inconnu, comme dans les ventes aux enchères où chaque joueur intervient au moment qu’il considère le plus opportun. Cette forme d’incertitude est aussi intrinsèquement liée à tous les jeux statiques, lorsque tous les joueurs jouent simultanément ou croient en faire ainsi. Tel est le cas du jeu du dilemme du prisonnier : chaque joueur doit envisager toutes les alternatives possibles avant de se décider à dénoncer ou non son complice, car il ne prendra connaissance du comportement de ce complice qu’au moment du verdict. Dans le cas où l’information est incomplète, l’incertitude porte sur le comportement des autres joueurs. Chacun doit anticiper le comportement de l’autre, deviner son intérêt et la façon dont il réagira à telle ou telle action. Bref, chaque joueur tentera de cerner la « personnalité » des autres. Dans l’exemple du dilemme du prisonnier, chaque joueur va réaliser ses anticipations en fonction de ce qu’il connaît ou croit connaître de l’autre. Si l’un des deux joueurs croit fermement que son complice ne parlera jamais quoiqu’il arrive, parce qu’un pacte de fraternité a été scellé entre les deux, il va de son intérêt de ne pas le dénoncer. Mais si le moindre doute surgit quant au respect de ce pacte, alors il devra « peser le pour et le contre », c’est–à–dire juger du risque que le complice ne respecte pas le pacte passé. Comme pour les décisions individuelles en situation d’incertitude, le risque lié à l’imperfection et à l’incomplétude de l’information est traité par l’affectation d’une distribution de probabilités subjectives aux actions possibles des autres joueurs. 21 Carmichael (1988).
138
Le décideur face à l’autre : de l’opportunisme à la coopération
Chaque joueur du dilemme du prisonnier va donc estimer le risque d’être dénoncé en affectant à cette éventualité une valeur probable basée sur la connaissance mutuelle de la personnalité des prisonniers. L’un des deux prisonniers peut considérer que son complice est sûr (« je le connais, il ne me dénoncera que s’il n’a pas le choix »), et affecter par exemple une probabilité de 10 % au fait d’être dénoncé. À l’inverse, l’autre prisonnier peut n’avoir aucune confiance en son compère (« c’est un lâche, il me dénoncera dès que l’occasion s’en présentera »), et considérer une probabilité élevée –par exemple 90 %– d’être dénoncé. Affecter une distribution de probabilités aux actions des autres joueurs constitue sans aucun doute une tâche ardue. Les croyances des agents sont fondamentales dans cette détermination et les joueurs doivent utiliser toutes les informations disponibles sur leurs adversaires pour se forger des croyances cohérentes et aussi proches que possible de ce qu’ils pensent être la réalité. Il convient toutefois de remarquer que cette « réalité » repose sur le comportement des autres joueurs. Or ce comportement n’est pas nécessairement fiable : les autres peuvent bluffer, tricher, menacer, trouver toutes sortes d’astuces visant à améliorer ou conserver leur avantage. Malheureusement, dans de nombreux jeux, même en information complète, les joueurs n’ont a priori aucune raison de se connaître à l’avance. Dès lors, chacun doit envisager le comportement des autres sans aucune croyance a priori sur ce comportement. De ce point de vue, l’incertitude est maximale. Dans ce dernier cas, en situation d’information imparfaite, la théorie des jeux fournit une solution double : d’une part au problème de la détermination d’une distribution de probabilités et d’autre part à celui de l’issue du jeu. Cette solution consiste pour chaque joueur, conformément aux principes de la théorie économique de la décision en situation d’incertitude, à rechercher la distribution de probabilités qui maximise l’espérance d’utilité de ses gains 22. Pour ce faire, chacun va considérer que l’autre raisonne comme lui et va tenter de maximiser sa propre espérance d’utilité en tenant compte des distributions de probabilité de tous les joueurs. Du point de vue d’un individu, la distribution de probabilité affectée à son propre comportement fait l’objet d’une anticipation (rationnelle) de la part des autres. La maximisation de l’espérance des gains de l’individu doit prendre cette anticipation en compte. Pour ce faire, chacun doit attribuer une distribution de probabilité à son propre comportement et l’utiliser dans son calcul d’optimisation. Puisque tous les individus font de même, il découle une infinité d’issues possibles de ce comportement dont une au moins est un équilibre de Nash, un équilibre en stratégie mixte 23.
22 Ce critère dû à Von Neumann et Morgenstern (1944) peut être critiqué pour diverses raisons (voir chapitres 1 et 2 de la première partie) mais il a l’avantage de respecter l’ordre des préférences des joueurs. Ainsi, l’espérance d’utilité a un sens : elle sert d’indicateur d’ordre des préférences entre les différentes stratégies d’un joueur. Si celui-ci doit comparer deux stratégies, il choisira celle qui lui procurera l’utilité espérée la plus élevée. 23 Le concept a déjà été défini et développé dans le chapitre précédent, section 2, paragraphe 1.
Informations asymétriques : l’opportunisme exacerbé
139
Le « jeu de la taxation » illustre parfaitement la notion d’équilibre en stratégies mixtes : après de nombreuses études, une entreprise multinationale sélectionne un État pour y implanter la majeure partie de ses activités. Une ombre pèse toutefois sur ce projet : l’État en question envisage la création d’une taxe sur l’investissement. De son côté, l’État voit d’un bon œil l’arrivée d’une nouvelle entreprise, dans un premier temps pour doper l’activité, ensuite pour le potentiel de recettes publiques qu’elle représente. Les préférences des deux agents sont donc ordonnées. L’État préfère « taxer la firme qui s’implante » à « ne pas taxer la firme qui s’implante ». Cette dernière situation est elle même préférée à « ne pas taxer la firme qui ne s’implante pas » puis « taxer la firme qui ne s’implante pas ». De son côté, l’entreprise classe ses préférences dans l’ordre décroissant suivant : « s’implanter si elle n’est pas taxée », « ne pas s’implanter si elle n’est pas taxée », « ne pas s’implanter si elle est taxée » et « s’implanter si elle est taxée ». La matrice des gains associée à ce jeu est donnée ci-dessous (figure 19) : Entreprise s’implante
ne s’implante pas
taxe
(3,0) (A)
(0,1) (B)
ne taxe pas
(2,3) (C)
(1,2) (D)
État
Ordre de lecture (gains de l’État, gains de l’entreprise) FIGURE 19 – Le jeu de la taxation
Si l’on s’en tient à l’analyse des gains tels qu’ils sont présentés dans le tableau, le jeu ne comporte pas de solution, ce qui exprime l’incompatibilité des stratégies proposées. Il est toutefois possible de trouver un équilibre en stratégie mixte. En effet, imaginons qu’avant de faire son choix, chaque joueur attribue une probabilité à chaque stratégie possible de l’autre, et que, de plus, chacun sait que l’autre fait de même. Représentons ceci en modifiant la matrice des gains de la façon suivante (figure 20).
Entreprise
État
s’implante
ne s’implante pas
probabilité
taxe
(3,0)
(0,1)
p
ne taxe pas
(2,3)
(1,2)
1–p
probabilité
q
1–q
p+q=1
Ordre de lecture : (gain de l’État, gain de l’entreprise) FIGURE 20 – Le jeu de la taxation en stratégie mixte
140
Le décideur face à l’autre : de l’opportunisme à la coopération
Chacun va alors rechercher la distribution de probabilité qui maximise son espérance de gain 24. Or on remarque que l’espérance d’utilité de l’État est indépendante de p lorsque q = 1-- , c’est–à–dire lorsque l’incertitude est maximale. L’État a 2
intérêt à choisir p = 1 pour une valeur de q > 1-- et p = 0 si q < 1-- . De même, l’espé2
2
rance d’utilité de l’entreprise est indépendante de q pour p = 1-- , quand l’incertitude 2
est maximale. L’entreprise a intérêt à choisir q = 1 quand p < 1-- et q = 0 quand p > 1-- . 2 2 Finalement, une solution négociée visant à « couper la poire en deux » est de l’intérêt de tous, elle correspond à la situation où l’incertitude est elle aussi maximale pour tout le monde. Notons que la nature de l’équilibre en stratégie mixte est confuse si l’on s’en tient aux jeux statiques. On a souvent tenté de justifier ce concept d’équilibre par la notion de conjecture 25, où la stratégie mixte d’un joueur correspond à la distribution de probabilité qui lui est attribuée par les autres joueurs et dont il a connaissance. Toutefois, certains théoriciens des jeux considèrent simplement que la notion d’équilibre en stratégies mixtes n’a de sens que dans des jeux répétés ou dynamiques. Les solutions mixtes des jeux statiques correspondent alors à une solution pure 26 du jeu répété associé.
3. Temps, croyances et information Dans les situations répétées, comme la relation propriétaire–locataire, deux types d’informations coexistent. Le premier type correspond à l’information commune ou universelle. Chacun connaît cette information et sait que les autres la connaissent 27. C’est, par exemple, la régularité passée de paiement du loyer par le locataire. Le second type concerne l’information privée de chaque joueur. Celle-ci est conservée par chacun afin de l’utiliser à son profit. Ainsi, le locataire est le seul à savoir s’il va 24 Chacun calcule l’espérance d’utilité associée à la double distribution de probabilités. Ainsi, pour l’État, l’espérance de gain sera de 3.p + 2.(1 – p)=p + 2 si l’entreprise s’implante et de 0.p + 1.(1 – p) = 1 – p si l’entreprise ne s’implante pas. Or, le choix de s’implanter ou non est aléatoire, il convient donc de tenir compte de la probabilité d’implantation (ou non) dans le calcul de l’espérance. Finalement, l’espérance de gain de l’État sera de q.(p + 2)+(1 – q).(1 – p), ce qui, en simplifiant s’écrit : E État = p(2.q – 1) + q + 1. De la même façon, l’espérance d’utilité de l’entreprise s’écrit EEnt = q(1 – 2.p) – p + 2. 25 C’est d’ailleurs par ce biais que nous l’avons présenté. 26 Le terme solution pure est impropre. Il faudrait, en toute rigueur, utiliser l’expression « équilibre en stratégie pure » qui, par opposition aux équilibres en stratégie mixte, correspond à une issue prévue par le jeu sans faire intervenir de probabilités. 27 La notion de connaissance commune ou universelle a une définition infinie car elle fait appel à elle-même (Lewis, 1969) : chacun connaît l’information commune, sait que les autres la connaissent, sait que les autres savent qu’il la connaît, sait que les autres savent qu’il sait que les autres la connaissent, etc.
Informations asymétriques : l’opportunisme exacerbé
141
arrêter de payer son loyer (et à quelle date) et le propriétaire est le seul à connaître l’état exact de salubrité de son bien. Toutefois, le propriétaire sait que le locataire peut être défaillant et que, si tel est le cas, son intérêt est de le divulguer le plus tard possible. De même, le locataire devine l’intérêt du propriétaire à ne faire part des défauts de l’appartement qu’en cas de force majeure, s’il en est. L’existence potentielle d’information privée est donc, en soi, une information universelle. L’objectif de chacun sera de découvrir par un moyen qui lui est propre, l’information privée des autres à partir de l’information universelle dont il dispose et ce, afin d’optimiser ses gains. Pour ce faire, chaque joueur devra être capable de se forger un système cohérent de croyances à partir de l’information universelle et des signaux que peut laisser transparaître le comportement de l’autre. Il devra toutefois se méfier des signaux fallacieux (bluff) ou flagrants (réputation), et accepter de réviser ses croyances de la meilleure façon possible.
3.1
INFORMATION INCOMPLÈTE ET JEU DYNAMIQUE
Pour modéliser les comportements en information incomplète sur une seule période, Harsanyi 28 propose de caractériser les joueurs selon la nature de l’information privée dont ils peuvent disposer. Par exemple, un locataire peut être du type « bon payeur » ou « mauvais payeur », un propriétaire peut être « franc » ou « faux–jeton » ; dans la relation employé–employeur déjà évoquée (partie 2), l’employé peut être « tire–au–flanc », « consciencieux » ou « zélé », etc. Le nombre (fini) de types possibles est connu de tous (information commune) et chacun connaît son propre type (information privée), mais personne ne connaît exactement le type des autres (incertitude). La distribution de fréquences des types des agents peut être connue a priori. Chacun sait, par exemple, que dans le pays, 20 % des locataires sont du type « mauvais payeur » et qu’un propriétaire sur deux est « faux–jeton » 29. Il est aussi possible d’envisager des cas où cette distribution a priori fait partie des croyances individuelles. Quoiqu’il en soit, tout joueur dispose, a priori, d’un ensemble de croyances sur le type des autres ainsi que sur son propre type. Il est donc en mesure, par un raisonnement bayésien (voir Encadré 16, ci-dessous), de se faire une opinion personnelle sur le type des autres. Ce qui se traduit par l’affectation d’une distribution de probabilités a posteriori. Muni de cette distribution de probabilités, chaque joueur recherche la stratégie qui maximise son espérance d’utilité conditionnellement au comportement des autres joueurs. Chacun recherche donc la meilleure réponse au comportement possible de l’autre, compte tenu de sa propre situation. Ainsi, la meilleure réponse du locataire « bon payeur » face à un propriétaire supposé « faux–jeton » serait de ne pas payer. Elle serait de payer si le propriétaire est supposé « franc », etc. 28 Harsanyi (1967-1968). Cette proposition est connue sous le nom « d’hypothèse d’Harsanyi ». 29 Ces valeurs sont fictives. Harsanyi (1967-1968) considère même qu’elles sont aléatoires. C’est la Nature, en tant que joueur fictif permettant d’initialiser le jeu, qui est chargée d’attribuer un type à chaque joueur.
142
Le décideur face à l’autre : de l’opportunisme à la coopération
ENCADRÉ 16
Le calcul bayésien La règle — ou formule — de Bayes permet d’affiner les probabilités affectées a priori à certains événements en y incorporant une information supplémentaire. Elle aboutit à une probabilité a posteriori de réalisation de l’événement. Illustrons cette règle à partir de l’exemple de la relation propriétaire–locataire. Compte–tenu des statistiques nationales, donc a priori, le locataire peut être du type « bon payeur » (noté Lb) avec une probabilité P(Lb) = p = 1/5, et « mauvais payeur » (noté Lm) avec une probabilité P(Lm) = 1 – p = 4/5. Lors de la signature du bail de location, le locataire apporte une lettre de recommandation assurant que ce locataire a toujours payé son loyer. Cette information supplémentaire, notée t, constitue indéniablement un atout pour notre locataire, mais cela prouve-t-il qu’il est du type « bon payeur » ? Il est en effet possible que ce locataire soit « mauvais payeur » mais qu’il ait toujours payé son loyer auparavant. Il subsiste donc un doute quant au type exact du locataire. À la condition que les types soient incompatibles entre eux, ce qui est le cas ici, la probabilité P(t) que le locataire apporte une lettre de recommandation s’écrit comme la somme des probabilités que cette information soit émise alors que le locataire est respectivement de type « bon payeur » et « mauvais payeur » : P(t)= p . P(t/Lb) + p . P(t/Lm) où P(t/Lb) et P(t/Lm) sont les probabilités conditionnelles pour qu’il y ait une lettre, sachant que le locataire est respectivement « bon payeur » et « mauvais payeur ». La formule de Bayes permet alors de trouver la probabilité conditionnelle a posteriori que le locataire soit d’un type donné lorsqu’il apporte la lettre de recommandation. Par exemple la probabilité pour que le locataire soit « bon payeur » sachant qu’il a apporté une lettre de recommandation s’écrit : p ⋅ P ( t ⁄ Lb ) p ⋅ P ( t ⁄ Lb ) P ( L b ⁄ t ) = -------------------------- = ----------------------------------------------------------------P(t) p ⋅ P ( t ⁄ Lb ) + ( p ⋅ P ) ( t ⁄ Lm )
▲
Puisque seul le locataire connaît son propre type, la difficulté pour le propriétaire consiste à évaluer les probabilités conditionnelles P(t/Lb) et P(t/Lm). C’est là une expression des croyances du propriétaire. Il convient toutefois de noter que ces croyances représentent plus qu’une simple estimation de l’information privée des autres ; elles font part de la façon dont chacun réagit aux informations communes émises par les autres joueurs. Comme le montre le calcul simple ci-dessous, ces croyances, subjectives, sont primordiales dans la décision des protagonistes.
Informations asymétriques : l’opportunisme exacerbé
143
Revenons à notre exemple et imaginons que le propriétaire soit un peu suspicieux. Il décidera de ne pas faire confiance à ce nouveau locataire et se dira qu’il y a deux chances sur trois pour que la lettre de recommandation soit une façon de masquer le vrai type du locataire. Les probabilités P(t/Lb) et P(t/Lm) auront par exemple les valeurs respectives de 1/3 et 2/3 et la probabilité a posteriori pour que le locataire soit du type « bon payeur » sera alors : 1 1 -- ⋅ -5 3 P ( L b ⁄ t ) = ---------------------------- = 1-1 1 4 2 9 -- ⋅ -- + -- ⋅ -5 3 5 3 Ainsi, la lettre de recommandation et la méfiance du propriétaire ont modifié la probabilité pour que notre locataire soit du type « bon payeur ». Celle-ci est passée de 1/5 a priori à 1/9 a posteriori. La lettre de recommandation a donc joué un rôle contraire à celui espéré par le locataire. Elle a accru la méfiance du propriétaire. Imaginons maintenant que notre propriétaire soit plus naïf, et que ses croyances soient à l’inverse du cas précédent (P(t/Lb)=2/3 et P(t/Lm)=1/3). La probabilité a posteriori que le locataire soit du type « bon payeur » est alors : 1 2 -- ⋅ -5 3 1 P ( L b ⁄ t ) = ---------------------------- = -1 2 4 1 3 -- ⋅ -- + -- ⋅ -5 3 5 3
Une fois les choix effectués et annoncés, les gains effectivement réalisés indiquent le niveau d’exactitude des anticipations sur le type de l’autre. Si tous les joueurs estiment avoir fait le bon choix, l’issue du jeu est qualifiée d’équilibre bayésien ou Nash-bayésien. Bien que ce soit possible, rien ne garantit qu’à l’équilibre, les croyances de chacun correspondent à la réalité. Ce qui importe, c’est que ces croyances soient compatibles avec l’issue sélectionnée, et qu’elles soient confirmées par le choix des autres joueurs. Lorsqu’un jeu à information incomplète ou imparfaite est dynamique et que les joueurs ont un comportement bayésien, l’action révèle une partie de l’information privée. Il leur est alors plus facile de se faire une opinion sur le type de celui qui a agi. Illustrons ces « jeux de signalement » à partir d’un exemple de marchandage entre deux individus sur le prix d’un objet. En passant devant une échoppe, un individu est attiré par un objet dont le prix n’est pas indiqué mais dont le vendeur lui annonce qu’il est négociable. Chacun attribue une valeur monétaire privée à cet objet. Pour l’acheteur, c’est l’expression de son désir d’obtenir l’objet, pour le vendeur, c’est le prix espéré de l’objet. Si la transaction aboutit, les gains de chacun seront représentés par la différence entre le prix négocié
144
Le décideur face à l’autre : de l’opportunisme à la coopération
et la valeur monétaire privée. L’intérêt de chacun consiste, bien sûr, à ce que la transaction se fasse au prix le plus éloigné de sa valeur privée. Au moment où débute la transaction, personne ne sait rien de la valeur privée que l’autre attribue au bien ni du prix auquel sera échangé ce bien. L’incertitude est donc double, elle porte d’une part sur les gains, d’autre part sur la durée de la négociation 30. Supposons que l’acheteur annonce le prix de départ, sa proposition est interprétée par le vendeur comme un signal, une indication de la valeur privée de l’acheteur et de ses croyances. En effet, le prix annoncé correspond nécessairement au prix qui maximise l’espérance de gains de l’acheteur. Toutefois, ce dernier ne peut proposer la valeur 0 car il sait que le vendeur a attribué une valeur au bien. L’annonce de l’acheteur sera donc celle qui, à son avis, minimise l’espérance de gains du vendeur. Elle résume les croyances de l’acheteur sur l’information privée du vendeur 31. Connaissant cette information, le vendeur peut alors, grâce à un raisonnement bayésien, se forger des croyances sur l’information privée de l’acheteur, sous forme de probabilités subjectives, et proposer un prix compatible avec ses croyances, qui maximise son espérance de gain. Le processus continue et, à chaque annonce, chacun est en mesure de réviser ses croyances sur l’autre. Ainsi, avant de faire sa seconde annonce (ou de se retirer), l’acheteur va réviser ses croyances afin de prendre en compte l’information émise par la dernière annonce du vendeur. Si l’échange a lieu, cela signifie que la stratégie de chacun a été la meilleure possible, à tout moment de la négociation, compte tenu de ses croyances à ce moment. Si tel n’était pas le cas, l’un des négociateurs se serait retiré du jeu. Par exemple, si la valeur privée du vendeur était au–dessus de celle de l’acheteur, chacun proposerait un prix qui ne pourrait convenir à l’autre. La rationalité économique voudrait dans ce cas que l’échange n’ait pas lieu. Si l’échange a lieu, la solution est appelée équilibre bayésien parfait car elle combine trois éléments. Elle utilise d’une part la notion de stratégie au sens bayésien du terme : tous les joueurs estiment avoir fait les bons choix au cours du jeu car leurs croyances sont validées par l’équilibre. Elle respecte d’autre part la rationalité dynamique de l’équilibre de Nash parfait puisque à chaque niveau du jeu, le choix de chacun constitue la meilleure réponse à la stratégie de l’autre. Elle utilise enfin des méthodes d’inférence statistique bayésiennes. D’un point de vue général, les équilibres bayésiens parfaits sont très nombreux dans un jeu dynamique. Il n’est pas rare, en effet, que plusieurs stratégies soient compatibles avec un système de croyances ou, à l’inverse, que plusieurs croyances 30 La durée de la négociation ou le nombre de coups qu’il faudra jouer dépend de l’attachement de chacun à échanger le bien. Or, cet attachement dépend lui-même de l’écart entre les valeurs privées de chacun. Ainsi, lorsque le vendeur affecte une valeur privée de 100, si l’acheteur lui donne une valeur de 90, la durée de la négociation sera courte. À l’inverse, si l’acheteur affecte la valeur 200, la négociation risque d’être plus longue. Par ailleurs, on peut remarquer que, compte tenu de cette incertitude sur la durée de la négociation, le raisonnement à rebours est impossible. 31 En toute rigueur, il faudrait tenir compte du fait que l’acheteur sait que son annonce sert de signal et qu’il peut donc être de son intérêt de ne pas dévoiler ses croyances (voir le paragraphe suivant). Mais il faudrait aussi considérer que le vendeur sait que l’acheteur peut bluffer, etc.
Informations asymétriques : l’opportunisme exacerbé
145
soient compatibles avec une stratégie. Pour illustrer ce propos, reprenons l’exemple précédent. Rien ne nous garantit que le prix d’échange sera exactement égal à une valeur p quelconque définie a priori — par exemple p = 100 — puisque le résultat de la négociation dépend des croyances : si chacun croit que l’autre ne proposera pas autre chose que 100, alors l’échange se fait à cette valeur et p = 100 correspond à un équilibre bayésien parfait. Mais le même raisonnement peut être fait avec n’importe quelle autre valeur de p. Il y a donc bien, dans cet exemple, une grande quantité d’équilibres bayésiens parfaits 32. Divers théoriciens des jeux ont tenté de réduire le nombre d’équilibres en tentant de se rapprocher du raisonnement logique des joueurs. Pour ce faire, Kreps et Wilson estiment, par exemple, que les équilibres liés à des actions arbitraires peuvent être éliminés dès que les joueurs disposent de probabilités a priori 33. En effet, ces informations a priori permettent d’initialiser le mécanisme de révision des croyances en l’aiguillant vers des issues non arbitraires. Kohlberg et Mertens procèdent pour leur part en éliminant les équilibres liés à des stratégies dominées puisque aucun agent n’utilise ni n’anticipe jamais une telle stratégie 34. Kreps, quant à lui, retire les équilibres à probabilité nulle 35. Grossman et Perry, enfin, considèrent que le raisonnement des joueurs est séquentiel, en conséquence, il est possible d’éliminer toutes les stratégies qui, quelles que soient les croyances, ne peuvent mener à la solution optimale 36.
3.2
DÉVIANCES STRATÉGIQUES ET RÉVISIONS DES CROYANCES
Tout joueur de cartes en conviendra, il est quelquefois possible de modifier l’issue du jeu à son avantage soit en transmettant une fausse information aux autres joueurs, c’est la pratique du bluff, soit en exhibant une information favorable, c’est le rôle de la réputation. Dans le premier cas, l’un des joueurs veut tromper l’adversaire, c’est–à–dire l’aiguiller vers un faux système de croyances afin d’aboutir à un équilibre qui lui soit favorable. Dans le cas de la réputation, l’un des joueurs a intérêt à faire connaître son information privée afin d’inciter les autres à agir dans une direction précise. La réputation diffère du bluff dans le sens où la réputation persiste dans le temps sans que le bénéficiaire ait besoin de l’entretenir. La nature de ces deux déviances stratégiques peut être illustrée par le jeu suivant, inspiré des travaux de Kihlström et Riordan et de Milgrom et Roberts 37 : un marchand est chargé de vendre deux produits de qualité différente à une clientèle de passage. D’apparence parfaitement identique, les produits ont un coût et un prix de vente proportionnels à leur qualité. Le produit L, de moindre qualité (qL), a un prix pL et un coût de production C(qL) inférieurs à ceux (pH et C(pH)) du produit H de qualité supérieure. Les gains du vendeur sont mesurés par la différence entre le prix de vente 32 En fait, tous les prix compris entre les deux valeurs privées correspondent à des équilibres bayésiens parfaits puisque l’on peut toujours trouver un système de croyances qui justifie l’un de ces prix. 33 Kreps et Wilson (1982). 34 Kohlberg et Mertens (1986). 35 Kreps (1984). 36 Grossman et Perry (1986). 37 Kihlström et Riordan (1984), Milgrom et Roberts (1986).
146
Le décideur face à l’autre : de l’opportunisme à la coopération
et le coût de production alors que ceux d’un éventuel acheteur sont calculés par la différence entre sa satisfaction à disposer du bien — qui dépend de la qualité du bien — et le prix de ce bien. Malheureusement, l’acheteur ne prend connaissance de la qualité réelle qu’après avoir acheté le bien. Il existe donc une incertitude sur les gains, liée au degré d’honnêteté du vendeur. La figure suivante montre que le vendeur peut avoir intérêt à bluffer, c’est–à–dire à annoncer que le bien est de bonne qualité, alors qu’il ne l’est pas, ce qui peut entraîner l’achat par un consommateur confiant (issue (e) sur la figure 21). Cependant, les acheteurs disposent a priori d’un système de croyances qui se nourrit de leur expérience. Le bluff n’a donc d’intérêt que dans le cas où il ne révèle pas la vraie nature du vendeur. Puisque l’efficacité de ce comportement repose sur la confiance que portent les acheteurs au vendeur, il est donc primordial que la clientèle soit « de passage », c’est–à–dire que le jeu soit répété à l’identique sans que l’information commune ne s’élargisse. Si tel n’est pas le cas, le vendeur doit opter pour une stratégie mixte, c’est–à–dire diversifier au mieux son comportement de façon à optimiser ses gains sur l’ensemble des échanges. En effet, si l’annonce transmise à l’acheteur est révélatrice du vrai comportement du vendeur, l’incertitude quant aux gains de l’acheteur disparaît et ce dernier est en « position de force » puisqu’il peut deviner la vraie qualité du bien. Imaginons que, dans notre exemple, un acheteur s’est toujours fait berner par le discours du vendeur ; ceci ne laisse aucun doute quant au comportement de ce vendeur. Le système de croyances de notre acheteur sera tel que, si le vendeur lui assure une bonne qualité de son bien, la transaction n’aura pas lieu, ce qui constitue un gain d’opportunité pour l’acheteur. Ce dernier, en évitant le piège du vendeur, a gagné au fait de ne pas avoir acheté (issue (f) sur la figure). La réputation relève d’un raisonnement connexe au précédent. Elle consiste à introduire une dose suffisante d’incertitude sur le type pour modifier durablement les croyances des autres joueurs 38. Supposons, pour l’illustrer, que le vendeur désire nuire à son entreprise. Il lui suffit de bluffer sur une période, que nous considérerons comme étant la première, et de le faire savoir. Partant, le second acheteur potentiel affectera une très forte probabilité au risque d’être trompé et préférera ne pas acheter le bien. Sur la figure 21, l’issue (f) sera donc préférée à l’issue (a). Le changement de comportement de ce second acheteur par rapport au premier sera pris en compte et imité par les acheteurs suivants s’ils sont rationnels. Leurs croyances a priori seront en effet proches de celles du second acheteur et confortées par le comportement de « non–achat » des autres clients potentiels. Le vendeur malhonnête n’aura donc pas à réitérer son acte, il lui aura suffi de semer publiquement le doute pour que la clientèle, rationnelle, ne prenne pas de risque et préfère le statu quo. La (mauvaise) réputation de l’entreprise sera désormais établie. Bluff et réputation reposent sur un mode privilégié de révision des croyances : le calcul bayésien associé à une rationalité optimisatrice. Or la théorie économique et la théorie des jeux commencent à en envisager d’autres, pouvant aboutir à d’autres « solutions » des jeux dynamiques. Rullière et Walliser font la synthèse des dévelop38 Milgrom et Roberts (1982).
Informations asymétriques : l’opportunisme exacerbé
Qualité réelle : qH
Annonce qH
Achète
Vendeur
Acheteur N’achète pas
(10,10) (a)
Achète
(–10,–10) (0,20) (b) (c)
Qualité réelle : qL
N
Annonce qL
Acheteur
N’achète pas
147
Annonce qH
Achète
Vendeur
Acheteur N’achète pas
(0,–20) (15,–5) (d) (e)
(–15,5) (f)
Annonce qL
Achète
Acheteur N’achète pas
(5,5) (g)
(–5,–5) (h)
– ordre de lecture : (gain du vendeur, gain de l’acheteur) – gain en cas d’achat : (prix – coût, satisfaction – prix) – perte d’opportunité en cas de refus d’achat : (coût – prix, prix – satisfaction)
FIGURE 21 – Le jeu de la clientèle de passage
pements en la matière en dénombrant quatre processus dynamiques d’apprentissage permettant d’englober l’ensemble des modes de révision des croyances 39. Le recensement au sein des quatre processus dynamiques, qualifiés de « processus d’apprentissage épistémique », « processus éductif », « processus d’apprentissage comportemental » et « processus évolutionnaire », est réalisé au regard de deux critères principaux. Il s’agit d’une part de la façon dont les agents acquièrent de l’information, d’autre part de la façon dont ils la traitent, c’est–à–dire leur degré de rationalité. Cette dernière caractéristique peut être ordonnée sur une échelle allant de la rationalité substantielle, propre à l’homo oeconomicus, à l’absence totale de rationalité, stylisée par un automate. 1. Le premier de ces processus, dit « d’apprentissage épistémique » peut, selon Walliser, se substituer aux raisonnements croisés complexes entre les joueurs. Dans un tel processus, les agents ont en permanence une information incomplète et des croyances partielles révisées en fonction de l’environnement informationnel (rationalité cognitive). Contrairement à l’hypothèse de rationalité substantielle, les procédures de choix ne sont pas nécessairement optimisatrices, elles sont ajustées aux résultats obtenus (rationalité instrumentale). Les jeux à mémoire finie et les processus auto–régressifs, si courants en économie, relèvent de ce type processus dynamique : les croyances a priori y jouent un rôle fondamental, mais l’incomplétude de ces croyances peut mener à un équilibre parfaitement irréaliste, basé uniquement sur des systèmes de croyances réciproques 40. Un individu peut, par exemple, baser son système de croyances sur une rumeur et trouver une confirmation de cette rumeur dans le comportement des autres. Or, l’individu a une mémoire finie, il oublie donc la 39 Dans Walliser (1989) et Rullière et Walliser (1995). 40 Schotter (1981).
148
Le décideur face à l’autre : de l’opportunisme à la coopération
situation initiale avec l’évolution du jeu. Ainsi, à un moment quelconque du jeu, l’individu se trouve dans la situation paradoxale où il connaît son système de croyances mais n’en décèle plus l’origine. En conséquence, ce joueur révisera ses croyances et ajustera sa fonction–objectif en fonction de l’information nouvelle qu’il reçoit, et de façon à conserver une compatibilité avec les seules situations antérieures dont il se « souvient ». Si tous les joueurs se comportent ainsi, l’équilibre atteint est un équilibre auto–confirmant, où les informations reçues n’incitent plus les joueurs à modifier leurs croyances partielles ni leurs stratégies induites. Les exemples d’équilibres de ce type ne manquent pas, notamment dans les milieux financiers où de nombreuses informations, parfaitement erronées, entraînent un comportement tel qu’a posteriori, le fait annoncé est confirmé et personne ne regrette son comportement. 2. Dans le processus qualifié d’« éductif », initialement proposé et analysé par Lewis, les agents ont a priori une connaissance commune de la structure générale du jeu, de la rationalité des joueurs et des actions mises en œuvre 41. Le raisonnement des agents est donc complètement antérieur à l’action puisque chacun anticipe à l’infini le comportement des autres. Toutefois, la connaissance commune n’est pas innée : elle ne peut être acquise que par raisonnement, si le jeu est suffisamment simple ou s’il existe un coordinateur extérieur, connu et reconnu par tous, capable de sélectionner l’équilibre (comme, par exemple, le feu tricolore dans le « jeu du croisement » ci-dessous). Lorsque le jeu est dynamique, le processus « éductif » est compatible avec une révision bayésienne des croyances mais ne peut, en général, se passer du coordinateur 42 — souvent appelé commissaire-priseur nashien. L’équilibre dynamique atteint est alors appelé équilibre corrélé. L’exemple emblématique de ce type d’équilibre est donné par le « jeu du croisement », dans lequel deux conducteurs arrivent simultanément à un croisement. Chacun peut accélérer, ce qui risque de provoquer un accident si l’autre en fait autant, ou freiner, ce qui lui fait perdre un temps précieux. Le jeu peut alors être représenté sous forme matricielle de la manière présentée à la figure 22. Les deux issues où l’un des conducteurs freine alors que l’autre accélère (issues (b) et (c) sur la figure) sont des équilibres de Nash. Il apparaît toutefois un problème de coordination qui ne peut être résolu dans les conditions énoncées 43. En situation répétée, il est possible de coordonner l’action des conducteurs en installant un feu tricolore au carrefour. Ce coordinateur fournit une solution au problème de coordination en affectant à chacun une probabilité de passage (chacun passe une fois sur deux) et en informant chacun du compor41 Lewis (1969). 42 Sauf à des conditions très strictes. Voir par exemple Walliser (1989), Aumann (1987) ou Bernheim (1986). 43 Le fait, notamment, que les deux conducteurs arrivent simultanément est primordial : si l’un des deux a une légère avance, sa stratégie dominante est d’accélérer, l’autre n’ayant pas d’autre choix que de freiner. Le problème de coordination est alors inexistant.
Informations asymétriques : l’opportunisme exacerbé
149
Conducteur 2
Conducteur 1
Accélère
Freine
Accélère
(-1,-1) (a)
(2,0) (b)
Freine
(0,2) (c)
(1,1) (d)
Ordre de lecture (gain du conducteur 1, gain du conducteur 2) FIGURE 22 – Le jeu du croisement
tement de l’autre. Ceci revient à proposer une solution qui deviendra un équilibre corrélé si les deux joueurs l’acceptent. L’existence d’un coordinateur est donc en mesure de modifier l’information commune et le mode de révision des croyances. Chaque conducteur n’a plus besoin de chercher à connaître l’information privée de l’autre puisque cette information est donnée par le feu tricolore. En conséquence, la révision des croyances est sinon inutile, du moins réduite à la prise en compte de la modification de l’information commune. 3. Le troisième processus, « d’apprentissage comportemental », ne se fonde que sur l’observation du comportement de l’adversaire, à l’inverse du processus d’apprentissage épistémique. Les individus utilisent bien les signaux émis par l’adversaire, mais uniquement dans l’objectif de renforcer l’efficacité de leurs propres actions. En d’autres termes, personne n’anticipe le comportement de l’autre sur la, ou les périodes à venir, chacun se contente d’accroître les actions qui lui apportent la plus grande utilité et de réduire le nombre d’actions de faible utilité. Ainsi, les croyances a priori n’existent pas, elles se forment au cours du jeu et sont soit renforcées, soit modérées par le comportement des autres. Il est aisé d’imaginer un tel processus grâce aux jeux de cartes comme la belote ou le tarot. L’apprentissage comportemental y est naturel. Personne ne sait rien du jeu des autres, cela constitue ses (ou son absence de) croyances initiales. Chaque étape du jeu permet aux joueurs de se forger leurs croyances. Du point de vue d’un joueur, si un adversaire joue du « cœur » de petite valeur sur un coup, il pourra être judicieux de jouer « cœur » tant que cet adversaire ne « coupera » pas 44. Les croyances de notre joueur seront renforcées par le comportement de l’autre tant que ce dernier posera du « cœur » et infirmées par la « coupe ». L’apprentissage comportemental passif, tel qu’il vient d’être décrit peut être doublé d’un apprentissage actif. C’est le fameux coup « pour voir », où l’on pose « cœur » et on regarde ce qui se passe. Si le résultat est positif, c’est–à–dire si personne ne coupe, il peut être intéressant de rejouer ce coup par la suite. 44 Si le « cœur » n’est pas la couleur « d’atout », lorsqu’un donneur pose du « cœur », les autres joueurs doivent soit poser du « cœur », s’ils en ont, soit « couper » avec une carte de la couleur « d’atout » s’ils n’ont pas de « cœur », soit, enfin, poser une carte quelconque, s’ils n’ont ni « cœur » ni « atout ».
150
Le décideur face à l’autre : de l’opportunisme à la coopération
4. Dans le quatrième type de processus, le processus « évolutionnaire », les joueurs ont une capacité d’analyse et une rationalité réduites à leur strict minimum, ce sont des automates au sens où ils ont été définis dans le chapitre précédent. Chaque automate n’est capable d’effectuer qu’une seule action ou série d’actions choisies au hasard. Cette action ou stratégie est répétée tant qu’elle gagne, mais dans le cas contraire, l’automate adopte l’action ou la stratégie du vainqueur. Ainsi, lors des rencontres, aléatoires, entre les joueurs, chacun joue sa propre action ou sa propre stratégie et, puisque celui qui perd adopte la stratégie de l’autre, l’interaction « reproduit » le vainqueur et détruit le perdant. Les agents sont donc sélectionnés selon leur action en vertu d’une règle proche la sélection « naturelle » darwinienne.
4. Conclusion Le chapitre 4 s’interrogeait sur ce que la théorie des jeux pouvait apporter dans l’analyse de l’émergence et de la pérennité de la coopération entre individus égoïstes et parfaitement rationnels. Pour assurer cette coopération et faire coïncider le rationnel et le raisonnable, un écart ou un affaiblissement de la rationalité pouvait alors être nécessaire. Cependant, l’appauvrissement de la rationalité maximisatrice va de pair avec l’appauvrissement du comportement humain. Ce chapitre propose au contraire un enrichissement de l’attitude humaine en interaction. La rationalité bayésienne, en conceptualisant l’asymétrie d’information, tient compte des croyances, renforcées par l’information acquise à toutes les étapes du jeu, et des processus d’apprentissage. Mais l’avantage retiré de cette approche a un inconvénient majeur : le renforcement des capacités de calcul des individus. Ainsi, la rationalité bayésienne ne lève pas les problèmes posés par la rationalité maximisatrice, elle ne fait que les neutraliser si l’on adopte un point de vue optimiste, ou les exacerber si l’on adopte un point de vue pessimiste. Elle peut même être à la base de difficulté supplémentaire : selon Mariotti, la rationalité bayésienne peut, en effet, être incompatible avec les principes mêmes de la rationalité dans un contexte interactif 45. Le chapitre suivant propose de s’interroger sur la rationalité d’un individu dans une situation expérimentale de décision interactive, et de comparer, selon l’expression de Thaler (1988), le gameman de la théorie des jeux avec le fairman de la réalité.
45 Mariotti, (1995).
Chapitre 6
Le décideur coopère plus qu’on ne le suppose Véronique D’ESTAINTOT et Philippe BATIFOULIER
Sommaire 1 Confrontée aux observations expérimentales, comment la théorie économique intègre-t-elle la dimension psychologique des interactions ?
153
2 Les conditions de la coopération identifiées par la psychologie expérimentale
166
3 Comment établir les bases d’une coopération stable et durable
175
4 Conclusion
179
152
Le décideur face à l’autre : de l’opportunisme à la coopération
L’ambition de la théorie des jeux est de formaliser les décisions des individus quand ils doivent interagir avec d’autres décideurs. Dans cette quête, elle s’appuie sur la théorie du choix rationnel, traditionnellement mobilisée en économie (voir chapitres 1, 4 et 5), mais contestée par les autres sciences sociales et notamment par les travaux issus de la psychologie expérimentale. Puisqu’elle prétend s’appliquer à une très large palette d’interactions, la théorie des jeux se doit de fournir des résultats robustes, capables de formaliser la décision des individus en société. Or, cette tentation hégémonique achoppe devant plusieurs difficultés, dont certaines ont été présentées dans les deux chapitres précédents. La théorie des jeux soulève de nombreuses questions, comme en témoignent les multiples paradoxes, énigmes ou « mises en intrigue » qui sont familiers à l’utilisateur de théorie des jeux. Mais ces paradoxes et ces situations particulières mettent en appétit. Un des grands mérites de la théorie des jeux est qu’elle produit — par elle-même — les instruments qui en permettent l’examen critique à la lumière de la réalité des relations sociales, que le monde aseptisé et artificiel du théoricien des jeux ne peut dépeindre que très maladroitement. En effet, bien que prétendant ne rien dire sur la façon dont les gens se comportent réellement, la théorie des jeux fournit un cadre pour modéliser les situations impliquant des choix interdépendants, ce qui facilite l’examen empirique de ses conclusions théoriques. C’est ainsi que le comportement des individus confrontés à des choix interdépendants a fait l’objet de nombreuses études expérimentales, permettant de clarifier les conditions dans lesquelles les individus prennent réellement leur décision. La question posée est la suivante : un même jeu produit-il des résultats identiques selon qu’il est joué par des individus en chair et en os ou par des individus de papier imaginés par le modélisateur ? Disons d’emblée que les observations expérimentales ne coïncident pas avec les conclusions de la théorie des jeux et semblent remettre en cause l’hypothèse de rationalité qui y est mobilisée. Cependant, un regard plus attentif sur ces résultats soulève de nouvelles questions et incite à rappeler les objectifs spécifiques des disciplines impliquées et la nature de leur démarche scientifique. En effet, les études expérimentales menées en psychologie ont pour objet de décrire le comportement des individus dans des conditions déterminées et de mettre en évidence les facteurs susceptibles d’influencer ce comportement, tandis que l’ambition de la théorie économique est de proposer des modèles à portée normative ou descriptive, selon les cas. Ainsi, les études expérimentales auxquelles il est fait référence dans ce chapitre visent toutes à identifier et à préciser les conditions dans lesquelles les conclusions de la théorie des jeux sont susceptibles de s’appliquer ou non. S’il est vrai qu’en l’état actuel des connaissances, on peut être tenté de prononcer un divorce entre les résultats de l’observation expérimentale et ceux de la théorie des jeux, il convient plutôt de mettre en évidence les questions posées et les pistes de recherche suggérées par ces divergences.
Le décideur coopère plus qu’on ne le suppose
153
Avant d’en proposer une analyse, ce chapitre présente une synthèse 1 critique de l’étude empirique de la théorie des jeux. Les jeux expérimentaux décrits s’inscrivent dans le cadre des jeux non coopératifs 2, en privilégiant ceux qui posent des problèmes aigus de coopération 3. C’est en effet dans ce domaine qu’apparaît le plus souvent, et de la façon la plus visible, une rupture entre les résultats de la théorie pure et les enseignements des jeux expérimentaux.
1. Confrontée aux observations expérimentales, comment la théorie économique intègre-t-elle la dimension psychologique des interactions ? La théorie des jeux non coopératifs conduit souvent à recommander des décisions opportunistes, qu’elle juge rationnelles, plutôt que des choix altruistes ou coopératifs, jugés irrationnels. Or, force est de constater que, dans la vie courante, les individus sont fréquemment amenés à coopérer. Sont-ils pour autant irrationnels ? Le problème n’est pas tant de savoir s’il est « vrai » que les individus coopèrent, puisqu’il s’agit, pour beaucoup, d’une banalité. Il convient plutôt de s’interroger sur la manière dont des individus, placés dans un contexte d’interaction, sont amenés à coopérer. Pourquoi des individus choisissent-ils la coopération en prenant des décisions qui leur apparaissent parfaitement rationnelles ? Dans cette perspective, il existe aujourd’hui un nombre considérable d’études expérimentales 4 qui tentent de répondre à cette question. Ces travaux portent sur l’observation du comportement d’individus mis en situation de jeu particulière.
1.1
QU’OBSERVE-T-ON DANS LES JEUX EXPÉRIMENTAUX ?
Nous ne pouvons pas rendre compte de façon exhaustive de tout ce qui a été étudié dans ce domaine. Aussi allons-nous privilégier trois types d’interaction : les dilemmes du prisonnier, les phénomènes de passager clandestin et les problèmes de marchandage, qui, en théorie des jeux (voir chapitres 4 et 5 et encadré 17), sont les principaux à avoir été largement explorés de façon expérimentale, éclairant ainsi les fondements des comportements coopératifs. 1 Sans prétendre à l’exhaustivité. 2 Les jeux non-coopératifs s’intéressent aux choix strictement individuels, pour lesquels il est supposé que chacun cherche à maximiser son propre gain, alors que les jeux coopératifs supposent que des accords peuvent être passés entre les individus, accords dont le non-respect entraîne des sanctions (Guerrien, 1997). 3 C’est aussi le cadre que nous avons privilégié dans les deux chapitres précédents. Il est donc possible de se reporter aux résultats théoriques présentés dans ces deux chapitres pour les comparer aux résultats expérimentaux exposés dans le présent chapitre. 4 Caldas, Rodrigues et Carvalho (2003).
154
Le décideur face à l’autre : de l’opportunisme à la coopération
ENCADRÉ 17
Mémento en forme de rappel Les différents types de jeux non coopératifs (Guerrien, 1997)
Information complète ou incomplète On dit qu’un jeu est à information complète si chacun des participants connaît : son ensemble de choix (ses possibilités d’action) ; l’ensemble des choix des autres joueurs ; toute la gamme des issues possibles, et les gains qui leur sont associés ; les motifs des autres joueurs (en plus des siens propres). Il y a connaissance commune de la structure du jeu, de la part de tous ceux qui y participent. On est en situation d’information incomplète quand il y a incertitude sur les valeurs prises sur certains des paramètres du modèle à information complète (issues, gains, comportements) : les valeurs possibles sont connues de tous, mais les valeurs qui sont effectivement prises par ces paramètres ne sont pas forcément connues de tous.
Information parfaite ou imparfaite Lorsqu’il y a information complète, chaque joueur connaît toutes les données du problème (possibilités de choix, issues, gains, motifs), pour lui et pour les autres. Toutefois, pour qu’un jeu soit totalement défini, il faut que ses règles précisent l’ordre des coups. Deux types de situations sont envisagés. Si les joueurs font leurs choix de façon séquentielle, dans un ordre précis et fixé à l’avance, on dit qu’il y a information parfaite (en plus de l’information complète). Le jeu du marchandage est une illustration de cette situation. Si les joueurs prennent leur décision simultanément, l’information devient imparfaite (même si elle reste complète). Le « dilemme du prisonnier » classique appartient à cette catégorie de situations.
Jeux répétés Dans la théorie des jeux, à l’origine, ce sont des jeux à un coup (une période) qui sont étudiés. Mais la vie économique et sociale ayant indéniablement un caractère répétitif, cette donnée a ensuite été intégrée dans les modèles de jeux, avec pour perspective de faire apparaître des phénomènes aussi importants que la réputation, les menaces de représailles, et même, si possible, les normes et les conventions. Cette approche par les jeux répétés comporte une dimension séquentielle — puisqu’il y a succession de coups — mais n’exclut pas a priori les choix simultanés. De plus, on distingue les cas où les jeux sont répétés un nombre fini de fois de ceux où ils sont répétés indéfiniment. Un exemple de dilemme du prisonnier répété indéfiniment est celui du bien collectif, utile à tous, mais que personne ne veut financer, et qui ouvre la voie aux passagers clandestins.
Le décideur coopère plus qu’on ne le suppose
155
1.1.1 Dilemmes du prisonnier Au niveau théorique, on sait que la coopération dans une structure du type dilemme du prisonnier est problématique 5. Ce résultat, qui est souvent interprété comme une « énigme de la coopération » heurte le sens commun. En effet, l’existence de comportements coopératifs est une condition nécessaire pour que prévale l’intérêt collectif dans toute vie en société 6. Confrontés à des choix interdépendants, les êtres humains se comportent de telle sorte que la coopération émerge malgré les conflits entre intérêt individuel et intérêt collectif. Ainsi, dans la réalité, les individus ne semblent pas aussi opportunistes que le prétend l’issue d’un dilemme du prisonnier. Les résultats expérimentaux concernant le dilemme du prisonnier classique 7 (2 joueurs, 1 période, jeu simultané) sont apparemment sans ambiguïté. Contrairement à ce que prétend la théorie, les individus coopèrent. En effet, les jeux expérimentaux suggèrent que la coopération est en réalité beaucoup plus fréquente que ne le laisseraient penser les modèles des théoriciens 8. Ainsi, pour prendre un exemple, dans une expérience répétant 267 dilemmes du prisonnier à une seule période, les individus n’ont fait défection que dans 39 % des cas. Même les étudiants en économie, à qui on enseigne que la stratégie rationnelle dans un dilemme du prisonnier est la non-coopération n’ont fait défection qu’à hauteur de 60 % 9 ! Que penser si les économistes se mettent eux aussi à coopérer plus qu’il n’est rationnel de le faire ? L’observation d’un dilemme du prisonnier expérimental en information parfaite est également source d’enseignements. Dans ce cas, il y a répétition du jeu et donc mise en perspective temporelle de l’interaction entre les joueurs. L’ordre des coups est connu et l’individu a une information parfaite sur ce qu’a joué l’autre joueur. Ces conditions permettent de mieux comprendre l’impact de la stratégie d’un joueur confronté à des stratégies déterminées à l’avance. On observe alors que les joueurs confrontés à une stratégie constituée uniquement de choix coopératifs (stratégie pacifiste) répondent par un plus grand nombre de choix coopératifs qu’ils ne devraient le faire en théorie. Seuls 50 % d’entre eux profitent de la naïveté de l’autre joueur. Ce type de comportement ayant également été remarqué dans d’autres jeux que le dilemme du prisonnier, on peut en conclure qu’il n’existe pas de propension générale à exploiter la stratégie pacifiste des autres. Les joueurs ne cherchent pas, en toutes circonstances, à profiter de la bienveillance de l’autre même s’il est facile de le faire. 5 Dans un dilemme du prisonnier, la configuration où personne ne coopère est l’unique équilibre sous-optimal en stratégie dominante. Ce résultat reste valable dans tout jeu statique, qu’il soit en information imparfaite (jeu simultané) ou parfaite (on connaît l’ordre des coups). Quand le jeu est répété en horizon fini, le résultat reste inchangé sauf à introduire une hypothèse d’information incomplète synthétisant un doute sur l’opportunisme de l’autre joueur. Quand le jeu est répété en horizon infini, l’équilibre coopératif devient possible mais, en vertu du « folk theorem », une multitude d’équilibres nouveaux peut émerger. Tous ces résultats ont été présentés aux chapitres 4 et 5. 6 Sans coopération de la part des individus et des groupes sociaux, les nations seraient amenées à se déchirer, les ressources naturelles de la terre à s’épuiser définitivement, les personnes à s’isoler les unes des autres, et donc, à terme, à disparaître. 7 Voir lexique et chapitre 4. 8 Boyer et Orléan (1997). 9 Frank, Gilovich et Regan (1993).
156
Le décideur face à l’autre : de l’opportunisme à la coopération
Lorsqu’il s’agit d’un dilemme du prisonnier en information imparfaite, à deux personnes et répété, l’observation, commune à près d’une centaine d’études, confirme la coopération. Mais celle-ci ne s’exprime plus que sous forme tendancielle : elle transite par des phases de blocage, où chacun choisit la non-coopération. On peut distinguer trois phases 10 : une première où la stratégie de coopération l’emporte, une seconde (après 30 itérations) où elle diminue fortement et une troisième, où les choix coopératifs recommencent à s’accroître lentement, se stabilisant à plus de 60 % au bout de 300 itérations. C’est donc seulement après une très longue période que les individus se remettent à coopérer. Bien que les économistes se soient penchés exclusivement sur les jeux à deux personnes, ce sont les jeux impliquant un grand nombre d’individus qui sont généralement plus représentatifs des interdépendances stratégiques de la vie courante. Or l’approche économique n’opère pas de distinction théorique entre les interactions bilatérales (jeux à 2 joueurs) et celles qui impliquent un plus grand nombre de joueurs. En effet, à partir du moment où l’interdépendance des choix respecte la structure stratégique du jeu, le problème de l’identification de la solution rationnelle se pose dans les mêmes termes de façon théorique, chaque participant ayant le choix entre une stratégie de coopération et une stratégie de défection. En réalité, la distinction entre les dilemmes du prisonnier à deux et à plusieurs intervenants (un dilemme du prisonnier multiple 11) apparaît fondamentale, du fait de ses nombreuses incidences psychologiques et stratégiques. En premier lieu, dans un jeu à deux personnes, le choix non coopératif d’un joueur pénalise directement et complètement l’autre joueur, tandis que dans un jeu à multiples intervenants, les conséquences néfastes d’un tel choix sont réparties sur l’ensemble des participants. Qui plus est, dans un dilemme du prisonnier multiple, l’adversaire est anonyme : personne ne peut être tenu responsable ni sanctionné pour son comportement non coopératif ; le mystère demeure sur l’origine de la défection. Enfin, dans un dilemme du prisonnier multiple, les joueurs ne disposent pas d’un pouvoir de renforcement sur le comportement d’autrui. À l’inverse, dans un jeu à deux participants, chaque intervenant dispose d’un pouvoir de rétorsion ou d’encouragement sur le comportement de l’autre : chacun peut récompenser un choix coopératif par un choix coopératif et punir un choix non coopératif en répliquant par un choix non coopératif. Pour ces différentes raisons, il est donc indispensable d’analyser de façon spécifique le comportement des participants à un dilemme du prisonnier à plusieurs intervenants. Une célèbre expérience 12 étudie la réaction des individus confrontés à un dilemme du prisonnier multiple comme il s’en crée en cas d’incendie dans un bâtiment public, lorsque la foule cherche à fuir le plus rapidement possible par l’issue de secours. Chaque individu peut alors choisir entre se mettre en rang et sortir dans l’ordre, ou bien se précipiter vers la sortie de façon à sortir le plus vite possible. Cette situation a bien la structure stratégique d’un dilemme du prisonnier à plusieurs 10 Rapoport et Chammah (1965). 11 Il n’existe pas de vocabulaire conventionnel pour qualifier ce type de jeu. On trouve dans la littérature les expressions de « jeu collectif » ou de dilemme social (social dilemma). Voir chapitre 8 pour plus de détails. 12 Mintz (1951). Le « jeu de la panique » est une application traditionnelle du dilemme du prisonnier.
Le décideur coopère plus qu’on ne le suppose
157
intervenants : indépendamment du choix des autres, les chances de survie de chaque individu sont meilleures s’il se précipite vers la sortie (défection), mais les chances de tous sont meilleures si les gens sortent de façon ordonnée (coopération). La situation d’évacuation d’urgence est reproduite comme suit en laboratoire : un groupe d’individus doit faire sortir des cônes d’aluminium d’une bouteille au goulot étroit le plus vite possible, en les tirant par des ficelles. Chaque individu tient l’extrémité d’une ficelle, l’autre extrémité étant attachée à un cône. La bouteille se remplit lentement d’eau et les sujets qui font sortir leur cône sans l’avoir mouillé reçoivent une compensation monétaire importante. Les sujets disposent d’un temps largement suffisant pour faire sortir tous les cônes dans le bon ordre en les maintenant au sec. Par contre, la forme des cônes est telle que, si deux cônes ou plus se trouvent entrer en même temps dans le goulot, ils s’y bloquent et obstruent la sortie. Le résultat obtenu dans cette expérience, et dans d’autres qui la reproduisent sous diverses formes 13, est invariablement le même : un blocage se crée systématiquement à l’entrée du goulot, empêchant ainsi certains cônes de sortir à temps. On observe cependant un léger progrès quand on laisse aux sujets la possibilité de se concerter au préalable, mais ce n’est qu’en supprimant l’eau (on supprime l’urgence) et les incitations financières (pas de motivation extrinsèque) que l’on supprime les blocages. Un dernier cas enfin a été envisagé : celui où les individus jouent un dilemme du prisonnier par ordinateur interposé 14. Un tournoi informatique fut organisé pour déterminer la stratégie la plus efficace dans une perspective évolutionniste 15. A deux reprises, il fut demandé à des spécialistes du dilemme du prisonnier (économistes, psychologues, sociologues...) de soumettre — sous forme de programmes informatiques — des stratégies destinées à entrer en compétition les unes avec les autres dans un dilemme du prisonnier répété 200 fois 16. La stratégie qui remporta le tournoi fut celle du « donnant-donnant » 17. Cette stratégie consiste à adopter une attitude coopérative pour commencer, puis à calquer ses actes sur ceux de son adversaire : coopérer s’il coopère et faire défection s’il fait défection, de façon systématique. On a observé dans des travaux antérieurs que, confrontés à cette stratégie, les individus ont tendance à devenir de plus en plus coopératifs et à se forger une opinion plus favorable des autres joueurs. Les résultats de ce tournoi et les scores relatifs des différentes stratégies permettent de conclure que le succès dans les interactions sociales est fondé sur les préceptes suivants : être « gentil », c’est-à-dire ne pas être le premier à devenir non coopératif ; ne pas être rancunier : si l’autre devient non coopéra13 Muir et Marrison (1989). 14 Axelrod (1980, 1984). 15 La perspective évolutionniste s’intéresse à la capacité des stratégies à perdurer au sein d’une population confrontée de manière répétée à une situation de base, en l’occurrence un dilemme du prisonnier. Elle est basée « sur le principe suivant lequel ce qui marche bien pour un joueur est probablement destiné à être utilisé davantage par la suite, et ce qui s’avère marcher moins bien, promis à être écarté » (Axelrod, 1980). L’efficacité d’une stratégie dans ce contexte dépend d’une part de ses caractéristiques propres et d’autre part de la nature des stratégies auxquelles elle est confrontée. 16 Le premier tournoi mit en compétition 14 stratégies auxquelles Axelrod ajouta la stratégie « hasard » Dans le second tournoi, les résultats du premier ayant été communiqués aux participants, 62 stratégies furent rassemblées, auxquelles « hasard » fut aussi ajouté. 17 Stratégie « donnant-donnant » (tit for tat) : « J’agis aujourd’hui comme tu agissais hier », ou, comme le dit le vieil adage : « œil pour œil, dent pour dent ».
158
Le décideur face à l’autre : de l’opportunisme à la coopération
tif, il suffit d’être non coopératif la fois suivante, et d’oublier cet « incident » par la suite si le joueur redevient coopératif ; être réactif et ne pas laisser passer un comportement non coopératif sans réagir immédiatement ; enfin, avoir un comportement très lisible, pour faire en sorte que l’autre décrypte bien ses propres intentions. Les stratégies fondées sur ces préceptes tendent à favoriser un comportement mutuel coopératif et donc à accroître la proportion de comportements coopératifs au sein d’une population, la plus efficace étant celle du donnant-donnant ; à l’inverse, les stratégies trop compétitives ou « rancunières » se révèlent autopunitives, en incitant l’adversaire à la défection. Dans ces expériences, ce ne sont pas des individus qui jouent mais des programmes informatiques. Les « joueurs » sont programmés pour suivre certaines stratégies prédéterminées. Comme dans l’ensemble de la théorie évolutionniste, les joueurs sont assimilés à des automates, ce qui peut donner une vision appauvrie de la rationalité de la décision humaine 18. Il n’en demeure pas moins que cette expérience met en évidence l’importance de la répétition du jeu et de la durée de l’interaction comme facteurs déterminants de la coopération.
1.1.2 Biens collectifs et passager clandestin Les décisions où les individus ont le choix de participer ou non à l’œuvre commune sont particulièrement intéressantes. En effet, quand le bien est de nature privée, la décision n’appartient qu’à l’individu et n’engage personne d’autre. Par contre, quand le bien est collectif, il dépasse le cadre individuel. Ainsi, pour prendre quelques exemples, l’achat d’une orange ou la consommation d’un café n’engage que vous-même. Vous payez, vous consommez et le bien disparaît. À l’inverse, l’existence d’un stade, d’une piscine ou d’un hôpital concerne tous les utilisateurs potentiels. L’utilisation individuelle n’empêche pas celle des autres 19. Ces configurations présentent une caractéristique remarquable : la potentialité d’un phénomène de « passager clandestin ». Quand un bien est collectif, l’individu rationnel peut tout à fait laisser croire qu’il n’est pas intéressé par ce bien. Il ne contribue donc pas à son financement, mais personne ne pourra l’empêcher de profiter du bien collectif, une fois celuici réalisé. Ainsi, un copropriétaire peut refuser de participer aux travaux de voirie de la copropriété tout en en profitant après coup. Une commune peut refuser de contribuer au financement du pont qui enjambe un fleuve, sachant que la commune de l’autre rive peut payer seule. Mais une fois le pont construit, rien n’interdit aux habitants de la première commune de circuler sur le pont. On peut conceptualiser de la 18 Voir notamment Dubuisson (1998) pour un développement de ce point de vue. Dans la théorie des jeux évolutionniste, les individus sont des automates, modélisés comme myopes (ils n’anticipent pas l’avenir ni ne reconnaissent leurs vis-à-vis) et naïfs (ils ne comprennent pas que leur propre comportement peut affecter celui de l’autre). Voir de Larquier, Abecassis et Batifoulier (2001). 19 Les économistes ont coutume de distinguer un bien public d’un bien privé selon plusieurs critères dont le critère de non-rivalité (quand un bien peut être consommé sans rivalité entre deux personnes, alors ce bien est un bien collectif) et celui de non-exclusion, qui signifie que tous les membres du groupe ont accès à la consommation du bien, indépendamment de leur contribution personnelle à la formation de ce bien.
Le décideur coopère plus qu’on ne le suppose
159
même façon les comportements qui engagent la responsabilité collective ou morale des personnes 20. Lorsque l’enjeu d’un jeu non-coopératif est un bien commun, l’incitation à se comporter en « passager clandestin » devient donc très forte : il est tentant pour chacun de resquiller dans le métro, d’utiliser sa propre voiture plutôt que les transports en commun moins polluants, de se livrer à la fraude fiscale ou de copier des logiciels de façon illégale. Cependant, à terme, les conséquences de ces comportements sont bien pires pour chaque individu que si chacun avait décidé de se restreindre. Il est clair que si tout le monde se conduit en passager clandestin, le bien commun ne peut exister. Si tous se conduisent en profiteurs, personne ne pourra profiter de quoi que ce soit 21 ! On emploie souvent le terme « tragédie » 22 pour désigner de tels phénomènes. Ainsi, dans les « dilemmes de ressources limitées » 23, les sujets puisent des ressources dans un pot commun dont la capacité est connue et fixée à l’avance, sachant qu’après chaque tour, le pot commun est réapprovisionné à un rythme prédéterminé. Ce paradigme de recherche modélise assez fidèlement des situations courantes, comme par exemple la conservation des richesses naturelles. La « Tragédie des Communs » 24, parabole classique de la littérature, illustre la nature et les conséquences de ce dilemme. Elle se réfère à l’utilisation de pâturages communs par un groupe d’éleveurs pour faire paître les troupeaux 25. Sachant qu’un animal supplémentaire représente un bénéfice individuel additionnel pour un coût réparti sur l’ensemble des éleveurs, chaque éleveur a intérêt à accroître la taille de son troupeau. Agissant ainsi de façon rationnelle, les éleveurs augmentent tous la taille de leurs troupeaux, ce qui conduit à épuiser les terres communes et à détruire l’ensemble des troupeaux faute de pouvoir les nourrir. Ce type de dilemme peut être étendu aux situations où la taille de la ressource commune n’est pas connue. Il y a donc une incertitude concernant l’environnement 26. 20 Par exemple, chaque citoyen est confronté à un dilemme stratégique concernant le niveau de sa consommation personnelle d’eau en période de sécheresse. Un individu ne tire les bénéfices d’un effort de restriction que si des milliers d’autres individus font cet effort. Mais, dans ce cas, l’effort consenti par un individu donné est clairement inutile car il profitera de toute façon des résultats de l’effort général, qu’il participe ou non lui-même à cet effort. Par ailleurs, si la plupart des autres individus ne tiennent pas compte de l’appel à la restriction, alors l’effort fourni par un individu est perdu car il n’y aura de toute façon aucun bénéfice global à partager. Si l’on adopte donc la perspective d’un individu donné, on se rend compte que le fait d’économiser de l’eau personnellement apparaît soit inutile, soit sans effet. Il est donc clairement rationnel individuellement ne pas faire d’effort de restriction, quel que soit le choix des autres. 21 Olson (1965, 1982) a beaucoup développé ce point de vue en le liant à une logique de taille des groupes. 22 En référence à la « Tragédie des Communs », ce terme désigne les situations où le bien collectif, à force d’avoir été ponctionné, disparaît littéralement, provoquant des catastrophes économiques ou humaines. Les questions écologiques du XXIe siècle peuvent s’analyser en ces termes. 23 Jerdee et Rosen (1974). 24 Hardin (1968). 25 Organisation traditionnelle de l’agriculture en Angleterre, qui persiste encore dans certaines régions. 26 Budescu, Rapoport et Suleiman (1992).
160
Le décideur face à l’autre : de l’opportunisme à la coopération
Dans ce type de situations, il apparaît plus rationnel pour un individu donné de profiter du bien commun sans lui-même se soucier de le préserver ou d’y contribuer. Or les comportements de passager clandestin sont à l’évidence relativement limités. L’existence même de biens collectifs en est une preuve, qu’il s’agisse d’hôpitaux ou d’équipements sportifs ou urbains. Nombre d’individus se montrent soucieux de préserver les biens collectifs dont ils bénéficient : économiser l’eau en période de sécheresse, par exemple, ou pratiquer le tri sélectif des déchets ne sont pas des comportements exceptionnels. En laboratoire, on constate que les individus ont tendance à contribuer au financement du bien commun à hauteur de 40 % à 60 % de leur dotation initiale en moyenne. De nombreuses autres études montrent combien le nombre de passagers clandestins est faible, qu’il s’agisse de joueurs novices ou expérimentés, au sein de groupes d’effectifs variables et pour des enjeux monétaires d’amplitude diverse. L’une des explications avancées repose sur la notion de « justice » invoquée par les sujets pour justifier leur degré de participation : par exemple, dans une de ces expériences, 88 % des sujets considéraient qu’il leur semblait juste de contribuer au moins à hauteur de 40 % de leurs ressources 27.
1.1.3 Marchandage et partage du gâteau Les résultats expérimentaux des jeux de marchandage mettent également en avant cette notion de justice. Dans ces interactions, les joueurs doivent se partager un gâteau. Pour ce faire, l’un fait une proposition (un ultimatum) que les autres acceptent ou non. Si la proposition est refusée, c’est à un autre joueur de faire une proposition en respectant les règles du jeu. Ce type de configuration s’adapte à des situations de négociation courantes, comme lorsqu’il s’agit, par exemple, de partager un gâteau entre les membres d’une famille, un surplus financier entre employés et direction ou entre manager et actionnaire etc.. Dans ces jeux, les joueurs jouent à tour de rôle. La solution rationnelle qui s’impose avantage le premier joueur, qui maximise ses gains et laisse une portion congrue du gâteau aux autres. L’encadré 18 présente une illustration simple de ce type de jeu 28. En définitive, les résultats théoriques de ce type de jeu mettent en avant des comportements de « dictateur » : le décideur en chef profite de sa position dominante pour s’accorder la plus grande part du surplus. Or les résultats expérimentaux ne confirment pas ces solutions fournies par la théorie des jeux. Dans les expériences réalisées 29, les « dictateurs » sont beaucoup plus altruistes que ne le prétend la théorie des jeux. Ils tendent au partage égalitaire alors qu’ils n’y sont pas obligés. Ils renoncent ainsi au gain maximal pourtant à leur portée et proposent des sommes très élevées, correspondant souvent à la moitié de la somme totale disponible. Ces sommes sont même parfois trop élevées aux yeux de certains récipiendaires 30, qui auraient tendance à les refuser 31. Ces attitudes sont irrationnelles en théorie. En réa27 Marwell et Ames (1979). 28 Le modèle de base est celui de Rubinstein (1982). 29 Voir notamment la synthèse de Güth et al. (1992). 30 Thaler (1988). 31 Alors que le comportement rationnel du récipiendaire consiste à accepter le minimum qui lui est offert, sachant qu’en cas de refus, il n’aura plus rien du tout.
Le décideur coopère plus qu’on ne le suppose
161
ENCADRÉ 18
Une illustration simplifiée du jeu de marchandage : le jeu des pirates À l’issue d’une bataille difficilement gagnée, un nombre n de pirates (dont la nature belliqueuse, égoïste et individualiste ne fait aucun doute) doit se partager 100 lingots d’or (le « gâteau »). La règle de répartition est la suivante : le plus âgé décide de la répartition. Si la majorité est d’accord avec lui, le jeu s’arrête et chacun disparaît avec sa part de butin. Si la majorité est contre, on lui coupe la tête ; il ne reste alors que n – 1 pirates et le plus âgé d’entre eux décide de la nouvelle répartition. Supposons pour simplifier qu’il n’y ait que 3 pirates. La majorité est donc fixée à 2 et il suffit que le plus ancien emporte le suffrage d’un des 2 autres pour avoir la vie sauve. La solution de ce jeu consiste donc à définir un triplet dont la somme fait 100. Des individus peu familiers avec la cupidité habituelle des pirates ou avec la rationalité égocentrique des économistes auraient tendance à proposer une répartition égalitaire du type (40,30,30) par ordre d’âge (40 pour le plus âgé, 30 pour le second et 30 pour le dernier), voire une répartition altruiste du type (20, 40, 40), qui donne peu à celui qui décide. On aurait ici des solutions qui ne correspondent absolument pas au modèle canonique de la rationalité : elles ne sont ni égoïstes ni maximalisantes. Elles seraient donc qualifiées d’irrationnelles par la théorie des jeux. La solution unique (l’équilibre de Nash parfait) de ce jeu est (99, 1, 0). Pour s’en convaincre, considérons l’exemple trivial de 2 joueurs : l’aîné qui décide et le benjamin qui peut refuser. La seule solution rationnelle pour le plus jeune est de refuser toute proposition du plus âgé, car le jeune est absolument sûr d’emporter les 100 lingots : il suffit qu’il dise qu’il est contre la répartition de l’ancien et celui-ci disparaît du jeu, laissant le plus jeune seul avec les lingots. On comprend bien, dans ces conditions, que l’aîné donne directement les 100 lingots à l’autre, sauvant ainsi sa tête. La solution pour 2 joueurs est donc (0, 100). Ce calcul montre à la fois que le plus jeune a intérêt à s’opposer à toute répartition pour rester seul en jeu et prendre les 100 lingots, et que le plus âgé, quand il y a 2 joueurs, se retrouve avec rien. À partir de là, le calcul rationnel du plus âgé dans une configuration à 3 est simple. Le plus jeune est toujours contre. Ce n’est pas la peine d’espérer un vote favorable de sa part, il aura 0 lingot. Tout dépend du second joueur dont l’aîné doit obtenir un suffrage favorable. Ce sera chose faite si ce second joueur y gagne. Or il y gagne s’il obtient plus de 0 lingot. En effet, s’il est contre, le plus âgé disparaît (on lui coupe la tête) et le second se retrouve dans la position du premier joueur où, comme on l’a montré précédemment, il ne peut espérer que 0 lingot. Il suffit alors de lui en donner 1. 1 lingot vaut mieux que 0 : il y gagne et s’il est rationnel, il ne peut refuser. Restent alors 99 lingots, que peut s’octroyer le plus âgé. Soit donc 99 pour le plus âgé, 1 pour le second et 0 pour le dernier. Le plus âgé a donc bien maximisé ses gains en prévoyant pour lui et pour les autres l’ensemble des conséquences de ses choix.
lité, il semble que le comportement des deux parties soit déterminé par le sentiment que la répartition de la somme entre les parties doive être équitable 32 : dans les faits, il n’y a pas de comportement dictatorial, puisque les « dictateurs » persistent à partager les sommes de façon équitable, même lorsque le récipiendaire n’a pas la possibi32 Kahneman, Knetsch et Thaler (1986).
162
Le décideur face à l’autre : de l’opportunisme à la coopération
lité de refuser la somme qui lui est proposée. C’est la notion de justice ou d’équité qui est généralement mise en évidence dans l’explication des comportements coopératifs observés dans ce type de jeu 33. En résumé, les résultats empiriques suggèrent généralement que les individus adoptent un comportement qui ne correspond pas à la poursuite exclusive de leur intérêt personnel à court terme mais qui traduit un degré de coopération supérieur à celui qui résulte des prédictions de la théorie des jeux.
1.2
PRISE EN COMPTE DES FACTEURS PSYCHOLOGIQUES PAR LA THÉORIE ÉCONOMIQUE
Il pourrait être tentant d’ignorer les résultats expérimentaux, en arguant que le comportement observé des individus, pour « raisonnable » qu’il soit, ne peut bénéficier d’une justification quelconque au regard des critères de la rationalité économique. Cependant, au vu de la quantité et de la qualité des travaux expérimentaux montrant que les individus ne sont pas aussi calculateurs et opportunistes que le laisse entendre la théorie des jeux non coopératifs, il n’est pas possible d’ignorer les observations accumulées. Il n’est pas non plus envisageable de porter un regard accusateur sur la théorie économique, sous prétexte qu’elle conduit à des solutions incompatibles avec les comportements observés. Une des questions posées par la confrontation de l’approche théorique et de l’approche expérimentale, en filigrane dans tout ce chapitre, est celle de la nature des contributions respectives des économistes et des psychologues à la compréhension et à l’amélioration des décisions humaines. En effet, chacun, avec les objectifs et les méthodes qui lui sont propres, a contribué à établir des passerelles entre la théorie et les observations expérimentales, dans la limite de son champ d’investigation particulier. Ainsi, la théorie économique a-t-elle intégré des dimensions psychologiques dans ses modèles pour tenter de rendre compte des résultats expérimentaux révélant la propension à coopérer des individus. Pour tenir compte des résultats expérimentaux, certains économistes ont entrepris de modifier la théorie des jeux en amendant ses hypothèses de façon à y intégrer l’influence de facteurs psychologiques. Par exemple, certains ont proposé d’intégrer des facteurs tels que la prédisposition coopérative, la confiance, l’altruisme ou encore l’émotion dans l’interaction, pour faire émerger un « équilibre de Nash psychologique » plus proche de la solution des jeux expérimentaux 34. D’autres plaident pour une « théorie des jeux comportementale » dont l’objectif est de décrire le 33 Le passage d’un jeu où le dictateur est un individu isolé à un jeu où un groupe a un comportement dictatorial envers un autre groupe (team dictator game) ne change rien aux résultats. Voir Cason et Mui (1997) pour une présentation du jeu et des expériences ainsi que des explications psychologiques avancées. De même, l’expérience conduite par Berninghaus, Güth et Keser (1999) dans laquelle 2 joueurs négocient avec un troisième montre que la solution théorique n’est pas toujours validée. Les deux premiers joueurs ont pour options de négocier séparément ou bien collectivement (en formant une coalition) avec le troisième. La solution théorique prédit une supériorité de la négociation décentralisée. Or, l’expérience met en évidence le choix de la négociation collective. 34 Rabin (1993, 1998).
Le décideur coopère plus qu’on ne le suppose
163
comportement réel 35. Nous choisissons de présenter la façon dont l’altruisme, la confiance et le sentiment de culpabilité, trois facteurs psychologiques souvent invoqués par les économistes, ont été intégrés dans la théorie économique des jeux.
1.2.1 L’altruisme Rappelons qu’en théorie des jeux, l’homo oeconomicus rationnel est supposé n’attacher aucune importance aux bénéfices obtenus par les autres participants d’un jeu, ni se préoccuper d’adopter un comportement jugé « convenable » aux yeux de la société 36. L’altruisme 37 se réfère à la motivation qui pousse l’être humain à se réjouir du plaisir éprouvé par les autres. Un individu altruiste serait motivé par la recherche de résultats positifs pour les autres autant que pour lui-même, ce qui l’inciterait donc à adopter un comportement coopératif de façon à assurer ces bénéfices. Cette explication est cependant insuffisante, car on constate que les individus persistent à coopérer même lorsque les bénéfices obtenus par les autres proviennent de fonds dérivés d’autres sources. Une forme alternative d’altruisme invoquée pour expliquer la coopération s’inscrit dans l’acte même de la coopération, et non plus dans les conséquences qui en découlent. Il s’agit de la motivation qui pousse les individus à « faire ce qui est convenable », voire à se donner « bonne conscience ». Cette forme d’altruisme peut expliquer les comportements coopératifs en partie, puisque 30 % des sujets avouent mettre leur dotation au pot commun pour cette raison 38. Il est donc apparu plausible d’intégrer l’altruisme dans les préférences des joueurs, à titre de « norme sociale » à laquelle se réfèrent les joueurs, par exemple en définissant un coefficient d’altruisme 39. Avec une modification de cette nature, la coopération peut émerger dans un dilemme du prisonnier joué par des joueurs parfaitement rationnels 40. Une telle démarche présente cependant des inconvénients majeurs, reconnus par les économistes eux-mêmes. En effet, le recours à une « norme altruiste » ne masque pas le manque de fondement théorique du concept, bien que l’existence d’une forme d’altruisme dans le comportement humain relève de l’évidence. « Pour les économistes, le recours à des normes est en général critiqué pour des raisons méthodologiques. Le risque invoqué est qu’en autorisant l’utilisation systématique d’explications de ce type, on affaiblisse considérablement les capacités prédictives des 35 Camerer (1997). 36 Thaler (1988). 37 On parle ici du véritable altruisme et non d’un égoïsme déguisé. L’altruiste se soucie des autres en tant que tels et non pour satisfaire son propre bien être égocentrique. 38 Orbell, Dawes et van de Kragt (1988). Les résultats révèlent également le rôle crucial de la communication et de l’appartenance à un groupe. En effet, si les sujets ont la possibilité de discuter entre eux, le taux de coopération s’élève à 70 %, mais seulement lorsque les membres de leur groupe sont les seuls à bénéficier ensuite de la répartition finale. Lorsque les bénéfices doivent être partagés avec les membres d’un autre groupe de sujets, le taux de contribution au pot commun chute généralement à moins de 30 %. Nous reviendrons ultérieurement sur le rôle de la communication. 39 Stark (1987). 40 Il faut généralement que le coefficient d’altruisme dépasse un certain seuil pour faire émerger l’équilibre coopératif. Par exemple, un tel coefficient peut être défini par la notion « d’utilité procédurale » au sens de Le Menestrel (1997). La coopération apparaît dans un dilemme du prisonnier en pondérant les utilités par des préférences procédurales.
164
Le décideur face à l’autre : de l’opportunisme à la coopération
modèles, une grande variété de comportements pouvant être « expliqués » par la référence à une « norme » sociale bien choisie. En d’autres termes, l’utilisation de tels concepts est souvent considérée comme ad hoc 41 ». D’autre part, l’altruisme peut conduire à des résultats ambigus. En effet, si l’altruisme permet de résoudre des problèmes de coopération, dans le dilemme du prisonnier notamment, il peut aussi conduire à des défaillances. Ainsi l’altruisme peut conduire les joueurs à ne pas punir l’individu déviant. Cette naïveté diminue l’incitation à la coopération mutuelle dans le cadre d’une interaction répétée. « L’altruisme peut donc s’avérer contre-productif. Incapables d’appliquer des punitions suffisamment sévères, les altruistes ne peuvent s’obliger mutuellement à tenir des engagements leur permettant d’atteindre des situations socialement souhaitables 42. » Il existe donc des « paradoxes de l’altruisme ». Les explications proposées se heurtent à des divergences quant à la nature de l’altruisme et aux modalités de son influence : l’altruisme est-il une caractéristique intrinsèque de l’individu ou une motivation liée à des normes sociales ? dans quelles conditions conduit-il à coopérer ou à laisser des comportements non-coopératifs perdurer ?
1.2.2 La confiance Le deuxième facteur psychologique couramment invoqué par les économistes pour expliquer les comportements coopératifs est la confiance. En effet, de nombreux exemples tirés du quotidien suggèrent que la confiance favorise la coopération, qu’il s’agisse de la coopération au sein d’une famille, ou de la coopération inter-entreprises. Cependant, pour décrire la façon dont la confiance favorise la coopération, plusieurs positions sont avancées. La première position consiste à dire que la confiance est au mieux un sentiment de sécurité psychologique accompagnant des choix interdépendants dont la structure des intérêts est telle, en réalité, que leur réciprocité suffit à lier les individus entre eux 43. Selon cette approche, la confiance se ramène à du risque calculé et peut se réduire à un élément de calcul comme un autre. Sauf situation particulière (les amis, la famille, le conjoint, qui sont des situations de personal trust), la notion de confiance ne sert à rien. Ce que l’on appelle confiance pour expliquer — notamment — la coopération n’est qu’une illusion qui cache un calcul raisonné des acteurs. À l’inverse, on peut considérer que l’existence d’intérêts mutuels ne conduit pas nécessairement à la coopération et que la confiance est une qualité intrinsèque des individus sur la base de laquelle peut s’établir la coopération 44. De ce point de vue, la confiance est une modalité spécifique d’interaction liant directement les personnes entre elles, par-delà le calcul des intérêts. D’autres approches encore appellent plusieurs remarques 45. En premier lieu, la conception selon laquelle la confiance est un élément que les joueurs intègrent dans leurs calculs permet de transformer l’outil traditionnel tout en conservant l’esprit de la théorie des jeux. En effet, on 41 Chiappori et Orfali (1997, p. 435). 42 Cahuc et Kempf (2000). 43 Williamson et Craswell (1993). 44 Orléan (1994a). 45 On pourra consulter les critiques sociologique (Karpik, 1998) et économique (Reynaud, 1998) ainsi que « Economie et Société » (1998) pour les sciences de gestion. Voir aussi Kreps (1990) pour la présentation du « jeu de la confiance ».
Le décideur coopère plus qu’on ne le suppose
165
incorpore certaines hypothèses sans toucher à l’essentiel : l’hypothèse de rationalité des joueurs. Avec ou sans la notion de confiance, les joueurs restent des calculateurs parfaitement capables de prévoir pour eux et pour les autres l’ensemble des conséquences de leurs choix. On a ici une illustration remarquable de la capacité de rebond dont est coutumière la théorie économique néoclassique, qui, loin d’être déstabilisée par des concepts hétérodoxes, parvient à les réinsérer dans une problématique du choix rationnel. En second lieu, affirmer que la confiance est une qualité intrinsèque de l’individu favorable à l’établissement d’une relation de coopération mutuelle 46 ne suffit pas à expliquer ce qui va permettre à cette relation de s’établir. On peut donc se demander si la confiance, plutôt qu’un facteur explicatif de la coopération en soi, ne serait pas en réalité une caractéristique de la relation instaurée entre les parties, caractéristique déterminée par un contexte spécifique et dont l’influence est susceptible de s’exercer à travers l’interprétation des stratégies et des intentions réciproques. Ici encore, le débat porte sur la nature même de la confiance en tant que facteur psychologique, ainsi que sur ses rapports avec la relation instituée entre les individus, telle qu’elle est déterminée par la structure même du jeu.
1.2.3 Le sentiment de culpabilité Le sentiment de culpabilité, quant à lui, a été invoqué par des économistes pour expliquer un comportement coopératif privilégiant l’intérêt du groupe aux dépens de l’intérêt individuel immédiat. Cette approche s’appuie sur une conception freudienne de la psychologie de l’individu. Quand dans un groupe la tricherie n’est pas visible, c’est la culpabilité interne qui peut détourner l’individu de la satisfaction de ses intérêts immédiats pour privilégier ceux du groupe. Pour reprendre des termes freudiens 47, il existe un conflit entre le « Ça » 48 qui vise à satisfaire ses propres désirs et le « Surmoi » qui permet d’intégrer les normes sociales et d’éviter l’expression libre des pulsions. Le sentiment de culpabilité est un moyen permettant de résoudre ce conflit, mais il provoque un malaise. Malgré cela, le recours à un « Surmoi envahissant » peut expliquer la coopération au sein d’un groupe. Pour être délivré de son propre sentiment de culpabilité, il apparaît rationnel de coopérer. La théorie freudienne, comme beaucoup d’autres, permet d’expliquer des comportements en apparence irrationnels par une théorie du choix rationnel 49 : quels que soient les motifs et les désirs d’un individu, il a de bonnes raisons de coopérer au sein d’un groupe. Là encore, une motivation psychologique est reconnue, mais les conditions qui la mettent en œuvre restent néanmoins obscures. Ainsi, l’introduction d’un concept psychologique dans la théorie économique, qu’il s’agisse de l’altruisme, de la confiance ou du sentiment de culpabilité, appelle des explications complémentaires que les travaux en psychologie ont contribué à développer. Notamment en mettant en évidence les conditions favorables à l’émergence de la coopération. 46 47 48 49
Orléan (1994a). Voir chapitre 3 pour l’approche psychanalytique de la décision. Défini comme le réservoir des pulsions dans la personnalité. voir Davidson (1990) pour un développement.
166
Le décideur face à l’autre : de l’opportunisme à la coopération
2. Les conditions de la coopération identifiées par la psychologie expérimentale À l’origine, les psychologues ont considéré que le degré de coopération dont faisait preuve un individu renvoyait à une caractéristique individuelle : chacun était qualifié comme étant plus ou moins égoïste, plus ou moins solidaire des autres, bref, d’un tempérament plus ou moins coopératif 50. Or l’accumulation des travaux expérimentaux a montré qu’un même individu pouvait se comporter de façon coopérative ou non coopérative selon l’environnement dans lequel il agissait. L’attention s’est donc portée sur les caractéristiques des environnements dans lesquels apparaissent des comportements coopératifs. Alors qu’en théorie économique, les caractéristiques de l’environnement et du contexte social 51 sont supposées n’influencer en rien le comportement des joueurs, ni les détourner de la stratégie rationnelle leur permettant de servir au mieux leur intérêt personnel 52, ce sont spécifiquement les situations dans lesquelles on observe des comportements coopératifs qui font l’objet des investigations de la psychologie expérimentale. La structure des situations étudiées en théorie des jeux se prêtant particulièrement bien à l’étude en laboratoire, les travaux expérimentaux ont mis en évidence de multiples facteurs favorables à l’émergence de la coopération. En constatant l’importance de certaines dimensions des jeux considérées cependant comme non pertinentes par la théorie économique, la psychologie expérimentale, tant cognitive que sociale, a été amenée à élargir le cadre théorique des décisions interdépendantes. En effet, ces dimensions, qui ne modifient pas la structure de l’interdépendance des participants, comme par exemple la répétition dans la durée, affectent les comportements en terme de coopération. Notre analyse va s’attacher à identifier les caractéristiques de l’environnement susceptibles de rendre compte de la diversité des comportements.
2.1
LE COMPORTEMENT DU DÉCIDEUR EST INFLUENCÉ PAR LES CARACTÉRISTIQUES DU JEU
La stratégie adoptée par un individu dans un jeu expérimental est fonction des éléments caractéristiques du jeu et de la structure d’interdépendance qu’il implique. 50 Dans cette perspective, Kelley et Stahelski (1970) se réfèrent à la tendance d’un individu à être coopératif ou opportuniste comme une dimension de sa personnalité. Cette position est critiquée par Beggan, Messick et Allison (1988), qui considèrent une telle tendance comme une valeur sociale relative aux préférences concernant la répartition des biens entre les individus. Les deux approches peuvent en fait se rejoindre dans la mesure où elles supposent que la population se répartit en individus coopératifs et en individus opportunistes, qu’il est possible d’identifier grâce à des échelles de mesure comme celle de Messick et McClintock (1968). 51 Il est fondamental de clarifier la signification du terme « social » tel qu’il est employé dans tout ce chapitre. En effet, la notion « d’environnement social » ne fait pas référence au concept « classe sociale », qui relève du vocabulaire de la sociologie. En psychologie sociale, le terme « social » est employé par opposition au terme « individuel ». Étudier l’influence de l’environnement social sur le comportement d’un individu, c’est observer ce comportement quand l’individu est en interaction avec d’autres individus, que ce soit de façon passive (il fait partie d’un groupe) ou active (il y a échange ou communication avec d’autres). 52 Puisque que les choix sont déterminés par les préférences des individus, préférences qui sont données, exogènes, et donc insensibles aux modifications de l’environnement et du contexte social.
Le décideur coopère plus qu’on ne le suppose
167
Les joueurs perçoivent et interprètent la situation, notamment la nature des enjeux et de l’interaction stratégique, à travers l’habillage du jeu et son environnement physique — sa durée, les motivations qui lui sont attachées … Ces éléments, ainsi que les croyances et les attentes concernant le comportement et les intentions d’autrui, influencent la relation qui s’installe entre les participants interprétant mutuellement leurs comportements. L’analyse des facteurs liés aux caractéristiques des jeux nous conduira à examiner les processus cognitifs sous-jacents à l’interaction.
2.1.1 L’habillage des éléments du jeu conditionne l’interprétation des enjeux L’individu qui participe à un jeu va chercher à comprendre la nature des enjeux et de leur interdépendance. De l’interprétation qu’il fera de la situation 53 dépendront ses choix 54. Or on constate que la façon dont les éléments du jeu sont présentés influence la perception des enjeux et modifie les choix des joueurs. Ainsi, le choix des individus sera différent selon que les enjeux sont présentés de façon abstraite, comme une simple matrice, ou de façon plus concrète, habillés d’un scénario. La nature même du scénario influencera les décisions. Ainsi, une matrice d’enjeux habillée de scénarios différents fut présentée à quatre groupes de sujets, de façon à faire varier l’interprétation du problème 55. Cette matrice fut présentée telle quelle (à l’état brut) au premier groupe de sujets. Aux autres groupes, elle fut présentée sous les formes respectives de négociations économiques, de négociations internationales, ou d’interactions interpersonnelles, amicales ou inamicales. Les individus jouaient tous contre une stratégie préprogrammée. Ceux qui prirent leurs décisions sans habillage contextuel ou dans un contexte de décision économique se montrèrent infiniment moins coopératifs que ceux qui prirent leurs décisions dans un contexte international ou interpersonnel 56. Même lorsqu’ils sont présentés sous la forme de matrices, les enjeux sont interprétés différemment par les joueurs, selon qu’il s’agit de matrices décomposées 53 Le comportement (coopératif ou non) d’un joueur est lié au sens qu’il donne à la situation et à la tâche qu’il doit accomplir. C’est par des processus cognitifs que l’individu perçoit et interprète l’information relative au jeu et au comportement d’autrui. Le processus d’interprétation s’effectue en utilisant les schémas, les attributions et les informations déjà stockés en mémoire mais évoqués par la situation, ainsi que ceux qui sont formés sur la base des informations disponibles dans l’environnement. Ainsi, les échanges et les comportements ont-ils un sens, lié au contexte (d’où le rôle des variables « sociales » et « cognitives »), et c’est ce sens qui va déterminer le degré de coopération que l’on va observer. 54 Voir également chapitre 2. 55 Eiser et Bhavnani (1974). 56 Les éléments caractéristiques de la structure d’interdépendance positive ou négative entre les intervenants conditionnent également le degré de coopération. Une expérience réalisée par Deutsch et Krauss (1960) montre, par exemple, que la présence d’une menace, unilatérale et surtout bilatérale, freine le processus d’émergence de la coopération ; une explication possible est que l’utilisation potentielle d’une menace modifie la signification d’un comportement conciliant, lui conférant un soupçon de faiblesse ou de lâcheté. Par contre, alors qu’on pourrait s’attendre à ce que la taille des enjeux influence clairement le degré de coopération observé, les conclusions des études portant sur cette relation sont relativement ambiguës ; on note toutefois un degré de coopération accru quand la taille des enjeux augmente dans les jeux à multiples intervenants.
168
Le décideur face à l’autre : de l’opportunisme à la coopération
ou agrégées. La figure 23 représente un même dilemme du prisonnier sous trois formes distinctes. Il s’agit dans les trois cas de la même situation. Le joueur doit choisir entre coopérer et ne pas coopérer. Pour calculer le résultat final obtenu par chaque joueur, on additionne ce que le joueur obtient du fait de son propre choix et ce qu’il obtient du fait du choix de l’autre joueur. Par exemple, si dans la matrice (b), le joueur A coopère, il obtient 0 point et donne à l’autre joueur 3 points ; si l’autre joueur coopère également, chacun des joueurs aura obtenu au final 3 points. En poursuivant le raisonnement pour cette matrice, ainsi que pour la matrice (c), on constate que les enjeux sont mathématiquement identiques à ceux de la matrice (a), qui correspond à la façon traditionnelle de présenter un dilemme du prisonnier. Or on remarque dans les faits une tendance à coopérer beaucoup plus forte quand les enjeux sont présentés dans des matrices décomposées : les joueurs sont plus prompts à répondre à un choix coopératif par un choix coopératif et plus lents à répondre à un choix non coopératif par un choix non coopératif. Ceci peut s’expliquer de la manière suivante 57 : les structures décomposées mettent en évidence pour chacun des joueurs le fait que le résultat qu’ils obtiendront dépend pleinement de la bonne volonté et de la générosité de l’autre joueur, ce qui semble encourager le développement d’une relation de coopération mutuelle. Illustrons cette idée en considérant que la matrice (c) se réfère à l’entraide entre voisins (prêt d’outils, babysitting, dépannage en lait, œufs etc.). On peut considérer que rendre un service à son voisin procure à celui-ci un bénéfice plus grand qu’il n’en procure à soi-même, alors que refuser de lui rendre service nous épargne des tracas, en étant source de réelle gêne pour le voisin. Chaque service rendu est plus bénéfique à l’autre, mais l’accumulation des services échangés est d’un plus grand profit pour tous. La présentation des enjeux met ainsi en avant l’intérêt d’établir une relation dans le long terme. On voit ici encore l’importance de la perspective temporelle dans l’émergence de la coopération.
2.1.2 La durée de l’interaction modifie les perspectives stratégiques La répétition d’un jeu ne modifie pas la structure de l’interdépendance des enjeux : du point de vue de la théorie économique, elle ne devrait donc pas avoir d’incidence sur les choix des joueurs. Or, l’observation des jeux répétés montre que la durée d’un jeu modifie les perspectives des joueurs et introduit des motivations particulières. L’interprétation des choix observés est complexe, une même stratégie pouvant être mue par des intentions différentes. Au-delà de la simple volonté de coopérer ou non, les attitudes de coopération ou de défection correspondent à des motivations liées au sens du contexte dans lequel s’exprime l’interaction 58. Dans un contexte de type « instrumental » 59, les joueurs vont coopérer -ou rivaliser- dans le but d’atteindre des résultats d’ordre économique ou tangibles, tandis que dans un contexte de type « social ou relationnel », l’objectif est de parvenir à une relation mutuellement satisfaisante avec l’autre, qui est un but en soi. Selon la nature de l’interaction et du 57 Colman (1982). 58 Rabbie (1991). 59 Qui se rapporte à l’action.
Le décideur coopère plus qu’on ne le suppose
169
Matrice agrégée (a) Résultat final obtenu par chacun, en fonction de son propre choix et de celui de l’autre joueur Joueur I
Joueur II
Coopère
Ne coopère pas
Coopère
(3,3)
(1,4)
Ne coopère pas
(4,1)
(2,2)
Ordre de lecture (gain du joueur II, gain du joueur I) Matrice décomposée (b) Il obtient
L’autre obtient
Si un joueur coopère
0
3
Si un joueur ne coopère pas
1
1
Matrice décomposée (c) Il obtient
L’autre obtient
Si un joueur coopère
1
2
Si un joueur ne coopère pas
2
0
FIGURE 23 – Un même Dilemme du Prisonnier représenté sous trois formes différentes – [Colman (1982)]
type de relation sociale envisagée, un même choix observé peut être l’expression d’orientations psychologiques différentes. Si le désir de maximiser le résultat global conduit à des choix de coopération et le désir de maximiser le résultat relatif — s’assurer de faire mieux que l’adversaire — à des choix de défection, le désir de maximiser le résultat individuel peut conduire aussi bien à des choix de coopération que de défection, selon le jeu de l’autre. L’ambiguïté de l’interprétation de la stratégie des joueurs devient évidente si l’on tient compte également du risque inhérent aux choix coopératifs : les choix coopératifs, dans un climat de confiance, peuvent traduire la volonté de maximiser les résultats globaux autant que les résultats individuels ; les choix de défection, dans un climat de méfiance, peuvent traduire la volonté de maximiser les résultats relatifs autant que les résultats individuels. Par conséquent, la défection ne traduit donc pas nécessairement une attitude agressive. Elle peut aussi correspondre à une attitude défensive de suspicion, pour se prémunir d’un risque de défection de la part de l’autre. Face à cette incertitude sur les motivations réelles de l’autre, le degré de coopération observé reste cependant étonnamment élevé : on constate un taux de coopération de 3 % dans un dilemme du prisonnier lorsque les joueurs sont au préalable informés de la défection de l’autre, de
170
Le décideur face à l’autre : de l’opportunisme à la coopération
16 % lorsqu’ils sont au préalable informés de la coopération de l’autre mais de 37 % lorsqu’ils ne savent pas si l’autre a coopéré ou fait défection 60. La tendance à coopérer augmente avec l’incertitude ! On peut attribuer cette observation à la difficulté souvent notée qu’ont les individus à envisager les conséquences d’événements incertains. Dans le doute, les joueurs choisiraient de coopérer, espérant induire ainsi un comportement coopératif de la part des autres participants. Dans un dilemme du prisonnier répété, les participants doivent interpréter le comportement d’autrui avant d’y réagir et de chercher à l’influencer, étant donné qu’une même action peut résulter de motivations très différentes. L’individu est amené à prévoir les intentions et les choix futurs des participants, et ces prévisions sont susceptibles de subir des biais systématiques (voir chapitre 2). Ces prévisions sont également influencées par le simple fait d’avoir à prendre une décision de coopération ou de défection, les participants ayant tendance à supposer que les autres auront un comportement similaire au leur 61. Par ailleurs, il est naturel pour un joueur d’attribuer des intentions à l’autre joueur, en se référant au comportement de celuici. Ces « attributions » 62 sont déterminantes dans les décisions qu’il prend, mais elles peuvent facilement être erronées. Par exemple, un choix coopératif pourra être interprété comme exprimant une volonté de coopération, alors qu’en réalité il était motivé par le désir d’induire l’adversaire en erreur, pour l’inciter à faire à son tour un choix coopératif susceptible d’être exploité. De même, un choix non coopératif pourra être interprété comme étant motivé par un esprit de compétition, alors qu’en fait il traduisait le désir de se protéger des conséquences d’une éventuelle défection de l’adversaire. D’une façon générale, on constate que la perception des intentions d’autrui est directement fonction de l’attitude de l’individu lui-même. Un individu coopératif aura tendance à supposer un comportement coopératif de la part d’autrui alors qu’un individu agressif aura tendance à prêter le même comportement aux autres. Cette approche initiale a des conséquences importantes pour la compréhension générale du déroulement du jeu. En effet, il apparaît que les individus plutôt coopératifs parviennent à comprendre rapidement les intentions de l’autre (après 10 jeux) alors que les individus opportunistes n’y parviennent pas, même après de nombreux jeux 63. Comment expliquer cela ? L’explication avancée s’appuie sur un phénomène classique qualifié « d’erreur attributionnelle projective » qui consiste à supposer que les autres sont en général semblables à soi-même dans leurs réactions. Un individu coopératif supposera donc que les autres sont a priori coopératifs ; c’est l’expérience qui le détrompera, corrigeant ainsi cette erreur d’attribution initiale. Par contre, un individu agressif, qui supposera a priori que les autres individus sont également opportunistes, ne sera jamais détrompé. En effet, son comportement aura pour effet de susciter un comportement non coopératif chez les autres, le confortant dans son idée que le monde est ainsi fait. Des études ont confirmé que les individus coopératifs et les individus opportunistes avaient une vision du monde différente. Les individus coopératifs 60 61 62 63
Shafir et Tversky (1997). Dawes, McTavish et Shaklee (1977). Croyances d’un joueur concernant les intentions de l’autre joueur. Kelley et Stahelski (1970a).
Le décideur coopère plus qu’on ne le suppose
171
considèrent qu’il existe des gens coopératifs et des gens opportunistes. Au contraire, les individus opportunistes sont convaincus qu’il n’existe que des tempéraments agressifs 64, ce qui les conduit à adopter un comportement qui rend les autres méfiants et les incite à ne pas coopérer. En étant persuadés que la société est par nature compétitive, les individus opportunistes créent autour d’eux-mêmes un tel environnement. On a constaté par ailleurs que les individus coopératifs souhaitent généralement obtenir des informations sur les motivations d’autrui, contrairement aux individus opportunistes, qui supposent chez les autres des motivations identiques aux leurs 65. Ils font preuve également d’une meilleure compréhension de la structure du jeu que les individus opportunistes, tant dans les jeux à multiples intervenants que dans les jeux à deux personnes. De plus, les individus opportunistes et les individus coopératifs utilisent des critères différents pour évaluer les situations. Alors que les individus très opportunistes ont tendance à juger le comportement de joueurs coopératifs en terme de force et de faiblesse, le qualifiant de « naïf » et « sans but », les individus très coopératifs ont tendance à juger ce même comportement en terme de valeur morale, le qualifiant de « sincère », « juste » et « honnête » 66. Cette divergence d’interprétation est une source potentielle de malentendus.
2.1.3 La coopération dépend de la possibilité qu’ont les joueurs de communiquer entre eux Dans la plupart des jeux non coopératifs, la communication verbale et gestuelle n’est pas autorisée, les participants étant isolés les uns des autres. Or, dans la réalité, la communication est souvent possible. Il importe donc de comprendre son influence sur l’émergence de la coopération. Les théoriciens des jeux ont depuis longtemps introduit la problématique de la communication 67, considérant cette dernière uniquement sous l’angle de l’accumulation d’informations : communiquer, c’est transmettre une information considérée comme une ressource rare. Nous envisageons cependant le concept de communication sous un angle plus large, qui insiste sur l’intention communiquée, et non pas uniquement sur le contenu de l’énoncé luimême. Communiquer, ce n’est pas seulement acquérir de l’information, c’est aussi évaluer la pertinence de cette information et l’interpréter pour déceler l’intention d’autrui. Les études réalisées montrent qu’en règle générale, la communication verbale ou non-verbale favorise la coopération, dans les dilemmes du prisonnier à deux comme à plusieurs joueurs. Le niveau de coopération entre les individus passe de 54 % à 96 % quand la communication est rendue possible 68. Plusieurs hypothèses peuvent expliquer cet effet. La communication favoriserait l’échange d’informations 64 Kelley et Stahelski (1970b). 65 Eiser et Tajfel (1972). 66 Beggan, Messick et Allison (1988) ; Liebrand, Jansen, Rijken et Shure (1986). 67 Ainsi, récemment, de nombreux travaux ont étudié le rôle d’un tour de communication préalable entre les joueurs avant de commencer le jeu. Cette communication est dite peu coûteuse (cheap talk) car elle n’affecte pas directement les paiements du jeu. Elle conduit généralement à l’équilibre coopératif. 68 Insko, Schopler, Drigostas, Graetz, Kennedy, Cox et Bornstein (1993).
172
Le décideur face à l’autre : de l’opportunisme à la coopération
sur le jeu et la compréhension de l’atmosphère dans laquelle il se déroule ; elle réduirait l’incertitude concernant les choix futurs des autres participants, suscitant ainsi un climat de confiance ; enfin, dans le cas où les participants appartiennent à un groupe, elle augmenterait le sentiment d’identité et la cohésion du groupe, incitant ainsi les individus à accorder plus de poids au bien-être collectif qu’à leur propre bien-être. Il apparaît cependant que la possibilité de communiquer ne suffit pas en ellemême à engendrer un niveau de coopération accru et durable : le contenu des échanges verbaux doit porter sur le jeu et non pas sur des sujets sans aucun rapport avec lui. On observe un taux de défection de 31 % quand la discussion porte sur le dilemme, mais un taux de 76 % quand elle porte sur d’autres sujets 69. Ainsi, la coopération ne résulte-t-elle pas simplement de la communication, mais de l’intention coopérative qui se manifeste réellement à travers elle. De plus, au sein d’un groupe, pour que la communication favorise le maintien des biens communs de façon prolongée et efficace, il faut qu’elle soit associée à un retour d’information sur les performances du groupe 70. Enfin, bien que le renforcement du sentiment d’identité d’un groupe grâce à la communication verbale favorise la coopération, c’est surtout lorsque les membres du groupe prennent des engagements les uns vis-à-vis des autres que la coopération augmente véritablement 71. L’espoir d’une coopération mutuelle durable semble ici encore être l’une des motivations sous-jacentes de l’interaction stratégique des participants.
2.2
L’INDIVIDU EN SOCIÉTÉ : COOPÉRATION ET COMPORTEMENT DE GROUPE
Nombre de décisions interdépendantes concernent les individus en société : décisions à prendre au sein d’un groupe ou décisions impliquant plusieurs groupes distincts. Comme le suggère ci-dessus l’impact de la communication sur la coopération au sein d’un groupe, la dimension sociale du contexte d’un jeu est à prendre en compte pour comprendre la façon dont l’individu interprète les enjeux de la situation et les intentions des autres participants. C’est dans l’environnement social que se trouve l’origine principale de la coopération observée dans les décisions interdépendantes : l’appartenance à un groupe, le comportement de chacun au sein du groupe ainsi que les caractéristiques du groupe influencent de multiples manières le comportement de l’individu en matière de coopération, qu’il s’agisse de préserver son intérêt propre ou celui de son groupe.
2.2.1 L’individu dans le groupe L’individu appartenant à un groupe — famille, tribu ou nation, par exemple — est marqué par les normes et les valeurs propres à ce groupe. En matière de coopération, l’impact de l’appartenance au groupe sur son comportement variera selon sa culture 72 et notamment selon les normes qu’elle véhicule en matière d’individualisme ou 69 Dawes, McTavish et Shaklee (1977). 70 Jorgenson et Papciak (1981). 71 Kerr et Kaufman-Gilliland (1994). 72 La culture se réfère à des conventions et normes implicites, qui sont partagées par des individus et qui déterminent en partie leur comportement en société.
Le décideur coopère plus qu’on ne le suppose
173
de collectivisme. En comparant des individus de cultures différentes, on constate une propension à coopérer très variable dans un dilemme du prisonnier : ainsi, une étude montre que les étudiants américains blancs sont moins coopératifs que les étudiants d’origine hispanique, afro-américaine ou asiatique 73. De même qu’il existe des personnes individualistes ou collectivistes, il existerait des cultures individualistes ou collectivistes, ces dernières visant à promouvoir les objectifs du groupe d’appartenance 74. Le groupe influe sur le degré de coopération non seulement à travers la culture qu’il véhicule mais aussi du fait de sa taille : dans les dilemmes du prisonnier à multiples intervenants, la coopération s’avère plus élevée dans les petits groupes que dans les groupes plus nombreux. Trois explications peuvent être avancées : – La théorie de la « pomme pourrie ». Il suffit de très peu d’individus non coopératifs au sein d’un groupe, voire d’un seul, pour décourager tous les autres de vouloir coopérer, surtout lorsque le jeu se répète. Si l’objectif final poursuivi par la coopération collective n’a aucune chance de se réaliser du fait de la noncoopération de quelques uns, alors il n’y a plus lieu de coopérer pour quiconque. Si l’on considère que dans tout groupe, il y a une proportion fixe d’individus susceptibles de ne pas coopérer, alors la probabilité qu’un groupe contienne de tels individus augmente avec la taille de ce groupe. Il suffit même que les gens soient persuadés que le nombre de « pommes pourries » augmente avec la taille du groupe pour que la non-coopération augmente de la même façon ! – Le sentiment d’importance. Plusieurs résultats expérimentaux montrent que les individus sont plus facilement prêts à se sacrifier pour le groupe si leur effort de coopération est essentiel ou fondamental à la réussite du projet collectif que si leur contribution leur paraît avoir un effet minime 75. L’efficacité personnelle dans ce type de jeu est perçue comme inversement proportionnelle à la taille du groupe 76. – L’existence d’une « désindividualisation ». Ce phénomène de la « désindividualisation » se produit quand l’identité et la responsabilité personnelles se diluent à l’intérieur d’un groupe 77. Dans ces conditions, les individus 73 Cox, Lobel et McLeod (1991). 74 Selon Triandis (1991), pour un individualiste, l’individu doit développer son jugement et sa personnalité, indépendamment de la pression sociale vers un plus grand conformisme. Les collectivistes privilégient les croyances, les attitudes et les valeurs partagées par le groupe. Dans les cultures collectivistes on observera donc un comportement extrêmement coopératif vis-à-vis des membres du groupe et très agressif vis-à-vis des autres. À l’inverse, dans les cultures où les objectifs individuels sont prioritaires, les individus coopéreront plus facilement avec des inconnus, leur faisant confiance s’ils partagent leurs valeurs, attitudes ou idéologies. Les individualistes n’établiront pas une distinction aussi marquée entre leur groupe d’appartenance et les autres groupes que les collectivistes. Ils pourront même appartenir à plusieurs groupes simultanément ou passer successivement d’un groupe à l’autre. Par conséquent les individus, selon qu’ils appartiennent à une culture collectiviste ou individualiste, auront des attentes et des présupposés différents concernant les conditions dans lesquelles s’établit la coopération. 75 Jorgenson et Papciak (1981) ; Samuelson, Messick, Rutte et Wilke (1984). 76 Kerr (1989) ; Rapoport, Bornstein et Erev (1989). 77 Hamburger, Guyer et Fox (1975).
174
Le décideur face à l’autre : de l’opportunisme à la coopération
sont moins inhibés par des comportements « égoïstes » ou « antisociaux ». Les mouvements de foule constituent une illustration classique de ce phénomène. Il est possible que la « désindividualisation » augmente avec la taille d’un groupe, dans la mesure où un individu peut apparaître plus anonyme dans un grand groupe que dans un petit groupe. Or, la coopération est inversement proportionnelle au degré d’anonymat 78 dans les dilemmes du prisonnier à multiples intervenants 79. D’une façon générale, néanmoins, on observe que les individus manifestent une plus grande volonté de coopérer avec les membres de leur propre groupe qu’avec les membres d’un autre groupe. Une explication possible serait l’activation des « schémas » 80 concernant les relations entre les membres d’un même groupe, schémas qui supposent ces relations fondées sur l’amitié, la politesse, la courtoisie et la volonté de coopérer. Plusieurs facteurs favorisant la coopération sont présents au sein des groupes sociaux, surtout si ceux-ci sont très soudés : la possibilité de communiquer, l’accessibilité des informations concernant le caractère plus ou moins coopératif des autres dans le passé, la confiance dans les membres du groupe, le sentiment de responsabilité quant au bien-être collectif ainsi que la conscience d’une identité propre au groupe 81. Si effectivement l’appartenance à un groupe favorise la coopération au sein du groupe, que dire des conséquences au niveau des relations qui se créent entre les groupes ?
2.2.2 La coopération entre les groupes L’émergence de la coopération entre individus d’un même groupe conduit paradoxalement à favoriser la compétition au sein de la collectivité. Le développement de la coopération entre deux individus s’appuie généralement sur l’espoir d’une coopération mutuelle à long terme et conduit à la constitution d’un groupe social embryonnaire 82. Lorsque ce processus s’étend à un plus grand nombre d’individus, un véritable groupe social se crée, à l’intérieur duquel se développe un niveau de coopération élevé, sous l’influence des normes du groupe et de la pression qu’il exerce. Or la formation de groupes clairement identifiés incite à la rivalité à un niveau plus global. En effet, l’appartenance à un groupe oriente le comportement des individus de deux façons. D’une part, elle conduit à privilégier les membres de son groupe et à être peu enclin à coopérer avec les individus extérieurs à ce groupe. Cette non-coopération favorise les relations hostiles entre les groupes, rendant encore moins probable l’émergence de la coopération. D’autre part, elle conduit l’individu à adopter des stratégies visant principalement à maximiser la différence avec les personnes extérieures à son groupe, même s’il en résulte un bénéfice réduit pour les membres de son 78 Ce résultat peut être relié à la possibilité de tricherie. Quand le groupe est petit, chacun peut observer l’autre, le comportement déviant est aussitôt repéré et sanctionné. Quand le groupe est grand, les individus sont anonymes et la tricherie peut rester cachée. 79 Fox et Guyer (1978) ; Kahan (1973). 80 Attentes ou croyances acquises relatives au déroulement attendu d’un événement. 81 Messick et Brewer (1983). 82 Rabbie (1991).
Le décideur coopère plus qu’on ne le suppose
175
groupe 83. La volonté de renforcer la distinction entre son propre groupe et les autres est en effet un moteur important du comportement de l’individu affilié à un groupe ; plus la cohésion du groupe est forte et plus la compétitivité se renforce. C’est pourquoi il ressort de nombreux dilemmes du prisonnier expérimentaux que les relations entre groupes ont tendance à être plus compétitives et moins coopératives que les relations entre individus. Ce phénomène de « discontinuité », très robuste puisqu’on l’observe dans une grande variété de conditions expérimentales 84, pourrait s’expliquer, comme ci-dessus, par l’existence des « schémas » concernant les groupes. En effet, les individus ont généralement tendance à considérer que les groupes auxquels ils n’appartiennent pas sont agressifs et dominateurs ; par conséquent, ils s’en méfient ou en ont peur, ce qui se traduit par un degré de coopération moindre que celui dont ils feraient preuve s’ils étaient confrontés à la même situation, face à des joueurs pris isolément 85. Comment, dans ces conditions, parvient-on donc à faire coopérer les groupes entre eux, pour arriver à une coopération au niveau de groupes sociaux élargis, voire d’une société dans son ensemble ?
3. Comment établir les bases d’une coopération stable et durable La question d’une coopération stable se pose tant au niveau des relations entre les groupes qu’au niveau des relations entre les individus. Outre la mise en avant d’objectifs communs, qui s’avère un moyen efficace pour instituer la coopération entre les groupes, l’intervention d’un médiateur ou le recours à la négociation sont des approches à privilégier pour établir les bases d’une coopération durable entre des groupes ou des individus.
3.1
LA MISE EN AVANT D’OBJECTIFS COMMUNS
Une expérience célèbre a permis de montrer comment la proposition d’objectifs communs très motivants permet d’instituer la coopération entre des groupes rivaux 86. Dans une colonie de vacances, les enfants, des garçons d’environ douze ans, furent répartis en deux groupes de façon aléatoire. Dans un premier temps, un climat conflictuel d’hostilité fut créé, sur une période de quinze jours, par le biais de jeux à caractère compétitif, dont seule l’une des équipes pouvait sortir gagnante. Les résultats des jeux étaient proclamés publiquement et leur importance soulignée par les expérimentateurs. Au bout de quinze jours, on pouvait observer que les conflits entre les deux groupes étaient devenus très violents : les groupes s’identifiaient par des noms et des symboles qui leur étaient propres, ils évitaient tout contact avec les membres de l’autre groupe et se comportaient de façon hostile, même dans les situations ne présentant aucun caractère de compétition. Dans un second temps, les expé83 84 85 86
Good (1991). Schopler et alii (1991, 1994). Insko et alii (1993). Sherif, Harvey, White, Hood et Sherif (1954).
176
Le décideur face à l’autre : de l’opportunisme à la coopération
rimentateurs tentèrent en vain de réduire l’intensité du conflit en faisant appel à des considérations morales ou en faisant participer les deux groupes en même temps à des occupations agréables, comme une séance de cinéma, par exemple. Ce n’est qu’en faisant travailler les deux groupes avec un même objectif à plusieurs reprises qu’on parvint à réduire le conflit et à établir la coopération entre eux. On leur demanda par exemple de réparer ensemble le système d’approvisionnement en eau, ou de sortir ensemble de l’ornière la voiture contenant tous les vivres de la colonie. D’autres études corroborent ces résultats et montrent que c’est la mise en avant d’objectifs communs très motivants qui favorise la coopération entre les groupes, incitant ainsi chacun à réaliser que l’appartenance au sous-groupe n’est plus pertinente dans ce nouveau contexte. Ce phénomène ne se produit cependant que dans la mesure où la collaboration entre les membres des deux groupes débouche sur un succès : en cas d’échec, on s’aperçoit que l’animosité entre les groupes est renforcée, chacun attribuant la responsabilité de l’échec à l’autre groupe !
3.2
L’INTERVENTION D’UN TIERS
Il est des cas où la mise en avant d’objectifs communs motivants est impossible, voire dangereuse. En effet, il n’est pas toujours judicieux de reporter le sentiment d’appartenance à un groupe au niveau supérieur et de déplacer ainsi les conflits vers des entités plus importantes telles que, par exemple, les nations. Comment dans ce cas amener les groupes à coopérer entre eux ? Sans avoir recours à la coercition ou à des principes d’ordre éthique, comme le font les hommes politiques ou les responsables d’organisations, il est possible de faire appel à des mécanismes favorisant la coopération et de mettre en place des structures à cet effet. L’intervention d’un tiers extérieur, agissant comme médiateur, facilite non seulement le processus menant à la coopération mais garantit également la confiance mutuelle des parties. Ce tiers peut intervenir sous des formes diverses. Si c’est l’appareil judiciaire qui tient le rôle du tiers, l’accord de coopération prendra la forme d’un contrat. En cas de rupture de l’accord, cependant, deux problèmes se posent : un problème monétaire — coût de l’action en justice — et un problème d’observabilité — preuve de la tricherie. La garantie de la coopération peut également prendre la forme d’un serment, auquel cas les deux parties font appel à un tiers chargé de les sanctionner violemment en cas de non-respect de leur parole — un tueur à gages ou une divinité ! Dans le cas d’un jeu répété, c’est la réputation qui peut jouer le rôle du tiers : la réputation, bonne si l’individu n’a jamais triché et souillée à jamais s’il a déjà triché au moins une fois, peut déterminer l’action future du ou des autres individus et constituer en soi le moteur de la coopération réciproque. L’efficacité de tous ces arrangements provient du fait qu’ils introduisent dans le jeu un tiers qui n’obéit pas au calcul de l’intérêt. Il s’ensuit la création d’un espace social qui, échappant à la logique des relations stratégiques, rend la confiance possible 87. C’est du moins l’analyse théorique du rôle des tiers. Mais on observe dans la pratique une autre forme d’intervention des tiers, consistant à agir comme médiateur dans une négociation, en aidant à identifier des terrains d’entente pour les deux parties. En effet, bien souvent les tiers, extérieurs au conflit, sont dans une position privilégiée pour en comprendre les données et les 87 Orléan (1994a).
Le décideur coopère plus qu’on ne le suppose
177
enjeux, ce qui leur permet d’intervenir de façon judicieuse et de faciliter la communication entre les parties.
3.3
LA NÉGOCIATION
Un comportement coopératif reste fragile : en effet, quand un différend oppose des groupes ou des individus et que les parties finissent néanmoins par aboutir à un accord, cela n’implique pas nécessairement la résolution du conflit. Ce n’est pas un cessez-le-feu qui fait disparaître la haine qui caractérise les relations entre les parties : le changement intervenu grâce à la coopération caractérise le comportement, non pas les attitudes ! Par contre, si les parties parviennent à se mettre d’accord sur plusieurs différends, alors il apparaît qu’une coopération durable et solide, ancrée dans les attitudes et non plus seulement dans les comportements, puisse résulter d’une négociation. Il est primordial cependant que l’objectif soit d’intégrer les désirs des parties dans une solution véritablement satisfaisante pour tous. En effet, dans un conflit, le problème est souvent posé de telle sorte que les intérêts des parties apparaissent totalement divergents. L’anecdote qui suit illustre l’importance de bien comprendre la véritable nature des enjeux impliqués dans un conflit : c’est la condition indispensable pour pouvoir reformuler le problème de façon à inscrire les intérêts propres de chacun dans une solution collectivement intéressante 88. Deux sœurs désirent ardemment une même orange. Elles acceptent à contrecœur de partager celle-ci en deux moitiés égales. Or on s’aperçoit après coup que l’une des sœurs mange la pulpe et jette la peau, tandis que l’autre jette la pulpe et utilise le zeste de la peau pour parfumer un gâteau. La solution de partage adoptée, bien qu’équitable, n’était donc pas optimale : si les deux sœurs avaient exprimé au préalable leurs intentions et leurs besoins réels, elles auraient pu se mettre d’accord sur un partage plus judicieux de l’orange, l’une conservant toute la pulpe et l’autre toute la peau, une solution « intégrative » ! En effet, il existe trois façons différentes de résoudre les conflits : la domination, le compromis et l’intégration. La domination se traduit par la victoire inconditionnelle d’une partie sur l’autre, solution simple mais fragile à long terme. Le compromis résulte de l’abandon par chacun d’une partie de ses revendications ; cette solution, peu satisfaisante psychologiquement puisqu’elle implique une abdication, ne permet en outre pas de prendre exactement la mesure des désirs de l’autre. Le compromis débouche sur des solutions évidentes mais pas optimales, telle que celle qui fut adoptée par les deux sœurs. L’intégration par contre aboutit à une situation bien meilleure, plus stable également : les désirs des deux parties sont intégrés sans qu’aucune n’ait eu à faire de concession. Chacun y trouve son compte et obtient une « part de gâteau » finalement plus grosse que prévue ! Cette approche exige de faire preuve d’inventivité et d’éviter d’envisager les solutions en termes d’options mutuellement exclusives. L’intervention d’un tiers, pour les raisons évoquées précédemment, facilite généralement le processus de négociation et augmente les chances de parvenir à un accord. C’est la raison d’être d’instances internationales comme l’ONU ou de cabinets conseil intervenant lors de réorganisations au sein des entreprises ; leur rôle est d’aider les parties à structurer le problème, à traiter l’information et à évaluer les 88 Fisher et Ury (1981) ; Follett (1940).
178
Le décideur face à l’autre : de l’opportunisme à la coopération
TABLEAU 3 – Pour négocier de façon rationnelle a
• Principe 1 : Déterminez à l’avance ce que vous ferez si vous ne parvenez pas à un
• • • •
•
•
•
accord avec votre adversaire. S’il s’agit d’acheter une voiture neuve, vous pouvez décider de vous rabattre sur une voiture d’occasion. Tout accord préférable à cette option alternative vaudra mieux que votre situation actuelle. Principe 2 : Envisagez ce que fera votre adversaire si vous ne parvenez pas à un accord commun. Il est important de prendre la mesure de sa marge de manœuvre. Principe 3 : Évaluez la nature réelle du problème de fond. Il est indispensable d’être capable de distinguer les positions exprimées des intérêts réels des parties. Principe 4 : Évaluez l’importance de chacun des éléments du problème pour vous. Vous pourrez ainsi faire des concessions sur des points mineurs pour obtenir satisfaction sur des points plus importants. Principe 5 : Évaluez l’importance de chacun des éléments du problème pour votre adversaire. Cela vous permettra d’identifier les informations qui vous manquent et de chercher à les obtenir dans le courant de la négociation. Ainsi vous aurez une vision plus claire des possibilités d’intégration et de la répartition optimale entre les parties. Principe 6 : Évaluez une zone de solutions acceptables. Un vendeur et un acheteur pourront marchander à l’intérieur d’une fourchette déterminée par le prix maximum d’achat acceptable pour l’acheteur et le prix minimum de vente acceptable pour le vendeur. Autant discuter de solutions « réalistes » plutôt que de négocier hors de la fourchette acceptable pour les deux parties. Principe 7 : Identifiez les compromis possibles. En sachant déterminer les préférences de chacune des parties, on rend possible une négociation intégrative, où les tractations sont profitables pour tous ; il en résulte des ententes de meilleure qualité et une relation mutuelle plus solide à long terme. Principe 8 : Évaluez dans quelle mesure vous et votre adversaire êtes susceptibles d’être sujets aux biais classiques des négociateurs. Vous serez ainsi plus à même de vous en prémunir ou d’en tirer parti.
Enfin, derniers conseils pour terminer : • Instaurez un climat propice aux émotions positives, car cela favorise les comportements généreux et la créativité ! • Assurez-vous que la solution adoptée soit perçue comme équitable pour ne pas saboter les relations à long terme. a. d’après Bazerman et Neale (1992).
options pour mettre en évidence la nature des intérêts individuels et la possibilité de les intégrer dans une solution réellement satisfaisante pour tous. Cependant, lorsqu’un conflit atteint un seuil critique, le processus de négociation peut s’avérer délicat. Il nécessite un minimum de préparation et de communication préalables et s’inscrit dans la durée. Il est par ailleurs sujet à des erreurs systématiques 89, liées aux 89 Deux biais sont évoqués ici à titre d’exemple (voir le chapitre 2 pour plus de détails sur ce point). Le phénomène de cadrage : il vaut mieux présenter une option comme un gain plutôt qu’une perte et éviter de prendre comme référence la position d’un adversaire. Ainsi, on augmente ses propres chances de succès en adoptant une formulation du type « un montant Y correspond à Z de plus que ce que vous avez maintenant » plutôt qu’une formulation du type « je sais que vous voulez obtenir X mais je ne peux pas vous accorder plus que Y ». L’excès de confiance en soi : ce biais omniprésent pollue le jugement et rend les individus trop optimistes, car ils surestiment leur degré de contrôle sur la situation. Il en résulte une attitude trop rigide et trop fermée à des compromis éventuels.
Le décideur coopère plus qu’on ne le suppose
179
biais cognitifs décrits au chapitre 2. Le tableau 3 propose quelques conseils utiles pour apprendre à négocier de façon rationnelle.
4. Conclusion L’analyse des processus psychologiques impliqués dans les décisions interdépendantes qui font l’objet de la théorie des jeux apporte un éclairage nouveau sur l’énigme de la coopération. En effet, la confrontation des résultats expérimentaux avec la théorie montre que les individus sont largement influencés dans leur comportement par de multiples facteurs liés au contexte de la décision, qu’il s’agisse des caractéristiques des éléments du jeu ou de l’environnement social. Même si les mécanismes de la coopération ne sont pas à ce jour parfaitement identifiés, il est clair que les comportements de coopération ou de défection observés dans une décision interdépendante sont l’expression de motivations diverses, qui dépendent du contexte. Dans ces conditions, il devient donc difficile d’accepter l’idée d’une compétence des joueurs qui serait universelle et donnée une fois pour toutes, comme le soutiennent la théorie des jeux et l’analyse néoclassique dans son ensemble : il existe, de manière évidente, une pluralité des façons de se comporter en société. La rencontre de l’économie et de la psychologie, au travers des jeux expérimentaux, témoigne du refus de s’enfermer dans un modèle unique de la décision interactive. Cette ouverture pourra être interprétée, selon les points de vue, comme la manifestation d’une prudence légitime de la part d’une théorie à prétention hégémonique ou comme le signe d’un renouveau de la théorie du choix rationnel.
o`qshd?RM?k\? "¦ ›‹?fi¡· L¡ ¡? ¡?fi\ ¡‒? ·? "¦ ¡·‒¹^ ?
?? c¡?a›¡¦¤?t‹ ¡‒
"? ?l" ⁄› ¡ ?E?q¡¦⁄¡‒¦⁄¡ ?
QOOTNP? fi\£¡ ?PWP?Ÿ?PWQ hrrm?
LLLLLLLLLLLLLLLLLLLLLLLLLLLLLLLLLLLLLLLLLLLLLLLLLLLLLLLLLLLLLLLLLLLLLLLLLLLLLLLLLLLLLLLLLLLLLLLLLLLLLLLLLLLLLLLLLLLL `‒ ¦ ¡?
fi›‹
¡?¡‹? £‹¡?Ÿ? F\ ‒¡
⁄ fiYNN•••M¦\ ‒‹M ‹¢›N \L ¡¦
¡Y
›‹L·‹¡L\fifi‒›¦⁄¡Lfi ·‒
¦ fi ‹\ ‒¡LLXVWQWOSPSWVQOLfi\£¡LPWPM⁄ «
LLLLLLLLLLLLLLLLLLLLLLLLLLLLLLLLLLLLLLLLLLLLLLLLLLLLLLLLLLLLLLLLLLLLLLLLLLLLLLLLLLLLLLLLLLLLLLLLLLLLLLLLLLLLLLLLLLLL LLLLLLLLLLLLLLLLLLLLLLLLLLLLLLLLLLLLLLLLLLLLLLLLLLLLLLLLLLLLLLLLLLLLLLLLLLLLLLLLLLLLLLLLLLLLLLLLLLLLLLLLLLLLLLLLLLLL o›·‒?¦ ¡‒?¦¡ ?\‒ ¦ ¡?Y ??Ao`qshd?RM?k\? "¦ ›‹?fi¡· L¡ ¡? ¡?fi\
¡‒? ·? "¦ ¡·‒¹^AK?l" ⁄› ¡ ?E?q¡¦⁄¡‒¦⁄¡ K??QOOTNP??fiM?PWPLPWQM
LLLLLLLLLLLLLLLLLLLLLLLLLLLLLLLLLLLLLLLLLLLLLLLLLLLLLLLLLLLLLLLLLLLLLLLLLLLLLLLLLLLLLLLLLLLLLLLLLLLLLLLLLLLLLLLLLLLL
c
‒ · ›‹?" ¡¦ ‒›‹ fl·¡?b\ ‒‹M ‹¢›?fi›·‒?c¡?a›¡¦¤?t‹ ¡‒
Å?c¡?a›¡¦¤?t‹ ¡‒
"M?s›· ? ‒›
"M
?‒" ¡‒ " ?fi›·‒? ›· ?fi\„ M
k\ ‒¡fi‒› ·¦ ›‹ ›· ‒¡fi‒" ¡‹ \ ›‹ ¡ ¦¡ \‒ ¦ ¡K ‹› \««¡‹ fi\‒ fi⁄› ›¦›fi ¡K ‹F¡ \· ›‒ "¡ fl·¡ \‹ ¡ « ¡ ¡ ¦›‹ ›‹ £"‹"‒\ ¡ F· \ ›‹ · ¡ ›·K ¡ ¦\ "¦⁄"\‹ K ¡ ¦›‹ ›‹ £"‹"‒\ ¡ ¡ \ ¦¡‹¦¡ ›· ¦‒ ¡ fi\‒ › ‒¡ "\ ¡«¡‹ M s›· ¡ \· ‒¡ ‒¡fi‒› ·¦ ›‹ ›· ‒¡fi‒" ¡‹ \ ›‹K ¡‹ ›· ›· fi\‒ ¡K ›· fl·¡ fl·¡ ¢›‒«¡ ¡ ¡ fl·¡ fl·¡ «\‹ !‒¡ fl·¡ ¦¡ › K ¡ ‹ ¡‒ ¡ \·¢ \¦¦›‒ fi‒"\ \ ¡ ¡ "¦‒ ¡ F" ¡·‒K ¡‹ ¡⁄›‒ ¡ ¦\ fi‒" · fi\‒ \ "£ \ ›‹ ¡‹ £·¡·‒ ¡‹ e‒\‹¦¡M h ¡ fi‒"¦ " fl·¡ ›‹ ›¦¤\£¡ \‹ ·‹¡ \ ¡ ¡ ›‹‹"¡ ¡ "£\ ¡«¡‹ ‹ ¡‒ M¹¹¹¹¹¹¹¹¹¹¹¹¹¹¹¹¹¹¹¹¹¹¹¹¹¹¹¹¹¹¹¹¹¹¹¹¹¹¹¹¹¹
PARTIE 3
La décision peut-elle se passer du décideur ?
SOMMAIRE Chapitre 7
Chapitre 8
Chapitre 9
La résignation du décideur devant la décision collective
183
Le décideur sous influence : l’émergence de la décision collective
211
Décideurs et organisations : dans les coulisses de la décision collective
235
182
La décision peut-elle se passer du décideur ?
INTRODUCTION À LA TROISIÈME PARTIE Alors que les deux parties précédentes considéraient le seul décideur individuel dans un environnement plus ou moins complexe, nous nous tournons dans cette partie vers le versant collectif de la décision. C’est-à-dire la décision prise par un groupe, une organisation ou un État. Puisqu’il s’agit d’une décision prise collectivement, le choix individuel n’apparaît plus comme fondamental. Le décideur individuel se dissout dans le choix collectif. Mais à quelles conditions ce décideur individuel accepte-t-il de s’effacer au profit du collectif ? C’est là le point crucial, la question pivot des trois chapitres que comporte cette partie. Dans le chapitre 7, l’économie aborde le problème de façon normative, en recherchant les conditions qui font qu’un décideur rationnel accepte de déléguer son pouvoir de décision à un collectif. Cette quête aboutit à une impossibilité : pour l’économie, à l’exception notable du marché, un choix collectif est toujours un choix imposé aux décideurs individuels. Mais pas de n’importe quelle manière puisque la décision s’appuie sur des critères d’efficacité collective d’une part et d’équité d’autre part. Critères que les décideurs individuels ne peuvent évidemment appréhender. Contrairement au chapitre précédent, le chapitre 8 ne considère pas le groupe comme une entité extérieure, indépendante du décideur individuel. Groupe et individus sont en effet intimement liés car le groupe « formate » l’individu qui, lui même, participe à la consolidation du groupe. De cette interaction permanente, il résulte des ciments tels que des normes, des cultures spécifiques au groupe. Dans un tel contexte où la décision est construite par le groupe, la distinction entre décision individuelle et décision collective n’est plus pertinente : le décideur individuel ferait les mêmes choix que le groupe… et réciproquement. Le chapitre 9 aborde la question à partir de l’organisation. Celle-ci, en tant que système, accomplit un certain nombre d’actions. Mais ces actions sont-elles l’aboutissement d’une décision ? Et, si tel est le cas, comment est prise cette décision ? En d’autres termes, ce chapitre s’intéresse à l’articulation entre les modèles du comportement individuel et la théorie de l’organisation. Et, au sein de cette articulation, le décideur individuel, soumis à des règles contraignantes et à la concurrence des autres décideurs, perd peu à peu de son « pouvoir de décision » au profit de mécanismes de choix opportuns, aléatoires ou chaotiques. Ainsi, le cheminement de cette troisième partie nous mène d’une décision sans véritable décideur à une « décision sans véritable décision ».
Chapitre 7
La résignation du décideur devant la décision collective Philippe ABECASSIS
Sommaire 1 L’agrégation des préférences individuelles
185
2 La théorie du choix social
198
3 Choix collectif et déviances stratégiques
205
4 Conclusion
209
184
La décision peut-elle se passer du décideur ?
Dans le cadre de la décision individuelle, l’approche utilitariste retenue par l’économie ne s’intéresse qu’aux seules conséquences du choix sur l’objectif du décideur, formalisé par ses gains. La décision optimale est alors celle qui apporte le gain le plus élevé au décideur. Il n’est pas possible d’étendre ce raisonnement au cadre collectif, de personnifier la Collectivité 1. En effet les décisions collectives ne peuvent pas seulement être optimales pour le tout, elles doivent l’être aussi pour les parties, c’est-à-dire les individus qui la composent. Si tel n’est pas le cas, la Collectivité risque la dissolution. Ainsi, le choix collectif (le choix de la Collectivité) se distingue du choix individuel car il doit répondre à deux objectifs qui peuvent être contradictoires. Au travers de la notion de marché, l’économie s’est tout naturellement et très rapidement intéressée aux difficultés qu’engendre ce double objectif. Le marché « décide » en effet d’un prix et d’une quantité qui s’imposent à chacun. Et chacun s’attend à ce que le marché prenne la « meilleure » décision, c’est-à-dire celle qui optimise les gains de tous, tant individuellement que collectivement 2. Mais comment une décision qui s’impose à tous peut-elle satisfaire chacun ? Dans une approche normative visant à montrer que le marché offrait une règle optimale, l’économie a proposé des éléments de réponse par une analyse en deux étapes. Elle a recherché dans un premier temps les conditions dans lesquelles les décideurs individuels acceptent de déléguer leur pouvoir au collectif. Elle a donc du, pour ce faire, analyser les différentes règles d’expression et d’agrégation de ces préférences individuelles (section 1). Dans un deuxième temps, en supposant que ces conditions étaient respectées, que la règle de choix était définie et acceptée 3, l’économie a alors recherché le comportement collectif optimal (section 2). L’efficacité d’un tel programme repose implicitement sur l’unité du choix collectif. Si la Collectivité se démultiplie involontairement, plusieurs choix contradictoires peuvent en émaner et la décision n’est plus optimale. Des déviances de comportement de la collectivité telles que la prévarication 4 peuvent être analysées au travers de cette grille : en agissant pour son propre compte, une entité déviante (le prévaricateur) crée une dissonance dans l’unité de la Collectivité. Certains indivi1 Le terme « Collectivité » avec une majuscule, doit être entendu ici au sens le plus large, c’est–à– dire comme une institution cohérente, formelle ou non, chargée collectivement de représenter les individus au mieux de leurs intérêts et de l’intérêt collectif. Des formes collectives particulières, telles que l’État, le groupe social, l’entreprise, etc., seront introduites ultérieurement. 2 C’est bien ce à quoi aboutit le marché, selon les théorèmes du « bien-être » (voir section 2 de ce chapitre). 3 Il convient de remarquer que ces conditions dépendent du contexte. Souvent, dans les entreprises, les stratégies industrielles ou commerciales –dont dépend la pérennité de l’entreprise– sont élaborées à l’aide de règles strictes et complexes comme l’unanimité, la majorité, la majorité qualifiée, etc. La règle est alors coûteuse en temps (celui qu’il faut pour contacter tous les votants, dépouiller les bulletins…) et en argent (déplacements, courriers). Les décisions quotidiennes de fonctionnement sont, quant à elles, assumées par des règles bien moins coûteuses comme une règle dictatoriale (c’est le « chef » qui décide), une convention, une habitude, une culture, une routine, etc. 4 La prévarication est le résultat d’un comportement calculé permettant à un individu, par manquement aux devoirs de sa charge, d’accroître ses gains individuels. Le terme « prévarication » sera préféré au terme de « corruption » car, contrairement à la « corruption », il n’associe d’une part aucune condamnation morale au comportement déviant, il ne se réfère jamais, d’autre part, à la notion de légalité.
La résignation du décideur devant la décision collective
185
dus profitent alors de cette occasion pour détourner la règle en faisant émerger leur propre intérêt. Si un tel comportement se multiplie, le choix collectif, dont la règle garantissait la cohérence, n’est plus en mesure d’assurer simultanément l’optimum du collectif et l’optimum de chacun (section 3).
1. L’agrégation des préférences individuelles 1.1
L’IDÉAL COLLECTIF
Du point de vue de l’économie, le meilleur choix collectif –celui qui optimise les gains du tout et des parties simultanément– est obtenu lorsqu’il est effectué sans aucune contrainte ni pression sur les individus, c’est-à-dire lorsqu’il coïncide parfaitement avec les choix individuels. Pour aboutir à ce choix idéal, l’économie 5 a montré que la règle d’agrégation des préférences individuelles devait respecter six propriétés : 1. Anonymat. Le vote 6 doit être anonyme : chacun doit être libre de voter comme bon lui semble, en fonction de ses propres intérêts individuels, sans aucune pression ni explicite ni implicite. Les procédures de vote à main levée, pourtant généralement jugées « démocratiques » et couramment utilisées (par exemple à l’Assemblée Nationale) violent manifestement cet axiome en connaissance de causes. 2. Neutralité. Le vote doit être neutre : le fait de changer le nom d’une alternative et/ou d’un candidat ne doit modifier ni le comportement individuel ni le comportement collectif. De ce fait, aucune alternative ou candidat ne doit pouvoir être favorisé par le système de vote. Cet axiome constitue souvent un argument publicitaire : on fait goûter trois produits différents X, Y et Z à plusieurs personnes en leur cachant tout signe de différenciation (ce qui garantit la neutralité du vote) afin de déterminer le « meilleur ». Si le choix se porte à l’unanimité sur le produit X, l’expérience devient une preuve irréfutable de la bonne qualité de ce produit. A contrario, les élections de personnes ne respectent jamais cet axiome de neutralité puisque le physique, le charisme des candidats (la voix, le passé personnel, etc.), sont autant de facteurs de différenciation qui peuvent modifier le comportement individuel des votants. En vertu du non-respect de cet axiome, un candidat X, avec un programme connu de tous, pourrait indifféremment être élu contre un candidat Y ou battu par la femme de Y, alors que les programmes de Y et de sa femme sont identiques et eux aussi connus de tous. Un tel phénomène pourrait être expliqué, par exemple, par le fait que Y est petit avec une voix fluette alors que sa femme est grande et sa que voix porte loin. 5 Principalement par la voix de K. Arrow (voir l’encadré 19 de ce chapitre). 6 On appelle « vote » toute procédure permettant de transmettre le choix d’un individu à une Collectivité.
186
La décision peut-elle se passer du décideur ?
3. Préordre et monotonie. Le vote doit être ordonnant et monotone : la procédure de vote doit aboutir à un classement des alternatives ou des candidats (le vote est ordonnant) et être sensible à la modification de comportement d’un seul votant (le vote est monotone). Dans la pratique, la plupart des procédures de vote respectent ces propriétés, même si l’ordre n’a pas toujours d’intérêt. Il en est ainsi, par exemple de la sélection des candidats à un emploi. Imaginons une procédure de recrutement en deux étapes : le premier entretien sert de pré-sélection, le second détermine le choix de l’entreprise. Si 20 candidats sont retenus par la présélection, ils seront alors classés (explicitement ou implicitement) à l’issue de cette première étape. Supposons qu’un candidat médiocre au premier entretien améliore sa prestation au cours du second entretien et gagne les faveurs de l’un des votants sans changer celles des autres. L’axiome de monotonie sera vérifié si ce candidat gagne au moins une place dans le classement final. Quoiqu’il en soit, puisque le vote est ordonnant, un seul candidat est choisi à l’issu de la seconde étape. Peu importe alors pour les autres de savoir qu’ils étaient 12e, 20e ou 2e. 4. Non-manipulabilité. Le vote doit être indépendant vis-à-vis de l’extérieur : la modification d’une caractéristique indépendante des alternatives (ou des candidats), comme la suppression de l’une d’entre elles, ne modifie pas le classement final. La manipulation des votes est chose commune. Pour le montrer, considérons l’exemple suivant : à l’issu de la première étape de la procédure de recrutement décrite précédemment, il reste trois candidats en lice, C1, C2, C3. Le premier candidat (C1) a fait meilleure impression que les autres. Toutefois, le candidat C3 a la préférence d’un électeur. Afin de favoriser son candidat, cet électeur proposera un classement faisant apparaître C3 en tête et le protégera en plaçant C1 en dernière position. Si C3 n’est pas élu, C1 risque de ne pas l’être non plus à cause de la présence de C2. Le classement final peut donc être modifié en fonction d’une caractéristique indépendante des candidats : leur nombre. Le vote est alors manipulé. 5. Absence de dictature. Le vote ne doit pas être dictatorial : aucun votant ne peut être assuré a priori que son choix sera celui de la Collectivité. Ainsi, lorsqu’un électeur détient plus de 50 % des voix dans une procédure majoritaire, cet électeur est un dictateur puisque aucun autre individu ni même un groupe d’individus ne peuvent changer la décision : le vote est inutile puisque le résultat est connu d’avance. La terminologie financière ne s’y trompe pas : lorsqu’une entreprise, un individu ou un État détient plus de 50 % des parts (des droits de décision) d’une autre entreprise, il y a « prise de contrôle » de cette entreprise. 6. Optimalité parétienne. Le vote doit être Pareto–optimal : si la satisfaction collective est représentée par la somme des satisfactions individuelles, cette satisfaction collective ne peut jamais être améliorée au détriment d’un des membres de la collectivité. Les procédures de vote à la majorité, entre autres, respectent cette propriété puisque même si une partie des votants — la minorité — ne maximise pas sa
La résignation du décideur devant la décision collective
187
satisfaction, aucune autre alternative que celle choisie par la majorité ne peut mener à une satisfaction globale supérieure. À la lumière de ces propriétés, si l’on recherche la meilleure procédure de vote, c’est l’unanimité qui vient immédiatement à l’esprit 7. Cette procédure est effectivement neutre, ordonnante, monotone et Pareto–optimale. Malheureusement, elle n’est pas nécessairement anonyme et, surtout, elle peut facilement se transformer en dictature. Il suffit pour cela qu’un individu vote contre tous les autres. Pour cette raison, mais surtout parce que l’unanimité est une procédure peu opératoire et coûteuse, cette procédure est peu utilisée. Wicksell a toutefois montré que sous certaines hypothèses concernant la procédure de choix budgétaire 8, la plupart des décisions portant sur les dépenses et recettes publiques peuvent être obtenues par des accords unanimes. Ce résultat est obtenu à une double condition. En supposant d’une part que les actions publiques améliorent nécessairement le bien-être collectif. En respectant, d’autre part, le droit de chacun à ne pas financer un bien public qu’il n’utilise pas. Dans ces conditions, si le budget propose que la dépense publique soit financée par les seuls individus qui gagneront plus à utiliser le bien public qu’ils ne dépensent pour le financer, alors il obtiendra l’unanimité. L’équilibre de Lindhal est basé sur le même principe : il est possible de trouver un niveau optimal de taxation publique (l’équilibre) en proposant à chaque individu la taxe qu’il est prêt à payer. La décision de financement public sera alors acceptée à l’unanimité. Pour comprendre cet équilibre de Lindhal, considérons un groupe d’amis qui se réunit à chaque anniversaire d’un de ses membres. Une fête est donnée pour l’occasion. Si chaque membre du groupe trouve un intérêt à ces fêtes et à leur perpétuation, chacun y contribuera volontairement au prorata de cet intérêt. La procédure adoptée consiste à nommer un organisateur extérieur au groupe chargé de réunir les fonds nécessaires à la préparation de la fête 9. L’organisateur propose différentes alternatives, correspondant à différents budgets. Si parmi les différentes propositions de l’organisateur, une alternative correspond exactement à ce que chacun était prêt à payer, celle-ci est alors acceptée à l’unanimité. Lindhal a montré que cette alterna7 Il faut remarquer avec Feddersen et Pesendorfer (1998) que l’unanimité peut aussi, dans certains cas, être la pire des procédures. Notamment lorsque la règle s’applique à un juré d’assise et que l’objectif recherché est de minimiser la fréquence des erreurs judiciaires du type « condamner un innocent ». 8 Les deux principales conditions sont, selon Wicksell (1896) : - Les dépenses et les recettes sont indissociables, on ne peut donc décider d’une dépense sans décider des recettes qui la financeront. - Il ne s’agit pas de décider si telle dépense doit être engagée ou non mais de déterminer comment cette dépense sera financée. Les alternatives du choix sont donc tous les modes de financement possible de la dépense. Celle-ci n’est refusée que dans le cas où aucune alternative ne fait l’unanimité. 9 On supposera, pour respecter les conditions de l’équilibre de Lindhal, que la fête peut être organisée à n’importe quel prix, seul l’éclat de la fête s’en ressent, et, avec lui, la satisfaction des membres du groupe.
188
La décision peut-elle se passer du décideur ?
tive, appelée équilibre de Lindhal, existe toujours puisque l’organisateur propose tous les financements possibles. À l’exception de ces quelques situations particulières, la règle de l’unanimité aboutit invariablement à la dictature de l’un ou l’autre des protagonistes ou à la paralysie de la décision collective. Il est donc nécessaire de proposer d’autres règles de décision collective, sans doute moins « parfaites » au regard des axiomes énumérés plus haut. Il existe trois alternatives à la règle de l’unanimité, et, pour chacune, une infinité de variantes. 1. La règle de la dictature. Celle-ci ne diffère pas considérablement de la règle de l’unanimité puisque l’unanimité aboutit finalement à une dictature. Toutefois, la dictature, où un individu décide pour la collectivité, ne peut être considérée comme une véritable règle de « décision collective » puisque les choix sont effectués par le dictateur, de façon discrétionnaires. 2. La règle de la majorité. Cette règle apparaît souvent comme une quasi–unanimité puisqu’elle prend en compte la satisfaction du plus grand nombre. La dictature est donc exclue. Mais en contrepartie, comme l’illustre l’exemple suivant, le vote n’est plus optimal. En effet, si à la suite d’un vote majoritaire, l’alternative A est choisie avec 7 voix contre 3 en attribuant un gain de 1 à tous les individus satisfaits (ayant voté A) et –1 à tous les insatisfaits, le gain collectif est de 7-3 = 4. Or, comparé à cette situation, il y a trois alternatives possibles pour lesquelles on observe à la fois un gain collectif supérieur à 4 et des gains individuels au moins égaux à ceux de la situation actuelle. Ce sont les situations dans lesquelles 8, 9 ou 10 individus sur 10 votent A. La satisfaction collective est alors, respectivement, de 6, 8 et 10 10. Outre cette imperfection, la règle de la majorité se heurte à la difficulté de trouver la « bonne » proportion d’individus qu’il faut retenir pour légitimer le vote. Intuitivement, il apparaît que cette proportion dépend de la nature de la décision à prendre. Ainsi, si la majorité absolue suffit à une décision d’ordre budgétaire, il faut souvent une majorité qualifiée (2/3 ou 3/4 des votants plus une voix), voire une unanimité pour une décision portant, par exemple, sur les libertés individuelles. Buchanan et Tullock ont proposé en 1962 une méthode normative permettant de déterminer cette proportion optimale en fonction de la nature de la décision. Pour ce faire, il est nécessaire d’utiliser le corpus axiomatique de l’économie et, en particulier, de considérer que les individus sont égoïstes et rationnels. Dans ces conditions, chaque individu est confronté à deux types de coûts. Les coûts externes, d’une part, sont induits par les décisions collectives auxquelles l’individu n’a pas souscrit mais qu’il subit d’autorité. Si, par exemple, une décision politique impose le couvre-feu à tous les jeunes de moins de 18 ans, ceux-ci subissent un préjudice. Une telle désutilité se traduit par un coût, que 10 Lorsque 8 individus votent A, 1 individu voit ses gains augmenter (de -1 à 1), le gain des autres ne change pas. Quant au gain collectif, il est de 8-2 = 6. On peut aisément étendre ce calcul aux cas où 9, puis 10 individus votent A.
La résignation du décideur devant la décision collective
189
l’on qualifiera d’externe. Les coûts internes sont liés, d’autre part, à la procédure de décision elle-même. Celle-ci est coûteuse car elle engendre des désutilités comme des pertes de temps, des recherches d’information, des négociations, etc. Lorsque les individus anticipent les coûts liés à une décision prise collectivement, chacun pense que ses coûts externes seront d’autant moins importants que leur choix sera partagé par un plus grand nombre de personnes. Ainsi, les coûts externes espérés diminuent lorsque la proportion d’individus retenue pour légitimer le choix augmente. À l’inverse, chacun sait qu’une unanimité sera coûteuse, parce que plus difficile à obtenir qu’une majorité qualifiée, ellemême plus coûteuse qu’une majorité simple, etc. Les coûts de décision anticipés augmentent donc avec la proportion d’individus retenue pour légitimer le choix. Un tel cadre permet de représenter n’importe quelle procédure de vote : la dictature (où le nombre d’individus nécessaires afin de légitimer le vote est égal à 1) est caractérisée par des coûts externes très élevés (voire infinis) et des coûts de décision nuls. A contrario, l’unanimité, considérée comme un idéal à atteindre, est caractérisée par des coûts externes nuls (puisque la décision est toujours choisie par tous) mais des coûts de décision très élevés. Ces deux situations sont les deux pôles d’une procédure générique de vote à la majorité où le nombre d’individus nécessaires à légitimer la décision est déterminé de façon endogène. Tout individu rationnel va chercher à minimiser l’ensemble de ses coûts. Aussi, c’est sur le coût total anticipé 11, calculé par la somme des coûts externes et internes précédents, que chacun va raisonner. Or ce coût total présente une valeur minimale unique (N* sur la figure 24) qui permet de trouver la proportion optimale de personnes nécessaires pour légitimer le vote. En d’autres termes, chacun acceptera le choix collectif si la procédure de vote prévoit que la décision sera prise avec une majorité correspondant à son niveau optimal. Lorsque cette valeur optimale est similaire pour tous les individus du groupe, la règle est acceptée par tous 12. Rien ne précise que N* doit représenter la moitié des votants : il ne s’agit que d’un cas particulier, au même titre que toute autre valeur. Dans ce modèle, c’est la nature de la décision à prendre qui fixe N* à un niveau plus ou moins élevé. Il existe en effet diverses catégories de décisions collectives, certaines restreignant plus que d’autres les droits de l’individu. En matière de lutte contre la pollution atmosphérique, par exemple, si l’interdiction de circuler un jour sur deux est jugée plus contraignante que celle qui consiste à faire régler régulièrement son moteur, les coûts externes liés à la première mesure seront plus élevés que ceux liées à la seconde mesure. Un individu rationnel exigera 11 Qualifié de « coût anticipé d’interdépendance sociale » par Buchanan et Tullock (1962). 12 En toute rigueur, il faudrait utiliser une procédure de choix collectif pour savoir à partir de quelle proportion d’individus ayant le même minima doit-on considérer que la règle est admise. Il sera plus commode de poser l’hypothèse que cette décision est prise à l’unanimité. « Pour éviter la question sans fin de savoir comment on définit les règles de décision retenues pour choisir des règles de décision optimales » (Généreux, 1996).
190
La décision peut-elle se passer du décideur ?
Coûts externes ∞
N
∞
0
N*
N
Nombre de personnes nécessaires pour légitimer le vote
0
Nombre de personnes nécessaires pour légitimer le vote
Coûts totaux anticipés
∞ Coûts de décision
FIGURE 24 – Coûts de la décision collective
donc, en appliquant la règle de minimisation de ses coûts, que la première mesure soit votée avec une plus grande proportion d’individus que la seconde. 3. Les méthodes à score (règles de Borda, Nanson…) 13 sont des extensions de la procédure majoritaires. Elles permettent de porter la règle de la majorité à des choix à plus de deux issues. Ces méthodes consistent à affecter une « note » qui dépend du classement des alternatives et/ou des candidats. Il n’est pas rare qu’une telle procédure soit utilisée dans des concours sportifs comme, par exemple, les championnats de ski, de conduite automobile, etc. À chaque épreuve, les concurrents gagnent des points en fonction de leur classement. Ces points peuvent correspondre au temps effectué lors des courses de vitesse (ski) ou être attribués en fonction du résultat à l’épreuve (automobile, football, tennis...). Dans ces exemples, les « électeurs » sont les épreuves. Chacun attribue une note à chaque candidat et, à la fin de la période de vote, le vainqueur est celui qui a cumulé le plus de points (ou le meilleur chronomètre). Pour fixer les idées, imaginons qu’une méthode à score soit proposée au conseil d’administration d’une entreprise afin de décider d’un important investis13 Pour un détail de ces méthodes à score, voir Fishburn (1977) ou Durand (2000).
La résignation du décideur devant la décision collective
Actionnaires Alternatives
1
2
3
4
5
6
Total
A1
2
2
1
1
2
1
9
A2
1
0
2
2
0
2
7
A3
0
1
0
0
1
0
2
191
TABLEAU 4
sement. Trois alternatives ont été retenues par les dirigeants, elles sont notées A1, A2 et A3 et il y a 6 électeurs. Chaque administrateur doit déposer un bulletin de vote faisant apparaître les trois alternatives dans l’ordre de ses préférences. Au dépouillement de chaque bulletin, deux points seront affectés à l’investissement préféré, un point à l’investissement venant en seconde position et zéro point au dernier. Le tableau 4 rassemble les résultats : L’investissement A1 remporte le plus de points, c’est donc celui qui sera choisi. Imaginons maintenant qu’un fait nouveau empêche la réalisation de l’investissement A1. Les mêmes bulletins sont utilisés pour départager A2 de A3. Les notes sont modifiées de façon à ce que l’alternative préférée de chacun obtienne 1 point, l’autre 0. Le résultat, sans surprise, est que A2 est préféré à A3 avec 4 points contre 2. Ceci est équivalent à dire que 4 électeurs sur 6 ont voté pour A2 contre A3. La méthode à score appliquée à 2 alternatives correspond donc au vote majoritaire.
1.2
IMPASSES ET IMPERFECTIONS DES RÈGLES DE DÉCISION COLLECTIVE
Parmi les diverses méthodes présentées ci–dessus, aucune ne respecte simultanément toutes les propriétés souhaitées. De nombreux exemples ont mis en valeur ces imperfections. Le paradoxe de Condorcet 14 en est le plus célèbre. Sans faire un exposé exhaustif de ces imperfections, mettons en évidence quelques failles des procédures les plus couramment utilisées. Le Marquis de Condorcet s’est longuement intéressé aux procédures de choix collectif en observant le fonctionnement des assemblées révolutionnaires. Bien qu’ardent défenseur du vote majoritaire, qu’il tenait pour la moins mauvaise des procédures, il était conscient de ses imperfections dès que le nombre d’alternatives est supérieur à deux. Afin de faire apparaître cette anomalie, reprenons les données de l’exemple précédent et supposons que le dépouillement des bulletins donne les résultats regroupés tableau 5. 14 Condorcet (1785).
192
La décision peut-elle se passer du décideur ?
Classement Actionnaires
Choix 1
Choix 2
Choix 3
1
A1
A2
A3
2
A2
A3
A1
3
A3
A1
A2
4
A1
A2
A3
5
A2
A3
A1
6
A3
A1
A2
TABLEAU 5
On remarque alors que si l’on utilise une procédure majoritaire, A1, A2 et A3 seront choisis chacun par 2 électeurs, il est donc impossible de trancher pour l’une ou l’autres des alternatives. Il pourrait alors être judicieux de tenir compte de l’ensemble des préférences pour départager les alternatives, ce qui revient d’ailleurs à adopter une méthode à score. En effet, puisque les trois alternatives sont ex æquo au premier rang (choix 1), pourquoi ne pas prendre celle qui est majoritaire au second rang (choix 2) ? Or, malheureusement, l’impossibilité de départager les alternatives au premier se répète au second et, même au troisième rang : les trois alternatives sont toujours ex æquo 15. Finalement, la décision collective est impossible. Ainsi, même si chaque agent ordonne ses choix, le cumul des choix individuels n’est pas nécessairement ordonné, la propriété 3 n’est pas respectée 16. Le marquis de Condorcet a utilisé ce paradoxe pour montrer que, si le vote majoritaire est bien défaillant dans certains cas, aucune autre méthode non dictatoriale ne lui est supérieure, pas même les méthodes à score qui buttent sur le même problème. Pour étayer l’idée que le vote majoritaire est la moins mauvaise des procédures, Condorcet ira même jusqu’à dévoiler une seconde imperfection des méthodes à score : dès que le nombre d’alternatives est supérieur à 2, c’est-à-dire dès que les méthodes à scores ne sont plus comparables à la procédure majoritaire, les préférences des électeurs ne sont plus parfaitement respectées. Supposons qu’au regard de la loi, trois candidats (MM. Gauche, Centre et Droite) soient éligibles au second tour d’une élection communale. Quelques jours avant le vote, une enquête réalisée sur un échantillon représentatif de 500 personnes par un organisme fiable aboutit au classement recensé au tableau 6. Si la procédure de vote est majoritaire, M. Gauche sera confortablement élu puisque 60 % des électeurs le préfèrent aux autres Par contre, s’il s’agit d’une procédure à score qui attribue, par bulletin, 2 points au préféré, 1 au suivant et 0 au dernier, M. Droite l’emportera puisqu’il disposera de 700 points (300 + 400) contre 600 points pour M. Gauche. 15 Si l’on optait pour une méthode à score, le paradoxe se traduirait par un score identique pour toutes les alternatives. Dans notre exemple : chacune aurait exactement 6 points. 16 Seule la transitivité des préférences, propriété indispensable à la notion d’ordre, est en cause ici.
La résignation du décideur devant la décision collective
Classement
Choix 1 (2 pts)
Choix 2 (1 pt)
Choix 3 (0 pt)
300 (60 %)
M. Gauche (=600 pts)
M. Droite (=300 pts)
M. Centre (=0 pts)
200 (40 %)
M. Droite (=400 pts)
M. Centre (=200 pts)
M. Gauche (=0pts)
Nombre et % de votants
193
TABLEAU 6
Plutôt que de multiplier à l’infini les exemples d’imperfection des diverses procédures de vote, K. Arrow 17 a recherché les conditions nécessaires à une règle de décision collective « idéale » qui respecte les six propriétés énoncées plus haut 18. Le résultat, connu sous le nom de « théorème d’impossibilité » 19 montre que les propriétés sont incompatibles entre elles dès que le nombre de candidats et/ou d’alternatives est supérieur à 2 (voir encadré 19). De nombreux auteurs ont tenté d’assouplir et améliorer le théorème d’Arrow. Ainsi A. Sen a réduit à quatre le nombre de propriétés « raisonnables » à respecter. Ceci lui a permis de montrer qu’il y avait une incompatibilité entre le principe parétien et la liberté individuelle (c’est le paradoxe du libéral parétien). Hansson montre en 1959 que si l’on ne retient que les propriétés 1 (anonymat), 2 (neutralité) et 4 (non-manipulabilité), il y a indifférence collective entre toutes les alternatives et/ou candidats, ce qui revient à dire que dans ces conditions, la dictature n’est pas combattue. De leur coté, A. Gibbard et M. Satterthwaite ont démontré indépendamment que pour toute règle de décision basée sur des préférences individuelles et non triviale (c’est–à–dire ni dictatoriale ni à deux issues), il peut être dans l’intérêt de chacun de conditionner son vote au comportement des autres. Par exemple, dans le cas d’une élection avec plus de 2 candidats, il peut être rationnel pour un individu de ne pas voter pour son propre candidat parce que celui-ci a peu de chances d’être élu. C’est le « vote utile » où l’individu ne révèle pas sa vraie préférence mais adopte un comportement stratégique qui dépend de ses croyances sur le comportement des autres. Un tel comportement rend le vote manipulable, c’est–à–dire dépendant de faits extérieurs.
1.3
LES MÉTHODES EFFECTIVES D’AGRÉGATION
Malgré toutes ces difficultés et imperfections, les systèmes politiques, la démocratie en tête, ont pourtant réussi à mettre en place des règles qui fonctionnent 17 Arrow (1951 et 1963). 18 Arrow ne considère que 5 propriétés, il « oublie » l’anonymat qui est implicite dans sa démonstration. 19 Arrow n’a, semble-t-il, découvert les travaux de Condorcet qu’après avoir développé son « théorème d’impossibilité ».
194
La décision peut-elle se passer du décideur ?
ENCADRÉ 19
Le théorème d’impossibilité de K. Arrow – Soit N individus i = 1,… N. Chaque individu a des préférences individuelles sur un ensemble A de résultats. Il existe une relation de préordre, notée ≤i sur les préférences de l’agent i (i.e la relation ≤i est réflexive et transitive). – On appelle F une fonction de choix social, (notée ≤) qui associe une préférence collective aux préférences individuelles. – Pour définir une préférence collective représentant le plus fidèlement possible la volonté générale, il faut que les conditions suivantes soient respectées :
Universalité : une fonction F doit prendre en considération l’ensemble des états sur lesquels les agents ont réalisé leurs préférences. Soit DF, le domaine de définition de F, F satisfait la condition d’universalité si DF = A. Transitivité : une fonction F doit représenter les préférences collectives de façon cohérente : a ≤ b et b ≤ c ⇒ a ≤ c. Unanimité (ou Monotonie) : une fonction F satisfait à la condition d’unanimité si, lorsque tout le monde préfère a à b alors la collectivité préfère également a à b (a ∈ A et b ∈ A) Indépendance : il doit y avoir indépendance de la fonction F par rapport aux états non pertinents. En d’autres termes, la préférence collective entre a et b, ne doit pas dépendre d’autre chose que a et b. ∀ a,b ∈ A, (∀i a ≤ b ⇔ a ≤ b) ⇒ (a ≤ b ⇔ a ≤ b) Non dictature : une fonction F est une dictature s’il existe un individu i*dont les préférences coïncident toujours avec la préférence collective. ∃i* tq (≤) = (≤i*). Arrow a montré que s’il y a au moins 3 choix possibles (|A|≥ 3), il ne peut exister aucune fonction F.
tant bien que mal. Les raisons de cette efficacité opératoire doivent être recherchées dans trois directions. 1. D’une part, les systèmes démocratiques utilisent souvent des règles complexes qui aboutissent in fine à une situation triviale à deux issues. Il en est ainsi des votes majoritaires à plusieurs tours, comme les élections politiques à deux tours, ou des tournois, tels que les tournois de tennis où une « tête de série » ne rencontre que quelques joueurs. Dans ces deux cas, les difficultés soulevées par Arrow ne s’appliquent pas car les choix sont le plus souvent binaires. Mais cette décomposition fragilise le vote qui devient manipulable. 2. En termes de probabilité, les chances d’aboutir à un cas Condorcet existent bien dès que le nombre d’options est supérieur à 3. Mais cette probabilité reste faible pour un nombre d’options limité. Ainsi, lorsqu’il n’y a que trois options, le risque d’aboutir à une impasse est de 8,8 %, mais il atteint 25,1 % avec cinq options 20. Comme le risque n’est toutefois pas négligeable, les procédures de choix collectif ayant plus de deux options envisagent un traitement spé20 Avec 7 options, il atteint 36,9 % et avec une infinité d’options, il est à 73 %.
La résignation du décideur devant la décision collective
195
cifique des cas Condorcet en instaurant une clause « dictatoriale ». Ainsi le choix peut se porter arbitrairement sur le plus âgé des candidats, un votant peut se voir attribuer une voix supplémentaire permettant de sortir de l’impasse, etc. Au delà de ce résultat statistique, l’expérience montre que ces situations paradoxales sont quasiment inexistantes. Wicksell avait déjà établi que la quasiunanimité était obtenue dans la plupart des situations de choix budgétaire (sous certaines conditions). Bowen puis Black vont plus loin avec le « théorème du votant médian » 21 puisqu’ils démontrent que, sous l’hypothèse principale d’unimodalité 22 des préférences individuelles, il existe toujours une solution au vote majoritaire 23. Cette solution correspond à celle de l’individu médian, c’est–à–dire celui qui partage les votants en deux populations identiques. Pour illustrer la démonstration de Black, imaginons qu’une commune ait à décider de l’opportunité d’offrir des séances de théâtre à ses habitants. Pour ce faire, le maire effectue une enquête auprès des habitants. Les résultats de cette enquête partagent les habitants en trois groupes de même taille. Le premier est constitué d’individus peu intéressés par le théâtre (individus de type A). Le second rassemble les individus moyennement intéressés (individus de type B) alors que les membres du troisième groupe sont des inconditionnels du théâtre (individus de type C). Le graphique a de la figure 25 rassemble les dispositions marginales à payer des membres de chaque groupe en fonction de la quantité de service offert. Supposons que la participation de chaque type d’agent au financement du théâtre soit fixée à l’avance aux taux tA, tB et tC (avec tA + tB + tC = 1). La quantité optimale de consommation de théâtre de chaque groupe est alors donnée par l’intersection de la part d’imposition avec la disposition marginale à payer du groupe. Ainsi, le groupe A est prêt à consommer QA compte tenu de sa contribution tA au financement du théâtre. Comme le montre le graphique b de la figure 25, en ce point le groupe A tire le bénéfice net maximal de sa contribution. Il n’a donc aucun intérêt à accepter une autre quantité que QA sous peine de voir son bénéfice net diminué par rapport à QA. Ce raisonnement est identique pour les trois groupes. Comme la commune doit tout de même définir une seule offre de service public, le maire propose de produire QB 24 et expose ce choix à la critique (et au vote) de ses habitants. Au cours de la discussion, les membres du groupe A 21 Voir Bowen (1943) et Black (1948). 22 Techniquement, les préférences sont unimodales lorsque, dans l’ensemble ordonné des préférences d’un agent, il n’existe qu’un seul point tel qu’avant ce point, les préférences sont strictement croissantes et, après ce point, les préférences sont strictement décroissantes. Ce point est alors le mode de la fonction de préférences. Lorsqu’un vote est unimodal, c’est-à-dire lorsque tous les agents ont des préférences unimodales, c’est qu’il y a une certaine homogénéité, ou uniformité des préférences (ou bien qu’il existe un accord partiel ente les agents). 23 Arrow avait déjà indiqué que, lorsque la caractéristique d’unimodalité des préférences était vérifiée, son théorème d’impossibilité ne s’appliquait pas. 24 Ce choix peut être justifié par le fait que QB maximise ici la somme des bénéfices nets.
196
La décision peut-elle se passer du décideur ?
a) Dispositions marginales à payer (dmp) Parts d'impôts (tA + tB + tC = 1)
tC
dmpC
tB tA
dmpA dmpB Q b) Bénéfice net (BM)
BNA
BNB
QA QB (=QM)
BNC
QC
Q
FIGURE 25 – Votant médian
demanderaient bien entendu une modification afin de rapprocher l’offre de QA. Mais, si elle était mise au vote, une telle modification se verrait refusée par les membres des groupes B et C car cette proposition entraînerait une diminution de leur bénéfice net par rapport à QB. De même, les membres du groupe C déposeraient une motion pour que l’offre se rapproche de QC, mais, pour les mêmes raisons que précédemment, cette mention serait, elle aussi, refusée par les membres des groupe A et B 25. 25 Le choix de QB comme offre initiale ne change rien au résultat. Si, par exemple, le maire avait proposé QA et soumis cette offre à la discussion, les membres du groupe B auraient proposé une motion visant à rapprocher l’offre de bien public vers QB. Cette motion aurait été adoptée car elle aurait bénéficié du soutien des membres du groupe C puisque le bénéfice net associé à QB est supérieur à celui obtenu avec QA.
La résignation du décideur devant la décision collective
197
ENCADRÉ 20
Le théorème de Gibbard et Sattertwhaite Gibbard et Sattertwhaite s’intéressent aux résultats des votes plutôt qu’aux préférences collectives. – Soit N individus i = 1,… N. Chaque individu a des préférences individuelles sur un ensemble A de résultats. Il existe une relation de préordre, notée ≤i sur les préférences de l’agent i (la relation ≤i est réflexive et transitive). – On appelle S une règle de vote, la relation ≤ désigne alors un N-uplet (≤i) et S(≤) désigne le résultat du vote (S(≤) ∈ A) lorsque les préférences annoncées par les agents valent (≤i ). – Pour que le vote représente le plus fidèlement possible la volonté générale, il faut que les conditions suivantes soient respectées : Universalité : une règle de vote S doit prendre en considération l’ensemble des états sur lesquels les agents ont réalisé leurs préférences. S(≤) ∈ A. Non dictature : une règle de vote S est dictatoriale s’il existe i*, un individu dont les préférences coïncident toujours avec la préférence collective. ∃i* tq (≤) = (≤i*). Non manipulabilité : lorsqu’une règle de vote est manipulable, les agents n’ont pas toujours intérêt à donner leurs vraies préférences. Une règle est donc non manipulable lorsqu’elle n’incite pas les agents à dévier. Soient les vraies préférences des agents. S est non manipulable si ∀i, ≤i, ∀≤i’ S(≤) ≤i S(≤i,…, ≤i’,… ≤N). Dans ces conditions, Gibbard et Sattertwhaite ont montré que s’il y a au moins trois choix possibles (|A| ≥ 3), toute règle de vote est soit manipulable, soit dictatoriale.
Ainsi, parce que sa demande optimale est au centre de tous les choix, c’est à chaque fois le vote du groupe B qui est déterminant : c’est le « votant médian ». La demande optimale du groupe B est alors appelée la « demande médiane » (QM). 3. Enfin, comme l’ont démontré Gibbard et Satterthwaite les procédures de vote sont manipulables. Aussi, des stratégies collectives et/ou individuelles sont utilisées par les candidats, les partis politiques ou les élus. Ainsi, Downs a initié, à partir de 1957, une longue série de travaux sur la stratégie optimale des partis politiques dont le principal objectif est d’être élus. Downs considère pour cela que les partis s’appuient sur des groupes de pression et des militants, motivés par leur égoïsme, et qu’ils peuvent, le cas échéant, rechercher des coalitions avec d’autres partis 26. Dans le même sens, Buchanan et Tullock considèrent que le vote est le résultat d’une série de marchandages politiques qui favorisent la constitution de coalitions capables de déjouer la décision collective « normale » et procurent, de ce fait, un certain pouvoir aux minorités. Cette thèse du logrolling (ententes illicites) peut aisé26 Cette série de travaux s’appuie principalement sur les résultats de la théorie des jeux coopératifs, et plus particulièrement sur les travaux de Shapley qui fournit un concept de solution (c’est-àdire de coalition optimale) à partir de la connaissance des gains espérés de chaque joueur lorsqu’il participe à une coalition donnée.
198
La décision peut-elle se passer du décideur ?
ment être illustrée à partir de l’exemple précédent. Dans cet exemple, aucun des groupes n’était majoritaire. Le choix se portait sur la demande médiane (celle du groupe B) parce que, compte tenu des préférences diamétralement opposées des deux autres groupes, il n’y avait aucune coalition possible. Imaginons maintenant que les membres du groupe A, qui étaient peu intéressés par le théâtre, soient tous passionnés de sport et, qu’à l’inverse, les membres du groupe C, fanatiques de théâtre, dédaignent le sport. Une telle configuration permet alors une coalition opportuniste, préalable au vote, dans laquelle tout le monde y trouvera son intérêt. Puisqu’à eux deux ils forment une majorité, il suffit en effet que les deux groupes décident de voter ensemble une dépense élevée pour le théâtre (ce qui est à l’avantage du groupe C) et une dépense importante pour le sport (ce qui favorise le groupe A).
2. La théorie du choix social Alors que la section précédente s’interrogeait sur la façon dont les préférences individuelles pouvaient être agrégées afin d’obtenir une demande collective conforme aux choix individuels, cette seconde section va supposer ce problème résolu pour se concentrer sur la façon dont l’institution collective (l’État, la collectivité territoriale, le syndicat…), décide au nom de ses promoteurs. L’économie a abordé ce problème presque exclusivement au travers de l’économie publique, qui analyse le rôle et le comportement de l’État. Cette branche de l’économie politique oppose traditionnellement deux approches en se fondant sur la notion de bien-être social. La première considère que l’État est neutre, il ne fait que représenter des électeurs/consommateurs. Son rôle se limite alors à améliorer le bien-être de ses promoteurs dans les cas particuliers où le marché ne peut y parvenir. La seconde envisage l’État comme une entité propre qui peut, pour leur bien-être, décider à l’encontre de ses électeurs. Or les deux approches buttent toutes deux sur le même problème, celui de la définition du bienêtre social.
2.1
BIEN-ÊTRE SOCIAL ET ÉCONOMIE PUBLIQUE
La théorie économique a posé la problématique de l’État à l’image de celle du marché. En effet le courant utilitariste a, sous l’égide entre autres de Bergson en 1938, Samuelson en 1947 ou Harsanyi en 1955, proposé de considérer l’État comme la simple émanation des individus qu’il représente sans aucune finalité propre. Le traitement économique de la décision collective est, dans ce cas, simplifié à l’extrême car il suffit de doter l’État d’une fonction d’utilité collective — somme des fonctions d’utilités des agents 27 — pour en conclure que toute décision publique profite nécessairement aux agents. Au premier abord, cette approche soulève néanmoins de sérieux problèmes. En effet, pourquoi des individus parfaitement individualistes et rationnels, évoluant dans 27 Selon l’expression de J. Bentham : le bien-être est égal à la « somme des plaisirs et des peines ». De façon plus générale, les fonctions d’utilité collectives individualistes peuvent ne pas être additives mais elles dépendent toujours des seules utilités individuelles de tous les membres de la collectivité.
La résignation du décideur devant la décision collective
199
une économie de marché, accepteraient-ils de déléguer leur pouvoir de décision à une collectivité ? Par ailleurs, si les agents acceptent de déléguer ce pouvoir, jusqu’où iront-ils ? En d’autres termes, l’approche utilitariste n’explique en rien le rôle de l’État dans une économie. Pigou avait déjà en 1920 posé les jalons d’une théorie du bien-être mais ce sont Samuelson et Musgrave qui, en répondant à ces questions, fondent véritablement l’économie publique. Pigou et Samuelson justifient l’existence de l’État pour suppléer aux défaillances du marché. Le premier s’appuie sur l’existence d’effets externes négatifs : l’État doit intervenir lorsque les effets externes nuisent à ceux qui ne les ont pas causés. Le second, en développant la notion de biens collectifs, a permis de circonscrire le rôle de l’État. Enfin Musgrave a clairement exposé les trois fonctions d’un État en précisant que celui-ci doit promouvoir une allocation optimale des ressources, favoriser une distribution équitable du bien-être et stabiliser les fluctuations macroéconomiques conjoncturelles. Au total, l’État interviendra dans l’intérêt de ses administrés à chaque fois qu’il y aura défaillances du marché, c’est-à-dire à chaque fois qu’une des conditions de fonctionnement du marché n’est pas respectée. Dans ce cas, le marché est bien défaillant puisque certains biens et services ne seront plus produits de façon optimale par le marché. On peut alors envisager des interventions publiques visant soit à corriger le marché quand il fournit mal certains biens, soit à le compléter quand ces biens ne sont pas fournis du tout. Il en est ainsi des biens collectifs purs, comme la Défense Nationale, la Police, etc., qui présentent des caractéristiques telles qu’aucun producteur privé n’aurait intérêt à les produire (voir encadré 21), ou encore des nuisances, des pollutions ou des inégalités qui comportent des coûts que le marché ne sait pas prendre en compte. L’approche normative de la théorie du bien–être repose, on le voit, sur l’idée que l’optimum du marché, lorsqu’il n’est pas défaillant, est la meilleure situation possible. Cette idée présente dans la plupart des travaux de l’économie depuis Smith a atteint son apogée avec la nouvelle économie du bien-être 28 et en particulier avec les travaux de Pareto. Le critère de Pareto porte en effet un jugement de valeur sur une situation, ou une action, à partir de ses conséquences sur les seules préférences individuelles. Une allocation optimale, au sens de Pareto est, de ce fait, à la fois efficace techniquement (il n’y a pas de gaspillage dans l’allocation des ressources productives) et efficace dans l’échange (il n’y a pas de gaspillage d’utilité dans l’échange). Ce critère de Pareto, qui stipule que le bien être d’une collectivité est optimal s’il n’est plus possible d’améliorer le bien-être d’une personne au moins par une modification de l’allocation de ressources, sans que personne d’autre n’en pâtisse 29. 28 Notamment grâce aux deux théorèmes fondamentaux du bien-être qui stipulent que tout équilibre général concurrentiel est un optimum de Pareto (premier théorème ou théorème de la « main invisible ») et, réciproquement, qu’un optimum de Pareto correspond à un équilibre général si les prix sont décentralisables par le marché (second théorème). 29 Cet énoncé, nommé « critère absolu », est le plus connu mais il est équivalent au critère relatif qui stipule qu’une situation doit être préférée à une autre si une personne au moins profite d’une modification de l’allocation de ressources sans que personne d’autre n’en pâtisse.
200
La décision peut-elle se passer du décideur ?
ENCADRÉ 21
Biens collectifs Samuelson a classé l’ensemble des biens et services en fonction de deux critères : • la divisibilité (ou rivalité) du bien : un bien est rival lorsque le fait de le consommer exclut tout autre consommateur. Un bien est non-rival lorsqu’un nombre quelconque d’individus peut le consommer sans que cela ne modifie le coût de production. Par exemple, un aliment est rival puisque si un individu A l’achète ou le consomme, il ne peut plus être acheté ou consommé par un individu B. À l’inverse, un parc, une route sont des biens non rivaux. Exclusion
Non-exclusion
Rivalité
Biens privés
Services collectifs mixtes (ou impurs)
Non-rivalité
Services collectifs mixtes (ou impurs)
Services collectifs purs
• l’exclusivité du bien : un bien est exclusif lorsque son détenteur est en mesure d’en contrôler l’accès. Un bien est non-exclusif lorsque son propriétaire est dans l’impossibilité d’en contrôler l’accès. Un taxi, par exemple, est exclusif car son chauffeur peut soit en interdire l’accès, soit faire payer la course À l’inverse, un phare est non exclusif car on ne peut interdire à quiconque de le voir, ni de l’utiliser. Ainsi, les services collectifs (ou publics) purs sont diamétralement opposés aux biens privés. L’éclairage public, la police, la défense nationale… sont des services collectifs purs. Ils sont caractérisés par de fortes externalités positives. Les biens collectifs (ou publics) mixtes (ou impurs) ne respectent qu’une seule des deux caractéristiques des biens collectifs. Les routes, les ponts, les piscines, etc. sont des services collectifs mixtes car ils sont sujets à congestion. Les caractéristiques d’exclusion et de rivalité des biens ne sont pas toujours purement techniques, certains biens peuvent avoir le statut de biens collectifs purs (non rivaux et non exclusifs) par volonté collective ou politique, ce sont alors des biens méritoires. Les services publics liés aux droits sociaux fondamentaux, tels que l’éducation, la santé, la justice, la police sont de ce type : ces services pourraient être privés mais sont érigés au statut de biens collectifs, c’est-à-dire à la disposition de tout le monde car ils ont des mérites jugés fondamentaux pour la collectivité.
2.2
COMMENT MESURER LE BIEN-ÊTRE ?
Dans une approche moins normative, Hicks et Kaldor, ont étendu la portée du critère de Pareto en développant un test de compensation qui stipule qu’un état de l’économie Y est socialement préférable à un autre état X lorsque les individus qui bénéficient de la modification de l’allocation de ressources peuvent compenser les individus qui en pâtissent tout en conservant un avantage 30. 30 Ce test de compensation est la base de l’analyse coût–avantage.
201
La résignation du décideur devant la décision collective
Pour illustrer ce test, imaginons que sur un territoire donné, la population active (1000 personnes) soit divisée en trois catégories : 10 % de cadres disposant d’un salaire élevé (catégorie A), 60 % d’ouvriers et employés (catégorie B), disposant d’un salaire moyen et 30 % d’individus sans qualification, disposant d’un salaire faible (catégorie C). Il n’existe qu’un seul taux d’imposition qui s’applique à tous. La situation étant jugée très inégalitaire, le gouvernement propose d’appliquer un impôt proportionnel aux revenus. La réforme prévoit d’augmenter le taux d’imposition des individus de la catégorie A, de diminuer celui de la catégorie C et de ne pas toucher au taux de la catégorie B. Selon le critère de Pareto, la réforme proposée n’améliore pas a priori le bienêtre collectif car le projet améliore bien la situation des individus de la catégorie C mais au détriment de ceux de la catégorie A. Pourtant, si l’on y regarde de plus près, dans certaines situations le test de compensation est positif. Ainsi, dans le cas particulier du tableau 7, les bénéficiaires de la réforme, c’est-à-dire les individus de la catégorie C disposeraient d’un revenu disponible supplémentaire leur permettant de couvrir les pertes de la catégorie A (2000 €) tout en conservant un avantage (1000 €). Au regard du test de compensation, la réforme est donc socialement préférable à la situation initiale. Tout en s’affinant, la théorie du choix social et son pendant, l’économie du bien-être, ont dû faire quelques concessions. Car comment prétendre continuer à représenter l’intérêt de tous les agents si, comme le préconise par exemple Pigou, l’État doit corriger les imperfections du marché en taxant les producteurs d’externali-
Catégories
Catégorie A
Catégorie B
Catégorie C
Totaux
2000 €
1000 €
500 €
-
100 (10 %)
600 (60 %)
300 (30 %)
1000
Taux d’imposition initial
10 %
10 %
10 %
-
Ressources d’imposition
20 000 €
60 000 €
15 000 €
95000 €
Revenu disponible des ménages
180 000 €
540 000 €
135 000 €
855000 €
11 %
10 %
8%
Ressources d’imposition
22 000 €
60 000 €
12 000 €
94000 €
Revenu disponible des ménages
178 000 €
540 000 €
138 000 €
856000 €
-2 000 €
-
+3 000 €
+1000 €
Situation initiale Revenu individuel Population concernée
Réforme envisagée Taux d’imposition envisagé par la réforme
Variation par rapport à la situation initiale
TABLEAU 7
202
La décision peut-elle se passer du décideur ?
tés négatives ? À l’instar de cette prescription de Pigou, toute intervention publique, y compris celles relevant de l’allocation optimale des ressources a un effet sur la redistribution. Or toute redistribution va contre l’intérêt de certains individus au profit des autres : l’État exerce alors une contrainte (ou tutelle) sur ses administrés. En d’autres termes, l’économie du choix social a été victime de son principal résultat, le théorème d’impossibilité de Arrow. Pour sortir de cette difficulté, les développements récents de la théorie du choix ont arpenté trois pistes 31 : 1. En premier lieu, certains auteurs, comme Sen, Broome, Mongin et d’Aspremont 32 ont justifié l’intervention tutélaire de l’État en introduisant des variables collectives de bien-être tels que la santé, l’éducation, etc. L’objectif de l’intervention publique n’est alors plus de mieux faire respecter les préférences des consommateurs mais de leur imposer des choix jugés meilleurs pour tous au sens de Pareto. Techniquement, cette transformation se traduit d’abord par un changement de langage : on ne parlera plus, pour désigner les préférences collectives, de fonction d’utilité collective mais de fonction de bien-être social ou même de fonction de préférence étatique. Mais cette transformation se traduit surtout par l’utilisation de fonctions d’utilité individuelles comparables entre elles (fonctions d’utilité cardinales), trahissant en cela l’un des fondements du théorème d’Arrow qui considère une agrégation des préférences basée sur les seules préférences ordinales des agents. La référence aux utilités individuelles reste bien sûr omniprésente dans ces fonctions mais elles subissent des transformations plus ou moins importantes. 2. En conservant l’approche purement utilitariste, d’autres auteurs ont tenté de restreindre les fonctions de l’État aux seules actions qui ne pouvaient pas être traitées par un autre moyen. Le célèbre théorème de Coase montre ainsi que l’intervention de l’État est inutile lorsque les coûts de transaction sont nuls et que les droits de propriété sont clairement définis, car les agents pourront internaliser les externalités par un mécanisme de négociation spontané. Imaginons, pour illustrer ce propos, que deux agents A et B partagent le même immeuble. Mais A est chimiste et son activité répand régulièrement une odeur nauséabonde chez B. Si A est le propriétaire de l’immeuble, B peut proposer à A de financer un système d’aération de l’immeuble. Tous deux pourront avoir intérêt à accepter cette proposition. B y a intérêt tant que le coût de la ventilation reste inférieur au montant du dommage qu’il subit du fait de la pollution. A a intérêt à accepter la proposition tant que le bénéfice ainsi perçu reste supérieur aux coûts correspondant à la mise en place d’un système de ventilation. Si c’est B qui est propriétaire de l’immeuble, alors A doit payer B pour pouvoir exercer son métier. A y a intérêt tant que ce coût supplémentaire reste inférieur au montant d’un système de ventilation. B y a intérêt tant que le gain 31 Pour une analyse des développements récents de la théorie du choix social, voir Fleurbaey (2000). 32 Pour une revue détaillée, voir Bossert et Weymark (2000).
La résignation du décideur devant la décision collective
203
provenant du paiement de A reste supérieur au montant du dommage subi par la nuisance. Ainsi, que A ou B soit propriétaire n’y change rien, une négociation entre les agents permet d’internaliser la nuisance dans les calculs des deux agents. Et le bien-être collectif est maximisé sans intervention extérieure. De façon plus générale, la théorie du bien-être permet de montrer que certaines procédures de décentralisation pouvaient rendre l’action publique efficace ENCADRÉ 22
Règles de redistribution Le jour de Noël, Madeleine offre 10000 € à ses deux petits–enfants : Antoine, qui vient juste d’obtenir un emploi bien rémunéré, et Clément, qui est encore étudiant. Pour partager cette somme, Antoine (un brillant économiste) propose d’envisager différents critères de répartition en prenant en compte ou non la situation personnelle des deux frères. – Avec le critère d’utilité (Bentham, Harsanyi), c’est la différence absolue entre les individus qui fonde la redistribution. La répartition se fera donc en fonction de l’utilité marginale de chacun. Si l’on ne tient pas compte de la situation personnelle, la somme sera partagée en deux (car l’utilité marginale de chacun est, a priori, la même). Si, par contre, on prend en compte le fait qu’Antoine a maintenant un revenu, son utilité marginale sera moins importante que celle de Clément qui, parce qu’il n’a pas de revenu, profitera plus de la somme qui lui sera attribuée. Clément recevra donc plus qu’Antoine. – Avec le critère d’égalité (Rousseau, Marx, Nash), Ce qui importe, c’est la différence relative entre les individus. La répartition se fera en fonction de l’utilité totale de chacun. Dans le cas où l’on ne tient pas compte des situations personnelles, la somme sera comme précédemment partagée en deux (car l’utilité totale est la même). Dans le cas contraire où l’on prend en compte les situations personnelles, puisque son utilité totale croît moins vite que celle de Clément, Antoine devra recevoir plus que Clément, de façon à ce qu’il y ait finalement égalité des utilités totales. – Avec le critère d’équité (Rawls), Ce qui importe c’est que l’individu qui a l’utilité la plus faible puisse maximiser cette utilité. Si l’on ne tient pas compte de la situation personnelle, la somme sera partagée en deux (car aucun des deux n’a une utilité plus faible que l’autre). Dans le cas contraire où l’on prend en compte les situations personnelles, on donnera à Clément, le moins favorisé des deux, la part qui maximise son utilité et on laissera le reste à Antoine. Le résultat peut donc être quelconque (puisque, selon sa fonction d’Utilité, Clément peut tout aussi bien maximiser son utilité avec 1 € qu’avec 9999 €). – Finalement, il est à gager qu’Antoine, qui dispose maintenant d’un revenu régulier, proposera une redistribution volontaire à l’avantage de Clément, par altruisme ou générosité (Hochmann et Rogers). Parce qu’il n’est pas insensible à la détresse de son frère, Antoine acceptera certainement spontanément que son frère ait une part plus grande que la sienne. A moins que ce ne soit par crainte (Brennan) que sa nouvelle situation ne crée des tensions et des jalousies pouvant mener à une brouille familiale. Ce qui, assurément, n’était pas dans les intentions de Madeleine.
204
La décision peut-elle se passer du décideur ?
sans que l’État n’ait besoin de contraindre les agents. En effet, le second théorème du bien-être stipule que, lorsque les prix sont décentralisables, à tout optimum de Pareto correspond à un équilibre général. Ceci signifie que tout optimum de Pareto défini par un décideur (ou planificateur) central peut être décentralisé. On détient ici les fondements de la théorie de la planification décentralisée puisque ce théorème montre que le choix autoritaire d’une allocation de ressources n’est jamais nécessaire, il suffit au décideur central d’envoyer les bons signaux aux agents, sous forme de prix, pour obtenir un résultat identique. 3. Une troisième voie, enfin, initiée par Kolm et Varian introduit des critères éthiques, limitant le choix social à un nombre restreint d’alternatives. L’État ne maximise plus le bien-être des agents de façon absolue, il le fait au regard du critère éthique sélectionné. La théorie de l’équité qui en découle propose ainsi des choix collectifs qui ne sont plus directement optimaux au sens de Pareto mais simplement efficaces : l’État opte pour la meilleure solution (au sens de Pareto) qui satisfait son critère d’équité. Ainsi, le critère utilitariste considérait, on l’a vu, que la maximisation du bienêtre collectif passait par la maximisation de l’utilité de tous les agents. Avec ce critère, l’additivité de la fonction de bien-être social mène implicitement à privilégier, lors des redistributions, la différence absolue entre les individus. Pour le critère égalitariste, issu des thèses humanistes et égalitaires de Rousseau et de Marx, tous les individus ont le droit au même niveau de bien-être. La fonction de bien-être social devient alors multiplicative et c’est la différence relative des individus qui est primordiale. Enfin, pour le critère de maximisation de la situation des plus défavorisés de Rawls, l’objectif est d’atteindre le maximum d’utilité pour l’individu ayant l’utilité la plus faible. Rawls justifie cette position en soutenant que cela correspond à ce que choisiraient des individus qui agiraient dans une situation d’incertitude totale. Résumons-nous. L’approche normative de la théorie du bien-être a pu définir quatre éléments caractéristiques de l’autorité publique : – un objectif : la maximisation de l’utilité collective ; – des fonctions spécifiques d’allocation, de redistribution et de régulation macroéconomique ; – un domaine : celui des biens et services générateurs d’externalités ; – un champ d’application correspondant aux situations pour lesquelles le marché est impuissant. Cependant, dans une approche plus positive, la théorie du bien-être social se heurte à de nombreuses difficultés. Outre le théorème d’impossibilité de Arrow 33, qui reste de nature normative, la décision publique doit prendre en compte de nombreuses déviances, tant du côté des administrés que de celui des administrateurs. 33 Quelquefois appelé « 3e théorème de l’économie du Bien-être », ce théorème, rappelons-le, montre que la fonction de préférence collective ne peut jamais parfaitement représenter les préférences individuelles.
La résignation du décideur devant la décision collective
205
3. Choix collectif et déviances stratégiques Avançons encore une hypothèse : supposons que, outre le problème de la « bonne » représentation des choix individuels, l’objectif à atteindre soit maintenant parfaitement défini. Supposons, en d’autres termes qu’il existe une entité parfaitement représentative des préférences et des choix individuels et qui dispose en conséquence d’une parfaite autonomie de décision. C’est alors vers cette autonomie que nous pouvons nous tourner. Celle-ci est, en effet, souvent analysée comme une source de déviances par rapport à l’objectif de bien-être. Car l’entité collective est aussi un agent économique contrôlé et organisé par d’autres agents économiques. À ce titre, l’entité est sujette à trois types de déviances. Des déviances bureaucratiques, lorsque le décideur public confond involontairement son utilité avec celle de la collectivité qu’il administre. Des déviances domestiques, lorsque la confusion bureaucratique devient volontaire. Enfin, des déviances partisanes lorsque la décision est influencée par un groupe de pression.
3.1
DÉVIANCES BUREAUCRATIQUES
Toute entité collective est confrontée au « paradoxe du choix collectif » 34. Ce paradoxe, basé sur le problème du « passager clandestin » montre qu’aucun individu n’a intérêt à dévoiler, ni a priori ni a posteriori, ses véritables préférences individuelles. Si certaines méthodes incitatives permettent la révélation des préférences a priori (cf. chapitre 5), il n’existe aucun moyen efficace de connaître la satisfaction a posteriori des agents. Or ce comportement, somme toute rationnel, mène le décideur public à des situations sous-optimales, c’est-à-dire à de mauvaises décisions, soit par inadaptation de l’offre de biens publics dont la quantité est choisie en tenant compte des seules demandes révélées, soit par sur-taxation des individus qui acceptent de payer. Il en est ainsi en France de la redevance télévisuelle. Alors que le taux de pénétration de la télévision est proche de 100 %, seulement 85 % des ménages déclarent en disposer malgré les dispositifs incitatifs et coercitifs mis en place 35. Une solution normative a été proposée pour contrer ce type de comportement : les procédures de vote payant 36. Dans ces procédures, l’électeur doit indiquer le prix qu’il est prêt à payer pour chacun des projets qu’il soutient. Le décideur public pourra donc sélectionner le projet dont le prix total que les électeurs sont prêts à payer est le plus élevé. Il peut, de plus, calculer pour chaque électeur, l’incidence d’un comportement de passager clandestin sur le prix total. La taxe imposée à chaque électeur est alors basée sur la différence de valeur avec et sans comportement de passager clandestin. 34 Olson (1966). 35 Le taux d’équipement en téléviseurs est, selon les sources, estimé entre 93,6 et 95 % des foyers. La fraude est, quant à elle, estimée à environ 10 % des foyers. Au total, seulement 85 % des foyers déclarent posséder un téléviseur. 36 Cette procédure, développée à partir des travaux de Tullock, Tideman, Loeb, Groves, Clarke et Vikrey, a de plus, l’avantage d’échapper au théorème d’impossibilité de Arrow.
206
La décision peut-elle se passer du décideur ?
Ainsi, dans le cas de la redevance télévisuelle, supposons que chaque foyer soit prêt à payer au maximum 100 € de taxe et que, par un moyen quelconque (de vote), cette information soit connue du ministère des finances. Puisque le nombre de foyers est d’environ 25 millions. La loi de finance décidera de doter le secteur audiovisuel public de 2,5 milliards d’euros. Toutefois, le comportement de passager clandestin génère un manque à gagner de 250 millions d’euros. Le ministère décidera du montant de la taxe en tenant compte de ce manque à gagner et taxera chaque foyer à 111.11 euros. Le total sera ainsi du montant souhaité par les électeurs mais seuls les individus ayant « voté » (ici 22,5 millions de foyers) paient effectivement la taxe. L’école du Public Choice 37 considère que les dysfonctionnements observés de la décision collective centralisée doivent être expliqués par une analyse du fondement même du fonctionnement de la collectivité. La décision collective est prise, in fine, par un bureaucrate–manager, qui marie habilement sa propre fonction d’utilité (ou celle de son service) et celle de la collectivité. Or, en tant que mandataire, le bureaucrate est le seul à disposer des informations sur le fonctionnement de son administration ainsi que sur ce qui peut ou ne peut pas être mis en œuvre. Si elle désire les obtenir, la tutelle doit passer par le mandataire pour obtenir ces informations. Le mandataire dispose donc d’une rente informationnelle et des risques de déviance managériale découlent de cette organisation du système de décision. La collectivité délègue un pouvoir à un bureaucrate-manager qui détient une information précieuse lui donnant un pouvoir discrétionnaire. L’offre de biens publics est corrélée au montant du budget alloué par la tutelle à l’administration, mais c’est aussi avec ce budget que le bureaucrate va pouvoir accroître son pouvoir discrétionnaire. Le bureaucrate-manager cherchera donc, par négociation avec sa tutelle, à maximiser ce budget au lieu de maximiser le bien-être collectif. Cette substitution aboutit systématiquement à une surproduction de biens publics, indirectement cautionnée par la tutelle qui, en acceptant de fournir un budget élevé, attendait bien, en échange, une offre importante. Dans le même ordre d’idée, Liebenstein envisage une deuxième forme de déviance managériale, celle de l’inefficience-X. Les situations d’inefficience-X sont caractérisées par un coût moyen de production systématiquement supérieur au coût de production optimal. Cette situation peut être expliquée, dans un contexte de rationalité limitée, par une erreur volontaire ou non de jugement de la part du décideur. Comme tout agent économique, celui-ci peut, en effet, restreindre son activité à un niveau qu’il juge satisfaisant, mais qui ne correspond pas à l’optimum. Il peut aussi tenter d’accroître son revenu personnel, son pouvoir, etc. et générer ainsi des surcoûts qui éloignent la production de son niveau optimal. Doté, comme dans l’analyse de Niskanen, d’une rente informationnelle, le manager public peut manipuler le mandataire en faisant passer l’offre sous-optimale de biens publics pour une offre optimale. Cette situation aboutit alors à une offre inappropriée de services publics.
37 Buchanan, Niskanen, Alessi, Breton…
La résignation du décideur devant la décision collective
3.2
207
DÉVIANCES PARTISANES
Les décideurs publics, parce qu’ils ont un pouvoir discrétionnaire sont souvent influencés par un parti politique ou des groupes de pression. Olson et Tullock 38 ont intégré le rôle de cet environnement dans le comportement des décideurs. Ces derniers doivent concilier trois fonctions d’utilité : la fonction collective, la fonction du groupe auquel ils adhèrent et, le cas échéant, leur propre fonction individuelle. Si l’on exclut cette dernière, en supposant que les décideurs ne pratiquent aucune prévarication, le décideur est souvent tiraillé entre l’intérêt collectif, et les intérêts partisans des groupes de pression qui ont souvent, de surcroît, des intérêts opposés entre eux. Ainsi le choix du manager consiste à substituer un choix partisan, issu d’un arbitrage entre différentes tendances et intérêts opposés, à une décision optimale pour la collectivité. Or l’objectif principal des groupes d’intérêt n’est pas d’améliorer le bien-être collectif mais seulement leurs propres intérêts. Les partis politiques ont ainsi pour objectif leur propre réélection, les syndicats veulent favoriser les individus qu’ils représentent, etc. La déviance partisane mène donc systématiquement à une situation dans laquelle l’allocation des ressources est sous-optimale. Rousseau, dans le contrat social, avait déjà attiré l’attention sur cette déviance partisane lorsqu’il écrivait que les magistrats, élus pour représenter l’intérêt du peuple, étaient munis de trois volontés : leur volonté particulière qui domine les autres et les entraîne à suivre leur intérêt personnel, leur volonté de corps qui les entraîne à suivre l’intérêt du corps des magistrats et enfin, l’intérêt du peuple qu’ils représentent. Mais, souligne Rousseau, « la volonté générale est toujours la plus faible, la volonté de corps a le second rang, et la volonté particulière est préférée à tout ; en sorte que chacun est premièrement soi-même, et puis magistrat, et puis citoyen : gradation directement opposée à celle qu’exige l’ordre social 39 ». Olson considère de plus qu’un tel comportement éloigne durablement l’économie de la situation optimale car les groupes de pression ne peuvent aboutir à leurs fins qu’en entravant le fonctionnement du marché par l’instauration de monopoles, de barrières à l’entrée, de subventions, de quotas… Cette analyse est partagée par la théorie du rent seeking de Tullock qui affirme que les restrictions accordées par l’État ne sont finalement destinées qu’à satisfaire des groupes de pression à la recherche de rentes. Cette analyse explique, selon Olson, l’écart de croissance économique observée, de 1947 à la fin des années 1970, entre d’une part les pays anglo-saxons (USA, Royaume-uni…) et, d’autre part, les pays dont les institutions ont dû être renouvelées après la guerre (Allemagne, Italie, Japon). Le premier ensemble, caractérisé par le dynamisme de ses groupes de pression et un système administratif et politique ancien, a eu une croissance relativement plus faible que le second ensemble, pour lequel, outre un système administratif entièrement renouvelé, des groupes de pression étaient moins omniprésents 40. 38 Olson (1966 et 1982), Tullock (1967). 39 Rousseau, Emile ou de l’Éducation, Livre V, Des voyages, 1762. 40 Cette thèse d’Olson a été testée empiriquement à de nombreuses reprises, mais les résultats sont assez mitigés.
208
3.3
La décision peut-elle se passer du décideur ?
DÉVIANCES DOMESTIQUES
Dans le prolongement de l’école du Public Choice, de nombreux auteurs 41 envisagent un comportement de prévarication de l’élu et/ou du bureaucrate. Ce comportement mène le corrompu à substituer sa propre fonction d’utilité à celle de la collectivité qu’il représente, il s’apparente en cela à un dictateur. À l’instar de la théorie de la bureaucratie, ce comportement est expliqué par l’organisation du système de décision publique. La relation d’agence, dans laquelle un mandant délègue une mission à un mandataire est en effet une condition indispensable à la prévarication. Le mandataire, à la recherche d’une rente personnelle effectue, selon Becker, une comparaison coûts/avantages dans laquelle l’avantage est représenté par la rente et les coûts sont mesurés par le montant de la sanction encourue, pondéré par le risque de se faire attraper. Les écarts engendrés par cette pratique par rapport à la solution optimale ont mené les économistes à proposer trois types d’interventions permettant de combattre la prévarication, non exclusifs les uns des autres. Le premier est de nature incitative. Il peut consister soit à offrir un revenu complémentaire équivalent à la rente de prévarication au mandataire, soit à aggraver les conséquences d’être découvert par augmentation de la valeur des sanctions et/ou des contrôles, de façon à augmenter le coût de la prévarication jusqu’à un niveau dissuasif. Soit, enfin, en réduisant la rente informationnelle du mandataire en introduisant, par exemple, une tierce personne chargée d’acquérir et de transmettre l’information cachée sur laquelle repose la prévarication. Ces trois types de mesures sont caractérisés par un coût relativement élevé. Pour cette raison, les méthodes incitatives ne se justifient que si, malgré le coût de l’intervention, le résultat reste socialement avantageux 42. Le second type d’intervention est de nature informative, il consiste à améliorer l’information, à promouvoir la publicité des préférences collectives et à favoriser la concurrence des contractants. Cette forme d’intervention repose sur la notion de réputation collective. Il est notoire que la probabilité de récidive d’un individu qui a déja été corrompu est forte 43. Dès lors, si la transparence prévaut, la réputation doit être intégrée dans le calcul des décideurs sous peine de ne pas être réélu. Le troisième type est de nature politique. Il repose sur l’idée de Tilman, Benson et Baden 44 selon laquelle la corruption est un « marché noir » des droits de propriété et les fonctionnaires ont, de par leur statut, un pouvoir allocatif discrétionnaire sur ce marché. En effet, les fonctions allocative et redistributive de l’État correspondent, dans cette analyse, à des transferts de propriété. Or dans ce domaine, l’État est moins bien doté que le marché car d’une part, les droits de propriété ne sont pas exclusifs et, d’autre part, ces droits sont facilement transférables. Ces deux caractéristiques donnent, de fait, un pouvoir discrétionnaire aux fonctionnaires qui en profitent inévitablement (parce qu’ils sont rationnels). Dans ces conditions, la seule intervention efficace pour contrer le comportement opportuniste des 41 42 43 44
Becker et Stigler, Tirole, Weber, Gould, etc. On retrouve ici le test de compensation de Hicks et Kaldor. Rocquet (2003). Tilman (1968), Beson et Baden (1985).
La résignation du décideur devant la décision collective
209
fonctionnaires consiste, pour l’État, à se désengager le plus possible de l’activité économique afin de limiter au maximum le pouvoir de nuisance des fonctionnaires.
4. Conclusion La décision collective est, du point de vue de l’économie, confrontée à un double problème. Celui de sa légitimité d’une part, celui de son efficacité d’autre part. Ces deux problématiques, bien qu’anciennes, ont longtemps trouvé écho dans d’autres domaines que l’économie et ce n’est qu’avec le renouveau de la Politique Économique, que les économistes ont tissé le canevas d’une théorie normative de la décision collective permettant de répondre à cette problématique : la théorie du bien-être. Le cœur de cette théorie repose sur le critère d’optimalité de Pareto, le modèle d’équilibre général et les deux théorèmes du bien-être qui en découlent. Ces deux théorèmes, qui stipulent qu’il existe une correspondance biunivoque entre l’équilibre de marché et l’optimum parétien, ont permis de circonscrire les domaines dans lesquels l’action du décideur collectif était compatible avec son objectif : l’amélioration du bien-être collectif. Par ailleurs, cette approche a doté le décideur politique d’une fonction « d’améliorateur social » (social meliorist) chargé d’indiquer aux agents ce qui est bien pour eux — l’équilibre Paretien. Elle justifie en cela des actions qui vont, en apparence, à l’encontre de l’intérêt individuel. Si le décideur était un despote bienveillant 45 agissant en permanence comme le lui préconise la théorie du bien-être social, la théorie normative deviendrait de facto une théorie positive car les choix du décideur seraient en permanence identiques à ceux des électeurs. Mais l’image du despote bienveillant est bien loin de la réalité. C’est ce qu’a voulu montrer l’école du Public Choice en reprenant l’idée ancienne selon laquelle outre sa fonction de représentation d’un collectif, le décideur était aussi un individu sujet à la tentation égoïste, un partisan chargé de favoriser les objectifs du groupe auquel il appartient et, enfin, un politique soucieux d’être réélu. Comment, dans ces conditions, ne pas avoir de comportement déviant (comparé au despote bienveillant), pour des raisons stratégiques, partisanes ou domestiques ? Même dans l’hypothèse où le décideur résiste à toutes ces tentations, rien ne dit que la voie qu’il propose soit celle effectivement désirée par les électeurs. Au contraire nous dit Arrow : un décideur élu à la majorité ne peut jamais représenter parfaitement les préférences de ses électeurs, son comportement implique toujours un soupçon de dictature. Le problème se trouve alors dans la légitimité du choix collectif. Pour lever toute suspicion de dictature, il faut en effet disposer d’une procédure de vote irréprochable. Cette règle existe, c’est l’unanimité, mais pour des raisons techniques bien compréhensibles, cette règle ne peut être utilisée qu’exceptionnellement. Il a donc fallu trouver des règles acceptables, c’est-à-dire moins contraignantes, moins coûteuses et plus accessibles que l’unanimité. La règle de la majorité (et ses extensions comme les méthodes à scores) est une bonne candidate. Cette règle comporte de nombreuses imperfections. il existe, 45 Selon l’expression de Wicksell.
210
La décision peut-elle se passer du décideur ?
par exemple, une possibilité non négligeable d’aboutir à une impasse –nommée « cas Condorcet ». La règle est aussi sujette à des manipulations, comme le logrolling, analysé par Buchanan. Toutefois, dans la pratique, la règle de la majorité reste satisfaisante car les choix des électeurs sont souvent assez proches les uns des autres et cette uniformité aboutit presque systématiquement à une solution médiane qui ne satisfait mais ne défavorise personne. La décision collective ainsi analysée par l’économie repose sur le canevas fourni par Arrow, c’est-à-dire la recherche d’une décision doublement optimale, individuellement et collectivement sélectionnée parmi tous les états sociaux possibles. Ce choix collectif repose sur l’agrégation des préférences individuelles. Or, et c’est là le principal apport de cette théorie, une telle décision est impossible. Le théorème d’impossibilité a eu et à en effet des implications fondamentales tant en économie où il s’oppose à toute tentative d’optimisation des choix collectifs, qu’en politique où il relativise la notion de Démocratie. Pourtant, il ne ressort de ces développements qu’un aspect négatif puisque, semble-t-il, rien n’a pu améliorer sensiblement les classiques fonctions d’utilité collectives du début du 20e siècle qui, bien qu’imparfaites, ne sont sommes toutes pas plus mauvaises que tout ce qui a été « inventé » depuis. Pour sortir de cette difficulté, il faut sortir du cadre imposé par Arrow. Soit de façon technique en relativisant les contraintes (les axiomes) du théorème et en supposant par exemple que certaines situations sociales ne sont pas comparables à d’autres ou bien que le choix collectif doit se baser sur la comparaison de préférences interindividuelles. Soit en (ré)intégrant une vraie dimension politique à l’économie comme le font Kolm, Varian ou Sen, c’est-à-dire en redonnant à l’entité collective une autonomie de choix vis-à-vis des agents qu’elle représente. C’est ainsi en introduisant du normatif -une éthique, une règle politique, etc.– que l’on a aboutit aux résultats les plus encourageants. L’introduction d’une règle d’équité permet ainsi à la théorie du choix social de proposer des solutions optimales (de second rang) qu’elle ne pouvait proposer sans cela. C’est aussi par rapport à cette solution, qui sert de référent, que la théorie du choix social peut envisager une théorie normative de la déviance et les méthodes incitatives visant à la réduire.
Chapitre 8
Le décideur sous influence : l’émergence de la décision collective Denis J. HILTON et Laure CABANTOUS
Sommaire 1 Les effets de l’influence sociale dans les groupes : la création et la dissolution du consensus
213
2 Les facteurs affectant la prise de décision dans les petits groupes
219
3 Prise de décision individuelle et comportements collectifs
226
4 Conclusion
233
212
La décision peut-elle se passer du décideur ?
De nombreuses décisions sont prises en groupe. Dans les organisations par exemple, le manager type passe les deux tiers de son temps à parler à ses collègues, à ses employés ou aux personnes qu’il rencontre dans la journée 1. Ces réunions et ces conversations, qu’elles soient formelles ou informelles, lui permettent de prendre de nombreuses décisions 2. De même, les décisions de consommation sont plutôt prises en groupe (la famille, par exemple) qu’individuellement 3. Cependant, malgré l’importance qu’ont les décisions de groupe dans le monde réel, de nombreux textes sur la psychologie du jugement et de la prise de décision ignorent le sujet 4. Certains économistes semblent même supposer que les préférences individuelles au sein d’un groupe se combinent simplement pour aboutir à une sorte de préférence ou de jugement moyen de groupe (cf. chapitre 7). Comme nous le verrons plus loin, supposer que la décision de groupe consiste simplement en l’agrégation des préférences individuelles ne permet pas de prévoir certains phénomènes récurrents dans la prise de décision collective. Les recherches montrent au contraire que les préférences ou jugements collectifs sont établis par un processus de débat et d’échanges dynamiques entre les individus. Ce processus aboutit à des conclusions qui dans de nombreux cas diffèrent d’une simple combinaison de « votes ». Dans ce chapitre, nous traiterons de deux types de collectifs. Nous aborderons d’une part les petits groupes de travail qui sont formés pour interagir dans un but précis (comme résoudre un problème ou gagner un match de football), et d’autre part, les grands agrégats, comme les foules, les nations ou les acteurs des marchés financiers, dans lesquels les membres n’interagissent pas dans un objectif défini (mais ont les moyens de s’influencer mutuellement). Il existe bien sûr d’autres types de collectifs — les organisations, par exemple, seront traitées dans le chapitre suivant. Le lecteur souhaitant aller plus loin dans la psychologie des groupes sociaux est renvoyé aux textes sur le sujet 5. Deux types de « décision de groupe » sont également envisagés. Ce terme est en effet employé dans ce chapitre pour désigner les décisions prises par un décideur inséré dans un environnement social : un décideur qui doit prendre, seul, une décision tient compte de l’avis des autres, subit des influences, des interactions. En économie, la théorie des jeux appréhende ce type de situations (cf. chapitres 4 et 5). Le terme « décision de groupe » est également utilisé au sens plus strict de « décision prise par un groupe de personnes ». Dans ce cas, plusieurs décideurs doivent se mettre d’accord sur la décision à prendre.
1 Mintzberg (1973). 2 Kotter (1982). 3 Dubois (1994). 4 Par exemple : Arkes et Hammond (1986) ; Kahneman, Slovic et Tversky (1982) ; Palmarini (1995) ; Russo et Schoemaker (1989) ; von Winterfeldt et Edwards (1986). 5 Aebischer et Oberlé (1998), par exemple.
Le décideur sous influence : l’émergence de la décision collective
213
1. Les effets de l’influence sociale dans les groupes : la création et la dissolution du consensus Les décisions de groupes présentées dans cette partie sont relatives à des « petits groupes ». Les recherches sur la formation des normes dans un groupe ainsi que sur la conformité illustrent l’importance de l’opinion majoritaire dans la décision d’un décideur individuel. Cependant, la majorité n’est pas la seule source d’influence et l’avis d’une minorité peut également influencer le décideur.
1.1
LA FORMATION DES NORMES DE GROUPE
Les individus ne semblent pas capables d’établir des jugements ou des préférences sans être influencés par les opinions des autres. Il a été observé depuis longtemps que les évaluations individuelles de goûts ou d’odeurs rejoignaient toujours celles des autres membres du groupe 6. Ainsi, dans ces expériences, la variance, résultant des évaluations de membres d’un groupe interactif, était toujours inférieure à celle d’un groupe (ou agrégat) non-interactif, dans lequel les individus faisaient leur jugement séparément. Les groupes interactifs convergeaient vers une norme collective commune sur ce qui constituait une odeur ou un goût désagréable ou agréable. On pourrait défendre l’idée qu’il est rationnel que se forment des normes dans les groupes. Par exemple, on pourrait dire que les discussions de groupes permettent aux individus de mieux connaître l’objet du jugement et de converger ainsi vers un jugement objectif (c’est à dire un jugement guidé par les propriétés de l’objet plutôt que par les particularités des perceptions individuelles). Cependant, de telles normes collectives apparaissent même lorsqu’il n’y a pas de réalité objective sur laquelle se mettre d’accord. Ainsi, une célèbre expérience 7 a mis à jour ce phénomène en utilisant une illusion optique, découverte par des astronomes, connue sous le nom d’effet d’autokinesis. Lorsqu’on fixe un point de lumière dans une pièce obscure (comme chez l’ophtalmologiste), ce point semble se déplacer. En réalité, il ne bouge pas du tout. Cette illusion est due au fait que l’œil va et vient constamment dans une série de mouvements rapides (les saccades). Dans les situations normales, où il y a plusieurs objets dans le champ de vision, comme c’est le cas à la lumière du jour ou dans le ciel étoilé, le cerveau parvient à stabiliser l’image malgré les mouvements saccadés de la rétine. Les participants à cette expérience ne connaissaient pas ce phénomène. Il leur a été demandé de regarder le point à quatre reprises. À la première session, les trois participants observaient le point séparément. Leurs conclusions sur l’amplitude des mouvements du point différaient alors sensiblement. En revanche, lors des trois sessions suivantes, ils observèrent le point ensemble ; à la fin de ces sessions ils s’étaient presque mis d’accord sur les déplacements du point de lumière. 6 7
Allport (1924). Sherif (1935).
214
La décision peut-elle se passer du décideur ?
Une autre expérience a renforcé ces conclusions. Trois participants commençaient par observer le point de lumière ensemble. Dans ces conditions, un consensus s’établissait dès la première séance et se maintenait au cours des trois suivantes. De plus, le consensus était maintenu même lorsque de nouveaux membres étaient introduits dans le groupe, et même lorsqu’il n’y avait plus aucun membre originel dans le groupe. Cette expérience nous donne donc un aperçu du mécanisme de transmission culturelle, où les normes collectives se transmettent de génération en génération, même quand les raisons de leur création ont été oubliées depuis longtemps. Ces expériences montrent bien que les préférences ou les jugements individuels peuvent être influencés par les interactions avec autrui. Les groupes créent des normes, et ces normes sont consolidées par la socialisation de nouveaux membres du groupe. Nous allons voir combien la pression sociale peut être forte lorsqu’il s’agit d’imposer un consensus aux nouveaux membres, ce qui peut même les conduire à prendre des décisions contraires à l’évidence qui est sous leurs yeux.
1.2
LES EFFETS DE CONFORMITÉ ET D’OBÉISSANCE : LA SOCIALISATION À LA NORME
L’étude que nous venons de présenter montre comment la pression sociale peut affecter la perception lorsque l’objet perçu n’est ni connu ni ambigu. Mais la pression sociale peut-elle orienter notre perception vers quelque chose d’évidemment faux ? Il semble que oui. Dans une expérience devenue classique en psychologie sociale 8, une ligne a été présentée à un groupe de huit participants et on leur a demandé de dire, parmi un ensemble de trois lignes de taille différente, lesquelles étaient de même taille que la ligne cible (cf. figure 26). En fait, une seule personne dans le groupe était véritablement sujet de l’expérience, les autres membres étaient associés à l’expérimentateur. Lorsque l’expérimentateur posait la question aux associés, ils désignaient tous une ligne plus courte que la cible (A).
Ligne cible
A
B
C
FIGURE 26
Même quand la réponse de la majorité était donc très clairement fausse, les participants suivaient cette réponse dans 36.8 % des cas. Sans la pression du groupe, le taux d’erreur descendait à 1 %. Une majorité de trois personnes suffisait généralement à créer ce niveau de pression. Cependant, la présence d’un contestataire avait 8
Asch (1955).
Le décideur sous influence : l’émergence de la décision collective
215
un impact important sur le niveau de conformité. S’il y avait un contestataire modéré (un associé qui exprimait des doutes, avant de finalement rejoindre le point de vue de la majorité), la conformité descendait à 24 % dans les groupes de huit personnes. S’il y avait un contestataire fort (un contestataire qui contredisait expressément la majorité), alors la conformité tombait à 9 % ! Lorsque l’on a demandé aux participants de cette expérience pourquoi ils s’étaient conformés, la majorité d’entre eux étaient conscients de voir les choses différemment du groupe, mais remettaient en cause leur propre capacité de perception. D’autres savaient avoir raison mais se conformaient pour ne pas s’écarter du groupe. Une petite proportion « voyait » effectivement comme le groupe. On peut conclure de cette expérience que la conformité tient à la peur : peur du ridicule, de la désapprobation sociale et de l’exclusion du groupe. Des travaux ultérieurs ont montré que les facteurs de situation et de personnalité peuvent modifier les effets de conformité. Par exemple, les participants peu sûrs d’eux-mêmes tendent à être plus conformistes. Les participants ont aussi plus de chances de se conformer si l’objet sur lequel porte le jugement est de nature ambiguë. Ainsi, les étudiants de l’école de commerce française HEC furent soumis à un test de goût en aveugle pendant un cours de marketing 9. On leur proposa deux verres d’eau minérale (prototype du produit ayant une odeur et un goût faibles) et on leur demanda lequel ils préféraient. En fait, les deux verres étaient remplis de la même eau. Les associés de l’expérimentateur s’exprimèrent en premier et désignèrent le même verre. Les participants suivants se conformèrent à la majorité. Les pressions de conformité varient également selon les cultures. Les effets de conformité obtenus dans les cultures « collectivistes » (Japon, Chine, Inde, par exemple) sont plus forts que ceux obtenus dans des cultures « individualistes » (surtout les pays occidentaux industrialisés) 10. Une expérience célèbre par ses conclusions surprenantes a élargi nos connaissances quant à l’effet de la présence d’autrui sur les comportements individuels 11. Il s’agissait d’étudier le niveau de brutalité que les gens étaient prêts à exercer, à la demande d’une autorité légitime (comme un expérimentateur de psychologie dans une université prestigieuse). Des participants furent recrutés par le laboratoire de psychologie de l’université de Yale afin de les soumettre à une « expérience d’apprentissage ». II leur fut assigné le rôle d’un professeur devant donner des décharges électriques à un élève (en réalité un collaborateur de l’expérimentateur Stanley Milgram) quand ce dernier se trompait dans la récitation d’une liste de mots. Le « professeur » avait la possibilité d’augmenter la puissance des chocs, de 30 volts (la tension appliquée au début de l’expérience) jusqu’à 450 volts. Il disposait devant lui d’une échelle graduée qui précisait, en face de chaque niveau d’intensité électrique, « choc modéré », « choc élevé », « choc très élevé », etc., jusqu’à « xxx ». L’« élève », de mèche avec l’expérimentateur, était placé dans une pièce voisine et avait été entraîné à réagir en fonction du niveau de la décharge, en criant, en hurlant, et, passé une certaine puissance, en restant silencieux. 9 Dubois (1994). 10 Smith et Bond (1995). 11 Milgram (1963), expérience illustrée dans le film I comme Icare, de Henri Verneuil (1979).
216
La décision peut-elle se passer du décideur ?
Avant l’expérience, il avait été demandé à un panel d’experts (psychologues et psychiatres) et de non-psychologues de prédire le comportement des participants. Les experts ne s’attendaient pas à ce que les participants dépassent 225 volts. En fait, 65 % des participants à cette expérience allèrent jusqu’à administrer la puissance maximale (450 volts). Milgram avait initialement voulu mener cette expérience en Allemagne pour y mesurer la propension au fascisme. Finalement, il trouva tellement de conformité et d’obéissance chez ses compatriotes américains qu’il resta chez lui pour effectuer ses travaux. Il découvrit que certains facteurs pouvaient modérer le niveau de conformité chez les « professeurs » dans son expérience d’obéissance. Ainsi la présence d’un contestataire, sous la forme d’un autre « professeur » chargé de faire la même expérience en parallèle (en réalité un associé) et refusant d’aller plus loin, réduisait considérablement le niveau de conformité. Le prestige de l’expérimentateur et de l’expérience avait également de l’influence. Ainsi, le niveau de conformité diminuait sensiblement lorsque le lieu de l’expérience était déplacé de l’université de Yale vers des bureaux anonymes du centre de New Haven laissant penser à une organisation privée (au lieu de l’université), ou lorsque l’expérimentateur ne portait pas la blouse blanche du scientifique. Enfin, la conformité se réduisait quand l’élève était plus proche et plus visible pour le « professeur ». Ces travaux mettent donc en évidence la sensibilité des jugements et des actions individuels à la pression collective, que ce soit sous la forme d’une majorité locale, ou sous celle d’une figure d’autorité désignée par l’ensemble de la société. Leurs études montrent que l’influence du groupe dans la prise de décision individuelle peut être très importante, et aident à comprendre comment des idées irrationnelles parviennent à s’imposer aux marchés et aux nations. Ainsi, des gens intelligents peuvent-ils être conduits à penser que les membres de minorités (comme les juifs dans l’Allemagne nazie ou les Albanais au Kosovo) sont des « catégories inférieures » ou que certaines actions en bourse ont une très grande valeur (sinon pourquoi autant de personnes en achèteraient-elles ?).
1.3
COMMENT EXPLIQUER LA CONFORMITÉ ? LES INFLUENCES NORMATIVES ET INFORMATIONNELLES
Les psychologues sociaux ont identifié deux processus majeurs expliquant le phénomène de conformité au groupe 12. Le premier est appelé influence normative. Les gens adoptent les normes du groupe dans le but d’obtenir des récompenses. Une étude sur les soldats américains de la Seconde Guerre mondiale montre que les nouvelles recrues incorporées dans des unités de combat expérimentées, ont tendance à adopter la norme des vétérans : « la guerre c’est l’enfer ». Ce faisant, ils arrivent à avoir l’approbation de ces membres prestigieux du groupe 13. Les psychologues sociaux ont manipulé la dépendance des individus envers les groupes afin de déterminer si elle affectait la conformité. Par exemple, dans certains groupes, l’interdépendance des membres était augmentée, en promettant des récom12 Kelley (1952). 13 Merton et Kitt (1950).
Le décideur sous influence : l’émergence de la décision collective
217
penses au groupe qui ferait le moins d’erreur de jugement (des places pour une pièce à Broadway), dans le cadre d’une compétition entre cinq groupes différents 14. Les membres de groupes interdépendants étaient deux fois plus conformistes que les membres des groupes de base (auxquels aucune récompense n’avait été promise). Dans une autre démonstration des effets de l’influence normative, les chercheurs ont fait varier le statut de certains participants au sein d’un groupe 15. Ils ont observé une plus grande conformité chez les participants de statut moyen que chez ceux qui ont un statut élevé ou faible. Ils en concluent que les participants de statut moyen ont plus à gagner à se conformer qu’à se différencier, tandis que les statuts élevés peuvent se permettre d’être non-conformistes et que les statuts faibles n’ont rien à perdre à se démarquer de la norme collective. Le groupe peut aussi affecter les individus par un processus d’influence informationnelle. Celui-ci correspond à la théorie de la comparaison sociale 16, selon laquelle les gens comparent leur réponse à celles des autres quand ils ne sont pas sûrs de son exactitude. Par exemple, un joueur débutant au tennis ne saura pas quelle raquette acheter et observera les joueurs expérimentés et leur matériel avant d’établir son choix. La recherche montre que les gens peu sûrs d’eux, ou s’estimant moins aptes au jugement que les autres, ont tendance à se conformer 17. De plus, lorsque le jugement est difficile ou ambigu, les effets de conformité tendent à s’intensifier 18. Les psychologues sociaux distinguent également deux types de conformité : la conformité publique avec la norme du groupe et la conversion -ou conformité privée à la position du groupe 19. Les processus d’influences informationnelle et normative n’ont pas la même importance sur les deux types de conformité. Une étude montre que l’influence normative affecte plus les positions prises publiquement, tandis que l’influence informationnelle a plus d’influence sur les opinions personnelles 20. Dans cette expérience, les participants étaient obligés de répondre, soit en public, soit en privé (leurs réponses étaient, selon le cas, communiquées, ou non, au groupe), et étaient informés quand l’expérimentateur pouvait vérifier l’exactitude de leur réponse. Ainsi, il était demandé aux participants de juger si une couleur était plus proche de la couleur à sa droite ou de celle à sa gauche. Ce jugement se faisait après avoir entendu les opinions d’autres participants (en réalité des collaborateurs de celui qui menait l’expérience). Comme prévu, les participants étaient plus conformistes dans les jugements publics (communiqués aux autres membres du groupe). Ils se conformaient aussi davantage lorsque l’expérimentateur pouvait vérifier leur réponse (montrant ainsi le souci d’avoir la bonne réponse). Ces deux effets étaient indépendants l’un de l’autre. En somme, les individus manifestent une remarquable tendance à la conformité dans les groupes. La différence est critiquée et ridiculisée. Sous cet angle, on 14 15 16 17 18 19 20
Deutsch et Gerard (1955). Dittes et Kelley (1956). Festinger (1954). Mausner (1954). Asch (1955) ; Crutchfield (1955). Van Avennaet (1996). Insko, Drenan, Salomon, Smith et Wade (1983).
218
La décision peut-elle se passer du décideur ?
peut se demander si le travail en groupe -comme le brainstorming- est vraiment le meilleur moyen d’inciter à la créativité.
1.4
L’INNOVATION : CAUSES ET CONSÉQUENCES DE L’INFLUENCE DE LA MINORITÉ
Jusque dans les années 60, la recherche en psychologie sociale sur les processus de groupes se concentrait sur la question de l’influence exercée par les majorités sur les minorités. Cependant, nombreuses sont les situations dans lesquelles les minorités ont réussi à influencer les majorités, comme pendant la Révolution française ou lors de la propagation des idées écologiques au vingtième siècle. L’adoption de certains produits comme le walkman ou le téléphone portable peut aussi être considérée comme résultant de l’influence d’une minorité : les produits se diffusent massivement si les innovateurs parviennent à convaincre les suiveurs d’acheter ces produits, et ce, jusqu’à la saturation du marché. Comment une telle influence peut-elle s’exercer ? Une illustration cinématographique du processus d’influence par une minorité est proposée dans le film de Sidney Lumet, Douze hommes en colère. Dans ce film, un seul juré (interprété par Henry Fonda) parvient à convaincre les onze autres jurés, par une argumentation longue et déterminée, qu’ils ne disposent pas de preuves suffisantes pour juger l’accusé coupable de meurtre, alors qu’au début du film, les onze autres jurés se prononçaient pour sa culpabilité, le condamnant à la peine de mort. Au premier abord, pourtant, les minorités ne sont pas avantagées : elles ne disposent ni de l’avantage du nombre, ni de l’avantage de l’autorité, ni de celui de la crédibilité, déterminants dans le processus normal d’influence sociale. Ce paradoxe des minorités parvenant malgré tout à agir sur la majorité peut cependant être expliqué 21 : pour parvenir à défendre sa cause, la minorité se doit d’être constante ; si elle veut faire entendre son point de vue sur une question, elle doit avoir une position claire et s’y tenir, malgré les pressions de la majorité. Lorsque des membres de la majorité sont confrontés à la position d’une minorité, ils s’interrogent sur les raisons de ce comportement inhabituel et s’engagent dans un processus d’attribution 22. Les recherches montrent que la minorité est plus persuasive lorsqu’elle maintient sa position sur le problème central, mais rejoint la majorité sur d’autres questions 23. Par exemple, le personnage joué par Henry Fonda dans Douze hommes en colère avait plus de chance de convaincre en restant ferme sur le meurtre tout en se mettant d’accord avec les membres du jury sur d’autres problèmes. Il semble que l’influence de la minorité ait plus de chance de conduire à une conversion (changement d’opinion privée) qu’à une conformité (accord public avec la position de la source) 24. De manière générale, les processus mis en place par les influences de majorité ou de minorité peuvent être assez différents. Par exemple, lorsque les gens sont confrontés à la position d’une minorité, ils s’engagent plus faci21 22 23 24
Moscovici (1976). Mass et Clark (1984) ; Werner (1985). Bonnet, Erg, Bernhard et Frank (1996). Moscovici (1976).
Le décideur sous influence : l’émergence de la décision collective
219
lement dans une réflexion créative 25 ou émettent plus souvent des hypothèses nouvelles et anticonformistes. Ainsi, dans une expérience, un problème concernant l’organisation de circuits touristiques par une agence de voyage est présenté à des participants suisses 26. Ceux-ci étaient informés que les trois villes préférées des touristes étaient Genève, Lausanne et Lucerne et que les employés de l’agence voulaient déterminer les raisons de cette préférence afin de sélectionner trois autres villes susceptibles d’avoir autant de succès auprès des touristes. On disait aussi aux participants que les employés de l’agence avaient sélectionné le triplet des trois villes suisses. On leur a ensuite demandé de choisir parmi des triplets de villes qui, soit étaient conformes à la règle de nationalité (comme Lugano, Nyon, et Brienz, trois autres villes suisses), soit ne l’étaient pas (comprenant des villes françaises, par exemple). Les participants étaient plus susceptibles de choisir des triplets non-conformes quand on leur disait que la règle initiale (« trois villes suisses ») avait été proposée par une minorité d’employés de l’agence, que quand on leur disait qu’elle avait été choisie par la majorité.
2. Les facteurs affectant la prise de décision dans les petits groupes Lorsqu’un groupe de personnes doit prendre une décision, le résultat peut être assez surprenant…Lorsqu’un décideur discute avec d’autres personnes de la décision qu’il doit prendre, sa décision finale est-elle différente de la décision qu’il aurait prise s’il n’avait pas échangé des points de vues ? Les études menées en psychologie sociale ont permis de mettre en évidence l’effet important de la discussion sur la prise de décision. Qu’elle soit effective et antérieure à la décision ou même potentielle et postérieure à la décision, la discussion semble bien jouer un rôle central dans la décision. Le décideur est dans tous les cas « sous influence ».
2.1
LA PENSÉE GROUPALE OU LE GROUPTHINK
Il arrive qu’un groupe de personnes raisonnables et intelligentes prenne des décisions qui, rétrospectivement, s’avèrent être désastreuses. Cela peut être le résultat d’un processus appelé « pensée groupale » (groupthink) 27. Ce processus commence avec le sentiment que le groupe est invulnérable. Les membres du groupe construisent une carapace réfractaire à toute information extérieure qui pourrait nuire à leur décision. Le groupe produit alors une « pensée groupale », qui est en fait un consensus trop rapidement obtenu, et souvent le reflet de ce que pensait le leader du groupe, très directif. Le groupe considère que ses conclusions sont unanimes même quand il y a beaucoup de dissidence non exprimée. Dans ces circonstances, il règne un bon état d’esprit au sein du groupe, entretenu par l’adhésion mutuelle aux conclu25 Nemeth (1986). 26 Butera et Munit (1995). 27 Janis (1982).
220
La décision peut-elle se passer du décideur ?
sions. Mais comme les désaccords au sein du groupe sont proscrits, les décisions peuvent parfois être désastreuses. La pensée de groupe apparaît le plus souvent dans les groupes dotés d’une forte cohésion, isolés, soumis à une forte pression, et ayant des leaders très forts et très dynamiques. Ceux-ci font des propositions et argumentent fortement en leur faveur. Les membres de groupe n’osent pas s’opposer parce qu’ils ne veulent pas saper le moral du groupe et parce qu’ils ont peur d’être rejetés. Ce phénomène serait responsable de nombreux désastres dans la politique extérieure des États-Unis, tels que le manque de préparation avant l’attaque surprise japonaise de Pearl Harbor en 1941, le débarquement dans la baie des cochons à Cuba en 1961, l’escalade dans la guerre au Vietnam etc. Dans tous les cas, un petit groupe d’hommes politiques, généralement mené par le président, a pris une décision sans tenir compte des voix dissidentes ou d’informations déterminantes. Ainsi, les plans du débarquement dans la baie des cochons prévoyaient, en cas d’échec, une retraite dans les montagnes Escambray occupées par la résistance anti-castriste. Aussi incroyable que cela puisse paraître, personne n’avait étudié la carte suffisamment en détail pour se rendre compte que les montagnes étaient séparées par 125 km de marécages infranchissables par une armée. On peut éviter le phénomène de groupthink en forçant le groupe à considérer plusieurs alternatives pour ne pas aboutir à un faux consensus et pour considérer toutes les informations pertinentes. Il faut pour cela respecter certaines « règles ». Ainsi, le rôle du leader est essentiel : il doit encourager chaque membre du groupe à exprimer des objections et des doutes concernant la conclusion proposée ; il doit accepter les critiques ; il doit enfin rester impartial dans un premier temps et n’exprimer ses préférences et ses attentes qu’après que les autres membres du groupe se sont exprimés. Le groupe a intérêt à utiliser différents moyens pour éviter un consensus trop rapide. Il peut par exemple se diviser en plusieurs comités pour discuter indépendamment et ensuite se retrouver pour évoquer les différences. Des experts extérieurs peuvent être invités à participer occasionnellement aux discussions et à remettre en question les points de vue du groupe. Enfin, à chaque réunion, une personne, au moins, peut jouer le rôle d’avocat du diable.
2.2
DANS QUELLES SITUATIONS LES GROUPES PRENNENT-ILS LES MEILLEURES DÉCISIONS ?
Le phénomène de pensée groupale nous alerte sur le fait que des discussions peuvent amener un groupe à prendre de mauvaises décisions. En général, la recherche en psychologie considère que les discussions de groupe mènent à une plus grande homogénéité des opinions 28, du fait de l’établissement de normes collectives (cf. première section de ce chapitre). Certains chercheurs sont arrivés à la conclusion que lorsque la bonne réponse peut facilement être expliquée aux membres du groupe, la performance du groupe tend à être aussi bonne que celle de l’individu le plus performant 29. Cependant, quand ce n’est pas le cas, la performance du groupe tend à être du même niveau que celle du membre moyen. Les groupes sont susceptibles de pren28 Einhorn, Hogarth et Klempner (1977) ; Hinsz, Tindale et Vollrath (1997). 29 Gigone et Hastie (1997).
Le décideur sous influence : l’émergence de la décision collective
221
dre les meilleures décisions quand le meilleur membre peut facilement justifier sa réponse. Il semble que la prise de décision collective soit améliorée par des facteurs qui intensifient la discussion, comme les règles de décision obligeant l’adoption unanime des solutions 30. De telles règles imposent un débat, afin de convaincre les membres minoritaires, et un véritable échange d’arguments. Certaines études utilisant un problème de survie sur la lune confirment cette hypothèse 31. Dans cette tâche, des groupes de 4 à 6 membres devaient décider quels objets, parmi une liste de 15 (tels que des bouteilles d’oxygène, de la nourriture, des balises de détresse), une équipe de cosmonautes échouée sur la lune devait prendre avec elle pour effectuer les 320 km la séparant de la base. Les groupes, qui avaient l’obligation de parvenir à un consensus (ce qui forçait le groupe à considérer les opinions des membres en minorité), sont souvent parvenus aux solutions envisagées par les experts de la NASA. De manière similaire, dans des délibérations de jurys fictifs de 12 personnes, la règle de l’unanimité (12-0) entraînait un doublement du temps de décision par rapport à la règle de la majorité (8-4) et une meilleure évaluation des faits. Cependant, il n’y avait pas de différences dans les verdicts rendus 32. Nous pouvons conclure que les bonnes décisions collectives ont plus de chances d’être prises quand les meilleurs membres peuvent aisément justifier leurs décisions au reste du groupe ou quand les conditions sont favorables à l’échange d’informations et d’arguments. Dans de tels cas, les décisions reposent sur des informations plus variées, et sont donc de meilleure qualité. Quand les pressions collectives mènent à l’adoption de normes inadéquates ou à une utilisation sélective de l’information, la discussion peut diminuer la qualité des décisions prises.
2.3
POLARISATION DU GROUPE ET PRISE DE RISQUE
La recherche sur la polarisation du groupe commence lorsqu’on découvre que, face à des décisions difficiles, des étudiants en gestion industrielle au Massachusetts Institute of Technology préféraient plus souvent des options risquées après discussion en groupe 33. Voici un exemple des problèmes de choix qui étaient soumis aux étudiants : M.A., un ingénieur en électricité, marié avec un enfant, travaille dans une grande entreprise d’électronique depuis la fin de ses études, il y 5 ans. On lui garantit un emploi à vie avec un salaire modeste mais correct. De plus, il bénéficie d’une pension pour sa retraite. En contrepartie, son salaire a peu de chance d’augmenter sensiblement durant sa carrière. Alors qu’il assiste à une convention, M.A. se voit proposer un poste dans une jeune entreprise à l’avenir incertain. Le nouveau travail est mieux payé et offre la possibilité d’une participation au capital de l’entreprise si elle résiste à la concurrence des grandes entreprises. Imaginez que vous conseillez M.A. 30 31 32 33
Doise (1993). Hall et Watson (1970). Hastie, Penrod et Pennington (1983). Stoner (1968).
222
La décision peut-elle se passer du décideur ?
Ci-dessous, se trouvent un certain nombre de probabilités concernant le futur financier de la jeune entreprise. Cochez la probabilité la plus faible que vous considéreriez raisonnable pour que le nouvel emploi soit intéressant. – La probabilité que l’entreprise soit saine financièrement dans quelques années est de 1/10 – La probabilité que l’entreprise soit saine financièrement dans quelques années est de 3/10 – La probabilité que l’entreprise soit saine financièrement dans quelques années est de 5/10 – La probabilité que l’entreprise soit saine financièrement dans quelques années est de 7/10 – La probabilité que l’entreprise soit saine financièrement dans quelques années est de 9/10 Cochez ici si vous pensez que M.A. devrait refuser l’offre quelles que soient les probabilités. Dans une première étude, des diplômés de gestion masculins devaient étudier un ensemble de douze problèmes similaires au précédent et donner leur avis personnel. Ensuite, les participants étaient regroupés par six et on leur demandait de rendre une décision unanime après discussion. On constatait alors que douze groupes, sur treize étudiés, avaient évolué vers une plus grande prise de risque, comparativement aux positions individuelles avant discussion. De plus, les participants devaient noter leur propre position après discussion. Globalement, on constatait encore une hausse du risque : environ 45 % des participants conservaient leur position, tandis que 39 % changeaient leur opinion pour un risque plus élevé, et seulement 16 % pour plus de prudence. Cet effet s’est avéré très robuste et a été retrouvé dans plus de 100 études menées dans une douzaine de pays différents. Cependant, on s’est rapidement rendu compte que cet effet n’était en fait qu’un cas particulier d’un phénomène plus général appelé « polarisation en groupe ». Tout d’abord, deux des douze problèmes utilisés dans ces premières expériences produisaient régulièrement des modifications vers plus de prudence plutôt que vers plus de risque. D’autres chercheurs pouvaient aussi rédiger des problèmes entraînant systématiquement un transfert prudent. Plus généralement, le choix de problèmes dans lesquels la vie ou le mariage d’une personne sont en jeu, ou dans lesquels la décision du protagoniste affecte une autre personne, comme une fiancée, la famille ou des parents, produit un transfert prudent 34. Par ailleurs, l’effet de polarisation a été observé dans des attitudes non liées au risque, par exemple dans des débats entre lycéens parisiens sur des questions telles que « le Général de Gaulle est-il trop vieux pour son importante mission politique ? », « L’aide américaine sert-elle toujours des fins économiques ? » 35. L’attitude individuelle moyenne concernant de Gaulle sur une échelle de –3 à +3 était légèrement favorable (0,9) ; après discussion en groupe elle devenait plus favorable (1,18). De la même manière, les attitudes individuelles concernant les Américains commençaient par être légèrement défavorables (–0,6), puis le 34 Brown (1986). 35 Moscovici et Zavalloni (1969).
Le décideur sous influence : l’émergence de la décision collective
223
ENCADRÉ 23
Brainstorming et perte de productivité Le brainstorming est une technique censée permettre de trouver des solutions créatives à tout type de problèmes. Ses règles sont les suivantes : 1. Dans un premier temps, les critiques ou les opinions divergentes sont écartées. 2. La fantaisie est bienvenue. Il est plus facile de partir d’une idée originale et de revenir ensuite à la réalité que de faire la démarche inverse. 3. Il faut de la quantité. Plus il y a d’idées, plus les chances de succès sont importantes. 4. Les associations d’idées sont recherchées. Il ne s’agit pas de se contenter de proposer ses idées, il faut aussi faire des suggestions permettant d’améliorer les idées des autres ou de combiner plusieurs idées. Dans une étude classique sur le brainstorming a, il a été demandé à des étudiants américains de travailler pendant une heure sur cinq problèmes tels que : « Supposez que les États-Unis souhaitent attirer d’avantage de touristes européens. Quelles sont les mesures que vous prendriez pour atteindre cet objectif ? » Certains participants étaient regroupés par cinq tandis que d’autres travaillaient seuls. La production des groupes a ensuite été comparée avec celle de 5 individus travaillant seuls. Les résultats étaient mesurés par la quantité et l’originalité des suggestions. Si deux personnes dans le groupe « agrégé » (travail individuel) proposaient la même idée, elle n’était comptée qu’une seule fois. Condition
Nombre d’idées différentes (en moyenne)
Nombre d’idées originales (en moyenne)
Vrai groupe de 5 personnes
37,75
10,8
Agrégation de 5 personnes travaillant seules
68,1
19,8
Les cinq personnes travaillant seules produisaient presque deux fois plus de solutions et idées originales que les cinq personnes travaillant ensemble. En effet, travailler seul permet de mieux se concentrer et évite le problème du conflit avec autrui. Cette étude, ainsi que d’autres, ont également montré que la stimulation engendrée par le brainstorming est plus que compensée par les interférences et les distractions inhérentes aux groupes. Il ressort finalement de ces expériences que le brainstorming donne des résultats décevants. On peut supposer que le plaisir éprouvé par la résolution collective de problèmes explique le recours fréquent à cette technique au sein de l’entreprise. Mais il serait plus profitable de demander d’abord aux membres du groupe de travailler individuellement, puis, dans un deuxième temps, de les réunir pour combiner leurs idées. Ainsi, le groupe augmenterait ses chances de trouver des idées originales, tout en profitant du sentiment de solidarité propre au travail en groupe. a. Taylor, Berry et Block (1958).
devenaient nettement plus après discussion (–1,09). Un effet de polarisation similaire a été noté dans une étude sur les attitudes d’étudiants en architecture par rapport à leur école : d’abord négatives, elles s’accentuaient dans ce sens après
224
La décision peut-elle se passer du décideur ?
discussion 36. Enfin, des études sur la prise de décision de jurys révélaient des caractéristiques similaires : les jurés expérimentaux initialement enclins à acquitter ou à condamner renforçaient souvent leur position après une discussion de groupe 37. Les processus d’influence normative et informationnelle ont tous deux été mis en avant pour expliquer le phénomène de polarisation de groupe. Par exemple, l’influence normative a été démontrée par la découverte que la simple exposition aux positions des autres (sans véritable discussion ou échange d’idées) suffisait à entraîner un changement d’opinion. En effet, en voyant que les autres avaient la même opinion qu’eux, les participants étaient susceptibles d’adopter un point de vue plus extrême 38. Cependant, l’influence informationnelle peut aussi jouer un rôle dans la polarisation du groupe. D’après certains chercheurs 39, les individus ont généralement plus de facilité à fournir des arguments en faveur de leur position plutôt qu’en défaveur. Ainsi, les membres d’un groupe favorables à une position (par exemple faire un investissement à risque dans l’hypothèse d’un gain futur important) vont produire plus d’arguments en faveur de leur position que contre, pendant la discussion de groupe. Ceci va entraîner la création d’un ensemble d’arguments, publiquement partagés, favorables à la position de départ (dans ce cas en faveur de la décision risquée). Après la discussion, chacun sera en possession de plus d’arguments favorables qu’au départ. Il aura donc plus de raisons de préférer sa position initiale après la discussion et sera plus confiant au moment de la défendre, ce qui entraîne ainsi un phénomène de polarisation du groupe. Ces recherches suggèrent que l’influence informationnelle joue un rôle plus important dans le processus de polarisation de groupe que l’influence normative.
2.4
RESPONSABILITÉ : EXPLICATION, JUSTIFICATION ET PRISE DE DÉCISION
Quand la prise de décision intervient dans un groupe, l’obligation d’expliquer sa position aux autres est susceptible d’affecter le jugement des individus et les processus de décision. Par exemple, des apprentis médecins, obligés d’expliquer leur raisonnement à un non-initié avaient de meilleurs résultats en termes d’assimilation des connaissances et de qualité de diagnostic 40. Le fait d’expliquer aux autres peut contraindre les décideurs à mieux articuler leurs enchaînements logiques, et à explorer plus en détails les différentes options, en particulier lorsque leurs interlocuteurs ne connaissent rien au domaine. Dans une autre recherche, quand on demandait aux individus de justifier leurs préférences, on observait une tendance commune dans les choix faits 41. Par exemple, dans des décisions de consommation pour un pack de six bières, les sujets devaient choisir entre 3 packs A, B et C : 36 37 38 39 40 41
Doise (1969). Brown (1986). Cotton et Baron (1980). Burnstein et Vinokur (1973). Pilkington et Parker-Jones (1996). Simonson (1989).
Le décideur sous influence : l’émergence de la décision collective
A.
Note de qualité : 50
Coût : $1.80
B.
Note de qualité : 70
Coût : $2.60
C.
Note de qualité : 40
Coût : $1.80
225
Les individus étaient plus enclins à choisir A quand on leur demandait de justifier leur choix que lorsqu’ils ne devaient pas fournir d’explications. Cet effet était prévisible, si on suppose que la justification force les gens à trouver des raisons de préférer un choix aux autres. L’option A offre le maximum de raisons, puisqu’elle est meilleure que B au niveau du prix, meilleure que C et moins bonne que B en terme de qualité, ceci donne deux raisons favorables contre une défavorable. L’option B offre deux raisons « pour » (meilleure que A et C en qualité) et deux raisons « contre » (plus chère que A et C). Quand on ne leur demandait pas de se justifier, les gens pouvaient être susceptibles de choisir B, simplement parce que ce pack avait une qualité supérieure. La vie en société oblige souvent à devoir justifier ses décisions aux autres. En effet, le but même de la prise de décision est souvent de produire une décision justifiable aux autres. Cette considération est connue de tout homme politique ou décideur devant gagner le soutien de supérieurs, de collègues, de subordonnés, d’amis, de membres de la famille, pour une décision. Alors qu’expliquer et justifier ses décisions aux autres peut déboucher sur une prise de décision améliorée (c’est, après tout, le principe de base des réunions et des audits dans les organisations), la recherche montre que ce n’est pas systématiquement le cas. Le fait de détenir des responsabilités peut avoir des effets paradoxaux et conduire le décideur à prendre des décisions moins rationnelles que celles qu’il aurait prises autrement. Par exemple, quand les gens savent qu’ils vont devoir expliquer leur décision, ils risquent de préférer une décision aisément justifiable en public à une décision maximisant l’utilité. Ceci peut se produire, par exemple, lorsqu’on discute d’un nouveau programme d’assurance maladie qui sauverait la vie de nombreuses personnes, au risque de tuer quelques autres personnes. Alors qu’une analyse en termes d’utilité favorise le programme, sur le principe utilitaire de la « plus grande satisfaction pour le plus grand nombre », il est extrêmement difficile de le justifier s’il cause des morts. Ce type d’effet a été démontré à l’aide d’une simulation de politique de programme de santé, dans laquelle des étudiants devaient se prononcer pour ou contre l’adoption d’un nouveau médicament anticoagulant 42. Selon les tests expérimentaux ce médicament était censé sauver un certain nombre de vies humaines (300, 600 et 900), mais avec un coût en vies lié aux hémorragies (respectivement 0, 100 et 300). Les décideurs responsabilisés, qui savaient qu’ils devraient justifier leur choix, étaient très défavorables au médicament si un nombre déterminé de personnes mourait et choisissaient plutôt de poursuivre les recherches avant de l’approuver, même si de nombreuses personnes mouraient entre temps. Cet effet était encore plus marqué quand il s’agissait de juger un médicament qui n’était pas encore introduit sur le marché, sans doute parce que le décideur responsabilisé se sentait encore plus responsa42 Tetlock et Boettger (1994).
226
La décision peut-elle se passer du décideur ?
ble des conséquences si son choix permettait l’introduction du nouveau médicament sur le marché. D’un autre coté, la responsabilité peut être bénéfique à la prise de décision, en particulier quand elle contraint les gens à faire plus d’efforts pour réfléchir au problème. Ainsi, elle peut réduire la tendance à continuer à croire en des idées discréditées. Par exemple, c’est un fait bien connu en perception sociale, la première impression tend à dominer ; les premières informations reçues sur un individu ont plus d’impact sur notre impression globale de cette personne que les informations suivantes : c’est l’effet de primauté. Ceci est dû entre autres à l’incapacité à prendre en compte l’information présentée ultérieurement. Ainsi, dans une simulation de procès pour meurtre 43, on a présenté à ses participants une longue liste d’arguments pour et contre la culpabilité de l’accusé. Deux ordres de présentation ont été établis. Dans un cas, la première moitié de la liste comprenait la plupart des arguments favorables à la culpabilité et la deuxième moitié la plupart des arguments défavorables ; dans l’autre cas c’était le contraire. Les participants qui n’avaient pas à justifier leur choix étaient très sensibles à l’effet de primauté : c’est à dire qu’ils étaient fortement influencés par les premiers arguments présentés. Les participants devant justifier leurs jugements étaient insensibles à l’effet de primauté. Cependant, le moment où la responsabilité était introduite avait un effet important : les participants qui étaient informés, après avoir lu les informations (plutôt qu’avant), qu’ils devraient justifier leur décision étaient tout aussi exposés à cet effet que les participants non-responsabilisés. En général, le fait de réclamer des explications aux gens améliore la prise de décision quand cette exigence est formulée avant l’analyse de l’information. Cependant, si la demande d’explications est faite après que la décision a été prise, elle peut causer une dégradation de la performance décisionnelle, car les gens s’accrochent à un choix erroné, alors même qu’on leur fournit de nouvelles informations leur permettant d’améliorer leur première décision. Malgré tout, être responsabilisé avant la prise de décision peut conduire à des décisions sous optimales, si l’objectif du décideur est d’arriver à une décision facilement défendable face à un groupe de référence, plutôt qu’à une solution optimisant les différents attributs essentiels.
3. Prise de décision individuelle et comportements collectifs Que se passe-t-il lorsqu’une multitude d’acteurs interagissent ? Quelles sont les décisions finales résultant de ces interactions ? La description du fonctionnement de certains marchés illustre bien la richesse des interactions sociales entre individus et l’importance du groupe (au sens large) dans la prise de décision. Si le groupe a tant d’influence sur la prise de décision, peut-on mettre en évidence des effets différenciés des groupes sur la décision individuelle en fonction du type de groupe ? Cer43 Tetlock (1983).
Le décideur sous influence : l’émergence de la décision collective
227
tains travaux de psychologie sociale culturelle essaient de répondre à cette question en étudiant les styles de prise de décision en fonction de la culture du groupe.
3.1
LES INTERACTIONS SUR LES MARCHÉS : L’EFFET DES ANTICIPATIONS DES CROYANCES DES AUTRES ACTEURS
Keynes comparait les marchés à des concours de beauté, où les juges doivent non seulement tenir compte de leurs préférences quant au plus beau visage, mais aussi de celles des autres juges. Discuter avec les acteurs des marchés et se laisser ainsi influencer par eux dans les choix boursiers fait partie intégrante du métier de financier. Ce dont les financiers ont moins conscience, c’est de l’influence que leur propre état d’esprit peut avoir sur l’utilisation de l’information. Imaginons la différence d’état d’esprit entre un investisseur qui est sur un marché stable et un investisseur sur un marché risqué. Les investisseurs sur les marchés stables à long terme, comme le marché des actions aux États-Unis entre 1949 et 1960, qui a connu une hausse quasi continue de 600 % sur la période, auront tendance à développer une grande confiance en eux. Ils auront le sentiment que leurs stratégies d’investissement sont efficaces, puisqu’ils gagnent de l’argent. En revanche, les investisseurs sur les marchés instables à long terme, comme le marché des actions aux États-Unis entre 1960 et 1982, qui a globalement perdu 9 % suite à des fluctuations très importantes, seront peu confiants. La recherche en psychologie sociale montre que les gens sûrs d’eux et de leur jugement tiennent faiblement compte de l’opinion des autres pour prendre leurs décisions. Le contraire est vrai pour ceux qui n’ont pas confiance en eux. Suivant ce raisonnement, certains chercheurs 44 ont déduit que les investisseurs sur le marché stable et croissant de la période 1949-1960 étaient susceptibles d’avoir un esprit plus indépendant que ceux du marché instable de 1960-1982. Les stratégies des investisseurs d’esprit indépendant devraient, en principe, être peu affectées par les nouvelles informations extérieures. Ces idées ont été confirmées. Par exemple, les marchés ont moins réagi aux élections présidentielles pendant la période 1949-1960 que pendant la période 1960-1982 : le volume moyen des transactions au lendemain d’élections n’a augmenté que de 9,2 % entre 1949 et 1960 contre 47,3 % entre 1960 et 1982. Dans une autre analyse, ils montrent que le marché de 1949-1960 a moins réagi aux catastrophes aériennes que celui de 1960-1982. Les transactions d’actions de la compagnie et/ou du constructeur impliqués dans une catastrophe ont augmenté de 29 % pendant 1946-1960 contre 166 % pendant 1966-1982. Des analyses plus ciblées sur les crises et croissances de ces périodes parviennent à des résultats similaires : les investisseurs réagissent plus aux informations extérieures pendant les crises que pendant les périodes de croissance. Les conclusions de ces chercheurs coïncident avec de nombreuses expériences montrant que les individus qui doutent d’eux sont plus susceptibles de se laisser influencer par les autres. Comme nous allons le voir, les phénomènes de pression sociale peuvent aussi expliquer des comportements irrationnels de la part des organisations ou des groupes de travail. 44 Schachter et al. (1985).
228
3.2
La décision peut-elle se passer du décideur ?
UN EXEMPLE DE PHÉNOMÈNE DE CONTAGION DANS UN « GRAND » GROUPE : LES BULLES SPÉCULATIVES SUR LES MARCHÉS
Les économistes s’intéressent généralement aux résultats globaux des décisions prises individuellement et rationnellement par les individus : ils étudient en effet les équilibres qui émergent sur des marchés. Ces équilibres sont tout simplement la résultante d’un ensemble de décisions individuelles. Par exemple, les économistes expérimentaux et les chercheurs en finance comportementale s’intéressent de près au phénomène de contagion sur les marchés (on parle également de comportements moutonniers ou encore de cascades informationnelles). Comment et pourquoi une nouvelle idée (acheter l’action X plutôt que l’action Y par exemple) se propage-t-elle rapidement sur un marché ? Cette « contagion » des idées est-elle efficace ? Est-elle la manifestation de comportements rationnels ? L’engouement pour la tulipe en Hollande en 1634-1637 ou la spéculation sur la compagnie du Mississippi entre 1718 et 1721 en France et sur la South Sea Bubble à Londres en 1719-20 45 sont des exemples classiques de ce phénomène. Suite à un phénomène d’engouement collectif, un bien ou une action sont demandés en masse par les acheteurs sur le marché. Le prix du bien s’accroît, une bulle se forme. Soudainement, lorsque les acteurs réalisent que la valeur monétaire du bien n’a rien à voir avec sa vraie valeur, la bulle éclate, la demande baisse, les prix chutent. Comment ces phénomènes de bulles spéculatives sont-ils expliqués par les économistes ? Contrairement à l’intuition, l’analyse économique des bulles spéculatives montre que des agents parfaitement rationnels (au sens économique strict du terme) peuvent provoquer des phénomènes de bulles spéculatives 46. En effet, les bulles ne vont pas à l’encontre de la théorie des anticipations rationnelles 47 ; elles montrent simplement que les anticipations, établies de manière raisonnée par les investisseurs, en fonction des informations qu’ils avaient sur la valeur future des tulipes, des actions de la compagnie du Mississippi et de South Sea Bubbles, se sont avérées fausses. La théorie des jeux, reposant sur l’hypothèse de comportement rationnel, explique pourquoi les bulles éclatent. Cette théorie a aussi été utilisée pour expliquer les effets de panique dans les foules 48. Les investisseurs sont conscients de ce que les autres sont susceptibles de faire et ont deux envies contradictoires : acheter ou vendre des actions. S’ils achètent en même temps que les autres, leurs actions vont prendre de la valeur, et tout le monde y gagne. Si les investisseurs qui veulent acheter le peuvent, c’est parce qu’il y a sur le marché, des investisseurs qui sont prêts à vendre. Pour ces vendeurs, la valeur réelle des biens échangés est au plus aussi élevée que le prix d’achat proposé par les acheteurs. Tant que les acheteurs considèrent que le prix d’achat est inférieur à la valeur du bien, la démarche rationnelle est d’acheter. Cette décision fait monter le prix, agissant comme une prophétie auto-réalisatrice. Cependant, à un certain niveau, les détenteurs de l’action estiment que l’action est 45 46 47 48
Mackay (1852). Banerjee (1992). Flood et Garber (1994). Brown (1965).
Le décideur sous influence : l’émergence de la décision collective
229
surévaluée et est condamnée à se dévaluer. Ici l’attitude rationnelle est alors de vendre au plus vite afin d’obtenir le prix à la vente le plus élevé possible. Cependant, puisque les autres acteurs du marché font le même raisonnement, tous les détenteurs d’actions vendent en même temps ce qui provoque une chute catastrophique du cours de l’action. Inévitablement, plus ils vendent tardivement, plus ils perdent. Les courtiers qui comprennent la psychologie de tels mouvements de marché et qui réagissent assez rapidement parviennent donc à générer des profits considérables sur le marché financier, sans même avoir la moindre idée de la valeur réelle des produits qu’ils échangent. L’intérêt de l’étude des phénomènes de bulles spéculatives en économie est de mettre l’accent sur l’importance des croyances dans le fonctionnement des marchés. Pour l’analyse économique, l’intérêt de ces travaux est certain. Ils permettent de rendre compte de phénomènes spéculatifs apparemment irrationnels à partir d’un cadre d’analyse centré sur des comportements rationnels. Cette analyse a par ailleurs le mérite de mettre en avant l’existence d’un contexte propice aux pressions sociales. Les tulipes tenaient leur valeur de leur rareté, elles étaient appréciées des riches familles hollandaises 49. Les compagnies du Mississippi et de South Sea utilisaient de nouvelles opérations financières expérimentales appuyées par le gouvernement, qu’un homme sensé, ne bénéficiant pas d’autres informations plus confidentielles, pouvait raisonnablement croire pertinentes. Il a été envisagé des explications psychologiques aux phénomènes de contagion, qui peuvent compléter la vision rationnelle du phénomène proposée par l’analyse économique. C’est dans les situations d’incertitude que les individus sont le plus susceptibles d’être influencés par ce que font les autres pour décider comment ils évaluent un objet déterminé (tulipe, peinture, action) 50. Ceci pourrait expliquer pourquoi les gens continuent d’investir dans les actions blue chips des compagnies telles que Général Motors, alors même que ces actions ont constamment des résultats inférieurs à ceux du marché. L’heuristique d’accessibilité 51 a également été invoquée pour expliquer la sur-réaction aux informations : les personnes attachent trop d’importance aux informations récentes. Malgré tout, les théories de la contagion sont confrontées à la difficulté d’expliquer pourquoi de telles bulles grandissent d’abord, puis se stabilisent ou éclatent. La théorie de l’impact social dynamique 52, par exemple, explique comment la contagion d’idées s’arrête naturellement, arrivant à un état de stabilité. Leur modèle suppose une influence réciproque des individus, par leurs conversations et autres moyens de communication. Dans les modèles de simulation informatique de ces chercheurs, les individus interagissent en permanence avec leurs voisins et, ce faisant, conduisent les autres à changer d’attitude dans leur sens. Plus un individu interagit fortement avec d’autres qui sont en faveur d’une attitude spécifique (par exemple, pro-IVG), plus il a de chances d’adopter une attitude similaire ; et plus il interagit avec d’autres personnes qui sont contre cette position (c’est à dire anti-IVG) plus il est susceptible d’être lui aussi contre cette position. On 49 50 51 52
Garber (1990). Festinger (1954). Tversky et Kahneman (1974). Nowack, Szamrej et Latané (1990).
230
La décision peut-elle se passer du décideur ?
serait alors tenté de croire que dans une population majoritairement en faveur d’une position (par exemple, 60 % en faveur de l’IVG), l’ensemble de la population soit peu à peu convertie à cette position, puisque les individus interagissent, en moyenne, plus avec des « pro-IVG » qu’avec des « anti-IVG ». Dans les faits, les minorités ne sont, en général, pas éliminées dans ces situations, et descendent rarement sous le seuil des 30 %. Cependant, ceci ne doit pas être confondu avec l’effet dit « d’espace social ». Dans les faits, des voisins ayant des orientations comparables se rassemblent dans un même espace social, à tel point que s’établissent des « ghettos d’opinions » dans lesquels les minorités forment des majorités globales. Dans ces rassemblements, les minorités continuent d’interagir entre elles plus fortement qu’avec les membres de la majorité, créant ainsi les conditions propres à maintenir des visions majoritaires.
3.3
IRRATIONALITÉ INDIVIDUELLE ET RATIONALITÉ DU MARCHÉ
L’explication économique des bulles spéculatives met l’accent sur la rationalité des agents. Toutefois, toutes les bulles spéculatives ne résultent pas des comportements rationnels des agents. Dans certains cas, cette rationalité peut être sévèrement remise en cause. Qu’en est-il alors de la rationalité globale du marché ? Une réponse à cette question, connue sous le nom d’hypothèse de Hayek, est de considérer que les marchés sont rendus rationnels par l’existence, sur le marché, d’acteurs rationnels qui déterminent les prix. Ainsi, ces acteurs du marché, capables d’éviter la sur-réaction liée aux informations de marché, ou d’éviter les biais d’interprétation, ont le plus de chances de gagner de l’argent en vendant cher et en achetant bon marché. Une démonstration frappante de l’hypothèse de Hayek a été faite sur le marché des actions politiques d’Iowa 53. Ces chercheurs ont mis en place un marché d’actions, avec des parts en candidats à la présidence des États-Unis de 1998. Les parts étaient émises en George Bush, Michael Dukakis, Jesse Jackson, et en « reste du lot » en avril 1998. Elles étaient échangées dès le 1er juin jusqu’à la fin des élections, en novembre 1998. Les dividendes finaux pour ces parts étaient calculés en fonction de l’estimation du pourcentage de voix pour chaque candidat. Ce prix permettait de calculer un ratio servant à prédire le résultat des candidats aux élections. Cette démarche a permis de prévoir le résultat final plus efficacement que six sondages professionnels, ce qui met en évidence l’efficacité du marché. Ce résultat a été renouvelé lors des élections présidentielles de 1992 54. Cependant, la plupart des profits ont été réalisés par une minorité d’acteurs : les « courtiers marginaux » 55. Selon eux, les courtiers marginaux résistaient à certains biais de jugement propres à la majorité. Tout d’abord, la majorité des courtiers semblait avoir été victime de l’effet de faux consensus : c’est à dire qu’ils surestimaient le nombre de personnes partageant leurs préférences (par exemple, en ce qui concernait Bush et Dukakis) et cherchaient donc à acheter plus de parts de leur candidat favori. De plus, la plupart des courtiers témoignaient d’une perception sélective : par exemple, ils étaient plus enclins à croire que leur candidat préféré 53 Forsythe et al. (1992). 54 Lopes (1994). 55 Forsythe et al. (1992).
Le décideur sous influence : l’émergence de la décision collective
231
avait remporté les trois débats télévisés. Ainsi, ces courtiers, qui croyaient en la victoire de leur candidat aux débats TV, augmentaient leur portefeuille d’actions de ce même candidat dans les jours suivants. Quant aux courtiers marginaux, minoritaires, ils n’affichaient pas de tels biais dus au parti-pris pour un candidat. Ils agissaient principalement en arbitres, achetant des actions Dukakis aux supporters (biaisés) de Bush et les revendant aux partisans (eux aussi biaisés) de Dukakis. Les courtiers marginaux se révélaient être ceux qui soumettaient des commandes limites (des offres incluses dans le lot des offres sans pour autant qu’il y ait de transaction immédiate) à des prix proches du prix de marché. Ceci leur permettait d’échanger même quand le marché variait plus que leurs croyances (ou prévisions) sur les événements futurs. Les partisans de Bush ou Dukakis, parmi ces courtiers marginaux, ne montraient pas de différences significatives dans leurs achats nets d’actions Bush ou Dukakis, tandis que les courtiers non marginaux achetaient beaucoup plus d’actions de leur candidat favori. En somme, les biais de jugement au niveau individuel (par exemple, le biais de disponibilité) et les processus de jugements sociaux (par exemple, la comparaison sociale) peuvent servir pour expliquer l’existence de la contagion. La théorie de l’impact social dynamique peut expliquer la stabilisation de la diffusion des opinions, et la théorie des jeux permet d’expliquer la nature catastrophique des bulles financières. Finalement, l’hypothèse de Hayek aide à expliquer la rationalité des marchés. Même si le marché est composé d’un grand nombre d’individus irrationnels, la présence de quelques individus jouant le rôle d’arbitres permet de maintenir la rationalité des prix du marché. Ces arbitres ont, bien sûr, toutes les chances de réaliser des profits en vendant au prix haut et en achetant au prix bas.
3.4
APPARTENANCE CULTURELLE ET DÉCISION
Ce chapitre a montré que les processus de prise de décision sont fortement influencés par le groupe social. Si cela est vrai, alors on devrait s’attendre à ce que les styles de prise de décision varient selon les cultures et en fonction des normes sociales en vigueur dans ces cultures. Bien que les analyses culturelles croisées soient très compliquées, à cause des problèmes liés, par exemple, à la difficulté de traduire fidèlement les questionnaires ou aux équivalences de signification entre certains comportements culturels, la question des différences culturelles dans la prise de décision est, depuis peu, examinée de façon systématique. Une différence fondamentale entre les cultures occidentales et non-occidentales a été établie à travers les notions d’individualisme et de collectivisme 56. Les cultures individualistes sont celles dans lesquelles la famille nucléaire prédomine et l’identité individuelle est importante. Les cultures collectivistes sont celles où la famille étendue prédomine et où l’identité des individus dépend fortement de leur groupe social (le clan ou l’entreprise, par exemple). Les cultures individualistes sont incarnées par des pays comme les États-Unis, la Grande-Bretagne et la France, tandis que les cultures collectivistes sont présentes en Chine, en Inde ou au Japon. 56 Smith et Bond (1998).
232
La décision peut-elle se passer du décideur ?
Une méta-analyse montre que les cultures collectivistes font preuve d’une conformité plus affirmée que les cultures individualistes 57. Certains chercheurs ont démontré l’existence de styles de prise de décision en contexte organisationnel compatibles à la fois avec les valeurs individualistes et avec les valeurs collectivistes 58. Ils ont étudié des membres d’équipe aux États-Unis, en Grande-Bretagne et au Japon, pour voir quelle était la probabilité qu’ils entreprennent certaines actions quand leur équipe était confrontée à un problème. Alors que les Américains et les Anglais étaient enclins à s’appuyer sur leurs expériences et formations passées, les Japonais avaient tendance à consulter leurs coéquipiers. Il est intéressant de remarquer que les supérieurs étaient plus satisfaits du travail quand l’équipe utilisait les méthodes nationales. C’est à dire que les supérieurs américains considéraient que les équipes étaient plus efficaces quand elles se basaient sur leurs expériences, tandis que les supérieurs japonais préféraient quand elles s’appuyaient sur les manuels d’entreprise. Il n’est pas évident de déterminer si ces différences perçues reflètent des différences réelles ou simplement des préférences culturelles sur les méthodes de prise de décision. Quoi qu’il en soit, les résultats illustrent le fait que des sociétés différentes adhérent à des normes de prise de décision différentes, et que les groupes suivent les stratégies favorisées par leurs supérieurs dans cette culture. Les différences culturelles peuvent prendre d’autres formes. Par exemple, un jeu de dilemme social (cf. chapitre 6) a été utilisé pour étudier les perceptions d’équité et de comportement chez des participants néerlandais et américains 59. Les dilemmes sociaux mettaient en scène des situations où les individus avaient une tendance initiale à être égoïstes (s’accaparant un bien public le plus possible), mais où ils encouraient un risque collectif d’épuisement des stocks de ce bien. Un exemple de ce genre de situation est le milieu de la pêche, dans lequel chacun a intérêt à attraper le maximum de poisson, s’exposant alors à la raréfaction du poisson, synonyme de désastre collectif. Dans le jeu expérimental, chacun des six participants dispose d’un ordinateur qui affiche l’évolution de la réserve commune des ressources. Au début, la réserve se monte à 300 unités. Ces unités ont une valeur en argent réel. Après que chacun des joueurs a pris ce qu’il veut, un nombre variable d’unités (environ 30) est ajouté à la réserve. Les joueurs sont informés des quantités prises par les autres à la fin de chaque tour. Ils savent aussi que l’épuisement de la réserve signifie la fin du jeu. Les participants ont pour instruction de récupérer le maximum d’unités et de faire durer le jeu le plus longtemps possible. En réalité, le dispositif était manipulé par les expérimentateurs. Dans certaines conditions, les autres participants semblaient se comporter plus ou moins de la même manière, créant ainsi une égalité apparente. Dans d’autres conditions, les comportements des participants différaient complètement : certains se comportaient comme de véritables gloutons, tandis que d’autres avaient des demandes plus modestes. Le changement moyen de la taille de la réserve était aussi manipulé, afin de faire croire à une augmentation, une diminution ou une stabilisation du niveau des stocks. 57 Bond et Smith (1996). La conformité était mesurée par la tâche de jugement aligné de Asch (1956), cf. section 1 de ce chapitre. 58 Smith, Peterson et Misumi (1993). 59 Samuelson, Messick, Rutte et Willke (1984).
Le décideur sous influence : l’émergence de la décision collective
233
Lorsqu’il n’y avait pas danger réel d’épuisement de la réserve, les participants avaient tendance à se servir beaucoup plus que lorsqu’un épuisement des réserves était possible. Quand l’épuisement était imminent, ils diminuaient leurs demandes, même si elles avaient toujours été modérées. Il était aussi demandé aux participants s’ils voulaient qu’un leader alloue les ressources au tour suivant. Cependant, on a constaté des différences nationales dans les réactions concernant les variations perçues chez les autres joueurs. En situation de précarité, des étudiants américains (de Santa Barbara) avaient tendance à prendre plus pour eux, et leur désir de voir un leader distribuer les ressources n’augmentait pas. Quant aux étudiants néerlandais (de Groningen), ils n’augmentaient pas leurs propres récoltes, mais tendaient à vouloir élire un leader chargé de distribuer les ressources. Dans les cas de consommation excessive de la part des autres, les américains semblaient penser qu’ils ne devaient pas être les « dindons de la farce » et, par conséquent, participaient à cette consommation excessive. Les néerlandais, de leur côté, semblaient faire preuve de solidarité : ils n’augmentaient pas leur part et encourageaient le contrôle social en se regroupant pour élire un leader chargé d’imposer une distribution équitable. Alors que les américains concevaient la distribution inégale comme morale et l’élection d’un leader comme un acte dictatorial inacceptable, les néerlandais avaient une vision opposée et considéraient l’injustice comme immorale et le contrôle social comme moralement nécessaire. Ces études illustrent le fait que des groupes différents peuvent avoir des normes différentes sur ce qui constitue une attitude acceptable dans de telles situations, résultant en des comportements différents. Les études futures contribueront sans doute à élucider les effets de la culture sur le comportement collectif.
4. Conclusion La prise de décision collective va donc bien au-delà d’une simple combinaison de réponses individuelles. Les membres de groupes s’influencent réciproquement, entraînant l’établissement de normes collectives. Ces processus expliquent le développement de « cultures collectives » dans les organisations ou les nations. Les pressions de conformité fonctionnent souvent pour supprimer l’innovation et le désaccord, aboutissant à des décisions sous-optimales, surtout dans les situations ambiguës dans lesquelles les individus possédant la meilleure réponse ne peuvent la justifier de manière convaincante aux autres membres du groupe. Ceci est à l’origine du phénomène de « réflexion collective », où des groupes de décideurs s’isolent de la réalité et produisent des mauvaises solutions. D’un autre côté, les procédures de prise de décision collective encourageant l’échange d’idées et l’expression des désaccords sont susceptibles de faciliter les prises de décisions optimales. Savoir qu’on devra justifier sa décision change souvent les processus de prise de décision, parfois pour le meilleur, parfois pour le pire. Ceci est une découverte importante pour les managers qui envisagent de responsabiliser leurs employés pour leurs décisions et leurs actions. Les processus de groupes, dans les agrégats, peuvent conduire à la contagion, et à la création puis à l’éclatement de bulles spéculatives dans les marchés financiers. En tout cas, un comportement rationnel de marché peut émerger d’une collectivité large-
234
La décision peut-elle se passer du décideur ?
ment composée d’individus irrationnels, à partir du moment où certains individus rationnels profitent des erreurs d’estimation du marché, achètent à bas prix et revendent cher. Le nouveau courant de recherche en finance comportementale 60 a d’ailleurs pour thème d’étude principal l’analyse des processus psychologiques à la base de l’irrationalité du marché. L’objectif est de comprendre comment certains investisseurs peuvent prévoir, avec plus de précision que d’autres, les mouvements futurs du marché et les exploiter. Enfin, il y a des différences culturelles marquées dans les styles de prise de décision, telles que la sensibilité aux pressions normatives dans les sociétés collectivistes et individualistes, et les idées sur l’équité pour l’allocation et la distribution des ressources dans des groupes nationaux.
60 Statman (1995).
Chapitre 9
Décideurs et organisations : dans les coulisses de la décision collective Bénédicte VIDAILLET
Sommaire 1 La décision comme pré-requis de l’efficacité des organisations
237
2 Vers une critique de la décision : entre incrémentalisme et jeux de pouvoir
240
3 Les théories critiques : l’organisation sans décision
247
4 Conclusion
256
236
La décision peut-elle se passer du décideur ?
Une célèbre épigramme souligne que « l’économie tout entière se préoccupe de savoir comment les gens font des choix ; la sociologie tout entière se préoccupe de savoir comment ils n’ont pas à faire de choix » 1. L’étude de la décision dans les organisations se situe entre ces deux extrêmes. Elle pose le problème de la transition entre un modèle du comportement individuel et une théorie du comportement d’un système, composé de ces mêmes individus. Certes, les théories du comportement de choix individuel et celles de la décision organisationnelle ont une histoire de fertilisation croisée. Les premiers travaux sur la décision dans les organisations s’inspiraient d’une volonté de représenter la décision comme un choix rationnel, bien que sujet à de sévères limites cognitives, tandis que certains travaux en théorie comportementale de la décision étaient influencés par des spéculations relatives aux organisations. Ces liens résultent d’un héritage intellectuel commun à ces deux champs : le modèle du choix rationnel (cf. l’introduction de cet ouvrage et le chapitre 1). Celui-ci définit une décision comme résultant de l’évaluation d’alternatives, en fonction de leurs conséquences futures, au regard de préférences préalablement établies. Malgré ces racines communes, l’étude de la décision individuelle et celle de la décision organisationnelle diffèrent. Dans les méthodes tout d’abord. La plupart des recherches sur l’individu sont expérimentales, et essaient d’identifier des régularités sur des aspects particuliers de la prise de décision, tels que le traitement de l’information, les règles de décision, etc. La recherche sur la prise de décision dans les organisations est de nature essentiellement théorique. Certes, elle s’appuie sur de nombreuses observations empiriques, mais il s’agit moins d’identifier ou de mettre à jour des phénomènes que d’en construire une interprétation plausible, en particulier quand ils semblent étranges au regard de la rationalité. Bien que les différences méthodologiques entre l’étude de la décision individuelle et celle de la décision organisationnelles soient importantes, elles sont probablement moins significatives que les différences substantives. Par exemple, alors que les travaux sur le choix individuel s’intéressent à la manière dont les personnes traitent les préférences, les attentes, les probabilités ou l’information, les recherches récentes sur les organisations font ressortir que les décisions sont modelées par les règles, les rôles, l’expérience et le passé plutôt que par une anticipation du futur, ou que des décisions peuvent être prises sans que les conflits de préférences, d’attentes ou de croyances soient pour autant résolus. Si les deux courants diffèrent, c’est qu’ils ont des objets différents. L’étude de la décision organisationnelle fait partie du vaste champ de l’étude des organisations, qui se préoccupe en premier lieu d’expliquer l’action collective et organisée. En conséquence, la recherche sur la décision dans l’organisation a connu un processus d’évolution similaire à celui du champ dans lequel elle s’inscrit. La décision organisationnelle a été abordée à travers une extrême variété d’approches. Les comportements de choix ont été étudiés à l’aide de modèles de choix rationnels issus de l’économie et des techniques de modélisation économique et statistique. Les aspects comportementaux ont été discutés par les théoriciens des organisations, les sociologues et les psycho-sociologues. Enfin, les phénomènes cognitifs en jeu dans la prise de décision ont fait l’objet de la psychologie. L’objectif de ce chapitre n’est pas de 1
Duesenberry (1960).
Décideurs et organisations : dans les coulisses de la décision collective
237
rendre compte de cette diversité. Il est de montrer comment la conception de la décision — et du décideur ! — a évolué dans le cadre plus large de la théorie des organisations : alors qu’elle paraissait centrale pour l’analyse et la compréhension de l’action collective, l’idée de décision — et de décideur — a été fortement remise en cause, au point que certains paradigmes proposent de l’oublier, au motif qu’elle correspondrait à une vision erronée du fonctionnement des organisations. Élaboré à partir de matériaux issus de la théorie des organisations, qui prend comme unité d’analyse l’organisation et ses membres, ce chapitre s’articule en trois parties. Dans la première, on montrera comment l’approche classique et néo-rationaliste de l’organisation met la décision au cœur du débat, en la posant comme prérequis de l’efficacité organisationnelle. La partie suivante présente un premier niveau d’évolution dans la conception de la décision : certes, les organisations prennent des décisions, ou plutôt, on prend des décisions en leur sein, mais le lien entre celles-ci et l’efficacité organisationnelle est remis en question. Enfin, la dernière partie entre plus avant dans une critique radicale de la décision : ne peut-on penser l’action collective sans faire appel au concept de décision ?
1. La décision comme pré-requis de l’efficacité des organisations 1.1
LES CLASSIQUES ET LES PRÉ-THÉORIES DE LA DÉCISION
Les premières théories administratives, qui se donnent pour objectif de penser l’organisation afin d’en améliorer le fonctionnement, vont définir des conditions propices à l’émergence de la décision comme concept structurant pour l’étude des systèmes organisés. En ce sens, ils sont fondateurs de la recherche contemporaine sur la décision dans l’organisation. Ainsi, bien que Taylor 2 ne se soit pas intéressé spécifiquement au processus de décision, ses travaux relatifs à l’organisation scientifique du travail affectent directement ce sujet. C’est avec Taylor que l’organisation va être posée comme lieu et objet de rationalisation des processus, par l’utilisation conjointe de trois préceptes : le recours systématique à l’étude des temps et des mouvements pour définir la meilleure manière d’exécuter une tâche ; la division systématique des activités de conception et d’exécution, les premières étant confiées à des experts et les secondes à des ouvriers soigneusement sélectionnés ; et la stimulation adéquate de l’ouvrier afin qu’il travaille selon la méthode définie, à la cadence souhaitable. Cette conception de l’organisation pose implicitement les postulats de la théorie classique de la décision organisationnelle. La séparation entre conception et exécution des tâches et des processus correspond à une séparation entre conception et exécution des décisions. La recherche d’un système simplifié de stimulation de l’ouvrier évacue la question des conflits d’intérêts, des rapports de pouvoir et des enjeux dont la décision peut faire l’objet. Dans une perspective similaire, les théories de gestion développées ultérieurement en France 3 s’appuient sur une conception de l’entreprise organisée, implicite2
Taylor (1911).
238
La décision peut-elle se passer du décideur ?
ment, autour des processus de décision. La gestion y est définie comme un processus de planification, d’organisation, de direction, de coordination, et de contrôle, et l’organisation comme un ensemble de postes de travail précisément définis, organisés hiérarchiquement selon des voies de décision et de communication. II revient au chef d’entreprise, figure toute-puissante du décideur, de définir et de chercher à atteindre les objectifs de l’organisation, puisqu’il est à la fois l’instrument du propriétaire et le seul mandaté par lui pour exercer une autorité sur l’organisation. Plus généralement, dans ces conceptions, la structure organisationnelle ne peut fonctionner que grâce à la centralisation décisionnelle caractéristique du sommet hiérarchique, et au relais efficace du système d’autorité qui transmet les décisions et coordonne les activités dans le sens souhaité. Le pouvoir formel concentre le pouvoir de décision, accompagné de la maîtrise de l’information et des moyens de contrôle. Ces théories de l’organisation qui envisagent des systèmes rationnels fonctionnant de la manière la plus efficace possible placent, et pour longtemps, le concept de décision et la figure du décideur au centre des processus organisationnels. La décision est associée aux caractéristiques de fragmentation (préparation, décision, exécution) de faible intérêt consacré à l’exécution et de liberté de choix du décideur, placé au sommet hiérarchique. Plus récemment, on retrouve ces éléments dans les travaux qui réduisent la rationalité de l’organisation à celle de la coalition dominante 4 : les organisations sont supposées être des instruments rationnels, permettant à leurs propriétaires, dirigeants ou administrateurs d’atteindre leurs objectifs. Leur rôle consiste, entre autres, à faire disparaître d’éventuelles zones d’irrationalité en jouant de leurs moyens de contrôle et de leur pouvoir.
1.2
LA DÉCISION AU CŒUR DE LA SCIENCE ADMINISTRATIVE
C’est avec Simon 5 que la décision est explicitement mise au centre de la science dite « administrative ». Simon entend en effet fonder les bases d’une science nouvelle qui serait la science de la décision. La science administrative se donne donc pour objet, selon lui, d’améliorer le circuit et la qualité des décisions au sein des organisations. La décision concerne tous les membres organisationnels qui sont inscrits dans un système d’autorité et d’influence. II y a autorité lorsqu’un individu accepte une décision sans examen critique, soit parce qu’il dépend hiérarchiquement de celui qui impose la décision, soit parce qu’il n’est pas suffisamment compétent pour la remettre en cause. L’influence s’exerce quand un individu se laisse volontairement guider par les choix d’autrui, dès lors qu’il a été convaincu. La science administrative doit permettre de développer la rationalité des décisions que prend l’individu, la rationalité étant entendue au double sens de cohérence de la décision par rapport aux valeurs du groupe et de sa cohérence par rapport à l’information disponible. La rationalité décisionnelle se développe donc d’abord si l’individu s’identifie aux normes et objectifs de l’organisation. Cette identification est complexe et peut entrer en contradiction, au sein même de l’organisation, avec les 3 4 5
Fayol (1970). Donaldson et Lorsch (1983) ; Hambrick et Mason (1984). Simon (1945).
Décideurs et organisations : dans les coulisses de la décision collective
239
objectifs et valeurs du sous-groupe auquel il appartient. L’équilibre de l’organisation est de ce fait fragile et résulte d’un compromis entre les intérêts des participants. Dans ce contexte, les systèmes de communication de l’entreprise sont essentiels, puisqu’ils sont la condition d’une transmission efficace de l’information, considérée comme la clé de voûte de la rationalité décisionnelle. Le postulat fait ici est que la décision est fragmentée, décomposée en fonction du rôle et des capacités de chacun, d’où l’importance d’un système de communication efficace pour intégrer les différentes composantes de la décision. L’apport de cette approche est considérable, d’une part parce qu’elle renouvelle la théorie administrative en la centrant sur la décision, d’autre part parce qu’elle remet en cause deux conceptions des théories de la décision antérieures. Le point commun de ces conceptions était de postuler la décision comme un acte simple et un moment. La décision n’est plus un acte condensé en un moment déterminé et court, mais au contraire le produit d’un processus complexe étalé dans le temps. En conséquence, elle n’est plus un moment libre, échappant aux déterminismes, puisqu’elle est le produit de ce processus. Cette évolution dans la conception de la décision organisationnelle est la conséquence d’une évolution fondamentale dans la conception du fonctionnement organisationnel. Elle s’inscrit dans une vision systémique de l’organisation 6. Composée de sous-systèmes, celle-ci recèle un ensemble de conflits potentiels, qu’elle s’efforce d’éviter en trouvant des voies de compromis entre les intérêts de ces nombreux sous-systèmes. La décision peut alors être pensée comme le produit d’un processus complexe. Cette pensée sera par la suite développée et étayée de thèses complémentaires dont la tonalité générale repose sur la prise de conscience de la non-rationalité des décisions 7. Cette non-rationalité se fonde essentiellement sur la distinction entre choix optimal/satisfaisant et but primordial/secondaire. « La plupart des décisions humaines individuelles ou organisationnelles se rapportent à la découverte et à la sélection de choix satisfaisants. Ce n’est que dans les cas exceptionnels qu’elles se rapportent à la découverte et à la sélection de choix optimaux » 8. Quant au deuxième point, il s’agit de mettre en avant et d’expliquer pourquoi les décideurs remplacent souvent des buts généraux par des buts secondaires comme critères de décision : les buts secondaires sont perçus comme plus opérationnels que les buts principaux (ou primordiaux). Par exemple, un dirigeant comprend plus facilement comment ses actions affectent la part de marché de son entreprise que son profit à long terme. Aussi le but secondaire de conserver sa part de marché devient-il un critère exclusif d’activité puisqu’il est opérationnel. Ces éléments de conceptualisation sont complétés par la mise en évidence de phénomènes d’absorption d’incertitude - lorsqu’au lieu de communiquer des données et des faits complexes, on communique les interprétations sur ces données - et par une théorie de l’innovation et de la planification qui révèle le caractère enchevêtré et complexe de la structure de décision. Quelle que soit la modernité des thèses de ces auteurs, elles sont loin de s’être débarrassées de tous les prémisses de la théorie classique : le modèle du choix ration6 7 8
Simon (1960). Cyert et March (1963) ; March et Simon (1958). March et Simon (1958).
240
La décision peut-elle se passer du décideur ?
nel. Subsistent en particulier : l’idée que la décision peut être prise par un individu isolé, la notion de fragmentation de la décision et la division entre élaboration et exécution. Ce courant qualifié de « néo-rationaliste » 9 propose finalement d’élargir le concept de « raison », de manière à pouvoir rendre compte du fait que les individus au sein des organisations ne choisissent pas toujours de manière optimale. Bien qu’elles ne s’engagent pas elles-mêmes très loin dans ce sens, ces théories ouvrent cependant la voie à une critique plus radicale de la décision.
2. Vers une critique de la décision : entre incrémentalisme et jeux de pouvoir 2.1
LA POLITIQUE DES PETITS PAS
Le modèle rationnel de la décision organisationnelle, enraciné dans la théorie classique des organisations, sera sérieusement remis en cause par certaines études empiriques de la prise de décision. L’accent porte alors délibérément sur les niveaux méthodologiques et descriptifs. Encore la description se veut-elle réduite aux seuls phénomènes observables. La normativité est écartée d’emblée. Des recherches entreprises sur le secteur public américain vont permettre de mettre en évidence les éléments suivants 10 : – Alors que dans l’approche classique l’analyse des alternatives est précédée d’une clarification séparée des valeurs et des objectifs, il apparaît que les administrateurs sont incapables de formuler d’abord les principales valeurs et de choisir ensuite les politiques susceptibles en fonction de ces valeurs. Ils choisissent directement entre les alternatives. – Moyens et fins sont choisis en même temps. C’est souvent le choix des moyens qui détermine la fin. En aucun cas, il n’y a séparation entre fins et moyens et évaluation des moyens en fonction des fins. – Dans l’approche classique, une décision est considérée comme bonne si on peut montrer qu’elle met les moyens appropriés en face des objectifs souhaités. Dans la réalité pourtant, le test d’une bonne politique se fait souvent par un accord direct sur la politique choisie - le moyen -, sans que cela nécessite pour autant un accord sur les objectifs. Ainsi, l’accord du Congrès des États-Unis sur la politique d’assurance des personnes âgées correspond chez les libéraux à la volonté d’augmenter le programme du Welfare, et chez les conservateurs à la volonté de réduire les demandes de pension privée. – Enfin, d’importantes conséquences éventuelles ne sont pas prises en compte, certaines analyses importantes ne sont pas faites, certaines valeurs sont négligées, au motif qu’il est impossible d’être compétent sur tous les aspects de la décision. 9 Sfez (1981). 10 Braybrooke et Lindblom (1963) ; Lindblom (1959).
Décideurs et organisations : dans les coulisses de la décision collective
241
De ces idées, il résulte que les décisions collectives ressemblent à une série de « petits pas », qui s’enchaînent les uns dans les autres. Des ajustements successifs aux stratégies en cours sont réalisés, qui permettent d’avancer progressivement sans modifier réellement le cours de l’action. Les solutions envisagées sont toujours celles qui perturbent le moins les choix faits antérieurement. Ainsi, chaque nouvelle décision se trouve fortement conditionnée par les décisions précédentes. Il s’agit d’un « processus sans fin fait d’étapes successives, dans lequel un grignotage continu remplace une bonne bouchée ». 11 De nombreux acteurs sont impliqués dans un tel processus, mais ne sont pas réellement coordonnés par une autorité centrale. Au mieux peut apparaître entre eux un processus d’ajustement mutuel. Pour ces raisons, ce modèle a été qualifié « d’incrémentalisme disjoint ou décousu ». Ce modèle de l’incrémentalisme développé dans le secteur public correspond en partie aux conclusions d’études plus récentes menées dans des organisations privées 12. Cependant, ces recherches mettent en évidence que dans les entreprises étudiées, le processus apparaît moins décousu. Les acteurs principaux parviennent à mieux intégrer et ajuster leurs décisions et leurs actions, dans une démarche incrémentale pourvue d’une logique sous-jacente qui en relie les différents aspects. Une limite importante de cette conception des choix organisationnels se trouve dans son incapacité à rendre compte de décisions radicales et plus largement de changements importants dans la vie des organisations. Cependant, malgré cette restriction, les modèles de l’incrémentalisme proposent une rupture nette avec les modèles antérieurs de la décision et, plus largement, de l’organisation et de la société. Avec un certain cynisme, sont démontrés la lenteur des évolutions, l’absence de liens entre valeurs et choix, la prédominance des moyens sur les fins et, finalement, la difficulté pour les organisations, de penser leur progrès, puisqu’elles ne peuvent se détacher du passé. De plus, certains aspects politiques du processus de décision dans les organisations sont mis en évidence. En effet, la « politique des petits pas » comporte un avantage tactique : chaque nouvelle étape différant peu de ce qui est en cours, et étant perçue comme un prolongement, il est plus facile de convaincre les différentes parties prenantes d’adhérer aux solutions proposées. Les choix semblent plus facilement réversibles, du fait de leur faible ampleur. Personne ne se sent menacé de changements radicaux et les conséquences des décisions prises paraissent relativement prévisibles. Enfin, les choix faits reflètent les décisions des plus puissants puisque les demandes de ceux qui sont politiquement sous-organisés ne sont pas représentées. Ces pensées appréhendent certains phénomènes politiques liés à la décision organisationnelle, mais, faute de s’inscrire dans un modèle de l’organisation adéquat, ne les développent pas suffisamment.
2.2
LA DÉCISION, ENJEU ET JEU DE POUVOIR
L’école de Michel Crozier 13 a fortement contribué à la construction d’une théorie des organisations envisagées comme système social. De plus, cette théorie des 11 Lindblom (1968, p. 25-26). 12 Quinn (1980). 13 Crozier (1962) ; Crozier et Friedberg (1977) ; Thoenig (1973).
242
La décision peut-elle se passer du décideur ?
organisations est explicitement insérée dans une conception du système social dans son ensemble, ce en quoi elle se distingue fortement des théories antérieures. Ces chercheurs estiment en effet qu’étant donné l’importance et le développement des organisations industrielles et administratives, la sociologie des organisations permet une connaissance plus générale des sociétés contemporaines et de leurs problèmes. Véritable sociologie de l’action organisée, cette théorie engage à une critique forte de la raison collective. Une première étude importante, menée dans une agence comptable parisienne et à la Seita, monopole d’état industriel 14, a pour objectif de comprendre et d’expliquer les dysfonctionnements des mécanismes bureaucratiques et les raisons de leur inefficacité. L’étendue du développement de règles impersonnelles, la centralisation des décisions, l’isolement de chaque catégorie hiérarchique et l’accroissement parallèle de la pression du groupe sur l’individu, ainsi que le développement de pouvoir parallèles autour des zones d’incertitude contribuent à développer un « cercle vicieux bureaucratique ». Par exemple, des difficultés d’adaptation entraînent un renforcement de la centralisation des décisions, qui elles-mêmes renforcent la résistance des différentes catégories hiérarchiques et leur lutte pour améliorer leur position, ce qui empêche l’organisation de s’adapter et accroît ses problèmes. Il y a dégradation continue du système dont on ne peut sortir que par une crise brutale. Ce modèle ne correspond cependant pas à toutes les organisations. Dans des travaux ultérieurs 15, une théorie générale des organisations est proposée, qui se donne pour objectif de rendre compte de l’action collective dans toute organisation, à travers les relations de pouvoir et les relations stratégiques entre ses membres. Ce modèle propose véritablement une conception de l’organisation comme système. Dans cette perspective, l’action collective n’est pas un phénomène naturel, elle est donnée à voir en premier lieu comme un problème. En conséquence, l’organisation est définie comme un « construit social », comme une solution construite, donc artificielle, des problèmes d’action collective. Cette définition de l’organisation permet d’introduire également un concept essentiel pour la compréhension de l’action collective : celui de pouvoir. Le pouvoir n’est pas entendu ici au sens classique taylorien d’autorité légitime, de répression ou de pouvoir « rationnel-légal » 16, lié à la position hiérarchique des membres de l’organisation. Le pouvoir dont il est question est défini comme le résultat de la mobilisation par les « acteurs » 17 des sources d’incertitude qu’ils contrôlent, dans une structure donnée. Mécanisme central qui régule les stratégies des différents acteurs, le pouvoir est une dimension inéluctable de toute relation sociale qui implique, pour l’action collective, un marchandage de sa « bonne volonté ». Un postulat fondamental des auteurs est qu’une situation organisationnelle ne contraint jamais totalement un 14 Crozier (1962). 15 Crozier et Friedberg (1977). 16 Weber (1947). 17 Le terme d’acteur est utilisé systématiquement par ces auteurs, qui ont recours au vocabulaire du « jeu ». Le terme d’acteur fait référence, d’une part à la possibilité qui est laissée à chacun, au sein de l’organisation, d’agir avec une certaine autonomie, d’autre part à l’idée de jeux et de stratégies dans lesquels s’engagent les membres de l’organisation au cours de leurs interactions avec les autres.
Décideurs et organisations : dans les coulisses de la décision collective
243
acteur. Celui-ci garde toujours une marge de liberté, qui correspond pour les autres à une zone d’incertitude. C’est sur cette marge de liberté qu’il jouera pour négocier sa « participation » à l’organisation en instaurant ainsi une relation de pouvoir entre lui et les autres. L’organisation devient un espace de conflit et de négociation, et son fonctionnement résulte des affrontements et marchandages entre des acteurs relativement libres, utilisant les sources de pouvoir à leur disposition, et animés de rationalités multiples et divergentes. Ces phénomènes se développent d’autant plus que l’organisation évolue vers une structure différenciée, dans laquelle des unités distinctes se voient confiées des objectifs, des missions et des priorités bien spécifiques. Ce concept de différenciation est au cœur de la théorie de la dépendance envers les ressources 18, qui permet d’expliquer pourquoi certaines unités organisationnelles exercent une domination d’autant plus grande en son sein qu’elles contrôlent l’accès à des ressources rares et cruciales pour la survie de l’organisation. De manière similaire, si un service ou un département, par le jeu de la répartition des tâches et fonctions, affronte une incertitude susceptible d’être critique pour le reste de l’organisation et est capable de la traiter en fonction de son champ de compétence, protégeant ainsi les autres unités, il est probable que ce service ou département verra par la suite son influence s’élargir, au delà même de son domaine de responsabilité 19. Par exemple, un département marketing capable d’éviter les fluctuations de la demande par ses actions sur les prix et la publicité détiendra une zone de pouvoir importante dans l’entreprise. La capacité à maîtriser des zones d’incertitude est donc susceptible de conférer un pouvoir et d’entraîner des jeux de pouvoir entre acteurs. Que devient la décision dans cette conception de l’organisation comme construit social, équilibre précaire résultant de conflits et de marchandages incessants entre ses acteurs ? Elle devient elle aussi enjeu et jeu de pouvoir. Les problèmes susceptibles de faire l’objet d’une décision attirent ceux qui s’en trouvent concernés, et qui essaient d’influencer les décisions en leur faveur. Les thèmes décisionnels sont poussés à l’ordre du jour par des jeux d’acteurs, qui définissent ainsi des priorités de traitement des problèmes 20. L’information est manipulée, dissimulée ou ignorée, en fonction des objectifs des participants. On essaie de freiner les objectifs de ses rivaux et de supprimer les opposants. Les processus de décision passent par de multiples négociations entre acteurs et sont le fruit de coalitions instables, qui cherchent à imposer leur propre rationalité 21. Les décisions prises dans l’organisation expriment donc dans ce cadre des intérêts particuliers, habilement portés par des décideurs partiaux 22. Si ces intérêts n’existaient pas, il n’y aurait pas besoin d’accorder autant d’importance aux moyens de contrôle mis en place à travers les structures organisationnelles, aux modes d’incitation des managers, et à d’autres mécanismes régulateurs. La théorie de l’agence (cf. encadré 24) est fondée explicitement sur le postulat d’un conflit d’intérêts entre actionnaires et dirigeants, lorsque ceux-ci ne sont pas les 18 19 20 21 22
Pfeffer et Salancick (1978). Hinings et al. (1974). Kingdon (1984). Bolman et Deal (1997). Pettigrew (1973).
244
La décision peut-elle se passer du décideur ?
ENCADRÉ 24
La théorie de la dépendance envers les ressources et la théorie de l’agence La théorie de la dépendance envers les ressources repose sur l’idée essentielle que le maintien et le développement d’une organisation dépendent de sa capacité à obtenir et à maintenir les ressources qui sont vitales pour son développement. Dans cette conception, l’organisation est considérée comme un système de coalitions largement ouvert sur son environnement, avec lequel elle est constamment en interaction pour obtenir les ressources indispensables à sa survie. L’organisation subit de nombreuses pressions et demandes, parfois contradictoires, provenant des différentes sources dont elle dépend en terme de ressources. Son maintien et son développement sont étroitement liés à sa capacité à gérer les relations avec ces différentes sources de dépendance, et notamment à créer des résultats satisfaisants pour ces différents interlocuteurs, à négocier avec eux, et à élargir à son tour son propre pouvoir sur eux. La théorie de l’agence — ou modèle principal-agent — a été ces vingt dernières années le cadre d’analyse dominant des recherches réalisées sur le conseil d’administration des entreprises. Cette théorie économique formalise les comportements et les stratégies des agents économiques dans une situation de délégation de pouvoir ou de décision. En effet, lorsque l’un des protagonistes, le « principal » délègue un pouvoir décisionnel à un « agent », ce dernier peut accomplir des actions non contrôlées, voire contraires aux intérêts du principal. Pour éviter toute déviance de ce type, il faut identifier et évaluer les risques afin de contrecarrer les déviances. Utilisée dans le cadre de l’organisation, cette théorie est intéressante à plusieurs titres. Tout d’abord, elle conceptualise l’organisation comme un réseau de relations contractuelles. Elle permet ensuite d’analyser et de comparer les formes d’organisation à partir des caractéristiques des contrats, pour déterminer celles qui sont le plus efficientes. Partant des hypothèses de rationalité des agents, d’opportunisme des dirigeants, et d’asymétrie d’information en la faveur de ces derniers, elle s’intéresse au problème d’agence lié au conflit d’intérêts entre actionnaires et dirigeants lorsque ceux-ci ne sont pas les actionnaires principaux et ne supportent donc pas les conséquences patrimoniales de leurs décisions. Cette théorie conduit à proposer des systèmes de contrôle, tant internes, comme le conseil d’administration, qu’externes, dérivés du marché, pour discipliner le comportement des dirigeants.
principaux actionnaires et ne supportent pas les conséquences patrimoniales de leurs décisions 23. Un système de contrôle interne - dont le conseil d’administration constitue le sommet - indépendant du système de décision vise à discipliner le comportement des dirigeants, naturellement opportunistes 24. Dans une conception plus hétérogène de l’entreprise, d’autres parties-prenantes que les actionnaires et les dirigeants - les employés par exemple - ont également des intérêts à défendre dans les décisions organisationnelles 25. 23 Fama (1980) ; Fama et Jensen (1983). 24 Pour un éclairage approfondi sur cette théorie et ses applications à l’entreprise, cf. Charreaux (1999). 25 Freeman (1984).
Décideurs et organisations : dans les coulisses de la décision collective
2.3
245
LA FACE CACHÉE DE LA DÉCISION : CHOIX SANS DÉCISION, DÉCISION SANS CHOIX ET NON-DÉCISION
Ce qui vient d’être exposé montre une claire opposition entre la conception de la décision comme prérequis fonctionnel pour l’efficacité des organisations et l’approche politique. Celle-ci suggère une activité beaucoup plus complexe qu’il n’y paraît à première vue. Une réelle compréhension du comportement dans les organisations oblige à identifier qui est impliqué dans les décisions, qui n’y participe pas, qui peut introduire des problématiques à l’ordre du jour, ou les en enlever, qui est en position d’exercer de l’influence. À ce stade intervient le pouvoir que certains qualifient de « pouvoir propre » ou de « pouvoir institutionnalisé » 26. Selon cette approche, la structure de ce type de pouvoir est reflétée dans la structure décisionnelle, contribuant pour beaucoup à une stabilité dans les organisations et à une régularité dans les processus. Ceux qui détiennent le pouvoir « propre » définissent les critères décisionnels, décident de ce qui est une information pertinente ou de ce qui ne l’est pas, donnent les règles et attribuent les rôles en fonction desquels certains ont ou n’ont pas le droit de participer aux décisions. Ou encore créent des systèmes de dépendance à leur égard, dans lesquels ceux qui sont impliqués pourront influencer les issues des choix dans le sens désiré. Le caractère pernicieux de ce type de pouvoir réside dans ses effets : la plupart font partie des choses tenues pour acquises, non sujettes à la remise en question ou à la négociation. Ainsi, de nombreuses sélections dans les organisations sont faites sans qu’il y ait de confrontations ouvertes, sans que des alternatives aient été impliquées : elles sont non envisageables, inconcevables, au regard des critères qui sont le produit de l’histoire de l’organisation. L’approche politique pose ainsi la question du « choix sans décision » 27, de la « décision sans choix » 28, et de la « non-décision » 29. Ces faces cachées mais néanmoins non négligeables de la décision organisationnelle correspondent à un exercice du pouvoir subtil et insidieux, qui, à l’inverse de celui plus ouvertement visible impliqué dans les conflits et les jeux d’acteurs, contribue à une structuration à long terme des rapports de force dans l’organisation. Les « choix sans décision » correspondent aux situations où le décideur peut théoriquement envisager plusieurs possibilités mais n’est en réalité pas libre de choisir. Il peut par exemple être contraint par des choix organisationnels antérieurs, qui constituent des « précédents ». Ou invoquer des obligations ou des attentes correspondant à son rôle. L’idéologie et la définition des rôles organisationnels correspondent à un contrôle social invisible qui pèse sur la décision. Il peut également être contraint de suivre certaines procédures définies par d’autres que lui. Les « décisions sans choix » sont des situations dans lesquelles le décideur est persuadé de n’avoir qu’une seule alternative disponible. Ces situations correspondent souvent à des pratiques tenues pour acquises. Par exemple, on entrera dans une pièce par la porte, alors que dans certains cas, les fenêtres pourraient tout aussi bien servir la même fonction. 26 27 28 29
Pfeffer et Salancick (1978) ; Salancik et Pfeffer (1974). Salancik et Brindle (1997). Salancik et Brindle (1997). Bachrach et Baratz (1962).
246
La décision peut-elle se passer du décideur ?
Les constructeurs automobiles américains, dans les années 70, n’envisageaient même pas que les consommateurs puissent désirer autre chose que de grandes « voitures américaines ». Les décideurs qui prennent des décisions sans choix sont persuadés ne pas avoir de manière alternative pour définir ou satisfaire leurs intérêts. Bien que les effets correspondent également à ceux de la rationalité limitée, le problème n’est pas de limiter sa recherche d’alternatives mais d’imaginer que celles-ci ne sont même pas concevables. Enfin, la « non-décision » correspond au fait de ne pas décider sur un sujet donné, parce que celui-ci est trop controversé, inacceptable dans la culture de l’organisation, inopportun, etc. Ces sujets sont alors laissés de coté ou supprimés. Les décisions qui sont à l’ordre du jour ne sont que la face visible, émergente, et officielle, de l’iceberg décisionnel. Les non-décisions constituent la véritable substance décisionnelle de l’organisation et révèlent des conflits latents et profonds en son sein, qui structurent les zones relevant ou non de la décision. Nous conclurons de cette seconde partie que l’approche politique de la décision, en s’appuyant sur une conception de l’organisation comme système social, a fortement fait évoluer la compréhension que l’on peut avoir de la décision dans l’organisation. Cependant, chaque modèle de la décision étant fondé sur une théorie de l’action collective et donc sur un découpage de la réalité particulier, il met en évidence des aspects et processus spécifiques, qu’il est très difficile d’intégrer dans une perspective d’ensemble. C’est ce qu’illustre un travail mené sur la crise des missiles de Cuba entre les États-Unis et l’URSS 30. Partant du postulat que la plupart des études de relations internationales repose implicitement sur la théorie de l’acteur rationnel, il est proposé d’analyser cette crise en adjoignant à ce modèle théorique deux modèles alternatifs centrés l’un, sur le processus organisationnel, l’autre sur les jeux politiques. Ces trois modèles sont utilisés alternativement comme paradigme analytique. Dans le paradigme de l’acteur rationnel, ce qui est expliqué est le choix d’action fait par un acteur global - le gouvernement américain. Le choix est présenté comme la réponse donnée à un problème stratégique, à la suite d’un calcul rationnel intégrant des contraintes spécifiques et permettant de répondre à l’objectif du gouvernement. Dans le second paradigme, le gouvernement est abordé comme une organisation, composée de sous-systèmes différenciés et non homogènes, qui ne sont que partiellement coordonnés par les leaders gouvernementaux. Le comportement gouvernemental et les décisions prises sont compris comme les produits, en partie non contrôlés, de l’ensemble des processus de fonctionnement de ces sous-systèmes et de leur intégration. Enfin, le troisième paradigme, politique, et proche dans sa conception de l’école de Crozier, décrit les membres du gouvernement comme un ensemble de joueurs positionnés hiérarchiquement, inscrits dans le même jeu compétitif, mais également tirés par des politiques et des actions diverses et spécifiques. Le comportement gouvernemental peut être alors interprété comme le résultat de ces jeux de négociation et de marchandage entre les différents joueurs de l’échiquier gouvernemental. Cette recherche permet de bien mettre en évidence la complexité en œuvre dans la structuration de la crise de Cuba et l’intérêt de chaque paradigme pour construire un réel différent. Cependant, il manque une articulation entre ces différents réels, puisque ceux-ci sont simplement juxtaposés dans trois modèles différents. 30 Allison (1971).
Décideurs et organisations : dans les coulisses de la décision collective
247
Faut-il en déduire que la décision est une réalité insaisissable, et un concept artificiellement construit en fonction des besoins de différents systèmes explicatifs ? On peut également se demander pourquoi, chacun de ces modèles, quelle que soit leur diversité, continue à utiliser et à intégrer le concept de décision ? Pour certains, la réponse est claire : la décision n’est qu’une idéologie, profondément enracinée dans les croyances occidentales, et qui revient donc systématiquement dans toute tentative d’explication de l’action collective. De ce constat, s’ensuit une profonde remise en cause de la décision dans des théories véritablement critiques : critiques de la décision, certes, mais critiques également des présupposés concernant l’action collective et organisée. Ces théories font l’objet de la partie suivante.
3. Les théories critiques : l’organisation sans décision 3.1
L’ANARCHIE ORGANISÉE ET LE « MODÈLE DE LA POUBELLE »
Une lecture radicalement critique de la décision organisationnelle est proposée avec le « modèle de la poubelle » 31, qui suggère de se débarrasser de l’idée d’antériorité et de couplage logique entre problèmes et décisions. Ce modèle de la décision concerne cependant des organisations particulières : les « anarchies organisées ». Celles-ci se caractérisent par trois dimensions essentielles. Tout d’abord, l’anarchie organisée fonctionne à partir d’une grande diversité de préférences, qui manquent de précision, sont souvent peu cohérentes entre elles et dont les acteurs eux-mêmes peuvent prendre conscience au cours de l’action ou a posteriori. Deuxième caractéristique, la participation fluctuante des acteurs aux processus : les participants s’engagent de manière variable dans les nombreux processus de l’organisation, en fonction de leur temps, de leur disponibilité, de la quantité d’attention dont ils disposent. Ainsi se développe une imprévisibilité essentielle dans les projets en cours. Enfin, les procédures et processus organisationnels sont mal compris par les acteurs, ce qui les empêche de dégager une vision claire et cohérente du fonctionnement de leur propre organisation. Ces caractéristiques « d’anarchie organisée » sont flagrantes dans certaines organisations telles que les universités ou les organismes publics 32, ainsi que dans des structures peu hiérarchisées, décentralisées, qui encouragent la participation de ses membres, telles que les associations ou les adhocraties 33. Cependant, plus largement, elles s’observent dans pratiquement toutes les organisations, à un moment ou à un autre de leur vie ou dans une partie de leur structure. Par exemple, lorsqu’il s’agit de nouveaux marchés, d’innovations de rupture, ou de changements importants, un certain temps est nécessaire pour que l’entreprise acquière une compréhension des processus en œuvre et mette en place de nouvelles règles de fonctionnement.
31 Cohen et al. (1972). 32 March et Olsen (1976) ; March et Weissinger-Baylon (1986). 33 Mintzberg (1982).
248
La décision peut-elle se passer du décideur ?
Dans ce type d’organisation, coexistent en permanence : – un flux d’occasions où des décisions peuvent être prises ; ces occasions, dites « occasions de choix » sont en général issues des différents systèmes formels de l’organisation ; – un flux de problèmes qui arrivent progressivement ; – un stock de solutions ou de procédures pour en développer ; – des acteurs, dotés de préférences et de valeurs instables ou mal définies, qui sont plus ou moins susceptibles de participer aux différents processus. Pour comprendre les phénomènes de décision dans ces organisations, les auteurs ont recours à l’analogie suivante : les problèmes, solutions, participants et occasions de choix sont jetés dans la « poubelle » organisationnelle de manière relativement aléatoire. La décision est envisagée comme le résultat imprévisible du croisement de ces différents flux de problèmes, de solutions, d’occasions de choix et de participants, présents à un même moment dans la « poubelle ». Les principales composantes des décisions - les problèmes, les solutions, les participants et les occasions de choix - sont « découplées » 34 et s’associent pour des raisons de simultanéité accidentelle plutôt que de pertinence mutuelle. Des participants peuvent pousser à formuler des problèmes pour lesquels ils détiennent déjà une solution. La solution peut dépendre plus de l’occasion de décision que des caractéristiques du problème. Des questions ou des problèmes peuvent être abordés à des occasions différentes, passer d’une occasion de choix à une autre - par exemple, d’une réunion à une autre - sans trouver de solutions. Des travaux empiriques portant sur les processus de décision dans l’organisation permettent d’affirmer que le modèle de la poubelle n’est pas qu’une élucubration théorique. Ainsi, une étude 35, qui analyse 163 cas de décisions dans des entreprises américaines et canadiennes, montre que dans un tiers des décisions étudiées, le processus a été induit par une idée, solution déjà identifiée à laquelle il reste à associer un problème ou une préoccupation. Les solutions constituent pour les décideurs des opportunités pour s’engager rapidement et de manière pragmatique dans l’action. Cependant, bien que ce procédé soit le processus de formulation des décisions le plus fréquent dans les cas étudiés, il ne conduit pas aux meilleurs résultats lors de la mise en œuvre de la décision. En effet, la préconception de solutions impose des contraintes fortes sur la décision et réduit fortement la phase de recherche (d’informations et d’alternatives) 36. De plus, les solutions sont souvent présentées et défendues par un seul acteur — dont le jeu va consister à imposer la décision en question. D’autres recherches sur les activités quotidiennes des managers mettent en évidence le caractère éminemment fragmenté de leur travail 37 : ils ne cessent de passer d’une activité à une autre, ne disposent que de très peu de temps pour chacune et répartissent leur attention dans des processus variés et fort nombreux. Dans ce cadre, les décisions sont bien modelées en partie par la participation fluctuante des diffé34 35 36 37
Weick (1976). Nutt (1993). Nutt (1998 ; 2002). Kotter (1982) ; Mintzberg (1973) ; Stewart (1967 ; 1987).
Décideurs et organisations : dans les coulisses de la décision collective
249
rents acteurs à ces processus et par la simultanéité entre la présence de problèmes et celle de décideurs disposant d’un stock d’attention suffisant. D’un point de vue pratique, le modèle de la poubelle conduit à utiliser des leviers d’action différents de ceux préconisés dans les approches précédentes. Par exemple, un acteur désireux de résoudre un problème spécifique, cherchera l’occasion de choix la plus propice, en fonction des préférences des participants impliqués, et de la probabilité que cette occasion lui fournisse une solution. Au contraire, si l’on souhaite détourner d’une décision spécifique certains acteurs, il faut focaliser leur attention sur d’autres processus. Par ailleurs, la résolution d’un problème n’est jamais assurée, car elle dépend fortement du « taux de remplissage » des problèmes lors des diverses occasions de choix, de la disponibilité relative des participants, etc. Par son originalité, ce modèle a nourri de nombreux travaux empiriques, qui changent profondément la manière de se représenter le fonctionnement des organisations étudiées. Ainsi, le modèle de la poubelle a-t-il été adapté pour rendre compte des processus décisionnels des pouvoirs publics aux États-Unis 38. Il s’intéresse à la formation de l’agenda du gouvernement, défini comme : l’ensemble des sujets ou problèmes auxquels les membres du gouvernement, et les gens en dehors du gouvernement mais étroitement associés à ses membres, prêtent une attention sérieuse à un moment donné. La formation de l’agenda est la résultante de trois facteurs : les problèmes, le jeu politique, et les participants visibles. Les participants cachés et le flux des politiques contribuent à influencer la définition des alternatives. La formulation des problèmes résulte d’un processus d’interprétation et de classification, qui influence fortement leur traitement 39. Ainsi, les difficultés d’accès aux transports par les handicapés peuvent être conçues comme un problème de transport ou comme un problème de droits individuels. Le jeu politique contribue à former l’agenda de manière très spécifique. Les élections conduisent par exemple à des changements de responsables politiques qui redéfinissent rapidement l’agenda. Certains thèmes au goût du jour sont plus susceptibles d’être portés et reconnus par l’opinion publique. Quant aux participants, ils sont soit visibles, soit cachés. Dans le premier cas, ils sont exposés au public et influencent directement la formation de l’agenda. Les participants cachés, qui collaborent avec les premiers mais ne sont pas visibles du public, sont souvent des spécialistes d’un domaine particulier, qui jouent un rôle dans la formulation des alternatives. Ces différents flux - problèmes, jeux politiques et participants - se rencontrent pour aboutir éventuellement à des décisions, lors de certains occasions qui représentent autant d’opportunités de choix - un changement d’acteur, l’échéance de renouvellement d’un programme, une prise de position officielle, par exemple. Dès qu’une telle opportunité se présente, les acteurs concernés s’y engouffrent, avec leurs problèmes et leurs solutions. Les participants fortement impliqués dans certaines problématiques jouent un rôle essentiel de repérage des opportunités ainsi que de promotion de leurs problèmes et de leurs solutions. Paradoxalement, l’anarchie apparente engendre peu d’actions, qui paraissent par ailleurs fortement contrôlées et relativement cohérentes entre elles. Deux logiques différentes se côtoient. Au niveau souterrain, non visible, règne un désordre 38 Kingdon (1984). 39 Vidaillet (2003).
250
La décision peut-elle se passer du décideur ?
interne. Au niveau visible, les occasions de choix délimitent fortement les conditions d’accès des problèmes, solutions et participants à la sphère décisionnelle, donnant l’impression d’une relative continuité dans les choix opérés. Cette idée se retrouve dans une étude sur les décisions liées à l’édition de manuels scolaires 40. Alors que l’industrie de l’édition est composée d’organisations fonctionnant comme des anarchies organisées (au sens où nous l’avons défini précédemment), elle produit des manuels normés et homogènes entre eux. En fait, la cohérence est donnée par le contexte institutionnel des différentes entreprises d’édition, qui joue un rôle de « couvercle sur la poubelle ». Ce contexte impose en particulier le contenu type des manuels, et détermine ainsi la nature du produit attendu. L’ordre - exprimé en termes de résultats - peut alors résulter d’un désordre dans les processus. Le modèle de la poubelle, en proposant de déconnecter les différentes composantes de la décision, a introduit une rupture radicale avec les conceptions antérieures de la décision organisationnelle. Certes, il importe de nuancer. Ce modèle de la décision caractérise certaines organisations (les « anarchies organisées ») seulement. Les travaux sur les liens entre la structure organisationnelle et les caractéristiques des processus décisionnels l’attestent. Entre autres, le degré de formalisation, de centralisation, de complexité ou d’intégration de l’organisation 41 interviennent dans la rationalité, la fluidité, la complexité, l’incrémentalité ou le degré de politisation des processus de décision 42. Cependant, l’intérêt majeur du modèle est d’ouvrir la voie à de nouvelles explorations : il s’agit de s’intéresser au désordre et à la confusion dans les organisations, éventuellement au chaos, comme nous le développerons par la suite. Et même lorsque les organisations semblent produire de l’ordre, méfions-nous, semblent dire les auteurs, car derrière l’ordre peut se cacher désordre et confusion dans les processus. Avec le modèle de la poubelle, la décision devient aléatoire.
3.2
LA « DÉCISION » COMME REPRÉSENTATION SOCIALE
Si les décisions organisationnelles sont le produit aléatoire de différents processus, pourquoi les chercheurs en organisation et les membres organisationnels continuent-ils inlassablement à donner une telle importance aux « décideurs » et aux « décisions » 43 ? Cette question est essentielle car elle incite à envisager que la décision ait une place beaucoup plus complexe qu’il n’y paraît dans les organisations. En 1976 déjà, deux des chercheurs qui ont développé le modèle de la poubelle affirmaient que les « processus de choix sont l’occasion de nombreuses choses, en particulier (...) : occasion de satisfaire des attentes de rôle, des devoirs ou des engagements antérieurs ; (...) de distribuer la gloire et le blâme pour ce qui a eu lieu dans l’organisation, et ainsi d’exercer, mettre en cause ou réaffirmer des relations de confiance ou d’amitié, des antagonismes, des relations de pouvoir ou des statuts ; occasion d’exprimer ou de découvrir ses intérêts et ceux de groupe, de socialiser 40 41 42 43
Levitt et Nass (1989). Fredrickson (1986) ; Miner (1987) ; Mintzberg (1979) ; Shrivastava et Grant (1985). Hickson et al. (1986). Brunsson (1990).
Décideurs et organisations : dans les coulisses de la décision collective
251
(...) ; occasion de passer de bons moments, d’apprécier les plaisirs associés au fait de participer à une situation de choix. » 44 La décision fonctionne comme une représentation sociale : les individus ont besoin de penser en termes de « décision » et de « décideur » car c’est en référence à ces concepts qu’ils définissent leurs rôles et leurs activités 45. Prendre des décisions fait partie de l’imagerie managériale. On peut avancer quelques hypothèses quant au rôle de cette représentation. Par exemple, le concept de décision entretient l’illusion du libre arbitre, dans une organisation qui, on l’a vu, échappe en grande partie à ses acteurs. Si les membres organisationnels se posaient le problème du choix dans un monde difficilement contrôlable et se pensaient comme des joueurs engagés dans une lutte inégale avec le hasard, ils auraient les plus grandes difficultés à s’impliquer dans l’action 46. En se pensant « décideurs », ils peuvent jouer un rôle proactif. Le besoin d’attribuer des responsabilités est indissociable de la tendance humaine à établir des relations entre des comportements et des événements 47 et à minimiser le rôle du hasard. Aussi les concepts de décision et de décideur sont-ils essentiels pour attribuer des responsabilités dans les organisations 48. Définir qui décide, ou qui a décidé, c’est également définir qui est responsable. Si quelqu’un est perçu comme la cause d’un événement, parce qu’il a librement choisi d’engager une action plutôt qu’une autre, il peut alors être en partie défini comme responsable de cet événement. La décision produit la responsabilité, à condition cependant qu’elle soit associée à l’idée de choix, d’où la prégnance du modèle classique de la décision. Ceci a des conséquences importantes sur les processus organisationnels. Ceux-ci vont être en effet définis de manière à donner une visibilité aux « décideurs », afin de pouvoir clairement désigner les responsables. C’est ainsi que l’on peut expliquer par exemple la pérennité de comités de décision formels, siégeant régulièrement, dont on dit pourtant qu’ils se limitent à des parodies de décision, puisque les jeux sont faits. Pour permettre d’allouer des responsabilités, les processus doivent créer la perception que certaines personnes sont clairement la cause d’événements ou d’actions particulières, donc qu’elles ont fait un choix entre plusieurs possibilités. D’où le fréquent recours à des alternatives dont on sait qu’elles sont factices. D’où également le fait que certains managers luttent pour avoir le droit de participer à un processus de décision, mais n’exercent pas ce droit par la suite. Une autre fonction de la décision comme représentation sociale peut être celle consistant à donner du sens aux actions organisationnelles. La décision dans ce cadre n’est pas un acte de choix mais d’interprétation. Karl Weick, théoricien des organisations qui a renouvelé la conception de celle-ci, développe particulièrement cette thèse. Pour lui, il est fondamental de repérer que toute décision est la conséquence directe d’une activité préalable de construction de sens, bien plus pertinente à observer. « L’activité de prise de décision, objet de très fréquents débats, est considérée, 44 45 46 47 48
March et Olsen (1976, p 11-12). Hervé Laroche a particulièrement développé cette conception (1995). March (1988) ; March et Shapira (1987). Kelley (1972). Brunsson (1990), Laroche (1995, 2003).
252
La décision peut-elle se passer du décideur ?
dans le cadre de la construction de sens, comme une conséquence relativement mineure d’une situation qui a déjà été définie, contrainte et cadrée au travers d’interactions. Ainsi, lorsque les gens parlent d’une « bonne » décision ou de la manière d’améliorer la prise de décision, ce dont ils parlent vraiment, c’est de circonstances où ils puissent interagir de manière plus vigilante et plus sensée pour forger une histoire plausible de ce qui se passe et de ce qui s’ensuit, avec assez de ressources disponibles pour faire évoluer cette histoire. [Ce cadre] permet d’envisager plus facilement la décision comme une activité qui se produit après que les individus ont trouvé leurs repères et ont une idée de « ce qui se passe ici ». Une fois que les gens se sont fait une première idée, en général ils se mettent à décider et à prévoir et à prescrire et à traiter et à planifier et à budgéter. Mais toutes ces activités successives présupposent des limites mises en place par une activité initiale de construction de sens. » 49 Cette conception est fortement développée à travers l’exemple connu sous le nom du « désastre de Mann Gulch ». Il s’agit d’une équipe de pompier qui n’aura pas de décision à prendre quant aux actions à mener pour éteindre un gigantesque incendie, faute d’une activité de construction de sens préalable. C’est ce qui conduira la plupart de ses membres à la mort 50. « (…) Plus généralement, il faut noter que les organisations peuvent (…) trébucher. Elles trébuchent en raison d’une construction du sens déficiente. Le monde de la décision est celui de la rationalité stratégique. Celle-ci est faite de questions claires et de réponses claires, qui cherchent à combler l’ignorance (…). Le monde de la construction du sens est différent. La construction du sens concerne la rationalité contextuelle. Celle-ci est faite de questions vagues, de réponses troubles, et d’arrangements négociés qui essaient de réduire la confusion. À Mann Gulch, les questions que les hommes ont eues à affronter n’étaient pas : où devons-nous aller ? quand devons-nous prendre position ? ou : quelle doit être notre stratégie ? À la place, ils ont affronté une sensation plus primaire, plus effrayante, à savoir que leurs repères traditionnels ne fonctionnaient plus. Ils étaient sortis du territoire de leur expérience passée et n’étaient plus sûrs ni de ce qui se passait ni de qui ils étaient. Avant de parvenir à une certaine compréhension de ces questions, il n’y a rien à décider. » L’activité de construction collective de sens, d’interprétation, peut être préalable à la décision comme décrit ci-dessus. Mais elle peut également intervenir a posteriori. Lorsque des acteurs organisationnels déclarent prendre une décision, c’est qu’ils ont le sentiment qu’un résultat présent existe, qui a dû être occasionné par un choix antérieur. Ils se livrent dès lors à un travail rétrospectif, par lequel ils se mettent d’accord sur la localisation et la « réification » de ce choix antérieur, qu’ils proclament correspondre à une « décision » qu’ils viendraient de prendre 51. L’histoire récente est donc reconsidérée à la lumière d’actions produites, les outputs, qu’il s’agit d’associer rétrospectivement à des décisions pouvant en rendre compte, les inputs. « Au lieu de considérer que les décisions sont prises lorsque l’occasion le requiert, il faut envisager une formulation alternative. Celle-ci consiste à prendre en compte la 49 Weick (2003 ; pp. 1-2). 50 Weick (1993). 51 Weick (1995 ; 2001).
Décideurs et organisations : dans les coulisses de la décision collective
253
possibilité que la personne définisse rétrospectivement les décisions qui ont eu lieu. Le résultat vient avant la décision… Les règles de la prise de décision dans la vie quotidienne portent certainement bien plus sur le problème d’attribuer à des résultats une histoire qui les légitime que sur la question de décider, avant même que l’occasion de choix se présente, des conditions sous lesquelles sera choisie une alternative parmi un ensemble d’alternatives possibles. » 52 Il s’agit ici pour les acteurs de maintenir une illusion de contrôle sur les événements, dans une réalité reconstruite a posteriori autour de leurs décisions. Cette perspective remet en cause l’idée, centrale dans de nombreuses théories, selon laquelle la vie peut être conçue comme un séquencement de choix. Une conception alternative est de considérer que ce qui est en jeu est moins le fait de faire des choix que de former des interprétations. Ce sont moins les éventuels résultats d’un choix qui importent que les processus. Les processus donnent un sens commun, ils rassurent en permettant de confirmer que les personnes pertinentes y sont impliquées, qu’elles ont une influence sur la performance organisationnelle et, enfin, que les choix résultent bien d’une démarche rationnelle et pensée. Dans ce cadre, la décision a une fonction symbolique et de nombreux aspects des processus de décision peuvent être considérés comme des rites.
3.3
LA FIN DE LA DÉCISION ?
Développant des idées anticipées dans les années 60 et selon lesquelles la plupart des actions ne relèvent pas d’un processus de décision rationnel et explicite, mais résultent de procédures organisationnelles 53, des travaux récents s’intéressent aux organisations comme systèmes de règles 54. Ces règles peuvent être issues des traditions, des habitudes, des normes culturelles dans l’organisation, de la définition du rôle de l’individu, de pratiques antérieures, etc. La plupart des décisions et des actions organisationnelles sont basées non pas sur des choix mais sur l’application de ces règles et les individus peuvent très bien suivre des règles qui ne vont pas forcément dans le sens de leur intérêt. Il s’agit essentiellement pour les acteurs de reconnaître une situation donnée et de lui faire correspondre une règle appropriée et choisie parmi un ensemble de règles organisationnelles. Cette conception de l’organisation comme système de règles remet fortement en cause la pertinence des concepts de décision et de décideur pour l’action organisationnelle. Tout d’abord, en effet, cette conception permet d’inverser la relation de causalité entre problème et action. Les organisations génèrent quasi-automatiquement de l’action, produite par l’ensemble des procédures et des programmes qui conditionnent les comportements de leurs membres 55. Par exemple, les procédures budgétaires entraînent tous les ans un ensemble d’actions : calculs d’écarts, estimation des budgets de l’exercice suivant, réunions de coordination de services, etc. Ainsi, face à cette production ininterrompue d’actions, les acteurs en viennent à inventer des pro52 53 54 55
Weick (1977). Cyert et March (1963). Bums et Flam (1987) ; Cohen et Bacdayan (1994) ; Zhou (1993, 1997). Starbuck (1983,1985) ; Brunsson (1990).
254
La décision peut-elle se passer du décideur ?
blèmes pour justifier les actions engagées ou réalisées. Celles-ci apparaissent indispensables, puisqu’elles sont posées comme solutions aux problèmes construits a posteriori. Plus largement, menaces, opportunités, succès et échecs passés, ne sont que des constructions rétrospectives, servant à des fins de justification, qui accompagnent ou suivent l’action. Ces analyses évacuent la question de la décision : en effet, celle-ci n’est plus un concept pertinent permettant de relier problèmes et actions. Les actions sont le produit mécanique de la « machinerie organisationnelle », et non le résultat de décisions. Les problèmes, plutôt que de donner naissance à des processus décisionnels, habillent l’action a posteriori 56. La notion de décision est abandonnée au profit d’un raisonnement en termes de système de production de l’action. Dans le domaine du management stratégique, par exemple, certains chercheurs proposent d’éliminer le concept de décision de l’analyse de la stratégie des organisations, car, il n’est plus à même, selon eux, de rendre compte des processus stratégiques 57. L’évolution de ces auteurs est nette : après avoir défini la stratégie comme a pattern in a stream of decisions 58, ils la décrivent comme a pattern in a stream of actions 59. Les stratégies des organisations peuvent émerger plutôt qu’être délibérément décidées à l’avance. Elles peuvent se dessiner par l’effet combiné d’un ensemble d’actions qui ont ou non été liées les unes aux autres, sans que pour autant quelqu’un ou quelques uns aient explicitement défini au préalable la direction à suivre. Avec le recul, une certaine tendance, une sorte de cohérence, émerge, qui peut être qualifiée de « stratégie ». À un autre niveau, les règles peuvent être considérées comme produites par le contexte institutionnel de l’organisation. Les travaux issus du courant néo-institutionnaliste en sociologie 60 fournissent un ancrage théorique intéressant de ce point de vue. Partant du constat de l’isomorphisme des organisations, à travers l’adoption de structures et de pratiques de plus en plus homogènes au sein d’un même champ, les néo-institutionnalistes l’attribuent à la présence dans ce champ d’institutions, organisations particulières qui ont la capacité d’y créer, d’y véhiculer ou d’y renforcer certaines normes, règles ou standards - une association professionnelle, par exemple. Ainsi ont été expliqués, entre autres, l’uniformisation des pratiques administratives des mairies américaines 61, le degré de diversification du portefeuille d’activités de grandes entreprises 62 ou leurs pratiques comptables 63. Parmi les facteurs qui contribuent à produire l’isomorphisme, le mimétisme est un comportement essentiel. Dès qu’une organisation est confrontée à une situation ambiguë ou incertaine, elle recherche dans son environnement des exemples à suivre. Elle va en particulier chercher à imiter des entreprises qui ont réussi avec succès à faire face à cette situation, reproduisant alors des règles correspondant à de « bonnes pratiques ». Plus généralement, elle peut adopter des comportements mimétiques parce que certaines règles et 56 57 58 59 60 61 62 63
Starbuck (1985). Mintzberg et Waters (1990). Mintzberg et Waters (1982). Mintzberg et Waters (1985). Granovetter (1985, 1994) ; Powell et Di Maggio (1991). Tolbert et Zucker (1983). Fligstein (1991). Mezias (1990).
Décideurs et organisations : dans les coulisses de la décision collective
255
ENCADRÉ 25
La crise de Nantes : routines et incapacité à improviser a L’exemple de la « crise de Nantes », déjà abordé dans le chapitre 2, montre l’importance du recours à des routines et à des procédures même dans un cas de crise qui nécessitait une certaine improvisation, dont les acteurs ont été incapables. Face à un nuage d’une ampleur importante et éventuellement toxique, les différents groupes d’acteurs concernés par la crise (la cellule de crise en préfecture, les pompiers, le SAMU et la cellule anti-pollution), ont tout d’abord ressenti un moment de flottement pendant lequel, incapables de se représenter ce qui était en train de se produire, ils se sentaient impuissants devant l’événement. Puis, ils sont parvenus à s’en faire une représentation, bien qu’approximative et partielle. La cellule de crise y a vu un nuage toxique dont il fallait protéger la population ; les pompiers, un incendie à éteindre ; le SAMU, un flux de personnes se présentant spontanément à l’hôpital, qu’il fallait examiner ; et la cellule anti-pollution, une éventuelle toxicité à mesurer dans des conditions difficiles. Dès lors, chaque groupe d’acteurs a mis en place des routines et des procédures propres à leur profession et à leur rôle, malgré le caractère totalement atypique de l’événement. Cette démarche a empêché les groupes de développer une communication entre eux et de construire une solution adaptée à la nature exceptionnelle de la crise. a. Vidaillet (2001) ; Roux-Dufort et Vidaillet, (2003).
pratiques sont certifiées par des associations professionnelles ou mises en place par des leaders d’opinion 64. Dans ce cas également, l’action organisationnelle est attribuée à des facteurs qui ne relèvent pas de choix et de décisions, mais de l’application de règles. L’argument du mimétisme comme ressort fondamental de l’action humaine dans les organisations est également au centre de la théorie des conventions, qui se développe de plus en plus en économie 65. La convention est décrite comme un « mécanisme cognitif collectif » auquel l’acteur se conforme lorsqu’il est confronté à l’incertitude. La convention lui permet d’agir dans une telle situation, convaincu qu’il est que l’ensemble de ses partenaires appliquent, eux aussi, le même ensemble de règles comportementales dans la même situation. L’entreprise, lieu de rationalité mimétique, peut être conçue comme un système qui tient par un ensemble de conventions, destinées à normaliser les comportements et agissant comme un puissant mécanisme de coordination…sans décision ! Enfin, nous mentionnerons un dernier courant assez récent en théorie des organisations qui donne de sérieux arguments théoriques pour « évacuer » la décision 64 Di Maggio et Powell (1983). 65 On pourra se référer au programme de recherche présenté notamment dans le numéro de la Revue Economique de mars 1989 ou Orléan (2004). Une présentation synthétique du programme est offerte par Eymard-Duvernay (2004), Favereau (2000) et Batifoulier (2005). Une discussion sur les différentes théories des conventions en économie et sciences sociales ainsi que sur l’originalité du programme de l’Economie des conventions peut être retrouvée dans Batifoulier (2001). Voir également Gomez (1996) et de Montmorrillon (1999) pour les applications en gestion.
256
La décision peut-elle se passer du décideur ?
de l’analyse de l’action organisée. II s’agit de l’application des théories du chaos aux organisations 66. Les organisations y sont présentées comme des systèmes dynamiques non linéaires, soumis à des forces internes et externes susceptibles de générer un comportement apparemment aléatoire et chaotique. L’organisation est si complexe que son fonctionnement échappe à ses acteurs. Les tentatives menées par ceux-ci pour créer des zones d’ordre et de stabilité les conduisent à entretenir l’illusion de manager. En fait, les situations que créent les membres de l’organisation tendent à développer leur propre dynamique et à échapper au contrôle humain, engendrant ainsi un fort déterminisme. Cette conception récente des organisations a cependant jusqu’à présent donné lieu à peu de recherches empiriques.
4. Conclusion Les conceptions successives de la décision, qui s’échelonnent de « l’âge classique » à la période contemporaine, se sont accumulées, composant des couches superposées dans les organisations et dans l’esprit des individus. Aucune conception n’ayant remplacé une autre, elles continuent à coexister de manière juxtaposée, ajoutant ainsi à la confusion et à la complexité pour qui désire comprendre la décision organisationnelle. Nous les avons présentées de manière à mettre en évidence une évolution, indissociable de l’évolution des organisations et de leur contexte. De la décision rationnelle, condition d’efficacité des organisations tayloriennes, nous sommes arrivés à une décision aléatoire, corollaire du désordre et du chaos organisationnel. De l’homme tout puissant et rationnel, créant l’organisation à son image, un glissement progressif s’est fait vers un homme disposant de peu de contrôle sur son environnement, dépassé par des déterminismes divers et dominé par la complexité de l’organisation. James March résume ainsi cette évolution 67 : « Si le progrès scientifique se mesure par la simplification, ce qui suit est l’histoire d’une régression. D’une approche simple des choix rationnels, anticipateurs et conséquents, nous sommes passés d’abord à une reconnaissance des limites de la rationalité, puis à l’étude des conflits internes et à la dépendance des conceptions humaines vis-à-vis de l’histoire et, enfin, à l’ambiguïté de l’action dans les organisations. La vie s’est montrée plus complexe que nos premières mythologies la concernant. » (p 14). En synthèse de ce chapitre, les apports de l’étude de la décision organisationnelle à celle du choix humain en général peuvent se grouper autour de plusieurs problématiques. En premier lieu est posé le problème de la décision comme relevant de choix ou de règles. Le décideur poursuit-il une logique conséquentialiste qui le conduit à choisir entre des alternatives en évaluant leurs conséquences rapportées à des préférences antérieures ? Ou une logique de mise en adéquation entre une situation identifiée et des règles pour y faire face ? En second lieu se pose la question de la décision comme occasion de cohérence et de clarification (des préférences, des choix) ou comme occasion d’exploiter, de renforcer ou de créer ambiguïté, confusion et incohérence. La troisième problématique tient à la décision comme activité instrumentale 66 Stacey (1992, 1993) ; Thiétart et Forgues (1995, 1997) ; Polley (1997) ; Farazmand (2003). 67 March (1988).
Décideurs et organisations : dans les coulisses de la décision collective
257
ou comme activité d’interprétation. Doit-on la comprendre comme correspondant à un processus de résolution de problème ou à un processus de construction de sens pour un individu ou un groupe ? Enfin, une quatrième préoccupation est relative aux résultats des processus de décision. Doivent-ils être attribués à des acteurs autonomes, dotés d’intentions et d’intérêts propres ? Ou sont-ils le fruit des propriétés d’un système composé d’acteurs en interaction ? Si les conceptions anciennes de la décision résistent, c’est peut-être justement pour éviter de poser ces questions et conserver à la décision son rôle de bouée idéologique, en permettant à l’homme d’entretenir l’illusion de son libre arbitre.
Bibliographie
Abelson R.P. et Levi A. (1985), « Decision Making and Decision Theory », in Handbook of Social Psychology, Lindzey G. et Aronson E. (eds), Hillsdale : Lawrence Erlbaum Associates, pp. 231309. Aebischer V. et Oberlé D. (1998), Le groupe en psychologie sociale, Paris : Dunod (2e édition). Ainslie G. (1975), « Specious Reward : a Behavioral Theory of Impulsiveness and Impulse Control », Psychological Bulletin, vol. 82(4), pp. 463-496. Akerlof G. (1970), « The Markets for Lemons : Qualitative Uncertainty and the Market Mechanism », The Quarterly Journal of Economics, vol. 84, pp. 488-500. Allison G.T. (1971), The Essence of Decision, Boston, Little Brown. Allport F. (1924), Social Psychology, Boston : Houghton Mifflin. Argote L., Seabright M.A. et Dyer L. (1986), « Individual versus Group Use of Base-Rate and Individuating Information », Organizational Behavior and Human Decision Processes, vol. 38, pp. 65-75. Arkes H.R. et Hammond K.R. (eds) (1986), Judgment and Decision-Making : an Introductory Reader, Cambridge : Cambridge University Press. Arrow K.J. (1951, 1963), Social Choice and Individual Values, New York : Wiley (traduction française : Choix collectifs et préférences individuelles, Pergame, Diderot Editeur, Arts et Sciences, 1997). Arrow K.J. (1963), « Uncertainty and the Welfare Economics of Medical Care », American Economic Review, vol. 53, pp. 941-973. Asch S. (1952), Social Psychology, New York : Prentice-Hall. Asch S. (1955), « Opinions and Social Pressure », Scientific American, vol. 193, pp. 31-35. Asch S. (1956), « Studies of Independence and Conformity : A Minority of One Against a Unanimous Majority », Psychological Monographs, vol. 70(9). Aumann R.J. (1974), « Subjectivity and Correlation in Randomized Strategies », Journal of Mathematical Economics, vol. 1. Aumann R.J. (1987), « Correlated Equilibrium as an Expression of Bayesian Rationality », Econometrica, vol. 55, pp. 1-8. Austin-Smith D. et Bank J. (1996), « Information Aggregation, Rationality and the Condorcet Jury Theorem », American Political Science Review, vol. 90, pp. 34-45. Axelrod R. (1980), « Effective Choice in the Prisoner’s Dilemma », Journal of Conflict Resolution, vol. 24, pp. 3-25.
260
La décision
Axelrod R. (1984), The Evolution of Cooperation, New-York : Basic Books (traduction française : Donnant donnant, Odile Jacob, 1992). Bachrach P. et Baratz M.S. (1962), « The Two Faces of Power », American Political Science Review, vol. 56, pp. 947-952. Batifoulier P. (ed.) (2001), Théorie des conventions, Paris : Economica. Batifoulier P. (2005.), Conventions (Economie des), Notionnaire, Encyclopaedia-Universalis, Vol.2. « Les grandes doctrines ». Bazerman M. et Neale M. (1992), Negotiating Rationally, New York : The Free Press. Beach L.R. et Mitchell T.R. (1978), « A Contingency Model for the Selection of Decision Strategies », Academy of Management Review, vol. 3(3), pp. 439-450. Beggan J.K. et Messick D.M. (1988), « Social Values and Egocentric Bias, Two Tests of the Might over Morality Hypothesis », Journal of Personality and Social Psychology, vol. 55, pp. 606611. Benson B.L. et Baden J. (1985), « The Political Economy of Governmental Corruption : The Logic of Underground Government », Journal of Legal Studies, vol. 14(2), pp. 391-410. Bergson A. (1938), « A Reformulation of Certain Aspects of Welfare Economics », Quarterly Journal of Economics, vol. 52, pp. 314-344. Bernheim B.D. (1986), « Axiomatic Characterizations of Rational Choice in Strategic Environments », Scandinavian Journal of Economics, vol. 88(3), pp. 473-488. Berninghaus S., Guth W. et Keser C. (1999), « Decentralized or Collective Bargaining in a Strategy Experiment », Document de travail du Cirano 99s-31, Montréal. Berthoz Y. (2003), La décision, Paris : Odile Jacob. Black D. (1948), The Theory of Committees and Elections, Cambridge : Cambridge University Press. Bohner G., Erb H.P., Reinhard M.A. et Frank E. (1996), « Distinctiveness across Topics in Minority and Majority Influence : An Attributional Analysis and Preliminary Data », British Journal of Social Psychology, vol. 35, pp. 27-46. Bolman L.G. et Deal T. (1997), Reframing Organizations : Artistry, Choice, and Leadership, San Francisco : Jossey-Bass Publishers (2° edition). Bond R. et Smith P.B. (1996), « Culture and Conformity : A Meta-Analysis of Studies using Asch’s (1952b, 1956) Line Judgment Task », Psychological Bulletin, vol. 119, pp. 111-137. Bossert W. et Weymark J.A. (2000), « Utility in Social Choice », in Handbook of Utility, Theory, Vol. 2 : Extensions, Barberà S., Hammond P. et Seidl C. (eds.), Kluwer : Dordrecht, pp. 1099– 1177. Bowen H.R. (1943), « The Interpretation of Voting in the Allocation of Economic Resource », Quarterly Journal of Economics, vol. 58, pp. 27-48. Boyer R. et Orlean A. (1997), « Comment émerge la coopération ? Quelques enseignements des jeux évolutionnistes », in Les limites de la rationalité, tome 2 : Les Figures du Collectif, Reynaud B. (ed.), Colloque de Cerisy, Paris : La Découverte, pp. 19-44. Braybrooke D. et C.E. Lindblom (1963), A Strategy of Decision, New York : Free Press. Breuer J. et Freud S. (1956), Études sur l’hystérie, Paris : PUF (première édition allemande : 1895). Brown R. (1965, 1986), Social Psychology, New York : The Free Press. Brunsson N. (1990), « Deciding for responsibility and legitimation : alternative interpretations of organizational decision-making », Accounting, Organizations and Society, vol. 15 (1/2), pp 47-59. Buchanan J. et Tullock G. (1962), The Calculus of Consent, Logical Foundations of Constitutional Democracy, Ann Arbor : University of Michigan Press.
Bibliographie
261
Budescu D., Rapoport A. et Suleiman R. (1992), « Simultaneous vs. Sequential Requests in Resource Dilemmas with Incomplete Information », Acta Psychologica, vol. 80(1-3), pp. 297310. Burnstein E. et Vinokur A. (1973), « Testing Two Classes of Theories about Group Induced Shifts in Individual Choice », Journal of Experimental Social Psychology, vol. 9, pp. 123-137. Butera F. et Mugny G. (1995), « Biais de confirmation, d’infirmation et influence sociale », in Irrationalités collectives, Drozda-Senkowska E. (ed.), Lausanne : Delachaux et Niestlé. Cahuc P. (1993), La nouvelle microéconomie, Paris : La Découverte. Cahuc P. et Kempf H. (2000), « Paradoxes de l’altruisme », Cahiers du Mauss, vol. 15, pp. 223246. Caldas J., Rodrigues J. et Carvalho L. (2003), « The Uncertainty of Cooperation. Experimental and Theoretical Explorations on Public Goods », Communication au Colloque Conventions et Institutions : approfondissements théoriques et contributions au débat politique, Paris, 1113 décembre. Camerer C. (1997), « Progress in Behavioral Game », Journal of Economic Perspectives, vol. 11(4), pp. 167-188. Carmichael H. (1988), « Incentives in Academics : Why is Tenure », Journal of Political Economy, vol. 96(3), pp. 453-472. Cason T.N. et Mui V.L. (1997), « A Laboratory Study of Group Polarisation in the Team Dictator Game », The Economic Journal, vol. 107(444), pp. 1465-1483. Charreaux G. (1999), « La théorie positive de l’agence : lectures et relectures… », in De nouvelles théories pour gérer l’entreprise du 21° siècle, G. Koenig (ed.), Paris : Economica, pp. 60141. Chi M.T., Glaser R. et Rees E. (1982), « Expertise in Problem Solving », in Advances in the Psychology of Human Intelligence, Sternberg R. (ed), Hillsdale : Lawrence Erlbaum Associates, pp. 7-75. Chiappori P.A. et Orfali K. (1997), « Préférences et interactions : une mise en perspective », Revue Française de Sociologie, vol. 38(3), pp. 429-464. Christensen-Szalanski J.J. (1980), « A Further Examination of the Selection of Problem-Solving Strategies : the Effects of Deadlines and Analytic Aptitudes », Organizational Behavior and Human Performance, vol. 25(1), pp. 107-122. Coase, R.H. (1960), « The Problem of Social Cost », Journal of Law and Economics, vol. 3 (oct.), pp. 1-44. Cohen M.D. et Bacdayan P. (1994), « Organizational Routines are Stored as Procedural Memories : Evidence from a Laboratory Study », Organization Science, vol. 5(4), pp. 554-568. Cohen M.D., March J.G. et Olsen J.P. (1972), « A Garbage Can Model of Organizational Choice », Administrative Science Quarterly, vol. 17 (1), pp. 1-25. Colman A.M. (1982), « Game Theory and its Applications in the Social and Biological Sciences », International Series in Social Psychology, Oxford : Butterworth-Heineman Ltd. Condorcet (Marquis de) M. (1785), Essai sur l’application de l’analyse à la probabilité des décisions rendues à la pluralité des voix, Paris : Imprimerie Royale. Cotton J.L. et Baron R.S. (1980), « Anonymity, Persuasive Arguments and Choice Shifts », Social Psychology Quarterly, vol. 43, pp. 391-404. Cox T.H., Lobel S. et McLeod P.L. (1991), « Effects of Ethnic Group Cultural Differences on Cooperative and Competitive Behavior on a Group Task », Academy of Management Journal, vol. 34, pp. 827-847. Crozier M. (1962), Le phénomène bureaucratique, Paris : Seuil. Crozier M. (1970), La société bloquée, Paris : Seuil. Crozier M. et Friedberg E. (1977), L’acteur et le système, Paris : Seuil.
262
La décision
Crutchfield R.A. (1955), « Conformity and Character », American Psychologist, vol. 10, pp. 191198. Cyert R.M. et March J.G. (1963), A Behavioral Theory of the Firm, Englewood Cliffs : Prenctice Hall. d’Estaintot V.M. (1996), Dynamic Consistency in Choices Involving Mixed Outcomes, thèse, The University of Chicago. d’Estaintot V.M. (2001), « Délai temporel et inversion des choix dans les décisions concernant des options concomitantes », Psychologie Française, vol. 46(4), pp. 327-340. Daubech J.F. (2001), « La décision », in Singulière mélancolie, Libres cahiers pour la psychanalyse, vol. 3, pp. 23-34. Davidson D. (1990), « Paradoxes of Irrationality », in Rationality in Action : Contemporary Approaches, Moser P. (ed), Cambridge : Cambridge University Press, pp. 449-464. Dawes R.M., McTavish J. et Shaklee H. (1977), « Behavior, Communication and Assumptions about other People’s Behavior in a Commons Dilemma Situation », Journal of Personality and Social Psychology, vol. 35, pp. 1-11. de Mijolla A. (ed.) (2002), Dictionnaire international de la psychanalyse, Paris : Calmann-Lévy. de Montmorrillon B. (1999), « Théorie des conventions, rationalité mimétique et gestion de l’entreprise », in De nouvelles théories pour gérer l’entreprise du 21° siècle, G. Koenig (ed.), Paris : Economica, pp. 171-198. Deutsch M. (1982), « Interdependence and Psychological Orientation », in Cooperation and Helping Behavior, Deregla V.J. et Grzelak J. (eds), New York : Academic Press. Deutsch M. et Gerard H.B. (1955), « A Study of Normative and Informational Influence upon Individual Judgment », Journal of Abnormal and Social Psychology, vol. 51, pp. 629-636. Deutsch M. et Krauss R.M. (1960), « The Effect of Threat upon Interpersonal Bargaining », Journal of Abnormal and Social Psychology, vol. 61, pp. 181-189. Di Maggio P.J. et Powell W.W. (1983), « The Iron Cage Revisited : Institutional Isomorphism and Collective Rationality in Organizational Fields », American Sociological Review, vol. 48, pp. 147-160. Dittes J.E. et Kelley H.H. (1956), « Effects of Different Conditions of Acceptance on Conformity to Group Norms », Journal of Abnormal and Social Psychology, vol. 53, pp. 100-107. Doise W. (1969), « Intergroup Relations and Polarization of Individual and Collective Judgments », Journal of Personality and Social Psychology, vol. 12, pp. 136-143. Doise W. (1993), Logiques sociales dans le raisonnement, Neuchatel : Delachaux et Niestlé. Donaldson G. et Lorsch J. (1983), Decision making at the top, New York : Basic Books. Dor J. (1985), Introduction à la lecture de Lacan, Paris : Denoël. Downs A. (1957), « An Economic Theory of Political Action in a Democracy », Journal of Political Economy, vol. 65(2), pp. 135-150. Dubois B. (1994), Comprendre le consommateur, Paris : Dalloz (2e édition). Dubuisson S., (1998), « Regard d’un sociologue sur la notion de routine dans la théorie évolutionniste », Sociologie du Travail, vol. 4, pp. 491-502. Duesenberry J. (1960), « Comment on “An Economic Analysis of Fertility”, in National Bureau Committee for Economic Research » in Demographic and Economic Change in Developed Countries, Princeton, NJ : Princeton University Press, pp. 231-234. Dupuy J-P. (1994), « Temps et rationalité », Cahiers d’Economie Politique, vol. 24-25, pp. 69104. Durand S. (2000), Sur quelques paradoxes en théorie du choix social et en décision multicritère, Thèse de doctorat, Grenoble : Université J. Fourrier. Economie et Société (1998), La confiance, numéro spécial, Série Sciences de Gestion, vol. 8-9.
Bibliographie
263
Einhorn H.J. et Hogarth R.M. (1985), « Ambiguity and Uncertainty in Probabilistic Inference », Psychological Review, vol. 92, pp. 433-461. Einhorn H.J., Hogarth R.M. et Klempner E. (1977), « Quality of Group Judgment », Psychological Bulletin, vol. 84, pp. 158-172. Eiser J.R. et Bhavnani K.K. (1974), « The Effect of Situational Meaning on the Behaviour of Subjects in the Prisoner’s Dilemma Game », European Journal of Social Psychology, vol. 4, pp. 93-97. Eiser J.R. et Tajfel H. (1972), « Acquisition of Information in Dyadic Interaction », Journal of Personality and Social Psychology, vol. 23 (3), pp. 340-345. Ellsberg, D. (1961), « Risk, Ambiguity and the Savage Axioms », Quarterly Journal of Economics, vol. 75(4), pp. 643-669. Eymard-Duvernay F. (2004), Economie politique de l’entreprise, Repères, Paris : La Découverte. Fama E.F. (1980), « Agency Problems and the Theory of the Firm », Journal of Political Economy, vol. 88(2), pp. 288-307. Fama E.F. et Jensen M.C. (1983), « Separation of Ownership and Control », Journal of Law and Economics, vol. 26, pp. 301-325. Farazmand A. (2003), « Chaos and Transformation Theories : A Theoretical Analysis with Implications for Organization Theory and Public Management », Public Organization Review, vol. 3(4), pp. 339-351. Fayol H. (1970), Administration industrielle et générale, Paris : Dunod. Feddersen T.J. et Pesendorfer W. (1998), « Convicting the Innocent : The Inferiority of Unanimous Jury Verdicts Under Strategic Voting », American Political Science Review, vol. 92(1), pp. 23-35. Festinger L. (1954), « A Theory of Social Comparison Processes », Human Relations, vol. 7, pp. 117-140. Fischhoff B. (1975), « Hindsight ≠ Foresight : the Effect of Outcome Knowledge on Judgment under Uncertainty », Journal of Experimental Psychology : Human Perception and Performance, vol. 1, pp. 288-299. Fishburn P. (1977), « Condorcet Social Choice Functions », S.I.A.M, Journal of applied Mathematics, vol. 33(3), pp. 469-489. Fisher R. et Ury W.L. (1981), Getting to YES : Negotiating Agreement without Giving In, Boston : Houghton Mifflin. Fleurbaey M. (2000), « Choix social : une difficulté et de multiples possibilités », Revue Economique, vol. 51(5), pp. 1215-1232. Fligstein N. (1991), « The Structural Transformation of American Industry : an Institutional Account of the Causes of Diversification in the Largest Firms, 1919-1979 », in The New Institutionalism in Organizational Analysis, Powell W.W. et P.J. Di Maggio (eds), Chicago : The University of Chicago Press, pp. 311-336. Flood R.P. et Garber P.M. (1994), Speculative Bubbles, Speculative Attacks, and Policy Switching, Cambridge, Mass : MIT Press. Follett M.P. (1940), « Constructive Conflict », in Dynamic Administration : The Collected Papers of Mary Parker Follett, H.C. Metcalf et L. Urwick (eds), New York : Harper. Forsythe R., Nelson F., Neumann G.R. et Wright J. (1992), « Anatomy of an Experimental Stock Market », American Economic Review, vol. 82(5), pp. 1142-1161. Fox J. et Guyer M. (1978), « ‘Public’ Choice and Cooperation in N-Person Prisoner’s Dilemma », Journal of Conflict Resolution, vol. 22(3), pp. 469-481. Frank R., Gilovich T. et Regan D. (1993), « Does Studying Economics Inhibit Cooperation ? », the Journal of Economic Perspectives, vol. 7(2), pp. 159-188.
264
La décision
Fredrickson J.W. (1986), « The Strategic Decision Processes and Organizational Structure », Academy of Management Review, vol. 11(2), pp. 280-297. Freeman, R.E. (1984), Strategic management : A stakeholder approach, Boston : Pitman. Freud S. (1927), Essais de psychanalyse, Paris : Payot, 1927. Freud S. (1936), Nouvelles conférences sur la psychanalyse, Paris : Gallimard. Freud S. (1952), « Les pulsions et leur destin », in Métapsychologie, Paris : Gallimard, pp. 25-66 (première édition allemande : 1915). Freud S. (1953), Cinq leçons sur la psychanalyse, Paris : Payot. Freud S. (1954a), « Remarques psychanalytiques sur l’autobiographie d’un cas de paranoïa : le président Schreber », in Cinq psychanalyses, Paris : PUF, pp. 263-324 (première édition allemande 1911). Freud S. (1954b), « Remarques sur un cas de névrose obsessionnelle (l’homme aux rats) », in Cinq psychanalyses, Paris : PUF, pp. 199-261 (première édition allemande 1913). Freud S. (1967a), L’interprétation du rêve, Paris : PUF (première édition allemande : 1900). Freud S. (1967b), Psychopathologie de la vie quotidienne, Paris : Payot (première édition allemande 1901). Freud S. (1970), Abrégé de psychanalyse, Paris : PUF. Freud S. (2001a), Introduction à la psychanalyse, Paris : Payot (première édition française : 1922). Freud S. (2001b), « Le motif du choix des coffrets », in L’inquiétante étrangeté et autres textes, Paris : Gallimard, pp. 150-194 (première édition allemande 1913). Freud S., Gesammelte Werke, vol. 18, Fischer Verlag. Frydman R. (ed.) (1994), Quelles hypothèses de rationalité pour la théorie économique ?, Cahiers d’Économie Politique, n° 24-25. Galbraith J.K. (1992), Brève histoire de l’euphorie financière, Paris : Seuil. Garber P.M. (1990), « Famous first bubbles », Journal of Economic Perspectives, vol. 4(2), pp. 35-54. Généreux J. (1996)., L’économie politique, analyse économique des choix publics et de la vie politique, Paris : Larousse. Gibbard A.F. (1973), « Manipulation of Voting Schemes : A General Result », Econometrica, vol. 41(4), pp. 587-601. Gigone D. et Hastie, R. (1997), « Proper Analysis of Group Judgments », Psychological Bulletin, vol. 121, pp. 149-167. Gomez P.-Y. (1996), Le gouvernement de l’entreprise — Modèles économiques de l’entreprise et pratiques de gestion, Paris : InterEditions. Good D.A. (1991), « Cooperation in a Microcosm : Lessons from Laboratory Games », in Cooperation and Prosocial Behaviour, Hinde R.A. et Groebel J. (eds), Cambridge : Cambridge University Press, pp. 224-237. Granovetter M. (1985), « Economic and Social Structure : the Problem of Embeddedness », American Journal of Sociology, vol. 91(3), pp. 481-510. Granovetter M. (1994), « Les institutions économiques comme constructions sociales : un cadre d’analyse » in Analyse économique des conventions, A. Orléan (ed), Paris : PUF, pp. 79-94. Greenberg M.S., Williams K.D. et O’Brien M.K. (1986), « Considering the Harshest Verdict First : Biasing Effects on Mock Juror Verdicts », Personality and Social Psychology Bulletin, vol. 12, pp. 51-62. Grossman S.J. et Perry M. (1986), « Sequential Bargaining under Asymmetric Information », Journal of Economic Theory, vol. 39(1), pp. 120-154. Guerrien B. (1996), Dictionnaire d’analyse économique, Paris : La Découverte. Guerrien B. (1997), La théorie des jeux, Paris : Economica, 2e édition.
Bibliographie
265
Hacking I. (1990), The Taming of Chance, Cambridge : Cambridge University Press. Hall J. et Watson W.H. (1970), « The Effects of a Normative Intervention on Group DecisionMaking Performance », Human Relations, vol. 23(4), pp. 299-317. Hambrick D. et Mason P. (1984), « Upper Échelons : the Organization as a Reflection of its Top Managers », Academy of Management Review, vol. 9(2), pp. 193-203. Hamburger H., Guyer M. et Fox J. (1975), « Group Size and Cooperation », Journal of Conflict Resolution, vol. 19, pp. 503-531. Hansson B, (1969), « Voting and Group Decision Functions », synthese, vol. 20(4), pp. 526537. Hardin G. (1968), « The Tragedy of the Commons », Science, vol. 162, pp. 1243-1248. Hargreaves-Heap S., Hollis M., Lyons B., Sugden R. et Weale A. (1992), The Theory of Choice : a Critical Guide, Oxford : Blackwell. Harsanyi J.C. (1955), « Cardinal Welfare, Individualistic Ethics and Interpersonal Comparisons of Utility », Journal of Political Economy, vol. 63(4), pp. 309-321. Harsanyi J.C. (1967), « Games with Incomplete Information Played by Bayesian Players. I : The Basic Model », Management Science, vol. 14(3), pp. 459-462. Harsanyi J.C. (1968a), « Games with Incomplete Information Played by Bayesian Players. II : Bayesian Equilibrium Points », Management Science, vol. 14(5), pp. 320-334. Harsanyi J.C. (1968b), « Games with Incomplete Information Played by Bayesian Players. III : Basic Probability Distribution of the Game », Management Science, vol. 14(7), pp. 486-502. Harsanyi J.C. (1978), « Games with Randomly Distributed Payoffs : a New Rationale for Mixed Strategy Equilibrium Points », International Journal of Game Theory, vol. 2, pp. 1-23. Hastie R., Penrod S. et Pennington, N.S. (1983), Inside the Jury, Cambridge, Mass : Harvard University Press. Hicks J.R. (1939), « The Foundations of Welfare Economics », Economic Journal, vol. 69, pp. 696-712. Hickson D.J., Butler R.J., Cray D., Mallory G.R. et Wilson D.C. (1986), Top Decisions, Oxford : Blackwell. Hilton D.J. (1997), « Constructive Processes in Judgment and Decision-Making : Implication for Psychology and marketing », Swiss Journal of Psychology, vol. 56, pp. 112-126. Hinings C.R., Hickson D.J., Pennings J.M. et. Schneck R.E (1974), « Structural Conditions of Interorganizational Power », Administrative Science Quarterly, vol. 19(2), pp. 21-44. Hinsz V.B., Tindale R.S. et Vollrath D.A. (1997), « The Emerging Conceptualization of Groups as Information Processors », Psychological Bulletin, vol. 121(1), pp. 43-64. Insko C.A., Drenan S., Solomon M.R., Smith R. et Wade, T.J. (1983), « Conformity as a Function of Positive Self-Evaluation with Being Liked and Being Right », Journal of Experimental Social Psychology, vol. 19, pp. 341-358. Insko C.A., Schopler J., Drigostas S.M., Graetz K.A., Kennedy J., Cox C. et Bornstein G. (1993), « The Role of Communication in Interindividual–Intergroup Discontinuity », Journal of Conflict Resolution, vol. 37(1), pp. 108-138. Janis I. (1982), Groupthink, Boston, Mass. : Houghton-Mifflin (2e édition). Jerdee T.H. et Rosen B. (1974), « Effects of Opportunity to Communicate and Visibility of Individual Decisions on Behavior in the Common Interest », Journal of Applied Psychology, vol. 59(6), pp. 712-716. Jorgenson D.O. et Papciak A.S. (1981), « The Effects of Communication, Resource Feedback, and Identifiability on Behavior in a Simulated Commons », Journal of Experimental Social Psychology, vol. 17, pp. 373-385. Kahan J.P. (1973), « Noninteraction in an Anonymous Three-Person Prisoner’s Dilemma Game », Behavioral Science, vol. 18, pp. 124-127.
266
La décision
Kahneman D. et Tversky A. (1979a), « Prospect Theory : An Analysis of Decision under Risk », Econometrica, vol. 47(2), pp. 263-291. Kahneman D. et Tversky A. (1979b), « Intuitive Prediction : Biases and Corrective Procedures », TIMS Studies in the Management Sciences, vol. 12, pp. 313-327. Kahneman D., Knetsch J.L. et Thaler R.H. (1986), « Fairness and the Assumptions of Economics », Journal of Business, vol. 59, pp. 285-300. Kahneman D., Slovic P. et Tversky A. (eds) (1982), Judgment under Uncertainty : Heuristics and Biases, Cambridge : Cambridge University Press. Kaldor, N. (1939), « Welfare Propositions in Economics and Inter-Personal Comparisons of Utility », Economic Journal, vol. 49, pp. 549-552. Karpik L. (1998), « La confiance : réalité ou illusion ? Examen critique d’une analyse de Williamson », Revue Economique, vol. 49(4), pp. 1043-1056. Kast R. (2002), La théorie de la décision, Paris : La Découverte. Kelley H.H. (1952), « Two Functions of Reference Groups », in Readings in Social Psychology, Swanson G.E., Newcomb T.M et Hartley E.L. (eds.), New York : Holt, Rhinehart and Winston. Kelley H.H. (1972), « Attribution in Social Interaction » in Attribution, Jones E., Kanouse D., Kelley H.H. et al. (eds), Morris-Town : General Learning Press. Kelley H.H. et Stahelski A.J. (1970a), « Errors in Perception of Intentions in a Mixed-Motive Game », Journal of Experimental Social Psychology, vol. 6, pp. 379-400. Kelley H.H. et Stahelski A.J. (1970b), « Social Interaction Basis of Cooperators’ and Competitors’ Beliefs about Others », Journal of Personality and Social Psychology, vol. 16(1), pp. 6691. Kerr N.L. (1989), « Illusions of Efficacy : The Effects of Group Size on Perceived Efficacy in Social Dilemmas », Journal of Experimental Social Psychology, vol. 25, pp. 287-313. Kerr N.L. et Kaufman-Gilliland C.M. (1994), « Communication, Commitment and Cooperation in Social Dilemmas », Journal of Personality and Social Psychology, vol. 66, pp. 513-529. Kets de Vries M. (1995), Leaders, fous et imposteurs, Paris : Eska. Kets de Vries M. (1996), « The Anatomy of the Entrepreneur : Clinical Observations », Human Relations, vol. 49(7), pp. 853-876. Kihlström R. et Riordan M. (1984), « Advertising as a Signal », Journal of Political Economy, Vol. 92(3), pp. 132-157. Kingdon J.W. (1984), Agenda, Alternatives and Public Policies, Boston : Little Brown and Cy. Klayman J. et Ha Y.W. (1987), « Confirmation, Disconfirmation, and Information in HypothesisTesting », Psychological Review, vol. 94(2), pp. 211-228. Klein M. (1950), Contributions to Pycho-Analysis, London : Hogarth Press. Klein M. (1968a), « Quelques conclusions théoriques au sujet de la vie émotionnelle des bébés », in Klein M., Heimann P., Isaacs S. et Riviere J. (eds.), Développements de la psychanalyse, Paris : PUF (première version anglaise : 1932). Klein M. (1968b), « Les racines infantiles du monde adulte », in Envie et gratitude et autres essais, Gallimard, pp. 95-117 (première version anglaise : 1959). Kohlberg E. et Mertens J. (1986), « On the Strategic Stability of Equilibria », Econometrica, vol. 54(5), pp. 1003-1034. Kolm S-C (1972), Justice et équité, Paris : Editions du CNRS (édition en anglais : MIT Press, 1988). Koriat A., Lichtenstein S. et Fischhoff B. (1980), « Reasons for Confidence », Journal of Experimental Psychology : Human Learning and Memory, vol. 6(2), pp. 107-118. Kotter J.P. (1982), « What Effective General Managers Really Do », Harvard Business Review, vol. 60(6), pp. 156-167. Kotter J.P. (1982), The General Manager, New York : Free Press.
Bibliographie
267
Kreps D.M. (1984), Signalling Games and Stable Equilibria, Research Paper, Stanford University. Kreps D.M. (1990), « Corporate Culture and Economic Theory » in Perspectives on Positive Political Economy, Alt J.E. et Shepsle K.A. (eds), Cambridge : Cambridge University Press, pp. 90143. Kreps D.M. et Wilson R. (1982), « Sequential Equilibria », Econometrica, vol. 50(4), pp. 863894. Kreps D.M., Milgrom P., Roberts J. et Wilson R. (1982), « Rational Cooperation in the Finitely Repeated Prisoners Dilemma », Journal of Economic Theory, vol. 27(2), pp. 245-252. Lacan J. (1966), Écrits, Paris : Le Seuil. Langer E.J. (1975), « The Illusion of Control », Journal of Personality and Social Psychology, vol. 32, pp. 311-328. Laplanche J. et Pontalis J.B. (1967), Vocabulaire de la psychanalyse, Paris : PUF. Laroche H. (1995), « From Decision to Action in Organizations : Decision-Making as a Social Representation », Organization Science, vol. 6(1), pp. 62-75. Laroche H. (2003), « Jugements et justifications dans les décisions », Management et Conjoncture Sociale, vol. 619, pp. 12-17. Larquier (de) G., Abecassis P. et Batifoulier P. (2001), « La dynamique des conventions en théorie des jeux », in Théorie des conventions, Batifoulier P. (ed), Paris : Economica, pp. 127-160. Lazear E., (1981), « Agency Earnings Profiles, Productivity and Hours Restrictions », American Economic Review, vol. 71(4) pp. 606-620. Le Menestrel M. (1997), « Consequential Rationality, Procedural Rationality, and Optimal Nash Equilibrium », Working paper 97/114/TM, INSEAD. Leibenstein H. (1966), « Allocative Efficiency vs ‘X-Inefficiency’ », American Economic Review, n° 56, pp. 392-415. Leibenstein H. (1969), « Organisational or Frictional Equilibria X-efficiency and the Rate of Innovation », The Quarterly Journal of Economics, vol. 83(4), pp. 600-623. Levitt B. et Nass C. (1989), « The Lid on the Garbage-Can : Constraints on Decision-Making in the Technical Core of College-Text Publishers », Administrative Science Quarterly, vol. 34, pp. 190-207. Lewis D. (1969), Convention : a Philosophical Study, Cambridge, Mass. : Harvard University Press. Lichtenstein S. et Slovic P. (1971), « Reversals of Preference between Bids and Choices in Gambling Decisions », Journal of Experimental Psychology, vol. 89, pp. 46-55. Liebrand W.B.G., Jansen R.W., Rijken V.M. et Shure C.J.M. (1986), « Might over Morality : Social Values and the Perception of other Players in Experimental Games », Journal of Experimental Social Psychology, vol. 22, pp. 203-215. Lindblom C. (1959), « The Science of Muddling Through », Public Administration Review, vol. 19, pp. 79-88. Lindblom C. (1968), The Policy-Making Process, Englewood Cliffs, NJ : Prenctice Hall. Loewenstein G. et Thaler R.H. (1989), « Anomalies, Intertemporal Choice », Journal of Economic Perspectives, vol. 3(4), pp. 181-193. Lopes L.L. (1994), « Psychology and Economics : Perspectives on Risk, Co-operation and the Marketplace », Annual Review of Psychology, vol. 45, pp. 197-227. Luce R.D. et Raiffa H. (1957), Games and Decisions, New-York : Willey. Maass A. et Clark R.D. (1984), « Hidden Impact of Minorities : Fifteen Years of Minority Influence Research », Psychological Bulletin, vol. 95, pp. 428-450. Mackay C. (1852), Extraordinary Popular Delusions and the Madness of Crowds, London : Office of the National Illustrated Library (reédité d’après Page L.C. and Co., Boston, 1932). March J.G. (1988), Decisions and Organizations, Oxford : Blackwell.
268
La décision
March J.G. et Olsen J.P. (1976), Ambiguity and Choice in Organizations, Bergen, Norway : Universitätsforlaget. March J.G. et Shapira Z. (1987), « Managerial Perspectives on Risk and Risk Taking », Management Science, vol. 1987(33), pp. 1404-1418. March J.G. et Simon H.A. (1958), Organizations, New York : Wiley. March J.G. et Weissinger-Baylon R. (1986), Ambiguity and Command : Organizational Perspectives on Military Decision-Making, Boston, MA : Pitman. Mariotti M. (1995), « Is Bayesian Rationality Compatible with Strategic Rationality ? », The Economic Journal, vol. 105(432), pp. 1099-1109. Marwell G. et Ames R.E. (1979), « Experiments on the Provision of Public Goods. I : Resources, Interest, Group Size, and the Free Rider Problem », American Journal of Sociology, vol. 84, pp. 1335-1360. Mausner B. (1954), « Prestige and Social Interaction. The Effect of one Partner’s Success in a Relevant Task on the Interaction of Observer Pairs », Journal of Abnormal and Social Psychology, vol. 49, pp. 557-560. Maynard Smith J. (1982), Evolution and the Theory of Games, Cambridge : Cambridge University Press. McCauley C., Durham M., Copley J.B. et Johnson J.P. (1985), « Patients’ Perceptions of Treatment for Kidney Failure : the Impact of Personal Experience on Population Predictions », Journal of Experimental Social Psychology, vol. 21, pp. 174-193. McNeil P., Paulker M., Sox N. et Tversky A. (1982), « On the Elicitation of Preferences for Alternative Therapies », New England Journal of Medicine, vol. 306(21), pp. 1259-62. Merton R.K. et Kitt A.S. (1950), « Contributions to the Theory of Reference Group Behavior », in Studies in the Scope and Method of « The American Soldier », Merton R.K. et Lazarsfeld P.F. (eds.), New York : The Free Press of Glencoe. Messick D.M. et Brewer M.B. (1983), « Solving Social Dilemmas : A Review », in Review of Personality and Social Psychology, L. Wheeler et P. Shaver (eds), Beverly Hills : Sage Publications, vol. 4, pp. 11-44. Messick D.M. et McClintock C.G. (1968), « Motivational Basis of Choice in Experimental Games », Journal of Experimental Social Psychology, vol. 4, pp. 1-25. Mezias S. (1990), « An Institutional Model of Organizational Practice : Financial Reporting at the Fortune 200 », Administrative Science Quarterly, vol. 35, pp. 431-457. Milgram S. (1963), « Behavioral Study of Obedience », Journal of Abnormal and Social Psychology, vol. 67, pp. 371-378. Milgram S. (1974), Obedience to Authority : An Experimental View, London : Tavistock. Milgrom P. et Roberts J. (1982), « Predation, Reputation and Entry Deterrence », Journal of Economic Theory, vol. 27, pp. 280-312. Milgrom P. et Roberts J. (1986), « Price and Advertising Signal of Product Quality », Journal of Political Economy, vol. 94(4), pp. 796-821. Miller D. (1987), « Strategy Making and Structure : Analysis and Implication for Performance », Academy of Management Journal, vol. 30, pp. 7-32. Mintz A. (1951), « Non-Adaptive Group Behavior », Journal of Abnormal and Social Psychology, vol. 46, pp. 150-159. Mintzberg H. (1973), The Nature of Managerial Work, New York : Harper and Row. Mintzberg H. (1979), The Structuring of Organizations : A Synthesis of the Research, Englewoods Cliffs, NJ : Prenctice-Hall. Mintzberg H. (1982), Structure et dynamique des organisations, Paris : Les Editions d’Organisation.
Bibliographie
269
Mintzberg H. et Waters J.A. (1985), « Of Strategies, Deliberate and Emergent », Strategic Management Journal, vol. 6, pp. 257-272. Mintzberg H. et Waters J.A. (1990), « Does Decision Get in the Way ? », Organization Studies, vol. 11, pp. 1-16. Morel C. (2002), Les décisions absurdes, sociologie des erreurs radicales et persistantes, Paris : Gallimard. Moscovici S. (1976), Social Influence and Social Change, London : Academic Press. Moscovici S. et Zavalloni M. (1969), « The Group as Polarizer of Attitudes », Journal of Personality and Social Psychology, vol. 12, pp. 125-35. Mugny G. (1982), the Power of Minorities, New York : Academic Press. Muir H.C. et Marrison C. (1989), « Human Factors in Cabin Safety », Aerospace, April, pp. 1821. Musgrave R. (1959), The Theory of Public Finance, New-York : McGraw Hill. Nash J. (1951), « Non Cooperative Games », Annals of Mathematics, vol. 54, pp. 286-295. Nemeth C. (1986), « Differential Contributions of Majority and Minority Influence », Psychological Review, vol. 93, pp. 23-32. Nisbett R.E. et Wilson T.D. (1977), « Telling More than We Can Know : Verbal Reports on Mental Processes », Psychological Review, vol. 84(3), pp. 231-259. Nowak A., Szamrej J. et Latané B. (1990), « From Private Attitude to Public Opinion : A Dynamic Theory of Social Impact », Psychological Review, vol. 97(3), pp. 362-376. Nutt P.C. (1993), « The Formulation Processes and Tactics Used in Organizational Decision Making », Organization Science, vol. 4(2), pp. 226-252. Nutt P.C. (1998), « Framing Strategic Decisions », Organization Science, vol. 9(2), pp. 195-217. Nutt P.C. (2002), Why decisions fail, San Francisco, CA : Berrett Koelher. Olson M. (1965), The Logic of Collective Action : Public Goods and the Theory of Groups, Cambridge, Mass. : Harvard University Press (traduction française : Logique de l’action collective, Paris : PUF, 1966). Olson M. (1982), The Rise and Decline of Nations : Economic Growth, Stagflation, and Economic Rigidities, New Haven and London : Yale University Press. Orbell J.M., Dawes R.M. et van de Kragt J.C. (1988), « Explaining Discussion Induced Cooperation », Journal of Personality and Social Psychology, vol. 54, pp. 811-819. Orléan A. (1994a), « Sur le rôle respectif de la confiance et de l’intérêt dans la constitution de l’ordre marchand », Revue du MAUSS, vol. 4, pp. 17-36. Orléan A. (1994b), « Vers un modèle général de la coordination économique par les conventions », in Analyse économique des conventions, Paris : PUF. Orléan A. (éd.) (2004), Analyse économique des conventions, 2e édition, Quadrige, PUF. Oskamp S. (1965), « Overconfidence in Case-Study Judgments », Journal of Consulting Psychology, vol. 29, pp. 261-265. Palmarini M.P. (1995), La réforme du jugement : ou comment ne plus se tromper, Paris : Odile Jacob. Park C.W. (1978), « A Seven-Point Scale and a Decision Maker’s Simplifying Strategy : an Operationalized Satisficing-Plus Model », Organizational Behavior and Human Performance, vol. 21(2), pp. 252-272. Payne J.W., Bettman J.R. et Johnson E.J. (1992), « Behavioral Decision Research : A Constructive Processing Perspective », Annual Review of Psychology, vol. 43, pp. 87-131. Pettigrew A.M. (1973), The Politics of Organizational Decision-Making, London : Tavistock. Pfeffer J. et Salancick G.R. (1978), The External Control of Organizations : A Resource Dependence Perspective, London : Harper et Row. Picard P. (1994), Éléments de microéconomie, Paris : Montchrestien, 4e édition.
270
La décision
Pigou A.C. (1920), Economics of Welfare, London : McMillan, 1re édition. Pilkington R. et Parker-Jones C. (1996), « Interacting with Computer-Based Simulation : The Role of Dialogue », Computers and Éducation, vol. 27(1), pp. 1-14. Polley D. (1997), « Turbulence in Organizations : New Metaphors for Organizational Research », Organization Science, vol. 8(5), 445-458. Powell W.W. et Di Maggio P.J (1991), The New Institutionalism in Organizational Analysis, Chicago : The University of Chicago Press. Quinn J.B. (1980), Strategic Change : Logical Incrementalism, Homewood, IL : Richard D. Irwin. Rabbie J.M. (1991), « Determinants of Instrumental Intragroup Cooperation », in Cooperation and Prosocial Behaviour, Hinde R.A. et Groebel J. (eds), Cambridge : Cambridge University Press, pp. 238-262. Rabin M. (1993), « Incorporating Fairness into Game Theory and Economics », American Economic Review, vol. 83(5), pp. 1281-1302. Rabin M. (1998), « Psychology and Economics », Journal of Economic Literature, vol. 36(1), pp. 11-46. Rapoport A. et Chammah A.M. (1965), Prisoner’s Dilemma : A Study in Conflict and Cooperation, Ann Arbor, MI : University of Michigan Press. Rapoport A., Bornstein G. et Erev I. (1989), « Intergroup Competition for Public Goods : Effects of Unequal Resources and Relative Group Size », Journal of Personality and Social Psychology, vol. 56, pp. 748-756. Rawls J. (1971), A Theory of Justice, Cambridge, Mass. : Harvard University Press (traduction française : Théorie de la justice, Paris, Seuil, 1987). Reny P.J. (1992), « Rationality in Extensive — Form Games », Journal of Economic Perspectives, vol. 6(4), pp. 103-108. Reynaud B. (1998), « Les conditions de la confiance. Réflexions à partir du rapport salarial », Revue Economique, vol. 49(6), pp. 1455-1472. Rocquet A. (2003), De la pertinence des politiques répressives sur la formation des carrières délinquantes : une approche analytique et empirique de la dissuasion de la délinquance juvénile de masse, Thèse, Université Paris I. Rosenthal R. (1981), « Games of Perfect Information, Predatory Pricing and the Chain Store Paradox », Journal of Economic Theory, vol. 25(1), pp. 92-100. Ross L. et Leper M.R. (1980), « The Perseverance of Beliefs : Empirical and Normative Considerations », in New Directions for Methodology and Behavioral Science : Fallible Judgment in Behavioral Research, Shweder R. et Fiske D.W. (eds), San Francisco : Jossey-Bass, pp. 17-36. Roux-Dufort C. et Vidaillet B. (2003), « The Difficulties of Improvising in a Crisis Situation : A Case Study », International Studies of Management and Organization, vol. 33(1), pp. 86-115. Rubinstein A. (1982), « Perfect Equilibrium in a Bargaining Model », Econometrica, vol. 50(1), pp. 97-105. Rullière J.-L. et Walliser B. (1995), « De la spécularité à la temporalité en théorie des jeux », Revue d’Economie Politique, vol. 105(4), pp. 601-616. Russo J.E. et Schoemaker P.J.H. (1989), Confident Decision-Making : How to Make the Right Decision Every Time, London : Piatkus. Salancik G.R. et Pfeffer J. (1974), « The base and use of power in organizational decision making : the case of a university », Administrative Science Quarterly, vol. 19, pp. 453-473. Salancik G.R. et M.C. Brindle (1997), « The Social Ideologies of Power in Organizational Decisions » in Organizational Decision Making, Shapira Z. (ed), Cambridge : Cambridge University Press, pp. 111-132.
Bibliographie
271
Samuelson C.D., Messick D.M., Rutte C.G. et Wilke H.A.M. (1984), « Individual and Structural Solutions to Resource Dilemmas in Two Cultures », Journal of Personality and Social Psychology, vol. 47, pp. 94-104. Samuelson P.A. (1947), Foundations of Economic Analysis, Cambridge, Mass. : Harvard University Press. Satterthwaite M.A. (1975), « Strategyproofness and Arrow’s Conditions : Existence and Correspondence Theorems for Voting Procedures and Social Welfare Functions », Journal of Economic Theory, vol. 10(2), pp. 187-217. Savage L.J. (1954), The Foundations of Statistics, New-York : Dover Publications. Schachter S., Hood D.C, Gerin W., Andreassen P. et Rennert M. (1985), « III : Some Causes and Consequences of Dependence and Independence in the Stock Market », Journal of Economic Behavior and Organization, vol. 6, pp. 339-357. Schelling T. (1960), The Strategy of Conflict, Cambridge, Mass. : Harvard University Press. Schmidt C. (1990), « Dissuasion, rationalité et magasins à succursales multiples », Revue d’Economie Politique, vol. 100(2), pp. 297-304. Schopler J., Insko C.A., Graetz K.A., Drigotas S.M. et Smith V.A. (1991), « The Generality of the Individual-Group Discontinuity Effect : Variations in Positivity-Negativity of Outcomes, Players’ Relative Power, and Magnitude of Outcomes », Personality and Social Psychology Bulletin, vol. 17(6), pp. 612-624. Schopler J., Insko C.A., Currey D., Smith S., Brazil D., Riggins T., Gaertner L. et Kilpatrick S, (1994), « The Survival of a Cooperative Tradition in the Intergroup Discontinuity Context », Motivation and Emotion, vol. 18(4), pp. 301-315. Schotter A. (1981), The Economic Theory of Social Institution, Cambridge : Cambridge University Press. Selten R. (1978), « The Chain Store Paradox », Theory and Decision, vol. 9(36), pp. 127,159. Sen A. (1979), Collective choice and social welfare, Amsterdam : North-Holland (1re edition, San Francisco : Holden Day, 1970). Sfez L. (1981), Critique de la décision, Paris : Presses de la Fondation des Sciences Politiques. Shafir E. et Tversky A. (1997), « Penser dans l’incertain. Raisonner et choisir de façon non conséquentialiste », in Les limites de la rationalité, tome 1. Rationalité, éthique et cognition, Dupuy J.P. et Livet P. (eds), Paris : La Découverte, pp. 118-154. Shapira Z. (1999), Aspiration Levels and Risk-Taking : A Theoretical Model and Empirical Study on the Behaviour of Government Bond Traders, document non publié, New York University. Shapley L.S. (1953), « A value for n-person games » in Contributions to the Theory of Games IV, Tucker A.W. et Luce R.D. (eds), Princeton : Princeton University Press, pp. 307-317. Sherif M. (1935), « A Study of Some Social Factors in Perception », Archives of Psychology, vol. 187. Sherif M., Harvey O.J., White B.J., Hood W.R. et Sherif C. (1954), Experimental Study of Positive and Negative Intergroup Attitudes between Experimentally Produced Groups : Robbers’Cave Experiment, Norman : University of Oklahoma. Simon H.A. (1945), The Administrative Behavior, New York : Free Press. Simon H.A. (1955), « A Behavioral Model of Rational Choice », Quarterly Journal of Economics, vol. 69(4), pp. 99-118. Simon, H.A. (1960), The New Science of Management Decision, New York : Harper et Row. Simonson I. (1989), « Choice Based on Reasons : The Case of Attraction and Compromise Effects », Journal of Consumer Research, vol. 16, pp. 158-174. Slovic P. et Mac Phillamy D.J. (1974), « Dimensional Commensurability and Cue Utilization in Comparative Judgment », Organizational Behavior and Human Performance, vol. 11, pp. 172194.
272
La décision
Slovic P., Fischhoff B. et Lichtenstein S. (1977), « Behavioral Decision Theory », Annual Review of Psychology, vol. 28, pp. 1-39. Smith P.B. et Bond M.H. (1998), Social Psychology across Cultures, London : Harvester Wheatsheaf (2e édition). Smith P.B., Peterson M.F. et Misumi J. (1993), « Event Management and Work Team Effectiveness in Japan, Britain and the USA », Journal of Occupational and Organizational Psychology, vol. 67, pp. 33-43. Sorin S. (1995), « Bluff et réputation », Revue d’Economie Politique, vol. 105(4), pp. 583-600. Stacey R.D. (1992), Managing Chaos : Dynamic Business Strategies in an Unpredictable World, London : Kogan Page. Stacey R.D. (1993), Strategic Management and Organizational Dynamics, London : Pitman Publishing. Starbuck W.H. (1983), « Organizations as Action Generators », American Sociological Review, vol. 48, pp. 91-102. Starbuck W.H. (1985), « Acting First and Thinking Later : Theory versus Reality in Strategic Change », in Organizational Strategy Decision and Change, Pennings J.M. et al. (eds), San Francisco : Jossey Bass, pp. 336-372. Stark O. (1987), « Cooperating Adversaries », Kyklos, vol. 40(4), pp. 515-528. Stasson M.F., Kaoru O., Zimmerman S.K. et Davis J.H. (1988), « Group Consensus Processes on Cognitive Bias Tasks : A Social Decision Scheme Approach », Japanese Journal of Psychology, vol. 30, pp. 68-77. Statman M. (1995), « Behavioral Finance versus Standard Finance », in Behavioral Finance and Decision Theory in Investment Management, Wood A. (ed.), Charlottesville, NJ : Association for Investment Management and Research. Staw B.M. (1997), « The Escalation of Commitment : An Update and Reappraisal », in Organizational Decision Making, Shapira Z. (ed.), Cambridge : Cambridge University Press. Stein M. (2003), « Unbounded Irrationality : Risk and Organizational Narcissism at Long Term Capital Management », Human Relations, vol. 56(5), pp. 523-540. Stewart R. (1967), Managers and Their Job, New York : McMillan. Stewart R. (1982), Choices for the Manager, New York : McGraw-Hill. Stewart R. (1987), « Middle Managers : Their Jobs and Behavior », in Handbook of Organizational Behavior, Lorsch J.W. (ed.), Englewood Cliffs, NJ : Prenctice Hall. Stoner J.A.F. (1968), « Risky and Cautious Shifts in Group Decisions : The Influence of Widely Held Values », Journal of Experimental Social Psychology, vol. 4, pp. 442-459. Taylor D.W., Berry P.C. et Block C.H. (1958), « Does Group Participation When Using Brainstorming Facilitate or Inhibit Creative Thinking ? », Administrative Science Quarterly, vol. 2, pp. 23-47. Taylor F. (1911), The Principles of Scientific Management, New York : Harper and Row. Tetlock P.E. (1983), « Accountability and the Perseverance of First Impressions », Social Psychology Quarterly, vol. 46, pp. 285-292. Tetlock P.E. (1992), « The Impact of Accountability on Judgment and Choice : Toward a Social Contingency Model », Advances in Experimental Social Psychology, vol. 25, pp. 331-376. Tetlock P.E. et Boettger, R. (1994), « Accountability Amplifies the Status Quo Effect : When Change Creates Victims », Journal of Behavioral Decision Making, vol. 7, pp. 1-23. Thaler R.H. (1981), « Some Empirical Evidence on Dynamic Inconsistency », Economics Letters, vol. 8, pp. 201-207. Thaler R.H. (1988), « Anomalies : The Ultimatum Game », Journal of Economic Perspectives, vol. 2(4), pp. 195-206.
Bibliographie
273
Thiétart R.A. et Forgues B. (1995), « Chaos Theory and Organization », Organization Science, vol. 6(1), pp. 19-31. Thiétart R.A. et Forgues B. (1997), « Action, Structure and Chaos », Organization Studies, vol. 18(1), pp. 119-143. Thoenig J.C. (1973), L’ère des technocrates, Paris : Les Editions d’Organisation. Tilman R.O. (1968), « Emergency of Black Market Bureaucracy : Administrative Corruption in the New States », Public Administration Review, vol. 28, pp. 437-443. Tirole J. (1996), « A Theory of Collective Reputation (with applications to the persistence of corruption and to firm quality) », Revue of Economic Studies, vol. 63(1), pp. 1-22. Tolbert P.S. et Zucker L. (1983), « Institutional Sources of Change in the Formal Structure of Organizations : the Diffusion of Civil Service Reform, 1880-1935 », Administrative Science Quarterly, vol. 28, pp. 22-39. Triandis H.C. (1991), « Cross-Cultural Differences in Assertiveness/Competition vs. Group Loyalty/Cooperation », in Cooperation and Prosocial Behaviour, Hinde R.A. et Groebel J. (eds), Cambridge : Cambridge University Press, pp. 78-88. Tullock G. (1967), « The General Irrelevance of the General Impossibility Theorem », Quarterly Journal of Economics, vol. 81(2), pp. 256-270. Tversky A. (1972), « Elimination by Aspects : A Theory of Choice », Psychological Review, vol. 79, pp. 281-299. Tversky A. et Kahneman D. (1974), « Judgment under Uncertainty : Heuristics and Biases », Science, vol. 185, pp. 1124-1131. Ulman-Margalit E. (1978), The Emergence of Norms, Oxford : Oxford University Press. van Avermaet E. (1996), « Social Influence in Small Groups », in Introduction to Social Psychology, Hewstone M., Stroebe W. et Stephenson G.M. (eds), Oxford : Blackwell (2e édition). Varian H.R., « Equity, Envy, and Efficiency », Journal of Economic Theory, vol. 9, pp. 63-91. Vidaillet B. (2001), « Cognitive Processes and Decision-Making in a Crisis », in Organizational Cognition : Computation and Interpretation, Lant T. et Shapira Z. (eds), New York : Lawrence Erlbaum, pp. 241-264. Vidaillet B. (2003), « Lorsque les dirigeants formulent leurs préoccupations : une occasion particulière de construire du sens », in Le sens de l’action. Karl Weick : sociopsychologie de l’organisation, Vidaillet B. (ed.), Paris : Vuibert, pp 115-137. von Neumann J. (1953), « Communication on the Borel Notes », Econometrica, vol. 21, pp. 124-125. von Neumann J. et Morgenstern O. (1944), Theory of Game and Economic Behavior, Princeton, NJ : Princeton University Press. von Winterfeldt D. et Edwards W. (1986), Decision Analysis and Behavioral Research, Cambridge : Cambridge University Press. Walliser B. (1989), « Théorie des jeux et genèse des institutions », Recherches économiques de Louvain, vol. 55(4), pp. 339-364. Wason P.C. (1960), « On the Failure to Eliminate Hypotheses in a Conceptual Task », Quarterly Journal of Experimental Psychology, vol. 12, pp. 129-140. Wason P.C. (1968), « Reasoning about a Rule », Quarterly Journal of Experimental Psychology, vol. 20, pp. 273-281. Weber M. (1947), The Theory of Social and Economic Organization, Glencoe, IL : Free Press. Weick K.E. (1976), « Educational Organizations as Loosely Coupled Systems », Administrative Science Quarterly, vol. 21, pp. 1-18. Weick K.E. (1977), « Enacted processes in organizations », in New Directions in Organizational Behavior, B.M. Staw et G. Salancik (eds), Chicago, Il : St Clair., pp. 267-300.
274
La décision
Weick K.E. (1993), « The Collapse of Sensemaking in Organizations : The Mann Gulch Disaster », Administrative Science Quarterly, vol. 38, 628-652. Weick K.E. (1995), Sensemaking in Organizations, London : Sage Publications. Weick K.E. (2003), « Préface », in Le sens de l’action. Karl Weick : sociopsychologie de l’organisation, Vidaillet B. (ed.), Paris : Vuibert, pp. 1-3. Weiner B. (1995), « “Spontaneous” Causal Thinking », Psychological Bulletin, vol. 109, pp. 7484. Wicksell, K. (1896). « A New Principle of Just Taxation », in Classics in the Theory of Public Finance, Musgrave R.A. et Peacock A.T. (eds.), London : Macmillan, pp. 72-118, (édition de 1958). Williamson O. et Craswell R. (1993), « Calculativeness, Trust and Economic Organization », Journal of Law and Economics, vol. 36(1), pp. 453-502. Zhou X. (1993), « The Dynamics of Organizational Rules », American Journal of Sociology, vol. 98, pp. 1143-1166. Zhou X. (1997), « Organizational Decision Making as Rule Following », in Organizational Decision Making, Shapira Z. (ed), Cambridge : Cambridge University Press, pp. 257-283.
Lexique
Agenda décisionnel Ensemble des préoccupations d’un décideur (individuel ou collectif) qui sont susceptibles de faire l’objet d’une décision.
Aléa moral Issu du vocabulaire des assurances, l’aléa moral (ou hasard moral) fait référence à une incertitude factuelle liée, par exemple, à un comportement déviant d’un agent par rapport à ce que l’on attendait de lui. Prenons un contrat d’assurance automobile. Imaginons qu’au moment de la signature du contrat, l’assuré se signale comme « bon conducteur » (par un bonus élevé). L’assureur attend de lui qu’il continue à bien conduire. Mais rien ne garantit que ce sera le cas (c’est l’aléa moral) : le « bon conducteur » peut avoir plusieurs accidents responsables successifs.
Alternative Dans le cadre d’une décision à prendre, il s’agit d’une des options de choix.
Anarchie organisée Ce type d’organisation a 3 caractéristiques. 1) L’anarchie organisée fonctionne à partir d’une grande diversité de préférences, qui manquent de précision, sont souvent peu cohérentes entre elles et dont les acteurs eux-mêmes peuvent prendre conscience au cours de l’action ou a posteriori. 2) La participation des acteurs aux processus est fluctuante : les participants s’engagent de manière variable dans les nombreux processus de l’organisation, en fonction de leur temps, de leur disponibilité, de la quantité d’attention dont ils disposent. Ainsi se développe une imprévisibilité essentielle dans les projets en cours. 3) Les procédures et processus organisationnels sont mal compris par les acteurs, ce qui les empêche de dégager une vision claire et cohérente du fonctionnement de leur propre organisation. Ces caractéristiques « d’anarchie organisée » sont flagrantes dans certaines organisations telles que les universités ou les organismes publics, ainsi que dans des structures peu hiérarchisées, décentralisées.
Anti-sélection Issu du vocabulaire des assurances, l’anti-sélection (ou encore sélection adverse ou contra-sélection) fait référence à une incertitude structurelle liée, par exemple, à la mauvaise
276
La décision
spécification d’un risque (par manque d’information). Prenons un contrat d’assurance automobile. Imaginons qu’au moment de la signature du contrat, l’assuré se signale comme « bon conducteur » (par un bonus élevé) même s’il s’agit en réalité d’un « mauvais conducteur ». Le signalement peut en effet être fallacieux (c’est le risque d’anti-sélection), soit parce que l’assuré ment, soit parce que, par chance, il n’a pas eu d’accident responsable depuis plusieurs années.
Arbitrage intertemporel L’arbitrage intertemporel est une application de la théorie économique du consommateur, dans le cas d’un choix entre deux biens, l’un consommable tout de suite et l’autre consommable dans le futur. On suppose que le consommateur répartit son budget actuel entre consommation (immédiate) et épargne. Lorsque l’épargne a un coût (de non consommation) ou rapporte un intérêt, la valeur de la consommation future est actualisée. La maximisation de l’utilité du consommateur selon les principes de la théorie microéconomique revient alors à réaliser un arbitrage entre consommation et épargne qui dépend du taux d’actualisation retenu.
Arbitrage travail-loisir La théorie économique standard définit le loisir par rapport au travail : toute heure de loisir est une heure de « non-travail ». L’individu doit donc arbitrer entre consacrer du temps au travail –et voir son revenu augmenter– ou choisir de ne pas travailler, ce qui accroît sa satisfaction (donc son utilité) mais réduit son revenu potentiel. L’application du critère de maximisation d’utilité permet au consommateur de faire la part des choses et de trouver le « meilleur » compromis entre travail et loisir.
Attributs Il s’agit des dimensions sur lesquelles sont décrites les options de choix.
Backward induction Il s’agit d’une méthode de résolution des jeux séquentiels à horizon fini. Elle consiste à partir de la fin de l’arbre représentant le jeu (forme extensive du jeu), et à remonter vers la racine en éliminant successivement les branches qui ne seront jamais jouées. L’équilibre atteint par cette méthode est appelé « équilibre de Nash parfait » du jeu. Voir Équilibre de Nash, Jeu dynamique et Forme extensive du jeu.
Biais cognitifs Erreurs systématiques caractérisant le raisonnement et le jugement humains, se rapportant surtout à l’évaluation et à l’interprétation d’informations quantitatives.
Bien collectif ou bien public Un bien public, ou bien collectif, est doublement caractérisé. D’une part il n’est pas « rival », c’est-à-dire que sa consommation par un individu n’empêche pas la consommation par d’autres personnes. D’autre part, il n’est pas exclusif, c’est-à-dire que son détenteur ne peut en contrôler l’accès. La Défense Nationale, la recherche fondamentale, la protection de l’environnement par exemple respectent ces deux caractéristiques. Dans certains cas, les propriétés énoncées ne sont pas parfaitement respectées, on parle alors de « biens collectifs mixtes ». C’est le cas, par exemple, des infrastructures routières qui peuvent être sujettes à des congestions (le bien devient alors rival). À l’inverse, certains biens ou services ne disposant pas des caractéristiques des biens publics peuvent être promus au rang de biens collectifs par volonté collective. On parle alors de « biens méritoires » car il s’agit là de biens qui ont des mérites pour la collectivité et doivent, à ce titre être à la
Lexique
277
disposition de tous. C’est le cas d’une partie importante des droits fondamentaux et des services publics qui en découlent (éducation, santé, police, etc.).
Ça Défini par Freud en 1923, le Ça est, selon lui, le réservoir des pulsions et le siège de la plus grande part des processus inconscients. Le Ça est une des trois composantes du psychisme avec le Moi et le Surmoi. Voir Moi et Surmoi.
Calcul bayésien Basé sur la célèbre « formule de Bayes », le calcul bayésien développe l’idée qu’une information supplémentaire améliore toujours la connaissance d’un phénomène ou, au pire, la laisse intacte lorsque l’information supplémentaire est indépendante du phénomène observé. L’accumulation d’information est alors fondamentale dans le processus de décision car elle permet sinon d’atteindre, du moins de s’approcher de la certitude quant aux conséquences de ses décisions. L’économie et la théorie des jeux ont adopté une telle approche bayésienne de l’information.
Common Knowledge L’hypothèse de connaissance commune (CK), sur laquelle repose une grande partie de la théorie des jeux, constitue le cas extrême de perfection d’une information. Sous cette hypothèse, il ne suffit pas qu’une information soit publique pour que tout le monde puisse la connaître et l’utiliser dans ses calculs décisionnels ; il faut aussi que tout le monde sache que l’information est publique, que tout le monde sache que tout le monde sait que l’information est publique, etc. jusqu’à l’infini. Voir Information parfaite.
Conformité publique/conformité privée ou conversion Il y a conformité publique quand la personne acquiesce publiquement aux valeurs dominantes du groupe dans lequel elle se trouve, tout en étant susceptible de les rejeter quand elle est dans la sphère privée. La conformité privée ou conversion est un mécanisme de conformité plus profond, qui implique que la personne change ses croyances, ses attitudes ou son comportement en prenant à son compte le système de valeurs qui lui est proposé.
Convention Pour l’économie des conventions, la convention est un mode de coordination des agents. Elle repose sur un cadre de référence commun, de nature arbitraire, d’origine inconnue, de formulation vague ou éventuellement précise mais sans version officielle. En théorie des jeux, la convention intervient lorsqu’il y a plusieurs équilibres identiques dans un jeu. Dans ce cas la coordination par le calcul seul est impossible, la coordination sur l’un des équilibres n’est possible qu’en mobilisant un cadre de référence commun : la convention. Voir Équilibre d’un jeu.
Coopération Comportement qui a pour effet de coordonner les comportements de plusieurs individus de telle sorte qu’ils soient en phase les uns avec les autres sans produire de situations conflictuelles.
Covariance Mesure mathématique de la variation conjointe de deux (ou plusieurs) variables (par exemple : température extérieure en degré Celsius et épaisseur de la glace sur une mare).
278
La décision
Diagnosticité Pertinence d’un élément d’information en tant que preuve potentielle de l’existence d’un phénomène ou d’un événement.
Dilemme de ressources limitées Dans un dilemme de ressources limitées, les sujets puisent des ressources dans un pot commun dont la capacité est connue et fixée à l’avance, sachant qu’après chaque tour, le pot commun est réapprovisionné à un rythme prédéterminé.
Dilemme du prisonnier Le dilemme du prisonnier est un jeu emblématique inventé en 1950 par M. Flood et M. Dresher et formalisé par A.W. Tucker. Dans ce jeu, deux individus sont fortement soupçonnés d’avoir cambriolé une banque. Pour les inciter à se dénoncer, la police interroge chaque prisonnier séparément et lui propose de dénoncer son complice contre une remise de peine. La rationalité individuelle mène chacun à la dénonciation et, les deux complices étant dénoncés, à la plus mauvaise situation individuelle et collective. Les applications développées à partir de ce jeu sont très nombreuses, en particulier en psychologie, en sociologie et en économie.
Dominance Dans un ensemble d’options, si l’option A est préférable à l’option B sur chacune de leurs caractéristiques comparées une à une, alors on dit que l’option A domine l’option B. L’option B peut donc être éliminée de l’ensemble car elle ne pourra jamais être préférée à l’option A, du fait de cette dominance.
Effet de cadrage Ce terme renvoie au phénomène observé quand on présente un même résultat sous des formes différentes à un décideur, et que celui-ci, sous l’effet de cette seule différence, opère des choix systématiquement influencés par la présentation. On s’aperçoit que le décideur évalue le résultat non pas dans l’absolu, mais par rapport à un point de référence qui peut être suggéré par le contexte ou la formulation de la décision, par autrui ou par sa propre situation. Un même résultat (obtenir 10 euros) sera par exemple évalué comme un gain (obtenir 10 euros alors qu’on n’attendait rien), ou comme une perte (obtenir 10 euros alors qu’on s’attendait à en obtenir 20).
Électeur médian L’électeur médian est l’individu qui découpe la population des électeurs en deux groupes de même taille. Black a montré que les choix de cet électeur médian coïncidaient avec le choix collectif lorsque les préférences des électeurs sont unimodales.
Équilibre d’un jeu La solution ou l’équilibre d’un jeu est l’issue effective du jeu lorsque chaque joueur joue sa meilleure stratégie. On parle par exemple d’équilibre de prudence lorsque les joueurs jouent leur stratégie la plus prudente. Le terme « équilibre du jeu », sans autre précision, fait le plus souvent référence à l’équilibre de Nash. Voir Équilibre de Nash.
Équilibre de Lindhal L’équilibre de Lindhal est le niveau optimal de taxation publique obtenu en proposant exactement à chaque individu le montant de la taxe qu’il est prêt à payer en échange d’un service public.
Lexique
279
Équilibre de Nash En théorie des jeux non-coopératifs, l’équilibre de Nash est la solution obtenue lorsque chaque joueur joue la stratégie qui donne la meilleure réponse individuelle (en termes de gains) au comportement de l’autre. Par exemple, dans le jeu du rendez-vous, où deux individus peuvent se rencontrer en deux endroits différents mais ne peuvent se coordonner au préalable, la meilleure réponse de chacun au comportement de l’autre consiste à se rendre au même lieu de rendez-vous que l’autre (il y a alors 2 équilibres de Nash). Voir Jeux noncoopératifs.
Équilibre en stratégies mixtes Un équilibre est dit en stratégies mixtes lorsque pour atteindre cet équilibre, chaque joueur mélange des stratégies du jeu. Par exemple la stratégie « A avec une probabilité de 1/4 et B avec une probabilité de 3/4 » (ou « on joue À une fois sur quatre et B trois fois sur quatre en moyenne ») est une stratégie mixte. Voir Forme extensive du jeu, Forme normale du jeu et Stratégie.
Équilibre en stratégies pures Un équilibre est dit en stratégies pures lorsque, pour atteindre cet équilibre, chaque joueur a joué une seule de ses stratégies sans chercher à les « mélanger ». On joue, par exemple, la stratégie A ou B mais pas « A une fois sur 2 ». Voir Stratégie.
Espérance d’utilité Lorsque la décision se prend dans l’incertain, l’espérance d’utilité est le critère de choix privilégié par la théorie économique (on parle aussi de critère de Von Neumann et Morgenstern, du nom de ses promoteurs). Pour faire son choix le décideur maximise l’espérance d’utilité EU = p1U(R1) + p2U(R2) où R1 et R2 sont les gains associés aux situations 1 et 2, U(R1) et U(R2) les utilités associées à ces gains et p1 et p2 les probabilités de réalisation des situations 1 et 2. En maximisant l’utilité associée aux gains plutôt que les gains, cette fonction a l’avantage de prendre en compte le niveau d’aversion au risque du décideur : l’utilité d’un gain risqué étant, selon les individus, plus petite (décideur « risquophobe ») ou plus grande (décideur « risquophile ») que celle d’un gain sans risque.
Externalités Il y a externalité économique lorsque l’action d’un agent a un effet direct sur l’utilité d’un autre agent, sans que cet effet fasse l’objet d’une transaction sur un marché. L’externalité peut être négative (l’utilité d’un agent est réduite par l’action d’un tiers), comme dans le cas de la pollution atmosphérique par la production industrielle, ou positive (l’utilité d’un agent est accrue par l’action d’un tiers), comme dans le cas du développement économique autour d’un nouveau pôle de production.
Folk theorem Ainsi nommé parce que son existence fut pressentie simultanément par de nombreux théoriciens des jeux, le folk theorem stipule que toute issue d’un jeu à horizon infini qui donne à chaque joueur un gain strictement supérieur à son utilité minimale garantie peut être obtenue comme équilibre de Nash du jeu dynamique si les joueurs valorisent davantage le futur. En d’autres termes, le folk theorem affirme que si les joueurs accordent un poids suffisant au futur, il est possible, dans un jeu dynamique à horizon infini, de trouver des équilibres qui ne reposent que sur un équilibre de menaces crédibles entre les joueurs. Voir Équilibre de Nash et Jeu dynamique.
280
La décision
Fonction d’utilité Elle se construit en attribuant à chaque unité de produit une valeur en terme d’utilité. Voir Utilité.
Forme extensive d’un jeu La forme extensive d’un jeu est une représentation sous forme d’arbre de décision d’un jeu. Pour un joueur donné, à un « instant » du jeu, l’arbre représente chacune de ses actions possibles par des flèches. À l’extrémité de l’arbre se trouvent les gains des joueurs associés aux actions mises en œuvre pour arriver à ces extrémités.
Forme normale d’un jeu La forme normale d’un jeu est une représentation sous forme matricielle des gains des joueurs. La matrice croise toutes les stratégies de tous les joueurs, elle fait ainsi apparaître toutes les issues possibles du jeu et les gains associés en fonction des stratégies choisies par les joueurs.
Heuristique Procédure simplificatrice utilisée par les individus afin de rendre les décisions et les choix plus gérables, compte tenu de l’ensemble des contraintes à prendre en compte.
Hypothèse d’Harsanyi En théorie des jeux, l’incomplétude de l’information génère de l’incertitude. Pour traiter ce problème, Harsanyi a proposé d’ajouter un joueur particulier, la Nature, qui a la particularité de jouer en premier et dont l’action consiste à attribuer un « type » à chaque joueur du jeu. Cette hypothèse permet à chacun d’analyser la Nature comme tout autre joueur et, ce faisant, de traiter l’incomplétude de l’information comme une imperfection.
Hypothèse de Hayek L’hypothèse de Hayek est la réponse qu’a apporté l’économiste autrichien F. Von Hayek à la question de la rationalité globale du marché. L’hypothèse émise par Hayek est que la présence sur le marché d’acteurs ayant des connaissances limitées (de leur environnement et des autres acteurs) n’empêche pas le marché de fonctionner efficacement (et donc d’être « rationnel »).
Incertitude Traditionnellement le risque se distingue de l’incertitude par la possibilité qu’il offre d’associer une distribution de probabilités aux états de la nature, contrairement à l’incertitude. Le langage économique assimile toutefois souvent risque et incertitude, car il est toujours possible de trouver une distribution de probabilité subjective à associer aux différents états de la nature, même dans le cas de l’incertitude.
Incertitude endogène L’incertitude est endogène lorsqu’elle est générée par la situation de décision. Ainsi, lorsque dans le cadre d’une relation bilatérale, un décideur ne sait pas ce que va faire l’autre (va-t-il avoir un comportement rationnel ?), sa décision est soumise à une incertitude de ce type, générée par l’imperfection de l’information dont il dispose.
Incertitude exogène L’incertitude est exogène lorsqu’elle est indépendante de la décision. C’est un état possible de la nature à laquelle on peut associer une distribution de probabilité. Dans le cadre d’une relation bilatérale, le décideur ne sait pas toujours à qui il a affaire (un interlocu-
Lexique
281
teur honnête, un truand…). Pour décider, il devra donc envisager les différentes alternatives possibles en associant une probabilité d’occurrence à chacune des ces alternatives. Sa décision est donc soumise à l’incomplétude de l’information dont il dispose.
Inconscient Terme défini par Freud pour désigner initialement un des systèmes de l’appareil psychique, constitué des contenus qui se sont vu refuser l’accès au système préconscient-conscient sous l’effet du refoulement. Ultérieurement, Freud redéfinira l’appareil psychique autour de trois composantes (le Ça, le Moi et le Surmoi) et l’inconscient ne sera plus alors associé à un seul système du psychisme. Voir Ça, Moi et Surmoi.
Incrémentalisme Conception de la décision (parfois appelée aussi « Politique des petits pas ») qui considère que les décisions collectives ressemblent à une série de « petits pas », qui s’enchaînent les uns dans les autres. Ces « petits pas » successifs permettent d’avancer progressivement sans modifier réellement le cours de l’action. Les solutions envisagées sont toujours celles qui perturbent le moins les choix faits antérieurement. Ainsi, chaque nouvelle décision se trouve fortement conditionnée par les décisions précédentes et en assure la continuité. Voir Politique des petits pas.
Inefficience-X Le concept d’inefficience-X développé par Liebenstein caractérise les situations dans lesquelles la production n’est pas efficiente car les coûts moyens de production sont systématiquement supérieurs au coût moyen minimal possible. Une telle situation peut apparaître dans le cadre d’une relation d’agence où l’agent, plus intéressé par son propre revenu ou son propre pouvoir, dédaigne l’objectif qui lui a été fixé, générant ainsi des surcoûts à la base de l’inefficience-X. Voir Théorie de l’agence.
Inférence L’inférence est l’opération intellectuelle qui consiste à construire, à partir d’un fait ou d’observations, une règle permettant d’expliquer les faits constatés.
Influence normative/influence informationnelle L’influence normative et l’influence informationnelle sont les deux processus majeurs expliquant la conformité dans les groupes. On parle d’influence informationnelle lorsque la conformité résulte de l’acceptation d’une information provenant d’autrui. Cette information est considérée comme une preuve de vérité. L’influence normative consiste à adhérer au jugement d’autrui, à se conformer, pour être accepté socialement.
Information complète En théorie des jeux, une information est complète lorsque le jeu n’est entaché d’aucune incertitude structurelle. Dans de nombreux jeux statiques, par exemple, les joueurs connaissent les « règles du jeu » et savent qu’elles seront respectées par les autres. Puisque personne ne triche et que cette information est connue de tous, il n’y a aucune incertitude structurelle sur le jeu, l’information est complète. Voir Jeu statique.
Information parfaite En théorie des jeux, une information est parfaite lorsque les joueurs n’ont aucune incertitude factuelle sur le comportement des autres. Dans une procédure d’enchères publiques, par exemple, le joueur qui joue en dernier connaît toutes les offres précédentes car ces
282
La décision
offres étaient publiques. Ni ce dernier joueur ni les autres n’ont de doute sur l’histoire du jeu. Dans ce cas, le dernier joueur dispose donc d’une information parfaite.
Interaction stratégique On parle d’interaction stratégique lorsque les décisions des agents ont un effet sur les gains des autres agents (interaction). Dans ces conditions, chaque agent, pour décider, doit définir des stratégies d’actions qui dépendent à la fois de ses propres choix et de ceux des autres agents. Ces situations sont typiquement celles qui sont étudiées en théorie des jeux.
Invariance Si l’option A est préférée à l’option B, il y a invariance si cette préférence persiste indépendamment 1) de la façon dont sont présentées les options et 2) de la façon dont on demande d’exprimer les préférences (classement, notation, évaluation monétaire …).
Jeu dynamique En théorie des jeux, les jeux dynamiques ou séquentiels sont des jeux dans lesquels l’ordre des coups a une importance : les joueurs peuvent par exemple jouer les uns après les autres. De tels jeux peuvent être à horizon fini (le nombre de coups est fini) ou non. Le jeu d’échecs, par exemple, est un jeu dynamique à horizon fini.
Jeu répété Un jeu répété ou « super jeu » correspond à la répétition d’un jeu de base un nombre n de fois. Le jeu de base peut être statique ou dynamique. La répétition du jeu mène les joueurs à définir des stratégies (du super jeu) différentes de celles du jeu de base. Dans le Dilemme du prisonnier, par exemple, la meilleure stratégie du jeu statique consiste à dénoncer. Ce n’est plus aussi systématique lorsque le jeu est répété : ne pas dénoncer peut être une stratégie optimale du jeu. Voir Dilemme du prisonnier, Jeu dynamique et Jeu statique.
Jeu séquentiel Voir Jeu dynamique.
Jeu statique Un jeu est statique lorsque l’ordre des coups n’a pas d’importance. Il en est ainsi des jeux simultanés dans lesquels les joueurs jouent en même temps.
Jeux coopératifs Les jeux coopératifs sont des situations de jeux dans lesquelles des joueurs peuvent se coaliser pour atteindre un objectif. Le problème de la théorie des jeux dans ce cas est alors celui de la recherche de la meilleure coalition, c’est-à-dire celle qui permet à chaque agent coalisé d’obtenir des gains supérieurs à ceux qu’il aurait sans coalition ou avec une coalition différente.
Jeux non-coopératifs Les jeux non-coopératifs sont des situations de jeux dans lesquelles les joueurs n’ont aucun contact, donc aucun moyen de se coaliser, avant le jeu. Le problème de la théorie des jeux dans ce cas est alors celui de la recherche de la meilleure stratégie de chacun face au comportement incertain des autres joueurs.
Lexique
283
Jugement calibré Un jugement est dit calibré quand les estimations qu’il a produites correspond aux probabilités effectives de réalisation des événements dont il s’agit (par exemple : annonce d’un orage avec une probabilité de 80 % et justesse de cette prédiction dans 80 % des cas).
Logrolling Le logrolling repose sur l’idée de Buchanan et Tullock, selon laquelle la décision collective est une marchandise qui peut faire l’objet d’un marchandage politique. À l’instar de ce qui se passe sur le marché de tout autre bien, les décisions politiques font l’objet de négociations qui permettent aux décideurs de faire aboutir leurs propositions, même s’ils sont minoritaires. Un décideur peut ainsi appuyer une décision qu’il n’approuve pas afin que les autres décideurs lui rendent la pareille pour un projet qu’il soutiendra.
Méthode compensatoire Méthode de choix fondée sur la comparaison des évaluations globales de chaque option ; l’évaluation des caractéristiques de chaque option étant intégrée dans l’évaluation globale de l’option, les points faibles en sont compensés par les points forts.
Méthode non compensatoire Méthode de choix entre des options qui ne permet pas que les points faibles d’une option soient compensés par ses points forts, dans la comparaison entre les options.
Modèle de la poubelle Modèle qui décrit la manière dont sont prises les décisions dans les « anarchies organisées ». Ce modèle tient son nom de l’analogie suivante : les problèmes, solutions, participants et occasions de choix sont jetés dans la « poubelle » organisationnelle de manière relativement aléatoire. La décision est envisagée comme le résultat imprévisible du croisement de ces différents flux de problèmes, de solutions, d’occasions de choix et de participants, présents à un même moment dans la « poubelle ». Les principales composantes des décisions - les problèmes, les solutions, les participants et les occasions de choix sont « découplées » et s’associent pour des raisons de simultanéité accidentelle plutôt que de pertinence mutuelle. Voir Anarchie organisée.
Modèle principal-agent ou Théorie de l’agence Cette théorie économique formalise les comportements et les stratégies des agents économiques dans une situation de délégation de pouvoir ou de décision. En effet, lorsque l’un des protagonistes, le « principal », délègue un pouvoir décisionnel à un « agent », ce dernier peut accomplir des actions non contrôlées, voire contraires aux intérêts du principal. Pour éviter toute déviance de ce type, il faut identifier et évaluer les risques afin de contrecarrer les déviances.
Moi Défini par Freud en 1923, le Moi sert, selon lui, d’intermédiaire entre le Ça, le Surmoi et la réalité extérieure. Le Moi est une des trois composantes du psychisme avec le Ça et le Surmoi. Voir Ça et Surmoi.
Névrose Trouble psychique dans lequel les symptômes sont considérés comme l’expression d’un conflit intrapsychique entre des scénarios fantasmatiques inconscients du sujet, associés au complexe d’Œdipe, et les défenses qu’ils suscitent.
284
La décision
Normativité La normativité se réfère à des modèles décrivant le comportement idéal que devrait adopter tout individu dans un souci d’optimalité, comportement qui s’érige en référence pour évaluer la qualité de tout comportement qui en diffère.
Norme sociale Il s’agit d’une référence implicite commune à un ensemble d’individus appartenant à un même groupe social (ou à une même culture). Chacun régit son comportement, d’une manière ou d’une autre, en fonction de cette référence, partagée et connue de tous.
Opportunisme Dans le langage économique, l’opportunisme caractérise les individus qui privilégient leur intérêt propre aux dépens de celui d’autrui.
Optimalité Formellement, l’optimalité s’entend comme la meilleure situation possible au regard d’un critère d’optimisation. En théorie économique de la décision individuelle, où les conséquences des actes sont mesurables en termes de gains (ou d’utilité), l’optimalité est la situation qui amène au gain (respectivement à l’utilité) le plus élevé. L’approche utilitariste consacre ce type d’optimalité en considérant que seules les fins (les résultats) comptent, peu importent les moyens mis en œuvre pour atteindre ces fins. Dans le cadre de la décision collective (y compris le marché), la notion d’optimalité est plus complexe puisqu’il faut distinguer les gains collectifs des gains individuels. Certaines situations peuvent être optimales individuellement mais pas collectivement (comme les pollutions, par exemple). De nombreux critères d’optimalité dans le cadre du choix collectif ont été élaborés, mais le critère de Pareto a été privilégié par l’économie car il est compatible avec l’approche utilitariste de la décision individuelle. Ce critère considère qu’une situation est optimale si l’on ne peut plus accroître le gain d’un agent sans réduire celui d’au moins un autre agent.
Paradoxe de Condorcet Le Marquis de Condorcet a montré que la règle de vote à la majorité pouvait dans certains cas aboutir à une impasse dès que le vote porte sur plus de deux options. La procédure de vote à la majorité tente en effet d’agréger des préférences individuelles qui ont pour caractéristique d’être transitives (si A est préféré à B et B est préféré à C, alors A est préféré à C). Or, comme le montrent les cas Condorcet, cette propriété est perdue lors de l’agrégation des préférences.
Paradoxe du choix collectif Développé par Olson, ce paradoxe souligne le fait que face à une dépense publique, chacun individuellement a intérêt à se comporter en passager clandestin. En d’autres termes, personne n’a intérêt à dévoiler, ni a priori ni a posteriori, ses véritables préférences individuelles. Dans ces conditions, la décision collective est sous-optimale, soit parce qu’elle est inadaptée à la demande, soit parce qu’elle surtaxe les individus qui dévoilent effectivement leurs préférences.
Passager clandestin (free-rider) Le terme de « passager clandestin » caractérise les situations dans lesquelles un agent consomme un bien sans en acquitter le coût. Ce type de comportement est largement observé lors de la consommation de biens ou de services collectifs car il est impossible,
Lexique
285
compte tenu des caractéristiques de ces biens (non rivaux et non exclusifs), d’exclure un consommateur, même s’il s’agit d’un passager clandestin.
Pensée groupale ou Groupthink Le phénomène de pensée groupale, dit également groupthink, a été mis en évidence par le psychologue Irving Janis. Il correspond à un processus de décision en groupe, caractérisé par une trop rapide convergence entre les membres du groupe, ce qui peut les conduire à prendre de mauvaises décisions.
Polarisation du groupe La polarisation du groupe désigne le fait qu’un groupe adopte une position ou une attitude extrême sur un sujet, plus extrême que la moyenne des positions individuelles initiales de chaque membre du groupe.
Politique des petits pas Voir Incrémentalisme.
Préférences Pour faire leurs choix de consommation, les consommateurs fondent leur raisonnement sur leurs préférences personnelles. La théorie de la décision individuelle a modélisé ces préférences en supposant que les individus étaient capables, au minimum, d’exprimer leurs préférences par une relation de préférence respectant les caractéristiques d’un préordre complet. Cette relation doit donc être réflexive (un bien est indifférent à lui-même) et transitive (si un bien A est préféré à un bien B et B est préféré à C, alors A est préféré à C) ; le préordre doit être complet : tous les biens doivent pouvoir être comparés entre eux.
Préférences unimodales Les préférences sont unimodales lorsque, dans l’ensemble ordonné des préférences d’un agent, il n’existe qu’un seul point tel qu’avant ce point, les préférences sont strictement croissantes et, après ce point, les préférences sont strictement décroissantes. Au sens statistique, ce point est alors le mode de la fonction de préférence.
Processus primaire, processus secondaire Ces deux types de processus ont été définis par Freud pour désigner les deux modes de fonctionnement de l’appareil psychique. Le premier est associé au pôle pulsionnel du psychisme et à l’inconscient, et se caractérise par un glissement incessant du sens, à travers notamment les mécanismes de condensation et de déplacement. Le second, développé ultérieurement, associé principalement à la sphère consciente du psychisme, permet l’exercice de la pensée logique, du raisonnement et de la décision rationnelle. Voir Inconscient.
Psychologie cognitive Branche de la psychologie qui s’intéresse à la façon dont l’individu perçoit, stocke, traite et utilise l’information ; la psychologie cognitive rend compte en particulier des processus impliqués dans le fonctionnement de l’attention, de la mémoire, du raisonnement.
Psychologie expérimentale Terminologie qui renvoie à plusieurs branches de la psychologie (cognitive, sociale …), en se référant aux méthodes utilisées pour étudier les phénomènes psychologiques auxquels elles s’intéressent. La psychologie expérimentale s’appuie sur les résultats d’expériences réalisées de façon rigoureuse pour tester des hypothèses théoriques. Elle pose des varia-
286
La décision
bles opérationnelles, qui sont manipulées systématiquement, de façon à ce que les résultats obtenus puissent être analysés à l’aide d’outils statistiques, qui indiquent leur fiabilité et leur capacité à réfuter les hypothèses testées.
Psychologie sociale Branche de la psychologie qui s’attache à décrire et à expliquer le comportement des individus lorsqu’ils interagissent avec d’autres individus, notamment au sein de groupes, modifiant leur comportement individuel en conséquence.
Rationalité limitée Développée par Herbert Simon, la rationalité limitée (bounded rationality) s’oppose à la rationalité maximisatrice qui présume que les individus disposent et mobilisent des capacités de calcul infinies. Or les décideurs ne disposent ni de l’information complète ni des capacités infinies que leur attribue l’orthodoxie économique. Même à supposer qu’ils en disposent, ils ne mobiliseraient pas nécessairement ces capacités infinies de calcul car cela serait coûteux (au moins en temps ou en effort) donc contradictoire avec l’objectif de maximisation des gains. La rationalité limitée suppose que les décideurs se contentent de décisions satisfaisantes ; ils n’optent pas pour la « meilleure » solution mais pour la « moins mauvaise » des solutions, compte tenu des informations et des capacités dont ils disposent. Voir Rationalité maximisatrice.
Rationalité maximisatrice L’économie a modélisé le comportement du décideur en se basant sur des hypothèses fortes résumées sous le terme de rationalité maximisatrice. D’une part l’individu est rationnel, c’est-à-dire qu’il effectue un raisonnement logique avant de prendre une décision ; il ne prend jamais de décision au hasard. D’autre part, le décideur est mû par l’appât du gain. Cette dernière hypothèse conduit le décideur à privilégier le résultat : il cherchera en permanence l’option lui assurant le gain le plus élevé, indépendamment des moyens mis en œuvre pour l’atteindre. Comme les mathématiques ont développé de puissantes méthodes de maximisation sous contrainte, le parallèle entre le raisonnement humain et le raisonnement mathématique a rapidement été effectué et l’on a assimilé la technique mathématique de maximisation à la rationalité maximisatrice du décideur.
Rationalité procédurale Comme la rationalité limitée, la rationalité procédurale a été elle aussi proposée par Herbert Simon. Dans cette approche, Simon restitue une partie de la richesse du raisonnement humain en supposant que le choix d’un décideur ne correspond pas nécessairement au meilleur (rationalité maximisatrice) ou au moins mauvais (rationalité limitée) des résultats mais découle d’un raisonnement personnel (une procédure délibérative) adapté au problème, issu d’un véritable processus de sélection, de classement et de jugement de l’information. Voir Rationalité maximisatrice.
Rationalité substantielle Par opposition à la rationalité procédurale, la rationalité substantielle (le terme a été proposé par Herbert Simon en 1976) représente un raisonnement axé sur le résultat (alors que la rationalité procédurale est à la fois axée sur le résultat et sur le processus permettant d’atteindre ce résultat). Avec cette forme de rationalité, le décideur est calculateur, égoïste et maximisateur. Voir Rationalité maximisatrice et Rationalité procédurale.
Lexique
287
Refoulement Processus par lequel le sujet cherche à repousser ou à maintenir dans l’inconscient des représentations (pensées, images, souvenirs) liées à une pulsion. Le refoulement se produit lorsque la satisfaction d’une pulsion, en elle-même source potentielle de plaisir, risquerait de provoquer du déplaisir à l’égard d’autres exigences (par exemple sociales).
Rent-seeking La théorie du rent-seeking considère que la décision collective est biaisée par le comportement opportuniste de certains groupes de pression à la recherche de revenus supplémentaires (rentes). Un tel comportement déviant favorise les membres des groupes de pression –ce qui est le but recherché. Mais, parce qu’il correspond à une situation sous-optimale, le rent-seeking diminue globalement le bien-être collectif.
Risque Voir Incertitude.
Social Le terme social, dans cet ouvrage, se réfère simplement au comportement de l’individu en interaction avec d’autres individus, lorsqu’il est en société et non pas seul. Il ne doit pas être confondu avec l’autre acception de ce mot, qui renvoie à la prise en charge des membres plus défavorisés d’une société par des mesures particulières.
Stratégie En théorie des jeux, une stratégie est une action (dans les jeux statiques) ou une suite d’actions (dans les jeux dynamiques et les jeux répétés). Une stratégie suit, en général, une certaine logique, par exemple de prudence (on choisira l’action ou la suite d’action la moins risquée). Voir Jeu dynamique et Jeu statique.
Surmoi Défini par Freud en 1923, le Surmoi, selon lui, résulte pour l’essentiel de l’intériorisation de l’autorité parentale. Le Surmoi est une des trois composantes du psychisme avec le Moi et le Ça. Voir Moi et Ça.
Théorème d’impossibilité de Arrow Toute procédure démocratique de choix collectif portant sur plus de deux alternatives risque d’aboutir à une impasse comparable à celle du paradoxe de Condorcet. Selon K. Arrow, il est impossible de sortir d’une telle impasse sans sacrifier l’un des fondements démocratiques de la procédure de choix. Ainsi, ajouter un électeur à un cas Condorcet permet bien de trancher pour l’une des alternatives mais au prix d’une dictature, puisque le choix collectif est dicté par cet électeur supplémentaire. Voir Paradoxe de Condorcet.
Théorème de Coase Lorsque les droits de propriété sont clairement définis et en l’absence de coûts de transaction, Coase a montré que les problèmes d’externalité pouvaient être résolus spontanément, en passant par le marché et sans intervention publique. L’État ne doit intervenir que pour distribuer et garantir les droits de propriété ou lorsque les coûts de transaction deviennent trop importants pour obtenir une solution spontanée au problème des coûts de transaction. Ainsi, le problème du « pollueur-payeur » peut aisément être résolu : si les victimes de la pollution industrielle (qui est une externalité négative) disposent légalement de droits de propriété sur l’air et/ou l’eau polluée, ils disposent du droit de ne pas
288
La décision
être pollués. Pour polluer, l’industriel pollueur doit donc verser une compensation ou racheter les droits de propriété. Voir Externalités.
Théorème de Gibbard-Satterthwaite Ce théorème, démontré séparément par les deux auteurs, montre que toute règle de décision basée sur des préférences individuelles et non triviale (c’est–à–dire ni dictatoriale ni à deux issues) est manipulable, c’est–à–dire dépendante de faits extérieurs. Par exemple, dans le cas d’une élection politique avec plus de 2 candidats, il peut être rationnel pour un individu de ne pas voter pour son candidat préféré parce que celui-ci a peu de chances d’être élu. C’est le « vote utile » où l’individu ne révèle pas sa vraie préférence mais adopte un comportement stratégique qui dépend de ses croyances sur le comportement des autres électeurs. Le vote est alors « manipulé » car l’électeur n’exprime pas ses véritables préférences, compte tenu de la configuration de l’élection.
Théorèmes du bien-être Fondements de l’économie du bien-être, les deux théorèmes du bien-être posent les conditions sous lesquelles une économie est efficace au sens de Pareto. Le premier théorème (ou « théorème de la main invisible ») stipule que tout équilibre général est un optimum de Pareto. Le second théorème postule la réciproque en annonçant que dans une économie concurrentielle, à tout optimum de Pareto correspond un équilibre général. Cette relation biunivoque entre optimum parétien et équilibre général démontre donc que des agents rationnels agissant de façon décentralisée aboutissent à une situation collective optimale. En conséquence, l’intervention publique n’a pas besoin d’être autoritaire ; il suffit, pour atteindre un objectif donné, d’envoyer les signaux adéquats aux agents (sous forme de prix).
Théorie de l’agence Voir Modèle principal-agent.
Théorie du chaos Dans cette théorie, appliquée aux organisations, celles-ci sont présentées comme des systèmes dynamiques non linéaires, soumis à des forces internes et externes susceptibles de générer un comportement apparemment aléatoire et chaotique.
Théorie du choix rationnel La théorie du choix rationnel repose sur l’hypothèse de rationalité maximisatrice selon laquelle les décideurs obéiraient dans tous les cas à des calculs d’intérêt, en vertu desquels chacun n’agirait qu’en fonction d’un objectif à maximiser.
Théorie de la dépendance envers les ressources Cette théorie repose sur l’idée essentielle que le maintien et le développement d’une organisation dépendent de sa capacité à obtenir et à maintenir les ressources qui sont vitales pour son développement. Dans cette conception, l’organisation est considérée comme un système de coalitions largement ouvert sur son environnement, avec lequel elle est constamment en interaction pour obtenir les ressources indispensables à sa survie. L’organisation subit de nombreuses pressions et demandes, parfois contradictoires, provenant des différentes sources dont elle dépend en terme de ressources. Son maintien et son développement sont étroitement liés à sa capacité à gérer les relations avec ces différentes sources de dépendance.
Lexique
289
Théorie des incitations La théorie des incitations stipule qu’il existe toujours un moyen de compenser l’opportunisme des agents (notamment dans les situations de délégation de pouvoir). Elle propose alors d’identifier les déviances et d’offrir aux déviants potentiels un contrat incitatif chargé de neutraliser le risque de déviance.
Théorie des jeux Il s’agit d’une théorie mathématique, initiée en 1944 par Von Neumann et Morgenstern, qui formalise et tente de fournir des solutions aux situations de « jeux » dans lesquelles des joueurs s’affrontent. Ce type de situation est très fréquemment décrit en sciences sociales. L’affrontement est canalisé par des « règles du jeu » et l’enjeu est matérialisé par des gains. Dans ces conditions, la théorie des jeux étudie les meilleures stratégies des joueurs en fonction de leurs objectifs (en termes de gains) et compte tenu de l’impact croisé des actions des uns envers les autres.
Théorie des perspectives (ou des possibilités) Théorie proposée par Daniel Kahneman et Amos Tversky en 1979, la théorie des possibilités (prospect theory) représente la façon dont sont évaluées des options de choix en situation d’incertitude. Elle décrit la façon dont l’individu reformule le problème de décision avant d’en évaluer les options ; elle comprend une fonction d’évaluation dont les caractéristiques traduisent des phénomènes observés dans ces choix (comme par exemple, la sensibilité aux différences relatives plutôt qu’aux valeurs absolues).
Transfert Désigne le processus par lequel des sentiments, désirs, modalités relationnelles jadis éprouvés à l’égard de personnes très investies dans l’histoire du sujet, se reportent dans le présent sur d’autres personnes — dont notamment le psychanalyste. Ce processus s’effectue en général à l’insu du sujet.
Transitivité L’ordre des préférences est transitif pour les options A, B et C si, A étant préféré à B et B étant préféré à C, alors A est préféré à C.
Utilité Particulièrement utilisée en économie, l’utilité est une mesure de la satisfaction apportée à un individu par la consommation d’un bien. Cette estimation a la caractéristique d’être communément commensurable, en d’autres termes, l’échelle de mesure est commune à tous les agents (il est alors commode d’utiliser la monnaie pour mesurer l’utilité). Deux notions d’utilité se sont succédées dans l’analyse économique. L’utilité cardinale mesure directement la satisfaction des agents. L’utilité ordinale ne donne quant à elle qu’un classement des préférences des agents. Voir Préférences.
Utilité espérée Il s’agit de la somme pondérée des utilités de chacun des résultats possibles d’une option de décision. Les coefficients de pondération sont les probabilités d’occurrence de ces résultats.
Valeur certaine équivalente Il s’agit de la somme qui rend un individu indifférent entre participer à une loterie donnée et recevoir cette somme de façon certaine. Lorsque l’on connaît les valeurs certaines équi-
290
La décision
valentes de plusieurs loteries, il est alors possible, par déduction, de classer celles-ci dans un ordre de préférence.
Valeur monétaire espérée Pour une loterie donnée, caractérisée par des résultats potentiels (gains et/ou pertes), chaque résultat ayant une probabilité d’occurrence connue, la valeur monétaire espérée de la loterie s’obtient en multipliant d’abord chacun des résultats possibles par la probabilité qui lui correspond, puis en additionnant toutes les valeurs ainsi obtenues.
Les auteurs
Philippe ABECASSIS Docteur en Sciences économiques, Philippe Abecassis est maître de conférences à l’Université d’Angers où il enseigne la théorie des jeux et, dans le cadre d’un cours d’économie publique, les choix de dépense des collectivités territoriales. Ses recherches, au confluent de l’économie sociale et de l’économie publique, s’intéressent particulièrement aux comportements collectifs des agents dans un contexte de « rationalité limitée ». Ses travaux sont régulièrement présentés dans des colloques scientifiques et publiés dans plusieurs ouvrages collectifs : Le rôle de l’État dans la vie économique et sociale (1996), Théorie des conventions (2001), Santé, règles et rationalités (2003).
Philippe BATIFOULIER Maître de conférences à l’Université Paris X-Nanterre, il enseigne les ressources humaines, l’économie du travail, la microéconomie ainsi que les politiques sociales et les politiques publiques de santé dans les Masters des universités de Paris X et de Marne-La-Vallée. Spécialiste d’économie de la santé et en particulier d’éthique médicale, il a publié plusieurs articles scientifiques consacrés à la décision, parus notamment dans Économie Appliquée, la Revue de Philosophie Économique et le Journal d’Économie Médicale ainsi que dans des ouvrages sur l’économie sociale et la protection sociale. Il a dirigé l’ouvrage collectif Théorie des conventions (2001).
Laure CABANTOUS Doctorante en Économie à l’Université de Toulouse 1, ses recherches portent sur l’économie et la psychologie de la décision, sur la décision en situation d’incertitude, et plus particulièrement l’aversion à l’ambiguïté.
Véronique D’ESTAINTOT Diplômée de l’ESSEC, Véronique d’Estaintot a effectué son doctorat au sein du Center for Decision Research de l’Université de Chicago (Graduate School of Business) et a obtenu un PhD en marketing et psychologie de la décision. Ses recherches portent sur les choix intertemporels, l’apprentissage et les processus cognitifs et émotionnels.
292
La décision
Denis HILTON Professeur de Psychologie sociale, aujourd’hui à l’Université de Toulouse II, Denis Hilton est un spécialiste de renommée internationale du raisonnement et de la prise de décision. Il a publié de nombreux travaux et ouvrages dans le domaine et contribué à plusieurs ouvrages pédagogiques traitant de la décision. Ses publications à ce sujet sont parues dans les revues Psychological Review, Psychological Bulletin, Journal of Personality and Social Psychology, Review of Economic Studies et Risques ainsi que dans les ouvrages The cognitive bases of science (Cambridge University Press) et La psychologie sociale, tome V : Des compétences pour l’application (Presses Universitaires de Grenoble).
Fabrice TRICOU Maître de conférences en Sciences économiques à l’Université Paris X-Nanterre, ses recherches portent essentiellement sur la relation entre rationalité individuelle, coordination marchande et équilibre social. Ses principaux travaux concernant la décision sont parus dans les Cahiers d’Économie Politique et dans Archives de Philosophie du Droit.
Bénédicte VIDAILLET Diplômée de l’ESSEC et docteur en Sciences de gestion, Bénédicte Vidaillet est maître de conférences à l’Université de Lille 2 où elle enseigne la psychosociologie des organisations et la prise de décision managériale. Ses travaux sur la décision sont parus dans les revues International Studies in Management and Organization, Management et Conjoncture Sociale, la Revue Française de Gestion, Histoire, gestion et organisation, et dans les ouvrages collectifs Repenser la stratégie : fondements et perspectives (1998), Perspectives en management stratégique (1999), Organizational cognition : Computation and Interpretation (2001) et Le sens de l’action — Karl Weick, sociopsychologie de l’organisation (2003).
Table des matières
INTRODUCTION ............................................................................................................... 5 PARTIE 1
Le décideur face à ses choix: quand l’homo oeconomicus se dévoile CHAPITRE 1 AU CŒUR DU DÉBAT : LA THÉORIE ÉCONOMIQUE DE LA DÉCISION .................... 13 Fabrice TRICOU
1. La rationalité maximisatrice en univers objectif et certain ................................. 17 1.1 Le choix en univers certain et sa formalisation ....................................................... 17 1.2 Le choix optimal du consommateur ........................................................................ 20 1.3 Du choix spécifique du consommateur au choix général de l’agent rationnel ............ 21
2. La rationalité maximisatrice en univers objectif et incertain .............................. 26 2.1 Le choix en univers incertain et sa formalisation .................................................... 2.2 La pondération des états du monde selon leur probabilité d’occurrence .................... 2.3 Du critère de l’espérance de gains au critère de l’utilité espérée ............................... 2.4 Deux domaines d’application de la décision risquée : l’assurance et la finance .........
26 27 28 31
3. La rationalité maximisatrice en univers intersubjectif et incertain .................... 32 3.1 Le choix en univers interindividuel et sa formalisation ............................................ 3.2 Trois modalités fondamentales de l’objectivation de l’autre ..................................... 3.3 Concepts d’équilibre stratégique ............................................................................. 3.4 Les développements contemporains de la « nouvelle microéconomie » ......................
32 34 36 38
4. Conclusion : conditions, limites et substituts à la rationalité maximisatrice .... 39 4.1 Le principe maximisateur et ses trois modalités ...................................................... 39
294
La décision
4.2 Les limites de la rationalité .................................................................................... 40 4.3 Rationalité limitée, rationalité satisfaisante et rationalité procédurale ..................... 41
CHAPITRE 2 LE DÉCIDEUR EN ACTION : COMPORTEMENTS ET PROCESSUS PSYCHOLOGIQUES .............................................................................. 43
Véronique D’ESTAINTOT et Bénédicte VIDAILLET
1. Préférences et choix : une instabilité qui dérange ............................................... 44 1.1 Le renversement des préférences ........................................................................... 44 1.2 La « théorie des possibilités » : un modèle fondateur ............................................. 48 1.3 Où sont les vraies préférences ? .............................................................................. 50
2. Biais cognitifs et décision ...................................................................................... 54 2.1 La nature des biais cognitifs .................................................................................. 54 2.2 Estimation de la probabilité d’un événement .......................................................... 55 2.3 L’individu face à la fiabilité de son propre jugement : sûr de lui ou…suffisant ? ...... 58 2.4 Pour renforcer le tout : illusion de contrôle et tendance à la confirmation ! ............. 61
3. Règles de décision et stratégies de choix .............................................................. 66 3.1 Règles compensatoires et règles non compensatoires ............................................... 66 3.2 Contexte de choix et utilisation des règles de décision ............................................. 70 3.3 Effort cognitif et optimalité ................................................................................... 71
4. Conclusion ................................................................................................................ 73 CHAPITRE 3 LE DÉCIDEUR SUR LE DIVAN : QUAND L’INCONSCIENT ENTRE EN SCÈNE ............ 75 Bénédicte VIDAILLET
1. Psychologie de la décision et psychanalyse : deux approches différentes de la « rationalité » humaine ...................................76 2. Une étude de cas : un décideur sur le divan ......................................................... 79 3. L’hypothèse de l’inconscient : un nouveau déterminisme pour la prise de décision ? ...................................................................................... 82 3.1 L’origine inconsciente de certaines décisions ........................................................... 82 3.2 Les manifestations de l’inconscient ........................................................................ 86 3.3 Un psychisme régi par deux types de processus radicalement différents : les processus primaires et les processus secondaires ................................................. 88 3.4 Implications pour la décision ................................................................................. 90
4. La complexité de nos choix : ambivalence et conflit ........................................... 91 5. La décision : une production du sujet, un scénario déjà écrit ............................. 96 6. Conclusion .............................................................................................................. 102
Table des matières
295
PARTIE 2
Le décideur face à l’autre : de l’opportunisme à la coopération CHAPITRE 4 LE DÉCIDEUR EN INTERACTION : ÉGOÏSTE ET CALCULATEUR ................................. 105 Philippe BATIFOULIER
1. Dilemme du prisonnier et problème de la coopération ...................................... 106 1.1 Décision individuelle et coopération ..................................................................... 108 1.2 La modification des utilités ................................................................................. 110
2. L’émergence de la coopération ............................................................................. 111 2.1 La décision interactive en contexte d’incertitude ................................................... 111 2.2 La sélection d’un équilibre ................................................................................... 114
3. Décision coopérative et répétition du jeu ........................................................... 117 3.1 Le rôle du temps sur la coopération ..................................................................... 118 3.2 Rationalité et pérennité de la coopération ............................................................ 121
4. Conclusion .............................................................................................................. 123 CHAPITRE 5 INFORMATIONS ASYMÉTRIQUES : L’OPPORTUNISME EXACERBÉ ........................... 125 Philippe ABECASSIS et Philippe BATIFOULIER
1. Information parfaite et jeux séquentiels ............................................................. 126 1.1 Décision et temporalité ........................................................................................ 127 1.2 Séquences temporelles et crédibilité de la décision ............................................... 131
2. La hiérarchie de l’information .............................................................................. 133 2.1 Asymétrie d’information et modèle de l’agence ..................................................... 134 2.2 Décisions interactives et probabilités .................................................................... 137
3. Temps, croyances et information ......................................................................... 140 3.1 Information incomplète et jeu dynamique ............................................................ 141 3.2 Déviances stratégiques et révisions des croyances ................................................. 145
4. Conclusion .............................................................................................................. 150 CHAPITRE 6 LE DÉCIDEUR COOPÈRE PLUS QU’ON NE LE SUPPOSE ........................................... 151 Véronique D’ESTAINTOT Et Philippe BATIFOULIER
1. Confrontée aux observations expérimentales, comment la théorie économique intègre-t-elle la dimension psychologique des interactions ? ........................... 153 1.1 Qu’observe-t-on dans les jeux expérimentaux ? ..................................................... 153 1.1.1 Dilemmes du prisonnier ................................................................................. 155 1.1.2 Biens collectifs et passager clandestin ............................................................. 158
296
La décision
1.1.3 Marchandage et partage du gâteau .................................................................. 160
1.2 Prise en compte des facteurs psychologiques par la théorie économique ................. 162 1.2.1 L’altruisme ................................................................................................... 163 1.2.2 La confiance ................................................................................................. 164 1.2.3 Le sentiment de culpabilité ............................................................................ 165
2. Les conditions de la coopération identifiées par la psychologie expérimentale 166 2.1 Le comportement du décideur est influencé par les caractéristiques du jeu ............................................................................... 166 2.1.1 L’habillage des éléments du jeu conditionne l’interprétation des enjeux ................ 167 2.1.2 La durée de l’interaction modifie les perspectives stratégiques ............................. 168 2.1.3 La coopération dépend de la possibilité qu’ont les joueurs de communiquer entre eux ............................................................................. 171
2.2 L’individu en société : coopération et comportement de groupe ............................. 172 2.2.1 L’individu dans le groupe ............................................................................... 172 2.2.2 La coopération entre les groupes ..................................................................... 174
3. Comment établir les bases d’une coopération stable et durable ........................ 175 3.1 La mise en avant d’objectifs communs .................................................................. 175 3.2 L’intervention d’un tiers ....................................................................................... 176 3.3 La négociation .................................................................................................... 177
4. Conclusion .............................................................................................................. 179 PARTIE 3
La décision peut-elle se passer du décideur? CHAPITRE 7 LA RÉSIGNATION DU DÉCIDEUR DEVANT LA DÉCISION COLLECTIVE .................... 183 Philippe ABECASSIS
1. L’agrégation des préférences individuelles .......................................................... 185 1.1 L’idéal collectif ................................................................................................... 185 1.2 Impasses et imperfections des règles de décision collective .................................... 191 1.3 Les méthodes effectives d’agrégation .................................................................... 193
2. La théorie du choix social ..................................................................................... 198 2.1 Bien-être social et économie publique .................................................................. 198 2.2 Comment mesurer le bien-être ? ........................................................................... 200
3. Choix collectif et déviances stratégiques ............................................................ 205 3.1 Déviances bureaucratiques ................................................................................... 205 3.2 Déviances partisanes ............................................................................................ 207 3.3 Déviances domestiques ........................................................................................ 208
4. Conclusion .............................................................................................................. 209
Table des matières
297
CHAPITRE 8 LE DÉCIDEUR SOUS INFLUENCE : L’ÉMERGENCE DE LA DÉCISION COLLECTIVE ........................................................... 211 Denis J. HILTON et Laure CABANTOUS
1. Les effets de l’influence sociale dans les groupes : la création et la dissolution du consensus ............................................................................. 213 1.1 La formation des normes de groupe .................................................................... 1.2 Les effets de conformité et d’obéissance : la socialisation à la norme .................... 1.3 Comment expliquer la conformité ? Les influences normatives et informationnelles ............................................................................................. 1.4 L’innovation : causes et conséquences de l’influence de la minorité .......................
213 214 216 218
2. Les facteurs affectant la prise de décision dans les petits groupes .................. 219 2.1 La pensée groupale ou le « groupthink » .............................................................. 2.2 Dans quelles situations les groupes prennent-ils les meilleures décisions ? ............. 2.3 Polarisation du groupe et prise de risque .............................................................. 2.4 Responsabilité : explication, justification et prise de décision ...............................
219 220 221 224
3. Prise de décision individuelle et comportements collectifs ............................... 226 3.1 Les interactions sur les marchés : l’effet des anticipations des croyances des autres acteurs ................................................................................................ 3.2 Un exemple de phénomène de contagion dans un « grand » groupe : les bulles spéculatives sur les marchés ................................................................................. 3.3 Irrationalité individuelle et rationalité du marché ................................................. 3.4 Appartenance culturelle et décision ......................................................................
227 228 230 231
4. Conclusion .............................................................................................................. 233 CHAPITRE 9 DÉCIDEURS ET ORGANISATIONS : DANS LES COULISSES DE LA DÉCISION COLLECTIVE ............................................... 235 Bénédicte VIDAILLET
1. La décision comme pré-requis de l’efficacité des organisations ........................ 237 1.1 Les classiques et les pré-théories de la décision .................................................... 237 1.2 La décision au cœur de la science administrative .................................................. 238
2. Vers une critique de la décision : entre incrémentalisme et jeux de pouvoir ................................................................................................. 240 2.1 La politique des petits pas ................................................................................... 240 2.2 La décision, enjeu et jeu de pouvoir ..................................................................... 241 2.3 La face cachée de la décision : choix sans décision, décision sans choix et non-décision ................................................................................................... 245
3. Les théories critiques : l’organisation sans décision .......................................... 247 3.1 L’anarchie organisée et le « modèle de la poubelle » ............................................ 247 3.2 La « décision » comme représentation sociale ...................................................... 250
298
La décision
3.3 La fin de la décision ? ......................................................................................... 253
4. Conclusion .............................................................................................................. 256 BIBLIOGRAPHIE ............................................................................................................. 259 LEXIQUE ......................................................................................................................... 275 LES AUTEURS ................................................................................................................. 291