Un soup con de th eorie des groupes: groupe des rotations et groupe de Poincar e
D.E.A. \Champs, Particules, Matieres", 1995 - 1996 derniere modication: Octobre 1997 B. Delamotte LPTHE, Universite Paris 7 - Denis Diderot Universite Paris 6 - Pierre et Marie Curie Tour 24-14, 5eme et., 75251 Paris Cedex 05
[email protected], 01 44 27 39 92
http://www.lpthe.jussieu.fr/DEA/
0
2 \Desordre du temps passe, Moi, pour dissiper la nuit, J'ai risque tout mon sommeil." P. Eluard
Preface
Ce cours de theorie des groupes n'en est en fait pas vraiment (vraiment pas ?) un. De nombreux developpements importants sont absents, comme par exemple la classication des groupes compacts semi - simples. Rien n'est dit, ou presque, a propos des representations de masse nulle du groupe de Poincare, de la theorie des caracteres ni non plus a propos de techniques de calcul, comme par exemple celle des tableaux d'Young. Le but de ce cours est de toute facon ailleurs : il vise autant a dire le pourquoi des choses que le comment, a montrer les liens et les dissemblances entre concepts, par exemple entre concepts classiques et quantiques et nalement a fournir au lecteur assidu de ces pages, les bases necessaires tant physiques que mathematiques, a la lecture de la litterature mathematiquement plus avancee. Ces notes ne dispensent donc en aucune facon de la lecture des bons ouvrages et, si elles sont a la hauteur de l'ambition de leur auteur, elles devraient en revanche donner le discernement qui permet d'eviter les mauvais. Ces notes sont basees sur la premiere partie d'un cours de theorie quantique des champs eectue plusieurs annees durant au DEA \Champs, Particules, Matieres" des universites Paris 6, Paris 7 et Paris 11. Il repose donc sur un a priori, celui d'introduire les concepts et techniques de calcul necessaires pour la suite de ce cours. J'ai egalement souhaite ^etre le plus rigoureux possible | au sens des physiciens | en essayant de donner, a chaque fois que faire se pouvait, le sens qualitatif des concepts exposes et en souhaitant que le lecteur soit plus convaincu par les arguments donnes que par des preuves qui n'auraient pas leur place ici. Si le courage ne me fault, une suite en deux chapitres devrait succeder, dans les annees a venir, a celui-ci : theorie quantique des champs libres, theorie des perturbations et electrodynamique quantique. Je souhaiterais que ce cours soit evolutif. J'entends par la qu'etant sur internet (l'adresse est en page de garde), je devrais pouvoir constamment l'ameliorer tout en le laissant a la disposition permanente des lecteurs. Donc, si d'aventure un de ceux ci, interesse par l'amelioration de ces notes, souhaite me faire part de ses critiques ou suggestions, je serais heureux de les examiner et de les inclure eventuellement dans une version corrigee. Je suis bien entendu interesse par toute remarque (ecrite de preference), de la plus petite a la plus grande. Mon adresse electronique est donnee en page de garde de ces notes. Et maintenant, voici une bibliographie (tres restreinte) :
3
0
P. Ramond : Field Theory : A Modern Primer, second edition, Frontiers in Physics, Addison - Wesley, 1989. Un ouvrage recommandable. Fait une petite introduction au groupe de Lorentz tres ecace. La partie theorie des champs est assez bien faite a quelques exceptions pres (le theoreme spin - statistique est ni plus ni moins omis!). L. Fonda et G.C. Ghirardi : Symmetry Principle in Quantum Physics, Marcel Dekker, Inc. New York 1970. Tres original dans sa presentation. Devient un peu pesant quand il passe a l'equation de Dirac. En fait, presque toute la partie quantique de ces notes est inspiree de ce livre. S. Weinberg : The quantum theory of elds, Volume I, Cambridge University Press, 1995. Appele a devenir un classique. Voila (enn et de nouveau !) un livre de theorie des champs ou l'on voit quelqu'un penser. Ca n'est pas frequent et tendait a dispara^tre ! D'un niveau un peu avance pour un debutant... et tres rapide sur la partie groupe quoique la notion de symetrie soit au c ur de son expose. P. W. Atkins : Molecular quantum mechanics, 2nd edition, Oxford University Press, 1983. Plus un livre de mecanique quantique que de theorie des groupes. Traite surtout des groupes discrets et de leur utilite en physique atomique et moleculaire. Toute la distinction anglo saxonne. Que c'est beau ! ... S. Sternberg : Group theory and physics, Cambridge University Press, 1994. Comme son nom l'indique: : : Un vrai penchant pour les maths avec cependant (c'est rare) de la vraie physique. Parfois deroutant : parler du groupe de Lorentz dans un chapitre intitule \vibrations moleculaires et bres vectoriels" n'est pas tout a fait commun: : : Et puis de nombreux cours m'ont inspire. Les cours d'Alain Laverne de mecanique quantique et de theorie des champs eectues a l'ex DEA de Physique Nucleaire d'Orsay et au DEA \Champs, Particules, Matieres" ainsi que les tres nombreuses discussions que j'ai eues avec lui ont largement contribue a ma comprehension du sujet. Certains arguments presentes dans ces notes lui sont entierement dus 1 . J'ai egalement ete un lecteur assidu des notes du cours de DEA de \Physique Quantique" de F. Lalo!e intitulees \Les symetries en mecanique quantique". L'encadre IV de ce cours est tout droit issu du cours de G. Mahoux \Cinematique relativiste" eectue a Orsay en 1970-1971. Ces notes ont beaucoup prote des critiques de nombreux etudiants de DEA et de collegues. Je tiens a les en remercier vivement. Je remercie tout particulierement M. Caarel, A. Laverne, 1: Merci Monsieur Laverne.
0
4
E. Kahn, P. Lecheminant et D. Mouhanna qui ont consacre beaucoup de temps et d'energie a me lire et a me suggerer moult modications. La typographie de ces notes doit beaucoup a D. Lederer qui m'a faconne un style LateX sur mesure. L. Laloux a reduit une a une les dicultes d'Unix, de Mac Intosh, de polices de caracteres, d'impression, etc: : : Quel cauchemar tout cela aurait ete sans lui: : : Pour nir, je ne peux pas resister au plaisir de citer H.J. Lipkin dont les deux phrases suivantes ecrites en 1970 ont souvent accompagne mes pensees : \A survey of the literature in theoretical particle physics in the past decade would probably indicate that there is more misuse than use of group theory. The authors either know too little group theory or too much." \I have often wondered why it took so many years from the discovery of strangeness to the proposal of unitary symmetry. : : : ] Evidently physicists active in strange-particle physics knew very little group theory while those familiar with group theory knew very little about strange particles."
0
5
Table des mati eres
Table des mati`eres 1 Les prolegomenes
De l'inter^et de la notion de symetrie : : : : : : : : : : A Brisure spontanee et brisure explicite de symetrie II Groupes de symetrie et representations : : : : : : : : : III Le groupe C3v : : : : : : : : : : : : : : : : : : : : : : :
I
: : : :
: : : :
: : : :
: : : :
: : : :
: : : :
: : : :
: : : :
: : : :
: : : :
: : : :
: : : :
: : : :
: : : :
: : : :
7 7 10 12 16
2 Groupes de Lie { groupes SO(3) et SU(2)
21 I Le groupe des rotations : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : 21 A Les vecteurs - algebre de Lie du groupe des rotations : : : : : : : : : : : : : 22 B Representation de dimension deux du groupe des rotations, groupe SU(2), spineurs : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : 28 C Construction de la relation SO(3) - SU(2) : : : : : : : : : : : : : : : : : : : 29 II Vecteurs, spineurs, tenseurs et generateurs : : : : : : : : : : : : : : : : : : : : : : 33 A Les representations de SU(2) : : : : : : : : : : : : : : : : : : : : : : : : : : 33 B La convention d'Einstein et quelques menus theoremes : : : : : : : : : : : : : 35 C Base et coordonnees spheriques - Operateurs vectoriels : : : : : : : : : : : : : 36 D Les tenseurs - produit tensoriel de representations : : : : : : : : : : : : : : : 41 E Autres petits theoremes : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : 43 F Comment construire des vecteurs a partir de spineurs - composition de deux spins 1/2 : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : 45
3 Theorie quantique et symetries I II III IV
Les axiomes de la mecanique quantique : : : : : Points de vue actif et passif : : : : : : : : : : : Le theoreme de Wigner : : : : : : : : : : : : : Transformations des observables { symetries : : A Symetries en representation de Schr!odinger B Symetries en representation de Heisenberg C Le modele de la particule a spin : : : : : : D Quelques remarques : : : : : : : : : : : : :
: : : : : : : :
: : : : : : : :
: : : : : : : :
: : : : : : : :
: : : : : : : :
: : : : : : : :
: : : : : : : :
: : : : : : : :
: : : : : : : :
: : : : : : : :
: : : : : : : :
: : : : : : : :
: : : : : : : :
: : : : : : : :
: : : : : : : :
: : : : : : : :
: : : : : : : :
: : : : : : : :
: : : : : : : :
48 48 50 51 54 55 58 59 63
0
6
Table des mati eres
V Un point de vue ni actif ni passif : : : : : : : : : : : : : : : : : : : : : : : : : : : 64
4 Le groupe de Lorentz SO(3,1) et le groupe de Poincare
Les groupes de Lorentz et de Poincare : : : : : : : : : : : : : : : : : : : A Quelques denitions et conventions : : : : : : : : : : : : : : : : : : II Le groupe SO(3 1) : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : A Quelques remarques sur le calcul tensoriel et le groupe de Poincare : III Les transformations speciales de Lorentz et les rotations : : : : : : : : : A Les algebres de Lie de SO(4) et de SO(3,1) : : : : : : : : : : : : : : 1 Le cas euclidien : : : : : : : : : : : : : : : : : : : : : : : : : : : 2 Le cas minkowskien : : : : : : : : : : : : : : : : : : : : : : : : B Construction de la relation SO(3,1)-SL(2,C ) : : : : : : : : : : : : : IV La Parite : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : V Spineurs, scalaires et quadri-vecteurs : : : : : : : : : : : : : : : : : : : : VI Les bi-spineurs et les matrices : : : : : : : : : : : : : : : : : : : : : : A Autres representations de l'algebre de Cliord : : : : : : : : : : : : B Transformations de Lorentz des bi-spineurs : : : : : : : : : : : : : : VII Champs et groupe de Poincare : : : : : : : : : : : : : : : : : : : : : : : A Les champs, les rotations et les transformations de Lorentz : : : : : 1 Le cas euclidien : : : : : : : : : : : : : : : : : : : : : : : : : : : 2 Le cas minkowskien : : : : : : : : : : : : : : : : : : : : : : : : VIIILes translations et le groupe de Poincare : : : : : : : : : : : : : : : : : : A le generateur des translations : : : : : : : : : : : : : : : : : : : : : : B Un premier operateur de Casimir : P2 : : : : : : : : : : : : : : : : : C Notion d'orbite et de groupe d'isotropie : : : : : : : : : : : : : : : D Les representations massives et de masse nulle de Poincare : : : : : IX Les lagrangiens invariants : : : : : : : : : : : : : : : : : : : : : : : : : :
I
5 Appendices
Appendice I : representations lineaires et non lineaires : A Equations covariantes et calcul tensoriel : : : : : : II Appendice II : groupes nis et caracteres : : : : : : : : III Appendice III : transformation des spineurs classiques : IV Appendice IV : Points de vue actifs : : : : : : : : : : : A Recapitulatif : : : : : : : : : : : : : : : : : : : : :
I
6 Quand on a tout oublie
: : : : : :
: : : : : :
: : : : : :
: : : : : :
: : : : : :
: : : : : :
: : : : : :
: : : : : :
: : : : : :
: : : : : :
: : : : : : : : : : : : : : : : : : : : : : : : : : : : : :
: : : : : : : : : : : : : : : : : : : : : : : : : : : : : :
: : : : : : : : : : : : : : : : : : : : : : : : : : : : : :
: : : : : : : : : : : : : : : : : : : : : : : : : : : : : :
: : : : : : : : : : : : : : : : : : : : : : : :
68 68 69 72 73 76 77 77 79 82 85 89 90 93 94 96 96 96 98 99 99 100 102 103 105
: : : : : :
108 108 109 113 114 116 119 121
7
1
CHAPITRE 1
´ ` Les prolegom enes I
´ ET ˆ DE LA NOTION DE SYMETRIE ´ DE L’INTER
Pourquoi diable un physicien normal devrait-il s'interesser a la notion de symetrie et a la theorie des groupes? Aujourd'hui, un cristallographe, un atomiste et un physicien des particules auraient probablement des idees assez dierentes sur le sujet. Qui plus est, ces idees ont beaucoup change avec le temps car suivant les epoques la communaute physicienne n'a pas toujours pense de la m^eme facon, ni accorde la m^eme importance a la notion de symetrie, importance qui d'ailleurs n'a ete reconnue que tardivement. Il est instructif, a cet egard, de se souvenir que la loi de conservation de l'energie a ete decouverte dans le cadre de la thermodynamique au dix neuvieme siecle (premier principe) et non comme une consequence de l'invariance par translation dans le temps { ce qu'elle est en fait. On peut maintenant, avec le recul des annees, se rendre compte que la plupart des lois fondamentales trouvees empiriquement, de Newton a Maxwell et a Schr!odinger, sont des consequences quasi obligatoires de symetries sous jacentes aux theories physiques 1 . Cependant, a quelques exceptions (importantes) pres dont je parlerai dans la suite, les symetries n'ont ete d'aucune utilite pratique dans la decouverte des lois physiques probablement parce que leur maniement etait trop abstrait et eloigne des phenomenes sensibles. 2 . Ca n'est donc bien souvent qu'apres coup que l'on a pu reinterpreter les lois physiques en question en termes de symetries et en apprecier toute l'importance. De toute facon, mise a part la gravitation ou l'invariance par changement de coordonnees a eectivement servi 1: En fait du melange de symetries et de principes fondamentaux de la physique : principes quantiques, principe de moindre action, causalite, localite, etc: : : On consultera avec prot a ce sujet Landau et Lifschitz \Mecanique" ou il est montre que le principe fondamental de la dynamique : F~ = m~a est une consequence quasi-obligatoire de l'invariance galileenne et du principe de moindre action. 2: Maxwell, par exemple, avait une vision epouvantablement mecaniste de l'electromagnetisme, faite de roues dentees et d'engrenages, rien qui ne ressembla a une quelconque invariance de jauge, fondement pourtant universellement reconnu aujourd'hui de l'electrodynamique. On peut eectivement montrer que cette theorie est une consequence quasi-obligatoire de l'invariance de Lorentz et d'une symetrie, dite de jauge, stipulant que le quadri-potentiel electromagnetique, forme du potentiel scalaire et du potentiel vecteur, est deni a un quadri-gradient pres. C'est ce qui impose de faire un choix de jauge, Coulomb, Lorentz, etc: : : lorsqu'on veut faire des calculs. Quant a la pertinence physique des theories de jauge, elle est tres fortement reliee a la structure quantique des interactions (renormalisabilite) entre particules elementaires. En un mot, ceci provient du fait que les seules interactions qui restent susamment fortes a \basse energie", i.e. aux energies experimentalement accessibles, pour jouer un r^ole sont celles fondees sur des symetries de jauge (a quelques exceptions pres : interaction de Yukawa ou en 4 par exemple).
1
I. De l'inter^et de la notion de symetrie
8
de guide a Einstien pour b^atir sa theorie, la notion de symetrie etait en general conne a un r^ole purement descriptif comme par exemple pour la classication des cristaux (Pasteur fut probablement un des premiers a utiliser la notion de structure de la matiere et de symetrie miroir avec les sucres dextrogyres et levogyres). C'est en fait vers le milieu des annees cinquante avec Yang et Mills que l'on a assiste en physique des particules a un changement de paradigme lorsque les physiciens de ce domaine ont compris qu'ils pouvaient utiliser les symetries non plus simplement de maniere descriptive mais de maniere constructive pour b^atir de nouvelles theories de particules en interaction (les theories de jauge). Pour cette physique, la possibilite oerte par les symetries de selectionner un jeu en denitive tres restreint de lois admissibles pour decrire les interactions entre particules dans l'ensemble, a priori inni, des equations que l'on peut imaginer, a ramene en grande partie le probleme de la determination des interactions fondamentales a celui des symetries sous tendant ces interactions 3 (modele standard des interactions electrofaibles, chromodynamique, theories supersymetriques, etc: : : ). On concoit des lors l'inter^et essentiel des symetries dans ce domaine. Une deuxieme caracteristique des symetries, egalement tres importante, est l'existence de quantites conservees dans le temps qui leur sont associees (pour les symetries continues, voir la suite). C'est le cas, par exemple, des symetries de l'espace-temps : la conservation de l'energie pour un systeme isole quelconque est une consequence de la symetrie de translation dans le temps (et non d'une propriete specique du systeme 4 ), celle de l'impulsion une consequence de l'invariance par translation dans l'espace, celle du moment cinetique une consequence de l'invariance par rotation 5, etc: : : Les deux proprietes majeures precedemment enoncees, contraintes sur les lois possibles et existence de quantites conservees, ne sont pas independantes car, pour un systeme donne, l'existence m^eme de quantites conservees est une contrainte sur la dynamique de ce systeme : les trajectoires des molecules d'un gaz, par exemple, pour erratiques qu'elles soient, sont telles qu'a chaque instant, l'energie du gaz reste inchangee. Ces contraintes peuvent donc logiquement determiner tout ou partie de la dynamique du systeme. 3: Il ne faudrait pas en deduire que les modeles fondes sur des symetries de jauge sont univoquement determines par ces symetries. Parmi les parametres non contraints par les symetries, on trouve la force des interactions, le contenu en particules de la theorie et les masses des particules, le schema de brisure spontanee (voir la suite). C'est evidemment un fantasme de la communaute d'imaginer qu'il existe une theorie | LA theorie | qui n'aurait aucun parametre libre et qui serait entierement determinee par un principe de symetrie. Cette TOE (theory of everything), beaucoup ont cru l'avoir trouvee ces vingt dernieres annees: : : 4: De ce fait, la notion de symetrie, et son corollaire les lois de conservation, sont peut ^etre les seuls concepts qui \traversent" la physique et se retrouvent aussi bien en physique des particules qu'en astronomie et d'ailleurs aussi en biologie ou en chimie. 5: La charge electrique est egalement une quantite conservee associee a une symetrie { la symetrie de jauge mentionnee dans la note numero 2 en bas de page { qui, elle, n'a, pense t'on, rien a voir avec la structure de l'espace-temps.
1
I. De l'inter^et de la notion de symetrie
9
Ces notes de cours (et leur suite non encore redigees) vont raconter comment les symetries de l'espace-temps (rotations, translations et transformations de Lorentz) alliees a la theorie quantique determinent entierement, pour les particules libres, l'ensemble des dynamiques physiquement acceptables. En fait, comme on peut le voir sur la theorie quantique des champs libres, m^eme la notion de particule elementaire { et d'anti-particules { n'a pas a ^etre explicitement introduite : elle est une consequence quasi-obligatoire des equations quantiques et invariantes de Lorentz que nous serons amenes a ecrire ! Comme nous l'avons deja mentionne, cette demarche constructive s'etend ensuite aux theories quantiques decrivant les particules en interaction gr^ace aux symetries de jauge 6. Nous allons donc dans la suite adopter comme point de vue de construire les theories quantiques relativistes de Lorentz a partir des symetries. Ce faisant, nous trahirons le processus historique de la decouverte puisque nous ne chercherons pas a decrire quoi que soit mais a construire a priori des equations repondant seulement a des exigences de symetrie (et aux principes quantiques). Evidemment, et c'est la la beaute de la chose, ce jeu qui pourrait para^tre sterile, ne l'est en fait pas car nous nous attaquons a des systemes simples { au sens d'elementaires { pour lesquels les symetries sont susantes pour tout determiner. Plus explicitement, nous postulerons que les equations d'evolution des champs 7 (quantiques on non) de Dirac, Maxwell, etc: : : derivent d'un principe de moindre action, i.e. sont les equations d'Euler - Lagrange de lagrangiens bien choisis : 3 @ @L = 0 @L ; X @ =0 @x @ (@=@x )
(I -1)
avec L= lagrangien et = champ(s) de Dirac, Maxwell, etc: : : Le probleme de trouver toutes les dynamiques possibles est ainsi ramene a celui de la determination de tous les lagrangiens et de tous les types de champs qui peuvent ^etre physiquement pertinents. Pour une raison qui sera claire dans la suite, les seuls lagrangiens (en fait les actions) qui sont susceptibles de conduire a des equations physiquement acceptables sont ceux qui sont invariants sous les symetries de la Nature, les symetries de l'espace - temps en 6: Exception notable, la gravitation qui resiste toujours a une description quantique. La, la solution choisie par une grande partie de la communaute est plus radicale : abandonner la theorie des champs au prot de la theorie des cordes qui s'avere ^etre un peu plus coriace mais qui fera tres probablement jouer a la notion de symetrie un r^ole de tout premier plan. Il est vrai aussi que les theories des (super-) cordes se sentent a leur aise essentiellement dans un espace - temps de dimension dix: : : 7: On peut justier assez simplement qu'il faut considerer des champs d'operateurs dans le domaine quantique et relativiste de Lorentz car il est tres dicile d'avoir un formalisme explicitement covariant sans utiliser de champs. La diculte conceptuelle qu'il y a a admettre que la bonne mathematisation d'objets discrets comme des particules passe par des objets continus comme les champs se resout en reconnaissant qu'elles apparaissent dans le spectre des hamiltoniens comme des excitations des champs et non comme les champs eux m^emes.
1
I. De l'inter^et de la notion de symetrie
10
tout premier lieu. Cette invariance sera notre seul guide 8. Tout notre travail a venir a donc en denitive un seul but : construire tous les champs (scalaires, spinoriels, quadri-vectoriels, etc: : : ) qui entreront dans nos lagrangiens et tous les invariants fonctions de ces champs qui seront les lagrangiens eux m^emes. La dynamique des theories obtenues et leur interpretation en termes de particules 9 seront des consequences inevitables des equations d'Euler - Lagrange et du spectre des hamiltoniens deduits de ces lagrangiens ! Le cas le plus simple, celui des particules libres, aura le bon go^ut de nous fournir les dynamiques exactes de ces particules et qui serviront de point de depart a l'etude des particules en interaction. Dans ce contexte, la formalisation mathematique de la notion de symetrie est un des exemples les plus frappants de \l'absurde ecacite des mathematiques" (Wigner). Mais avant cela, encore un mot general sur la notion de symetrie. A Brisure spontan´ee et brisure explicite de sym´etrie
On pourrait a priori s'etonner des propos que je tiens precedemment. Apres tout, si l'existence de symetries etait contraignante au point de determiner presque entierement la dynamique des systemes, cela devrait nous crever les yeux. Or ca n'est pas le cas. Pourquoi n'en est il pas ainsi? Il y a a cela de multiples reponses. Je voudrais juste en exposer trois. 1) Tout d'abord, les lois de conservation issues des principes de symetrie ne sont que globales. Par exemple, seule l'energie totale d'un systeme isole est conservee, mais il n'en va pas de m^eme en general pour chacun de ses sous systemes. Ainsi, lorsqu'on etudie un systeme en interaction avec son environnement, il se peut qu'aucune quantite relative au systeme (son energie interne, son impulsion, etc: : : ) ne soit conservee. Il peut neanmoins exister des situations ou l'on parvient a isoler tres bien un systeme de son environnement et dans ce cas les lois habituelles de conservation valent independament pour le systeme et pour le reste de l'univers. Mais la notion de \systeme isole" est en fait relative a une quantite conservee donnee. Ainsi, on sait bien isoler energetiquement un systeme en le mettant dans une bo^te ayant des parois adiabatiques, mais il est beaucoup plus dicile de le faire pour ce qui est de l'impulsion: une fois que l'on a mis un gaz dans une bo^te posee sur une table, il peut echanger de l'impulsion avec un reservoir \inni" { la terre { via les parois de la bo^te 10. 2) Dans les systemes a grand nombre de corps, on sait que m^eme un couplage tres faible avec l'environnement peut bouleverser la dynamique microscopique du systeme (l'interaction gravitationnelle des molecules d'un gaz avec un electron place a l'autre bout de la galaxie 8: A condition de supposer que nous pouvons nous limiter aux theories quantiques, causales, lagrangiennes et locales des champs. 9: Attention au photon ! 10: C'est pour cela que dans l'approche microcanonique de la mecanique statistique, on ne suppose jamais xee l'impulsion du systeme.
1
I. De l'inter^et de la notion de symetrie
11
est susante pour completement modier, sur un temps microscopique, les trajectoires des molecules du gaz). Dans ce cas, seule une approche statistique est viable si bien que les lois de conservation peuvent grandement perdre de leur inter^et quand bien m^eme elles sont veriees a une tres bonne approximation (l'impulsion totale d'un gaz dans une bo^te est nulle a de tres petites %uctuations pres et pourtant il ne s'agit pas d'une quantite pertinente). 3) Dans les deux cas precedents, les lois de conservation relatives a un systeme etaient explicitement violees a cause du couplage a l'environnement. On parle alors de brisure explicite de symetrie : dans l'hamiltonien decrivant ce systeme, on doit incorporer un terme de couplage avec l'exterieur qui ne respecte pas certaines symetries. Il existe toutefois des cas ou un probleme (un hamiltonien H par exemple) possede une symetrie sans que ses solutions la possede (l'etat fondamental de H par exemple). Voici un exemple. Cherchons le trajet le plus court reliant quatre points situes au sommet d'un carre. Le probleme ainsi pose possede evidemment la symetrie du carre. On trouve neanmoins deux solutions dont aucune n'a la symetrie du carre (aucune des deux gures n'est invariante par symetrie miroir par rapport a AC par exemple) :
Fig.
A
B
A
B
D
C
D
C
1.1 - Les deux chemins les plus courts reliant les sommets du carre ABCD
On peut se convaincre cependant que l'ensemble des solutions doit ^etre globalement invariant sous les operations de symetrie du carre (a partir d'une solution, on engendre obligatoirement une solution | autre ou identique | par action des operations de symetrie du carre). Bien s^ur, une fois choisie une solution, il n'est plus du tout evident de se rendre compte qu'elle est issue d'un probleme possedant des symetries plus grandes. On parle dans ce cas de brisure spontanee de symetrie. Les cas de brisure spontanee de symetrie sont nombreux dans la nature: les positions d'equilibre d'un crayon sur une table horizontale (une instable : le crayon vertical, une innite de stables : le crayon couche sur la table), l'aimantation spontanee d'un corps ferromagnetique en dessous de sa temperature de Curie, les cristaux liquides, le modele de Weinberg - Salam, etc: : : Pour ces systemes, les symetries existantes sont cachees et ne nous crevent donc pas les yeux. La notion de brisure spontanee de symetrie joue un r^ole considerable tant en physique des particules, qu'en mecanique statistique, en physique du solide, en hydrodynamique, etc: : : Et maintenant, formalisons un peu tout cela.
1 II
II. Groupes de symetrie et representations
12
´ ´ DEFINITION DE LA NOTION DE GROUPE DE SYMETRIE ET DE ´ REPRESENTATIONS D’UN GROUPE
En physique, la notion de symetrie est directement reliee a celle d'invariance. Ici, deux exemples et un petit avertissement. Un carre est dit posseder un groupe 11 de symetrie car il est invariant sous l'ensemble des transformations : rotations d'angle 0 =2 3=2, symetries miroir par rapport aux diagonales et aux mediatrices 12. Dans ce cas, c'est le \systeme" lui-m^eme qui est invariant sous le groupe de transformation.
L'invariance de la physique sous le groupe des translations signie qu'une experience eectuee
dans un vaisseau spatial (moteur coupe et loin de toute matiere) est independante de la position du vaisseau 13 . Ici ce n'est pas le systeme qui est invariant puisqu'il est translate, ce sont les \equations du mouvement" du systeme qui le sont (seules les positions initiales changent, pas l'evolution). On voit sur cet exemple qu'en physique symetrie signie le plus souvent non pas invariance du syst eme mais invariance des lois physiques. Il n'est pas ininteressant non plus de noter que symetrique signie \ non distinguable" ou encore \inobservable". Prenons en eet l'exemple d'habitants d'un monde unidimensionnel ayant la forme d'un carre. Imaginons que deux habitants de ce monde se telephonent et essayent de se communiquer leur adresse (position) sur le carre. Ils peuvent chacun se dire a quelle distance ils sont de l'angle le plus proche, mais ils ne peuvent en aucune maniere specier sur quel c^ote du carre ils sont, car les quatre c^otes, qui sont echanges par les diverses operations de symetrie du carre, sont absolument indiscernables. La seule solution pour se reperer sur le carre est de planter un poteau en un point quelconque du carre et d'indiquer un sens de rotation. Ainsi toutes les distances peuvent ^etre calculees a partir de cette origine. Mais planter un poteau, c'est precisement briser la symetrie du carre. Il est bon de comprendre qu'il en va de m^eme \dans la vie de tous les jours". Dire que la physique est invariante par translation, ca n'est pas dire que l'univers qui nous entoure est le m^eme partout : quiconque s'est cogne contre un mur devrait en ^etre convaincu. L'univers qui nous entoure n'est pas invariant par 11: groupe = ensemble G muni d'une loi de composition (souvent appelee multiplication m^eme si elle n'a rien a voir avec la mutiplication des reels) possedant les quatre proprietes suivantes : 1) la loi de composition est une loi interne a G, i.e. que la mutiplication de deux elements quelconques de G donne un element de G, 2) il existe un element neutre, 3) tout element possede un symetrique et 4) la loi est associative. Au fait, pourquoi les symetries d'un systeme physique possederaient elles une structure de groupe? Essentiellement parce que la composee de deux symetries doit ^etre une symetrie, d'ou la notion de loi de composition interne. Les autres proprietes, a part l'associativite, vont de soi dans la plupart des cas. Quant a l'associativite, c'est le cas general, mais je me demande bien pourquoi: : : 12: On peut facilement verier que l'ensemble de ces transformations forment un groupe. 13: Probleme sans fond : que signie loin de toute matiere?
1
II. Groupes de symetrie et representations
13
translation : il y a des \poteaux" partout ! C'est precisement ce qui nous permet de nous reperer dans l'espace. L'invariance par translation de la physique signie que si l'on translatait la terre (et s'il le faut pour l'experience que nous sommes en train d'eectuer, le systeme solaire et la galaxie) le resultat de notre experience serait inchange 14 . A propos, qu'est ce qu'un groupe (pour un physicien)? 1) C'est un ensemble de transformations (rotations, translations, transformations de Galilee ou de Lorentz, etc: : : ) 2) et c'est une table de multiplication entre transformations qui verie les proprietes mentionnees dans la note en bas de page (12).
Mais attention, en tant que physiciens (par opposition au Tres Haut), nous ne connaissons
des groupes que leurs actions sur les systemes physiques que nous etudions, i.e. que leurs actions sur les ^etres mathematiques qui nous servent a les modeliser : T = temperature, E~ = champ electrique, etc: : : Il se peut donc qu'en passant d'un systeme a un autre, ou plut^ot d'une quantite mathematique a une autre, l'action d'un m^eme groupe soit assez radicalement dierente et reserve m^eme des surprises ! Que l'on songe a un condensateur que l'on fait tourner : la charge q de chacune des plaques ainsi que le module du champ entre les plaques restent invariants dans une rotation, alors que le champ electrique (vectoriel), lui, varie ! Les choses se compliquent encore lorsqu'on s'interesse au tenseur d'inertie d'un corps solide et plus encore au spin d'un electron (qui necessite l'introduction d'objets mathematiques appeles spineurs et qui ne sont ni des scalaires ni des vecteurs). Il est important de comprendre que c'est donc moins la rotation elle m^eme (du systeme physique) qui nous interesse que les transformations induites par cette rotation sur les grandeurs mathematiques qui modelisent ledit systeme. Ces transformations induites doivent representer, en un sens que nous preciserons par la suite, les transformations du systeme ainsi que leur algebre. Ce sont elles qui peuvent ^etre dierentes suivant les quantites physiques sur lesquelles elles agissent. Ce qui va nous interesser par la suite est donc moins la structure des groupes de transformations, que les representations de ces transformations | les transformations induites | sur les grandeurs physiques. En fait, la question est plus vaste que cela car le choix m^eme des grandeurs physiques : q = singulet, E~ = (Ex Ey Ez ) = triplet, etc: : : qui, comme nous le verrons, \ne se transforment pas n'importe comment", est deja dicte, pour ce qui est de leur nature matricielle, par la theorie 14: En fait la presence de la matiere (terre, soleil, etc...) en un point donne de l'espace ne vient pas de proprietes speciques de ce point, mais de l'histoire de l'evolution de l'univers qui aurait tres bien pu mettre la terre (et le systeme solaire) ailleurs, sans violer aucune loi de la physique. Il s'agit la aussi d'une brisure spontanee de symetrie: celle de translation.
1
II. Groupes de symetrie et representations
14
de la representation des groupes, ici, dans l'exemple choisi, par celle du groupe des rotations. Nous devrons donc, a la fois, trouver la nature matricielle (singulet, doublet, triplet, etc: : : ) des grandeurs physiques et la facon dont ces grandeurs se transforment.
Nous allons maintenant denir precisement la notion de representation d'un groupe. Appelons g1 et g2 deux elements d'un groupe G (deux rotations du condensateur par exemple) et T (g1) et T (g2) les deux transformations associees a g1 et g2 et agissant sur une quantite physique donnee (E~ = champ electrique du condensateur par exemple). Il est clair que pour que l'ensemble des fT (gi)g representent correctement le groupe G, il faut que la table de multiplication de G soit preservee dans le passage des fgi g aux fT (gi)g, i.e. que la table de multiplication des fT (gi)g doit reproduire celle des fgig 15. En d'autres termes si : =)
g1 suivie de g2 donne g3 T (g1) suivie de T (g2) doit donner T (g3)
soit encore :
T (g2:g1 ) = T (g2):T (g1)
(II -2)
On dit que T est un homomorphisme 16 de groupe, car il envoie un groupe G = fgig sur un autre groupe T (G) = fT (gi)g, en preservant la structure de groupe (attention, on emploie en general le m^eme symbole \." pour la loi de composition de G et de T (G) alors que ces lois n'ont en general rien a voir). On dit alors que les fT (gi)g forment une representation de G et que les quantites qui se transforment par les fT (gi)g (champ, charge, temperature, spin par exemple) engendrent la representation fT (gi )g de G. Si l'on s'arr^etait la, tout cela serait tellement general que l'on ne pourrait pas en deduire grand chose. Heureusement, parmi toutes les representations d'un groupe, il en est qui sont plus agreables que d'autres : ce sont les representations lineaires, i.e. celles qui agissent lineairement sur les quantites physiques qu'elles transforment (voir l'Appendice I). Deux cas peuvent alors se presenter : 1) soit la quantite physique A que l'on etudie possede un nombre ni de composantes, A = (A1 : : : An) (exemple : le champ electrique qui a trois composantes) et alors les T (g) sont des matrices 17 : Ai = Pj &T (g)]ij Aj (exemple : les matrices de rotation 3 3 agissant sur les vecteurs), 15: T exporte donc la structure de groupe des fgi g sur les fT (gi)g. 0
16: Isomorphisme si T est bijectif. 17: En fait, les T (g) sont des operateurs lineaires agissant dans (l'espace vectoriel) Rn (ou C n ), appeles pour l'occasion espace de representation. A ces operateurs sont associees des matrices les representant, une fois fait choix d'une base dans cet espace de representation.
1
II. Groupes de symetrie et representations
15
2) soit A a une innite de \composantes" (ex : un champ A(x)) et alors les T (g) sont des operateurs lineaires. Par exemple, dans une translation a une dimension :
A (x) = A(x + a) = ea dxd A(x) = T (a)A(x) 0
qui est une forme un peu inhabituelle (mais o^ combien importante) de la formule de Taylor. On reverra tout cela en grand detail par la suite 18 . Il n'est peut ^etre pas inutile de noter que la notion de representation n'est pas propre a la theorie des groupes mais est au contraire tres generale. La geometrie analytique, par exemple, releve de la m^eme demarche puisqu'elle consiste a \envoyer" un probleme de geometrie sur un probleme isomorphe d'analyse dans R n . Pour cela, on \ramene l'espace a un repere et on attribue a chaque point des coordonnees", ce qui permet de traduire, i.e. de representer, le probleme initial en un probleme d'analyse 19 . La solution, une fois obtenue par des methodes analytiques, peut ^etre retraduite, en sens inverse, en termes geometriques. L'avantage est bien entendu que l'on dispose dans R n d'un arsenal de techniques bien ma^trisees et surtout intuitivement claires. Comme on procede de la m^eme facon en physique, en representant par des nombres les quantites physiques pertinentes, il est naturel aussi de representer par des nombres | des matrices | les operations de symetrie sur ces quantites. Tout notre travail a venir va consister a chercher les representations lineaires des groupes de symetrie de la nature, rotations, translations et transformations de Lorentz, en vue d'en deduire, dans un deuxi eme temps et par des methodes lagrangiennes, toutes les equations invariantes sous ces groupes (en tous cas les plus simples). Ces equations dites de Dirac, Klein-Gordon, Maxwell, Einstein, seront directement interessantes. Pour l'instant, attaquons nous a un exemple \simple".
18: Voir l'appendice I pour plus de details sur la notion de representation lineaire et non lineaire. 19: Nous sommes aujourd'hui tellement habitues a l'isomorphisme entre notre espace physique et R3 que l'on en oublie combien cette idee d'associer a chaque point de l'espace des coordonnees et de transformer un probleme de geometrie en un probleme de calculs sur R3 a ete une percee non triviale. Il n'est peut ^etre pas mauvais pour cela de voir combien nous avons de mal encore a representer les grandeurs du monde quantique par des operateurs, les nombres qui nous sont si proches n'intervenant plus qu'en une deuxieme etape lors de la prise de valeurs moyennes: : :
III. Le groupe C3v
1 III
16
´ ´ ´ LE GROUPE DE SYMETRIE C3V DU TRIANGLE EQUILAT ERAL y
B
x A
Fig.
C
1.2 - Le choix d'axes Oxy correspond au choix de matrice T (SA) donne en (III -3)
Le groupe de symetrie du triangle equilateral possede six elements : 1) l'identite, 2) les rotations R1 et R2 d'angle 2=3 et 4=3, 3) les trois symetries SA, SB et SC par rapport aux trois hauteurs passant respectivement par A, B et C.
!
I R1 R2 SA SB SC
I I R1 R2 SA SB SC
R1 R1 R2 I SC SA SB
R2 R2 I R1 SB SC SA
SA SA SB SC I R1 R2
SB SB SC SA R2 I R1
SC SC SA SB R1 R2 I
La table de multiplication du groupe est donnee dans la table precedente (la verier et verier qu'il s'agit d'un groupe). On peut prouver qu'il n'y a que trois representations, dites irreductibles, (voir la suite pour une denition) : 1) tous les elements du groupe sont representes par 1. 2) les rotations et l'identite sont representees par 1 et les symetries par ;1. 3) une representation matricielle donnee par :
p ! p ! ; 1 = 2 ; 3 = 2 ; 1 = 2 ) T (R1 ) = p3=2 ;1=2 ) T (R2) = ;p3=2 ;13==22 ! p ! p ! 1 ; 3 = 2 ; 1 = 2 3 = 2 ; 1 = 2 T (SA) = 1 ) T (SB ) = ;1=2 p3=2 ) T (SC ) = ;1=2 ;p3=2 (III -3)
T (I ) = 1 1
!
Il y a donc deux representations de dimension 1 et une de dimension 2. Il est tres instructif de verier que la table de multiplication du groupe est reproduite par chacune des representations.
III. Le groupe C3v
1
17
I. Notion de reductibilite et d'irreductibilite
Une representation fT (g)g d'un groupe G est formee d'operateurs lineaires agissant dans un espace vectoriel L, dit espace de representation (voir la note en page14). Elle est dite reductible s'il existe au moins un sous espace L1 de L, non trivial et laisse invariant par tous les T (g). Si aucun sous espace non trivial n'est invariant, on dit que les T (g) forment une representation irreductible. Si fT (g)g est reductible, alors, par un choix de base approprie dans L, on peut reecrire tous les T (g) sous la forme de blocs : T (g )
=
T1 (g )
0
Q(g ) T2 (g )
!
(III -4)
Si de plus le sous espace L1 , orthogonal a L1 , est lui aussi laisse invariant par tous les T (g) alors par un choix de base approprie on peut toujours prendre Q(g) = 0 pour tout g, si bien que T (g) est diagonal par blocs pour tout g et se reecrit : ?
T (g ) = T1 (g ) T2 (g )
8g
Si fT1 (g)g et fT2 (g)g sont elles m^emes reductibles, i.e. si l'on peut iterer le processus avec fT1 (g)g et/ou fT2 (g)g et que l'on aboutisse a la n a une forme de fT (g)g enti erement diagonalisee par blocs, nous dirons que fT (g)g est completement reductible et que nous l'avons decompose en representations irreductibles. On peut montrer facilement que quand fT (g)g est de dimension nie et unitaire alors L1 est toujours invariant si L1 l'est, si bien que toute representation unitaire est toujours compl etement reductible. Il s'ensuit l'importante consequence suivante (d'autant plus importante que pour les representations de dimension nie, on peut se contenter d'etudier les representations unitaires, voir encadre III, page(34)): ?
Pour les representations unitaires nies, on pourra toujours se contenter d'etudier les representations irreductibles. On voit sur cet exemple un phenomene qui est general : envoyer chaque element du groupe sur le nombre 1 donne une representation, appelee representation triviale. Pour triviale qu'elle soit, cette representation est essentielle. C'est elle qui \transforme" les quantites qui sont invariantes (on dit aussi scalaires) sous le groupe. On peut remarquer aussi que le determinant des matrices de la troisieme representation est la deuxieme representation (pourquoi en est il forcement ainsi? ). La troisieme representation agit bien entendu sur des objets a deux composantes et que l'on nommera vecteurs a deux composantes (du plan Oxy evidemment). Ici, plusieurs remarques de portee generale :
Il y a une innite de choix possibles pour la matrice representant SA par exemple. En fait, pour comprendre cet arbitraire dans le choix de representation matricielle, il faut realiser qu'a
III. Le groupe C3v
1
18
un element g de G, on associe par l'homomorphisme T un operateur lineaire T (g) (un endomorphisme d'espace vectoriel pour ^etre politically correct (voir la note en page14) 20) qui est lui m^eme represente par une matrice une fois fait choix d'une base dans l'espace vectoriel de representation (ici, comme il s'agit de la representation vectorielle, l'espace de representation est (isomorphe a) l'espace de base, si bien que la base dans cet espace peut servir aussi de base de l'espace vectoriel de representation). Ainsi, sans changer l'operateur T (g), on peut changer de matrice associee a T (g) en changeant de base (les autres matrices representant les autres elements du groupe doivent changer de m^eme dans ce cas). Le choix de matrice fait pour representer SA correspond au choix d'axes dessines sur la gure puisque, dans ces axes, SA echange x et y (le verier imperativement ainsi que le fait que ce choix determine toutes les autres matrices).
Exercice : Peut on prendre SA =
1
!
;1 ? Quelles sont les autres matrices de
la representation dans ce cas? A quel choix d'axes d'axes cela correspond il?
Moralite : 1) un changement de choix de matrice representant SA par exemple (pourvu qu'elle reste de determinant ;1) est equivalent a un changement d'axes. Une fois fait choix de ces axes, plus aucun arbitraire ne reste : les matrices representant les autres elements du groupe sont entierement xees. 2) il n'y a donc pas qu'une seule solution pour la representation matricielle 2 2, mais les dierentes solutions sont equivalentes dans le sens qu'elles ne dierent que par un choix d'axes. Deux representations matricielles fT1(g)g et fT2 (g)g de m^eme dimension sont dites equivalentes si l'ensemble de ces matrices se deduisent les unes des autres par un m^eme changement d'axes, i.e. s'il existe une matrice unitaire U realisant le changement de base 21 , telle que pour tout g 2 G:
T2 (g) = U T1 (g) U
;
1
(III -5)
20: Attention, il ne faut pas confondre l'espace de base, ici le plan ane, avec l'espace vectoriel de representation dans lequel agit T . Ces deux espaces n'ont rien a voir et ne sont d'ailleurs pas en general de m^eme dimension. Les espaces de representation pour les trois representations de C3v sont respectivement de dimension 1, 1 et 2. 21: Dans notre cas, ou l'on travaille dans un espace reel, U serait une matrice unitaire reelle, i.e. une matrice orthogonale: t U = U ;1, i.e. encore une matrice de rotation.
III. Le groupe C3v
1
19
On veriera imperativement, et aisement, que (II -2) est preservee comme il se doit dans cette transformation.
Il y a trois sortes de quantites qui se transforment lineairement dans une transformation du
triangle puisqu'il y a trois representations inequivalentes (et irreductibles). Nous les appellerons des scalaires pour la premiere representation, des pseudo-scalaires pour la seconde et des vecteurs pour la troisieme. Exemple : ~ OB ~ AB ~ sont des vecteurs (le verier imperativement), OA 2 ~ est un scalaire, OA ~ ^ OB ~ denie comme (OA)x(OB )y ; (OA)y (OB )x est un pseudo-scalaire (le verier). OA
On peut bien entendu considerer un objet matriciel comme : 0 1 ~ OA X =@ ~ 2 A OA
(III -6)
qui a trois composantes et qui se transforme lineairement sous C3v . Mais cet objet est la reunion totalement articielle, dans un m^eme multiplet, d'un doublet et d'un singulet qui ne se melangeront jamais lors d'une transformation. Les 2+1 composantes de X n'ont donc aucune raison de jouer des r^oles similaires, contrairement aux deux composantes d'un vecteur, condamnees a jouer des r^oles semblables dans toute theorie invariante sous C3v et qu'il est donc naturel de reunir dans un m^eme multiplet. En d'autres termes, si l'on eectue une quelconque des six operations g de symetrie sur le triangle, X va se transformer par D(g) :
X = D(g)X avec D(g) diagonal par blocs pour tout g : 3 ! T ( g ) 0 D= 0 T 1(g) 0
(III -7)
On dit alors que l'ensemble des matrices D(g) forment une representation reductible de C3v . Une representation dont l'ensemble des matrices ne peuvent pas ^etre simultanement diagonalisees par blocs est dite irreductible (voir l'encadre I). Les representations irreductibles sont les seules qui vont nous interesser. Ce sont les briques elementaires de toute construction. On peut prouver assez simplement que les trois representations donnees precedemment pour C3v sont les seules representations irreductibles (a une equivalence pres) de ce groupe, voir l'Appendice II. On voit, sur l'exemple de C3v , se derouler le programme que l'on s'etait xe : trouver les representations irreductibles, c'est a la fois identier les quantites mathematiques qui se transforment lineairement sous le groupe et les matrices qui transforment ces quantites. Pour un
1
III. Le groupe C3v
20
Exercice : La molecule NH3 est une pyramide dont la base triangulaire est formee
par les trois atomes d'hydrogene. Elle possede donc la symetrie C3v . Appelons sa sb sc les orbitales 1s des atomes d'hydrogene et sn l'orbitale 2s de l'atome d'azote. Trouver la representation de C3v de dimension quatre transformant ces orbitales. Montrer qu'elle est trivialement reductible en la somme d'une representation de dimension 1 et d'une representation de dimension 3. Trouver les combinaisons lineaires de sa sb et sc qui permettent de reduire la representation de dimension 3 precedente. (Reponse : s1 = sa + sb + sc, s2 = 2sa ; sb ; sc, s3 = sb ; sc.) groupe ni, le nombre de representations irreductibles est ni (pour plus d'informations, voir l'Appendice II). Par contre, pour un groupe continu comme le groupe des rotations, ce nombre est inni denombrable. Nous allons maintenant construire ces representations.
21
2
CHAPITRE 2
Groupes de Lie – groupes SO(3) et SU(2) Le passage des groupes discrets comme C3V aux groupes continus (innite continue d'elements) comme le groupe des rotations s'accompagne de pas mal de bouleversements quant aux representations de ces groupes et on ne peut pas directement transposer en general aux groupes continus ce qui est valable pour les groupes discrets. Deux grandes categories de groupe se distinguent de ce point de vue, les compacts, pour lesquels le(s) parametre(s) du groupe varie(nt) sur un compact (exemple: les rotations ou l'angle varie entre 0 et 2) et les non compacts pour lesquels il n'en est pas ainsi (exemple: les translations ou les parametres varient sur tout R D , les transformations de Lorentz ou la rapidite varie sur R 3 ). Pour tous ces groupes, la notion de representations irreductibles garde son sens mais leur nombre | toujours inni |, leur unitarite et leur dimension sont non trivials. Les groupes compacts sont ceux qui sont le plus proches des groupes discrets: presque tout se transpose, le nombre inni | discret | de representations irreductibles unitaires etant la dierence majeure. Nous allons voir maintenant en detail ce qu'il en est pour le groupe des rotations. I
´ LE GROUPE DES ROTATIONS ET SES REPRESENTATIONS GROUPES SO(3) ET SU(2)
L'hypothese de l'isotropie de l'espace signie pour nous l'invariance des lois physiques sous le groupe des rotations 1. Comme il l'a deja ete specie auparavant, nous ne connaissons du groupe des rotations que ses manifestations sur les grandeurs { les quantites mathematiques { que nous utilisons en physique. Etudions dans un premier temps la transformation des vecteurs par les rotations. Et d'abord, une remarque. Pour etudier les rotations, on a le choix entre un point de vue \actif " ou un seul observateur observe deux systemes identiques deduits l'un de l'autre par rotation (on tourne le systeme en gardant xes les axes de reference), et un point de vue \passif " ou un m^eme systeme est observe par deux observateurs dierents tournes l'un par rapport a l'autre (on garde xe le systeme et on tourne les axes de reference). C'est, sauf mention explicite du contraire, ce dernier point de vue que nous adopterons dans la suite 2. 1: L'espace est suppose euclidien et a trois dimensions. 2: Notons en passant que pour qu'une theorie physique soit complete, il est necessaire de savoir comment cette theorie, ecrite par un observateur, se transforme en celle ecrite par un autre observateur (point de vue passif).
2
22
I. Le groupe des rotations
A Les vecteurs - alg`ebre de Lie du groupe des rotations
Eectuons, par exemple, une rotation des axes d'angle autour de Oz. Appelons (~e1~e2~e3 ) et (~e1 ~e2 ~e3 ) les \vecteurs" de base des deux systemes d'axes. 0
0
0
V
z
x
y’ y
θ x’
Fig.
2.1 - Rotation (passive) du syst eme d'axes
Par denition, dans le point de vue passif, les vecteurs ne changent pas, seules leurs composantes le font. Ce changement de composantes est donne par 3 : 3 X
i=1
avec (attention aux signes)
X Vi~ei = V~ = Vj ~ej 3
0
(I -1)
0
j =1
0 1 0 sin B@ ~~ee12 CA = B@ ;cos sin cos ~e3 0 0 Par denition de la matrice R, on a donc : 3 X ~ej = Rjk ~ek 0 0 0
10
1
0 ~e1 C B 0 A @ ~e2 C A 1 ~e3
(I -2)
(I -3)
0
k=1
ou, par consequent, j est un indice de ligne et k un indice de colonne. On en deduit :
Vi =
3 X
j =1
Vj Rji = 0
3 X t
( R)ij Vj = 0
j =1
3 X
j =1
(R 1)ij Vj ;
0
(I -4)
car R est une matrice orthogonale (i.e. de rotation) et donc R 1 = t R. On en deduit donc : ;
Vj = 0
3 X
k=1
Rjk Vk
(I -5)
3: Notons que dans le point de vue passif il est dangereux de poser V~ = (V1 V2 V3 ) car on travaille avec deux bases dierentes.
2
I. Le groupe des rotations
23
Les composantes se transforment donc comme les \vecteurs" de base dans une transformation passive 4 . Il va ^etre interessant dans la suite de considerer les transformations innitesimales car, d'une part, elles sont tres simples et plus commodes a manipuler que les transformations nies et, d'autre part, on va montrer que l'on peut reconstruire les transformations nies a partir de ces transformations innitesimales, si bien que l'on pourra, pour tout ce qui suivra, se limiter a ces transformations (voir cependant l'encadre II et la page 32). Prenons par exemple une rotation innitesimale autour de l'axe Oz : 0 1 1 R=B (I -6) @ ; 1 CA 1 et calculons Vi = Vi ; Vi, on trouve : 0
0 1 0
V1 B@ V2 CA = B@ ;
V3 0 : ;i B Jz = J3 = @ i : : :
Appelons alors 5
Vi = i On peut denir de m^eme 6 :
0 1 : : : Jx = J1 = B @ : : ;i CA : i :
4: C'etait evident a priori car
Vi0 = V~ :~ei 0 =
X~ j
3 X
10 1 CA B@ VV12 CA V3 1 : :C A :
(Jz )ij Vj
(I -8)
(I -9)
j =1
0 1 : : i ) Jy = J2 = B @ : : : CA ;i : :
V :(Rij ~ej ) =
(I -7)
(I -10)
X ~ X Rij V :~ej = Rij Vj j
j
Pour une transformation active, les composantes se transforment par la matrice R;1 le montrer. On voit sur cet exemple que les ~ej ne sont pas des vecteurs (pour le groupe des rotations) ! En eet, pour nous un vecteur, pour le groupe des rotations, est, par denition, un objet a trois composantes qui est invariant dans un changement d'axes, alors que bien entendu les axes, c'est a dire les ~ej justement, se transforment. Ceci est particulierement important pour la theorie de la gravitation et conduit prend pas garde. P a pas mal dePconfusions quand on~ n'y 5: On deduit de (I -9) et de (I -11) que Vi = jk k kij Vj = ; jk ikj k Vj = ;( ^ V~ )i . 6: Cette denition se generalise a un groupe continu quelconque : les generateurs Gi sont les derivees des matrices M de transformation par rapport aux parametres i , prises a parametres nuls : Gi = i dM=di j=0 .
2
I. Le groupe des rotations
24
et on aurait les m^emes relations pour les rotations innitesimales autour de Ox et Oy. Remarquons que (Ji)jk = ;iijk (I -11) avec le tenseur totalement antisymetrique, i.e. antisymetrique dans l'echange de n'importe quelle paire d'indices et tel que 123 = +1. Il n'est pas tres complique de retrouver l'eet d'une rotation nie autour Oz a partir de l'expression de la rotation innitesimale car la rotation d'angle est la succession des N rotations d'angle =N considerees comme innitesimales si N ! 1. !N 3 X Vj (I -12) Vi = 1 + i Jz N j =1 ij 0
Or
J lim 1 + i N N z
!N
!1
soit
= eiJz =
X (i )k k (Jz ) k=0 k! 1
R( z^) = eiJz
(I -13) (I -14)
On peut d'ailleurs le verier directement :
eiJz = 1 + i Jz + (i 2) Jz 2 + : : : 0 1 0 1 0 2 1 1 ; =2 ; 2 =2 CA + : : : =B @ 1 CA + B@ ; CA + B@ 1 0 1 0 cos sin B = @ ; sin cos C A 1 2
(I -15)
Les relations precedentes se generalisent pour une rotation autour d'un axe quelconque (ca n'est pas tout a fait trivial) 7 :
R( ~n) = ei~:J~ = ei(x Jx+y Jy +z Jz )
(I -16)
7: Il n'est pas inutile de noter que ceci ne signie pas qu'une rotation de parametre ~ est la composee des trois rotations autour de Ox Oy et Oz d'angles x y et z respectivement car ces trois rotations ne commutent pas entre elles, voir la formule (I -19).
2
25
I. Le groupe des rotations
ou ~ = ~n avec ~n = vecteur unitaire suivant l'axe de la rotation et = angle de la rotation 8. Attention, J~ est un \vecteur" dont chaque composante Ji est une matrice. On a maintenant un resultat qui s'averera tres important pour la suite : l'ensemble des Ji est clos sous l'action du commutateur (le verier en se servant par exemple de I -11)) : &Ji Jj ] = i
3 X
k=1
ijk Jk
(I -17)
par exemple : &Jx Jy ] = iJz . Remarquons que ce ne sont pas des relations lineaires. L'ensemble des trois Ji munis de ces relations de commutation forme l'alg ebre de Lie du groupe des rotations. On appelle constantes de structure du groupe SO(3) les iijk .
Exercice : Il est tres commode, pour certains calculs, d'ecrire Ji sous la forme P Ji = ;i jk ijk jj ihkj avec jii = ~ei . Verier cette relation et retrouver, gr^ace a elle, le commutateur de deux J quelconques.
En resume, on a vu que l'on peut construire n'importe quelle rotation a partir des trois Ji seulement et que ces trois Ji verient une algebre tres simple de commutation. Mais il y a beaucoup plus fort: : : Comme l'ensemble des rotations forme un groupe et qu'une rotation quelconque des composantes d'un vecteur peut s'ecrire exp(i~ :J~), il doit exister, pour chaque ~ et ~ , un ~ tel que : ei~:J~ : ei~ :J~ = ei~ :J~ (I -18) Le calcul de ~ en fonction de ~ et ~ est non trivial et a conduit Hamilton a inventer les quaternions. On ne va pas eectuer ce calcul mais simplement se convaincre de (I -18). La formule suivante dite de Campbell - Hausdor (et pas mal d'autres) : 0
00
0
00
00
0
eAeB = eA+B+ 12 AB]+:::
(I -19)
ou tous les termes suivants, diciles a calculer, s'expriment uniquement en fonction des commutateurs embo^tes de A et B , &A &A B ]] &B &A B ]] &A &A &A B ]]] : : : 8: Remarquons qu'avec le i inclus dans la denition des Jk , R est donnee par une exponentielle complexe. Ce choix de convention est fait pour que les Ji soient des matrices hermitiennes et imaginaires pures : Ji = t Ji et donc antisymetriques. R qui est une matrice orthogonale, i.e. veriant t R = R;1 (R est de determinant 1 et reelle) appara^!t clairement comme telle car t R = ei~: J~ = R;1 . Sous cette forme R ressemble a une phase (ne change pas le module des vecteurs). t
2
26
I. Le groupe des rotations
et le fait que les Ji forment un ensemble clos sous l'action du commutateur, &Ji1 &Ji2 &: : : Jin ]] : : :] / Jj nous montrent que l'equation (I -18) est bien veriee et donc que ~ existe eectivement. Mais on en deduit aussi que ~ = ~ (~ ~ ) est une fonction entierement determinee par les relations de commutation des Ji entre eux et donc que: : : 9 00
00
00
0
Toute l'information sur la table de multiplication du groupe des rotations est codee dans l'algebre de Lie du groupe. On en deduit une consequence tres importante pour la suite. Supposons que nous cherchions les representations en termes de matrices N N du groupe des rotations. Supposons egalement que nous ayons trouve 3 matrices Ji, hermitiennes, N N , veriant la m^eme algebre que les Ji : 3 X &Ji Jj ] = i ijk Jk (I -20) alors l'ensemble des matrices
k=1
D(~ ) = ei~: ~ (I -21) verient obligatoirement la m^eme table de multiplication que les R(~ ) et forme donc une representation unitaire de ce groupe 10 . On en conclut donc l'enorme simplication suivante : J
Pour avoir une representation du groupe des rotations en termes de matrices N N , il faut et il sut d'obtenir une representation de l'algebre de Lie du groupe, i.e. d'avoir 3 matrices N N qui verient les m^emes relations de commutation que celles existant entre les Ji et qui soient hermitiennes. Forts de ce theoreme, nous allons chercher ces representations. Mais avant, un peu de vocabulaire. 1) Le groupe des matrices R(~ ) est appele SO(3). S = special () det R = +1, O = orthogonal reel () R est une matrice de coecients reels veriant t R = R 1 , 3 = R est une matrice 33. ;
9: Ce qui suit est vrai car le groupe des rotations est connexe (quoique non simplement connexe). Ce resultat se generalise a tous les groupes de Lie (connexes). 10: On verra page 32 une petite subtilite a ce propos sur l'exemple de SU (2) et de SO(3).
2
I. Le groupe des rotations
27
2) J1 J2 J3 sont appeles les generateurs innitesimaux du groupe. 3) Les relations de commutation entre les generateurs forment l'algebre de Lie du groupe. 4) J~ 2 = Pi Ji2 commute avec tous les generateurs Jj . On l'appelle l'operateur de Casimir du groupe. On peut montrer que c'est le seul (a un facteur pres) operateur construit avec les Ji qui a cette propriete. On peut en deduire gr^ace a un theoreme, appele le lemme de Schur, qu'il est par consequent proportionnel a l'unite dans chaque representation (mais le facteur de proportionnalite peut dependre { et en fait depend { de la representation). On peut aussi montrer que toutes ses valeurs propres sont de la forme j (j +1) avec j entier. Une representation est donc etiquetee par une valeur de j . 4) Dans un espace de dimension trois, les objets qui se transforment lors d'une rotation par les matrices de SO(3) sont appeles des vecteurs (dans un espace de dimension D le groupe devient SO(D) et un vecteur a D composantes). SO(3) est donc la representation vectorielle du groupe des rotations d'un espace a trois dimensions 11.
Un vecteur pour un physicien est donc bien plus qu'un element d'un espace vectoriel (ce qui est banal et seulement indicatif d'une structure lineaire), c'est un objet qui engendre la representation SO(3) du groupe des rotations (ce qui n'est pas trivial). En fait, tout cela est connu intuitivement par tout le monde : il ne viendrait a l'idee de personne de mettre une %eche sur un nombre reel ou sur une fonction de carre sommable. Ce sont pourtant des elements d'un espace vectoriel (a noter qu'en mecanique quantique, on a une autre notation pour les elements de l'espace de Hilbert des fonctions de carre sommable : les kets). Commencons notre recherche des representations de SO(3) par la ou les representations de dimension 1. On cherche donc des Ji qui soient des nombres reels et qui verient l'algebre 11: Le groupe des rotations est souvent introduit et deni par son action sur les vecteurs position de l'espace euclidien a trois dimensions. Ceci me para^!t pedagogiquement dangereux en physique. En eet, en physique, les positions ne jouent pas forcement un r^ole privilegie : les impulsions peuvent ^etre plus fondamentales, ou les kets d'un espace de Hilbert ou la quadri-position de l'espace de Minkowski ou le tenseur electromagnetique: : : Les vecteurs (position) ne sont qu'un cas particulier parmi d'autres de representation. Le groupe de matrices SO(3) est important non pas tant parce qu'il transforme les positions lors d'une rotation que parce qu'il est le groupe de symetrie correspondant a l'isotropie de l'espace euclidien. Ainsi, le groupe SO(3) garde toute son importance m^eme pour un probleme pour lequel la notion de position n'a aucune pertinence | un champ, un electron delocalise | car il exprime une propriete de l'espace et non du systeme etudie. Nous verrons de plus, lors de l'etude des spineurs, que nous sommes interesses en physique par des quantites qui, a proprement parler, n'engendrent pas une representation de SO(3) et qui pourtant se transforment lineairement par (engendrent une representation de) un groupe cousin de SO(3) (SU (2)) lors des rotations dans l'espace physique.
2
I. Le groupe des rotations
28
de Lie, Eq.(I -20). Comme deux nombres reels commutent toujours, on obtient comme seule solution Ji = 0, soit, pour les \matrices" de la representation : D( ) = exp(i~ :~0) = 1. Donc la seule representation de dimension 1 est la representation triviale 1. C'est la representation engendree par les quantites dites scalaires qui sont invariantes sous les rotations. On veriera que c'est par exemple le cas pour le produit scalaire de deux vecteurs. Continuons par: : : ´ B Representation de dimension deux du groupe des rotations, groupe SU(2), spineurs
On a trouve une representation de dimension 1 et une de dimension trois du groupe des rotations et il n'est pas trivial a priori de savoir s'il en existe de dimension 2. La recette est toujours la m^eme : chercher trois matrices, 22 dans ce cas-ci, qui verient l'algebre de Lie du groupe, Eq.(I -20). Pour respecter les conventions usuelles de notation, nous appelons dans ce cas les generateurs x=2 y =2 z =2. Il est facile d'en trouver : ce sont (une demi fois) les matrices de Pauli que nous notons 1=2 2 =2 3=2 : ! ! ! x = 1 = 1=2 0 1 0 ; i 1 0 y 2 z 3 2 = 2 = 1=2 i 0 2 = 2 = 1=2 0 ;1 1 0 2 2 (I -22) 12 On a en eet
x y z =i 2 2 2
(le 1=2 est important)
(I -23)
et permutations circulaires. n o Les matrices de la representation sont les ei~:~=2 . Or (le montrer) : soit
ei~:~=2 = cos 2 1 + i sin 2 ~n:~
0 (in + n ) sin 1 cos + in sin z x y 2 2 2 C U (~ ) = ei~:~=2 = B @ A (inx ; ny ) sin 2 cos 2 ; inz sin 2
Cette matrice est en fait une matrice generale a coecients complexes de la forme : *!
; U = * avec det U =
* + * = 1 12: Une relation tres commode sur les i :
i j = ij 1 + i
X k
ijk k
(I -24) (I -25)
(I -26)
2
I. Le groupe des rotations
29
L'ensemble de ces matrices est le groupe SU (2) : S : special () detU = +1, U : unitaire () U = U 1 (U =t U* ), 2 : matrice 2 2. y
;
y
On appelle spineurs les objets a deux composantes qui engendrent la representation SU (2) du groupe des rotations, i.e. qui se transforment lors d'une rotation par (voir l'Appendice III) :
! ! ! z z 1 1 ~ z = z ! z = z = U ( ) zz1 2 2 2 0
0
0
(I -27)
Il est important de comprendre que l'aspect spinoriel (ou vectoriel ou tensoriel) d'un doublet (respectivement d'un triplet ou d'un n-uplet) ne se manifeste que lorsqu'on eectue une rotation. Par exemple, n'importe quel triplet de nombres peut representer les composantes d'un vecteur dans une base donnee : pour savoir s'il s'agit bien d'un vecteur, il faut le transformer dans une rotation. Il en va de m^eme bien entendu pour un spineur qui peut ^etre n'importe quel doublet de nombres complexes. Notons un fait remarquable : alors que les matrices de SO(3) sont reelles, celles de SU (2) sont en general a coecients complexes. Ceci implique que si un observateur associe a une grandeur physique spinorielle un doublet (z1 z2 ) de nombres reels, un autre observateur tourne par rapport au premier, associera en general a la m^eme grandeur un doublet (z1 z2 ) complexes. En d'autres termes, contrairement aux vecteurs, la condition de realite des composantes d'un spineur n'est pas stable par rotation. Et maintenant une question meta - physique. Pourquoi la physique classique n'emploiet'elle pas de spineurs et pourquoi la mecanique quantique le fait elle? Sans pretendre que cela reponde entierement a la question, on consultera a ce propos avec prot l'encadre IV, page 53. 0
0
Notre construction precedente nous assure par avance que les tables de multiplication de SU (2) et SO(3) sont identiques. Etablissons explicitement l'homomorphisme envoyant SU (2) sur SO(3). C
Construction de la relation SO(3) - SU(2)
Commencons par quelques remarques preliminaires : l'ensemble M des matrices M , 22, hermitiques (M = M ) et de trace nulle est isomorphe a R 3 . En eet, la parametrisation generale d'une telle matrice est : y
M = x +z iy x ;;ziy avec x y z reels.
!
(I -28)
2
30
I. Le groupe des rotations
une base de l'espace a quatre dimensions des matrices 2 2 est =(12, 1 2 3) avec
= 0 1 2 3. Dans cette base M s'ecrit : M = M (~x) = ~x:~ = x 1 + y 2 + z 3 (I -29) Le produit scalaire dans cet espace est 1=2 fois la trace et les sont orthonormees pour ce produit scalaire (le verier) : 1 Tr( ) =
(I -30) 2P On en deduit evidemment que si N = N alors N = 1=2 Tr(N ). le determinant de M est l'oppose du carre scalaire de ~x : det M = ;(x2 + y2 + z2 ). Forts de ces preliminaires, nous pouvons nous attaquer a notre probleme. L'idee est d'associer a une transformation U 2 SU (2) agissant sur les matrices M (~x) la transformation RU 2 SO(3) ainsi induite sur les vecteurs ~x associes aux matrices M (~x), Eq.(I -29). Si l'application U ! RU est un homomorphisme, nous aurons alors etabli que SO(3) est une representation de SU (2). Il n'y a pas une foule de choix possibles pour transformer par SU (2) une matrice hermitique de trace nulle en une autre matrice hermitique de trace nulle. Appelons RU l'application de M dans M qui est telle que : M ! M = RU (M ) = UMU 1 avec U 2 SU (2) (I -31) On peut verier que M est 1) hermitique : M = (UMU ) = M et 2) de trace nulle : TrM = Tr(UMU 1 ) = TrM = 0 par cyclicite de la trace. On en deduit que M 2 M et que par consequent elle s'ecrit : M = ~x :~ . Comme M et 3 R sont isomorphes, on peut continuer a appeler RU la transformation qui envoie ~x sur ~x : ~x = RU (~x): Or il est trivial que det M = ;~x 2 puisque M 2 M, et que RU conserve le determinant : det M = det(UMU 1 ) = det M: Donc ~x 2 = ~x 2 et par consequent RU est une rotation : RU 2 SO(3) 13. On a de plus : RU :RV (M ) = U (V MV 1)U 1 = (U:V )M (U:V ) 1 = RU:V (M ) (I -32) et donc l'application qui envoie U 2 SU (2) sur RU 2 SO(3) est un homomorphisme. On a ainsi montre directement que SO(3) est une representation de SU (2). 0
;
0y
0
0
y
y
0
;
0
0
0
0
0
0
0
0
0
;
0
;
;
;
13: En toute rigueur, il faudrait encore montrer que son determinant est positif, sinon il pourrait s'agir d'une re#exion. On peut soit le faire par calcul direct soit se contenter de l'argument suivant qui contient l'essentiel : on peut passer contin^ument de la matrice 12 a U = exp(i~:~ =2) en faisant varier contin^ument ~. Ce faisant, on passe contin^ument de RU (12) = 13 a RU (~) = RU . Or det 13 = 1 et par consequent det RU = +1 aussi.
2
I. Le groupe des rotations
31
II. Topologie | Groupe de recouvrement
La notion de continuite d'une representation est fondamentale. L'idee en est simple. Pour le groupe des rotations par exemple (et il en ira de m^eme de facon \generale" pour les groupes ayant une innite continue d'elements), on voit que l'espace des parametres ~ est un domaine de R3 sur lequel on peut denir une notion de continuite (contrairement aux groupes discrets). On souhaite evidemment qu' a deux rotations de param etres ~ et ~ proches correspondent des elements du groupe g(~) et g(~ ) ainsi que des representants T (g(~)) et T (g(~ )) qui soient proches. La structure qui permet de denir la notion de continuite de facon generale est celle de topologie. Nous n'entrerons pas dans les details car il sut de savoir que pour les groupes qui nous interesseront, on peut induire une topologie sur le groupe a partir de celle de l'espace des param etres qui, etant un sous ensemble de Rn , nous est assez famili ere (boules ouvertes de Rn ). Prenons comme exemple l'espace des param etres de SO(3). L'idee est qu' a chaque vecteur ~, on peut associer un point d'une boule qui est l'extremite de ce vecteur (tous les vecteurs partant du centre de la boule). Etant donne que R( + ~n) = R( ; ;~n), le rayon de cette boule est , toute rotation d'angle superieur a etant egale a une rotation d'angle inferieur a autour de la direction opposee. Mais on doit encore faire attention car les points diametralement opposes sur la surface de la boule doivent ^etre identies puisqu'ils correspondent a la m^eme rotation : R( ~n) = R( ;~n). Finalement, l'espace des param etres de SO (3) est une boule de rayon dont les points diametralement opposes sur la surface sont identies. Cet espace est connexe mais non simplement connexe car un chemin partant d'un point interieur a la boule arrivant sur la surface et repartant depuis le point diametralement oppose pour revenir a son point de depart ne peut pas ^etre contin^ument deforme pour ^etre ramene a un point (c'est ce qui arrive aussi lorsqu'il y a un trou dans une surface et qu'on dessine un chemin ferme entourant le trou). Or l'alg ebre de Lie, obtenue par developpement limite au voisinage de l'identite (le centre de la boule), n'est sensible qu' a la structure locale du groupe et non a sa structure globale. Une representation de l'alg ebre de Lie d'un groupe G peut donc fournir par exponentiation une representation (continue) T (G) du groupe G qui s'av ere ^etre multiplement valuee si G et T (G) n'ont pas la m^eme topologie. C'est la raison pour laquelle, si l'on ne veut pas abandonner la notion de continuite d'une representation, on est amene a associer, Eq.(I -31), a une m^eme matrice R de SO(3) (doublement connexe), deux matrices U et ;U de SU (2) (simplement connexe). Verier en eet gr^ace a (I -25) que le chemin partant du centre de la boule et y revenant en augmentant contin^ument de 0 a 2 a comme image un chemin dans SU (2) partant de 1 et arrivant a ;1. On peut montrer de facon generale deux theor emes : 1) Un groupe n-connecte peut au plus avoir des representations n-valuees. 2) Pour tout groupe multiplement connexe G, il existe un unique plus \petit" groupe simplement connexe G qui a la m^eme alg ebre de Lie (aucun sous groupe de G n'est homomorphe a G). G est dit groupe de recouvrement universel de G. Pour G = SO(3), = SU (2). Pour G = SO(3 1), G = SL(2 C ), voir la suite. G 0
0
0
Mais attention, la reciproque est fausse car cette representation n'est pas dele (i.e. ca n'est pas un isomorphisme) et donc l'homomorphisme inverse n'existe pas 14 . En eet, aux matrices 14: Notons que si deux groupes sont isomorphes l'un de l'autre, ils sont des representations (dites deles) l'un de l'autre et il est indierent de chercher les representations de l'un plut^ot que de l'autre : ce sont les m^emes.
2
I. Le groupe des rotations
32
U et ;U est associee la m^eme matrice RU : RU = R U . Dit autrement, l'application \inverse" de SO(3) dans SU (2) est bivaluee et donc SU (2) n'est pas une representation de SO(3). Peut-on remedier a cela et construire un isomorphisme de SO(3) dans SU (2)? Non, si l'on veut conserver la continuite de la representation (U ! RU ) car un tel isomorphisme (appele homeomorphisme s'il est continu dans les deux sens) est un morphisme de topologie, et ne peut donc exister qu'entre des espaces topologiquement equivalents. Or SU (2) est simplement connexe alors que SO(3) l'est doublement, si bien que ces espaces ne sont pas topologiquement equivalents (voir l'encadre II). Nous verrons dans la suite que ces considerations ne sont pas qu'arguties mathematiques mais ont des implications physiques importantes. Tout vient du fait que ;U ( ~n) = U ( + 2~n) (voir Eq.(I -24)) et donc, alors qu'une rotation de 2 ne peut pas se distinguer de pas de rotation du tout pour des vecteurs, il n'en est pas de m^eme pour des spineurs. Notre intuition, basee sur un \monde classique" ou les spineurs n'interviennent pas, nous trompe sur ce point. Pour un spineur, c'est une rotation de 4 qui est equivalente a pas de rotation, cf. Eq.(I -24) 15. Il est facile, a partir de ce qui precede, de construire explicitement RU en fonction de U : X (I -33) xi = 21 Tr(M i ) = 12 Tr(~x:U~ U 1 i ) = 12 Tr(U j U 1 i)xj j or x = P R x (l'indice U de R n'a pas ete rappele) si bien que : ;
0
i 0
j ij j
0
;
;
U
Rij = 21 Tr( i U j U 1 )
(I -34)
;
Prenons un cas particulier : la rotation d'angle autour de Oz. i=2 ! e U ( z^) = eiz =2 = e i=2 D'apres la formule (I -34), on trouve : 0 1 cos sin 0 R=B @ ; sin cos 0 CA = eiJz 0 0 1 ;
(I -35)
(I -36)
15: Dans un espace de dimension deux, on peut construire des \compteurs des rotations" qui marchent modulo des multiples de 2 aussi grands que l'on veut. C'est ce que fait une montre a aiguilles qui est un compteur des rotations planes marchant modulo 12 fois 2. Ceci vient du fait que le groupe de recouvrement de SO(2) est Z et que l'homomorphisme de SO(2) dans Z est par consequent inniment value. Par contre, pour SO(3), on peut montrer que l'on ne peut pas construire de \compteur de rotations" dans l'espace de dimension trois qui fonctionne modulo plus que 4. En d'autres termes une machine quelconque faite de celles, de poulies, d'engrenages, etc: : : capables de mesurer des rotations dans l'espace est obligatoirement telle qu'au bout d'une rotation de 4 elle est revenue a son etat initial. Joli, isn't it?
2
II. Vecteurs, spineurs, tenseurs et generateurs
33
qui est, comme on pouvait l'esperer, R( z^). Nous allons maintenant etudier deux points importants. D'abord nous ferons une etude succincte de certaines proprietes generales des representations du groupe des rotations et nous verrons comment se transforment les spineurs. Ensuite nous ferons une courte revue du cas quantique et de l'utilisation des spineurs en mecanique quantique. II
´ DAVANTAGE SUR LES REPRESENTATIONS DU GROUPE DES ´ ERATEURS ´ ROTATIONS : VECTEURS, SPINEURS ET GEN
A
Les repr´esentations de SU(2)
Nous allons montrer comment, a partir d'un spineur et de SU (2), on peut generer toutes les representations de SU (2). A vrai dire, nous ne prouverons pas que nous les obtenons toute ainsi, bien que ce soit le cas. On peut de facon generale montrer, au moins en principe, comment on peut construire toutes les representations des groupes de Lie compacts, mais cela necessite pas mal de travail et est au dela du but assigne a ces notes. Considerons donc un spineur de composantes ( ). Formons la quantite a v + 1 composantes : T (v+1) = ( v v 1: : : : :v 1 v ) (II -37) On va montrer que T (v+1) engendre une representation lineaire du groupe SU (2), i.e. que les transformations de SU (2) sur ( ) induisent sur T (v+1) des transformations lineaires qui forment une representation de SU (2). Pour cela appliquons U a ( ) et calculons la transformation de Ti(v+1) = v i:i : ;
;
;
v * )v i :( + *)i = X Sik(v+1) v k :k T (iv+1) = v i: i = ( ; k=0 X (v+1) (v+1) = Sik Tk 0
0
;
0
;
;
k
(II -38)
Donc la transformation des composantes de T est lineaire et il est immediat de verier que les matrices S (v+1) (U ) forment une representation de SU (2), i.e. que la composee de deux transformations U1 et U2 de SU (2) induit une transformation sur les Ti qui est la composee des deux transformations S (v+1) (U1 ) et S (v+1) (U2 ). Les T (v+1) engendrent donc des representations de SU (2) a v +1 dimensions et ce quelque soit v. Telles quelles, les S (v+1) ne sont pas unitaires, mais il est facile de les rendre unitaires. Au lieu de T , considerons Q de composantes : j +m j m Q(mj) = q : (j + m)!(j ; m)! ;
(II -39)
2
II. Vecteurs, spineurs, tenseurs et generateurs
34
III. Groupes de Lie | Compacite
Cet encadre va presenter des resultats generaux dont on se servira non seulement pour le groupe des rotations mais aussi pour le groupe de Lorentz. Un groupe continu, i.e. qui n'est pas discret, est dit topologique si sa loi de composition interne ainsi que l'inversion sont des applications continues (i.e. si g est proche de g2 alors g1 g est proche de g1 g2 et g 1 est proche de g2 1). Un groupe topologique est dit compact si l'espace de ses parametres est compact, i.e. ferme et borne. Un groupe topologique est dit groupe de Lie si tous les parametres a1 a2 : : : an de l'espace des parametres sont essentiels, i.e. aucun d'eux n'est fonction des autres, et si ci = ci(a1 : : : an b1 : : : bn) et di = di(a1 : : : an) denis par g3(fcig) = g1(faj g):g2(fbk g) et g1 1 (fai g) = g4 (fdj g) sont des fonctions analytiques de leurs arguments. C'est ce qui arrivera en pratique dans la suite et nous n'aurons aaire qu'aux groupes de Lie. Deux theoremes seront importants pour la suite : 1) Pour les groupes de Lie compacts, on peut prouver que dans chaque classe de representations equivalentes il y a une representation unitaire, toute representation unitaire est completement reductible, toute representation irreductible est de dimension nie. 2) Pour les groupes non compacts, on peut prouver que toutes les representations continues d'un groupe semi-simple sont completement reductibles (c'est en fait vrai independamment de la compacite du groupe), toutes les representations unitaires autres que la (ou les) representation(s) de dimension un sont de dimension innie. Le premier theoreme nous permet pour les groupes compacts, le groupe des rotations en particulier, de ne nous interesser qu'aux representations irreductibles, de dimension nie, unitaires et inequivalentes. Le second theoreme nous assure que pour le groupe de Lorentz qui est non compact, ce n'est que dans l'espace de Hilbert qui est de dimension innie que l'on pourra avoir des representations unitaires (et donc qui conservent la norme des vecteurs d'etats), cf. le theoreme de Wigner. ;
;
;
ou on a deni j = v=2 et m peut prendre les valeurs entre ;j m +j par saut de une unite (la representation est donc de dimension 2j + 1). j prend donc toutes les valeurs positives entieres ou demi entieres. Les matrices (unitaires, le verier) qui transforment les Q(j) sont appelees les Dj . On peut montrer que l'ensemble des Dj quand j varie, forme l'ensemble de toutes les representations unitaires irreductibles et inequivalentes de SU (2). Lorsque j est entier, ces representations forment aussi l'ensemble des representations de SO(3). Lorsque j est demi entier, il s'agit de \representations" bi-valuees de SO(3).
2
II. Vecteurs, spineurs, tenseurs et generateurs
35
On voit donc qu'a partir des spineurs, on peut construire toutes les autres representations. On pourrait montrer que, comme on s'y attend, les Dj (~ ) peuvent s'ecrire pour tout j
Dj (~ ) = ei~: ~
(II -40)
J
avec les trois Ji des matrices hermitiques (2j + 1) (2j + 1) qui verient l'algebre de Lie de SO(3). On pourrait egalement montrer que J~ 2 est toujours proportionnel a l'identite avec un facteur de proportionnalite j (j + 1) et que Jz a comme valeur propres m prenant toutes les valeurs entre ;j et +j par saut de une unite. Nous avons ainsi atteint notre but pour le groupe des rotations qui etait de trouver toutes les representations irreductibles et unitaires de ce groupe. Nous verrons dans la suite que l'on peut de facon absolument equivalente engendrer toutes les representations du groupe des rotations par produit tensoriel de la representation (spinorielle) 2 2, ce qui est tres important pour la mecanique quantique lorsque l'on compose des spins. Mais avant, nous avons encore besoin de voir une petite subtilite plus facile a comprendre sur l'exemple des vecteurs que sur celui des spineurs. Et d'abord, commencons par quelques modestes theoremes. B
` La convention d’Einstein et quelques menus th´eoremes
Nous adopterons dans toute la suite la convention d'Einstein qui consiste a sous entendre
le symbole de sommation lorsque dans un m^onome un indice de sommation gure deux fois. En clair, ceci signie que Ai Bi signie, sauf mention explicite du contraire, Pi Ai Bi. L'inter^et de cette convention vient de ce que lorsque l'on utilise a haute dose l'algebre lineaire (ou multilineaire), un indice repete deux fois est toujours, sauf cas exceptionnel, un indice muet de sommation. Des lors, il est plus simple d'inverser les conventions usuelles : on ne met rien quand il y a sommation et au contraire on indique explicitement quand il n'y a pas sommation (avec des mots ou avec un symbole special laisse a l'imagination de chacune). Ceci n'entra^ ne jamais de confusion. Exemple :
Ai Bk Ck Dij Ml =
X ik
AiBk Ck Dij Ml = Ai Dij (B~ : C~ )Ml
Nous avons vu au chapitre precedent que : M = UMU 1 = ~x:(U~ U 1 ) = ~x :~ = (RU ~x):~ 0
soit en composantes
;
X i
;
xi U i U 1 = ;
0
X ij
Rjixi j
2
II. Vecteurs, spineurs, tenseurs et generateurs
36
soit en manipulant un peu cette equation, en utilisant la convention d'Einstein et comme ceci est vrai pour tout vecteur ~x : U 1 i U = Rij j (II -41) ;
Une relation analogue existe pour les Ji : R 1 JiR = Rij Jj ;
(II -42)
On peut prouver directement cette relation, mais nous allons nous contenter de montrer qu'elle se reduit pour les transformations innitesimales a l'algebre de Lie de SO(3). C'est elementaire si l'on se souvient de la note en bas de la page 23. En eet, on a d'une part
Rij Jj = Ji ; ikj d k Jj et d'autre part
R 1 JiR = (1 ; i d~ :J~)Ji(1 + i d~ :J~) = Ji + i d k &Ji Jk ] = Ji ; ikj d k Jj ;
(II -43)
qui est donc bien la m^eme chose. Les relations (II -41) et (II -42) sont en quelque sorte les formes integrees des algebres de Lie de SU (2) et SO(3) respectivement. Nous allons voir au chapitre suivant la signication de ces relations et nous verrons toute leur importance dans le cadre quantique. C Base et coordonn´ees sph´eriques - Op´erateurs vectoriels
Nous allons maintenant voir que des operateurs lineaires peuvent avoir un caractere tensoriel par rapport aux rotations. Ceci sera particulierement important dans le cadre quantique ou les grandeurs physiques sont representees par des operateurs. Nous allons raisonner sur les generateurs des rotations qui, comme nous allons le montrer, forment un operateur vectoriel. La generalisation a d'autres operateurs ne posera pas de probleme. Par souci de clarte, appelons B l'espace de base, euclidien, minkowskien, etc: : : et R l'espace de representation (voir la note 17, page 14 et l'encadre I). Bien entendu, il y a autant d'espaces de representation que de representations et l'on devrait donc indicer ces espaces. Dans la pratique, il n'y aura jamais de confusion possible et nous omettrons cet indice. Pour la suite, il sera important de bien faire la distinction entre, d'une part, les operateurs lineaires qui representent les elements du groupe et, d'autre part, les matrices representant ces
2
II. Vecteurs, spineurs, tenseurs et generateurs
37
operateurs une fois fait choix d'une base dans l'espace vectoriel R de representation. Il se peut donc, et c'est en fait frequent, que des operateurs dierents soient representes par les m^emes matrices car les bases de R dans lesquelles sont evalues ces operateurs sont dierentes. Ainsi, nous pouvons tres bien considerer les generateurs des rotations autour de deux systemes d'axes de B dierents et evaluer les matrices les representant dans deux bases de R telles que ces matrices soient identiques. Il s'agit donc d'^etre prudent et de savoir ce que l'on fait. Pour lever toute ambigu!te, nous noterons, lorsqu'il y a possibilite de confusion, les matrices par la m^eme lettre que les operateurs mais en indiquant explicitement en exposant la base de projection choisie dans R. En regle generale, les espaces B et R n'ont rien a voir et ne sont m^eme pas de m^eme dimension. L'exception est le cas vectoriel ou ces deux espaces sont isomorphes si bien qu'on les confond la plupart du temps en physique pour cette raison (on represente par exemple sur un m^eme dessin position, vitesse, force, etc... alors que ces quantites ne peuvent pas ^etre additionnees et n'appartiennent donc pas au m^eme espace vectoriel). Nous verrons sous peu, dans le cadre quantique en particulier ou l'espace de representation est l'espace (complexe) de Hilbert des etats, que, m^eme dans le cas vectoriel, la distinction entre ces deux espaces n'est pas inutile. Introduisons d'emblee les notations qui seront commodes dans le formalisme quantique et notons par des kets fj ig une base choisie dans R et par des bras la base duale : j i = tj *i = h j y
Ainsi, pour le cas spinoriel, une base commode dans R est evidemment celle dans laquelle les generateurs de SU (2), xyz =2, sont representes par une demi fois les matrices de Pauli 123=2. Nous noterons (z) cette base : fj+ zi j; zig: (II -44) C'est evidemment celle ou 3 est diagonale: 3 j zi = j zi, + j+ zi = 0 +j; zi = j+ zi ou + = 1=2 ( 1 + i 2 ). De m^eme, dans le cas vectoriel, nous noterons en cas de besoin fjeiig la base canoniquement associee aux axes f~eig et que nous avons jusqu'a maintenant confondue avec elle. Nous allons maintenant montrer que les relations (II -41,II -42) ont une interpretation tres simple. La generalisation de ces relations permet de denir la notion d'operateurs tensoriels irreductibles dont la transposition au cas quantique s'avere tres importante puisqu'elle permet de montrer le theoreme de Wigner-Eckart. Les calculs qui vont suivre ont comme seul but de montrer que la relation (II -41) est l'analogue pour les generateurs de SU (2) du fait suivant, typique des vecteurs ordinaires : si l'on tourne un vecteur ~v en R~v et que l'on tourne en m^eme temps la base f~eg en fR~eg, alors le nouveau vecteur a les m^emes composantes sur la nouvelle
2
38
II. Vecteurs, spineurs, tenseurs et generateurs
base que l'ancien sur l'ancienne base. Cette propriete etant vraie pour les generateurs de SU (2) | c'est le sens de la relation (II -41) | on dit qu'ils forment un operateur vectoriel. Cette notion se transpose a d'autres operateurs que les generateurs veriant une relation analogue a (II -41), voir la suite. Montrons maintenant qu'il en est bien ainsi.
Exercice : On pose i = U 1 i U avec U une matrice de SU (2). Montrer que les i 0
;
0
sont hermitiques et verient la m^eme algebre de Lie que les i . Adapter ce calcul au cas des Ji. De l'exercice precedent, on deduit que les operateurs primes sont des generateurs tres acceptables et l'on s'attend par consequent a ce qu'ils soient les generateurs de \rotation" de SU (2) autour d'axes ~ei a determiner. On peut voir qu'il en est bien ainsi par le raisonnement suivant. Considerons une matrice generique de SU (2) qui s'ecrit : 0
V = eiii =2 les 123=2 etant les matrices representant, dans SU (2), les generateurs des \rotations" par rapport aux axes f~eig. La base choisie dans R est entierement xee par le fait qu'il s'agit des matrices de Pauli et est la base (II -44). V est evidemment la matrice representant, dans la base (II -44), la rotation de parametres ~ = i~ei dans l'espace de base. Considerons maintenant les matrices i = U 1 i U = Rij j ou U est une matrice quelconque de SU (2) et R = RU est la matrice de SO(3) associee a U , Eq.(I -34), ainsi que le systeme d'axes f~ei g = fR~eig de l'espace de base B. On a donc deux bases f~eig et f~ei g dans B et une seule fj zig dans R. Dans cette base le vecteur ~ a comme composantes : i = Rij j . Comme R est orthogonale, R 1 = t R, on a alors evidemment i i = i i = ~ :~ 0
;
0
0
0
;
0
et par consequent
0
V = eii i=2 : Cette relation s'interprete simplement: V est toujours la matrice \representant" dans la base fj zig la rotation de parametres ~ mais exprimee en fonction des generateurs des rotations autour des ~e i. C'est la relation que l'on ecrirait si l'on avait choisi les fR~eig comme axes autour desquels sont eectuees les rotations dans B, tout en conservant l'ancienne base propre fj zig de ez | et non de ez | dans R. Les matrices i =2 sont donc les matrices associees aux generateurs des \rotations" de SU (2) autour des fR~eig evalues dans la base (II -44). Il en va de m^eme pour les Ji denis par Ji = 0
0
0
0
0
0
0
2
II. Vecteurs, spineurs, tenseurs et generateurs
39
Rij Jj = R 1JiR qui sont les generateurs des rotations autour des nouveaux axes, les R~ei, evalues dans l'ancienne base, les ~ei (ou plus exactement les jeii). Le sens de (II -42) est donc : (e) JRe = Rij Je(je) = R 1Je(ie) R (II -45) i ;
;
ou l'indice indique l'axe (de B) autour duquel l'operateur est le generateur et l'exposant la base (de R) dans laquelle est evaluee la matrice. De m^eme pour les i : (z) Re = Rij e(zj ) = U 1 e(zi ) U i
(II -46)
;
ou (z) signie la base fj zig. On peut faire encore un peu mieux en eectuant, en plus du changement d'axes de rotation, un changement de base dans R pour prendre a chaque fois la base de R \naturellement associee" au systeme d'axes de B. Cela consiste dans le cas SU (2) a prendre dans R la base prope de (Re) ez et dans celui de SO(3) la base fRjeig. Nous allons ainsi montrer que les matrices JRe i representant les JRei dans la base fRjeig sont identiques aux matrices Je(ie) representant les Jei dans la base fjeig. Dans les notations precedentes, on a : 0
1 (e) (e) R Jei R jk = JRei jk = hej jJRei jek i = Rlj Rmk hel jJRei jemi (Re) = R 1 JRe R jk i
(II -47)
(Re) Je(ie) = JRe i
(II -48)
;
0
0
;
et donc
L'exact analogue de cette relation existe evidemment aussi pour le cas spinoriel avec les i (le montrer). Par consequent, on peut interpreter les relations (II -41,II -42) en disant qu'un changement d'axes de rotation (dans B) | terme Rij Jj ou Rij j | est matriciellement exactement compense par un changement de base dans R | terme R 1Ji R ou U 1 iU . Tout compte fait, la relation (II -41) exprime le fait rassurant, et seul compatible avec l'invariance par rotation, que quel que soient les axes Oxyz, on peut toujours choisir les matrices de Pauli 123 =2 pour representer les generateurs xyz =2 de SU (2) suivant ces axes a condition de prendre (II -44) comme base dans l'espace de representation, i.e. de prendre la base propre de z (m^eme interpretation pour SO(3)). S'il n'en etait pas ainsi, on pourrait, par simple examen des matrices representant les generateurs, savoir autour de quels axes sont eectuees les rotations et par consequent mettre en evidence de facon absolue son orientation dans l'espace. ;
;
2
II. Vecteurs, spineurs, tenseurs et generateurs
40
Si l'on examine attentivement tous les calculs precedents, on s'apercevra que l'on peut en denitive traiter les generateurs des rotations comme des vecteurs ordinaires pour ce qui est du changement d'axes de rotation. On appelle pour cette raison, les Ji et les i des operateurs vectoriels. On verra dans le cas du groupe de Lorentz que la aussi l'ensemble des generateurs a un caractere tensoriel. En fait, l'histoire ne s'arr^ete pas la. Alors que la relation (II -41) donne la transformation la plus generale des i qui 1) preserve l'hermiticite des i et 2) preserve l'algebre de Lie de SU (2), il n'en est pas de m^eme pour la relation (II -42) car on pourrait choisir les R unitaires et non pas seulement orthogonales reelles. Les
Ji = N 1 JiN 0
;
(II -49)
avec N unitaire sont de tres bons generateurs de SO(3) 16. On a maintenant :
Je(iNe) = t N Je(ie) t N y
(II -50)
ce qui correspond a un changement de base dans un espace de representation complexe cette fois. A quoi tout cela sert-il? D'abord, il faut realiser qu'en mecanique quantique, l'espace de representation, en fait l'espace de Hilbert des etats, est eectivement complexe. Ensuite on est souvent interesse a se placer dans la base ou J~ 2 et Jz sont diagonaux, ce qu'ils ne sont pas dans la base des jeii, cf. Eq.(I -8). En fait, J~ 2 est comme on s'y attend proportionnel a l'identite et vaut, comme on peut facilement le verier explicitement 17 : (II -51) J~ 2 = 2:1 La (petite) subtilite que l'on rencontre ici est que Jz ne peut pas ^etre diagonalisee avec seulement une matrice orthogonale 18, le changement de base qui la diagonalise est obligatoirement de type (II -49) avec N donnee par : p 1 0 p ; 1=p 2 ;i=p2 0 N =B (II -52) @ 1= 2 ;i= 2 0 CA 0 0 1 Dans cette nouvelle base, on a d'apres (II -50) : 0 1 1 Jz(Ne) = B (II -53) @ ;1 CA 0 16: Evidemment, dans ce cas, on ne peut plus avoir N ;1 J^i N = Nij J^j car alors les Nij devraient ^etre reels (le montrer), ce qui n'est le cas que si les N sont des matrices de SO(3). 17: On peut verier egalement tres simplement que dans la representation spinorielle ~ 2 =4 est egalement proportionnel a l'identite avec un facteur de proportionnalite egal a 3/4. 18: Si Jz etait une matrice hermitique reelle alors elle serait diagonalisable par une matrice orthogonale.
2
II. Vecteurs, spineurs, tenseurs et generateurs
41
et l'on retrouve le fait bien connu que pour la representation j = 1, Jz a comme valeurs propres ;1 0 +1. Cette base est appelee la base spherique. Les coordonnees (et les vecteurs de base) y sont reliees a celles de la base cartesienne par 8 1 (V + iV ) > p V = ; > + y > < 2 x (II -54) > V = p12 (Vx ; iVy ) > : V0 = Vz ou jV i = Vxjexi + Vy jey i + Vz jez i = V+je+i + V je i + V0je0i (II -55) ;
;
;
et je+ 0i sont respectivement les vecteurs de base de la base spherique, i.e. la base propre, avec les valeurs propres +1 ;1 0. ;
D
Les tenseurs - produit tensoriel de repr´esentations
Nous allons voir qu'il existe une facon dierente de ce que nous avons vu jusqu'a maintenant de generer les representations a partir de \produits" de representations de dimension inferieure. C'est la notion de produit tensoriel, si important en mecanique quantique, qui fournit l'outil approprie. Et d'abord qu'est ce qu'un tenseur et qu'un produit tensoriel au sens de l'algebre lineaire (et non au sens de la theorie des groupes)? C'est l'extension la plus simple a laquelle on puisse penser de la notion de vecteurs. E1 et E2 etant deux espaces vectoriels de dimension d1 et d2 et ayant comme base fje1i ig et fje2j ig respectivement, on denit le produit tensoriel E1 E2 de ces espaces comme l'espace vectoriel de dimension d1d2 engendre par la base fje1i i je2j ig. Un vecteur de cet espace se decompose en :
jvi = vij je1i i je2j i
(sommation sous - entendue)
(II -56)
Lorsqu'un vecteur w est le produit tensoriel de deux vecteurs : jwi = jai jbi de E1 et E2 alors wij = aibj . Cependant, en general, un vecteur de l'espace produit est une somme de produits tensoriels. Le produit tensoriel est par denition lineaire pour chacun des espaces E1 et E2 : (jai + ja i) jbi = jai jbi + ja i jbi et idem pour les vecteurs de E2. La simplicite de la notion de produit tensoriel vient de ce que l'on peut denir naturellement le produit tensoriel de deux operateurs lineaires A et B agissant dans E1 et E2 par : 0
0
(A B ) (jai jbi) = (Ajai) (B jbi) = Aij aije1j i Bkl bk je2l i
(II -57)
2
II. Vecteurs, spineurs, tenseurs et generateurs
42
A B est encore lineaire dans E1 E2 et doit donc pouvoir se representer matriciellement dans cet espace. Si l'on range conventionnellement les d1d2 composantes de jai jbi dans l'ordre suivant: (a1 jbi : : : ad1 jbi) = (a1 b1 a1b2 : : : a1bd2 a2b1 : : : ad1 bd2 ) alors la matrice representant A B dans la base je1k i je2l i rangee dans l'ordre correspondant aux composantes precedentes de jai jbi est la matrice d1d2 d1d2 (le verier) : 0 1 A 11 B A12 B : : : A1d1 B BB A21 B CC BB C : : : C (II -58) BB : CC : : : : @ A Ad1 1 B Ad1 d1 B ou Aij B est Aij fois la matrice d2 d2 representant B dans la base des je2l i. Supposons maintenant que nous ayons deux representations unitaires d'un groupe G, T1(g) et T2(g), agissant dans des espaces de representation E1 et E2. Il est immediat de voir que T (g) = T1 (g) T2(g)
(II -59)
est une representation unitaire de G dite produit tensoriel (ou direct) des deux representations T1 et T2 . En general cette representation est reductible et nous verrons sur l'exemple de la composition de deux spins 1=2 comment la reduire. Un cas frequent et important est celui ou l'on fait n fois le produit tensoriel d'un m^eme espace vectoriel comme par exemple R 3 R 3 : : : ou C 2 C 2 : : : Dans ce dernier cas, un vecteur W de cet espace s'ecrit :
W = W 1 ::: n j 1i : : : j ni
(II -60)
Supposons que dans une rotation (point de vue passif), les vecteurs de base j i se transforment par SU (2) (comme en (III -16), Appendice III) : j i = U* j i ou U 2 SU (2) (II -61) 0
Cette transformation induit une transformation sur les composantes W 1 ::: n de W car celui-ci est suppose invariant dans ce point de vue passif : W = W . On en deduit que W 1 ::: n se transforme gr^ace une matrice U par indice (le montrer et voir l'Appendice III) : 0
W = W 1 ::: n j 1i : : : j ni =) W 1 ::: n = U 1 1 : : : U n n W 1 ::: n 0
0
0
0
(II -62)
Ceci se generalise evidemment a n'importe quel groupe G. On en deduit que si 1 : : : n sont des indices d'un groupe G, i.e. Z = g Z , g 2 G alors: 0
2
II. Vecteurs, spineurs, tenseurs et generateurs
43
W 1 ::: n se transforme comme le produit Z 1 : : : Z n des composantes Z de Z . On dit qu'il s'agit d'un tenseur de rang n de G (dans le cas de SU (2) d'un multispineur).
Exercice : Comment est deni un tenseur de SO(3)? Comment ses composantes se
transforment elles lors d'une rotation passive?
Nous verrons dans la suite que le produit tensoriel de deux spins 1/2, qui correspond par consequent a un objet a deux indices spinoriels, donne une representation reductible qui se decompose en une representation de spin 1 et une de spin 0. La partie de spin 1 est la partie symetrique dans les deux indices de spin et celle de spin 0 la partie antisymetrique. Ceci montre qu'un indice vectoriel est equivalent a deux indices spinoriels symetrises et pas d'indice a deux indices spinoriels antisymetrises. Ceci se generalise aux representations de spin plus eleve. On voit sur ce qui precede que la tensorialite (au sens des groupes) d'un objet a n indices est relative a un groupe de transformations. Ainsi, un objet mathematique peut tres bien porter des indices de nature dierente : par exemple n1 indices de SU (2), n2 indices du groupe de Lorentz, etc: : : Dans une transformation de SU (2), un tel objet verra ses n1 indices de SU (2) se transformer et les n2 de Lorentz ^etre inertes et vice-versa pour une transformation de Lorentz. C'est ce qui arrive couramment dans les theories de jauge ou le groupe de symetrie total de la theorie est : groupe de Lorentz (en fait Poincare) groupe de jauge et ou par consequent les objets que l'on doit considerer ont une nature tensorielle mixte. Les champs de jauge par exemple sont en m^eme temps des (quadri-) vecteurs pour le groupe de Lorentz et des objets qui engendrent une representation (dite adjointe) du groupe de jauge. Pour illustrer la notion de produit tensoriel de representations et sa decomposition en representations irreductibles, nous allons maintenant considerer l'exemple du produit de deux representations de \spin 1/2". Nous allons commencer par prouver encore quelques theoremes. E
` Autres petits th´eoremes
\Le tenseur completement antisymetrique a deux indices est un tenseur invariant de
SU (2)."
2
II. Vecteurs, spineurs, tenseurs et generateurs
44
Considerons le tenseur antisymetrique a deux indices dont les composantes dans un repere valent par denition : ! ; 1 = 1 (II -63) Dans une transformation de SU (2) ses composantes se transforment en :
= U U = U t U
0
(II -64)
soit matriciellement :
= U tU (II -65) Il sut maintenant de prendre la parametrisation generale d'une matrice de SU (2), Eq.(I -26), et d'eectuer le produit matriciel pour voir que quelque soit U on a : = . Donc = j i j i est un tenseur dont les composantes sont invariantes dans n'importe quelle transformation de SU (2). On l'appelle le tenseur invariant. On peut montrer reciproquement que tous les tenseurs invariants de rang deux de SU (2) sont proportionnels a (unicite de ce tenseur a un facteur pres) 19 . \Z et Z* engendrent des representations de SU (2) equivalentes." C'est evident a partir de ce qui precede. Pour toute transformation de SU (2) : 0
0
Z = U Z =) Z* = U* Z*
0
(II -66)
0
et
= U t U =) U* = U 1 (II -67) Or cette relation est precisement la denition de l'equivalence de deux representations puisque la matrice est unitaire. D'ou le resultat. \ (t Z) se transforme comme (Z ) ." On a t Z = Z = Z U = Z t U = Z U = t Z U (II -68) ;
y
0
y
0
et d'autre part
y
(Z ) = Z* = Z* U* = Z* U = Z U Les deux expressions se transforment donc bien de la m^eme maniere. y
0
0
19: Pour SO(3), le tenseur antisymetrique invariant est ijk .
y
y
y
(II -69)
2
45
II. Vecteurs, spineurs, tenseurs et generateurs
\Z etant un spineur, Z Z est un scalaire et V~ = Z ~ Z est un vecteur et, par consequent, il y
y
~ = t Z~ Z ." en va de m^eme de W
(Z Z ) = Z U UZ = Z Z
(II -70)
Vi = Z ~ Z i = Z U i UZ
(II -71)
y
d'autre part,
0
y
0
y
0
y
y
y
y
Or, d'apres la celebrissime relation (II -41), on deduit
Vi = Z Rij j Z = Rij Vj 0
y
(II -72)
~ : Wx = tZ x Z et idem pour Wy D'ou le resultat. Evaluons les coordonnees cartesiennes de W et Wz . On se place, dans l'espace des spineurs, dans la base propre de z ou z = 3 . Un calcul elementaire donne 20 : 8 > < Wx = Z22 ; 2Z12 2 W = ;i(Z + Z ) (II -73) > : Wyz = 2Z1Z12 2 Passons maintenant dans la base spherique (II -54) :
p 8 > < W+ = ;p2Z222 = ; 2Z1 > :W W0 = 2Z1Z2 ;
(II -74)
qui, a un facteur 2 et un signe sur les composantes Wx et Wy pres, sont les composantes Q(mj) du tenseur Q(1) construites en (II -39). C'est une facon supplementaire de retrouver le fait qu'il s'agit d'un vecteur. Anticipons sur le chapitre traitant de la mecanique quantique et faisons maintenant le lien entre ces resultats et le produit tensoriel de deux spins 1/2. F
Comment construire des vecteurs a` partir de spineurs - composition de deux spins 1/2
Nous avons deja vu que Z ~ Z est un vecteur si Z est un spineur. Nous allons retrouver dans ce paragraphe ce resultat sous une forme un peu dierente et faire le lien avec la mecanique quantique ou on \sait" que la composition de deux spins 1/2 donne un spin 1 et un spin 0. y
20: C'est un calcul particulierement interessant de verier que lors d'une rotation, la transformation des Z induit une transformation sur les Wi qui est bien celle des composantes d'un vecteur.
2
II. Vecteurs, spineurs, tenseurs et generateurs
46
Nous en proterons pour faire le lien entre les notations des chapitres precedents et celle utilisee couramment en mecanique quantique. C 2 est l'espace de representation pour j = 1=2 et on doit donc en faire le produit tensoriel par lui m^eme pour composer deux telles representations. La base de C 2 denie en (II -44) est : fj ig = fj "i j #ig et l'espace produit tensoriel de C 2 par lui m^eme est donc engendre par fj i j ig = fj ""i j "#i j #"i j ##ig ou par denition j ""i = j "i j "i, etc: : : Commencons pour simplier par eectuer le produit tensoriel d'un spineur par lui - m^eme :
W = Z Z = (Z j i) (Z j i) = Z Z j i j i p = Z12j ""i + Z22j ##i + 2Z1Z2 j "#ip+ j #"i 2
soit
W11 = Z12 W
(II -75) (II -76) (II -77)
p
(II -78) = Z22 W1 1 = 2Z1 Z2 p (1) 21 qui sont les composantes Q(1) m du tenseur Q a un facteur 2 pres . On voit donc que l'on a genere la representation de \spin 1" par produit tensoriel de deux representations de spin 1/2. Mais il faut faire un peu attention car on a fait un produit tensoriel tres particulier car ne faisant intervenir que le seul spineur Z . Ainsi toutes les composantes de W sont obligatoirement symetriques dans l'echange des Z et on voit d'ailleurs que W appartient au sous espace engendre par les produits tensoriels symetriques des vecteurs de base. Quid du produit de deux spineurs quelconques? 1 1
; ;
;
W = Y Z = (Y j i) (Z j i) = Y Z j i j i = Y1Z1j ""i + Y2Z2j ##i + p1 (Y1Z2 + Y2Z1) j "#ip+ j #"i 2 2 + p1 (Y Z ; Y Z ) j "#ip; j #"i 0
(II -79) (II -80) (II -81)
(II -82) 2 1 2 2 1 2 Pour bien voir ce qui se passe, construisons les generateurs des rotations dans l'espace produit. Prenons une rotation innitesimale d'angle d~ : ! ~ ~ ~:~=2 ~:~=2 id id ~ e
e = 1 1 + id : 2 1 + 1 2 (II -83) et donc les generateurs sont les Ji = 2i 1 + 1 2i . Un calcul elementaire (mais imperatif a faire une fois dans sa vie) montre facilement que J 2 n'est pas diagonal dans la base fj i j ig p21: Noter que, ce faisant, on a associe a la matrice 2 2, W = Z Z le vecteur a trois composantes 2(W+ W; W0 )
2
II. Vecteurs, spineurs, tenseurs et generateurs
47
mais l'est dans
fj ""i j ##i (j "#ip+2j #"i) (j "#ip;2j #"i) g p Dans le sous espace engendre par fj ""i j ##i (j "#i + j #"i)= 2g, J 2 = 2:1 et Jz est diagonal avec les valeurs propres +1 ;1 et 0 respectivement 22 . La restriction des Ji au sous espace de
dimension trois precedent n'est, ni plus ni moins, que le generateur des rotations de SO(3) evalue dans la base ou Jz est diagonale, Eq.(II -p53). Dans l'autre sous espace, J 2(j "#i ; j #"i)= 2 = 0 et idem pour Jz . Il s'agit donc dans ce sous espace du generateur de SO(3) pour la representation unite. Les trois combinaisons symetriques sont donc de spin 1, ou dit autrement forment la base d'un espace des etats de spin 1, au sens quantique du terme. La combinaison antisymetrique 23 est de spin 0) c'est un scalaire p sous les rotations . Or c'est un scalaire a deux indices puisque ses coordonnees sont (a 2 pres) Y Z ; Y Z ! Mais on conna^t un tel tenseur a deux indices qui est invariant : c'est le tenseur antisymetrique . Comme on a vu qu'il n'y a qu'un tenseur invariant, a un facteur pres, on deduit que Y Z ; Y Z doit ^etre proportionnel a . Dans le cas de SU (2) c'est matriciellemnt evident puisque la matrice Y Z ; Y Z vaut
! Y Z ; Y Z 1 2 2 1 Y Z ; Y Z = Y Z ; Y Z = (Y2Z1 ; Y1Z2)
2 1 1 2
(II -84)
On voit donc que dans le produit de deux spineurs Y Z la combinaison symetrique est de spin 1 (vecteur) et la combinaison antisymetrique de spin 0 (scalaire). On note : 2 2=31
(II -85)
ou les chires representent les dimensions des representations que l'on compose. On pourrait poursuivre cette voie et composer un moment angulaire j1 avec un autre moment j2 j1 . Rappelons ici seulement le resultat :
Dj1 Dj2 = D(j1+j2) D(j1 +j2
1) : : : D (j1 j2 )
;
;
(II -86)
On pourrait aussi composer plus de deux representations irreductibles ensemble. Il existe une technique diagrammatique classique, tres commode, les diagrammes d'Young, pour trouver la decomposition en representations irreductibles d'un produit tensoriel de representations. Nous ne l'exposerons pas ici car elle ne sera pas essentielle dans ce qui suivra. 22: C'est la raison pour laquelle on note aussi ces vecteurs respectivement j1 1i j1 ;1i j1 0i. On dit qu'il s'agit du triplet symetrique. 23: Dans ce cas ou W = Y Z , on associe a cette matrice 2 2 un vecteur a trois composantes et un scalaire.
48
3
CHAPITRE 3
´ Theorie quantique et sym´etries \Il fallait savoir a tout prix, m^eme au prix de la plus grande sourance. J'ai pris, j'ai ouvert le couteau a ouvrir les yeux." H. Michaux I
´ LES AXIOMES DE LA MECANIQUE QUANTIQUE
Et d'abord quelques generalites pas forcement inutiles a \rappeler".
Il n'y a qu'une theorie quantique avec ses axiomes de base et plusieurs mod eles s'appuyant
sur cette theorie (pas de premiere ni de seconde quantication 1). Exemple : le modele a une particule libre, invariant galileen. L'espace des etats est un espace de Hilbert dans lequel agissent trois operateurs fondamentaux (qui forment un ensemble ~ P~ S~ : les operateurs position, impulsion et spin. Toutes les autres irreductible, voir la suite) X grandeurs physiques sont representees par des operateurs qui sont des fonctions de ces trois (ou plut^ot neuf) la. Les quantites mesurables sont des elements de matrice d'operateurs : hjAji ~ P~ S~ ). L'invariance galileenne impose les relations de commutation usuelles entre ou A = A(X les operateurs X~ et P~ : &Xi Pj ] = i ij 1 (voir la suite)) S~ commute avec X~ et P~ . La dynamique du systeme est donnee par l'hamiltonien du systeme qui est aussi le generateur des translations dans le temps. Sa forme est elle aussi xee par l'invariance galileenne : H = P~ 2=2m.
Les ingredients necessaires pour avoir une modele quantique completement deni sont 1) un ensemble irreductible d'operateurs hermitiens. Par irreductible, on veut dire qu'il est minimal et qu'il n'existe pas d'operateurs commutant avec tous les operateurs de l'ensemble irreductible, a part l'unite 2. Toutes les \observables" peuvent ^etre construites a partir de ces ~ P~ S~ forme l'ensemble irreductible pour la particule a spin. operateurs. X 1: L'histoire de l'expression \seconde quantication" est tortueuse et vient de ce que l'on a cru un moment que la theorie des champs consistait a \quantier la fonction d'onde" en la prenant comme un operateur. Aujourd'hui, cette expression est encore employee (on se demande pourquoi) pour signier que l'on emploie un formalisme d'operateurs de creation et d'annihilation. 2: Attention, il ne faut pas confondre ensemble irreductible d'operateurs et ensemble complet d'operateurs commutants. Les operateurs de l'ensemble irreductible ne commutent pas en general entre eux (X~ et P~ par exemple).
3
I. Les axiomes de la mecanique quantique
49
2) un espace de Hilbert qui est l'espace des etats du systeme. L'hypothese d'irreductibilite implique que l'espace de Hilbert est engendre | et donc deni | par les kets propres de l'ensemble maximal d'operateurs (de l'ensemble irreductible) commutant, i.e. simultanement diagonalisables. Ces kets sont donc entierement reperes par les valeurs propres de ces operateurs (aucun nombre quantique supplementaire n'est necessaire pour les reperer) 3 . Les etats d'un systeme quantique sont representes par les rayons normes de l'espace des etats, un rayon etant deni comme l'ensemble des vecteurs aji quand a decrit C et un rayon norme comme l'ensemble des vecteurs normes aji avec ji norme et donc jaj = 1. L'ensemble des etats physiquement accessibles est suppose engendrer l'espace de Hilbert. Reciproquement, tous les vecteurs de l'espace de Hilbert ne sont pas obligatoirement des etats physiquement acceptables : par exemple pour un ensemble de particules chargees, la combinaison lineaire d'etats de charges dierentes n'est pas physique (sinon, avec une probabilite non nulle, on pourrait, lors de mesures, trouver des charges dierentes pour le m^eme systeme, ce qui n'a jamais ete observe et est formalise sous le nom de principe de conservation de la charge). On dit pour cette raison qu'il y a des operateurs denissant des regles de super - selection qui interdisent de former certaines des combinaisons lineaires d'etats. L'espace de Hilbert est donc en general la somme directe de sous espaces, dits sous espaces coherents, reperes par des nombres quantiques bien denis | les valeurs propres des operateurs de super - selection |, la charge par exemple, et tels que les grandeurs physiques ont des elements de matrice nuls entre des etats appartenant a deux sous espaces coherents dierents. 3) des relations de commutation entre les operateurs fondamentaux. Comme on le verra, ces relations de commutation sont en fait determinees par le groupe de symetrie de l'espace - temps choisi : Galilee ou Poincare. L'espace de Hilbert et les operateurs de l'ensemble irreductible sont entierement caracterises par la donnee de toutes les relations algebriques entre ces operateurs. 4) un hamiltonien qui determine l'evolution temporelle du systeme 4 . Cet hamiltonien doit avoir un spectre borne par en bas pour ^etre admissible (condition de stabilite). L'etat fondamental de cet hamiltonien (appele le vide) joue un r^ole particulierement important. 3: Il pourrait para^!tre curieux de parler d'operateurs avant de parler de l'espace dans lequel agissent ces operateurs. Il n'en est en fait rien car un modele quantique repose bel et bien du point physique sur la donnee d'un certain nombre de grandeurs physiques | d'operateurs hermitiens | et de l'hypothese \d'irreductibilite" de cet ensemble d'operateurs, les deux determinant la structure du Hilbert. 4: En fait le postulat fondamental de la mecanique quantique est que l'evolution dans le temps des vecteurs d'etats j(t)i et j (t)i conserve la probabilite jh(t)j (t)ij au cours du temps : jh(t)j (t)ij = jh(t0 )j (t0 )ij. Comme on le verra avec le theoreme de Wigner, cette relation implique l'existence d'un operateur unitaire T (t t0 ) appele operateur d'evolution, tel que j (t)i = T (t t0)j (t0 )i. L'hamiltonien H du systeme est relie a T par T (t0 + dt t0 ) = 1 ; iH (t0 )dt ou encore, pour une evolution nie et un hamiltonien independant du temps, T (t t0 ) = exp (;iH (t ; t0 )). L'equation de Schr%odinger se deduit immediatement de cette relation.
3
50
II. Points de vue actif et passif
Tous les resultats d'une mesure sont evidemment independants du choix du representant dans le rayon. jhjij2 represente la probabilite de trouver dans une mesure l'etat ji sachant que le systeme etait dans l'etat ji. La \mecanique quantique" n'est rien d'autre que la theorie quantique galileenne. II
´ LES DIFFERENTS POINTS DE VUE ACTIF ET PASSIF ψ’s
ψ’ s’
S ψs
O
S’
O’ ψs ’
3.1 - Premier point de vue actif dans le cas d'une translation. Les conventions sont telles que, par exemple, on appelle jS i le ket attribue par O au syst eme S et j S i = U jS i celui attribue par O au m^eme syst eme, U faisant le passage entre O et O Fig.
0
0
0
0
0
0
0
En fait, il n'y a pas que deux points de vue, l'actif et le passif, mais bien quatre (voir l'Appendice IV). 1) Le point de vue passif. Dans ce point de vue, on a deux observateurs O et O transformes l'un de l'autre et un seul systeme. On a donc une seule realite objective et deux descriptions dierentes de cette realite. On dira qu'il existe une transformation de symetrie (translation, rotation, transformation de Galilee ou de Lorentz, inversion, etc: : : ) si les lois ecrites par O sont identiques a celles ecrites par O . 2) Le premier point de vue actif. Dans ce point de vue, on a deux observateurs O et O transformes l'un de l'autre et deux systemes identiques S et S qui sont tels que initialement, a un instant t0 , O est relie a S de la m^eme facon que O est relie a S (par exemple Juliette fait la m^eme experience a Grenoble que Tatiana a Moscou). On dira dans ce point de vue qu'il y a symetrie entre O et O si les resultats de toutes les mesures faites par O sur S sont identiques a ceux obtenus dans les m^emes mesures eectuees par O sur S . 3) Le deuxieme point de vue actif. Dans ce point de vue, on a un seul observateur et deux systemes S et S transformes l'un de l'autre. Les appareils de mesure servant a etudier chacun des systemes sont eux m^emes transformes de la m^eme maniere que les systemes. La aussi, on dira qu'il y a symetrie entre les systemes si les m^emes mesures eectuees sur les deux systemes donnent les m^emes resultats. 0
0
0
0
0
0
0
0
0
0
3
51
III. Le theor eme de Wigner
3) Le point de vue ni actif ni passif. Ce point de vue ne permet pas directement de mettre en uvre un principe de relativite mais il est tres utilise pour des raisons pratiques. Il consiste a prendre un seul observateur et un seul systeme et a transformer les appareils de mesure. III
´ TRANSFORMATIONS INDUITES DANS L’ESPACE DES ETATS ´ ` THEOR EME DE WIGNER
On va se placer dans cette partie dans le point de vue passif. Pour xer les idees, supposons que les deux observateurs O et O soient deplaces l'un par rapport a l'autre par une translation ~ et qu'ils cherchent a decrire le m^eme systeme quantique. Comment d'une quantite xee ~a = OO passer de la description de l'un a celle de l'autre? Attention, contrairement a une vitesse, une force, etc: : : un vecteur dans l'espace des etats n'est pas directement \observable". Par consequent, m^eme dans le point de vue passif, rien n'interdit que deux observateurs decrivant un m^eme systeme attribuent des vecteurs d'etat dierents a ce systeme, contrairement au cas classique, voir Eq.(I -1) du chapitre 2. 5. En fait, la seule restriction quant a leur choix est que les quantites mesurables, comme par exemple un taux de comptage dans un detecteur, soient identiques dans leurs deux descriptions, aux mesures reliees a la position pres. Ainsi, si les deux observateurs O et O attachent a un etat du systeme respectivement les kets (normes) j(t)i et j (t)i et cherchent a mesurer respectivement jh(t)j(t)ij et jh (t)j (t)ij ou j(t)i et j (t)i representent un autre etat du systeme vu par chacun des observateurs, on doit avoir : jh(t)j(t)ij = jh (t)j (t)ij (III -1) Un theoreme d^u a Wigner montre que si cette condition est remplie, alors il existe un operateur U agissant dans l'espace de Hilbert 6 qui est soit lineaire et unitaire soit anti-lineaire et unitaire et qui envoie ji et ji sur j i et j i 7 : 0
0
0
0
0
0
0
0
0
0
0
jhjij = jh j ij () 0
0
(
j i = U ji j i = U ji 0
0
(III -2)
5: C'est m^eme obligatoire si O et O0 ont choisi le m^eme operateur position, car le ket d'etat possedant, dans ce cas, toute l'information sur la position du systeme, et cette position n'etant pas la m^eme relativement aux deux reperes, les vecteurs d'etat doivent ^etre dierents (voir la suite) 6: En general, U depend explicitement des reperes lies a O et O0 et pas seulement de la transformation faisant passer de O a O0 . Que l'on pense a une translation dans le temps pour un systeme dont l'hamiltonien depend explicitement du temps (presence d'un champ exterieur variable par exemple). Par contre, lorsque la transformation consideree est une symetrie, alors seule la \position" relative des deux observateurs importe et U ne depend plus alors que de la transformation faisant passer de O a O0 . Dans le cas d'une translation U = U (~a) ~ 0. ou ~a = OO 7: En fait, l'equation (III -1) denit une relation entre rayons et non entre kets puisque les phases de ces kets n'y jouent aucun r^ole. Voir l'encadre IV.
3
III. Le theor eme de Wigner
52
Dans tout ce qui suit, sauf pour le renversement du temps, il est facile de se convaincre que seuls les operateurs unitaires jouent un r^ole (c'est en fait evident pour les symetries continues car on peut alors passer contin^ument de l'unite a n'importe quel element du groupe). Supposons maintenant, pour le cas des translations ou U = U (~a), un troisieme observateur O deplace de ~b par rapport au second et qui lui aussi decrit le m^eme systeme. On peut bien entendu recommencer le m^eme raisonnement avec le m^eme resultat : ( j i = U (~b)j i (III -3) j i = U (~b)j i Mais bien entendu, O est translate de ~a+~b par rapport a O et on peut donc encore recommencer le m^eme raisonnement avec comme resultat 8 : j i = U (~a + ~b)ji = U (~b)U (~a)ji (III -4) 00
00
0
00
0
00
00
et donc
U (~a + ~b) = U (~b)U (~a)
(III -5) Les U forment donc une representation du groupe des translations, ou, dit autrement, les etats de l'espace de Hilbert engendrent une representation du groupe des translations (et idem pour les rotations et Lorentz). On voit ici toute l'importance de la structure lineaire { espace de Hilbert, operateurs lineaires, etc: : : , { qui est a la base de la mecanique quantique : elle fournit un espace de representation pour les groupes de symetrie 9. Ceci vaut evidemment aussi pour le groupe des rotations et le groupe de Lorentz. Si ~a = ~0, les deux observateurs sont confondus et on veut donc que U (~0) = 1. Pour une transformation innitesimale, U doit donc ^etre voisin de 1 si bien que l'on peut ecrire : U (d~a) = 1 ; iP~ : d~a (III -6)
ce qui denit P~ comme le generateur des translations dans l'espace de Hilbert (P~ est hermitique puisque U est unitaire). Le signe moins est la pour retrouver les conventions de signe habituelles. En repetant le raisonnement de la page 24, on deduit que pour une transformation nie :
U (~a) = e
iP~ :~a
;
On peut etablir une equation analogue pour les rotations : U (~ ) = eiJ~ : ~
(III -7) (III -8)
8: Il y a un arbitraire de phase dans toutes ces relations. Voir l'encadre IV. 9: On remarquera que pour les transformations de Lorentz ou le raisonnement est identique, on obtient ainsi une representation unitaire pour ce groupe non compact, ce qui n'est possible que parce que l'espace de Hilbert est de dimension innie, voir l'encadre III.
3
III. Le theor eme de Wigner
53
IV. Representations projectives | Spin 1/2
La relation (III -4) n'est \pas tout a fait exacte". En eet U (~a + ~b)j i et U (~b)U (~a)j i decrivent bien tous les deux le m^eme etat physique et doivent donc appartenir au m^eme rayon, i.e. ^etre egaux a une phase pres. On en deduit donc en general
U (g1 ) U (g2) = ei (g1 g2)U (g1 g2) ou g12 sont des elements d'un groupe de transformation G. On dit pour cette raison que les U fournissent une representation a une phase pres | dite aussi representation projective | du groupe G dans l'espace des etats. Et la intervient un theoreme extraordinaire, valable dans les cas qui nous interesseront, c'est a dire le groupe des rotations et le groupe de Lorentz : \Toute representation a une phase pr es, continue, unitaire de SO(3) est une representation vraie de son groupe de recouvrement universel SU (2)." Ceci signie deux choses : 1) Sans changer le contenu physique de la theorie, on peut toujours se ramener pour SO(3) a des representations vraies | et donc ignorer les phases | a condition de prendre les representations de SU (2) (il en sera ainsi egalement pour le groupe de Lorentz et en general pour tous les groupes de symetrie auquel nous aurons aaire). 2) Les representations de SO(3) ne dierent de celles de SU (2) qu'en ce qui concerne le \spin" de la representation. Pour SO(3), j est entier alors que pour SU (2), j est entier ou demi entier. Ceci signie qu'en mecanique quantique bien que l'espace de base soit euclidien et ait donc SO(3) et non SU (2) comme sous groupe du groupe d'isometrie (les reperes sont des objets classiques qui se transforment par SO(3)), les etats engendrent en fait des representations de SU (2) lors des rotations dans l'espace de base. Ceci permet l'existence de representations de spin 1/2 que la Nature utilise eectivement et qui n'ont pas d'analogue classique. Remarquons toute l'importance du choix des axiomes de la mecanique quantique : la notion d'espace de Hilbert, b^ati sur les complexes et de dimension innie conduit au theoreme de Wigner, autorise des representations unitaires m^eme pour les groupes non compacts (Lorentz), fournit un espace pour les representations a une phase (complexe) pres et par consequent autorise la notion m^eme de spin demi entier: : :
ou les Ji sont les generateurs du groupe des rotations dans l'espace de Hilbert 10. Un resultat identique sera etabli plus tard pour les transformations de Lorentz.
10: Par manque de symboles, nous noterons generiquement J~ le generateur des rotations, independamment de la representation, i.e. de la valeur de j .
3
IV. Transformations des observables { symetries
54
IV POINT DE VUE PASSIF – TRANSFORMATIONS DES ´ OBSERVABLES – SYMETRIES
On a donc deux observateurs O et O transformes l'un de l'autre et un seul systeme. Supposons que l'on connaisse l'operateur U qui transforme le ket ji attribue au systeme par l'observateur O, en j i le ket attribue par O au m^eme systeme, (Eq.(III -2) pour le cas des translations). Comment se transforment alors les observables dans le passage d'un observateur a l'autre? Ce que l'on a vu dans le cas classique c'est que, par exemple pour un vecteur V~ et pour le groupe des rotations h ij Vi = R(~ ) i Vj (IV -9) 0
0
0
0
ce qui, symboliquement, se generalise a n'importe quel objet tensoriel ou spinoriel engendrant la representation fM g de SU (2) h i
T = M (~ ) T
(IV -10) 0
ou et representent un ou des indices vectoriels, spinoriels ou tensoriels et M une ou des matrices de SU (2), SO(3), etc: : : (s'il y a plusieurs indices, on a une matrice de transformation par indice). L'idee naturelle pour generaliser cette loi de transformation est de supposer que ce qui est vrai en classique l'est en quantique pour les valeurs moyennes. Nous posons donc :
!
0
hjT ji = M hjT ji
(IV -11)
Ceci est la veritable | ou en tout cas la n^otre | expression du \principe de correspondance". En posant (IV -11) comme un des fondements de la theorie quantique, on espere evidemment poser les bons axiomes qui permettront de retrouver les theories classiques comme des limites des theories quantiques. On peut evidemment, et comme d'habitude en quantique, changer les kets et garder xes les operateurs ou le contraire (ou m^eme un melange des deux). On choisit ici de changer les etats en gardant xes les operateurs :
8 < j (t)i = U (~ t)j(t)i : h jT j i = M (~ ) hjT ji 0
0
0
(IV -12)
3
IV. Transformations des observables { symetries
55
ou U (~ t) est l'operateur unitaire representant dans l'espace de Hilbert la rotation d'angle ~ et ou il s'agit bien du m^eme T dans les deux membres de l'equation. La deuxieme relation implique que U verie 11
U T U = M T
(IV -13)
y
Remarquons que pour les translations, la transformation classique de la position ne consiste pas en une transformation matricielle, mais en une transformation ane : ~x ! ~x = ~x + ~a. On choisit donc pour la transformation quantique de la position : 0
h jX~ j i = hjX~ ji + ~a: 0
(IV -14)
0
ce qui entra^ne
U (~a) Xi U (~a) = Xi + ai: Dans une rotation, l'equation (IV -13) devient pour l'operateur position
(IV -15)
y
U (~ ) Xi U (~ ) = Rij Xj :
(IV -16)
y
et dans l'action successive d'une rotation et d'une translation : j U (~ ~a) Xi U (~ ~a) = R(~ )i Xj + ai
(IV -17)
y
Toutes ces relations doivent ^etre interpretees comme des contraintes que doivent satisfaire les U et qui en fait les determinent 12. Attention, U , T , Xi etc: : : sont des operateurs dans l'espace de Hilbert alors que les M , R et ~a agissent sur les valeurs moyennes. Les M et les U forment des representations des groupes de symetrie pour respectivement les tenseurs \classiques" et les etats quantiques. A
Sym´etries en repr´esentation de Schr¨odinger
Voyons maintenant ce qu'il en est de la notion de symetrie dans le point de vue passif et en representation de Schr!odinger. Tout ce qui va suivre va consister a formaliser la notion simple suivante. Pour passer de j(t0)i a j (t)i, on peut soit transformer j(t0)i en j (t0)i gr^ace a U (t0 ) puis laisser evoluer ce ket jusqu'a t, soit laisser evoluer j(t0)i jusqu'a t en j(t)i et le 0
0
11: Le fait que l'egalite des valeurs moyennes entra^!ne l'egalite des operateurs est une consequence du fait que l'on travaille dans un espace de Hilbert (metrique positive). Voila une bonne raison supplementaire pour adopter cette structure et travailler sur les complexes. 12: Pour entierement determiner un operateur U , on doit conna^!tre l'analogue de la relation (IV -17) pour chacun des operateurs de l'ensemble irreductible. C'est la qu'intervient tout l'inter^et de cette notion d'irreductibilite.
3
56
IV. Transformations des observables { symetries
transformer en j (t)i gr^ace a U (t). Lorsque U represente une symetrie, ces deux operations commutent et, comme nous allons le voir, ceci impose la contrainte suivante sur l'hamiltonien H du systeme et donc sur sa dynamique 13 : 0
&H U ] = 0 Montrons maintenant la preuve de ce resultat. Nous allons dans un premier temps travailler en representation de Schr!odinger ou ce sont les etats qui evoluent dans le temps et les operateurs qui sont independants du temps. On a besoin pour formaliser la notion de symetrie d'etablir la relation entre les operateurs d'evolution dans le temps T (t t ) et T (t t ) utilises par chacun des deux observateurs. Dans toute la suite, on appellera U (t) l'operateur de Wigner faisant passer des kets utilises par l'observateur O a ceux utilises par O pour decrire le m^eme systeme (point de vue passif). On a par denition : 0
0
0
0
8 > < j (t)i = T (t t0)j (t0 )i = T (t t0)U (t0 )j(t0)i > : j (t)i = U (t)j(t)i = U (t)T (t t0 )j(t0 )i 0
0
0
0
0
(IV -18)
d'ou l'on deduit la relation generale entre operateurs d'evolution :
T (t t0)U (t0 ) = U (t)T (t t0 ) 0
(IV -19)
On voit donc que, contrairement aux observables de l'ensemble irreductible, les operateurs d'evolution dans le temps changent en general d'un observateur a l'autre. Cependant, lorsque la transformation consideree est une symetrie, les lois d'evolution doivent par denition ^etre identiques pour les deux observateurs et par consequent les operateurs d'evolution doivent ^etre les m^emes. Ceci implique donc, compte tenu de la relation precedente :
T (t t0)U (t0 ) = U (t)T (t t0 )
(IV -20)
pour tout t (et t0 ). Ceci constitue, dans la representation de Schr!odinger, la condition pour que le passage de O a O soit une symetrie. Il est interessant de reexprimer cette condition en fonction de l'hamiltonien du systeme. Dire que les deux observateurs ecrivent les m^emes lois dynamiques, c'est dire qu'ils ont le m^eme operateur d'evolution et ecrivent donc la m^eme equation de Schr!odinger. Ils ont donc le m^eme hamiltonien (m^eme T donc m^eme H ): 0
H (t) = H (t) 0
(IV -21)
13: Cette relation n'est en fait vraie que dans le cas ou U est independant du temps, voir l'Eq.(IV -24).
3
IV. Transformations des observables { symetries
57
Multiplions a gauche par U (t), que l'on supposera unitaire dans toute la suite, l'equation de Schr!odinger ecrite par O : ! d (IV -22) iU (t) dt j(t)i = U (t)H (t)U (t) U (t)j(t)i En comparant cette equation a celle ecrite par O on deduit (le verier) : H (t) = H (t) = U (t)H (t)U (t) + i @U@t(t) U (t) (IV -23) ou de facon equivalente compte tenu de (IV -21) y
0
0
y
&H (t) U (t)] + i @U (t) = 0 @t
y
(IV -24)
Si, comme ce sera souvent le cas, U est independant du temps, alors la condition (IV -20) pour que U represente une symetrie devient : &H (t) U ] = 0
(IV -25)
Tous les U sont par consequent des constantes du mouvement (voir aussi (IV -30)). Pour autant, lorsque le groupe de symetrie est un groupe de Lie, on n'obtient pas ainsi une innite de constantes du mouvement independantes. En fait, on voit sur la relation precedente, en developpant U au premier ordre, que seuls les generateurs sont des constantes du mouvement independantes lorsqu'on a une symetrie (le faire). Etant de plus hermitiques, contrairement aux U , ce sont de bons candidats pour jouer le r^ole de grandeurs physiques. Comme on le verra dans la suite, c'est le cas de l'impulsion pour un systeme invariant par translation, du moment cinetique pour un systeme invariant par rotation, etc: : : Dans le cas ou le systeme etudie possede des symetries, on peut chercher les etats propres de H qui sont egalement etats propres de l'ensemble maximal des generateurs qui commutent entre eux et avec H . Ceci peut considerablement simplier la recherche des etats propres en pratique (par exemple pour des systemes sur reseau ou l'on eectue sur ordinateur des diagonalisations exactes d'hamiltoniens et ou une analyse ne des symetries du systeme peut s'averer cruciale). L'ensemble des relations de commutation (IV -25) | une pour chaque symetrie | n'impose des contraintes sur la forme que peut prendre l'hamiltonien du systeme que parce que H et U sont des fonctions des m^emes operateurs de l'ensemble irreductible. Plus il y a de quantites conservees, plus la dynamique est contrainte. Comme il etait annonce dans les premieres pages d'introduction de ce cours, ceci determinera, en dernier ressort, presque entierement la forme des theories, i.e. des hamiltoniens, que nous construirons 14 . 14: En fait, techniquement parlant, ce n'est pas cette demarche qui est la plus simple car il devient fort complique dans la pratique de trouver, en fonction des operateurs de l'ensemble irreductible, a la fois les U
3
IV. Transformations des observables { symetries
58
Pour les systemes conservatifs, ceci fournit des r egles de selection car (le montrer)
hu1jH ju2i = 0 pour des valeurs propres u1 6= u2
(IV -26)
lorsque ju12i sont des vecteurs propres de U . Ceci fournit egalement des renseignements sur la degenerescence des niveaux d'energie : si jE i est vecteur propre de H alors U jE i l'est aussi avec la m^eme energie (le montrer). Si ces deux vecteurs ne sont pas proportionnels alors le niveau est degenere au moins deux fois. Pour un niveau degenere, l'ensemble des vecteurs normes de ce niveau engendre une representation irreductible du groupe de symetrie de la theorie. On voit donc que degenerescence et symetrie sont liees et donc, souvent plus important en pratique, levee de degenerescence et perturbation brisant la symetrie (eet Zeeman par exemple). B Sym´etries en repr´esentation de Heisenberg
Il est interessant d'etudier ce qu'il en est de la notion de symetrie dans la representation de Heisenberg car, d'une part, nous allons voir que l'analogue de la condition (IV -20) est plus simple dans cette representation et, d'autre part, la representation de Heisenberg est mieux adaptee a la theorie des champs que la representation de Schr!odinger. Rappelons d'abord que le passage de Schr!odinger a Heisenberg s'eectue en posant, dans des notations evidentes : hH jAH (t)jH i = hS (t)jAS jS (t)i (IV -27) d'ou l'on deduit la correspondance
8 H > < j i = T (t t0) jS (t)i > : AH (t) = T (t t0) AS T (t t0 ) y
(IV -28)
y
ou t0 est un instant arbitrairement choisi ou les deux representations co!ncident. Appelons U l'operateur de Wigner faisant passer de O a O . Il est clair que pour chaque observateur, on peut se servir de la representation de Heisenberg mais il n'est pas evident dans cette representation que les deux observateurs puissent prendre les m^emes operateurs a tout instant. En fait, comme d'une part, nous avons choisi de prendre identiques les operateurs de l'ensemble irreductible pour O et O dans la representation de Schr!odinger, Eq.(IV -12), et, comme d'autre part, si U est une symetrie, les operateurs d'evolution sont identiques, nous deduisons qu'en representation de Heisenberg, tout operateur A de l'ensemble irreductible doit 0
0
et les hamiltoniens symetriques commutant avec les U (surtout en theorie des champs). C'est la raison qui nous poussera a formuler toute la theorie des champs gr^ace au principe de moindre action | et a partir du lagrangien et non de l'hamiltonien | car dans cette formulation nous pourrons obtenir automatiquement des theories invariantes sous n'importe quel groupe de symetrie.
3
59
IV. Transformations des observables { symetries
verier :
AH (t) = A H (t) 0
8t
(IV -29)
pour que U soit une symetrie. Ajoutons qu'en representation de Heisenberg, la relation (IV -20) a une interpretation tres simple car U (t0 ) = T (t t0)U (t)T (t t0 ) est equivalent a U H (t0) = U H (t) et cette relation exprime donc le fait que l'operateur U H est independant du temps. Dit autrement, pour une symetrie : y
dU H (t) = 0 dt
pour une symetrie
(IV -30)
C'est donc une constante du mouvement 15 . En resume, on voit que les deux relations (IV -29), (IV -30) signient que :
En representation de Heisenberg, lorsqu'il s'agit d'une symetrie, l'operateur U de Wigner est independant du temps et les deux observateurs utilisent les m^emes operateurs pour une grandeur physique donnee, comme dans le cas de la representation de Schrodinger. Appliquons maintenant tout ceci a un cas simple. C
` de la particule a` spin Le modele
Nous allons illustrer ce qui precede sur le modele galileen a une particule. Par denition, notre modele suppose l'existence d'un operateur position X~ pour la \particule" 16. Bien s^ur, pour que la notion de position ait un sens, il faut que les valeurs moyennes de X~ se transforment conformement a (IV -14) dans une translation du repere (et que les dierentes composantes de X~ commutent entre elles). Ceci implique qu'il existe un operateur Ut (~a), fonction des operateurs de l'ensemble irreductible, tel que (IV -15) soit veriee. Cette exigence est incompatible avec le fait que l'ensemble irreductible ne contienne que X~ car
~ a) Xi U (X~ ~ a) = Xi U (X~ y
15: Rappelons que les U etant des operateurs dans l'espace de Hilbert sont des fonctions des operateurs de l'ensemble irreductible. 16: Nous verrons que la construction du modele des particules libres, dans le cas relativiste de Lorentz, repose sur des hypotheses assez dierentes et, d'ailleurs, moins contraignantes puisqu'on ne fait justement pas l'hypothese de l'existence de particules, mais (presque) seulement de l'invariance de Lorentz et des postulats quantiques. On y gagnera en generalite, mais on y perdra un peu quant au contenu intuitif.
3
IV. Transformations des observables { symetries
60
~ a). Nous sommes donc amenes a construire un autre operateur, P~ , generateur pour tout U (X~ des translations, tel que (IV -15) soit veriee. On a alors par denition : Ut (~a) = e
iP~ :~a
;
(IV -31)
On appelle impulsion l'operateur P~ . Les relations de commutation entre X~ et P~ sont xees par (IV -15). En eet, en developpant au premier ordre cette relation, on obtient (a une dimension) : (1 + iPda) X (1 ; iPda) = X + da
(IV -32)
soit : &X P ] = i
(IV -33)
C'est donc bien notre \principe de correspondance" qui xe l'alg ebre des operateurs de l'ensemble irreductible. La soit-disant correspondance entre theories classique et quantique n'existe pas, mis a part l'equation (IV -11). Il n'y a qu'une limite (non triviale) entre les deux, et des symetries communes qui ont historiquement fait croire a une correspondance entre les deux theories ou, pire encore, qui ont fait croire que la theorie quantique se \deduisait" de la theorie classique. Bien s^ur, en pratique, on ne conna^t la plupart du temps que l'aspect classique d'une theorie. De la, on cherche a induire (et non deduire) la bonne theorie quantique qui redonne a la limite classique la theorie dont on est parti. On cherche donc, en eet, un algorithme qui permette de supputer une theorie quantique a partir d'une theorie classique. Il ne faut pourtant pas en conclure que le chemin entre les deux est univoque. L'invariance du systeme sous les translations se traduit par la relation (IV -25) ou par (IV -30), c'est a dire : h~ i ~H (IV -34) P H = 0 ou dPdt = 0 La premiere de ces relations signie qu'en representation de Schr!odinger, si le systeme est a un certain instant dans un etat propre d'impulsion, il le restera. Cela signie aussi que l'hamiltonien ne peut pas dependre explicitement de X~ . On souhaiterait evidemment que notre modele soit aussi invariant sous les rotations. Nous allons choisir comme precedemment que les valeurs moyennes de la position et de l'impulsion se transforment comme des vecteurs classiques :
(
Ur (~ ) Xi Ur (~ ) = Ri j Xj Ur (~ ) Pi Ur (~ ) = Ri j Pj y y
(IV -35)
La question se pose donc, de nouveau, de savoir si l'on peut, avec X~ et P~ , construire le generateur des rotations ou s'il faut elargir de nouveau l'ensemble irreductible. Il se trouve que
3
IV. Transformations des observables { symetries
61
l'on peut construire un generateur des rotations a partir de X~ et P~ seuls (le verier imperativement) : L~ = X~ ^ P~ (IV -36) et l'on a alors : Ur (~ ) = eiL~ : ~ (IV -37) Il y a invariance par rotation lorsque h~ i L~ H = 0 (IV -38) L H = 0 ou ddt On devrait maintenant s'interesser a l'invariance galileenne, mais, avant d'en venir la, voyons comment le spin peut ^etre naturellement incorpore dans notre modele. L'idee est que l'on peut dicilement changer ce qui concerne la position dans notre modele, mais que l'on peut augmenter l'ensemble irreductible, sans rien changer a ce qui precede, en supposant que le generateur complet des rotations, appele J~ par denition, a certes une partie L~ , que nous denommerons maintenant orbitale, mais egalement une partie S~ , que nous appellerons spin : S~ = J~ ; L~ . L'ensemble irreductible d'operateurs est donc suppose ^etre dans ce nouveau modele : ~ P~ S~ ). Il est facile d'etablir les contraintes que doit verier S~ : (X 8 > < Ut (~a) S~ Ut (~a) = S~ (IV -39) > : Ur (~ ) Si Ur (~ ) = Ri j Sj y
y
On voit qu'en prenant :
h i h i Si Xj = 0 = Si Pj
(IV -40) rien n'est a change pour ce qui est des translations. En prenant de plus, comme il est naturel de le faire : Ur (~ ) = eiJ~ : ~ (IV -41) on peut facilement verier que tout est coherent (le faire). La quantite conservee lorsqu'il y a invariance par rotation est, dans ce cas, J~ : h~ i J~H = 0 J H = 0 ou ddt (IV -42) Notre modele est donc maintenant celui d'une particule qui, en plus de ces degres de liberte orbitaux, possede une caracteristique supplementaire, le spin, qui est lie au comportement dans les rotations de la particule. Rien ne nous dit jusqu'a maintenant que la Nature utilise eectivement ce degre de liberte. Pour tester ce modele, il faudrait construire des modeles d'interaction
3
IV. Transformations des observables { symetries
62
de ce type de particule avec un environnement et confronter les predictions theoriques avec les resultats experimentaux 17 . Passons maintenant a l'invariance galileenne dans le modele de la particule sans spin, l'ajout du spin dans ce contexte etant sans inter^et. Supposons que O soit en translation rectiligne et uniforme a vitesse ~v0 par rapport a O. Notre principe de correspondance consiste, dans ce cas ci, a supposer l'existence d'un operateur Ug (~v0) permettant de passer de la description de O a celle de O et a imposer (le verier imperativement) : 8 > < Ug (~v0) X~ Ug (~v0 ) = X~ ; ~v0 t (IV -43) > : Ug (~v0) P~ Ug (~v0) = P~ ; m~v0 0
0
y
y
ou m est la masse de la particule. On peut montrer que la solution de ces equations est donnee en representation de Schr!odinger par Ug = ei(P~ t mR~ ) :~v0 (IV -44) ;
Si la theorie est invariante galileenne alors on doit avoir en representation de Heisenberg :
H d P~ t ; mR~ =0 (IV -45) dt soit, puisque P~ H est independant de t si la theorie est invariante par translation : dR~ H (t) = P~ H (IV -46) dt m ce qui montre que la particule ne peut se deplacer dans ce modele qu'a vitesse constante. On pourrait encore deduire de ce qui precede que l'energie se transforme en valeur moyenne comme dans le cas classique lors d'une transformation de Galilee. L'hamiltonien pour la particule libre sans spin qui satisfait a toutes ces contraintes est ~2 H = 2Pm (IV -47)
17: On sait experimentalement qu'il existe bien des particules elementaires qui possedent un spin, mais, sans que l'on sache completement pourquoi | on a tout de m^eme des idees la dessus |, on n'a trouve jusqu'a maintenant que des particules de spin 1=2 1 et peut ^etre 2 (le graviton). En fait, on pense qu'il doit exister des particules de spin 0 | le modele standard electrofaible en prevoit, les particules de Higgs | qu'il existe peut ^etre des particules de spin 3=2 | les gravitinos predits par les theories de supergravite | mais qu'il est beaucoup moins s^ur qu'il existe des particules de spin superieur a deux. En eet, les theories invariantes de Lorentz ont du mal a s'accommoder a ces particules des qu'elles sont en interaction avec d'autres particules (quid des cordes sur ce dernier point? ). Evidemment, pour des systemes non elementaires, atomes, noyaux, etc: : : , tous les spins sont permis.
3
IV. Transformations des observables { symetries
63
Ce qui donne a m son sens usuel de masse. Tous ces resultats peuvent se generaliser sans diculte au cas de plusieurs particules. On trouve dans ce cas que ce sont les sommes des impulsions et des moments cinetiques qui sont conservees et que c'est le centre de masse qui se deplace a vitesse uniforme. D
Quelques remarques
Pour nir faisons trois remarques. Dans le point de vue passif, pour chaque operateur B utilise par O, on peut construire un operateur B utilise par O pour decrire la m^eme mesure mais dans la description faite par O . B est deni par : h jB j i = hjB ji =) B = UBU (IV -48) Prenons par exemple la mesure de l'abscisse du systeme par rapport a O. B = X dans ce cas et B = X = U (~a) X U (~a). Dans ce contexte, cet operateur n'est pas tres interessant car il sert a O , non pas a mesurer la distance du systeme par rapport a lui m^eme, mais par rapport a O. Ca n'est donc pas X = UXU qui est interessant mais bien X . Cet operateur sert aux deux observateurs a mesurer la distance du systeme par rapport a leur referentiel respectif (il ne s'agit donc pas de la m^eme quantite, m^eme s'il s'agit du m^eme operateur). 0
0
0
0
0
0
0
0
0
0
y
y
0
0
y
Une petite remarque en guise d'avertissement. Pour ~x = ~x + ~a
(IV -49)
j~x i = U (~a)j~xi = j~x + ~ai
(IV -50)
h~x jX~ j~x i = ~x + ~a
(IV -51)
(~x) = h~xj i = h~xjU (~a)ji = (~x ; ~a)
(IV -52)
0
on a \evidemment" 18
0
puisque
0
0
Pour une fonction d'onde on a donc : 0
0
car U (~a)j~xi = U (;~a)j~xi = j~x ; ~ai. Le signe moins pourrait para^tre bizarre, mais il est en fait tout a fait normal comme la gure 3.2 le montre (m^eme chose pour une rotation ou c'est R 1 qui intervient dans la fonction d'onde (R 1~x). Le montrer.). 18: En fait, il faut faire attention car les j~xi n'appartiennent pas au Hilbert. Cette relation est donc plut^ot y
;
;
la denition de l'extension de U a ces vecteurs. Cette denition est evidemment faite pour ^etre coherente avec tous les resultats precedents.
3
V. Un point de vue ni actif ni passif f(x)
g(x)=f(x-a)
a Fig.
64
x
3.2 - Dans une translation de +a, la fonction translatee g(x) vaut f (x ; a)
On trouve souvent ecrit dans la litterature que comme le hamiltonien determine la dynamique
innitesimale des systemes quantiques (equation de Schr!odinger), il est le generateur des translations dans le temps. Ceci est faux (mais le resultat est juste). Il ne faut pas confondre translation dans le temps et dynamique. Dire que deux experiences sont translatees dans le temps d'une quantite , c'est dire que si l'une a demarre a t0 , l'autre a demarre a t0 + : il n'y a rien ici de dynamique (cette facon de realiser une translation dans le temps n'est pas celle du point de vue passif puisqu'il y a deux experiences, mais c'est ici la plus claire). Neanmoins, comme l'evolution dynamique d'un systeme quantique est telle que jh(t)j(t)ij = jh(t0)j(t0)ij, voir la note en bas de page 49, et que ceci est formellement identique a l'equation (III -1), l'operateur qui, a un temps donne, dans le point de vue passif, realise le passage entre les kets d'un observateur a ceux de l'autre observateur translate dans le temps, n'est rien d'autre que l'operateur d'evolution. L'hamiltonien est donc bien egalement le generateur des translations dans le temps, mais pour une raison un peu plus subtile que celle en general avancee. Il serait logique a ce stade de discuter les deux points de vue actif. Cependant, comme aucun resultat nouveau ne sera obtenu dans ces points de vue, il ne s'agit que d'une reformulation, cette discussion est rejetee en Appendice IV. Nous allons au contraire discuter d'un point de vue qui n'est ni passif ni reellement actif et qui nous permettra de denir la notion d'operateurs tensoriels irreductibles. ´ V UN POINT DE VUE NI ACTIF NI PASSIF - OPERATEURS TENSORIELS
Nous allons nous interesser a une situation ou il n'y a qu'un seul observateur et un seul systeme et ou ce sont les appareils de mesure que l'on transforme. Nous allons etudier comment changent les observables (associees aux appareils de mesure) dans ces transformations 19. Pour xer les idees, nous allons considerer les rotations et la mesure de l'observable de spin. Pour un instant, considerons le second point de vue actif ou il n'y a qu'un observateur et deux systemes tournes l'un par rapport a l'autre par une rotation R (voir l'Appendice IV). 19: C'est en fait le second point de vue actif dans lequel on retire le systeme S 0 tout en gardant les appareils de mesure qui y etaient attaches.
3
V. Un point de vue ni actif ni passif
65
L'invariance par rotation nous dit que si l'on tourne le systeme et les appareils de mesure, tous les resultats de mesure sont identiques. Ainsi, si le systeme S caracterise par un operateur de spin S~ , est dans l'etat propre de Sz = S~ :~ez avec valeur propre +1=2, le systeme S , tourne par la rotation R par rapport a S , sera dans l'etat propre de Sz = S~ :~ez , ou e~z = R~ez , avec la m^eme valeur propre (on a fait tourner toute l'experience). Par consequent, a syst eme donne, la relation entre les observables Sz et Sz s'obtient en disant que si l'on tournait le systeme en m^eme temps que les appareils de mesure, les resultats des deux mesures devraient ^etre identiques : jhS jSz jS ij = jhS jSz jS ij (V -53) ou jS i represente l'etat du systeme S et jS i represente l'etat qu'aurait le systeme si on le tournait, par la rotation R, en m^eme temps que les appareils de mesure. Le passage entre ces deux kets se fait, bien entendu, gr^ace a un operateur de Wigner V 20 : 0
0
0
0
0
0
0
0
0
jS i = V jS i
(V -54)
0
On en deduit donc
Sz = V Sz V 1 (V -55) Cette relation est bien entendu vraie pour tout operateur. Ce qui n'est pas general, c'est par contre que : Sz = S~ : e~z = R3j Sej = V S~ V 1 : e~z (V -56) ou, plus generalement, que : SRei = Rij Sej = V Sei V 1 (V -57) ou R est la rotation dans l'espace de base qui amene le vecteur de base ~ei sur R~ei 21 . En conclusion, on voit que les operateurs U (ou V ) qui permettent de transformer les etats permettent aussi de transformer les operateurs. Les operateurs qui sont invariants sous cette transformation : A = U 1 AU sont dits operateurs scalaires. Au contraire, les operateurs qui se transforment comme S~ sont dits vectoriels car ils se transforment comme des vecteurs ordinaires. On peut ainsi denir des operateurs tensoriels de tout ordre de facon analogue et on peut, a partir de la, demontrer un theoreme tres important en pratique : le theoreme de Wigner-Eckart. Nous n'en dirons pas davantage sur ce theoreme car nous n'en aurons pas besoin dans la suite 0
0
;
0
;
;
;
20: Comme il s'agit d'une rotation active, V = U ;1 ou U = U (R) est l'operateur deni dans le point de vue passif et qui permettrait de faire le passage entre les kets j S i attribue par l'observateur O au systeme S et j S0 i attribue au m^eme systeme par l'observateur O0 tourne par rapport a O par la rotation R. Voir l'appendice IV pour un dessin et davantage d'explications, en particulier l'equation (IV -26). Comparer egalement avec l'equation (IV -48): &ca n'est pas la m^eme chose! 21: On comparera avec inter^et cette relation avec celles donnees dans les equations (II -41) et (II -42). Ce sont evidemment les m^emes et pour les m^emes raisons bien que derivees dieremment.
3
66
V. Un point de vue ni actif ni passif
de ce cours et que de toute facon on peut en trouver l'enonce et la demonstration dans la plupart des livres de mecanique quantique. Pour nir ce chapitre, remarquons qu'il convient de faire particulierement attention au fait suivant. Nous avons vu que dans une transformation passive ou
j i = U ji 0
(V -58)
les valeurs moyennes des operateurs se transforment par le \principe de correspondance" :
hjT ji = M hjT ji 0
(V -59)
ou M est la matrice representant la transformation dans la representation engendree par le tenseur T (exemple : pour l'operateur de spin et les rotations, T = S~ et M = R). Le choix de representation est dicte par le fait que l'on veut retrouver la limite classique et que l'on interprete les valeurs moyennes des operateurs comme des objets classiques, auxquels on impose donc les lois de transformation classiques (le spin n'a pas d'analogue classique mais on lui impose ses lois de transformation par analogie avec celles du moment angulaire). Ceci impose la relation : U T U = M T
(V -60) Or, on peut egalement denir le transforme d'un operateur, comme on l'a vu precedemment, par T = U T U (V -61) Dans le cas d'une rotation par exemple, les T sont les composantes de l'observable T qu'aurait un systeme tourne par rapport au systeme de reference. Les deux relations precedentes indiquent que si une quantite classique engendre une representation irreductible d'un groupe, l'observable quantique correspondante est un tenseur irreductible de m^eme rang, i.e. engendre la m^eme representation et verie donc y
0
y
0
T = U T U = M T
0
y
(V -62)
Par exemple, pour un operateur tensoriel Tij de rang deux, cette relation s'ecrit :
Tij = U Tij U = Rik Rjl Tkl 0
y
(V -63)
Considerons maintenant le cas particulier d'un operateur vectoriel et d'une transformation innitesimale. Dans ce cas, M est simplement la matrice de rotation R de SO(3) et il en va de m^eme pour U : U = eid~ : J~ = 1 + i~ : J~
3
On denit :
V. Un point de vue ni actif ni passif
Ti = Ti ; Ti 0
qui, dans ce cas, vaut :
h i
Ti = ;id j Jj Ti = ;ijk d j Tk La condition necessaire et susante pour qu'un operateur soit vectoriel est donc h i Ji Tj = iijk Tk
67 (V -64) (V -65) (V -66)
Appliquee a J~, on retrouve evidemment l'equation (II -42) et donc l'algebre de Lie de SO(3). L'equation precedente en est la generalisation a un operateur vectoriel quelconque et l'equation (V -62), la generalisation a un operateur tensoriel quelconque. L'invariance par rotation nous a servi, entre autres choses, de galop d'essai pour illustrer les notions de base de la theorie des groupes. Passons maintenant a la theorie quantique relativiste (de Lorentz). Avant d'aborder l'aspect quantique, il est bon d'elargir au groupe de Lorentz, ce que nous avons vu sur l'exemple du groupe des rotations. Ceci est le sujet du chapitre suivant: : :
68
4
CHAPITRE 4
Le groupe de Lorentz SO(3,1) et le groupe de Poincar´e \Science avec patience, Le supplice est s^ur." A. Rimbaud ´ I DEFINITION DES GROUPES DE LORENTZ ET DE POINCARE´
On aura besoin dans tout ce qui suit de la relativite de Lorentz et on doit donc trouver les objets qui engendrent les representations du groupe de Lorentz : scalaires, spineurs de Lorentz, quadri-vecteurs, tenseurs de Lorentz: : : En dernier ressort, ces objets nous permettront de construire des invariants sous le groupe de Lorentz qui seront directement utiles pour la construction des lagrangiens des theories quantiques des champs desquels, en denitive, tout decoulera 1. Commencons par denir ce groupe et pour cela faisons un retour en arriere sur le groupe des rotations. Il est commode de denir le groupe SO(3) des rotations (sur les vecteurs) comme le groupe de transformations de l'espace euclidien qui laisse invariant le carre de la distance entre deux points voisins de cet espace 2 :
ds2 = dx2 + dy2 + dz2
(I -1)
De la m^eme facon, on peut choisir l'espace de Minkowski comme modele de l'espace physique et alors le groupe d'isometrie de cet espace est le groupe dit de Poincare ayant comme sous groupes, le groupe de Lorentz et le groupe des translations a quatre dimensions (il y a en plus de ces groupes continus des operations discretes, dites de renversement du temps et de re%exion). 1: Il y a un \petit detail" qui n'en decoule pas { en tout cas, pas directement { et qui s'appelle la renormalisation. En fait, la renormalisation est, avec l'invariance de Lorentz, ce qui rend la theorie quantique et relativiste des champs assez fondamentalement dierente de la theorie quantique galileenne. 2: Le groupe des rotations est en fait un sous groupe de ce groupe qui contient les symetries miroirs (re#exion), l'inversion qui change ~x ! ;~x et les translations. Les matrices de rotation ont un determinant +1 alors que les re#exions et inversions sont toutes representees par des matrices de determinant ;1 (elles changent l'orientation de l'espace). A noter que les translations agissent sur les points de l'espace euclidien mais pas sur les vecteurs : un vecteur reste invariant par translation.
4
I. Les groupes de Lorentz et de Poincare
69
Le groupe de Poincare (en fait son action sur les quadri-vecteurs) est donc deni comme le groupe agissant sur les coordonnees des points d'un espace de dimension quatre et qui laisse invariant la distance au carre entre deux points voisins, denie par :
ds2 = dt2 ; (dx2 + dy2 + dz2 )
(I -2)
(remarque : un plus et trois moins ou trois plus et un moins = choix de convention). Les proprietes topologiques de l'espace de Minkowski sont identiques a celles de l'espace euclidien R 4 , seules les proprietes metriques sont dierentes. Le choix de cette distance (ou produit scalaire) signie que l'on peut rapporter l'espace de Minkowski a une base (e1 e2 e3 e4) designee generiquement e avec = 0 : : : 3, telle que les (quadri-) vecteurs de cet espace se decomposent en 3 : (sommation sur sous entendue) (I -3) A = A e avec par denition :
e : e =
ou
01 B ;1 = B B@ ;1
;1
1 CC CA
(I -4)
ou le \:" represente par denition le produit scalaire minkowskien. Les e jouent dans l'espace de Minkowski le r^ole joue par une base orthonormee dans l'espace euclidien, a la subtilite, fondamentale, pres qu'il s'agit d'une metrique de signature (+ ; ; ;). sont les composantes du tenseur metrique 4. On l'appelle simplement la metrique. Les A sont appelees les composantes contra-variantes de A dans la base fe g. Avec ces denitions, on a ds2 = dx:dx = dx dx e :e = dx dx (I -5) ce qui est bien la denition donnee precedemment si l'on pose :
x0 = t x1 = x x2 = y x3 = z A
(I -6)
Quelques d´efinitions et conventions
Dans toute la suite, on travaillera dans les unites ou
= 1 et c = 1. Ceci signie simplement que l'on compte les vitesses en unite de la vitesse de la lumiere et donc que v = 1=2, ~
3: Nous soulignerons les quadri-vecteurs pour les distinguer des vecteurs de l'espace euclidien a trois dimensions. A noter que les e , en tant que vecteurs de base, ne sont pas des quadri-vecteurs au sens du groupe de Lorentz, voir la note en bas de la page 23. 4: Nous verrons dans la suite qu'il s'agit bien d'un tenseur. Pour l'instant on le considere comme un ensemble de nombres xes.
4
I. Les groupes de Lorentz et de Poincare
70
par exemple, signie que l'on se deplace a la moitie de la vitesse de la lumiere. De m^eme, on compte les distances en seconde : x = 2 secondes = 2 secondes lumiere =2 3 105km. On peut verier qu'il ne reste qu'une unite independante que l'on peut choisir ^etre celle de la masse et qu'une distance est une inverse masse. Les indices grecs courent sur quatre valeurs : = 0 1 2 3 et les indices latins sur les trois valeurs : i j = 1 2 3. 0 represente la composante \temporelle" : x0 = t. Un evenement P est un point de l'espace de Minkowski = un instant et un lieu. La convention d'Einstein consiste dans ce cas a sommer sur un indice gurant deux fois dans un mon^ome et tel que l'un est situe en exposant (contra-variant) et l'autre en indice (covariant). Nous verrons dans la suite pourquoi dans l'espace de Minkowski, il est commode de denir des indices en haut et en bas. On a par exemple :
dxdx = 00 dx0 dx0 + 11dx1 dx1 + 22 dx2dx2 + 33 dx3dx3 = dt2 ; dx2 ; dy2 ; dz2
(I -7) (I -8)
Coordonnees co- et contra- variantes. On peut pour n'importe quelle base et n'importe quel vecteur denir deux sortes de coordonnees :
A = A e et A = A : e
(I -9)
Ces coordonnees avec indice en bas sont appelees coordonnees co-variantes. Par exemple, pour une base non orthogonale de l'espace euclidien ces deux types de coordonnees ne sont pas confondues : y y1 1
y O Fig.
M x1 x1
x
4.1 - Les deux types de coordonnees, covariantes et contravariantes
Il en va de m^eme dans l'espace de Minkowski et on peut calculer la relation entre ces coordonnees : A = A : e = A e : e = A (I -10) Cette equation peut s'inverser en denissant comme l'inverse de :
=
(I -11)
4
71
I. Les groupes de Lorentz et de Poincare
avec
le symbole de Kronecker ordinaire (remarque : comme est son propre inverse, on a pour chaque element de matrice = .) On en deduit donc
A = A et A = A
(I -12)
Ce qui s'enonce : \ et permettent de descendre et monter les indices." Petit calcul elementaire : A0 = A0 Ai = ;Ai (I -13) on en deduit que et plus generalement
ds2 = dx dx = dx dx = dx dx
(I -14)
A : B = A B = A B = A B = B A
(I -15)
Exercice : Montrer que si A et S sont deux tenseurs respectivement antisyme-
trique et symetrique dans leurs indices, alors A S = 0. En deduire que si T et T sont des tenseurs veriant A T = A T quelque soit le tenseur antisymetrique A alors T et T ne sont pas obligatoirement egaux. Que peut on en deduire sur les parties symetriques et antisymetriques de T et T ? 0
0
0
0
On pose : soit
@ = @ = @ = @ @ = @ = @ = @ , etc: : : @x0 0 t @t @x1 1 x @x ( ) f@ g = @x@ = (@0 @1 @2 @3) = (@t @x @y @z )
On denit de m^eme :
) @ = (@ 0 @ 1 @ 2 @ 3 ) @x et on verie aisement (le faire) que comme pour un quadri-vecteur on a @ = @ : ! @ @ @ @ f@ g = @t ; @x ; @y ; @z
f@ g =
(
(I -16) (I -17)
(I -18)
II. Le groupe SO(3 1)
4 II
72
TRANSFORMATIONS DE LORENTZ ET TRANSLATIONS, GROUPE SO(3,1)
Le point de vue passif est la aussi le plus simple : on imagine deux observateurs ayant chacun leurs axes dans l'espace - temps de Minkowski et decrivant les m^emes evenements : evenement P
(
dans B : (OB e ) : x = (x0 : : : x3) dans B : (OB e ) : x = (x 0 : : : x 3) 0
0
0
0
0
0
(II -19)
On dit qu'il y a entre B et B une transformation de Lorentz et/ou une translation (ou renversement du temps ou re%exion) si les distances minkowskiennes qu'ils attribuent chacun entre deux points voisins sont identiques : 0
ds 2 = ds2 dx dx = dx dx @x
@x @x @x dx dx = dx dx 0
() ()
0
0
0
0
d'ou l'on deduit :
(II -20)
@x
(II -21) @x @x @x = ou les x sont consideres comme des fonctions des x . On deduit de cette equation deux importantes consequences : !2 @x det : det = det =) det @x 6= 0 (II -22) @x @x 0
0
0
0
0
et donc la transformation qui fait passer des x aux x est inversible. D'autre part en derivant par rapport a x : 0
@2x
2 x @x
@x @ @x @x @x + @x @x @x = 0 que l'on reecrit avec des notations evidentes : 0
0
0
0
A( ) + A( ) = 0
(II -23) (II -24)
ou A est symetrique dans les deux indices entre parentheses. Si l'on echange avec : et avec :
A( ) + A() = 0
(II -25)
A() + A( ) = 0
(II -26)
II. Le groupe SO(3 1)
4
73
En faisant (II -24) + (II -25) ; (II -26) on obtient : 2 x @x
@ @x @x @x = 0 0
En se servant de (II -22) on deduit :
0
(II -27)
@2x = 0 (II -28) @x @x et donc les x sont des fonctions lineaires des x (ce qui etait loin d'^etre evident au depart et a des consequences miriques): 0
0
x = + : : x + a 0
(II -29)
ou + est une matrice 4 4 et a un quadri-vecteur, tous deux etant independants de x. Matriciellement, l'indice nord-ouest de + est l'indice de ligne et l'indice sud-est celui de colonne. On verra dans la suite que l'aspect matriciel de ces operations n'est pas tres interessant m^eme s'il n'est pas forcement mauvais au debut de comprendre la correspondance entre le calcul tensoriel que nous sommes en train de mettre au point et le calcul matriciel (en fait, voir la suite, il faut se convaincre que le recours aux matrices n'est jamais utile). La relation (II -29) n'est que necessaire) pour ^etre susante il faut s'assurer que le ds2 est invariant, soit 5 :
+ : :+ : : =
(II -30)
Cette relation denit les matrices + des transformations de Lorentz. On peut en donner une construction explicite en resolvant cette equation (ce que nous ferons dans la suite dans le cas particulier des transformations de Lorentz suivant l'axe x) mais, dans bien des cas, c'est inutile car la relation precedente est souvent susante a notre bonheur. Le sous-ensemble de ces matrices de determinant +1 forme un groupe appele SO(3 1) car il preserve la metrique minkowskienne contenant trois ; et un +. Le groupe complet, i.e. qui contient egalement les translations s'appelle le groupe de Poincare. A
Quelques remarques sur le calcul tensoriel et le groupe de Poincar´e
Il est immediat de montrer que l'ensemble des matrices + forme un groupe appele le
groupe de Lorentz. A partir de la relation (II -30) on deduit immediatement que (det +)2 = 1 et donc que det + = 1. On verra que le groupe de Lorentz contient comme sous groupe le groupe des rotations SO(3) a trois dimensions (ce qui est evident) et l'ensemble des transformations propres de Lorentz (celles dont on a l'habitude). Ces transformations sont toutes de determinant 5: La relation suivante s'ecrit matriciellement : t ' ' = . Le verier.
II. Le groupe SO(3 1)
4
74
+1 car elles ne changent pas l'orientation de l'espace - temps. En prenant la condition (II -30) pour = = 0, on trouve que (+00)2 = 1 +
3 X
i=1
(+i0 )2 1
On a donc deux solutions : ( 0 + 0 1 pas de renversement du temps +00 ;1 avec renversement du temps
(II -31)
(II -32)
On appelle L+ le groupe de Lorentz propre (det + = +1) orthochrone (+00 1, i.e. pas de renversement du temps). C'est celui qui nous interessera le plus souvent. Les transformations de re%exion et de renversement du temps correspondent aux matrices de transformation : 01 1 B ;1 CC S=B B@ CA (II -33) ;1 ;1 et 0 ;1 1 B CC 1 T =B B@ (II -34) A 1 C 1 "
Nous avons choisi de mettre les indices de + en position nord-ouest et sud-est : + :: . Ce choix
etait evidemment dicte par la volonte d'obtenir pour + : x un indice en haut comme c'etait le cas pour x . Ainsi, l'indice de ligne de + est en haut et pour que la convention d'Einstein s'applique il faut que l'indice de colonne soit en bas. Pour l'instant +: : n'a pas de sens (non plus que + ou + ). Toute la beaute du calcul tensoriel vient de ce que la matrice inverse de + : : est obtenue, comme on va le voir, a partir de + en montant et descendant les indices. En eet : 0
+ :: + : : = =) + :: = (+ 1): : ;
et donc
(+ 1): : = + : : Denissons une nouvelle matrice par ;
+: : = + ::
(II -35) (II -36)
II. Le groupe SO(3 1)
4
75
c'est a dire que l'on manipule les indices comme s'il s'agissait d'indices de quadri-vecteurs. On trouve alors : +: : = (+ 1): : = (t+ 1) :: soit encore +: : + :: = (II -37) L'inverse matriciel est donc tres simple a calculer : il sut de monter et descendre les indices gr^ace a la metrique. Mais en fait, il y a encore mieux car on va maintenant voir que l'on n'a jamais a considerer explicitement cet inverse non plus que la matrice transposee, la position des indices susant a coder toute l'information. Commencons par les vecteurs de base 6 . ;
;
x = x e = x e = +: : x e 0
0
0
soit
e = e +: : ou e = +: : e On en deduit les transformations des coordonnees covariantes : 0
0
(II -39)
x = x:e = x : +:: e
(II -40)
x = +: : x
(II -41)
0
et donc :
(II -38)
0
0
On voit donc que la base se transforme comme les composantes covariantes (d'ou leur nom).
Exercice : Montrer que la relation (II -30) signie que le tenseur metrique est un
tenseur invariant. A t'on egalement un tenseur metrique invariant dans le cas euclidien? Les points fondamentaux a remarquer sont : 1) Les composantes covariantes se transforment par la transposee de la matrice inverse des composantes contravariantes. C'etait previsible car on a vu que ds2 = dx dx est invariant et donc que dx et dx doivent se transformer de facon inverse. De facon generale on a :
A : B = A B
(II -42)
est un scalaire de Lorentz. Le produit scalaire minkowskien realise avec la metrique est bien la generalisation a l'espace de Minkowski du produit scalaire euclidien. 6: Il n'est pas inutile de mettre en regard de cette discussion, celle faite pour les rotations.
4
III. Les transformations speciales de Lorentz et les rotations
76
2) On voit maintenant tout l'inter^et des indices co- et contra- variants : on a jamais a utiliser explicitement les matrices + 1 ou t +, seules les +: : et +: : importent. Les seules choses qu'il est bon d'avoir a l'esprit pour transformer correctement un quadri-vecteur sont : i) que l'on passe de l'une a l'autre forme de ces matrices en montant et descendant les indices comme s'il s'agissait d'indices de quadri-vecteurs, ii) que la transformation se fait en mettant la matrice + a gauche du quadri-vecteur et en sommant sur les indices voisins l'un en haut l'autre en bas, et iii) que les matrices + sont denies par l'Eq.(II -30). La position des indices est alors automatiquement correcte. Ainsi on a par exemple : ;
A 1 B 1 C 1 = +1 2 +1 2 + 1 2 A2 B2 C 2 0
III
0
(II -43)
0
´ LES TRANSFORMATIONS SPECIALES DE LORENTZ ET LES ROTATIONS
On va considerer dans un premier temps les transformations qui changent x0 et x1 en laissant invariants x2 et x3 (transformation le long de l'axe Ox) et pour lesquelles il n'y a pas de translation (a = 0). On veut donc que (dx 0)2 ; (dx 1)2 = (dx0)2 ; (dx1 )2 0
(III -44)
0
Comme il s'agit d'une rotation d'un angle imaginaire 7, la parametrisation la plus generale de ces transformations est : 0 01 0 1 0 x0 1 ; sinh BB xx 1 CC B ; cosh CC BB x1 CC BB 2 CC = BB sinh cosh (III -45) A B@ x2 CA 1 C @ x3 A @ 1 x3 x 0 0 0 0
est appele la rapidite. C'est le parametre pertinent des transformations de Lorentz. Il est similaire a ~ pour les rotations mais il n'est pas borne et varie entre ;1 et +1. Pour cette raison, le groupe de Lorentz n'est pas un groupe compact contrairement au groupe des rotations. L'origine de certaines dierences entre les deux groupes que nous verrons par la suite vient de la. Pour relier la rapidite a la vitesse du deuxieme referentiel par rapport au premier, on considere un point xe par rapport au referentiel prime (l'origine par exemple) : x 1 = constante. On a alors : dx1 = tanh ; sinh x0 + cosh x1 = x 1 =) v = dx (III -46) 0 ou v est la vitesse de ce point par rapport au referentiel d'origine et est donc aussi lapvitesse du referentiel prime par rapport au premier referentiel. On en deduit que cosh = 1= 1 ; v2 et 0
0
7: On passe de la metrique euclidienne a la metrique minkowskienne en changeant x0 ! ix0 .
4
III. Les transformations speciales de Lorentz et les rotations
77
p
sinh = v= 1 ; v2 ce qui redonne la forme habituelle des transformations de Lorentz le long de l'axe Ox. Suivant l'usage anglo-saxon, on appelle aussi ces transformations les transformations speciales de Lorentz ou les boosts pour les distinguer des rotations qui forment un sous groupe de SO(3 1) 8. A
Les alg`ebres de Lie de SO(4) et de SO(3,1)
1 LE CAS EUCLIDIEN
On va commencer par etudier l'ensemble des isometries d'un espace euclidien a quatre dimensions qui est un peu plus simple conceptuellement que celui de l'espace de Minkowski. Dans cet espace, le produit scalaire est le produit scalaire ordinaire entre vecteurs a quatre composantes, si bien que la metrique est simplement le kronecker a quatre indices . Il n'y a donc pas de distinction entre indices co- et contra- variants (dans une base orthonormee) : x = x et la relation de conservation de la longueur analogue a (II -30), dans une transformation x = R x (III -47) est :
R R = (III -48) soit : t R = R 1 . R est donc, bien entendu, une matrice orthogonale 4 4 comme on aurait pu le prevoir d'emblee et le groupe de ces matrices est SO(4). Tout comme pour SO(3), et d'ailleurs pour n'importe quel groupe de Lie, il existe ici aussi un jeu de generateurs innitesimaux clos sous l'action du commutateur et tels qu'une transformation nie s'obtient par exponentiation (pour les transformations connexes a l'identite). Pour trouver les generateurs et surtout leur algebre, on eectue une transformation innitesimale : R = + (III -49) La relation (III -48) devient au premier ordre en : + = 0 =) = ;
(III -50) Matriciellement, cela donne 0 0 d d d 1 1 2 3 B C ; d 0 d ; d B 1 3 2 C = B (III -51) @ ;d 2 ;d 3 0 d 1 CA ;d 3 d 2 ;d 1 0 0
;
0
0
0
0 0
0
8: On peut montrer que toute transformation de Lorentz peut se decomposer de facon unique en produit d'une rotation et d'une transformation speciale de Lorentz. Mais attention, l'ensemble des transformations speciales ne forme pas un sous groupe car le produit de deux transformations speciales de Lorentz donne en general le produit d'une transformation speciale et d'une rotation : l'ensemble des transformations speciales n'est pas clos, voir l'algebre de Lie de SO(3 1), Eq.(III -65).
4
III. Les transformations speciales de Lorentz et les rotations
78
On reconna^t evidemment dans la sous matrice 3 3 en bas a droite (par exemple) la matrice des parametres d'une rotation innitesimale dans le sous espace R 3 a trois dimensions orthogonale a x0 . Les trois generateurs correspondant : 0: : : : 1 0: : : :1 0: : : :1 B : : : : CC B C B C J1 = Jx = B B@ : : : ;i CA ) J2 = Jy = BB@ :: :: :: i: CCA ) J3 = Jz = BB@ :: i: ;: i :: CCA : : i : : ;i : : : : : : (III -52) sont simplement les extensions a quatre dimensions des generateurs deja vus dans le chapitre sur le groupe des rotations a 3D (c'est pourquoi on les note de la m^eme de la m^eme facon m^eme s'il ne s'agit pas des m^emes matrices). Il y a trois nouveaux generateurs (hermitiens) : 0 : : : ;i 1 0 : : ;i : 1 0 : ;i : : 1 C C B B B i : : : CC (III -53) K1 = B B@ : : : : CA ) K2 = BB@ i: :: :: :: CCA ) K3 = BB@ :: :: :: :: CCA i : : : : : : : : : : : Une rotation nie s'ecrit : R = ei(~:J~+~ :K~ ) (III -54) L'algebre de Lie de SO(4) s'ecrit : 8 > > &Ji Jj ] = iijk Jk 0
0
0
0
0
> < &Ji K j ] = iijk K k > > > : &K i K j ] = iijk Jk 8 1 > > < Ai = 2 (Ji + K i) > > : B = 1 (J ; K ) 0
0
Posons par denition :
0
(III -55)
0
0
i
(III -56)
i 2 i Il est facile de verier que l'algebre de Lie de SO(4) devient : 8 > > &Ai Aj ] = iijk Ak 0
> < &Bi Bj ] = iijk Bk (III -57) > > > : &Ai Bj ] = 0 Les Ai et les Bi verient donc deux algebres de Lie de SO(3) (ou SU (2) puisque c'est la m^eme) independantes (car ils commutent entre eux). On a donc : Lie (SO(4)) = Lie (SO(3)) Lie (SO(3))
(III -58)
4
III. Les transformations speciales de Lorentz et les rotations
79
Les representations de cette algebre sont obtenues en prenant par exemple : Ai = 1 Ji(j2) et Bi = Ji(j1) 1 (III -59) ou Ji(j1 )(j2 ) sont les representants des generateurs du groupe SU (2) dans la representation de dimension 2j12 + 1 (A~ 2 = j2 (j2 + 1)1 B~ 2 = j1 (j1 + 1)1) respectivement : Ji(1=2) = i=2, Ji(1) = matrice 3 3 appelees Ji dans ce cours, etc: : : Donc une representation de SO(4) est equivalente au produit tensoriel de deux representations de SU (2) : les objets se transformant par cette representation sont etiquetes par jj1 m1 ) j2 m2 i = jj1 m1 i jj2 m2 i et m1 2 &;j1 +j1], m2 2 &;j2 +j2]. 2 LE CAS MINKOWSKIEN
Forts de ces connaissances sur le cas euclidien nous pouvons revenir au cas minkowskien. On developpe de nouveau au premier ordre la matrice + en : + = + (III -60) et pour que ce soit une transformation de Lorentz, + doit verier la relation (II -30) qui se traduit sur par : + = 0 =) = ;
(III -61) ou encore, matriciellement : 0 0 ;d ;d ;d 1 1 2 3 ( 0 i B C i=0 ; d 0 d ; d B 1 3 2 C =B = ) (III -62) @ ;d2 ;d 3 0 d 1 CA i j = ;j i ;d3 d 2 ;d 1 0 On reconna^t dans la sous matrice 3 3 en bas a droite la matrice des parametres innitesimaux d'une rotation dans le sous espace des trois dimensions spatiales. d~ contient les parametres innitesimaux des transformations speciales de Lorentz (voir l'equation (III -45)). Les generateurs du groupe de Lorentz sont donc les trois Ji deja denis en (III -52) et les generateurs des boosts (les positions des indices de ces matrices sont (Ki) ) : 0: 1 : :1 0: : 1 :1 0: : : 11 B 1 : : : CC B C B C Kx = B B@ : : : : CA ) Ky = BB@ 1: :: :: :: CCA ) Kz = BB@ :: :: :: :: CCA (III -63) : : : : : : : : 1 : : : que l'on a choisi hermitiques, choix qui implique que 9
= ;d~:K~ + id~ :J~ =) + = e
~:K~ +i~:J~
;
(III -64)
9: On notera que cette relation ne permet pas l'identication directe de et ~ avec une rapidite et un angle car ' = exp ;~:K~ + i~:J~ 6= exp ;~:K~ exp i~:J~ car (J K ] 6= 0.
4
III. Les transformations speciales de Lorentz et les rotations
80
+ n'est donc pas unitaire car il n'y a pas de i en facteur du terme de boost ~:K~ , dans l'exponentielle. Ceci est une illustration du theoreme general enonce dans l'encadre III, stipulant qu'un groupe non compact n'a pas de representation unitaire de dimension nie. On peut remarquer que l'on a ecrit les generateurs de Lorentz en fonction d'operateurs J~ et K~ qui sont des vecteurs pour les rotations. On peut reecrire cela de facon plus covariante de Lorentz : + = exp(;i=2 J ) ou et J contiennent respectivement les parametres et les generateurs des boosts et des rotations, voir encadre V. Calculons l'algebre de Lie de SO(3 1) : 8 > > &Ji Jj ] = iijk Jk
> < &Ji Kj ] = iijk Kk (III -65) > > > : &Ki Kj ] = iijk Jk On a donc formellement la m^eme algebre que pour SO(4), la seule dierence residant dans le
fait que les matrices + ne sont pas unitaires. On pose de facon similaire : 8 1 > > < Ni = 2 (Ji + Ki) > > : Qi = 1 (Ji ; Ki) 2 qui sont bien entendu hermitiques et verient : 8 > > &Ni Nj ] = iijk Nk
(III -66)
> < &Qi Qj ] = iijk Qk (III -67) > > > : &Ni Qj ] = 0 Il s'agit donc de nouveau de deux algebres de SU (2). Les representations sont donc de nouveau etiquetees par deux entiers ou demi-entiers j1 et j2 . Le point remarquable est que Jz = N3 + Q3 et donc que le j de J~ 2 = j (j +1)1, qui est egal a la valeur propre la plus haute de Jz , j = mmax, est egalement la somme de la valeur propre la plus grande de N3, j2 = m2max, et de la valeur propre la plus grande de Q3 , j1 = m1max : j = j1 + j2 = \spin" de la representation (III -68) On emploie ici un vocabulaire quantique car la correspondance devrait commencer a ^etre claire. On peut deja en deduire les dierents types de representation que l'on a : spin 0 : j1 = 0 = j2 =) Ji = Ki = 0. Il s'agit de la matrice de transformation identite et c'est donc la representation scalaire engendree par exemple par ds2 et A : B.
4
III. Les transformations speciales de Lorentz et les rotations
V. Algebre de Lie de SO(3,1) et operateurs tensoriels
Nous avons ecrit l'algebre de Lie de SO(3 1) en fonction des generateurs des rotations et des boosts. Ces generateurs sont des operateurs vectoriels pour les rotations (le verier pour les boosts). On peut logiquement s'attendre a ce que, comme pour les generateurs de SO(3), les generateurs de SO(3 1) forment un tenseur pour ce groupe. Montrons le et deduisons en une forme evidemment covariante de l'algebre de Lie. Remarquons que pour une transformation innitesimale, on peut reecrire (III -60) sous la forme :
+ = 1 ; 12 i J =) + = ; 12 i J
avec J = ;J puisque est antisymetrique. Attention, il ne faut pas confondre les indices et avec des indices d'elements de matrice : pour un et un particulier, J est dont une matrice 1
= pour que les elements de matrice sont notes J . On doit bien s^ur avoir ; 2 i J (III -60) soit veriee. On en deduit que (le verier) : (J ) = i ;
. Il est facile (et pas ininteressant) de voir que ceci entra^!ne
(
J0i = ;iKi Jij = ijk Jk
(III -69)
et donc que les six J (six a cause de l'antisym sont les generateurs des boosts et des rotations. etrie) 1 Pour une transformation nie, on a + = exp ; 2 i J , si bien que l'on traite de fa&con symetrique boosts et rotations. contient, a la fois, les parametres du boost et de la rotation. L'algebre de Lie de SO(3 1) peut evidemment s'ecrire en fonction de ces J :
h
i J J = i ( J ; J + J ; J )
(III -70)
C'est un excellent exercice de retrouver l'equation precedente en notant que les generateurs peuvent tres commodement s'ecrire J = i(jih j ; j ihj) et que le produit scalaire est, bien entendu, minkowskien : h ji = . L'algebre de Lie de SO(3 1) est, si l'on veut bien y re#echir un peu, la plus simple (la seule? le verier) dont le membre de droite est lineaire et respecte l'antisymetrie des J .
Elle signie aussi que les J forment un operateur tensoriel antisymetrique a deux indices, tout comme l'algebre de Lie de SO(3) signie que les Ji forment un operateur vectoriel (on verra dans le cas quantique que U (+)J U (+) = + + J et que pour une transformation innitesimale, cette relation se ramene a l'algebre de Lie). y
8 > < j1 = 1=2 et j2 = 0 spin 1/2 : >: ou j1 = 0 et j2 = 1=2
dite (1=2 0) dite (0 1=2)
81
4
82
III. Les transformations speciales de Lorentz et les rotations
Pour la (1=2 0) : Q~ = ~ =2 1 = ~ =2 et N~ = 1 ~0 = ~0 =) J~ = ;K~ = ~ =2 les matrices de transformation sont donc :
M1(~ ~) = e+~: ~2 +i~: ~2
(III -71)
Pour la (0 1=2) : Q~ = ~0 1 = ~0 et N~ = 1 ~ =2 = ~ =2 =) J~ = K~ = ~ =2 les matrices de transformation sont donc :
M2(~ ~) = e ~: ~2 +i~: ~2 (III -72) Les objets qui se transforment par M1 et M2 sont clairement des objets a deux composantes complexes. On constate que pour une rotation pure (~ = ~0), M1 et M2 sont confondues et sont les matrices de SU (2) qui transforment les spineurs sous les rotations. Les objets de type 1 et 2, i.e. qui se transforment respectivement par M1 et M2 dans un changement d'axes dans l'espace de Minkowski, sont des spineurs de spin 1/2 que seul le comportement dans les boosts dierencie. Nous reviendrons dans la suite sur la signication physique de cette dierence. Pour l'instant faisons quelques remarques. ;
B Construction de la relation SO(3,1) - SL(2,C )
L'ensemble des matrices M1 (et idem pour M2 evidemment) est le groupe SL(2 C ) :
S : det M1 = 1 L : lineaire, i.e. aucune contrainte d'unitarite ou autre 2: 2 2 C : a coecients complexes. ! a c M 2 SL(2 C ) () M = b d ad ; bc = 1 Ce groupe depend de 6 parametres reels comme SO(3 1) (s'en assurer). Comme on le verra, SL(2 C ) joue pour SO(3 1) le r^ole que SU (2) joue pour SO(3) : c'est le recouvrement universel de SO(3 1). A partir des representations fM1 g et fM2g de SL(2 C ) on pourra construire toutes les autres. Construisons explicitement un homomorphisme qui envoie les matrices de SL(2 C ) sur les matrices de SO(3 1). La construction est analogue a celle faite pour l'homomorphisme entre SU (2) et SO(3), voir page 29. 1) On denit = (1~ ). Une matrice hermitique quelconque X peut se parametriser par : ! t + z x ; iy X = x = x + iy t ; z (III -73)
4
III. Les transformations speciales de Lorentz et les rotations
83
On a deja vu qu'alors x = 1=2 Tr(X ). 2) det X = (x0 )2 ; (~x)2 = x2 3) On denit l'application +M agissant sur les matrices hermitiques X par :
X = +M (X ) = MXM 0
y
avec M 2 SL(2 C )
Cette application conserve eectivement l'hermiticite car
X = MXM = X 0y
y
y
0
X peut donc aussi se decomposer sur les , soit : X = x . Elle conserve aussi le determinant : det X = det X et donc x 2 = x2. Il doit donc exister une transformation de SO(3 1) entre x et x . Appelons de nouveau + (en omettant l'indice M ) cette transformation : x = + x (III -74) Nous avons ainsi construit, a partir d'une transformation M de SL(2 C ) sur les matrices hermitiques X (x ), une transformation +M de SO(3 1) sur les quadri-vecteurs x et donc un homomorphisme de SL(2 C ) vers SO(3 1). 4) On peut trouver explicitement + en fonction de M (il s'agit en fait de M2 , voir la suite) : (III -75) x = 21 Tr(X ) = 12 Tr Mx M (III -76) (III -77) = 12 Tr M M x 0
0
0
0
0
0
0
0
0
y
y
soit :
+ = 21 Tr M M y
(III -78)
Donc, comme on devait s'en douter, cette representation n'est pas dele car, comme pour SU (2), les deux matrices M sont associees a la m^eme matrice +. L'homomorphisme inverse de SO(3 1) vers SL(2 C ) est bi-value. Mais il y a du nouveau. Dans le cas de SU (2) les matrices de SU (2) forment evidemment une (auto-) representation de SU (2) et les matrices complexes conjuguees (representees indieremment par une etoile ou une barre) forment une representation equivalente car :
U 2 SU (2) =) U = U
1
;
4
III. Les transformations speciales de Lorentz et les rotations
84
avec la matrice du tenseur antisymetrique. Il n'en est pas de m^eme pour SL(2 C ) car M ! M est un endomorphisme de SL(2 C ) qui n'est pas une equivalence. Or comme nous allons le montrer, fM2g est equivalent a fM1 g et n'est donc pas equivalent a fM1 g. Les ensembles de matrices fM1 g et fM2g forment donc deux representations inequivalentes de SO(3 1), chacune etant bi-valuee : M1 (~ ~) ! +(~ ~) et M2 (~ ~) ! +(~ ~). Decomposons les etapes de la preuve. 1) Montrons que i t = ; i . Il est facile de verier explicitement que i est symetrique pour tout i = 1 2 3. On a donc :
~ = t (~ ) = t~ t = ;t~
(III -79)
d'ou le resultat en prenant le conjugue et en multipliant a droite par 1 . 2) On en deduit que M2 (~ ~) = M1 (~ ~) 1 ;
;
M1 1 = e i(~+i~)~ =2 1 = ei(~+i~)~=2 le montrer = M2 (~ ~) C.Q.F.D.
;
;
;
(III -80)
Il y a donc deux homomorphismes inequivalents de SL(2 C ) vers SO(3 1) et nous n'en
avons construit qu'un jusqu'a maintenant. Montrons que c'est celui qui envoie les matrices M2 sur les +. Pour cela, construisons explicitement la transformation ~ de Lorentz induite sur x par une transformation X = M2 XM2 avec M2 = exp ; :~ =2 = cosh =2 1 ; sinh =2 z pour ~ = z^. Dans ce cas : ! cosh = 2 ; sinh = 2 0 M2 = (III -81) 0 cosh =2 + sinh =2 = M2 y
0
y
On trouve alors
2 0 3 2 2 1 2) X = ((cc2;;ss)2()(xx1++xix)2 ) ((cc +;ss)2 ()(xx0 ;;xix 3) avec c s = cosh sinh =2. On en deduit que 0
!
(III -82)
! ! 0 ! x0 = cosh ; sinh x (III -83) 3 ; sinh cosh x3 x Nous avons donc explicitement montre qu'a la transformation M2(0 z^), correspond la transformation de Lorentz selon l'axe Oz de rapidite , +(~0 z^). Comme le sous groupe des rotations 0 0
4
85
IV. La Parite
a deja ete etudie, la preuve est complete. La relation (III -78) est donc en fait valable pour les matrices M2 et seulement pour elles. Quid de M1 ? La relation entre +(~ ~) et M1 (~ ~) s'obtient trivialement en se servant de l'Eq.(III -80). On construit les matrices ~ = 1 = (1 ;~ ) qui forment evidemment aussi une base des matrices 2 2. On construit de m^eme les matrices X~ = x ~ et on considere le m^eme type de transformation qu'auparavant mais avec les matrices M1 cette fois ci : X~ = ~ 1 . Il est alors elementaire de montrer en prenant le complexe conjugue de X = M2 XM2 M1 XM et en se servant de (III -80) que ~ 1 X = M2 XM2 =) X~ = M1XM (III -84) ;
0
y
0
0
y
y
0
On en deduit donc que
y
+ = 12 Tr M1 ~ M1 ~ y
(III -85)
On deduit des relations precedentes que M2 M2 = + y
M1 ~ M1
y
(III -86)
= + ~
Ces equations sont les extensions au groupe de Lorentz de l'equation (II -41). Elles impliquent que les et ~ forment deux operateurs quadri-vectoriels (inverses par parite). La dierence et l'inter^et physique de ces deux representations viennent de leur comportement dans la parite (re%exion des trois axes x^ = ;x^ y^ = ;y^ z^ = ;z^). On constate d'ailleurs que le passage de X a X~ , et donc de M1 a M2 , revient a changer les composantes d'espace de signe, en laissant invariante la composante temporelle. Il s'agit donc d'une operation de re%exion. 0
IV
0
0
LA PARITE´
Petite remarque preliminaire : le produit vectoriel de deux vecteurs (a trois dimensions) n'est pas tout a fait un vecteur. En eet : Cx = (A~ ^ B~ )x = Ay Bz ; Az By (IV -87) et c'est donc, en fait, un tenseur a deux indices antisymetriques. En fait gr^ace au tenseur completement antisymetrique ijk , on peut \transformer" un tenseur a deux indices antisymetriques en un vecteur : Ci = ijk Aj Bk (IV -88)
4
86
IV. La Parite
Il est facile de voir que comme ijk est un tenseur invariant sous les rotations de SO(3), A~ ^ B~ se comporte bien dans les rotations comme un vecteur, mais qu'il est invariant dans une transformation (active) de parite qui consiste a changer les vecteurs en leurs opposes : (A~ ^B~ ) = (;A~ ) ^ (;B~ ) = A~ ^ B~ . On l'appelle pour cette raison un pseudo-vecteur. Par extension, tout vecteur qui est invariant dans une re%exion est appele un pseudo - vecteur. C'est le cas du champ magnetique et c'est la raison pour laquelle, par exemple, la force de Lorentz d'un champ magnetique sur une charge q est un produit vectoriel : F~ = q~v ^ B~ . On a vu dans la note en bas de la page 23 que Vi = Vi ; (~ ^ V~ )i et donc pour que V~ et V~ soient des vecteurs, il faut que ~ soit un pseudo - vecteur. On peut le verier dans le cas innitesimal sur la forme de la matrice des parametres innitesimaux, Eq.(III -51) (et commentaires suivants). Il n'en est pas de m^eme de la rapidite ~, Eq.(III -62). 0
0
0
z φ φ O
x’
θ y
y’
O’
θ x Fig.
z’
4.2 - Deux observateurs inverses l'un par rapport l'autre
Reprenons cette discussion de facon plus imagee. Considerons 2 observateurs dont les reperes sont inverses comme sur la gure 4.2. Imaginons que l'on fasse subir la m^eme rotation d~ = d z^ a chacun des reperes. Dans les deux cas la rotation va de Ox vers Oy, donc
!# ! ! " !# ! ! " 1 x1 x 1 x2 (IV 89) x 1 = 1 + d 2 = 1 et + d y2 ;1 y1 ;1 y2 y1 0
0
0
0
ce qui est evident puisque (x1 y1) = (x2 y2) =) (x1 y1) = (x2 y2). Or, si chacun des observateurs ramene l'espace a sa propre base, les matrices numeriques representant les (J^x1 J^y1 J^z1 ) et les (J^x2 J^y2 J^z2 ) sont les m^emes : Jx(1)1 = Jx(2)2 , etc: : : Ils s'accordent donc a dire que 0
d 1 = d 2
0
0
0
(IV -90)
bien que z^1 = ;z^2 . d~ est donc bien un pseudo - vecteur. Il indique un sens de rotation (qui est le m^eme pour les deux observateurs) et non une direction de l'espace 10 . Par contre, pour 10: C'est ce qui permet de comprendre que SO(4) a six generateurs et non quatre, comme on pourrait na%!vement le croire en supposant qu'il y a quatre \axes de rotation" independants. En fait, il y a six plans
4
IV. La Parite
87
un boost parallele a Oz dans le m^eme sens que z^, les coordonnees de ~ changent entre les deux observateurs. Explicitement :
! ! ! ! ! ! t 1 = cosh 1 sinh 1 t1 et t 2 = cosh 2 sinh 2 t2 (IV 91) z1 sinh 1 cosh 1 z1 z2 sinh 2 cosh 2 z2 0
0
0
0
comme on a (t2 z2 ) = (t1 ;z1 ) et donc (t2 z2 ) = (t1 ;z1 ), on deduit que 0
0
0
0
2 = ;1
(IV -92)
ce qui est en accord avec notre dessin. La parite, en tant que symetrie (violee ou non), ainsi que les spineurs, ne sont vraiment interessants que dans le cadre quantique. Placons nous donc dans ce cadre. On adoptera dans la suite le point de vue passif ou on a deux observateurs inverses spatialement l'un par rapport a l'autre : les coordonnees d'espace classiques d'un m^eme evenement sont opposees pour les deux observateurs et le temps est identique pour les deux. Les vitesses ont par consequent des composantes opposees. D'apres notre principe de correspondance, on choisit donc quantiquement de prendre : 8 > < UP Xi UP = ;Xi (IV -93) U Pi UP = ;Pi > : UPP UP = UP UP = 1 ou UP est l'operateur representant la transformation de parite dans l'espace de Hilbert 11. On deduit de cela que le moment cinetique orbital, L~ = X~ ^ P~ est invariant par parite. On retrouve bien ainsi la discussion classique. Par analogie avec la partie orbitale, on suppose qu'il en est de m^eme du spin. L'operation de parite inversant les vitesses, on suppose donc aussi par analogie avec le cas classique que UP Ki UP = ;Ki (IV -94) ou par abus de langage, on note encore Ki le generateur des boosts de Lorentz dans l'espace de Hilbert. Le point qui nous interesse pour la suite est que les deux representations de spin 1/2 sont echangees par parite comme on peut le voir immediatement sur (III -71) et (III -72). Ceci y y y
y
y
perpendiculaires independants dans un espace de dimension quatre : (t x) (t y) : : : (y z ) et donc six rotations independantes. Ces rotations ne peuvent pas ^etre reperees par seulement un vecteur. Le raisonnement est identique pour SO(2) ou il y a un seul generateur car il n'y a qu'un plan independant (dans un espace de dimension deux ! ), bien qu'il y ait deux axes perpendiculaires de coordonnees. 11: Comme UP est une operation discrete, il n'est pas a priori trivial que ce soit un operateur lineaire puisque le theoreme de Wigner permet l'existence d'operateurs anti - lineaires pour lesquels A(ji) = Aji. On peut facilement se convaincre que UP doit ^etre lineaire en veriant que l'algebre entre X et P n'est preservee par l'operation de parite que dans ce cas. Le montrer. L'invariance par parite d'une theorie quantique de particules est donnee par la condition : (UP H ] = 0
4
IV. La Parite
88
signie (comme on pourrait le montrer plus precisement) que si un observateur attribue a un objet quantique, un vecteur d'etat qui est un spineur se transformant par exemple par M1 lors des transformations de Lorentz, alors l'autre observateur attribuera au m^eme objet, un spineur se transformant par M2. Ainsi, si l'on a invariance par parite, les deux observateurs trouveront les m^emes resultats pour toutes leurs mesures et aucune des representations M1 ou M2 ne sera privilegiee par rapport a l'autre : les deux orientations de l'espace sont dans ce cas equivalentes et les deux types de spineurs doivent intervenir symetriquement dans n'importe quelle loi physique. Il n'est pas mauvais de retrouver ce resultat en raisonnant dans le point de vue actif. Dans ce point de vue, dire qu'une theorie est invariante par parite, revient a dire que si un systeme est decrit par un spineur se transformant par M1 , alors le systeme obtenu en eectuant une inversion doit lui aussi exister, doit ^etre decrit par un spineur se transformant par M2 et doit obeir aux m^emes lois que le systeme initial. Dit autrement, une telle theorie doit traiter sur un pied d'egalite les deux types de spineur, tout comme une theorie invariante par rotation doit traiter toutes les composantes d'un vecteur de facon identique. Ainsi, et pour la m^eme raison qu'il est avantageux de reunir dans un m^eme triplet les composantes d'un vecteur, il va ^etre commode, pour les theories invariantes par parite, de reunir dans un m^eme quadruplet deux spineurs de chaque type :
= L R
!
(IV -95)
ou L et R se transforment par M1 et M2 respectivement. Se transformant dieremment, ce sont des objets independants. Il ne faut pas se laisser abuser par les notations ! 12 On appelle bi-spineur, ces \spineurs" a quatre composantes. Ces bi-spineurs forment des representations reductibles du groupe de Lorentz et des representations irreductibles du groupe forme de Lorentz et de la parite, comme nous le verrons par la suite. Si la theorie consideree n'est pas invariante par parite, comme c'est le cas de l'interaction faible, alors les deux types de spineur ne jouent pas le m^eme r^ole dans la theorie, c'est a dire ne sont pas couples de la m^eme facon aux autres champs (vectoriels en particulier) de la theorie. Avant d'aborder les bi-spineurs, apprenons a former des scalaires et des quadri-vecteurs a partir des spineurs. Ceci sera tres utile dans la suite lorsqu'on cherchera a construire des lagrangiens invariants de Lorentz. 12: Il n'est pas rare que l'on designe par la m^eme lettre, a l'indice pres, les composantes d'un vecteur, V~ = (V1 V2 V3 ). Ceci ne signie pas que ces composantes ne sont pas independantes.
4
89
V. Spineurs, scalaires et quadri-vecteurs
V COMMENT FAIRE DES SCALAIRES ET DES QUADRI-VECTEURS AVEC DES SPINEURS
Il est important de savoir fabriquer des scalaires avec les spineurs car, en dernier ressort, c'est ce dont nous aurons besoin pour construire les lagrangiens des theories quantiques des champs faisant intervenir des particules de spin 1=2 (les lagrangiens sont des scalaires). En fait, le lagrangien de Dirac, et donc l'equation du m^eme nom, sont une consequence directe de l'invariance relativiste de Lorentz et se ramene donc a la recherche des dierents invariants de plus bas degre construits avec des bi-spineurs 13. On va aussi chercher a construire des vecteurs a partir des bi-spineurs, car on sait deja fabriquer des scalaires lorsqu'on a des vecteurs : il sut simplement de faire le produit scalaire avec un autre vecteur. Ceci sera important lorsqu'on voudra coupler une particule de spin 1=2, decrite par un bi-spineur, et une particule de spin 1, decrite par un quadri-vecteur. L'exemple classique est celui du couplage electron - champ electromagnetique dans le lagrangien de l'electrodynamique quantique. On va maintenant poser par denition qu'un spineur se transformant par M1 sera dit gauche et note L (L comme gauche) et qu'un spineur se transformant par M2 sera dit droit et note R (R comme droit) : (L ) = (M1) (L )
(R ) = (M2) (R )
0
0
(V -96) (V -97)
Il est facile de former un scalaire avec une forme bilineaire de spineurs comme dans le cas des rotations. En eet, considerons deux spineurs L et L qui sont echanges par parite respectivement avec R et R , alors :
LR + R L y
est invariant par parite car :
(LR ) = LR = R L
(V -98)
(R L) = R L = LR
(V -99)
y
et
y
y
0
0
0y
0y
0
0
y
y
13: Ceci n'a pas du tout ete la fa&con de proceder de Dirac. Il lui a fallu pas mal d'intuition et une perseverance marquee pour trouver son equation et surtout pour y croire (elle etait pleine de contradictions internes dans le cadre quantique de l'epoque). L'expose presente dans la suite de ces notes est donc une sorte de trahison du processus creatif, en tout cas de celui de Dirac.
VI. Les bi-spineurs et les matrices
4
90
Pour ce qui est des quadri-vecteurs, on sait deja que V~ = L~ L est un vecteur pour les rotations. Il para^t donc naturel de chercher un V 0 bilineaire en L et L qui soit la composante temporelle de V = (V 0 V~ ). Il para^t tout indique d'essayer LL que l'on sait deja ^etre un scalaire sous les rotations. Eectuons un boost innitesimal. On a d'une part : (LL ) = L M1 M1 L = L e~ : d~ L (V -100) = L L + d~ : (L ~ L ) (V -101) et d'autre part : (L ~ L ) = L e~2 : d~ ~ e ~2 : d!~ L (V -102) ! (V -103) = L 1 + ~ 2 : d~ ~ 1 + ~ 2 : d~ L Prenons par exemple une transformation de Lorentz suivant l'axe Ox. On a alors : 0 1 0 1 0 L 1 1 d L L BB CC B d 1 BB L CC C CC B L x L C BB L x L CC = BB (V -104) @ A B@ L y L CA 1 @ L y L A 1 L z L L z L Il s'agit bien de la transformation d'un quadri-vecteur. Plus precisement on peut facilement montrer que : 8 < L L L ~ L composantes covariantes d'un 4-vecteur (V -105) : R R R ~ R composantes contravariantes d'un 4-vecteur donc, en posant par denition (voir page 85) : f g = (1 ;~ ) et f ~ g = (1~ ) (V -106) on a : V = L L (V -107) W = R ~ R (V -108) qui sont des quadri-vecteurs. y
y
y
y
0
y
y
y
y
y
y
0
y
y
y
y
y
y
0
y
y
y
y
y
y
y
y
y
VI BI-SPINEURS – MATRICES DE DIRAC – SCALAIRES ET QUADRI-VECTEURS
On a deja vu que lorsqu'on veut construire une theorie invariante par parite, on a inter^et a utiliser des bi-spineurs denis par ! = L (VI -109) R
VI. Les bi-spineurs et les matrices
4
91
ou L et R sont des spineurs a deux composantes a priori independants et qui sont echanges par parite. On appelle un bi-spineur de Dirac. Dans le point de vue passif, si un observateur O associe a un objet physique, le bi-spineur , un observateur O , inverse par rapport a O, associe au m^eme objet physique le bi-spineur 0
! ! ! ! 0 1 L = 0 R L = = = 1 0 R L R 0
0
0
(VI -110)
(ce qui est gauche pour l'un est droit pour l'autre et vice versa). 1 signie ici la matrice unite 2 2. Cette relation denit la matrice 0 . Examinons maintenant le comportement dans la parite des scalaires que nous avons construits. D'apres tout ce qui precede, on voit donc que l'on peut denir deux types de scalaires de Lorentz : d'une part les \vrais" scalaires qui sont egalement scalaires sous la parite :
S = LR + R L y
(VI -111)
y
et les \pseudo-scalaires qui sont transformes en leur oppose par parite 14 :
P = LR ; R L y
(VI -112)
y
Il est temps maintenant de reecrire tout cela en termes de nos bi-spineurs. On denit pour les besoins de la cause, une nouvelle conjugaison sur les bi-spineurs, qui transforme en un bi-spineur, universellement appele * (ne pas confondre avec le complexe conjugue qui n'est d'aucune utilite ici), par : * = 0 = (R L) (VI -113) y
y
y
* est appele le conjugue de Dirac de . On denit aussi la matrice 4 4, 5 par : ! ; 1 5 = 1 Avec ces notations, on a nalement pour les vrai et pseudo- scalaires : ( S = * P = * 5
(VI -114)
(VI -115)
Pour ce qui est des quadri-vecteurs, ca n'est pas plus complique. V deni par :
V 0 = LL + R R V~ = ;L~ L + R~ R y
y
y
y
(VI -116)
14: Remarquons que comme deux transformations de parite consecutives redonnent l'identite, une quantite scalaire ne peut qu'^etre invariante ou transformee en son oppose par parite.
VI. Les bi-spineurs et les matrices
4
92
est un vrai quadri-vecteur car sa composante temporelle est invariante et ses composantes spatiales sont inversees comme pour x . Par contre A deni par : 0 A = LL ; R R A~ = ;L~ L ; R~ R (VI -117) est un pseudo-vecteur car sa composante temporelle est inversee alors que ses composantes spatiales ne le sont pas (c'est la denition d'un pseudo-quadrivecteur). Notons qu'evidemment, le produit scalaire (minkowskien) de deux pseudo-vecteurs est un vrai scalaire et que le produit scalaire d'un vrai vecteur par un pseudo-vecteur est un pseudoscalaire. On peut reecrire tout cela en fonction des spineurs de Dirac : 8 0 > < V = = * 0 ! ! ; ~ ~ (VI -118) ~ > = * : V = ~ ;~ y
y
y
y
y
y
ou on s'est servi de ( 0 )2 = 1. On denit les trois matrices i (avec indice en haut) : ! ~ ~ = ;~ (VI -119) et on deduit que les vrais vecteurs s'ecrivent : V = * (VI -120) alors que les pseudo-vecteurs font intervenir un 5 : (VI -121) A = * 5 En resume : on a deni les cinq matrices gamma, dites matrices de Dirac : ! ! ! 0 1 ~ ; 1 0 5 = 1 0 (VI -122) ~ = ;~ = 1 Ces matrices verient les relations suivantes qui sont fondamentales (nous verrons en quoi) : 8 > f g = 2 1 (crucial ! ! ) > 5 > < f5 2 g = 0 (VI -123) ( ) = 1 > 5 = i 0 1 2 3 > > : ( 0) = 0 ( i) = ; i = 0 i 0 ( 5) = 5 ou, par denition, fA B g = AB + BA est l'anticommutateur de A et B . Remarquons que : ! ! 5 1 1 + 5 = 0 1 ; (VI -124) 1 et 2 = 0 2 Ce sont donc les projecteurs respectivement sur les parties droite et gauche des spineurs de Dirac. y
y
y
VI. Les bi-spineurs et les matrices
4
93
Exercice : En etendant aux matrices , les relations (III -86), retrouver le fait que
V et W sont des quadri-vecteurs. A
Autres repr´esentations de l’alg`ebre de Clifford
Nous avons, sans le dire, fait un choix d'ecriture pour passer des spineurs a deux composantes aux spineurs de Dirac. En eet, nous avons pris comme composantes du bi-spineur, les composantes des spineurs L et R (et non pas une combinaison de ces composantes). Ce choix etait certes licite, mais absolument pas unique. En eet, si on prend une matrice unitaire U , 4 4, (U 2 SU (4)) et que l'on pose :
(
= U 5 = U 5 U 0
0
alors :
(VI -125)
y
* = 0 = (U) U 0 U = *U = * 0
0y
0
y
y
y
(VI -126)
0
On en deduit donc que
8 > < S = * = * U U = * (VI -127) > : V = * = * U U U U = * et, chose remarquable, toute l'algebre des , Eq.(VI -123), est inchangee, en particulier y
0
y
0
y
0
0
0
f g = 2 1 0
0
Donc, en fait, c'est cette algebre qui est fondamentale, les matrices donnees en (VI -122) n'etant qu'une representation de cette algebre, appelee representation de Weyl. Du coup, l'algebre des matrices gamma a le droit de porter un nom : elle est connue dans la litterature mathematique sous le nom d'algebre de Cliord. Toutes les representations (de dimension 4) de l'algebre de Cliord peuvent ^etre obtenues a partir de la representation de Weyl en changeant les matrices en = U U avec U unitaire 15. Toutes les representations sont equivalentes mais elles ne sont pas toutes aussi commodes pour ce qui est des calculs. Ainsi la representation de Weyl est pratique pour les transformations de Lorentz par exemple, et celle de Dirac (voir la suite) pour la limite non 0
y
15: Le fait que les spineurs de Dirac soient a quatre composantes pour un espace - temps a quatre dimensions est une pure co%!ncidence. En dimension D, les spineurs de Dirac ont 2D=2] composantes, ou (D=2] signie partie entiere de D=2.
VI. Les bi-spineurs et les matrices
4
94
relativiste, car deux composantes des bi-spineurs, dans cette representation, tendent vers zero dans cette limite. La representation de Dirac. Elle est obtenue a partir de celle de Weyl gr^ace a la matrice U: ! 1 1 1 (VI -128) U = p ;1 1 2 Les matrices gamma s'ecrivent : ! ! ! 1 1 i 0 i 5 D = D = 1 (VI -129) ;1 D = ; i
La representation de Majorana. Elle est obtenue a partir de celle de Dirac par la matrice unitaire :
(VI -130) U = p1 D0 D2 + D0 2 Dans cette representation, toutes les matrices sont imaginaires pures ce qui est commode pour la conjugaison de charge par exemple.
B Transformations de Lorentz des bi-spineurs
Elles decoulent evidemment, en representation de Weyl, de celle des parties gauche et droite, L et R. Pour les obtenir dans une representation quelconque, il faut les reecrire en fonction des matrices . De facon generale, on doit avoir :
= S (+) 0
(VI -131)
ou S (+) est la matrice representant la transformation de Lorentz + sur les spineurs de Dirac. Pour une transformation innitesimale + = + , on pose par denition des six matrices : (VI -132) S = S () = 1 ; 4i est antisymetrique en . En parlant en termes d'elements de matrice : (VI -133) S = ; 4i ( )
En representation de Weyl, tout est simple : 0 13 ! ! 2 0 L = 41 + i @ d ~ ; id~ :~ =2 A5 L (VI -134) ~ ~ R R 0 d + id :~ =2 0 0
Pour en deduire la transformation dans une representation generale, on va reecrire cela en fonction des matrices . On peut se contenter d'etudier ce qui se passe pour une transformation
VI. Les bi-spineurs et les matrices
4
95
particuliere car, et c'est la toute la force du calcul tensoriel (voir l'appendice I), lorsqu'on sait comment ca marche pour une transformation particuliere on en deduit automatiquement l'expression de la transformation generale : c'est la m^eme puisque toutes les composantes sont traitees de facon identique. Prenons comme exemple une rotation autour de Ox : d 1 6= 0 et tous les autres parametres sont nuls. Dans ce cas : " !# i 1 (VI -135) = 1 + 2 d 1 1 Tout cela n'est pas tres covariant. On peut deja un peu ameliorer en prenant 32 = ;23 a la place de d 1. Reste le 1 a transformer. On a ! ! 1 i 1 & ] 2 3 (VI -136) 1 = 4 32 & 2 3] 2 32 Encore un petit eort et on y sera. Comme on a : ! 2 3 2 3 (VI -137) =; 2 3 on deduit que : ! i d 1 1 h 3 2i = 1 h 3 2i + h 2 3i = (VI -138) 1 23 1 2 4 32 8 32 ou la derniere egalite ne co^ute pas chere et est necessaire si on veut remettre cette expression sous la forme d'une somme, ce que l'on fait maintenant sans probleme puisque seuls 32 et 23 sont non nuls. Par consequent : 1 (VI -139) = 1 + 8 & ] et cette loi, ecrite pour une transformation particuliere, est valable quelque soit la transformation puisqu'elle est ecrite de facon tensorielle (voir Appendice I). Donc, en resume, les transformations de Lorentz des spineurs de Dirac dans une representation quelconque sont donnees par : 0
0
8 = S (+) > < > : S (+) = e 2i =2 0
;
=
i 2 & ]
(VI -140)
ou + = exp(;i=2 J ) avec J le generateur dans la representation quadri-vectorielle, voir encadre V, page 81. Et comme dans la suite des evenements, nous serons, pour une raison non triviale, interesses par des champs, il est maintenant temps de passer aux transformations des champs.
4 VII
96
VII. Champs et groupe de Poincare
LES CHAMPS DE SCALAIRES, DE SPINEURS ET DE VECTEURS – GROUPE DE POINCARE´
A Les champs, les rotations et les transformations de Lorentz
Comme on va ^etre amene a s'occuper de champs, il est bon de se pencher sur la transformation des champs et la denition du caractere tensoriel d'un champ. Commencons par le groupe des rotations. 1 LE CAS EUCLIDIEN
Un champ a n composantes est par denition une fonction f de l'espace de base (euclidien a trois dimensions dans cette discussion, minkowskien a quatre dimensions dans la suite) vers R n . Une fonction d'onde est un exemple de champ. On dira qu'un champ est scalaire lorsque n = 1 et que pour tout ~x 2 R 3 , f (~x) est un scalaire. Dans le point de vue passif, ceci signie que la valeur de cette quantite ne change pas dans une rotation, seul l'etiquetage des points change : point M , champ f (M )) base B associee a l'observateur O : (~e1 ~e2~e3 ) f (M ) = fB (xB yB zB )) base B associee a l'observateur O : (~e1 ~e2 ~e3 ) f (M ) = fB (xB yB zB )) ou (xB yB zB ) et (xB yB zB ) sont respectivement les coordonnees de M dans B et dans B . Le fait que le champ soit scalaire signiant que sa valeur est identique pour les deux observateurs, on doit avoir : fB (xB yB zB ) = f (M ) = fB (xB yB zB ) (VII -141) Donc, dans le cas d'un champ, les fonctions representant f , i.e. fB et fB , ne sont pas identiques car les coordonnees du point M changent d'un observateur a l'autre. Posons par denition :
fB = fB ; fB qui represente la variation de la fonction fB . On a donc :
fB (x y z) = fB (x y z) ; fB (x y z) (VII -142) ou ici fB et fB sont evaluees pour le m^eme triplet (x y z). Considerons une rotation innitesimale autour de Oz d'angle d : 0 1 0 10 1 xB 1 d B@ yB CA = B@ ;d 1 CA B@ xyBB CA + O(d 2) (VII -143) zB 1 zB On a donc dans ce cas : ! @ @ fB (xB yB zB ) = fB (xB yB zB ) + d yB @x ; xB @y fB (xB yB zB ) (VII -144) B B 0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
4
VII. Champs et groupe de Poincare
97
Donc en se servant de (VII -141) et de (VII -142) et en raisonnant au premier ordre en d , on obtient : ! @ @
fB = d x @y ; y @x fB (VII -145) Posons par denition
~ Li = ;iijk xj @k =) L~ = ;i~x ^ r
(VII -146)
(par exemple Lx = ;i(y@z ; z@y )), alors pour une rotation innitesimale de parametre d~
d~ fB = id~ : L~ fB
(VII -147)
L'algebre des Li ne fait pas de mystere puisque c'est juste celle du moment cinetique en mecanique quantique (il est bon de faire le calcul une fois dans sa vie) on fait agir le commutateur sur une fonction test) : &Lx Ly ] = iLz (VII -148) et permutations circulaires. C'est l'algebre de Lie de SO(3). Nous avons donc trouve une representation du groupe des rotations en termes de champs scalaires. Qu'en est il pour les champs vectoriels? On reprend le m^eme raisonnement :
VBi (xB yB zB )~ei = V~ (M ) = VBj (xB yB zB )~ej 0
0
0
0
0
(VII -149)
Cette relation peut encore se reecrire de la facon suivante :
VBi (x ) = Rij VBj (x) 0
0
Un petit calcul et on trouve que pour une rotation innitesimale autour de Oz : 0 11 0 11 0 10 1 1 VB
VB VB : d : B @ VB2 CA = d (x@y ; y@x) B@ VB2 CA + B@ ;d : : CA B@ VB2 CA VB3
VB3 VB3 : : :
(VII -150)
(VII -151)
Pour chacune des composantes, le premier terme du membre de droite est identique a celui des fonctions scalaires : il rend compte du changement de coordonnees du point M et ne melange pas ensemble les composantes de V~ . Le second terme est identique a la transformation matricielle des composantes d'un vecteur. C'est lui qui signe la nature vectorielle du champ. En conclusion, on trouve que dans le cas des champs, se superposent la transformation matricielle, caracteristique de la nature tensorielle du champ, et la transformation qui rend compte du changement de coordonnees du point ou est evalue le champ :
Ti = i d~ : J~ ij Tj avec J~ = L~ + S~
(VII -152)
4
VII. Champs et groupe de Poincare
98
et ou L~ , deni precedemment en (VII -146), represente la partie \orbitale" et S~ la partie \intrinseque" qui est matricielle et qui est choisie pour correspondre a la nature tensorielle du champ : S~ = ~0 pour un champ scalaire, S~ = ~ =2 pour un champ spinoriel, etc: : : 16 Pour une rotation nie, la transformation s'ecrit :
h i Ti (~x) = ei~ : J~ ij Tj (~x)
(VII -153)
0
ou encore (voir l'Eq.(VII -150)) :
h i Ti (~x ) = ei~ : S~ ij Tj (~x) 0
(VII -154)
0
2 LE CAS MINKOWSKIEN
L'argument precedent se generalise bien entendu a des champs de l'espace de Minkowski et aux transformations de Lorentz. Dans une transformation innitesimale, Eq.(III -60) :
xB = xB + xB
(VII -155)
0
on a, pour un champ scalaire de Lorentz :
fB (xB ) = fB (xB ) = fB (xB ) + xB @ fB (xB )
(VII -156) (VII -157)
fB = ; 21 i : i(x @ ; x @ )fB
(VII -158)
0
0
0
0
et donc : On pose par denition et par analogie avec l'Eq.(III -69) :
8 > < L0x = i(t@x + x@t ) = ;iKx et idem Kyz L = i(x @ ; x @ ) =) > : Lij = i(xi@j ; xj @i ) = ijk Lk
(VII -159)
ou les Li sont denis en (VII -146). L'algebre des L se calcule sans diculte. On obtient :
h
i L L = i ( L ; L + L ; L )
(VII -160)
16: Il ne faut pas confondre le J~ deni ici avec le J~ utilise dans la premiere partie de ces notes et deni en (I -8,I -10) du chapitre 2. La m^eme lettre a ete utilisee dans les deux cas car c'est l'usage. En (I -8,I -10), il signiait seulement la partie appelee maintenant intrinseque et notee S~ , car il n'etait pas question de partie orbitale a ce moment la (il n'y avait aucune dependance en ~x) : L~ etait nul.
4
VIII. Les translations et le groupe de Poincare
99
On retrouve l'algebre de Lorentz, Eq.(III -70). Les Ki denis precedemment sont donc les representants des generateurs des boosts de Lorentz. Ils rendent compte du changement de coordonnees du point M ou est evalue le champ, dans un boost. Si l'on eectue un boost sur un champ spinoriel, quadri-vectoriel, etc: : : cette transformation orbitale | generee par L | est bien s^ur accompagnee, comme dans le cas des rotations, d'une transformation \intrinseque" | generee par S | qui n'est rien d'autre que la transformation matricielle adaptee a la nature tensorielle du champ et qui a ete construite lors de notre etude du groupe de Lorentz : S = 0 pour un champ scalaire, S = =2 pour un champ spinoriel, etc: : :
h T (x ) = e 0
;
i i J T (x )
(VII -161)
avec J = L + S . Ceci peut aussi se reecrire,
h T (x ) = e 0
VIII A
0
i i S T (x )
;
(VII -162)
Les translations et le groupe de Poincar´e
´ erateur ´ le gen des translations
Des que l'on considere des quantites dependant de la position, on doit se preoccuper de leur comportement dans les translations x = x + a Cherchons comment l'intrusion de cette nouvelle symetrie bouleverse notre schema precedent. Pour cela, nous allons devoir chercher l'algebre de Lie du groupe contenant a la fois les transformations de Lorentz et les translations, puis en chercher les representations. Ce groupe est appele le groupe de Poincare. Il contient 10 parametres : 3 parametres de rotation, 3 de boosts et 4 de translation. Il est non compact et non connexe puisqu'il contient le groupe de Lorentz qui ne l'est pas a cause du renversement du temps et de la parite. Commencons par identier l'action du generateur des translations sur des champs. C'est trivial car quelque soit la nature tensorielle du champ, une translation agit de facon identique sur toutes les composantes, ou, dit autrement, ne les melangent pas entre elles (pas de transformation matricielle). On peut donc se contenter d'etudier un champ scalaire, la generalisation a un champ quelconque etant triviale. On a donc, dans une translation passive : fB (x ) = fB (x = x + da ) (VIII -163) = fB (x ) + da @ f et donc :
f = ;da @ f (VIII -164) 0
0 0
0
4
VIII. Les translations et le groupe de Poincare
On pose par denition :
P = i@
100
(VIII -165)
et on en deduit :
f = ida Pf
(Taylor : f (x + a) = ea@x f (x) = e
iaP f (x))
;
(VIII -166)
Le generateur des translations est donc represente, dans son action sur les fonctions de x , par (i fois) le quadri-gradient. On peut en deduire l'algebre de Lie du groupe de Poincare (la verier et se convaincre que \ca ne pouvait ^etre que cela") :
i 8h > P P =0 < > : hP L i = i ( P ; P )
(VIII -167)
La deuxieme relation signie que P est un operateur quadri-vectoriel, ce qui ne devrait pas surprendre etant donnee sa denition. Le fait que P et L ne commutent pas, indique que le groupe de Poincare n'est pas simplement un produit direct du groupe Lorentz par celui des translations (c'est un produit dit semi-direct). Physiquement parlant, ceci vient de la contraction des longueurs dans les boosts.
Exercice : Montrer que la loi de groupe pour Poincare est : (+ a) : (+ a ) = (++ a + + : a ) 0
0
0
0
(VIII -168)
On pourrait donc croire que nous avons travaille en vain en construisant les representations du groupe de Lorentz, et qu'il faut tout recommencer pour celles du groupe de Poincare qui doivent ^etre dierentes. Heureusement, il n'en est pas tout a fait ainsi et nous allons, pour une grande part, pouvoir nous resservir de ce que nous avons vu precedemment. Cherchons, pour commencer, les operateurs de Casimir de Poincare. B Un premier op´erateur de Casimir : P2
On peut deja tres facilement construire un Casimir de Poincare : il s'agit de P 2. En eet, en tant que carre d'un operateur quadri-vectoriel, il est invariant dans les boosts et les rotations et doit donc commuter avec J (le verier). Il commute evidemment avec chacun des P et commute donc avec les dix generateurs. Or, comme nous allons le \montrer" maintenant, P 2 = P P a comme valeur propre le carre de la masse, m2 , lorsqu'on s'interesse a un systeme
4
VIII. Les translations et le groupe de Poincare
101
constitue d'une particule libre, si bien que la masse va servir a etiqueter les representations du groupe de Poincare. C'est evidemment dierent du groupe de Lorentz et c'est cela qui va introduire quelques nouveautes comme on le verra par la suite. Cherchons donc les valeurs propres de P 2 pour une particule libre quantique 17 . Notre modele (inspire de la mecanique classique) consiste a dire que la particule libre est denie par une quadri-impulsion p dont le carre scalaire est ce que l'on appelle par denition la masse 18 :
p = (E ~p) ou E = energie et E 2 = m2 + ~p 2 (VIII -169) Considerons une fonction f quelconque, mais non singuliere, de p . La contrainte p2 = (p0)2 ; p~ 2 = m2 denit dans l'espace des quadri-impulsions, pour m = 0, un c^one analogue au c^one de lumiere et pour m > 0, un hyperbolo!de a deux nappes separees par ce c^one et pour lequel seul la nappe superieure correspond aux energies positives. f n'est donc pas denie dans tout l'espace des p , mais seulement sur cet hyperbolo!de (en fait, seulement sur la nappe superieure pour les etats a energie positive). Pour cette raison, il est commode de remplacer f par une fonction u denie sur tout l'espace des impulsions et qui co!ncide avec f : u~(p) = (p2 ; m2 ) f (p) (VIII -170) Cette fonction verie evidemment l'equation : (p2 ; m2 ) u~(p) = 0 (VIII -171) et (VIII -170) en est, en fait, la solution generale comme nous l'enseigne la theorie elementaire des distributions. Supposons que u~ soit une fonction susamment bien elevee pour ^etre transformable de Fourier 19(toute la theorie des champs est b^atie avec de telles fonctions) : Z d4p u(x) = (2)4 eip : x u~(p) (VIII -172) Alors l'equation (VIII -171) implique sur u(x) l'equation dite de Klein-Gordon (le verier) : (@ 2 + m2)u(x) = 0 (VIII -173)
17: Nous allons considerer comme acquis que l'on peut etendre le formalisme de la mecanique quantique galileenne au cas des particules libres lorentziennes. On peut eectivement le faire pour les particules libres, mais &ca ne marche plus lorsqu'on \branche" une interaction. La raison en est que, sauf exception, on peut alors creer et annihiler des particules et que l'evolution de chacune d'elles n'est par consequent plus unitaire. C'est pourquoi il faut, dans ce cas, introduire la notion de champs et d'espace de Fock. Le calcul eectue dans ce paragraphe n'est vraiment pas beau car il laisse en suspend beaucoup de questions (qui se resolvent dans le cadre de la theorie des champs). Il a l'avantage d'^etre simple. 18: Rappel : on travaille dans des unites ou ~ = 1 et c = 1. 19: C'est la qu'intervient la simplication de considerer une particule quantique : on passe par transformee de Fourier de la position a l'impulsion (en classique, il faudrait considerer tout l'arsenal des crochets de Poisson). Il faut noter que ceci n'est pas innocent pour le temps qui n'est pas la valeur propre d'un operateur hermitique. Tout cela se resoudra de soi m^eme en theorie des champs.
4
VIII. Les translations et le groupe de Poincare
102
car, en transformee de Fourier, @ ! ip (le montrer). Par consequent, l'action de P 2 sur toute fonction de la position d'une particule libre est la multiplication par m2 : P 2 = m21. Comme nous le verrons dans la suite, le groupe de Poincare admet deux Casimirs. Avant m^eme de construire le second, on peut voir qualitativement comment l'analyse des groupes de Poincare et de Lorentz vont dierer 20. Suivant la masse de la particule, il y a deux possibilites. i) Ou on s'interesse a une particule de masse non nulle et on peut alors, par une transformation de Lorentz, se mettre dans un repere ou la particule est au repos. On s'attend, dans ce cas, pour l'essentiel, a retrouver ce que l'on a deja vu dans le cas galileen. En particulier, le spin de la particule doit ^etre donne par son comportement dans les rotations. ii) Ou alors on s'interesse a une particule de masse nulle, qui se deplace donc a vitesse 1 dans tout referentiel inertiel, et on ne peut jamais la mettre au repos. On s'attend donc, dans ce cas, a avoir des eets ultra-relativistes, probablement nouveaux par rapport au cas galileen. Rien ne dit que la notion de spin, telle qu'elle a ete denie auparavant, soit encore valable. Nous allons voir dans la suite comment preciser tout cela. Mais d'abord, un peu de vocabulaire : : : C Notion d’orbite et de groupe d’isotropie
Soit G un groupe agissant sur un ensemble M . On pourra songer par exemple au groupe des rotations et a l'espace euclidien ou au groupe de Lorentz et a l'espace de Minkowski. On appelle orbite d'un point m de M , l'ensemble note G:m des points transformes de m par G :
G:m = fm = gm = g 2 Gg 0
(VIII -174)
L'orbite, pour SO(3), d'un point de l'espace euclidien R 3 , autre que l'origine, est la sphere centree sur l'origine et passant par ce point 21. On appelle groupe d'isotropie Gm d'un point m de M , l'ensemble des elements de G qui laissent invariants m (verier qu'il s'agit d'un groupe) :
Gm = fg 2 G = gm = mg
(VIII -175)
Par exemple, l'ensemble des rotations qui laissent invariants un point de R3 , autre que l'origine, est le groupe SO(2) des rotations autour de l'axe passant par ce point et l'origine (il y a donc 20: L'analyse complete des representations (projectives ou non) du groupe de Poincare a ete eectuee par Wigner et est techniquement assez compliquee. Nous n'en reproduirons que les resultats les plus physiquement signicatifs. 21: Si l'ensemble M est une orbite du groupe, on dit que G agit transitivement sur M . SO(3) agit transitivement sur la sphere.
4
VIII. Les translations et le groupe de Poincare
103
\autant" de ces SO(2), tous isomorphes, que de points sur la sphere) 22 . Les groupes d'isotropie de l'origine sont pour SO(3) et pour SO(3 1) ces deux groupes tout entier. D
Les repr´esentations massives et de masse nulle de Poincar´e
Justions succinctement ce que nous avons annonce precedemment quant aux representations de Poincare. i) Si m 6= 0, le quadri-vecteur impulsion (m 0 0 0) gure dans l'orbite de p . m est donc le parametre qui classie les dierentes orbites. La transformation de Lorentz qui permet de passer de p a (m 0 0 0) n'est pas pour autant unique, car (m 0 0 0) possede un groupe d'isotropie non trivial, a savoir tout SO(3) 23. On peut montrer que les representations de Poincare sont etiquetees, d'une part par la masse m qui etiquette les orbites, et, d'autre part, par la valeur du Casimir du groupe d'isotropie (le petit groupe), c'est a dire par le spin 24. Le groupe de Poincare possede donc deux Casimirs, comme le groupe de Lorentz. On peut, en fait, construire explicitement le second Casimir. L'idee est de construire un quadri-vecteur qui soit orthogonal a P . Son carre fournit automatiquement un scalaire de Lorentz et qui commute avec P . Un tel vecteur (appele pseudo-vecteur de Pauli-Lubanski) est par exemple : (VIII -176) W = 21 L P ou est le tenseur invariant de SO(3 1) completement anti-symetrique. On peut facilement voir que WW commute avec tous les generateurs. Ses valeurs propres sont ;m2 s(s + 1). ii) Lorsque m = 0, le petit groupe n'est plus SU (2) comme on peut le voir de la facon suivante. A p, on associe la matrice : 0 3 1 2! + p p ; ip P = pp1 + (VIII -177) ip2 p0 ; p3 22: A partir d'un point donne m, disons sur l'axe Oz , on peut donc atteindre, par rotation, n'importe quel point m0 de la sphere passant par m : m0 = Rm. Reciproquement, a chacun des points m0 de la sphere n'est pas associee une rotation R unique, puisque n'importe quelle rotation autour de Oz laisse m invariant : m0 = (R : rm )m, ou rm est n'importe quelle rotation autour de Om. On denit, pour cette raison, l'ensemble quotient SO(3)=SO(2) des classes d'equivalence (a droite) des rotations de SO(3), a une rotation de SO(2) autour de Om pres : SO(3)=SO(2) = fR_ R 2 SO(3)g avec R_ = fR0 2 SO(3) = R0 = R : rm g. Il est alors simple de montrer que chaque point de la sphere est en correspondance unique avec une classe d'equivalence R_ si bien que la sphere peut ^etre identiee avec SO(3)=SO(2). Ce genre de relations geometriques a d'innombrables applications en physique (physique des particules, mecanique statistique, etc: : : ). En particulier, l'espace de Minkowski peut
^etre identie avec le quotient du groupe de Poincare par le groupe de Lorentz (le montrer). 23: On appelle \petit groupe" de p , le groupe d'isotropie d'un representant quelconque de l'orbite de p . Le petit groupe de p , dans le cas massif, est SO(3). 24: En fait, cette fa&con de dire les choses n'est, a strictement parler, vraie que dans le cas quantique, ou l'on cherche les representations projectives de Poincare. Dans ce cas, on doit considerer, non pas les representations de SO(3), mais ses representations projectives, i.e. celles de son recouvrement universel SU (2), si bien que les valeurs admissibles du Casimir du groupe d'isotropie sont les j (j +1) avec j entier ou demi-entier, voir l'encadre IV. On obtient ainsi tous les spins possibles.
4
VIII. Les translations et le groupe de Poincare
104
comme on l'avait fait pour la quadri-position. Comme dans ce cas la, les transformations de Lorentz sur p sont realisees par :
P = MPM 0
avec M 2 SL(2 C )
y
(VIII -178)
Un point commode dans l'orbite de p est, pour m = 0 et p0 > 0, p0 = p3 , p1 = p2 = 0. Le groupe d'isotropie de ce point est constitue des matrices M veriant :
a b c d
!
2 0 0 0
!
! ! a* c* = 2 0 *b d* 0 0
(VIII -179)
L'ensemble de ces matrices est le groupe des matrices
!
ei b 0 e
i
;
(VIII -180)
On peut facilement montrer, en composant deux de ces matrices, que ce groupe est celui des isometries de l'espace euclidien a deux dimensions (en fait son groupe de recouvrement, car on est parti de SL(2 C )) forme des translations (parametre b = x + iy) et des rotations dans le plan (parametre ). Il y a donc du nouveau par rapport au cas massif. On devrait en principe etudier les representations de ce groupe pour en deduire celle du groupe de Poincare. Le resultat est le suivant : on peut encore denir la notion de spin qui, comme auparavant, prend des valeurs entieres et demi-entieres. Cependant, la projection du spin sur la direction de l'impulsion de la particule ne peut prendre que les valeurs ;s et +s. C'est la raison pour laquelle le photon, qui a un spin un, n'a que deux etats de spin +1 et ;1 ce qui, classiquement, se traduit par le fait qu'il n'a que deux etats de polarisation et non pas trois. On peut montrer que ceci a comme consequence que le champ electromagnetique est transverse et n'a pas, du fait de sa masse nulle, de composante longitudinale. Il en va de m^eme pour le graviton qui est de spin 2.
En conclusion, les representations du groupe de Poincare, pour des particules elementaires
libres, sont etiquetees par la masse et le spin : c'est la carte d'identite d'une particule libre. Ceci est, en soi, un resultat assez extraordinaire de la theorie des groupes. C'est aussi le point de depart de la theorie des champs. On cherchera, a partir de ces representations, a construire des equations du mouvement (en fait, des lagrangiens) qui sont covariantes pour le groupe de Poincare : ces equations sont connues sous les noms d'equations de Klein-Gordon, de Dirac, de Maxwell, etc: : : Bien s^ur, lorsque l'on etudiera les particules en interaction, d'autres nombres \quantiques" viendront s'ajouter : charge, couleur, etc: : : A ce propos il convient, a mon avis, de faire preuve de prudence. A la suite de Wigner, on appelle communement particule, une representation du groupe de Poincare. Ceci est parfaitement justie dans bien des cas. En eet, tres souvent, et c'est la base de la theorie des champs, on etudie la diusion de particules
4
IX. Les lagrangiens invariants
105
venant de l'inni et repartant a l'inni et on suppose que lorsque les particules sont eloignees les unes des autres, on peut negliger leurs interactions et les considerer comme libres. On etudie donc la diusion de particules qui, asymptotiquement, sont libres et s'identie donc avec une representation de Poincare. Cependant, ce schema repose implicitement sur une hypothese \perturbative" selon laquelle on peut debrancher \doucement" l'interaction au fur et a mesure que les particules s'eloignent, sans bouleverser qualitativement la physique. Outre qu'il n'est pas evident que l'on puisse negliger l'interaction de la particule avec son propre champ 25 , il est franchement douteux que cela marche lorsqu'on a des etats lies comme les quarks (ou des electrons apparies par paires de Cooper), qui ne sont jamais isoles les uns des autres (pas de quarks libres asymptotiquement 26). On est la dans le domaine non perturbatif de la theorie des champs pour lequel, qualitativement, l'interpretation a la Wigner ne marche plus. Bien s^ur, comme on ne sait pas partir d'autre chose que de l'analyse de Wigner, on continue, m^eme dans ce cas, a se servir du m^eme type de formalisme, en esperant que le point de depart est toujours correct et que l'aspect non trivial de ces theories emergera d'une analyse non perturbative, si tant est que l'on en soit capable un jour: : : IX
Les lagrangiens invariants de Klein-Gordon, Dirac et Maxwell
Nous avons maintenant tous les outils pour construire des invariants sous le groupe de Poincare. Ces invariants vont ^etre les briques a partir desquelles les lagrangiens (plus precisement les actions), et donc la dynamique, seront construits. Qu'une action soit, par denition, un invariant sous le groupe de Poincare est chose tres naturelle, car nous cherchons, en dernier ressort, pour satisfaire a notre appetit de symetrie, des equations du mouvement covariantes sous ce groupe. Or, a partir de l'action, nous sommes capables, via les equations d'Euler-Lagrange, de construire les equations du mouvement et il est facile de se convaincre que si l'action est un scalaire sous Poincare, les equations du mouvement sont automatiquement covariantes. C'est en fait la que reside tout l'inter^et de l'approche lagrangienne : les symetries | et pas seulement celle de Poincare | sont incluses automatiquement 27. Ceci est deja important pour la symetrie de Poincare et devient crucial pour l'invariance de jauge. Nous n'allons pas developper ici la theorie lagrangienne des champs (c'est le sujet d'un futur chapitre de ces notes) mais nous allons d'ores et deja donner une liste des invariants qui seront des candidats pour former les lagrangiens de la theorie des champs. L'etude du groupe 25: On pretend, gr^ace a la renormalisation, pouvoir le faire en considerant des particules \habillees". 26: Les quarks sont en fait libres quand ils sont a tres courte distance les uns des autres. 27: De plus, les lois de conservation associees a l'existence de symetries continues, donnees par le theoreme de Noether, se construisent tres naturellement en fonction du lagrangien.
4
IX. Les lagrangiens invariants
106
de Poincare nous indique que nous devons considerer des objets de masse et spin denis. Nous allons donc proceder par ordre croissant de spin. Mais avant toute chose, une petite remarque. L'invariance par translation, presente dans le groupe de Poincare, est facile a realiser, il sut d'integrer sur tout l'espace de Minkowski 28 :
Z
S = d4x L
(IX -181)
S est l'action et L le lagrangien 29. Pour obtenir une action invariante sous le groupe de Poin-
care, il sut donc de prendre L scalaire sous Lorentz. Ceci justie a posteriori tous les eorts faits pour comprendre Lorentz et ses representations, independamment de Poincare. Nous allons maintenant construire des candidats lagrangiens en se souvenant que la somme de deux candidats lagrangiens est un candidat lagrangien. spin 0. Il s'agit de champs scalaires. Avec un seul champ scalaire , on peut former comme scalaires de Lorentz : 2 : : : n et en ajoutant le gradient : @ @ et toutes ses puissances. On peut faire enn des produits de ces termes : n(@ @)p. Mis a part le terme lineaire en (que l'on peut toujours eliminer), les termes les plus simples sont les deux seuls termes quadratiques @ @ et 2 Le lagrangien de Klein-Gordon, decrivant une particule de spin 0 et de masse m est fait a partir de ces deux invariants : LKG = 21 @ @ ; 12 m2 2 (IX -182) Les termes de degres plus eleves en correspondent a des termes d'interaction. spin 1/2. Il s'agit de champs spinoriels. Avec un champ de bi-spineurs , on peut * et ses puissances et, en faisant intervenir le gradient, * @ et construire comme invariants ses puissances. On peut enn faire des produits de ces termes. Le lagrangien de Dirac decrivant une particule libre de spin 1/2 et de masse m (et son anti-particule) est le plus simple que l'on puisse imaginer : * @ ; m * LD = i (IX -183) Les termes de degres plus eleves en correspondent a des termes d'interaction. spin 1. Il s'agit de champs vectoriels. Avec un champ A, on peut construire comme invariants : A A et ses puissances et en ajoutant le gradient : @ A @ A et @ A @ A. Pour 28: Il y a tout de m^eme un a priori derriere tout cela, a savoir que l'on veut des theories locales, c'est a dire pour lesquelles on s'interdit des produits de champs en des points dierents. Une justication pragmatique a cela est que l'on ne sait pas faire de theorie quantique des champs non locales. 29: En fait, il s'agit de la densite de lagrangien, mais l'usage est de dire lagrangien seulement, les risques d'ambigu%!te etant faibles.
4
IX. Les lagrangiens invariants
107
une raison non triviale, et qui sera explicitee plus tard, on veut, en plus de Poincare, une invariance supplementaire, dite de jauge, lorsqu'on considere des particules de spin 1 et de masse nulle, comme le photon. Une transformation de jauge (abelienne: : : il y en a de non abeliennes) correspond a la transformation du champ A en :
A = A + @ + 0
(IX -184)
ou + est un champ scalaire. Il est facile de voir (le faire) que le terme en A A n'est pas invariant sous cette transformation et que seule la combinaison F F avec
F = @ A ; @ A l'est. Le lagrangien de Maxwell donnant la dynamique du champ electromagnetique non couple a des sources est : (IX -185) LM = ; 41 F F le 1/4 n'etant la que pour assurer ulterieurement la denition habituelle de la charge lorsque A sera couple aux autres champs. Un terme en A2, non invariant de jauge, correspondrait a un terme de masse pour le photon. On peut s'amuser a trouver des lagrangiens d'interaction invariants de Poincare. C'est facile. Par exemple, A @ pour un scalaire et un vecteur : pas la bonne dimension, ne conduit pas a un lagrangien invariant de jauge, inutile. Autre essai avec un spineur : * A
(IX -186)
A toutes les proprietes requises lorsqu'on transforme de jauge en
= ei 0
(IX -187)
Le terme (IX -186) est le terme de couplage electron-photon, par exemple. On pourrait continuer ce jeu, mais on verrait bien vite qu'en prenant des termes de degres de plus en plus eleves, on peut construire de plus en plus de termes possibles d'interaction. Heureusement, la renormalisation va drastiquement limiter les choix possibles pour n'en laisser que quelques uns. C'est le sujet des chapitres suivants, pas encore tapes: : :
108
5
CHAPITRE 5
Appendices I
Appendice I : Les repr´esentations lin´eaires et non lin´eaires et leur ´ et ˆ inter
Il est clair que parmi toutes les representations d'un groupe, les representations lineaires sont les plus interessantes car elles sont les plus simples. Voyons en quelques exemples et voyons en quoi consiste exactement cette simplicite. Considerons le plan ane rapporte aux axes Oxy et le groupe des rotations SO(2) autour de l'axe Oz perpendiculaire a Oxy. Dans les rotations (passives) de SO(2) autour de Oz, les composantes x et y du vecteur ~r, prises independamment, n'engendrent pas de representation de SO(2) alors que le doublet (x y) engendre une representation lineaire de ce groupe :
! ! ! x = cos sin x y ; sin cos y Il en va de m^eme si ~r est norme (et appartient donc au cercle unite) 1 : x2 + y2 = 1 car cette contrainte est invariante p 2sous les rotations. Par contre, m^eme dans ce cas ou y n'est pas independant de x, y = 1 ; x , x a lui tout seul n'engendre pas une representation lineaire. Il engendre en fait une representation non lineaire : 0
0
p
x = T (x) = cos x sin 1 ; x2 0
Dans toute la suite, pour simplier la discussion, on ne considerera que les points ou x et y sont positifs. On peut montrer qu'il s'agit bien d'une representation de SO(2) car :
p
x = T &T (x)] = cos x + sin y = cos( + ) x sin( + ) 1 ; x2 = T+ (x) 00
0
0
0
0
0
0
0
0
(I -1) (I -2)
Notons tout de m^eme que la demonstration directe de la relation precedente, i.e. sans passer par y, n'est pas absolument triviale car elle reclame la relation (le verier) :
q
p
p
1 ; (cos x + sin 1 ; x2 )2 = ; sin x + cos 1 ; x2
dont la veracite ne saute pas yeux. 1: On voit ici que les fonctions f (x y) = g(x2 + y2 ) sont scalaires sous SO(2).
5
I. Appendice I : representations lineaires et non lineaires
109
Pour des dimensions plus grandes, on concoit aisement que cela devienne fort complique ! En dimensions trois, on peut aussi facilement fabriquer des representations non lineaires a partir des coordonnees (x y z) (qui engendrent bien entendu une representation lineaire de SO(3)) en considerant, par exemple, les coordonnees spheriques (r ) qui pour ( ) se transforment non lineairement sous SO(3) (le verier). Dans les deux exemples precedents, on voit que l'on peut facilement faire le chemin inverse \sans perdre d'information" pet passer des representations non lineaires aux representations lineaires : a x on adjoint y = 1 ; x2 et (x y) se transforme lineairement sous SO(2)) a ( ), on adjoint r et on fait le changement de variables (x y z) = (r sin cos r sin sin r cos ) et on obtient une representation lineaire de SO(3). Ceci est il toujours le cas? Peut on toujours construire une representation lineaire \physiquement equivalente" a une representation non lineaire? Je ne le sais pas et je souhaiterais qu'un lecteur cultive m'eclaire. Voyons maintenant au dela de la simplicite des transformations, l'inter^et des representations lineaires. A
Equations covariantes et calcul tensoriel
Considerons l'espace euclidien et un systeme de coordonnees spheriques dans cet espace. Soient deux vecteurs normes A~ et B~ de composantes spheriques (1 A A), (1 B B ). La quantite
Q( A : : : B ) = cos A cos B + sin A cos A sin B cos B + sin A sin A sin B sin B est elle un scalaire sous SO(3)? La reponse a cette question, pour anodine qu'elle semble ^etre, est revelatrice de la pertinence du choix de representation. Si l'on veut faire le calcul sans re%echir, il faut calculer ( AB AB ), transformes de ( AB AB ) dans une rotation quelconque, calculer Q( A : : : B ) et comparer avec Q( A : : : B ). Par contre, il est trivial de voir que Ai et Bi etant les composantes cartesiennes de A~ et B~ : 0
0
0
0
Q= 0
X i
Ai Bi
est scalaire. En fait, Q = Q = A~ : B~ , si bien que Q est scalaire m^eme si ca ne saute pas aux yeux en composantes spheriques. Il serait encore plus dicile de voir que l'equation : ~ ~ F~ = ~A :~B 2 E~ (C :D) 0
0
une fois ecrite en composantes spheriques, forment bien un ensemble de trois equations covariantes sous SO(3), c'est a dire sont des equations entre deux objets de m^eme caractere
5
110
I. Appendice I : representations lineaires et non lineaires
tensoriel, ici deux vecteurs. Au contraire, il est trivial de voir qu'il en est ainsi pour
Fk = (CAiDBi)2 Ek j j
(I -3)
car
Une equation est covariante, en composantes cartesiennes, si et seulement si les indices sont equilibres entre les deux membres. Ceci signie que les indices sommes le sont conformement a la convention d'Einstein et que les indices libres sont identiques entre les deux membres 2 . C'est la le deuxieme avantage des representations lineaires : il est possible d'inventer un systeme de notations | un calcul tensoriel | tel que la covariance des equations soit explicite et evidente. Il faut noter aussi, c'est un corollaire, que dans ces notations, il est evident que les equations covariantes sont invariantes de forme sous les transformations du groupe. Ceci signie dans l'exemple precedent, que si (I -3) est veriee dans un repere, alors, dans des notations evidentes, on a pour tout autre repere obtenu par rotation a partir de celui ci :
Fk = (CAiDBi)2 Ek 0
0
0
0
j j 0
0
(I -4)
Les equations covariantes sont d'ailleurs aussi invariantes de forme en composantes spheriques, mais il est tres dicile de le savoir a priori.
Exercice : Se convaincre que seules les equations covariantes sous un groupe de
symetrie G sont admissibles pour ecrire une loi invariante sous G.
Un autre avantage des representations lineaires est que, connaissant une equation physique veriee par une composante d'un tenseur, on peut, en l'ecrivant sous forme tensorielle, obtenir la loi veriee par toutes les autres composantes. Ceci vient, bien entendu, du fait que toutes les composantes jouent un r^ole equivalent (elles sont echangees par les symetries) et doivent donc obeir aux m^emes equations. De m^eme, si l'on conna^t une loi ecrite dans un rep ere particulier, on peut, en l'ecrivant de facon tensorielle, l'obtenir dans un rep ere quelconque. Prenons par 2: Il en va de m^eme dans un espace de Minkowski.
5
I. Appendice I : representations lineaires et non lineaires
111
exemple les transformations de Lorentz suivant Ox : 8 t = (t ; x) > > x = (x ; t) < (I -5) > y = y > : z =z avec = (1 ; v2) 1=2 et ~ = ~v (c = 1 dans ces unites) est la vitesse du deuxieme repere par rapport au premier. Cherchons a deduire de ce qui precede la transformation de Lorentz suivant une direction quelconque. Comme l'axe Ox n'est pas privilegie | isotropie de l'espace | on s'attend, connaissant (I -5) a pouvoir en deduire la transformation de Lorentz suivant une direction quelconque gr^ace a l'invariance par rotation et a la manipulation de tenseurs de SO(3). On reecrit donc les trois dernieres equations de (I -5) de facon telle que l'invariance par rotation soit manifeste : 8 8 ~ > > < x = x + ( ; 1)x ; t < x = x + ( ; 1)~r :
; t y =y (I -6) =) y =y > > : z =z : z =z car, pour cette transformation le long de Ox, x = ~r : ~ = . Donc pour cette transformation, ~ ~r = ~r + ( ; 1)~r : ; ~ t Maintenant, l'invariance par rotation et le fait que nous n'utilisons que des tenseurs de SO(3), en l'occurrence ici que des vecteurs et des scalaires, nous assurent que cette expression est valable pour tout ~ ! C'est evidemment beaucoup plus commode que d'eectuer brutalement le calcul ! (voir aussi le calcul page(95) pour un autre exemple). On peut aussi se servir de l'invariance par rotation pour predire des formes d'equation. Ainsi, le champ d'un dip^ole electrique s'ecrit : ! p ~ :~ r ~ E~ = ;r 40 r3 et etant vectoriel, lineaire en ~p=40 et de dimension p=40r3 ne peut que s'ecrire : p~ :~r) ~r E~ = 4~p r3 + 4( 0 0 r5 ou et sont des constantes numeriques qui ne peuvent ^etre determinees que par calcul direct (pourquoi un terme en p~ ^ ~r est il interdit? ). Terminons par un truc de calcul tres commode en particulier en physique des particules : l'integration symetrique. Supposons que l'on doive calculer l'integrale en dimension D, supposee convergente : Z I = dD k ki kj f (~k2 m) 0
0
0
0
;
0
0
0
0
0
0
0
5
I. Appendice I : representations lineaires et non lineaires
112
Exercice : Sachant que dans une transformation de Lorentz, le champ electrique se 8 < E =E : E~ = E~ + ~ ^ B~
transforme en :
0
k
k
0
?
?
ou E et E~ sont respectivement les composantes parallele et perpendiculaire de E~ suivant la direction de ~ et ou B~ est le champ magnetique, se convaincre que l'invariance par rotation assure que ces relations peuvent se reecrire de maniere entierement vectorielle, i.e. sans faire appel au choix d'axes precedents qui privilegie la direction ~ . Montrer alors en completant astucieusement les relations precedentes que E~ = E~ + 1 ;2 (~ : E~ )~ + ~ ^ B~ k
?
0
Exercice : Trouver le champ magnetique B~ cree par un moment magnetique sachant que : ! ~ ^ ~r ~B = r ~ ^ m B~ et m ~ sont des pseudo-vecteurs.
4r3
ou m designe un ou un ensemble de parametres scalaires. ~k etant une variable d'integration, il est clair que I n'en depend pas. Or, comme I depend de facon symetrique de deux indices vectoriels et comme il n'y a qu'un seul tenseur symetrique a deux indices, le tenseur metrique
ij (ou, dans le cas minkowskien ij ), on doit obligatoirement avoir :
I = ij (I -7) Le calcul de est en general plus simple que celui I car par contraction de (I -7) avec ij on obtient ( ij ij = Tr1 = D) Z 1
= D dD k ~k2 f (~k2 m) Par le m^eme raisonnement, on montre que Z dD k ki1 : : : ki2j+1 f (~k2 m) = 0 et pour quatre variables ki par exemple : Z dD k ki1 : : : ki4 f (~k2 m) = i1i2 i3i4 + i1 i3 i2i4 + i1 i4 i2 i3
5
II. Appendice II : groupes nis et caract eres
avec
113
Z = D(2 +1 2D) dD k (~k2)2 f (~k2 m)
Exercice : Montrer que Z
II
~ 2 d2r^ (B :~r^) 5 = B~ 2 g(A~ 2) + (A~ : B~ )2h(A~ 2 ) (1 ; A : r^)
´ ` APPENDICE II : THEORIE DES CARACTERES POUR LES GROUPES FINIS
Nous allons dans cet appendice mentionner quelques resultats propres a la theorie des groupes nis qui sont importants dans le contexte de la physique atomique, moleculaire, nucleaire, etc: : : et qui montrent, sur des exemples simples, des techniques de calcul qui se retrouvent de facon presque identique pour les groupes de Lie compacts comme le groupe des rotations. La somme des carres des dimensions dl des representations irreductibles est egale au cardinal h | appele aussi ordre | du groupe :
X l
dl 2 = h
(II -8)
Pour C3v : 12 + 12 + 22 = 6. On dit que deux elements g et g d'un groupe sont conjugues s'il existe un element f du groupe tel que : g = f 1gf (II -9) 0
0
;
La signication de la conjugaison est que g et g sont de \m^eme type" s'ils sont conjugues. Plus precisement, dans l'exemple de C3v , les deux rotations sont conjuguees et les trois symetries miroir le sont aussi (le montrer). On a par exemple : R2 = SA 1R1 SA. Le fait que l'on passe ainsi de R1 a R2 vient simplement de ce que R2 est une rotation d'angle ;2=3 et qu'une symetrie miroir change le sens de rotation. De m^eme, le fait que l'on passe par conjugaison d'une symetrie miroir a une autre indique seulement que l'on passe d'un plan miroir a un autre par rotation de 2=3 ou 4=3. La relation de conjugaison etant une relation d'equivalence (le 0
;
5
III. Appendice III : transformation des spineurs classiques
114
verier), l'ensemble des classes d'equivalence, dites classes de conjugaison, forme une partition du groupe. On peut montrer que le nombre de classes de conjugaison (trois pour C3v ) est egal au nombre de representations irreductibles. Pour le groupe des rotations, les classes de conjugaison sont formees des rotations de m^eme angle. On peut comprendre ainsi qu'il y a une innite de representations irreductibles pour SO(3). On appelle caractere de la matrice Tl (g), representant l'element g d'un groupe dans la l-ieme representation irreductible, la trace de cette matrice :
l (g) = Tr (Tl (g))
(II -10)
Cette denition s'etend trivialement aux representations reductibles. Il est clair a partir des denitions precedentes que le caractere est une constante a l'interieur d'une classe de conjugaison. On notera ~ l le vecteur a h composantes : (l (g1) : : : l (gh)). La relation \d'orthogonalite" suivante constitue le resultat fondamental de la theorie des caracteres :
~ l : ~ l = h ll 0
0
(II -11)
(Il peut arriver que les matrices d'une representation, et donc les caracteres, soient complexes). Si une representation fT (g)g, de caractere ~ , est reductible et s'ecrit :
T (g) =
X l
al Tl (g)
(II -12)
ou il s'agit d'une somme directe sur les representations irreductibles fTl (g)g du groupe, alors, par application directe de (II -11), on obtient que le nombre de fois que la l-ieme representation irreductible appara^t dans la decomposition de T est : (II -13) al = h1 ~ l : ~
III
APPENDICE III : TRANSFORMATION DES SPINEURS CLASSIQUES
Nous allons voir dans cet appendice que si un systeme classique est decrit par un doublet, il s'agit obligatoirement d'un spineur pour SO(3). Tout cet appendice peut ^etre considere comme un exercice, les spineurs classiques n'etant guere interessants en physique. Considerons donc deux observateurs vivant dans l'espace de base tri-dimensionnel et auxquels sont associees deux bases f~eig et f~e ig = fR~ei g, R etant une matrice de rotation. Ces deux observateurs etudient le m^eme systeme physique qui, par hypothese, est decrit par un 0
5
115
III. Appendice III : transformation des spineurs classiques
doublet. Nous allons etudier comment passer de la formulation de l'un des observateurs a celle de l'autre (point de vue passif). Comme nous avons montre qu'il etait loisible de le faire, nous supposerons que chacun des observateurs a pris comme representation matricielle des generateurs des rotations autour de ses propres axes (une demi fois) les matrices de Pauli (voir page 39). Ces choix xent entierement un choix de base de l'espace C 2 pour chacun des observateurs, a savoir j zi et j z i. Notre choix de base signie matriciellement : 0
(z ) ei = h z j ei j z i = e(zi ) = h zj ei j zi 0
0
0
(III -14)
0
0
Appelons U la matrice de SU (2) qui fait le passage des generateurs autour des ~ei a ceux autour des ~e i, Eq.(II -41) : e(zz) = R3j e(zj ) = U 1 e(zz) U (III -15) et appelons V la matrice qui fait le passage de la base des j zi aux j z i : 0
;
0
0
j z i = V j zi
(III -16)
0
Comme on peut toujours prendre ces bases orthonormees puisque les generateurs sont hermitiens, V est elle aussi unitaire et de determinant unite : V 2 SU (2). Notons que l'on a par denition du produit scalaire sesquilineaire habituel dans les espaces de Hilbert complexes :
h zj z i = V h z j zi = V* 0
(III -17)
0
Tout doublet jZ i peut se decomposer sur l'une ou l'autre base :
jZ i = Z j zi = Z j z i 0
(III -18)
0
Montrons que le passage des Z aux Z se fait gr^ace a la matrice U de SU (2). Pour trouver la relation entre Z et Z on va imposer (III -14). Partons de 0
0
e(zi ) 0
0
= e(zi )
=) h z j ei j z i = h z jU 1 ez U j z i 0
0
0
0
;
0
(III -19)
et inserons quelques relations de fermeture
h z j ez j z i = 0
0
0
=
X
h z j zi h zjU 1 j zi h zj ez j zi h zjU j zi h zj z i 0
;
0
X * 1 (z ) V U ei U V
(III -20)
;
Cette equation n'est compatible avec (III -14) que pour U = V* . En reportant dans (III -18) on trouve jZ i = Z j zi = Z t U 1 j zi (III -21) 0
;
5
IV. Appendice IV : Points de vue actifs
116
soit
Z = U Z
(III -22) Par consequent, et comme on pouvait s'en douter, les coordonnees d'un doublet se transforment par SU (2) lors des rotations dans l'espace de base. Il faut remarquer de nouveau que si l'on tourne contin^ument de 0 a 2 les axes du second observateur dans l'espace de base, les coordonnees du doublet ne reviennent pas a l'identique mais sont changees de signe. Ce n'est qu'au bout d'une rotation de 4 qu'elles se retrouvent a l'identique. Il est par consequent douteux que les spineurs soient necessaires dans le cadre classique ou, sauf exception, on n'a jamais aaire a des objets pour lesquels les rotations de 2 et de 4 soient discernables. De tels objets existent pourtant bel et bien, mais ils ne sont jamais elementaires. Un exemple fameux et souvent cite est celui du bras et de la main, paume tournee vers le ciel, qui apres un tour presente une torsion et qui au bout de deux tours n'en presente plus. On peut montrer en toute generalite qu'on ne peut pas construire un compteur des rotations (fait d'engrenages, d'aiguilles, de poulies, etc: : : ) de l'espace tri-dimensionnel qui fonctionne modulo plus de 4. Les choses se presentent assez dieremment dans le monde quantique y compris pour des particules elementaires et ce pour une raison non triviale exposee dans l'encadre IV. En eet, on montre page 51 que, dans le cadre quantique, les transformations dans l'espace de base induisent des transformations des vecteurs d'etat de l'espace de Hilbert m^eme dans le point de vue passif, contrairement au cas classique. Ceci vient du fait qu'un vecteur d'etat n'est pas directement associe a une quantite mesurable | qui sont les valeurs moyennes d'operateurs | contrairement a un vecteur classique comme une position ~x, un champ electrique ou magnetique, etc: : : Les transformations sont donc dierentes de ce qui est presente ici. Le theoreme de Wigner indique comment proceder. Notons enn que dans le point de vue passif, le fait que les coordonnees d'un vecteur ~v ou d'un tenseur T classique engendrent des representations de SO(3) est synonyme de l'existence \d'^etres geometriques" V~ , T qui sont intrins eques, i.e. independants d'un quelconque syst eme de coordonnees. Cette notion d'objets geometriques se retrouvent de facon identique dans l'espace de Minkowski, sous la forme de quadrivecteurs, quadritenseurs, etc: : : ainsi que dans les espaces de Riemann servant de cadre conceptuel a l'etude de la gravitation. 0
IV APPENDICE IV : POINTS DE VUE ACTIFS
Nous allons retrouver dans le cadre quantique et dans les deux points de vue actifs, les resultats deja derives dans le texte dans le point de vue passif, page 55 et suivantes. Nous donnerons nalement un recapitulatif des quatre points de vue.
5
117
IV. Appendice IV : Points de vue actifs
Il y a deux points de vue actifs. Le premier consiste a prendre deux observateurs O et O et deux systemes identiques S et S tels que initialement O est relie a S de la m^eme facon que O est relie a S . Ceci signie que les systemes etant identiques, ils sont caracterises par le m^eme ensemble irreductible d'operateurs et ont donc le m^eme espace de Hilbert (ou des espaces de Hilbert isomorphes que l'on peut par consequent confondre). A t0, les systemes etant dans des situations identiques relativement a leur observateur respectif, i.e. que les operateurs de l'ensemble irreductible ont m^eme valeur moyenne, le m^eme ket ji peut ^etre choisi par chacun des observateurs a cet instant pour decrire son systeme. Ulterieurement ils mesureront le m^eme jeu de probabilites de transition (donnes par les m^emes etats de leurs appareils de mesure) et declareront qu'une symetrie les relie si ces valeurs moyennes sont toujours egales : jhf jT (t t0)jij2 = jhf jT (t t0)jij2 (IV -23) ou T (t t0) et T (t t0) sont respectivement les operateurs d'evolution utilises par O pour decrire l'evolution de S et par O pour decrire celle de S . Si ceci est vrai pour tout ji et tout jf i, on deduit qu'a une une phase pres, que l'on peut montrer ^etre inessentielle, T doit ^etre egal a T . Montrons que cette condition est bien identique a celle trouvee dans le point de vue passif. Remarquons d'abord que pour l'observateur O par exemple, les deux systemes S et S sont identiques et ne dierent que par leurs conditions initiales (ils ne sont pas au m^eme point ou pas orientes de la m^eme facon, etc: : : ). Ils ont donc, pour cet observateur, le m^eme operateur d'evolution T (t t0 ). Il en va de m^eme evidemment pour O qui emploie le m^eme operateur d'evolution T (t t0) pour decrire les evolutions de S et de S . Or si l'on raisonne maintenant a systeme donne, disons S , c'est a dire que l'on oublie momentanement S , alors on se retrouve dans le point de vue passif ou les deux observateurs decrivent le m^eme systeme S . On sait de notre analyse precedente que les operateurs d'evolution utilises par les deux observateurs pour decrire l'evolution de S ne sont pas a priori egaux et sont relies par T (t t0) = U (t)T (t t0 )U (t0) ou U est deni comme precedemment et est l'operateur, deni dans le point de vue passif, qui fait passer des kets utilises par O a ceux utilises par O . En revenant maintenant a notre point de vue actif et compte tenu de ce qui a ete etabli precedemment, on deduit que l'operateur d'evolution de S utilise par O est T (t t0 ) = U (t)T (t t0 )U (t0 ). La condition pour avoir une symetrie est donc : T (t t0) = U (t)T (t t0 )U (t0) (IV -24) comme dans le point de vue passif. Remarquons, dans ce cas, qu'a tout instant, les kets decrivant les systemes S et S , respectivement dans la description de O et O , sont egaux, puisqu'ils sont egaux a t0 et ont m^eme operateur d'evolution : jS (t)i = jS (t)i (IV -25) 0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
y
y
0
0
0
0
y
5
IV. Appendice IV : Points de vue actifs
118
C'est bien ce a quoi on s'attend intuitivement. La m^eme analyse que dans le cas passif peut donc s'obtenir ici en particulier l'existence de quantites conservees. Le deuxieme point de vue actif | et qui est le plus souvent employe | consiste a prendre un seul observateur O et deux systemes S et S transformes l'un de l'autre. Il s'obtient a partir du premier point de vue actif en eliminant l'observateur O . Il faut se souvenir qu'evidemment les appareils de mesure de S sont transformes eux aussi par rapport a ceux mesurant S (on a par exemple deux experiences identiques l'une tournee vers la Mecque et l'autre tournee vers Jerusalem). La condition pour avoir une symetrie est que les resultats des mesures faites sur l'un des systemes soient identiques a celles faites sur l'autre. Revenons pour un instant au premier point de vue actif. On a comme relation entre les kets attribues par O et O au systeme S : 0
0
0
0
0
jS (t)i = U 1 (t)jS (t)i = U 1 (t)jS (t)i 0
;
0
(IV -26)
;
0
La derniere egalite n'etant vraie que pour une symetrie. Par ailleurs, il existe une relation analogue entre les kets d'etats attribues, cette fois-ci par un m^eme observateur, aux etats des appareils de mesure attaches a S et S . En eet, comme O attribue aux etats physiques des appareils de mesure de S , les m^emes kets jf i que O attribue a ceux de S , on deduit que O attribue aux etats physiques des appareils de mesure de S , les kets U 1 (t)jf i. La condition de symetrie entre les deux systemes s'obtient en disant que les probabilites de transition sont identiques pour les deux systemes : 0
0
0
0
;
j (hf jU (t)) jT (t t0)j U 1 (t0 )ji j2 = jhf jT (t t0)jij2 ;
(IV -27)
(ne pas oublier que les deux systemes ont pour O le m^eme operateur d'evolution). Cette condition redonne la condition de symetrie deja obtenue dans les autres points de vue :
T = UTU
1
;
(IV -28)
Comme on peut s'en convaincre facilement, cette relation signie aussi que le transforme de l'evolue dans le temps est l'evolue du transforme ou dit autrement que les deux systemes evoluent de facon absolument parallele et que pour passer de l'un a l'autre a n'importe quel instant, il sut d'employer l'operateur U 1 (t). Une remarque nale sur les points de vue actif. Le premier point de vue actif est (inconsciemment? ) employe en physique a chaque fois qu'un laboratoire refait une experience deja eectuee dans un autre laboratoire et compare ses resultats. Cependant, il faut faire attention que ce point de vue actif peut ne pas exister du tout lorsque, precisement, la transformation etudiee n'est pas une symetrie. Que l'on songe au neutrino qui n'existe que sous la forme gauche. ;
5
119
IV. Appendice IV : Points de vue actifs
L'experience miroir que l'on chercherait a faire pour tester, dans le point de vue actif, la symetrie de parite, n'existe pas puisque, justement, la physique des neutrinos n'est pas invariante par parite et que les neutrinos droits n'existent pas. En ce sens, le fait que le point de vue actif n'existe pas dans ce cas est en soi une preuve de la non invariance par parite de l'interaction faible. Le point de vue passif reste lui possible m^eme dans ce cas. Cependant, il existe des cas ou c'est le point passif qui n'existe pas. Si, par exemple, S est au dela de l'horizon cosmologique de O , celui ci n'a aucun moyen de l'etudier. 0
A
´ Recapitulatif
Nous allons maintenant donner un resume des dierents points de vue et resultats dans le cas d'une symetrie. On pourra s'imaginer que la transformation dont on parle est une rotation, mais n'importe quelle symetrie fait l'aaire. Dans le cas d'une symetrie, nous avons, a chaque instant, les relations suivantes entre les dierentes descriptions : jS i = U jS i (IV -29) 0
ou les notations choisies sont telles que, par exemple, jS i est le ket attribue par O au systeme S . Cette relation vient directement du theoreme de Wigner. Nous avons evidemment aussi 0
0
jS i = U jS i 0
(IV -30)
0
0
puisque la relation (IV -29) est generiquement vraie entre les kets attribues par O et O au m^eme systeme. Pour une symetrie, on peut toujours prendre (a une phase inessentielle pres) pour tout t : jS (t)i = jS (t)i (IV -31) 0
0
0
puisque les systemes evoluent, relativement a leur observateur respectif, exactement de la m^eme facon. On deduit de ces relations : jS i = U 1 jS i (IV -32) qui est la relation utile dans le second point de vue actif. Le fait que ce soit U 1 qui intervient dans ce cas est tout a fait normal : ceci signie simplement, dans le cas d'une rotation par exemple, qu'une rotation passive | i.e. du repere | d'un angle ~ est equivalente a une rotation active | i.e. du systeme | d'un angle ;~ . Dans ces conventions, et pour une symetrie, l'operateur utilise par O et mesure par un appareil de mesure lie a S , AS , est identique a celui utilise par O et mesure par un appareil de mesure lie a S , AS : AS = AS (IV -33) ;
0
;
0
0
0
0
0
0
5
120
IV. Appendice IV : Points de vue actifs
Ceci est clair compte tenu de (IV -31) puisque les deux systemes et les deux observateurs sont totalement symetriques et que par consequent :
jhS jAjS ij = jhS jAjS ij 0
0
0
(IV -34)
0
Compte tenu de (IV -31) et de (IV -32) on deduit de la relation precedente :
jhS jU 1 AU jS ij = jhS jAjS ij 0
;
(IV -35)
0
Bien s^ur, le membre de gauche represente toujours la mesure eectuee par les appareils lies a S sur le systeme S . Etant pris entre les etats attribues par O au systeme S , l'operateur U 1 AU est l'operateur utilise par O et mesure par les appareils lies a S :
0
0
0
;
0
AS = U 1 AS U 0
;
(IV -36)
qui n'est rien d'autre, dans le cas general, que l'equation (V -55) (la derivation donnee ici est dierente de celle donnee dans le texte).
121
6
CHAPITRE 6
Quand on a tout oubli´e Je suis s^ur, tacites amis, tous nous le sommes, Qu'il n'est qu'une vengeance et qu'il n'est qu'un pardon Et c'est l'oubli. Quelque divinite t don De cette etrange cle a la haine des hommes. J.L. Borges
Un groupe ' une table de multiplication (loi interne). Un groupe de Lie ' groupe dont les elements dependent contin^ument d'un ou plusieurs
parametres et tel que la loi de composition et l'inversion soient des fonctions analytiques des parametres. Exemple : SO(3) = fR(~ )g.
Algebre de Lie et generateurs. Pour SO(3) par exemple : (~ ) Ji = i d R d i
~=~0
j
() R(d~ ) = 1 + id~ : J~
On choisit souvent, en pratique, des generateurs hermitiques. C'est le cas pour les Ji et les generateurs du groupe de Lorentz (boosts + rotations). Algebre de Lie ' algebre des commutateurs entre generateurs.
Representations lineaires : on envoie les elements g du groupe sur des matrices D(g) | ou
sur des operateurs dierentiels | de telle facon que la loi de groupe soit reproduite par la multiplication matricielle : D(g1) : D(g2) = D(g1 g2)
Espace de representation : Les matrices D(g) peuvent ^etre interpretees comme des opera-
teurs lineaires agissant dans un espace vectoriel (de dimension, la dimension des matrices D(g)). Cet espace vectoriel est appele espace de representation. On dit que les objets qui se transforment par les D(g) engendrent la representation fD(g)g du groupe G. L'espace de Hilbert des etats d'un systeme quantique est un espace de representation pour les groupes de symetrie du systeme. Les kets d'etats engendrent des representations (en fait des representations projectives) de ces groupes de symetrie.
122
6
Representations equivalentes : fD(g)g et fD (g)g sont dites equivalentes si l'on peut par un m^eme changement de base dans l'espace de representation, passer des D(g) aux D (g), 8g : 0
0
9P=8g 2 G D (g) = P 1 D(g) P: 0
;
Dans ce cas, les operateurs lineaires representes par les D(g) et D (g) sont identiques pour tout g. Representation reductible : fD(g)g est dite reductible si elle est equivalente a une representation diagonale par blocs pour tout g. Groupe SO(3) = fR(~ )g t R = R 1 et det R = +1. R(~ ) = exp(i~ : J~). 3 parametres i =) 3 generateurs Ji (hermitiens). Algebre de Lie : " # X Ji Jj = i ijk Jk 0
;
k
Un operateur de Casimir (i.e proportionnel a l'unite dans chaque representation) : J~ 2 =
Jx2 + Jy2 + Jz2 . Le coecient de proportionnalite depend de la representation : J~ 2 = j (j +1)1 avec j entier. la dimension de chaque representation est 2j + 1 et les vecteurs de base dans chaque representation sont etiquetes par j et m = ;j ;j + 1 : : : +j = valeurs propres possibles de Jz dans la representation j . En coordonnees cartesiennes, la representation vectorielle, i.e. j = 1, a comme generateurs : 0 1 0 1 0 1 : : : : : i : ;i : Jx = B @ : : ;i CA ) Jy = B@ : : : CA ) Jz = B@ i : : CA : i : ;i : : : : :
Dans la base spherique, Jz est diagonale avec comme valeurs propres 1 0 ;1. Les generateurs sont des operateurs vectoriels, veriant donc : R 1 JiR = Rij Jj (sommation ;
sous entendue).
Groupe SU(2)= fU (~ )g U = U 1 et det U = +1. U (~ ) = exp(i~ :~ =2) = cos 2 + i sin 2 ~n :~ ou ~ = ~n. h i M^eme algebre de Lie que SO(3) : i=2 j =2 = i Pk ijk k =2 (c'est le groupe de recouy
;
vrement universel de SO(3)). Les i=2 sont les generateurs de SU (2). ! ! ! : 1 : ; i 1 : Base ou z est diagonale : x = 1 : y = i : z = : ;1 .
123
6
i j = ij 1 + i Pk ijk k .
! z ; z * 1 2 U 2 SU (2) () U = z2 z*1 avec det U = z1 z*1 + z2 z*2 = 1 Les objets a deux composantes complexes qui se transforment par SU (2) : zi = Pj Uij zj sont appeles spineurs. ! ~ ~ Les matrices U ( ) et ;U ( ) = U ( + 2)~n sont envoyees sur la m^eme matrice R(~ ) de SO(3) par le morphisme : Rij = 21 Tr i U j U : 0
y
Les i forment un operateur vectoriel : U i U = Pj Rij j . Si Z est un spineur alors V~ = Z ~ Z est un vecteur et S = Z Z est un scalaire. est un tenseur (antisymetrique) invariant de SU (2), c'est a dire qu'il verie ij = P U ijU . Ceci montre egalement que la complexe conjuguee de SU (2) est une representation y
y
y
kl ik jl kl
equivalente a SU (2). zi et zi etant les composantes de deux spineurs, le produit tensoriel zi zj se decompose en une partie vectorielle qui est le produit symetrise (zi zj + zj zi )=2 et une partie scalaire qui est le produit antisymetrise (zizj ; zj zi)=2 et qui est proportionnelle au tenseur antisymetrique ij . Tenseurs. Le caractere tensoriel est relatif a un groupe de transformations. Pour SO(3) par exemple, on denit un tenseur T de rang p par : 0
0
0
0
0
0
T=
X
i1 ::ip
Ti1::ip ~ei1 : : : ~eip
Dans une rotation passive, ou T est invariant, les composantes Ti1 ::ip se transforment par :
Ti1 ::ip = 0
X
j1 ::jp
Ri1 j1 : : : Ripjp Tj1::jp
Ceci se generalise directement au cas de SU (2) pour lequel on appelle parfois les tenseurs des multispineurs puisqu'ils portent p indices spinoriels. En general, un tenseur de rang p engendre une representation reductible, cf. le produit de deux spineurs. Pour le groupe de Lorentz, on denit egalement des tenseurs de la m^eme maniere, mais il est en plus commode de denir des tenseurs mixtes, p1 fois covariants et p2 fois contravariants (voir la suite). Transformations des champs dansPles rotations. On denit, pour le groupe des rota~ () Li = ;i k ijk xj @k . L~ verie la m^eme algebre de Lie que les tions : L~ = ;i~x ^ r
124
6
generateurs du groupe des rotations. Un champ de tenseurs T (~x), deni sur l'espace euclidien a trois dimensions, voit ses composantes se transformer dans une rotation passive par :
Ti (x) = 0
X"
ei~ : (L~ +S~ )
j
#
ij
Tj (x)
avec S~ l'operateur matriciel representant le generateur des rotations dans la representation engendree par T (le spin de T en quantique) : S~ = ~0 pour un champ de scalaire, S~ = ~ =2 pour un champ de spineur, etc: : : Une autre forme de la m^eme relation est :
Ti (x ) = 0
0
X" j
ei~ : S~
#
ij
Tj (x)
Ceci se transpose directement aux transformations de Lorentz. Theoreme de Wigner. Dans un espace de Hilbert, si l'on a une application U qui envoie ji sur j i en conservant les modules des produits scalaires, alors cette application est soit lineaire et unitaire soit anti-lineaire et unitaire : 0
jhjij = jh j ij () j i = U ji 0
0
0
Comme une symetrie conserve les produits scalaires, les U forment des representations des groupes de symetrie. En fait, il s'agit de representations projectives (i.e. a une phase pres). Les representations projectives des groupes de symetrie qui nous interessent, sont des representations vraies de leur groupe de recouvrement universel. D'ou, par exemple, l'inter^et de SU (2) en mecanique quantique. Principe de correspondance, Operateurs tensoriels. On postule que les valeurs moyennes des observables quantiques se transforment comme les quantites classiques. Par exemple, si T est un tenseur classique (pas un operateur) de SO(3) engendrant la representation M de ce groupe, alors son analogue quantique, nomme de facon identique par abus de langage, obeit par hypothese a : ! hjT ji = M hjT ji 0
En choisissant de changer les kets par Wigner et en gardant xes les operateurs, il doit donc verier :
U (~ ) T U (~ ) = M (~ ) T
Ceci est la denition d'un operateur tensoriel. On peut transposer sans probleme cette relation au groupe des translations et de Lorentz. Symetries. Le fait d'avoir une symetrie contraint la dynamique du systeme. y
125
6
En representation de Schr!odinger, ceci se traduit par : &H (t) U (t)] + i@U=@t = 0 ou U est
l'operateur de Wigner eectuant, dans le point de vue passif, la transformation des etats. Si U est independant du temps : &H (t) U ] = 0] En representation de Heisenberg, ceci se traduit par le fait que la transformation des etats (i.e. U ) est independante du temps : dU H = 0 dt et que les deux observateurs se servent des m^emes operateurs pour une grandeur physique donnee, comme en Schr!odinger. Les relations de commutation canoniques entre les observables de l'ensemble irreductible sont determinees par les symetries, en tout cas pour ce qui est de la particule galileenne (ce n'est plus que partiellement vrai en theorie quantique des champs). En particulier, &X P ] = i est une consequence de l'invariance par translation (et du principe de correspondance, bien entendu). Espace de Minkowski. Il s'agit d'un espace a quatre dimensions, reel, muni d'un produit scalaire entre vecteurs de base fe g = 0 : : : 3 :
01 B ;1 ou = B B@ ;1
e :e = ds2
;1
1 CC CA
Le carre de la distance entre deux points voisins est denie par :
= dx:dx = dx dx = dx dx ou l'on a utilise la convention d'Einstein. Les coordonnees d'un point sont : x0 = t x1 = x x2 = y x3 = z Un quadri-vecteur : A = A e Coordonnees co et contra- variantes : A et A = A . Produit scalaire : A : B = A B = AB . Gradient : @ = @=@x = @ = @=@x . Transformations de Lorentz et translations :
ds2 = ds 2 () x = + : : x + a avec + :: + : : = 0
0
On a par denition de +:: : +:: + :: = . A = +:: A A = +:: A . 0
0
126
6
0 0 BB xx 1 Boost suivant Ox : BB x 2 @ 3 x
1 0 ; sinh CC B ; cosh sinh cosh B CC = B 1 A @
1 0 x0 1 CC BB x1 CC CA B@ x2 CA v = tanh 1 x3 Pour une transformation de Lorentz innitesimale : + = + avec = ; 0 0 ;d ;d ;d 1 1 2 3 ( 0 i B C i=0 ; d 0 d ; d 1 3 2 C =B = ) B @ ;d ;d A i j = ;j i 0 d 1 C 2 3 ;d3 d 2 ;d 1 0 0 0 0 0
~:K~ +i~:J~ = e
avec J0i = ;iKi Jij = ijk Jk . 0: : : 1 : : 1 :1 : : : : :C CC ) Kz = BBB : : : @: : : : : : : :A : : : : : 1 : : Algebre de Lie du groupe de Lorentz :
+=e
;
;
0: B1 Kx = B B @: :
1 2
i J
0: :1 :C CC ) Ky = BBB : @1 :A : :
1 : : :
1 CC CA
h i J J = i ( J ; J + J ; J )
Elle peut aussi s'ecrire : &Jx Kx] = 0 &Jx Ky ] = iKz &Kx Ky ] = iKz . On peut la reecrire comme deux algebres de Lie de SU (2) independantes. Representations (1/2,0) et (0,1/2) de SO(3,1). (0 1=2) : J~ = ~ =2 et K~ = ~ =2 =) M2 (~ ~) = e ~ :~=2+i~ :~=2 . (1=2 0) : J~ = ~ =2 et K~ = ;~ =2 =) M1 (~ ~) = e+~ :~=2+i~ :~=2. M1 et M2 2 SL(2 C ). Ce sont deux representations inequivalentes de SL(2 C ). fM* 1 (~ ~)g et fM2(~ ~)g sont des representations equivalentes. La parite echange (0 1=2) et (1=2 0). Bi-spineurs et Diracologie . ! Bi-spineur : = LR : = 1 : : : 4 8 < L L L ~ L composantes covariantes d'un 4-vecteur : ~ composantes contravariantes d'un 4-vecteur R R R R LR et R L sont des scalaires. * = 0 est le conjugue de Dirac de , * = ( 0) S = * est un (vrai scalaire). ;
y
y
y
y
y
y
y
y
127
6
P = * 5 est un pseudo-scalaire. V = * est un (vrai) quadrivecteur. A = * 5 est un pseudo-quadrivecteur En representation de Weyl ! : ! ! ~ ; 1 0 1 ~ = ;~ 5 = 0 = 1 0 1
En repr esentation ! de Dirac : ! ! 1 1 i 0 i 5 D = D = 1 ;1 D = ; i 8 Algebre de Cliord et proprietes des matrices : > f g = 2 1 > > < f52 5g = 0 ( ) = 1 > > 5 = i 0 1 2 3 > : ( 0) = 0 ( i) = ; i = 0 i 0 ( 5) = 5 5 1 2 = projecteur sur les composantes droites et gauches. ( Changement de representation : =5 =UU 5 U U unitaire y
y
y
0
0
y
Transformation de Lorentz des bi-spineurs : = S (+) 0
avec = i=2 & ]
S (+) = exp(; 2i =2)
Transformations de Lorentz des champs. J = L + S avec L = i(x @ ; x @ ). L
est la partie orbitale et S la partie de \spin" : S = 0 =2 etc: : : suivant que le champ est scalaire, spinoriel, : : : Pour un champ : i
h T (x ) = e 2i J T (x ) ou l'on prend J dans la representation correspondant a la nature tensorielle de T . Translations : On appelle P le generateur des translations. P est represente, dans son action sur les fonctions de x, par i@ . Algebre de Lie de Poincare(. Il s'agit de celle de Lorentz a laquelle on ajoute : &P P ] = 0 &P L ] = i ( P ; P ) Operateurs de Casimir du groupe de Poincare. Il y en a deux : P 2 = m2 et W 2 = ;m2 s(s + 1) avec W = 21 L P . Pour les particules de masse nulle comme le photon, seules deux projections du spin, s, existent. 0
;