Proprieta fisiche della materia

Proprietà Fisiche della Materia Andrea Castro Proprietà letteraria riservata ©libreriauniversitaria.it Editore Webs...

Author: Andrea Castro

186 downloads 1095 Views 3MB Size Report

This content was uploaded by our users and we assume good faith they have the permission to share this book. If you own the copyright to this book and it is wrongfully on our website, we offer a simple DMCA procedure to remove your content from our site. Start by pressing the button below!
Report copyright / DMCA form

DOWNLOAD PDF

Proprietà Fisiche della Materia Andrea Castro

Proprietà letteraria riservata ©libreriauniversitaria.it Editore Webster srl, Padova, Italy I diritti di traduzione, di memorizzazione elettronica, di riproduzione e di adattamento totale o parziale con qualsiasi mezzo (compresi i microfilm e le copie fotostatiche) sono riservati per tutti i Paesi. Nessuna parte di questa pubblicazione può essere riprodotta, distribuita o trasmessa in qualsivoglia forma senza l’autorizzazione scritta dell’Editore, a eccezione di brevi citazioni incorporate in recensioni o per altri usi non commerciali permessi dalla legge sul copyright. Per richieste di permessi contattare in forma scritta l’Editore al seguente indirizzo: libreriauniversitaria.it Editore Via Stefano Breda, 28 35010 - Limena PD [email protected] Webster srl, Padova, Italy

ISBN: 978-88-6292-008-7 Prima edizione: Maggio 2009 Il nostro indirizzo internet e`: www. libreriauniversitaria.it

Per segnalazioni di errori o suggerimenti relativi a questo volume potete contattare: Webster srl Via Stefano Breda, 28 Tel.: +39 049 76651 Fax: +39 049 7665200 35010 - Limena PD [email protected]

Sommario

Prefazione

ix

I La fisica dei quanti

1

1 La quantizzazione dell’energia e il fotone 1.1 La radiazione di corpo nero . . . . . . . . . . . . . . . . . . . . 1.1.1 Caratteristiche sperimentali della radiazione da corpo nero . . . . . . . . . . . . . . . . . . . . . . . . . 1.1.2 La legge di Planck per la radiazione del corpo nero 1.1.3 La quantizzazione dell’energia . . . . . . . . . . . . . 1.1.4 Implicazioni del postulato di Planck . . . . . . . . . . 1.1.5 Esempi . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1.2 L’effetto fotoelettrico . . . . . . . . . . . . . . . . . . . . . . . 1.2.1 L’interpretazione di Einstein per l’effetto fotoelettrico . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1.2.2 Esempi . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1.3 Diffrazione dei raggi X su un cristallo . . . . . . . . . . . . . . 1.4 La diffusione di Compton . . . . . . . . . . . . . . . . . . . . . 1.4.1 Esempi . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1.5 Natura duale delle onde elettromagnetiche . . . . . . . . . . 1.6 Applicazioni . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1.6.1 Termografia . . . . . . . . . . . . . . . . . . . . . . . . . 1.6.2 Radiazione cosmica di fondo . . . . . . . . . . . . . . 1.7 Quesiti di riepilogo . . . . . . . . . . . . . . . . . . . . . . . . . 1.8 Esercizi . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

3 3 7 12 13 15 16 19 23 26 28 31 35 36 37 38 39 40 45

SOMMARIO

2 La materia: corpuscoli o onde? 2.1 Esperimento di Young con elettroni . 2.2 L’ipotesi di De Broglie . . . . . . . . . 2.2.1 Esperimenti di supporto . . . 2.2.2 Esempi . . . . . . . . . . . . . . 2.3 Il dualismo onda-particella . . . . . . 2.4 Indeterminazione di Heisemberg . . 2.4.1 Esempi . . . . . . . . . . . . . . 2.5 Complementarietà onda/particella . 2.6 Applicazioni . . . . . . . . . . . . . . . . 2.6.1 Microscopia elettronica . . . 2.6.2 Diffrazione di neutroni . . . . 2.7 Quesiti di riepilogo . . . . . . . . . . . 2.8 Esercizi . . . . . . . . . . . . . . . . . . .

. . . . . . . . . . . . .

. . . . . . . . . . . . .

. . . . . . . . . . . . .

. . . . . . . . . . . . .

. . . . . . . . . . . . .

. . . . . . . . . . . . .

. . . . . . . . . . . . .

. . . . . . . . . . . . .

. . . . . . . . . . . . .

. . . . . . . . . . . . .

. . . . . . . . . . . . .

3 I fondamenti della meccanica quantistica 3.1 L’ipotesi di Born . . . . . . . . . . . . . . . . . . . . . . . . 3.2 L’equazione di Schrodinger ¨ . . . . . . . . . . . . . . . . . 3.2.1 Equazione di Schrodinger ¨ degli stati stazionari 3.2.2 Esempi . . . . . . . . . . . . . . . . . . . . . . . . . 3.3 Momenti angolari e spin . . . . . . . . . . . . . . . . . . . 3.3.1 L’esperimento di Stern-Gerlach . . . . . . . . . 3.3.2 Lo spin dell’elettrone . . . . . . . . . . . . . . . . 3.3.3 Interazione spin-orbita . . . . . . . . . . . . . . . 3.3.4 Momenti magnetici nucleari . . . . . . . . . . . 3.4 Applicazioni . . . . . . . . . . . . . . . . . . . . . . . . . . . 3.4.1 Risonanza magnetica (nucleare) . . . . . . . . . 3.5 Quesiti di riepilogo . . . . . . . . . . . . . . . . . . . . . . 3.6 Esercizi . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

ii

. . . . . . . . . . . . .

. . . . . . . . . . . . .

. . . . . . . . . . . . .

. . . . . . . . . . . . .

. . . . . . . . . . . . .

47 47 50 50 54 56 59 62 68 69 69 72 75 76

. . . . . . . . . . . . .

79 79 81 83 84 93 96 98 100 101 102 103 105 106

SOMMARIO

II Proprietà elettriche, magnetiche, ottiche e termiche 107 4 La conduzione elettrica nei metalli 4.1 Classificazione dei solidi . . . . . . . . . . . . . . 4.2 Il modello di conduzione classico . . . . . . . . 4.3 Verso un modello quantistico . . . . . . . . . . . 4.3.1 Stati permessi . . . . . . . . . . . . . . . . 4.3.2 Esempi . . . . . . . . . . . . . . . . . . . . 4.4 Teoria delle bande . . . . . . . . . . . . . . . . . . 4.5 La conduzione elettrica . . . . . . . . . . . . . . 4.6 Conduttore o isolante? . . . . . . . . . . . . . . . 4.7 L’effetto della struttura reticolare . . . . . . . . 4.8 Massa efficace . . . . . . . . . . . . . . . . . . . . 4.9 Elettroni e lacune . . . . . . . . . . . . . . . . . . 4.9.1 Esempio . . . . . . . . . . . . . . . . . . . 4.10 Superconduttività . . . . . . . . . . . . . . . . . . 4.10.1 La teoria BCS per la superconduttività 4.11 Applicazioni . . . . . . . . . . . . . . . . . . . . . . 4.11.1 Termocoppia . . . . . . . . . . . . . . . . 4.11.2 Magneti superconduttori . . . . . . . . 4.11.3 Effetto Josephson e SQUID . . . . . . . 4.12 Quesiti di riepilogo . . . . . . . . . . . . . . . . . 4.13 Esercizi . . . . . . . . . . . . . . . . . . . . . . . . .

. . . . . . . . . . . . . . . . . . . .

111 112 115 119 122 128 131 134 136 138 141 144 145 146 151 153 153 156 157 158 159

5 I semiconduttori 5.1 I semiconduttori intrinsechi . . . . . . . . . . . . . . . . . . . . 5.1.1 Proprietà elettriche di un semiconduttore . . . . . . 5.1.2 Esempi . . . . . . . . . . . . . . . . . . . . . . . . . . . . 5.2 Semiconduttori drogati . . . . . . . . . . . . . . . . . . . . . . 5.2.1 Proprietà elettriche di un semiconduttore drogato 5.2.2 Effetto Hall . . . . . . . . . . . . . . . . . . . . . . . . . 5.2.3 Esempi . . . . . . . . . . . . . . . . . . . . . . . . . . . . 5.3 Dispositivi semiconduttori . . . . . . . . . . . . . . . . . . . . .

161 162 163 165 167 174 174 177 178

iii

. . . . . . . . . . . . . . . . . . . .

. . . . . . . . . . . . . . . . . . . .

. . . . . . . . . . . . . . . . . . . .

. . . . . . . . . . . . . . . . . . . .

. . . . . . . . . . . . . . . . . . . .

. . . . . . . . . . . . . . . . . . . .

. . . . . . . . . . . . . . . . . . . .

SOMMARIO

. . . . . . . . . . . .

178 185 188 195 198 201 202 204 206 208 210 212

6 Diamagnetismo e paramagnetismo 6.1 Campo magnetizzante e magnetizzazione . . . . . . . . . . 6.2 Diamagnetismo . . . . . . . . . . . . . . . . . . . . . . . . . . . 6.3 Paramagnetismo . . . . . . . . . . . . . . . . . . . . . . . . . . . 6.3.1 Suscettibilità magnetica per gli elettroni di conduzione . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 6.3.2 Smagnetizzazione adiabatica . . . . . . . . . . . . . . 6.3.3 Esempi . . . . . . . . . . . . . . . . . . . . . . . . . . . . 6.4 Applicazioni . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 6.4.1 Raffreddamento adiabatico . . . . . . . . . . . . . . . 6.4.2 Levitazione diamagnetica . . . . . . . . . . . . . . . . 6.5 Quesiti di riepilogo . . . . . . . . . . . . . . . . . . . . . . . . . 6.6 Esercizi . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

215 216 218 220 227 228 230 232 233 234 235 235

7 Ferromagnetismo 7.1 Ferromagnetismo . . . . 7.1.1 Domini di Weiss 7.1.2 Ciclo di isteresi . 7.1.3 Esempi . . . . . . 7.2 Ferrimagnetismo . . . .

237 237 244 246 249 250

5.4

5.5 5.6

5.3.1 La giunzione p-n . . . . . . 5.3.2 Il diodo . . . . . . . . . . . . 5.3.3 Il transistor . . . . . . . . . 5.3.4 Esempi . . . . . . . . . . . . Applicazioni . . . . . . . . . . . . . . 5.4.1 I LED . . . . . . . . . . . . . 5.4.2 Il laser a semiconduttore 5.4.3 La cella fotovoltaica . . . . 5.4.4 I rivelatori di particelle . . 5.4.5 Il regolatore di tensione . Quesiti di riepilogo . . . . . . . . . Esercizi . . . . . . . . . . . . . . . . .

. . . . . iv

. . . . .

. . . . .

. . . . .

. . . . .

. . . . .

. . . . . . . . . . . .

. . . . .

. . . . . . . . . . . .

. . . . .

. . . . . . . . . . . .

. . . . .

. . . . . . . . . . . .

. . . . .

. . . . . . . . . . . .

. . . . .

. . . . . . . . . . . .

. . . . .

. . . . . . . . . . . .

. . . . .

. . . . . . . . . . . .

. . . . .

. . . . . . . . . . . .

. . . . .

. . . . . . . . . . . .

. . . . .

. . . . . . . . . . . .

. . . . .

. . . . . . . . . . . .

. . . . .

. . . . . . . . . . . .

. . . . .

. . . . . . . . . . . .

. . . . .

. . . . . . . . . . . .

. . . . .

. . . . .

SOMMARIO

7.3 7.4

7.5 7.6

Antiferromagnetismo . . . . . . . Applicazioni . . . . . . . . . . . . . 7.4.1 Elettromagneti . . . . . . 7.4.2 Magneti permanenti . . 7.4.3 Nuclei per trasformatori 7.4.4 Memorie magnetiche . . 7.4.5 Dischi magneto-ottici . . 7.4.6 Schermo magnetico . . Quesiti di riepilogo . . . . . . . . Esercizi . . . . . . . . . . . . . . . .

. . . . . . . . . .

. . . . . . . . . .

. . . . . . . . . .

. . . . . . . . . .

. . . . . . . . . .

8 Onde elettromagnetiche in un dielettrico 8.1 Polarizzazione di un dielettrico . . . . . . 8.2 Equazioni di Maxwell per un dielettrico 8.3 L’indice di rifrazione . . . . . . . . . . . . . 8.3.1 Dispersione della luce . . . . . . 8.3.2 Velocità di gruppo . . . . . . . . . 8.3.3 Esempi . . . . . . . . . . . . . . . . 8.4 Costante dielettrica relativa . . . . . . . . 8.5 Riflessione sulla superficie . . . . . . . . . 8.5.1 Esempio . . . . . . . . . . . . . . . 8.6 Trasmissione di un’onda . . . . . . . . . . 8.7 Applicazioni . . . . . . . . . . . . . . . . . . 8.7.1 Spettroscopia ottica . . . . . . . . 8.7.2 Riscaldamento dielettrico . . . . 8.8 Quesiti di riepilogo . . . . . . . . . . . . . 8.9 Esercizi . . . . . . . . . . . . . . . . . . . . .

. . . . . . . . . .

. . . . . . . . . . . . . . .

. . . . . . . . . .

. . . . . . . . . . . . . . .

. . . . . . . . . .

. . . . . . . . . . . . . . .

. . . . . . . . . .

. . . . . . . . . . . . . . .

9 Onde elettromagnetiche in un conduttore 9.1 L’indice di rifrazione di un conduttore . . . . . 9.1.1 Approssimazione per basse frequenze 9.1.2 Approssimazione per alte frequenze . 9.1.3 Esempi . . . . . . . . . . . . . . . . . . . . v

. . . . . . . . . .

. . . . . . . . . . . . . . .

. . . .

. . . . . . . . . .

. . . . . . . . . . . . . . .

. . . .

. . . . . . . . . .

. . . . . . . . . . . . . . .

. . . .

. . . . . . . . . .

. . . . . . . . . . . . . . .

. . . .

. . . . . . . . . .

. . . . . . . . . . . . . . .

. . . .

. . . . . . . . . .

. . . . . . . . . . . . . . .

. . . .

. . . . . . . . . .

. . . . . . . . . . . . . . .

. . . .

. . . . . . . . . .

252 253 254 256 256 257 257 259 260 261

. . . . . . . . . . . . . . .

263 263 270 274 278 279 281 283 284 286 287 288 288 288 289 290

. . . .

293 293 295 297 302

SOMMARIO

9.2 9.3

9.4 9.5

Effetto pelle . . . . . . . . . . . . . . . . . 9.2.1 Esempio . . . . . . . . . . . . . . Applicazioni . . . . . . . . . . . . . . . . . 9.3.1 Argentatura degli specchi . . . 9.3.2 Schermatura elettromagnetica 9.3.3 Ionosfera e onde radio . . . . . Quesiti di riepilogo . . . . . . . . . . . . Esercizi . . . . . . . . . . . . . . . . . . . .

. . . . . . . .

. . . . . . . .

10 Proprietà termiche 10.1 Capacità termica . . . . . . . . . . . . . . . . 10.1.1 Modello classico . . . . . . . . . . . 10.1.2 Modello di Einstein . . . . . . . . . 10.1.3 Modello di Debye . . . . . . . . . . 10.1.4 Contributo elettronico . . . . . . . 10.1.5 Esempi . . . . . . . . . . . . . . . . . 10.2 Conduzione termica . . . . . . . . . . . . . 10.2.1 Conduzione elettrica e termica . . 10.2.2 Esempi . . . . . . . . . . . . . . . . . 10.3 Espansione termica . . . . . . . . . . . . . . 10.4 Comportamenti termici . . . . . . . . . . . 10.4.1 Isolamento o conducibilità . . . . 10.4.2 Dilatazione . . . . . . . . . . . . . . 10.5 Applicazioni . . . . . . . . . . . . . . . . . . . 10.5.1 Isolamento termico dello Shuttle 10.5.2 Dispersori di calore . . . . . . . . . 10.6 Quesiti di riepilogo . . . . . . . . . . . . . . 10.7 Esercizi . . . . . . . . . . . . . . . . . . . . . .

. . . . . . . .

. . . . . . . . . . . . . . . . . .

. . . . . . . .

. . . . . . . . . . . . . . . . . .

. . . . . . . .

. . . . . . . . . . . . . . . . . .

. . . . . . . .

. . . . . . . . . . . . . . . . . .

. . . . . . . .

. . . . . . . . . . . . . . . . . .

. . . . . . . .

. . . . . . . . . . . . . . . . . .

. . . . . . . .

. . . . . . . . . . . . . . . . . .

. . . . . . . .

. . . . . . . . . . . . . . . . . .

. . . . . . . .

. . . . . . . . . . . . . . . . . .

. . . . . . . .

. . . . . . . . . . . . . . . . . .

. . . . . . . .

303 305 306 306 307 308 309 310

. . . . . . . . . . . . . . . . . .

311 312 314 315 317 319 320 322 327 328 329 331 331 332 332 334 335 336 336

11 Cristalli liquidi 339 11.1 Proprietà elettriche e magnetiche . . . . . . . . . . . . . . . . 342 11.2 Proprietà ottiche . . . . . . . . . . . . . . . . . . . . . . . . . . . 345 11.2.1 Birifrangenza . . . . . . . . . . . . . . . . . . . . . . . . 346 vi

SOMMARIO

11.3 11.4

11.5 11.6

11.2.2 Dicroismo . . . . . . . . . . . . 11.2.3 Attività ottica . . . . . . . . . . 11.2.4 Riflessione di Bragg . . . . . . Esempi . . . . . . . . . . . . . . . . . . . Applicazioni . . . . . . . . . . . . . . . . 11.4.1 Termografia a cristalli liquidi 11.4.2 Schermo a cristalli liquidi . . Quesiti di riepilogo . . . . . . . . . . . Esercizi . . . . . . . . . . . . . . . . . . .

. . . . . . . . .

. . . . . . . . .

. . . . . . . . .

. . . . . . . . .

. . . . . . . . .

. . . . . . . . .

. . . . . . . . .

. . . . . . . . .

. . . . . . . . .

. . . . . . . . .

. . . . . . . . .

. . . . . . . . .

. . . . . . . . .

. . . . . . . . .

347 348 350 352 354 354 355 356 356

12 Soluzioni 357 12.1 Quesiti di riepilogo . . . . . . . . . . . . . . . . . . . . . . . . . 357 12.2 Esercizi . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 364 13 Bibliografia

373

vii

Prefazione Questo testo è stato pensato principalmente come supporto al corso di Complementi di Fisica per la Laurea Triennale in Chimica e Chimica dei Materiali, presso la Facoltà di Scienze MM. FF. e NN. dell’Università di Bologna. Si tratta di un corso di base e non specialistico e, quindi, questo libro vuole servire da introduzione concisa e, si spera, esauriente, al tema complesso delle proprietà fisiche della materia. A tal fine si è scelto di privilegiare la trattazione dei concetti e delle formule principali, limitandosi al formalismo matematico indispensabile alla comprensione dei concetti stessi in modo da non appesantire la trattazione. Le proprietà fisiche della materia sono legate principalmente al comportamento degli elettroni, elettroni che si manifestano talvolta come particelle e talvolta come onde con un dualismo che viene spiegato nell’ambito della meccanica quantistica. L’elettromagnetismo classico e` in genere in grado di fornire un modello valido per la spiegazione, qualitativa se non quantitativa, dei fenomeni fisici. L’accordo tra teoria ed esperimento, cos`ı come la previsione di certi fenomeni inspiegabili classicamente, può essere ottenuto però solo ricorrendo a un trattamento secondo la meccanica quantistica dei fenomeni in questione. Per questo motivo la prima parte del testo è dedicata a tracciare le origini, riassumere i concetti e descrivere i fondamenti di questa teoria. La seconda parte del libro affronta il tema principale e discute le proprietà elettriche, magnetiche, ottiche e termiche della materia solida, proprietà che hanno innumerevoli conseguenze pratiche e che portano ad applicazioni di estrema rilevanza scientifica e tecnologica. Per completare parzialmente il quadro, verrà discusso anche il caso di uno stato di aggregazione differente da quello solido, il caso dei cristalli liquidi.

In questo testo, per ciascun capitolo, vengono presentati degli esempi seguiti dall’illustrazione di alcune tra le applicazioni concrete più significative dei temi discussi. Ogni capitolo terminerà con alcuni quesiti di riepilogo e problemi, la soluzione dei quali e` riportata alla fine del testo. Per aiutare lo studente si e` voluto inoltre evidenziare, incorniciandole, le formule essenziali, che spesso fanno riferimento a delle leggi particolarmente importanti. Per completare la trattazione ho voluto fornire anche, ove rilevante, un breve inquadramento cronologico dei modelli o degli esperimenti, segnalando gli scienziati che vi hanno contribuito.

Parte I La fisica dei quanti Il XIX secolo terminò, dal punto di vista della fisica, con il grosso successo dell’unificazione dei fenomeni elettrici e magnetici attraverso le quattro equazioni di Maxwell. Queste equazioni rappresentarono il compendio della conoscenza scientifica dei fenomeni elettrici e magnetici acquisita fino ad allora e diventarono le equazioni fondamentali di una nuova teoria elettromagnetica. I campi elettrici E e magnetici B non appartenevano più a due mondi distinti, ma rappresentavano due aspetti della stessa entità, il campo elettromagnetico, descritto formalmente da un unico insieme di equazioni che legano E a B. In aggiunta a ciò le equazioni di Maxwell portarono alla previsione, verificata poi sperimentalmente, dell’esistenza delle onde elettromagnetiche. Il XX secolo cominciò subito con delle osservazioni sperimentali che non poterono essere spiegate dalla fisica classica che includeva l’elettromagnetismo derivante dalle equazioni di Maxwell, ma che invece richiesero dei nuovi modelli in netto contrasto con la teoria classica. Fu l’anno 1900, quello in cui Planck presentò i suoi studi sulla radiazione termica emessa da un corpo nero, che viene convenzionalmente considerato l’anno di nascita della fisica quantistica, teoria che richiese qualche decina d’anni per arrivare a una formulazione completa. Oltre alla radiazione termica, altri fenomeni quali l’effetto fotoelettrico e la diffusione di Compton dimostrarono inequivocabilmente che la radiazione elettromagnetica quando interagisce con la materia, cioè quando viene emessa o assorbita da essa, si comporta non come l’usuale onda ma come un’entità in cui l’energia risulta essere concentrata in pacchetti localizzati e non distribuita su tutto il fronte d’onda come ci si aspetterebbe classicamente.

Continuando con le osservazioni sperimentali si fecero delle scoperte ulteriori che obbligarono a cambiare drasticamente il modo in cui si interpretava la materia. Alcune assunzioni della fisica classica, quali il fatto che le particelle di materia siano localizzabili spazialmente con precisione arbitraria e che si spostino tra due punti come corpuscoli, risultarono essere in contrasto con i risultati sperimentali e dovettero essere abbandonate per fare posto al concetto di indeterminazione nella conoscenza della posizione di un corpo e al concetto di natura ondulatoria, paradossale per le particelle. Com’è vero anche per la teoria della relatività speciale, che venne a svilupparsi più o meno negli stessi anni, la fisica quantistica rappresenta una generalizzazione di quella classica, nel senso che essa include la teoria classica come caso particolare. Cos`ı come la teoria della relatività estende il dominio di validità delle leggi fisiche a situazioni in cui le velocità in gioco sono molto grandi (vicine a quelle della luce nel vuoto, c), allo stesso modo la fisica quantistica rappresenta un’estensione delle teorie classiche, indispensabile quanto più si va a indagare nel mondo microscopico. Il ruolo svolto nella teoria relativistica dalla costante universale c viene giocato in quella quantistica da un’altra costante universale, la costante di Planck, h, che fornisce la granularità degli aspetti quantistici della materia. I fenomeni suddescritti, assieme ad altri aspetti in netto conflitto con la fisica classica, sono diventati i fondamenti a partire dai quali e` stata sviluppata la nuova teoria quantistica, evoluta poi in una teoria più completa e formalizzata detta meccanica quantistica, che rappresenta un’estensione delle teorie classiche e che descrive con successo il comportamento della materia a livello microscopico. Questa raffinata teoria si è sviluppata soprattutto nella prima metà del XX secolo con contributi importanti da parte di vari scienziati, come dimostrato dalla serie di Premi Nobel per la Fisica a loro attribuiti. In questa prima parte andremo a discutere gli esperimenti e i principi fondamentali che hanno determinato la nascita della fisica quantistica, per poi fornire dei cenni su alcuni aspetti significativi della meccanica quantistica.

2

Capitolo 1 La quantizzazione dell’energia e il fotone Lo spettro elettromagnetico rappresentato in figura 1.1, cioè la caratterizzazione delle onde elettromagnetiche in funzione di lunghezza d’onda o frequenza, e` convenzionalmente suddiviso in porzioni individuate da un intervallo di lunghezze d’onda o frequenze. Queste classi di radiazione elettromagnetica non si propagano nello spazio in modo differente l’una dall’altra, ma sono invece caratterizzate da modi diversi di essere prodotte e/o assorbite dalla materia. Sono tre, in particolare, le classi dello spettro elettromagnetico che ci interessa discutere in questo capitolo: la radiazione infrarossa, quella ultravioletta e i raggi X. L’inizio del XX secolo ha visto, infatti, lo svolgimento di esperimenti, riferiti a queste tre classi, che hanno modificato totalmente l’interpretazione di queste onde elettromagnetiche e hanno portato alla creazione di una nuova teoria, la fisica quantistica. Andiamo ora a discutere questi esperimenti, la loro interpretazione e le nuove ipotesi che vennero proposte per descriverli adeguatamente.

1.1

La radiazione di corpo nero

Tutti i corpi, in quanto si trovano a una temperatura T superiore allo zero assoluto, emettono radiazione termica. Di tale radiazione ce ne accorgiamo, ad esempio, quando avviciniamo la nostra mano a un corpo molto più caldo di noi, come nel caso di una lampadina a incandescenza: anche senza toccare la lampadina la nostra mano percepisce e assorbe del calore. Questo calore

Capitolo 1

La quantizzazione dell’energia e il fotone

λ (m) 10−13 10−12 10−11 10−10 10−9 10−8 10−7 10−6 10−5 10−4 10−3 10−2 10−1 1 10 102 103 104 105 106 107

E γ (eV) 107 106 105 104 103 102 10 1 10−1 10−2 10−3 10−4 10−5 10−6 10−7 10−8 10−9 10−10 10−11 10−12 10−13

ν (Hz) Raggi γ Raggi X Ultravioletto Luce visibile Infrarosso

Microonde TV Radio

1022 1021 1020 1019 1018 1017 1016 1015 1014 1013 1012 1011 1010 109 108 107 106 105 104 103 102 10

Figura 1.1: rappresentazione dello spettro elettromagnetico in termini di lunghezza d’onda, energia e frequenza dei fotoni associati.

4


Capitolo 1

non e` stato trasferito né per contatto diretto né per convezione, ma secondo una terza modalità detta irraggiamento. La radiazione termica e` allora un’onda elettromagnetica che e` stata prodotta dal corpo caldo, si e` propagata nello spazio ed e` stata assorbita dalla nostra mano (non ce ne accorgiamo, ma contemporaneamente la nostra mano emette essa stessa radiazione termica). Chiaramente si tratta di un’onda elettromagnetica emessa dal corpo e non riflessa/diffusa da esso perché la possiamo osservare anche nel caso di un corpo a temperatura molto alta (incandescente) posto in una stanza buia. Un’altra osservazione sperimentale piuttosto comune riguarda il riscaldamento progressivo di un corpo e le mutazioni che avvengono nella radiazione termica da esso emessa. Infatti, la radiazione termica corrisponde tipicamente all’intervallo infrarosso dello spettro elettromagnetico (vedi figura 1.1), con lunghezza d’onda compresa tra 700 nanometri e qualche millimetro, e quindi non e` percepibile direttamente dalla vista umana. Le cose cambiano se la temperatura del corpo assume valori elevati: se osserviamo una sbarretta di ferro sottoposta a una fiamma, man mano che si riscalda essa comincia ad assumere un’incandescenza via via più brillante. Continuando a riscaldare la sbarretta ne aumentiamo la temperatura e la sua colorazione passa da un colore bruno-rossastro a un arancio più vivo, per diventare poi di aspetto bianco-azzurrastro. Questa osservazione sperimentale significa due cose: 1) che all’aumentare della temperatura del corpo ne aumenta la brillantezza, cioè che la radiazione emessa aumenta in intensità; 2) che all’aumentare della temperatura il colore dominante della radiazione emessa, e osservata dai nostri occhi, passa dal rosso al bianco-azzurro, cioè diminuisce in lunghezza d’onda. In riferimento a ciò, come in altri casi simili, si possono fare delle misure precise di intensità e di lunghezza d’onda e qualsiasi modello che si proponga di spiegare le modalità della radiazione termica deve essere in grado di accordarsi con le suddette osservazioni sperimentali qualitativamente e quantitativamente. Se tutti i corpi emettono e assorbono radiazione termica le caratteristi-

5

Capitolo 1


che di tale radiazione dipenderanno, come già visto, dalla temperatura, ma anche dalle caratteristiche del corpo stesso e soprattutto della sua superficie: il tipo di materiale che compone la superficie, la sua forma, il grado di ruvidezza, la capacità di riflettere/diffondere la luce incidente su di esso. Ad esempio, una superficie piana e liscia di 1 cm2 , alla temperatura di 500 ○ C, emette tipicamente 1.7 W, nel caso del ferro, e 0.2 W se si tratta di platino. Se poi, a parità di materiale, si rende la superficie più ruvida la potenza emessa aumenta perché e` come se avessimo aumentato la superficie emettente. In una teoria della radiazione termica si vuole ricavare un modello generale che faccia riferimento a dei principi fondamentali della fisica e non a caratteristiche e dettagli individuali del corpo in questione. Per potere fare ciò dovremmo poter fare riferimento a un corpo ideale cos`ı come, nel caso dei gas, si e` fatto riferimento a un gas ideale per poter ottenere la famosa legge di stato PV = nRT. Tale modello, basato su un corpo radiante ideale, avrà come parametro fondamentale la temperatura del corpo stesso. Un esempio di corpo radiante ideale e` rappresentato dal corpo nero, un corpo cioè che assorbe tutta la radiazione incidente su di esso senza rifletterla. Un esempio di (quasi) corpo nero è un corpo normale ricoperto da uno strato di pigmento nero. Un corpo che non riflette né trasmette la luce apparirà nero se e` freddo, ma se lo riscaldiamo esso diventa una sorgente di radiazione termica ideale perché le caratteristiche della radiazione vengono a dipendere solo dalla temperatura del corpo e non dalla sua natura. Un corpo nero che si trovi all’equilibrio termico (cioè alla stessa temperatura) rispetto ad altri corpi che lo circondano si troverà a emettere, in media, altrettanta energia di quella che assorbe dagli altri corpi, a qualsiasi lunghezza d’onda. Un corpo nero a temperatura maggiore dell’ambiente circostante emetterebbe, invece, più radiazione di quella assorbita dall’ambiente. C’è un altro esempio di corpo che si comporta come un corpo nero ed e` più facile da trattare: la cosiddetta cavità. Immaginiamo di avere un corpo cavo le cui pareti sono mantenute alla temperatura uniforme T (vedi figura 1.2). Questa cavità sia fornita di un piccolo foro che consenta alla radiazione

6


Capitolo 1

di entrare al suo interno. Una volta entrata, questa radiazione viene assorbita e riemessa continuamente dalle pareti, raggiungendo una sorta di equilibrio termico con le pareti stesse della cavità. Una piccola frazione di tale radiazione riesce però a sfuggire dalla cavità emergendo dal foro avente un’area molto piccola rispetto all’area della superficie interna della cavità. Il foro della cavità agisce allora come sorgente di radiazione termica e la radiazione uscente da esso rappresenta un campione con le stesse caratteristiche della radiazione all’equilibrio presente dentro la cavità. Siccome tale cavità assorbe quasi tutta la radiazione incidente essa può essere assimilata a un corpo nero. Nel seguito considereremo come equivalenti i concetti di cavità e di corpo nero e useremo i due termini in modo intercambiabile.

1.1.1

Caratteristiche sperimentali della radiazione da corpo nero

Supponiamo di effettuare adesso delle misure quantitative sulla radiazione emessa da un corpo nero. Nello specifico si possono fare le seguenti osservazioni: − l’intensità della radiazione emessa dal corpo nero, cioè l’energia emessa in un secondo da una superficie di area unitaria, si chiama intensità di irraggiamento. Misurando questa intensità per valori diversi della temperatura del corpo nero scopriamo che essa non solo aumenta all’aumentare della temperatura, come qualitativamente avevamo anticipato, ma aumenta secondo la potenza quarta della temperatura assoluta, secondo la seguente formula empirica: I(T) = σ T 4 (1.1) chiamata legge di Stefan-Boltzmann1, enunciata per la prima volta nel 1879. 1

Josef Stefan (1835-1893), fisico austriaco. Ludwig Boltzmann (1844-1906), fisico austriaco studente di Stefan, che contribu`ı anche allo sviluppo della teoria cinetica dei gas.

7

Capitolo 1


Figura 1.2: rappresentazione di una cavità e della radiazione incidente su di essa e riflessa dalle pareti.

La costante σ viene misurata sperimentalmente e vale 5.67×10−8 W/m2 ⋅ K4 per un corpo nero. Qualsiasi altro corpo diverso dal corpo nero ideale ha un’intensità di irraggiamento che e` sempre minore di quanto espresso dalla legge di Stefan-Boltzmann. Per un corpo reale l’intensità di irraggiamento si scrive allora: (1.2) I(T) = єσ T 4 dove є < 1 e` una caratteristica del corpo reale e si chiama emissività; − l’intensità emessa in un certo intervallo di lunghezze d’onda (o di frequenze) si chiama radianza spettrale R(λ, T) ed e` funzione sia della lunghezza d’onda λ sia della temperatura T. Tale quantità rappresenta la potenza per unità di superficie, emessa con lunghezza d’onda compresa tra il valore λ e il valore λ + d λ. Il legame tra radianza spettrale e intensità di irraggiamento e` dato dalla formula seguente: I(T) = ∫

∞

0

R(λ, T)d λ

(1.3)

La radianza spettrale cos`ı definita e` una funzione di distribuzione che può essere misurata per un corpo nero a una certa temperatura e che, se rappre8

Radianza spettrale (W/cm2 μm)


Capitolo 1

35

2200 K 30

2000 K

25 20 15

1800 K

10 5 0

0.5

1

1.5

2

2.5

3

λ (μm)

3.5

4

4.5

5

Figura 1.3: curve di radianza spettrale per un corpo nero alla temperatura di 1800, 2000 e 2200 K.

sentata in un grafico, seguirebbe l’andamento di figura 1.3. Dalla figura si vede che all’aumentare della temperatura aumenta l’area al di sotto della curva e, essendo tale area uguale all’integrale della funzione, se ne deduce che aumenta anche l’intensità di irraggiamento, come osservato sperimentalmente; − osservando la figura 1.3 si nota anche che il massimo della funzione viene raggiunto a valori diversi di lunghezza d’onda λ max per temperature diverse. Se si studia quantitativamente la relazione tra λ max e T si scopre un’altra legge empirica, la legge dello spostamento di Wien2 : λ max T = 2898 μm ⋅ K

(1.4)

A questo proposito bisogna prestare attenzione se si sta esprimendo la radianza spettrale in funzione della lunghezza d’onda o della frequenza ν poiché la frequenza a cui corrisponde il massimo della radianza spettrale non e` data banalmente da ν max = c/λ max . Infatti, la radianza spettrale assume forma diversa se espressa in funzione di λ o in funzione di ν. Per passare da 2

Wilhelm Wien (1864-1928), fisico tedesco vincitore del Premio Nobel per la Fisica nel 1911 per le ricerche sulla radiazione termica.

9



Capitolo 1

12

1595 K

10

Rayleigh-Jeans 8 6 4

Dati

2

Wien

00

1

2

3

4

5

6

λ (μm)

Figura 1.4: radianza spettrale sperimentale (●) e previsioni ottenute dalle formule di Rayleigh-Jeans e di Wien, per una temperatura di 1595 K.

un’espressione all’altra dobbiamo ricordarci che la grandezza fisica che deve essere la stessa nei due casi e` la potenza emessa, quindi deve valere : R(λ)d λ = −R(ν)dν

(1.5)

dove il segno − deriva dal fatto che se la lunghezza d’onda aumenta la frequenza diminuisce e viceversa. Essendo ν = c/λ ne deriva che dν = −(c/λ2 )d λ quindi R(λ) ≠ R(ν), cioè non si può passare da R(λ) a R(ν) semplicemente per sostituzione della variabile λ con c/ν. La legge di Wien espressa per la frequenza sarebbe invece: ν max /T = 5.879 × 1010 Hz/K

(1.6)

Più avanti verranno discussi degli esempi (1 e 2) di radiazione termica emessa dal corpo umano e dalle stelle che si comporta in accordo con le leggi di Stefan-Boltzmann e di Wien. Date queste osservazioni sperimentali, passiamo a discutere la loro interpretazione. Agli inizi del XX secolo esistevano due formule che tentavano di spiegare le caratteristiche della radiazione da corpo nero (vedi figura 1.4): 10


Capitolo 1

1) la formula di Rayleigh-Jeans, e` stata sviluppata inizialmente da Rayleisulla base di principi della fisica classica e modificata successivamente da Jeans4 . Tale formula era stata ricavata considerando la radiazione entro la cavità come somma di onde stazionarie aventi i nodi sulla superficie della cavità. Il numero di onde stazionarie presenti in un certo intervallo di frequenze veniva contato usando considerazioni geometriche. A ciascuna onda veniva associata, secondo il principio di equipartizione dell’energia5, un’energia media E = kT dipendente solo dalla costante di Boltzmann k e dalla temperatura T della cavità. In questo modo si arriva a valutare la densità di energia entro la cavità e, quindi, la radianza spettrale. La formula cos`ı ottenuta per la radianza spettrale non risulta però in accordo con i valori sperimentali se non a lunghezze d’onda molto grandi (λ ≫ 50 μm). Non si tratta però di una semplice differenza quantitativa; il grosso problema di questa formula e` che per lunghezze d’onda piccole essa tende a divergere (catastrofe ultravioletta) prevedendo, cosa chiaramente assurda, un’intensità di irraggiamento infinita. 2) la formula di Wien per l’irraggiamento, che e` invece una formula di derivazione empirica. Tale formula non ha i problemi di divergenza della formula precedente e segue abbastanza bene le misure sperimentali, cominciando a discostarsene a lunghezze d’onda più elevate. Questa formula ha come unico presupposto la somiglianza analitica con un’altra formula usata in tutt’altra situazione, la formula di Maxwell6 , per la distribuzione delle velocità delle molecole di un gas ideale. Per spiegare la radiazione termica, Wien gh3

3

John W. Strutt noto come Lord Rayleigh (1842-1919), fisico inglese vincitore del Premio Nobel per la Fisica nel 1904 per i suoi studi sui gas e la scoperta dell’argon. 4 James H. Jeans (1877-1946), fisico, astronomo e matematico inglese, studiò oltre alla teoria della radiazione anche l’evoluzione stellare. 5 Il principio di equipartizione dell’energia prescrive che in un sistema di particelle classiche all’equilibrio l’energia cinetica media valga 21 kT per ogni grado di libertà; altrettanto dicasi per l’energia potenziale. 6 La formula di Maxwell fornisce la distribuzione f (v) delle velocità v di singole molecole di massa m in un gas alla temperatura T. Tale distribuzione risulta dipendere dalla velocità 2 secondo una formula del tipo f (v) ∝ v 2 e −mv /2kT . 11

Capitolo 1


ha usato la forma funzionale di Maxwell, adattando i parametri ai risultati sperimentali. Rispetto al mancato accordo tra risultati sperimentali e la formula di Rayleigh-Jeans, la proposta di Wien rappresentò un passo in avanti, dal punto di vista della pratica, ma era ovviamente insufficiente dal punto di vista della teoria. Queste due formule risultano parzialmente accettabili, vista la loro applicabilità a porzioni diverse dello spettro infrarosso. Entrambe però falliscono nell’interpretazione della natura della radiazione termica.

1.1.2

La legge di Planck per la radiazione del corpo nero

Partendo dalle due descrizioni insoddisfacenti di Rayleigh-Jeans e Wien, Planck7 cercò di adattarle per ricavare un’espressione valida su tutto l’intervallo di lunghezze d’onda. A questo fine Planck propose inizialmente, nel 1900, una formula per la radianza ancora empirica, del tipo: R(λ) =

1 a 5 b/λT λ e −1

(1.7)

dove i parametri empirici a e b erano stati ricavati in modo da accordare la formula con le osservazioni sperimentali. Anche se per questa formula l’accordo valeva a qualsiasi lunghezza d’onda, essa non aveva apparentemente alcun fondamento teorico. Planck cercò successivamente di fornirne un’interpretazione teorica e nel giro di un paio di mesi ci riusc`ı, arrivando a una formulazione leggermente differente: R(λ) =

1 2πc 2 h 5 hc/λkT λ e −1

(1.8)

In questa nuova formula i due parametri a e b vennero sostituiti da due costanti universali: la costante di Boltzmann k e una nuova costante h, che assumerà il nome di costante di Planck. Questa nuova formulazione risultò 7

Max Planck (1858-1947), fisico tedesco vincitore del Premio Nobel per la Fisica nel 1918 per la scoperta della quantizzazione dell’energia. 12


Capitolo 1

in pieno accordo con i risultati sperimentali (vedi figura 1.5) a piccole come a grandi lunghezze d’onda. Rispetto alla formulazione precedente essa non rappresenta banalmente una sostituzione di variabili perché ora la formula viene a dipendere da costanti universali e non da parametri empirici. La nuova costante h introdotta da Planck viene ad assumere un significato fondamentale, associato alla quantizzazione dell’energia.

1.1.3

La quantizzazione dell’energia

Per arrivare alla sua formula Planck rivide la legge di equipartizione dell’energia E = kT e assunse che essa valesse ancora per frequenze vicine a zero mentre, per ovviare alla catastrofe ultravioletta, l’energia media dovesse tendere a zero ad alte frequenze. Nel modello elaborato da Planck gli atomi che compongono la superficie interna della cavità si comportano come degli oscillatori caratterizzati da una frequenza propria di oscillazione. Come tutti gli oscillatori essi sono in grado di assorbire energia, se sollecitati dall’esterno, e di cederne a loro volta. Un tale oscillatore, secondo la teoria classica, sarebbe soggetto a variazioni continue dell’energia, cos`ı come un pendolo classico riduce progressivamente l’ampiezza delle proprie oscillazioni quando l’attrito con l’aria o l’attrito tra filo e perno dissipano in modo progressivo la sua energia. L’oscillatore introdotto da Planck si comportava però in modo diverso e l’ipotesi fondamentale postulata da Planck fu che: Per un oscillatore l’energia E assorbita o ceduta può assumere solo valori discreti, multipli di una quantità elementare, cioè E = nhν dove il numero intero n, chiamato numero quantico, ci dice che l’incremento o decremento minimo di energia deve essere pari alla quantità hν, dove h e` una costante universale indipendente dalle caratteristiche della cavità. L’idea che gli incrementi o decrementi nell’energia di un oscillatore avvengano in modo discreto corrisponde ad assumere che l’energia, una grandezza fisica che veniva considerata fino ad allora variabile con continuità, sia

13



Capitolo 1

8 7

1595 K

6 5 4 3 2 1 00

1

2

3

λ (μm)

4

5

6

Figura 1.5: radianza spettrale sperimentale (●) e previsione ottenuta dalla formula di Planck per un corpo nero alla temperatura T = 1595 K. I dati sperimentali sono tratti da una misura di W.W. Coblentz (1916) e riscalati per tenere conto di una definizione diversa di radianza.

invece una quantità discreta o come si dice quantizzata. Questo concetto rivoluzionario non fu facile da accettare nemmeno da parte di Planck stesso che cercò invano, per più di un decennio, di conciliare la teoria classica con il modello quantistico. La difficoltà principale nell’accettare questa nuova idea stava nel fatto che la teoria classica aveva ben funzionato per descrivere il moto di oggetti macroscopici mentre era nel dominio del microscopico, nel caso ad esempio degli atomi-oscillatori, che essa falliva. La discrepanza era basata su dati di fatto, ma poteva essere sanata se si andava a considerare la teoria classica come un caso limite di quella quantistica. In questa ottica il legame tra le due teorie sta nel principio di corrispondenza, principio che può essere enunciato nel modo seguente: La teoria quantistica coincide con quella classica quando si ha a che fare con numeri quantici grandi cioè tipicamente con oggetti macroscopici per i quali la teoria classica funziona egregiamente. Avendo considerato l’energia come una variabile discreta e non continua, 14


Capitolo 1

la legge di equipartizione dell’energia assume una forma differente: E=

hν e hν/kT

−1

(1.9)

tale da ottenere il comportamento voluto: E → kT per ν → 0 e E → 0 per ν → ∞. Si noti che e` l’estrema piccolezza del valore della costante di Planck, h = 6.63 × 10−34 J ⋅ s, a rendere inosservabile la discretezza dell’energia se non quando l’energia assume essa stessa valori minuscoli e confrontabili con la variazione elementare hν. La costante di Planck rappresenta allora un altro modo di guardare al principio di corrispondenza: si può ottenere la teoria classica a partire da quella quantistica facendo tendere h a zero; in questo modo la quantizzazione dell’energia sparirebbe e l’energia tornerebbe ad essere una grandezza continua. Il principio di corrispondenza spiega anche perché la legge di RayleighJeans fosse in accordo con l’esperimento per λ ≫ 50 μm. Lunghezze d’onda elevate corrispondono, infatti, a frequenze molto piccole e, quindi, il valore di hν risulta piccolo rispetto alla quantità kT che rappresenta l’ordine di grandezza dell’energia media classica di traslazione di una particella alla temperatura T. In questo caso la discretezza dell’energia e` inosservabile e si ricade nel caso classico. Osserviamo che le leggi sperimentali di Stefan-Boltzmann e dello spostamento di Wien possono essere ricavate a partire dalla formula di Planck per la radianza8 . Nel primo caso si integra su tutto il dominio della lunghezza d’onda, nel secondo caso si trova il valore di lunghezza d’onda che annulla la derivata della radianza spettrale, dR(λ)/d λ = 0.

1.1.4

Implicazioni del postulato di Planck

Il postulato usato da Planck, cioè che ogni oscillatore possiede un’energia pari a nhν dove n e` un numero intero, può essere generalizzato dicendo che 8

In questo caso sarebbe più conveniente usare R(ν) = 2πhν 3 /(e hν/kT − 1)c 2 .

15

Capitolo 1


Un qualsiasi sistema fisico, descritto da una coordinata che sia una funzione sinusoidale del tempo e che quindi esegua oscillazioni armoniche semplici, possiede una energia E = nhν. In questo caso si dice che il sistema si trova in un insieme discreto di stati quantici permessi, descritti dal numero quantico n. Tale descrizione quantistica sarebbe vera, ad esempio, per un pendolo semplice che oscilli a partire da una certa ampiezza iniziale. Sappiamo però che a causa di attriti vari l’ampiezza dell’oscillazione del pendolo e, quindi, la sua energia diminuiscono. Se l’energia e` quantizzata, come ci aspettiamo da quanto detto finora, allora anche l’ampiezza di oscillazione deve variare in modo discreto. Come può accordarsi ciò con la nostra esperienza che la diminuzione dell’ampiezza sia continua? Lo discuteremo nell’esempio 3.

1.1.5

Esempi

1. Discutere la radiazione termica prodotta dal corpo umano. La radiazione termica emessa dal corpo umano segue sostanzialmente le leggi della radiazione del corpo nero. Parte dell’energia scambiata dal corpo con l’ambiente circostante viene scambiata sotto forma di radiazione termica, con un’interazione continua con l’ambiente. La potenza netta risulta essere la differenza tra quella emessa e quella assorbita: Pnetta = Pem − Pass dove ciascuna potenza risulta essere pari all’intensità di irraggiamento moltiplicata per l’area A del corpo umano. A sua volta l’intensità di irraggiamento segue la legge di Stefan-Boltzmann, tenendo conto dell’emissività. La potenza netta irradiata diventa allora: Pnetta = Aєσ(T 4 − T04 ) dove T0 e` la temperatura ambiente e T quella del corpo umano. Consideriamo un’area approssimativa di 2 m2 per la superficie del corpo umano, 16


Capitolo 1

un’emissività є ≈ 1, una temperatura ambiente T0 = 20 ○ C e una temperatura media del corpo umano T ≈ 28 ○ C, dovuta alla presenza dell’abbigliamento. Con questi valori la potenza netta risulta essere: Pnetta = 2 × 1 × 5.67 × 10−8 × (3014 − 2934 ) = 95 W cioè la stessa potenza emessa da una tipica lampadina a incandescenza. Una tale potenza netta persa dal corpo umano comporterebbe una perdita giornaliera di energia pari a 8.2 × 106 J o equivalentemente circa 2000 kcal. Ecco perché dobbiamo assumere con il cibo una quantità energetica più o meno equivalente anche solo per mantenere la nostra temperatura corporea. Il calcolo fatto rappresenta una stima grossolana a causa dell’approssimazione delle assunzioni. Esistono, inoltre, altri meccanismi per lo scambio di calore che andrebbero considerati, quali la conduzione, la convezione e l’evaporazione legata alla nostra traspirazione. Sfruttando la legge dello spostamento di Wien possiamo poi stabilire la lunghezza d’onda dominante della radiazione emessa dal corpo umano: λ max = 2898/301 = 9.6 μm Il picco della radianza si trova, quindi, nella regione infrarossa. 2. Discutere la radiazione termica prodotta dalle stelle. Consideriamo la radiazione termica proveniente da tre stelle: il Sole, Antares e Vega. Per queste tre stelle conosciamo (vedi tabella 1.1) la lunghezza d’onda dominante (quella del picco della radianza) λ max e il raggio r. Con questi valori si può ottenere una stima approssimativa della loro temperatura superficiale, dell’intensità di irraggiamento e della potenza totale irraggiata. Assumendo che la superficie stellare si comporti come un corpo nero, possiamo ottenere una buona stima della sua temperatura dalla legge dello spostamento di Wien: T = 2898/λ max ottendendo una temperatura superficiale di circa 5800 K per il Sole, 3500 K per Antares e 9600 K per Vega. Le intensità di irraggiamento si ottengono 17

Capitolo 1


STELLA Sole Antares Vega

λ max (nm) 500 830 300

` RAGGIO r (m) LUMINOSITA 7.0 × 108 1 L⊙ 11 4.9 × 10 65000 L⊙ 9 1.6 × 10 37 L⊙

Tabella 1.1: lunghezza d’onda del picco delle radianza, raggio e luminosità di tre stelle.

invece dalla legge di Stefan-Boltzmann: I = σ T 4 = 5.67 × 10−8 T 4 e corrispondono a 6.4 × 107 , 8.5 × 106 e 4.8 × 108 W/m2 rispettivamente per Sole, Antares e Vega. La potenza totale emessa e` legata alla luminosità della stella e si ottiene moltiplicando l’intensità di irraggiamento per l’area della superficie stellare: P = I ⋅ 4πr 2 Le potenze corrispondenti valgono 3.9 × 1026 , 2.6 × 1031 e 1.5 × 1028 W rispettivamente per Sole, Antares e Vega. La luminosità di una stella rispetto a quella solare si ottiene facendo il rapporto tra le rispettive potenze. Da ciò si ricava che la luminosità di Antares e` circa 66 000 volte maggiore di quella del sole (L⊙ ) e che quella di Vega e` circa 40 volte maggiore di L⊙ . Questi valori sono in accordo con quanto riportato in tabella 1.1. 3. Si discuta la quantizzazione dell’energia nel caso di un pendolo semplice. Si consideri un pendolo semplice di massa m pari a 10 grammi sospeso tramite un filo di lunghezza ℓ = 10 cm, spostato dalla verticale di un angolo θ = 0.1 rad. La frequenza di oscillazione del pendolo si ricava dalla formula: √ √ g 9.8 1 1 = = 1.6 Hz ν= 2π ℓ 2π 0.1 valida per piccole oscillazioni.

18

L’effetto fotoelettrico

Capitolo 1

L’energia iniziale del pendolo corrisponde alla sua energia potenziale nella posizione iniziale, assumendo come zero dell’energia potenziale il valore corrispondente a quando il pendolo passa per la verticale. Quindi: E = mgh = mgℓ(1 − cos θ) cioè E = 0.01 × 9.8 × 0.1 × (1 − cos 0.1) = 5 × 10−5 J La quantizzazione dell’energia prevederebbe incrementi/decrementi di energia di entità ΔE = hν = 6.63×10−34 ×1.6 = 1×10−33 J. Chiaramente tale quantità discreta risulta essere enormemente più piccola dell’energia stessa del pendolo, essendo ΔE/E = 2 × 10−29 . Per accorgersi della discretezza dell’energia, e cioè della validità del postulato di Planck per il pendolo in questione, dovremmo essere in grado di misurare l’energia del pendolo con un’accuratezza migliore di una parte su 1029 , cosa assolutamente impossibile in questo caso come per qualsiasi altro esempio riguardante corpi macroscopici.

1.2


La radiazione di corpo nero riguarda tipicamente la porzione infrarossa o visibile dello spettro delle onde elettromagnetiche. Aumentando la frequenza della radiazione incidente e illuminando una piastrina metallica con radiazione ultravioletta, avente lunghezza d’onda compresa tra circa 1 e 400 nm, si osserva invece un altro fenomeno di estremo interesse: l’effetto fotoelettrico, scoperto da Hertz9 nel 1887. Consideriamo il sistema rappresentato in figura 1.6 in cui una piastrina metallica viene illuminata con onde elettromagnetiche di frequenza ν. Si osserva sperimentalmente che se la radiazione incidente ha frequenza sufficientemente grande (tipicamente nell’intervallo dell’ultravioletto) essa e` in grado di espellere degli elettroni dalla piastrina metallica. Gli elettroni espulsi, chiamati fotoelettroni, possono poi essere raccolti da un anodo e trasformarsi in corrente misurabile in un circuito esterno. L’efficacia della raccolta 9

Heinrich R. Hertz (1857-1894), fisico tedesco, scopritore anche delle onde radio (1897). 19

Capitolo 1


C E

γ

A V

Figura 1.6: apparato sperimentale per la misura dell’effetto fotoelettrico. Nel recipiente sotto vuoto una piastrina (emettitore) E viene illuminata e il fotoelettrone emesso (●) viene raccolto dal collettore C. Variando la d.d.p. applicata V si misura con l’amperometro A una corrente i.

dei fotoelettroni emessi dipende dalla differenza di potenziale V applicata tra la piastrina (catodo emettitore) e l’anodo collettore. Questa differenza di potenziale e` a sua volta la somma della differenza di potenziale del generatore (Vgen ) e del potenziale di contatto (Vcont ) inevitabilmente presente se emettitore e collettore sono composti da metalli differenti. Ai fini della discussione non ci interessa però separare i due tipi di potenziale e faremo sempre riferimento alla differenza di potenziale complessiva. La figura 1.7 mostra l’intensità della corrente osservata all’anodo in funzione di V, per un certo valore I0 di intensità della radiazione incidente e per un valore doppio. Dallo studio di questa figura possiamo trarre le considerazioni seguenti: − per una differenza di potenziale sufficientemente grande tutti i fotoelettroni emessi dal catodo vengono raccolti all’anodo e si raggiunge un valore di saturazione per la corrente; − a un’illuminazione con intensità doppia corrisponde un valore doppio per la corrente di saturazione; − in corrispondenza di V = 0 esiste ancora una qualche corrente, però se la differenza di potenziale diventa sufficientemente negativa la corrente va a

20


Capitolo 1

2 ⋅ I0

i

I0

−V0

V

Figura 1.7: intensità di corrente misurata in seguito ad illuminazione con intensità I 0 e 2I 0 .

zero. Il valore −V0 di V che annulla la corrente si chiama potenziale d’arresto e risulta essere lo stesso indipendentemente dall’intensità dell’illuminazione. Il potenziale d’arresto rappresenta il potenziale (negativo) da applicare per impedire ai fotoelettroni di raggiungere l’anodo. Anche il fotoelettrone emesso con velocità maggiore non deve essere in grado di arrivare all’anodo quindi, considerando la conservazione dell’energia, ne segue che l’energia cinetica massima vale proprio Kmax = eV0 . Possiamo a questo punto provare a misurare come il potenziale d’arresto dipenda dalla frequenza della luce incidente. In questo caso si ottiene il grafico di figura 1.8 dal quale si evince che esiste una frequenza minima ν0 , detta frequenza di soglia, corrispondente a un potenziale d’arresto nullo, al di sotto della quale l’emissione di fotoelettroni non ha luogo. Il grafico riporta i dati tratti da una misura di Millikan10 fatta nel 1914. Sono sostanzialmente tre le proprietà dell’effetto fotoelettrico che non sono spiegabili per mezzo dell’elettromagnetismo classico: 1) relazione intensità - energia cinetica. La figura 1.7 fa vedere che il potenziale d’arresto non dipende dall’intensità della luce incidente. Ne consegue 10

Robert A. Millikan (1868-1953), fisico statunitense vincitore del Premio Nobel per la Fisica nel 1923 per i suoi studi sull’effetto fotoelettrico.

21

Capitolo 1


allora che anche l’energia cinetica massima dei fotoelettroni Kmax = eV0 non debba dipendere dall’intensità. Ciò non torna però con l’elettromagnetismo classico perché a un’intensità maggiore corrisponderebbe un valore maggiore dell’ampiezza del campo elettrico, quindi, un lavoro più grande fatto sugli elettroni e dunque un’energia cinetica maggiore; 2) frequenza di soglia. L’emissione di un fotoelettrone avviene, secondo la teoria classica, quando l’elettrone ha assorbito dalla radiazione incidente un’energia sufficiente a vincere le forze che lo tengono legato alla piastrina metallica, cioè pari al lavoro di estrazione W0 che e` una proprietà caratteristica del metallo. Ne consegue che, con un’intensità sufficientemente grande la fotoemissione avviene per qualsiasi valore della frequenza. Ciò e` in contraddizione, però, con l’osservazione sperimentale dell’esistenza di una frequenza di soglia; 3) assenza di ritardo. Un’altra contraddizione tra teoria classica ed esperimento sta nella simultaneità tra arrivo dell’onda luminosa e la fotoemissione. L’energia della radiazione classica e` distribuita su tutto il fronte d’onda e ci si aspetta che ciascun elettrone assorba solo quella che incide su una superficie efficace pari circa alla sezione dell’atomo al quale l’elettrone appartiene. Se l’intensità della luce e` estremamente debole si prevede allora che la fotoemissione avvenga con un ritardo significativo (come discusso nell’esempio 4), durante il quale l’elettrone continua a raccogliere energia dall’onda incidente fino a raggiungere un’energia pari almeno al lavoro di estrazione. Un tale ritardo non e` però osservato sperimentalmente: la fotoemissione e` praticamente coincidente con l’arrivo della luce. Il disaccordo tra teoria elettromagnetica classica e il comportamento sperimentale dell’effetto fotoelettrico non e` una banale discrepanza numerica che potrebbe essere recuperata affinando le assunzioni alla base del modello. Si tratta, invece, di una fondamentale incapacità da parte della teoria classica di accordarsi con l’esperimento. C’è bisogno di rivedere completamente i presupposti della teoria.

22


Capitolo 1

Potenziale d’arresto V0 (V)

4 3.5 3 2.5 2 1.5 1 0.5 00

2

4

6

8

Frequenza ν (1014 Hz)

10

12

Figura 1.8: potenziale d’arresto in funzione della frequenza della luce incidente. Misure tratte da un lavoro di Millikan (1914).

1.2.1

L’interpretazione di Einstein per l’effetto fotoelettrico

Per risolvere l’incompatibilità tra teoria classica ed esperimento, Einstein11 propose nel 1905 di rivedere il meccanismo di interazione tra radiazione e materia, alla luce dei risultati ottenuti dalla teoria di Planck per la quantizzazione dell’energia di un oscillatore. Nel momento in cui la radiazione viene assorbita dagli elettroni essa non si comporta, secondo Einstein, come un’onda distribuita, ma come un pacchetto di energia localizzata. Sono tali pacchetti di energia, chiamati fotoni, a essere assorbiti individualmente e completamente dagli elettroni. L’interazione onda-materia non va allora considerata come un fenomeno complessivo, ma come un’interazione individuale tra un singolo fotone e un singolo elettrone. Questa assunzione non e` per Einstein in conflitto con i comunemente accettati esperimenti sull’interferenza e diffrazione perché in tali casi si ha a che fare con un numero molto grande di fotoni e, quindi, i risultati che 11

Albert Einstein (1879-1955), fisico tedesco famoso per la sua teoria della relatività; vinse invece il Premio Nobel per la Fisica nel 1921 per la teoria sull’effetto fotoelettrico.

23

Capitolo 1


si ottengono vanno riferiti a un comportamento collettivo in cui vengono mediati i comportamenti dei fotoni individuali. L’attenzione di Einstein non punta sulle modalità di propagazione della radiazione – ben descritta della teoria ondulatoria classica – ma invece sulle modalità di emissione e assorbimento. Il fotone γ porta con sè un’energia quantizzata pari a Eγ = hν, localizzata in un piccolo volume dello spazio e che rimane localizzata mentre esso si muove nello spazio con velocità c. All’atto dell’assorbimento della radiazione questa energia viene ceduta integralmente all’elettrone in un’interazione individuale elettrone-fotone. Con questa energia l’elettrone che si trova all’interno del metallo può compensare l’energia dissipata negli urti con il reticolo cristallino e, una volta arrivato in prossimità della superficie, avere energia sufficiente per fornire il lavoro di estrazione e sfuggire al metallo. Il bilancio energetico per l’assorbimento di un fotone da parte di un elettrone prossimo alla superficie del metallo sarebbe allora: Kmax = Eγ − W0 = hν − W0

(1.10)

mentre per tutti gli altri elettroni si avrebbero valori dell’energia cinetica K < Kmax . Va sottolineato che l’ipotesi del fotone funziona perché e` in grado di motivare agevolmente le tre condizioni non spiegabili dalla teoria classica: 1) relazione intensità - energia cinetica. Il numero di fotoni associati a un’onda elettromagnetica e` proporzionale all’intensità dell’onda, quindi, anche se aumenta l’intensità non aumenta la frequenza dell’onda e il potenziale d’arresto: Kmax hν − W0 = (1.11) V0 = e e rimane indipendente dall’intensità come osservato sperimentalmente; 2) frequenza di soglia. Per un fotone avente frequenza ν0 = W0 /h l’energia cinetica massima del fotoelettrone risulterebbe nulla. Perciò se la radiazione ha frequenza al di sotto di ν0 , per quanti fotoni ci siano cioè per quanto intensa sia la radiazione, nessun elettrone può assorbire energia sufficiente a fornire il lavoro di estrazione e quindi l’effetto fotoelettrico non si verifica; 24


Capitolo 1

3) assenza di ritardo. Nel momento in cui un fotone, con frequenza superiore alla soglia, viene a contatto con un elettrone gli cede istantaneamente la sua energia. Riducendo l’intensità riduciamo il numero di fotoni, ma fintantoché ce n’è almeno uno l’effetto fotoelettrico si può verificare. Per Einstein l’intensità della radiazione e`: I = Nhν

(1.12)

dove N e` il numero medio di fotoni che attraversano l’unità di superficie (ortogonale alla direzione di propagazione dell’onda) nell’unità di tempo (vedi esempio 5). Siccome la teoria ondulatoria prescrive che l’intensità sia proporzionale al valore medio del quadrato dell’ampiezza del campo elettrico 2 ⟩ pu` o essere intere siccome tutti i fotoni hanno la stessa energia, allora ⟨E m pretato come una misura del numero medio di fotoni presente nell’unità di volume. La teoria del fotone non solo risolve elegantemente i problemi suelencati, ma risulta essere in accordo con i risultati ottenuti precedentemente sulla radiazione del corpo nero. Sulla base della misura del potenziale d’arresto in funzione della frequenza (vedi figura 1.8), Millikan arrivò nel 1914 a misurare, a partire dalla pendenza della retta interpolante, il valore della costante numerica h che moltiplica la frequenza. Tale misura forn`ı il valore h = (6.57 ± 0.03) × 10−34 J ⋅ s, in ottimo accordo con il valore usato da Planck nella sua formula. Si tratta, quindi, della stessa costante universale a cui si assegna, sulla base di misure più recenti, il valore: h = 6.626 × 10−34 J ⋅ s Va sottolineato che l’ipotesi di Einstein e` che il fotone abbia esattamente energia pari a hν e non pari a un suo multiplo intero. L’energia nhν dell’oscillatore di Planck sarebbe allora associata alla presenza di n fotoni aventi tutti frequenza ν. In questa ottica Einstein trattò la radiazione presente entro la cavità come un gas di fotoni non interagenti l’uno con l’altro e ricavò la stessa formula ottenuta qualche anno prima da Planck.

25

Capitolo 1

1.2.2


Esempi

4. Valutare il tempo che, nella teoria classica, sarebbe necessario a un elettrone per essere emesso da una superficie di potassio illuminata con una sorgente luminosa di potenza pari a Pγ = 1 W, posta a una distanza ℓ = 1 m. Il potassio ha un lavoro di estrazione W0 = 2.3 eV = 3.7 × 10−19 J e affinché l’elettrone possa essere emesso esso deve assorbire dall’onda altrettanta energia. Se l’energia della radiazione incidente e` distribuita in modo uniforme su tutto il fronte d’onda sferico, quella assorbita dall’elettrone sarà solo la porzione che colpisce un’area efficace pari a circa πr 2 = π × 10−20 m2 dove r ≈ 1 × 10−10 m e` il raggio tipico di un atomo. La potenza assorbita dall’elettrone vale: Pe = Pγ

πr 2 = 2.5 × 10−21 Pγ = 2.5 × 10−21 W 4πℓ2

Per raggiungere il valore necessario di 3.7 × 10−19 J ci vuole un tempo pari a

W0 = 1.5 × 102 s Pe cioè 2 minuti e mezzo, che e`, quindi, facilmente osservabile. Δt =

5. In riferimento all’esempio precedente, quanti elettroni potrebbero, al più, essere emessi in un secondo da un’area unitaria? Si assuma luce monocromatica con lunghezza d’onda λ = 530 nm. Innanzitutto verifichiamo che l’effetto fotoelettrico abbia effettivamente luogo. L’energia di ciascun fotone vale: Eγ = hν =

hc 6.63 × 10−34 × 3 × 108 = = 3.75 × 10−19 J = 2.35 eV λ 530 × 10−9

appena al di sopra della soglia corrispondente al lavoro di estrazione W0 = 2.3 eV.

26


Capitolo 1

Macchie di Laue

Raggi X Cristallo

Lastra fotografica

Figura 1.9: schema dell’apparato usato da Laue per la diffrazione di raggi X su un cristallo.

Alla distanza ℓ = 1 m la potenza per area unitaria (cioè l’intensità) vale I=

Pγ 1 = 8.0 × 10−2 W/m2 = 5.0 × 1017 eV/m2 ⋅ s = 2 4πℓ 4π × 1

Il numero di fotoni che colpiscono l’area unitaria nell’unità di tempo si ottiene dividendo l’intensità per l’energia del singolo fotone: I 5.0 × 1017 = 2.1 × 1017 γ/m2 ⋅ s = Eγ 2.35 Ciascuno di questi fotoni può essere assorbito da un elettrone, ma solo gli elettroni in prossimità della superficie non perdono, a causa degli urti con il reticolo cristallino, parte di questa energia finendo sotto la soglia pari a W0 . Al più possono, quindi, essere emessi 2.1 × 1017 e/m2 ⋅ s. Osserviamo che il numero di fotoni che colpiscono l’area unitaria in un secondo e` un numero enorme, quindi, la granularità della radiazione diventa difficile da rivelare. La radiazione appare perciò continua, salvo circostanze speciali.

27

Capitolo 1


1.3 Diffrazione dei raggi X su un cristallo Passiamo ora a discutere i raggi X12 , cioè la radiazione elettromagnetica avente lunghezza d’onda compresa approssimativamente tra 0.01 e 10 nm. Questa radiazione ha lunghezza d’onda dell’ordine delle distanze interatomiche e, quindi, ci si aspetta che essa possa essere soggetta a diffrazione da parte di un cristallo. Il ruolo delle fenditure trasparenti, che funzionavano per un reticolo ottico diffrangendo la luce e producendo figure di interferenza, viene per i raggi X svolto dai piani presenti all’interno del reticolo cristallino. Inviando dei raggi X ben collimati su un cristallo, come in figura 1.9, e osservando l’immagine che essi producono su una lastra fotografica, si osserva una serie di macchie luminose che ricorda il risultato dell’esperimento dei fori di Young. Queste macchie (vedi figura 1.10) vengono chiamate macchie di Laue, dal nome dello scienziato13 che le osservò la prima volta nel 1912 studiando la diffrazione da parte di un cristallo di cloruro di sodio. Questa immagine prova chiaramente che i raggi X hanno natura ondulatoria. Nel caso del cloruro di sodio, come per altri solidi cristallini, la struttura presenta una simmetria cubica in cui gli atomi si dispongono ai vertici di un cubo a formare delle celle elementari. All’interno del reticolo cristallino si possono individuare allora dei fasci di piani che contengono queste celle elementari ripetute. La ripetizione, con una certa regolarità, di tali piani e` ciò che porta alla formazione delle figure di interferenza. La posizione delle macchie di Laue e la direzione di diffrazione rispetto all’asse di incidenza vennero studiate da Bragg14, che mise in relazione la 12

I raggi X, scoperti dal fisico tedesco Wilhelm C. Roentgen nel 1895, sono prodotti quando un fascio di elettroni molto energetici, accelerati da una differenza di potenziale di migliaia di volt, viene fermato da un bersaglio; la forte decelerazione risulta in emissione di onde elettromagnetiche con spettro continuo. Per questa scoperta Roentgen (1845-1923) vinse il Premio Nobel per la Fisica nel 1901. 13 Max von Laue (1879-1960), fisico tedesco vincitore del Premio Nobel per la Fisica nel 1914 per la scoperta della diffrazione dei raggi X. 14 William L. Bragg (1890-1971), fisico australiano vincitore del Premio Nobel per la Fisica nel 1915 (assieme al padre William H. Bragg) per l’analisi della struttura cristallina per mezzo di raggi X.

28

Diffrazione dei raggi X su un cristallo

Capitolo 1

Figura 1.10: figura di diffrazione (macchie di Laue) prodotta dalla diffrazione di raggi X su un cristallo. Per gentile concessione di Internet Microscope for Schools dell’Università di Manchester, UK. Vedi anche http://www.tools4schools.org.uk.

distanza tra i piani atomici d, la lunghezza d’onda della radiazione X e la direzione di diffrazione, in una equazione nota come legge di Bragg: 2d sin θ = mλ (m = 1, 2, 3, ...)

(1.13)

dove θ e` l’angolo di diffrazione della radiazione che emerge dal cristallo come se fosse riflessa dai piani cristallini a un angolo di riflessione15 uguale a quello di incidenza (vedi figura 1.11). La differenza di cammino tra i due raggi (1) e (2) di figura 1.11 e` pari a AC +CB = 2d sin θ. La condizione di interferenza si ottiene imponendo che la differenza di cammino sia pari a un multiplo intero della lunghezza d’onda, ottenendo cos`ı la legge di Bragg. In queste condizioni le onde riemesse da ciascuna cella elementare del reticolo cristallino (atomo o molecola) risultano essere in fase e interferiscono costruttivamente nella direzione corrispondente a un angolo di diffrazione uguale a quello della radiazione incidente; si parla in questo caso di riflessione di Bragg. All’interno del reticolo si possono definire tante famiglie possibili di piani paralleli passanti per le celle elementari. Una tra queste famiglie avrà distanza interplanare d tale da soddisfare la legge di Bragg per la lunghezza d’onda 15

In questo caso l’angolo di riflessione non viene definito, come al solito, rispetto alla normale di incidenza ma rispetto al piano (angolo radente). 29

Capitolo 1


(2) (1)

θ

d

A θ

C B

Figura 1.11: rappresentazione della diffrazione di raggi X come riflessione sui piani (linee tratteggiate) del cristallo, dove i pallini rappresentano i centri delle celle elementari. Sono evidenziati due raggi e il diverso cammino percorso.

della radiazione X incidente. Conoscendo già la lunghezza d’onda e misurando θ si ottiene una caratterizzazione della struttura geometrica di un cristallo, mentre conoscendo le distanze interplanari e misurando θ possiamo ottenere una misura di λ. In esperimenti simili Debye16 e Scherrer17 studiarono la diffrazione di raggi X su una polvere cioè su un agglomerato di cristalli minuscoli orientati a caso. In questa situazione non si ottengono delle singole macchie, ma degli anelli circolari (vedi figura 1.12) dovuti alla diffrazione sugli innumerevoli piani cristallini aventi orientazione spaziale casuale. I raggi degli anelli sono collegati alla lunghezza d’onda dei raggi X e forniscono un modo per misurarla. L’esperimento di Debye e Scherrer conferma in modo spettacolare quanto osservato da Laue, a dimostrazione che i raggi X hanno comportamento ondulatorio nella loro interazione con la materia in forma cristallina. 16

Peter J.W. Debye (1884-1966), fisico e chimico olandese vincitore del Premio Nobel per la Chimica nel 1936. 17 Paul Scherrer (1890-1969), fisico svizzero.

30

La diffusione di Compton

Capitolo 1

Figura 1.12: rappresentazione della figura di diffrazione prodotta dalla diffrazione di raggi X su una polvere policristallina.

1.4


Nel 1923 Compton18 studiò la diffusione di raggi X monocromatici incidenti su un bersaglio di grafite, come descritto in figura 1.13. Andando a misurare la presenza di raggi X in funzione dell’angolo di diffusione ϕ e la loro lunghezza d’onda, si osservarono due picchi di intensità: uno alla stessa lunghezza d’onda λ della radiazione incidente e uno a una lunghezza d’onda diversa λ′ , più grande di un valore Δλ chiamato spostamento di Compton. Muovendo il rivelatore e, quindi, variando l’angolo di diffusione si osservò che il valore di Δλ risultava essere dipendente da ϕ. La teoria ondulatoria classica prevede che i raggi X, comportandosi come onde elettromagnetiche a tutti gli effetti, vadano a sollecitare con il loro campo elettrico gli elettroni dell’atomo, costringendoli a oscillare con frequenza pari a quella dei raggi X stessi e portandoli, quindi, a emettere a loro volta onde elettromagnetiche ancora alla stessa frequenza. Non e` possibile, quin18

Arthur H. Compton (1892-1962), fisico statunitense vincitore nel 1927 del Premio Nobel per la Fisica per gli studi sulla diffusione dei raggi X.

31

Capitolo 1


rivelatore

λ′ ϕ

λ collimatore

bersaglio

Figura 1.13: descrizione dell’apparato usato da Compton per lo studio della diffusione di raggi X.

di, immaginare un meccanismo che sulla base della teoria classica preveda riemissione di onde con λ′ ≠ λ. Compton interpretò questi risultati postulando che i raggi X incidenti non siano semplicemente un’onda di frequenza ν, ma un’insieme di fotoni. La diffusione dei raggi X non sarebbe altro che un urto tra questi fotoni individuali, aventi energia Eγ = hν e quantità di moto pγ = hν/c e i singoli elettroni del bersaglio debolmente legati al resto dell’atomo e, inizialmente, pressoché in quiete. I fotoni vennero trattati da Compton ancora come particelle, ma a differenza del caso fotoelettrico non venivano assorbiti ma diffusi, cioè deviati con direzione diversa da quella di incidenza, cos`ı come avviene per urti tra corpi. La giustificazione dell’ipotesi di un urto con un singolo elettrone deriva dall’osservazione sperimentale che la frequenza della radiazione diffusa non dipende dal tipo di materiale che costituisce il bersaglio e, quindi, dal numero di elettroni o protoni presenti in ciascun atomo. Per questo motivo il fenomeno di diffusione deve riguardare non interi atomi, ma singoli elettroni. A differenza della teoria ondulatoria la teoria del fotone spiega facilmente il fatto che λ′ ≠ λ e arriva anche a prevedere quanto debba valere Δλ per un certo angolo di diffusione, determinando un accordo qualitativo e quantitativo con le osservazioni sperimentali. Risulta chiaro, facendo riferimento 32


ϕ = 90○

Intensità

Intensità

ϕ = 0○

0

Capitolo 1

0

ϕ = 135○

ϕ = 45○

0

0 0.700

0.750

˚ λ (A)

Figura 1.14: risultati sperimentali per la diffusione di Compton in corrispondenza dell’angolo di diffusione ϕ = 0○ e ϕ = 45○ . Viene rappresentata l’intensità relativa in funzione della lunghezza d’onda del raggio diffuso.

0.700

0.750

˚ λ (A)

Figura 1.15: risultati sperimentali per la diffusione di Compton in corrispondenza dell’angolo di diffusione ϕ = 90○ e ϕ = 135○. Viene rappresentata l’intensità relativa in funzione della lunghezza d’onda del raggio diffuso.

33

Capitolo 1


alle leggi di conservazione energia-quantità di moto in un urto, che se l’elettrone emerge con una certa energia e quantità di moto dopo l’urto, il fotone deve emergere con energia e quantità di moto differenti rispetto al valore posseduto prima dell’urto. Si spiega, quindi, in questo modo il fatto che sia λ′ ≠ λ. Se si fa riferimento alla cinematica relativistica19 e si applicano le leggi di conservazione di energia e quantità di moto nella loro formulazione relativistica, si ottiene una previsione per lo spostamento di Compton Δλ = λ′ − λ in funzione di ϕ: h (1 − cos ϕ) Δλ = (1.14) mc dove la quantità λC = h/mc = 2.43 × 10−12 m viene chiamata lunghezza d’onda di Compton. Tale previsione risultò essere in accordo con le misure sperimentali, come può essere osservato in figura 1.14 e 1.15. La presenza di un picco di larghezza finita in corrispondenza di λ′ e` dovuta all’intervallo finito delle lunghezze d’onda e degli angoli di diffusione selezionati dall’apparato e all’incertezza sui loro valori. Se la teoria relativistica e` in grado di prevedere il valore dello spostamento di Compton, resta da capire come mai avvengano anche diffusioni corrispondenti a Δλ = 0 cioè λ′ = λ. In questo caso quello che succede e` che la diffusione, cioè l’urto e −γ, avviene non con un elettrone quasi libero ma con un elettrone fortemente legato al suo atomo. In questo caso l’analogia sarebbe con un urto classico tra una particella e un corpo di massa molto grande: la particella incidente emerge dall’urto con energia pressoché immutata perché la grande massa del corpo gli consente di rinculare con la stessa velocità. Se il fotone incidente viene diffuso senza variazioni sostanziali nella sua energia ne consegue che anche la sua lunghezza d’onda resterà immutata come osservato nel picco di sinistra di figura 1.15. Nella soluzione delle equazio19

La cinematica relativistica e` una modifica di quella classica per renderla compatibile con la teoria della relativit` √ a di Einstein. Per essa l’energia di un corpo avente massa m e quantità di moto p e` E = p2 c√2 + m 2 c 4 , dove c e` la velocità della luce nel vuoto, mentre la quantità di moto vale p = mv/ 1 − v 2 /c 2 . 34


Capitolo 1

ni dell’urto bisogna sostituire la massa dell’elettrone m con quella dell’intero atomo M. Nel caso della grafite (M ≈ 22 000 × m) lo spostamento Compton diventa 22 mila volte più piccolo e la radiazione diffusa finisce al di sotto del picco corrispondente alla lunghezza d’onda incidente. In questo caso si parla di diffusione di Thomson. La diffusione di Thomson e quella di Compton sono fenomeni che avvengono entrambi quando una radiazione elettromagnetica colpisce un bersaglio. E` solo per lunghezze d’onda molto piccole, cioè nell’intervallo dei raggi X, che la diffusione di Compton diventa osservabile in aggiunta a quella di Thomson. Per lunghezze d’onda ancora più piccole, cioè per i raggi γ, la diffusione di Compton diventa invece dominante. I risultati dell’esperimento di Compton sancirono definitivamente la necessità e la validità dell’ipotesi del fotone.

1.4.1

Esempi

6. Ricavare dalla figura 1.15 il valore della costante h che compare nell’equazione (1.14). I risultati della figura 1.15 mostrano, per un angolo di diffusione ϕ = 135○ , ˚ e uno a circa 0.747 A. ˚ Il primo la presenza di due picchi, uno a circa 0.708 A picco e` allora a λ = 70.8 × 10−12 m, mentre il secondo corrisponde a λ′ = 74.7 × 10−12 m. Lo spostamento di Compton vale, quindi: Δλ = λ′ − λ = 3.9 × 10−12 m Invertendo l’equazione (1.14) si ottiene h=

9.1 × 10−31 × 3.0 × 108 × 3.9 × 10−12 mcΔλ = = 6.24 × 10−34 J ⋅ s 1 − cos ϕ 1 − cos 135○

molto vicino al valore della costante di Planck. 7. Si consideri un fascio di raggi X aventi lunghezza d’onda λ = 0.1 nm. Considerando la radiazione diffusa a 90○ calcolare: a) lo spostamento di Compton,

35

Capitolo 1


b) l’energia cinetica di rinculo dell’elettrone, c) la frazione energia persa dal fotone. Lo spostamento di Compton per ϕ = 90○ vale Δλ =

6.63 × 10−34 h (1 − cos ϕ) = × (1 − 0) = 2.43 × 10−12 m mc 9.1 × 10−31 × 3.0 × 108

Assumendo che l’elettrone sia inizialmente a riposo la conservazione dell’energia prescrive che20 Eγ = Eγ′ + K e , quindi l’energia cinetica dell’elettrone vale hc hcΔλ hc K e = Eγ − Eγ′ = − = λ λ + Δλ λ(λ + Δλ) cioè: Ke =

6.63 × 10−34 × 3.0 × 108 × 2.43 × 10−12 = 4.72 × 10−17 J 0.1 × 10−9 × (100 + 2.43) × 10−12

equivalente a 295 eV. L’energia del fotone valeva inizialmente: Eγ =

hc 6.63 × 10−34 × 3.0 × 108 = = 1.99 × 10−15 J = 12.4 keV λ 0.1 × 10−9

e la frazione di energia persa e`: ΔEγ /Eγ = 0.295/12.4 = 0.024 quindi, il fotone perde in questa diffusione di Compton il 2.4% della sua energia.

1.5 Natura duale delle onde elettromagnetiche Gli esperimenti presentati in questo capitolo hanno dimostrato la necessità di introdurre nella teoria l’idea del fotone, inteso come un pacchetto di energia 20

Secondo la cinematica relativistica bisognerebbe considerare per l’elettrone anche l’energia di massa a riposo mc 2 che però e` la stessa prima e dopo l’urto e, quindi, si semplifica nell’equazione. 36

Applicazioni

Capitolo 1

localizzato. Sono, infatti, i fotoni che si trovano entro la cavità a essere responsabili delle caratteristiche della radiazione termica del corpo nero, cos`ı come sono ancora i fotoni a produrre l’effetto fotoelettrico. L’onda elettromagnetica in queste due situazioni viene emessa e assorbita dalla materia sotto forma di fotoni. L’esperimento di Compton necessita a sua volta l’ipotesi del fotone per spiegare il suo urto con l’elettrone, ma fa un passo in avanti: e` necessario che questi quanti di radiazione incidano sul bersaglio e ne emergano in direzioni ben definite, per conservare quantità di moto ed energia. Il fotone ha effettivamente nei casi suelencati un comportamento corpuscolare, ma le esperienze precedenti riguardanti i fenomeni di interferenza (esperimento di Young) e diffrazione (diffrazione dei raggi X) non possono essere dimenticate. L’unico modo per costruire una teoria non contradditoria e`, quindi, quello di accettare la natura duale delle onde elettromagnetiche: La radiazione non è un fenomeno né puramente ondulatorio né puramente corpuscolare, ma e` tutte e due le cose contemporaneamente. Questo non significa che un qualsiasi esperimento possa portare a conclusioni contradditorie, ma piuttosto che in determinate situazioni prevarrà l’aspetto corpuscolare (ad esempio, nella diffusione di Compton) mentre in altre circostanze la radiazione si comporterà secondo le usuali leggi delle onde (ad esempio, nell’esperimento di Laue o di Debye-Scherrer). Questa dualità di comportamento può lasciare perplessi, inizialmente, ma va accettata come un principio fondamentale su cui si basa il comportamento della radiazione elettromagnetica.

1.6 Applicazioni Si vogliono fornire in questa sezione alcune applicazioni significative di quanto discusso in questo capitolo, relative alla radiazione termica e a un particolare tipo di radiazione elettromagnetica chiamata radiazione cosmica di fondo. 37

Capitolo 1

1.6.1


Termografia

Esistono dispositivi detti termografici (ad esempio le fotocamere all’infrarosso) sensibili alla radiazione infrarossa e che producono un’immagine della radiazione termica emessa da un corpo. Il vantaggio rispetto alla fotografia usuale e` che la radiazione termica e` emessa da tutti i corpi in base alla loro temperatura e non c’è bisogno di illuminare un corpo per vederne l’immagine infrarossa. Inoltre, poiché la radiazione termica segue le leggi della radiazione del corpo nero, l’intensità e la frequenza della radiazione emessa vengono a dipendere dalla temperatura del corpo stesso. Ribaltando questa relazione, con la termografia risulta possibile individuare variazioni di temperatura in porzioni diverse del corpo tramite misure di intensità e di frequenza. Regioni a temperatura diversa vengono poi mappate in un’immagine a falsi colori in cui le zone più calde vengono rappresentate tipicamente con colori verso il rosso e zone più fredde con colori verso il blu. La figura 1.16 mostra, ad esempio, il termogramma di un edificio in cui le finestre, lasciando passare la radiazione termica dell’ambiente interno, risaltano rispetto alle pareti, più fredde, dell’edificio. La termografia e` però una cosa differente dal prendere un’immagine su una pellicola sensibile all’infrarosso, non fosse altro per l’intervallo di sensibilità. Una pellicola infrarossa e` sensibile tipicamente a temperature tra i 250 e i 500 ○ C, mentre i dispositivi per termografia cominciano a essere sensibili già attorno ai -50 ○ C e arrivano fino a circa 2000 ○ C. La termografia ha avuto tradizionalmente un uso esteso per fini bellici o di sicurezza, ma ha importanti applicazioni civili, ad esempio, nel campo della: − diagnostica medica (vedi figura 1.17), che sfrutta il fatto che tessuti cancerosi sono caratterizzati dall’avere un diverso afflusso sanguigno (a causa dell’angiogenesi che modifica la vascolarizzazione), il che comporta una temperatura differente rispetto ai tessuti adiacenti. Poiché in un corpo umano normale c’è una elevata simmetria termica, piccole asimmetrie di temperatura possono essere in questo modo evidenziate. Il grosso vantaggio di questa tecnica e` che essa e` assolutamente non-invasiva e priva di conseguenze visto 38

Applicazioni

Capitolo 1

che non viene usata radiazione ionizzante, a differenza di altre tecniche diagnostiche che usano i raggi X. Va detto che una termografia può suggerire la presenza di tessuto canceroso, ma solo una biopsia può darne conferma. Differenze di temperatura possono essere indicazione di altre patologie legate a processi infiammatori come reumatismi, sinoviti, traumi muscolari, ecc. − metereologia, dove si ricorre a satelliti equipaggiati con dispositivi sensibili alla radiazione infrarossa. Vengono prodotte delle immagini (vedi figura 1.18) dalle quali e` possibile risalire al tipo e alla quota delle nuvole poiché la temperatura delle nuvole diminuisce con la quota. Tipicamente viene usato l’intervallo di lunghezze d’onda tra 10.3 e 12.5 μm, corrispondente a temperature tra circa -40 e 10 ○ C, consentendo la distinzione tra cirri e cumulonembi (più freddi e a quota maggiore) e strati o stratocumuli (più caldi e a quota minore). − oceanografia, in cui le immagini infrarosse degli oceani (vedi figura 1.19) evidenziano la temperatura delle masse d’acqua e la presenza di vortici o correnti, come nel caso della corrente del golfo.

1.6.2

Radiazione cosmica di fondo

Si tratta di una forma di radiazione elettromagnetica scoperta nel 1965 da Penzias e Wilson21 e che permea l’intero universo. In questo caso si tratterebbe della radiazione termica di corpo nero per una temperatura di 2.7 K, la cui lunghezza d’onda corrispondente ha un picco a circa 1 mm, nella regione delle microonde. Questa radiazione residua e` considerata dai cosmologi come la migliore prova della teoria del Big Bang che modella la nascita dell’universo. Secondo la teoria del Big Bang, sviluppatasi a partire dagli anni ’40 con il 21

Arno Penzias (1933-), fisico statunitense di origine tedesca e l’astronomo statunitense Robert W. Wilson (1936-), ricevettero nel 1978 il Premio Nobel per la Fisica per la loro scoperta.

39

Capitolo 1


lavoro di Gamow22 , Alpher23 e Herman24 , l’universo originario era composto da un ammasso di fotoni, elettroni, barioni25 e plasma26 ad altissima temperatura. A seguito dell’espansione dell’universo, con conseguente raffreddamento adiabatico dello stesso, iniziarono a formarsi atomi dalla combinazione di elettroni con protoni e neutroni. A partire da questa condizione, corrispondente a un’età dell’universo di circa 400 mila anni, si ha il disaccoppiamento tra la materia (neutra) e la radiazione. A causa della continua espansione i fotoni hanno da allora continuato a diminuire la loro energia e, quindi, la loro temperatura fino al valore attuale di 2.7 K. Più recentemente, l’interesse verso la radiazione cosmica di fondo si e` concentrato verso misure di anisotropia nella radiazione stessa, per ricavare dall’inomogeneità maggiori informazioni sulla formazione e sulla struttura dell’universo. La figura 1.20 mostra, ad esempio, i risultati ottenuti dal satellite WMAP lanciato dall’ente spaziale statunitense NASA nel 2001.

1.7 Quesiti di riepilogo 1. Una certa sorgente di luce rossa ha una potenza maggiore di una certa sorgente di luce blu. Quale sorgente emette i fotoni con maggiore energia individuale? 2. La luce di frequenza ν espelle fotoelettroni dal metallo A ma non dal metallo B. Cosa significa? a) che la frequenza di soglia per il metallo B e` maggiore di ν; b) che il lavoro di estrazione del metallo B e` maggiore che per il metallo A; c) entrambe le cose. 22

George Gamow (1904-1968), fisico di origine russa, noto anche per la spiegazione del decadimento α dei nuclei attraverso l’effetto tunnel. 23 Ralph A. Alpher (1921-2007), cosmologo statunitense. 24 Robert Herman (1914-1997), fisico statunitense. 25 I barioni sono delle particelle elementari composte da quark che sono tra i costituenti fondamentali della materia. Protoni e neutroni rientrano in questa categoria. 26 Il plasma e` un gas di elettroni ionizzati che ha proprietà distintive tali da considerarlo come uno stato della materia.

40

Quesiti di riepilogo

Capitolo 1

Figura 1.16: termogramma di un edificio. E` evidente la diversa temperatura di finestre e porte. L’originale a colori può essere trovato all’indirizzo http://www.thermalconsultancy.com/gallery/. Per gentile concessione di www.thermalconsultancy.com.

Figura 1.17: termogramma di un corpo umano. Le zone con diversa colorazione corrispondono a valori differenti della temperatura superficiale. L’originale a colori può essere trovato all’indirizzo http://www.breastthermography.com/mammography thermography.htm. Per gentile concessione di www.breastthermography.com.

41

Capitolo 1


Figura 1.18: mappatura della temperatura delle formazioni nuvolose al di sopra della costa nord-orientale degli Stati Uniti. Zone a colore diverso corrispondono a zone a diversa temperatura e quindi a nubi a quota diversa. Mappe simili a colori possono essere trovate all’indirizzo http://www.accuweather.com/maps-satellite.asp. Per gentile concessione di www.accuweather.com.

Figura 1.19: mappatura della temperatura delle acque degli oceani. Zone a colore diverso corrispondono a zone a diversa temperatura. L’originale a colori può essere trovato al’indirizzo http://icons.wunderground.com/data/images/sst basin/gl sst.gif. Per gentile concessione di www.wunderground.com.

42


Capitolo 1

Figura 1.20: mappatura della anisotropia della radiazione cosmica di fondo, fatta dal satellite WMAP. L’originale a colori (e altre immagini) può essere trovato all’indirizzo http://map.gsfc.nasa.gov/media/080997/index.html. Per gentile concessione della NASA.

3. C’è nessuno dei metalli riportati in tabella 1.2 per il quale si potrebbe avere fotoemissione con luce visibile? 4. Supponiamo di illuminare una lastrina metallica con luce ultravioletta di intensità I e frequenza superiore alla frequenza di soglia per effetto fotoelettrico. a) Cosa succede al numero di elettroni emessi N e se si raddoppia la frequenza? b) E se si raddoppia l’intensità I? 5. Che differenza c’è nel bersaglio usato per la diffrazione di Laue e per quella di Debye? 6. Quale tra le seguenti affermazioni e` vera: a) la diffusione di Compton domina su quella di Thomson nella regione delle microonde; b) la diffusione di Compton domina su quella di Thomson per raggi γ; c) la diffusione di Thomson domina sempre su quella di Compton.

43

Capitolo 1


METALLO LAVORO ESTRAZIONE (eV) Alluminio 4.1 Bario 2.5 Cadmio 4.1 Cobalto 5.0 Litio 2.3 Oro 5.1 Rame 4.7 Tungsteno 4.5

METALLO LAVORO ESTRAZIONE (eV) Argento 4.7 Berillio 5.0 Cesio 2.1 Ferro 4.5 Magnesio 3.7 Potassio 2.3 Tantalio 4.2 Zinco 4.3

Tabella 1.2: lavoro di estrazione per alcuni metalli.

` METALLO TEMPERATURA (○ C) EMISSIVITA Alluminio (ossidato) 600 0.19 Rame (ossidato) 540 0.77 Ferro (ossidato) 500 0.84 Ferro (ossidato) 1200 0.89 Argento 540 0.03 Argento 1090 0.03 Tungsteno 500 0.07 Tungsteno 1000 0.15 Tabella 1.3: emissività per alcuni metalli a diverse temperature.

44

Esercizi

Capitolo 1

1.8 Esercizi 1. Calcolare la luminosità relativa (in unità di L⊙ ) per Betelgeuse (λ max = 850 nm e r = 4 × 1011 m). 2. Facendo riferimento alla tabella 1.3 in cui sono riportati i valori tipici di emissività per alcuni metalli, si dica per piastrine di uguale dimensione di ferro, argento e tungsteno, rispettivamente alle temperature di 800, 1200 e 1000 ○ C, quale emetterebbe con maggiore intensità e quale con lunghezza d’onda dominante minore. 3. Facendo riferimento alla tabella 1.2 si dica per quale metallo sarebbe possibile la fotoemissione se illuminato con luce ultravioletta avente frequenza ν = 1.1 × 1015 Hz. 4. Valutare, come fatto da Millikan, il valore della costante h usando i dati della figura 1.8. 5. Si immagini di illuminare un cristallo di cloruro di sodio con un fascio di raggi X avente lunghezza d’onda di 0.140 nm. Se, per il massimo del primo ordine, la direzione di diffrazione forma un’angolo di 84○ con la radiazione incidente, quanto varrebbe la distanza interplanare d? 6. Si consideri un fascio di raggi γ aventi lunghezza d’onda λ = 1.9 × 10−3 nm. Considerando la radiazione diffusa a 90○ calcolare: a) lo spostamento di Compton, b) l’energia cinetica di rinculo dell’elettrone, c) la frazione di energia persa dal fotone.

45

Capitolo 2 La materia: corpuscoli o onde? Gli esperimenti incontrati nel capitolo precedente e i concetti di fisica quantistica ivi descritti suggeriscono di stare attenti a dare per scontati certi presupposti su cui si basa la fisica classica. Anzi, in certe situazioni la natura presenta dei fenomeni contrari al senso comune, come ad esempio il fatto che la luce in determinate circostanze si comporti come un’onda mentre in altre si comporti come un corpuscolo. Data questa premessa viene spontaneo allora ricercare sperimentalmente se esistono delle circostanze nelle quali, a loro volta, particelle di materia possano esibire un comportamento ondulatorio. Cos`ı come il carattere ondulatorio della luce fu evidenziato per la prima volta nel 1801 da Young1 e poi da altri attraverso esperimenti di interferenza e diffrazione, per cercare di osservare un ipotetico comportamento ondulatorio delle particelle conviene ricorrere ancora a esperimenti di interferenza.

2.1 Esperimento di Young con elettroni Possiamo pensare a duplicare l’esperimento di Young considerando una barriera con doppia fenditura su cui viene inviato un fascio di elettroni prodotti da una sorgente (ad esempio, un filamento metallico riscaldato dal passaggio di corrente) e accelerati da una differenza di potenziale, come in figura 2.1. Questi elettroni passano attraverso le fenditure, vanno a colpire uno scher1

Thomas Young (1773-1829), scienziato inglese famoso per il suo esperimento sulla interferenza prodotta dalla luce uscente da due fori o fessure.

Capitolo 2

La materia: corpuscoli o onde?

schermo fluorescente

sorgente doppia fenditura elettroni

lastra fotografica Figura 2.1: descrizione apparato con doppia fenditura per lo studio della diffrazione di elettroni.

mo fluorescente e vengono registrati su una lastra fotografica, producendo un’immagine particolare. Vari esperimenti sono stati condotti secondo modalità diverse e i risultati che si ottengono da uno di questi esperimenti sono mostrati in figura 2.2. Anziché osservare due fasce chiare in corrispondenza delle due fenditure, viene osservato un insieme di fasce chiare e scure alternate, corrispondenti ai punti dello schermo fluorescente colpiti o meno dagli elettroni. Questo fenomeno ricorda il sistema di frange osservato per la luce, dimostrando inequivocabilmente che gli elettroni che attraversano le due fenditure interferiscono tra di loro come onde. Evidenza di comportamento interferente si osserva anche in esperimenti in cui le sorgenti di elettroni sono cos`ı deboli da poter assumere che sulle fenditure arrivi, praticamente, un elettrone alla volta. Se gli elettroni si comportano come onde attraversando un sistema di due fenditure e` lecito domandarsi se ciò sia una loro proprietà esclusiva o se l’interferenza possa verificarsi anche per altre particelle atomiche come, ad esempio, i neutroni che si possono produre nella disintegrazione di alcu48

Esperimento di Young con elettroni

Capitolo 2

Figura 2.2: immagine delle frange di interferenza prodotte da elettroni su uno schermo fluorescente. Da un articolo di C. Jonsson, American Journal of Physics, 42, 4, 1974. Copyright 1974, American Association of Physics Teachers.

ni nuclei radioattivi. Rispetto agli elettroni i neutroni hanno il vantaggio di differire non solo per la carica elettrica, essendo essi neutri, ma anche per la massa che e` circa 2000 volte più grande. Nel caso dei neutroni si possono praticare, ad esempio, due fenditure su una lastrina di materiale che li assorba fortemente (ad esempio, il boro) e misurare con un rivelatore di neutroni la loro presenza in un piano parallelo alle fenditure. Anche in questo caso verrebbe osservata una distribuzione in cui l’intensità oscilla tra massimi e minimi, come caratteristico per due onde interferenti. Date queste osservazioni sperimentali, come e` possibile allora che le particelle elettrone e neutrone manifestino proprietà di interferenza? Nel caso delle onde elettromagnetiche erano porzioni diverse del fronte d’onda, le porzioni provenienti dalle fenditure, a sovrapporsi su uno schermo e a interferire, ma per le particelle che cos’è che interferisce?

49

Capitolo 2


2.2 L’ipotesi di De Broglie Partendo dal dualismo onda-particella esibito dalla radiazione elettromagnetica, De Broglie2 ipotizza nel 1924 che anche la materia possieda la stessa natura duale. Il fotone introdotto da Einstein aveva energia E = hν e quantità di moto p = h/λ. De Broglie sugger`ı allora che, analogamente, una particella materiale di quantità di moto p possieda un’onda associata sinusoidale avente lunghezza d’onda data da: h λ= (2.1) p Tale lunghezza d’onda e` chiamata lunghezza d’onda di De Broglie. La costante universale h, che risulta presente sia nell’espressione dell’energia dei fotoni sia nell’espressione della quantità di moto delle particelle, rappresenta il legame tra le due realtà. L’ipotesi di De Broglie e` affascinante e soddisfa un criterio di simmetria tra materia e radiazione. Ma se la materia e il moto dei corpi sono stati osservati e misurati con accuratezza da centinaia di anni, come e` possibile che non si sia rivelata prima l’esistenza di un’onda associata? La risposta sta nell’estrema piccolezza della lunghezza d’onda associata a oggetti macroscopici, come discusso nell’esempio 1 trattato più avanti, che rende inosservabili queste onde. Per oggetti microscopici, invece, osservare l’onda di De Broglie sarebbe in linea di principio possibile, ma affinché tale ipotesi potesse diventare un fondamento della teoria essa bisognava che venisse provata dall’evidenza sperimentale.

2.2.1

Esperimenti di supporto

Se si vuole tentare di evidenziare l’onda associata di De Broglie bisogna necessariamente operare con oggetti microscopici o altrimenti la lunghezza d’onda risulta cos`ı piccola da essere inosservabile. Come suggerito dall’esempio 1, 2

Louis de Broglie (1892-1987), fisico francese vincitore del Premio Nobel per la Fisica nel 1929 per la scoperta della natura ondulatoria dell’elettrone. 50

L’ipotesi di De Broglie

Capitolo 2

rivelatore fascio diffuso sorgente elettroni

fascio elettroni

ϕ bersaglio

Figura 2.3: schema dell’apparato usato nell’esperimento di Davisson-Germer.

elettroni e neutroni sono buoni candidati per esperimenti volti a evidenziare l’aspetto ondulatorio e, infatti, i primi esperimenti a essere stati condotti hanno riguardato proprio queste particelle. Sulla base dell’esperienza acquisita con la diffrazione delle onde, e in particolare la diffrazione dei raggi X, ci si aspetta che si possa osservare diffrazione nel caso di elettroni inviati su una struttura cristallina. Descriviamo a questo riguardo alcuni esperimenti storici: − Esperimento di Davisson-Germer. Similmente al caso della diffrazione di raggi X su un cristallo che evidenzia la formazione delle cosiddette macchie di Laue (vedi capitolo 1), vengono inviati degli elettroni su un bersaglio di nichel, come indicato in figura 2.3. Questi elettroni, prodotti da un filamento riscaldato, vengono accelerati da una differenza di potenziale V regolabile a piacere, ottenendo cos`ı un fascio di elettroni di energia eV. Se la differenza di potenziale non e` troppo grande gli elettroni, aventi bassa energia, non riescono a penetrare in profondità nella struttura cristallina ed e` sufficiente considerare la diffrazione che si produce nei piani atomici superficiali. La struttura atomica superficiale si comporta come un reticolo di diffrazione in riflessione, caratterizzato da un passo d pari alla distanza interatomica. 51

Capitolo 2


Per tale reticolo la condizione per avere un massimo di interferenza sarebbe data dalla legge di Bragg (vedi capitolo 1): 2d sin θ = mλ (m = 1, 2, 3, ...)

(2.2)

dove θ e` l’angolo radente misurato rispetto al piano contenente i centri diffrangenti. Andando a guardare la corrente misurata dal rivelatore e variando l’angolo ϕ tra fascio incidente e fascio diffuso, Davisson3 e Germer4 osservarono (vedi figura 2.4) un massimo di interferenza ben pronunciato a un angolo ϕ = 50○ dimostrando la natura ondulatoria dell’elettrone. Conoscendo, inoltre, la distanza interatomica del nichel si ottiene (vedi esempio 2) una lunghezza d’onda molto vicina al valore atteso secondo l’ipotesi di De Broglie. Notiamo che l’interferenza osservata non si riferisce a onde associate a elettroni diversi, ma si tratta, invece, dell’interferenza tra porzioni dell’onda associata a un singolo elettrone. Questo può essere verificato riducendo l’intensità del fascio di elettroni, facendo in modo che sul bersaglio arrivi un singolo elettrone alla volta. − Esperimento di G.P. Thomson. In questo esperimento del 1927 G.P. Thomson5 diresse un fascio di elettroni aventi energia cinetica ben definita pari a 15 keV su un sottile foglio ricoperto di polvere metallica. In questo caso non si ha a che fare, come nell’esperimento di Davisson-Germer, con un singolo cristallo, ma con un insieme di cristalli orientati in modo arbitrario. Andando a osservare l’immagine prodotta su una lastra fotografica (vedi figura 2.5) si osserva una figura di diffrazione ad anelli, simile a quella che si produce con raggi X aventi la stessa lunghezza d’onda (esperimento di Debye-Scherrer, vedi capitolo 1). L’analisi numerica della figura di diffrazione fornisce valori di lunghezza d’onda in accordo con quella di De Broglie. 3

Clinton Davisson (1881-1958), fisico statunitense vincitore del Premio Nobel per la Fisica nel 1937 per la scoperta della diffrazione degli elettroni. 4 Lester H. Germer (1896-1971), fisico statunitense. 5 George P. Thomson, (1892-1975), figlio dello scopritore dell’elettrone J.J. Thomson, condivise con Davisson il Premio Nobel per la Fisica nel 1937. 52


Capitolo 2

Intensità corrente

ϕ = 50○

ϕ = 40○

ϕ = 65○ 40

45

50

55

60

65

70

Energia cinetica (eV)

Figura 2.4: intensità di corrente in funzione dell’energia cinetica, per diversi valori dell’angolo ϕ. Misura tratta dall’esperimento di Davisson-Germer (1927).

Figura 2.5: rappresentazione della figura di diffrazione prodotta nella diffrazione di elettroni su una polvere metallica.

53

Capitolo 2


− Diffrazione di neutroni. I neutroni vengono prodotti abbondantemente nei reattori nucleari. Si possono cos`ı ottenere fasci di neutroni molto intensi e collimati. I neutroni interagiscono molto fortemente con gli atomi di idrogeno (principalmente con il suo nucleo), a differenza di quello che succede con i raggi X che interagiscono principalmente con gli elettroni dell’atomo e, quindi, sentono una carica elettrica molto piccola. Per questo motivo un cristallo di materiale organico ricco di idrogeno risulta adatto a condurre esperimenti di diffrazione con neutroni. Anche in questo caso si osserva una struttura a macchie di Laue (vedi figura 2.6) a supporto della natura ondulatoria dei neutroni. − Altri esperimenti. La natura ondulatoria non e` proprietà solamente delle particelle elementari quali l’elettrone o il neutrone, ma e` caratteristica di qualsiasi corpo materiale, carico o neutro. Per osservarla c’è solo bisogno che la lunghezza d’onda di De Broglie sia confrontabile con le dimensioni dell’oggetto diffrangente e, quindi, bisogna usare corpi aventi dimensioni microscopiche. Esperimenti su fasci composti da atomi di idrogeno, elio o da molecole sono stati condotti esibendo il comportamento atteso per un’onda soggetta a diffrazione. L’onda associata di De Broglie e`, quindi, una caratteristica, osservabile o meno, di tutti i corpi materiali.

2.2.2

Esempi

1. Calcolare la lunghezza d’onda di De Broglie per un granello di sabbia (massa 0.1 g, velocità 1 mm/s), un elettrone accelerato da una d.d.p. di 1000 V e un neutrone con energia cinetica di 10 eV. La lunghezza d’onda di De Broglie si ricava dalla formula λ = h/p a partire dalla quantità di moto. Per il granello di sabbia: p = mv = 0.1 × 10−3 × 1 × 10−3 = 1 × 10−7 kg ⋅ m/s quindi:

6.63 × 10−34 ≈ 7 × 10−27 m 1 × 10−7 assolutamente inosservabile. λ=

54


Capitolo 2

Nel caso dell’elettrone √ la sua energia cinetica sarebbe K = eΔV e la quantità di moto (classica) p = 2mK, quindi la lunghezza d’onda sarebbe: 6.63 × 10−34 λ= √ 2 × 9.1 × 10−31 × 1.6 × 10−19 × 1000 cioè ˚ λ ≈ 3.9 × 10−11 m ≈ 0.4 A Il neutrone avrebbe invece lunghezza d’onda: 6.63 × 10−34 λ=√ 2 × 1.67 × 10−27 × 10 × 1.6 × 10−19 ˚ ≈ 9.1 × 10−12 m ≈ 0.1 A Sia nel caso dell’elettrone sia nel caso del neutrone la lunghezza d’onda di ˚ De Broglie viene ad avere dimensione simile a quelle di un atomo (∼ 1 A), quindi, ci si può aspettare che un reticolo cristallino atomico, inteso come struttura diffrangente, possa per l’appunto diffrangere un fascio di elettroni o neutroni. 2. Nel loro esperimento Davisson e Germer misurarono un massimo principale di interferenza per un angolo di diffusione ϕ = 50○ usando elettroni accelerati da una d.d.p. di 54 V. Il passo del reticolo, cioè la distanza interatomica, vale per il nichel d = 0.091 nm. Ricavare la lunghezza d’onda dell’onda associata all’elettrone. Considerando la legge di Bragg per il massimo del primo ordine, la lunghezza d’onda, in funzione dell’angolo radente θ = (180○ − ϕ)/2 = 65○ , vale: λ = 2d sin θ = 2 × 0.091 × sin 65○ = 0.165 nm L’energia cinetica dell’elettrone vale K = 54 eV = 8.64 × 10−18 J e la sua quantità di moto e` pari a: √ √ p = 2mK = 2 × 9.1 × 10−31 × 8.64 × 10−18 = 4.0 × 10−24 kg ⋅ m/s 55

Capitolo 2


Figura 2.6: figura di diffrazione (macchie di Laue) prodotta nella diffrazione di neutroni su un cristallo di cloruro di sodio. La figura si riferisce al lavoro di Shull e Wollan (1949) ed e` tratta da un articolo più recente di C. Shull, Review of Modern Physics, 67, 753, 1995. Copyright 1995, American Physical Society.

In questo caso la lunghezza d’onda di De Broglie sarebbe: h 6.63 × 10−34 = 0.167 nm λ= = p 4.0 × 10−24 in buon accordo con il valore sperimentale.

2.3 Il dualismo onda-particella Gli esperimenti descritti finora, in questo capitolo e in quello precedente, dimostrano in modo convincente che in determinate circostanze la radiazione elettromagnetica può comportarsi in modo corpuscolare mentre, in altre situazioni, le particelle materiali possono esibire comportamento ondulatorio. La differenza fondamentale tra onde e particelle sta nel concetto di localizzazione. Classicamente l’onda e l’energia a essa associata sono distribuite su un fronte d’onda esteso, mentre la particella corrisponderebbe a un volumetto individuato dalla sua posizione nello spazio. Se i due aspetti de56

Il dualismo onda-particella

Capitolo 2

vono fondersi nel dualismo onda-particella il concetto di localizzazione va ridiscusso. Affrontiamo prima il modo in cui un’onda si propaga nello spazio e nel tempo, considerandone la rispettiva estensione: − Estensione nello spazio. Un’onda armonica che si propaga lungo la direzione x e` rappresentata da una funzione sinusoidale del tipo: ξ(x, t) = ξ0 sin(k0 x − ω0 t) caratterizzata da una lunghezza d’onda ben precisa λ0 = 2π/k0 e una frequenza ν0 = ω0 /2π. Tale funzione e` definita per qualsiasi valore di x significando che l’onda da essa descritta (vedi figura 2.7) si estende da x = −∞ a x = +∞. La conoscenza della funzione ξ non ci dà però nessuna informazione sulla posizione dell’onda: l’incertezza sulla posizione Δx risulta, infatti, essere infinita. Una rappresentazione come quella di figura 2.8, chiamata pacchetto d’onda, sarebbe, invece, caratterizzata da un’incertezza Δx finita, pari approssimativamente all’estensione spaziale del pacchetto. Il modo per passare dall’onda armonica della figura 2.7 al pacchetto della figura 2.8 e` quello di sommare un certo numero di onde sinusoidali aventi lunghezza d’onda, ampiezza e fase opportune. Si fa cioè quello che in matematica viene chiamato sviluppo di Fourier, secondo il quale una qualsiasi funzione periodica (o meno) può essere ottenuta come somma finita (o infinita, cioè un integrale) di tante funzioni seno e coseno, aventi diverso numero d’onda e ampiezza ricavabile secondo una certa formula. Queste onde interferiscono tra di loro in modo costruttivo in corrispondenza del pacchetto d’onda e distruttivo altrove. In questo modo la sovrapposizione di onde non localizzate produce un pacchetto d’onda che si muove con una certa velocità (vedi esempio 3) e che e` localizzato nello spazio con una certa indeterminazione Δx. La localizzazione del pacchetto d’onda e` stata però ottenuta a scapito della precisione sul valore del numero d’onda. Nello sviluppo di Fourier partecipano più numeri d’onda distribuiti attorno a un valore centrale k0 con una dispersione Δk, come si può vedere in figura 2.8. Notiamo che se volessimo avere un pacchetto d’onda di estensione Δx = ∞ ritorneremmo al caso 57

Capitolo 2


y

Ampiezza

x

0.5k0

k0

1.5k0

2k0

k

Figura 2.7: rappresentazione di un’onda armonica vista all’istante t (sopra) e la distribuzione in ampiezza relativa del numero d’onda k (sotto).

dell’onda armonica pura cioè basterebbe un unico numero d’onda e, quindi, Δk = 0. Se, invece, si volesse avere un pacchetto d’onda perfettamente localizzato con Δx = 0, lo sviluppo di Fourier richiederebbe l’uso di un numero infinito di onde da sovrapporre e, quindi, Δk = ∞. Ciò suggerisce che Δx e Δk risultino tra di loro inversamente proporzionali, secondo una relazione del tipo: Δk ⋅ Δx ∼ 1 (2.3) − Estensione nel tempo. Una funzione ξ(x, t) definita come sopra e` valida per istanti di tempo compresi tra t = −∞ a t = +∞ e l’onda da essa rappresentata si estende temporalmente tra gli stessi estremi. Anche in questo caso non sarebbe possibile localizzare temporalmente l’onda se non ricorrendo a una sovrapposizione di Fourier di tante onde, ottenendo, quindi, un pacchetto d’onda anche in funzione del tempo. Per questo pacchetto d’onda varrebbe un’espressione per l’incertezza temporale simile a quanto visto sopra: Δω ⋅ Δt ∼ 1

(2.4)

indicando che per avere un impulso di durata molto breve bisogna ricorrere a un ampio intervallo di frequenze associate. 58

Indeterminazione di Heisemberg

Capitolo 2

y Δx

Ampiezza

x

Δk 0.5k0

k0

1.5k0

2k0

k

Figura 2.8: rappresentazione di un pacchetto d’onda visto all’istante t (sopra) e la distribuzione in ampiezza relativa del numero d’onda k (sotto).

2.4 Indeterminazione di Heisemberg Le relazioni di indeterminazione Δk ⋅ Δx ∼ 1 e Δω ⋅ Δt ∼ 1 hanno validità generale per le onde perché derivano dalle proprietà dello sviluppo di Fourier. Se, secondo l’ipotesi di De Broglie, si può associare un’onda a ciascuna particella allora le suddette relazioni possono essere applicate, riscritte in modo diverso, anche alle particelle. Consideriamo una particella che si muova nella direzione x con quantità di moto px . La lunghezza d’onda di De Broglie vale λ = h/px e l’indeterminazione Δk diventa: 2π px 2π 2π ) = Δ( )= Δpx λ h h e sostituendo nell’equazione (2.3) si ottiene: Δk = Δ (

Δk ⋅ Δx =

(2.5)

2π Δpx ⋅ Δx ∼ 1 h

(2.6)

h 2π

(2.7)

e, quindi: Δpx ⋅ Δx ∼ 59

Capitolo 2


espressione che, assieme a quelle analoghe rispetto alla direzione y e z, viene chiamata relazione di indeterminazione di Heisemberg. Questa espressione, ricavata nel 1927 da Heisemberg6, riassume il suo principio di indeterminazione: Posizione e quantità di moto di una particella non possono essere misurate simultaneamente con precisione illimitata. Non si tratta qui di una limitazione nelle nostre capacità sperimentali o nell’accuratezza dei nostri strumenti di misura, ma di una limitazione intrinseca della natura: se in un esperimento riusciamo a misurare con estrema precisione la velocità di una particella (e, quindi, la sua quantità di moto) siamo costretti a rinunciare a una misura altrettanto precisa sulla sua posizione, e viceversa. Il principio di indeterminazione non limita l’accuratezza con cui si può pensare di misurare individualmente px o x, ma e` un limite sulla misura simultanea di px e x. Negli esempi presentati più avanti (4 e 5) vedremo la differenza dal punto di vista delle incertezze tra oggetti macroscopici e microscopici, cioè il ruolo giocato dal valore della costante di Planck nel separare la fisica classica da quella quantistica. La meccanica classica del corpo ci consentiva, noto il valore iniziale della posizione e della velocità, di ricavare il moto seguente e la traiettoria seguita dal corpo a partire dalle forze in gioco. Alla luce del principio di indeterminazione ciò non risulta essere più possibile: non essendo note con precisione arbitraria la posizione e la velocità iniziale, le leggi orarie non possono essere risolte univocamente e il concetto stesso di traiettoria definita perde significato. Perde significato anche il concetto di valore vero di una misura, in quanto anche uno strumento con accuratezza infinita non consentirebbe di ottenerlo. Il principio di indeterminazione e`, infatti, legato all’idea che il processo 6

Werner Heisemberg (1901-1970), fisico tedesco vincitore del Premio Nobel per la Fisica nel 1932 per la sua teoria della meccanica quantistica.

60


Capitolo 2

di osservazione o misura influenzi l’osservazione/misura stessa e che tale influenza non possa essere minore di quanto indicato dalle relazioni di indeterminazione. L’osservatore altera, quindi, in qualche modo la grandezza stessa che vuole misurare. Se, ad esempio, (vedi esempio 6) vogliamo misurare la posizione di un corpo minuscolo, inviando su di esso un raggio laser e osservandone la riflessione, dobbiamo ricordarci che i fotoni nel raggio laser possiedono quantità di moto oltre che energia e che venendo riflessi dal corpo, cioè rinculando nell’urto con il corpo, gli cedono una piccola quantità di moto. Volevamo misurare con precisione la posizione di un corpo inizialmente fermo, ma dopo la misura non siamo più sicuri che esso sia fermo, e quindi Δpx ≠ 0. Quanto più vogliamo essere sicuri della precisione sulla posizione (ad esempio, usando più di un raggio laser) tanto più aumenta Δp. Alla fine Δpx e Δx risultano essere inversamente proporzionali come prescritto dal principio di indeterminazione e qualsiasi esperimento non può essere in grado di scendere sotto un limite dato da7 : Δpx ⋅ Δx ≥

ħ 2

(2.8)

dove ħ ≡ h/2π = 1.05 × 10−34 J ⋅ s; analogamente per le componenti y e z. Un altro modo per misurare la posizione di una particella sarebbe di farla passare attraverso una fenditura sottile (vedi esempio 7) a scapito però della conoscenza della sua quantità di moto. Il principio di indeterminazione vale anche per la conoscenza simultanea di tempo ed energia, con un’espressione simile a quella tra posizione e quantità di moto: ħ ΔE ⋅ Δt ≥ (2.9) 2 Quest’ultima relazione di indeterminazione ha delle conseguenze interessanti. Ad esempio: − la conservazione dell’energia, principio fondamentale della fisica, può 7

Questa, espressa in termini di limite inferiore sul prodotto delle incertezze, sarebbe la formulazione corretta delle relazioni di indeterminazione di Heisemberg.

61

Capitolo 2


essere violata per un intervallo di tempo Δt della quantità ΔE; tanto più grande e` la violazione, tanto più breve deve essere il tempo in cui essa avviene; − un atomo che si diseccita spontaneamente in un tempo Δt ha una incertezza corrispondente ΔE sul valore dell’energia dello stato eccitato e tale incertezza e` tanto più grande quanto più breve e` il tempo di diseccitazione (vedi esempio 8).

2.4.1

Esempi

3. Dimostrare che, per un elettrone descritto da un pacchetto d’onda, la velocità di gruppo risulta essere uguale a quella della particella. La velocità di gruppo v g viene definita a partire da frequenza angolare e numero d’onda come: dω vg = dk L’energia di un pacchetto d’onda vale, secondo Einstein, E = hν = ħω mentre l’energia (non relativistica) di un elettrone vale: E=

p2 ħ 2 k 2 = 2m 2m

quindi:

ħk 2 2m Derivando, otteniamo la velocità di gruppo: ω=

vg =

dω ħk p mv = = = =v dk m m m

che risulta essere uguale a quella della particella. 4. Una pallina da ping-pong di massa pari a 10 grammi si muove con velocità di 1 m/s. Supponendo che la velocità sia stata misurata con precisione dell’1%, quanto varrebbe l’incertezza sulla posizione?

62


Capitolo 2

La quantità di moto della pallina vale: p = mv = 0.01 kg ⋅ m/s e Δp = 0.01 × p = 1 × 10−4 kg ⋅ m/s L’incertezza minima corrispondente varrebbe: Δx =

1.05 × 10−34 ħ 1 ⋅ = = 5.3 × 10−31 m −4 2 Δp 2 × 1 × 10

risultando assolutamente inosservabile. 5. Un elettrone, inizialmente a riposo, viene accelerato lungo l’asse x da una differenza di potenziale di 100 V, nota con precisione dell’1%. Quale sarebbe l’incertezza sulla sua posizione? Un elettrone accelerato dalla differenza di potenziale di 100 V assume un’energia cinetica K = 100 eV, corrispondente a 1.6 × 10−17 J. L’incertezza dell’1% sulla differenza di potenziale si traduce direttamente in un’incertezza dell’1% su K, cioè 1 eV. La sua quantità di moto vale (notiamo che a queste energie l’elettrone non e` relativistico): √ p = 2mK quindi, ricorrendo alla formula di propagazione degli errori, l’incertezza sulla quantità di moto vale: √ ∂p m ΔK = ΔK Δp = ∂K 2K pari a: √

9.1 × 10−31 × 1.6 × 10−19 = 2.7 × 10−26 kg ⋅ m/s 2 × 100 × 1.6 × 10−19

L’incertezza sulla posizione sarebbe allora: Δx =

1.05 × 10−34 ħ 1 ⋅ = = 1.9 × 10−9 m ≈ 2 nm 2 Δp 2 × 2.7 × 10−26 63

Capitolo 2


lente γ ϕ′

f

ϕ

γ

e− x

Figura 2.9: rappresentazione del microscopio a fotoni immaginato da Heisemberg.

che non e` per nulla trascurabile, contrariamente a quanto visto nel caso precedente.

6. Si immagini di misurare la posizione di un elettrone con un microscopio. Che incertezza ci aspettiamo su questa misura? E` un valore compatibile con il principio di indeterminazione? (Questo è un esperimento concettuale immaginato da Heisemberg e rivisto da Bohr.) Per misurare la posizione di un elettrone immaginiamo di illuminarlo e di osservare la luce diffusa attraverso la lente obbiettivo di un microscopio, come rappresentato in figura 2.9. La misura della posizione x (ortogonale all’asse del microscopio) è affetta da una incertezza Δx perché l’immagine di un oggetto puntiforme prodotta da una lente è in effetti una figura di diffrazione. Considerando l’angolo minimo θ R risolvibile da una lente pari a quello che si ha nella diffrazione da parte di un foro di diametro d (θ R ≈ λ/d), l’incertezza diventa: λ (2.10) Δx = f θ R ≈ f d 64


Capitolo 2

elettroni a py p θ

x

Figura 2.10: rappresentazione della diffrazione di un fascio di elettroni da parte di una fenditura sottile.

dove f e` la distanza focale della lente e λ la lunghezza d’onda della luce utilizzata. Il diametro della lente e` legato a f dalla relazione: d = 2( f tan ϕ) ≈ 2 f sin ϕ quindi:

(2.11)

λ (2.12) 2 sin ϕ Notiamo che minore e` la lunghezza d’onda della luce impiegata, minore e` l’incertezza sulla misura di posizione; converrebbe allora usare luce ultravioletta per ottenere la migliore accuratezza sulla misura. La luce che usiamo e` composta da fotoni e l’illuminazione dell’elettrone, atto indispensabile alla sua osservazione, causa una modifica della quantità che si vuole misurare. Possiamo ridurre tale disturbo, ma non lo possiamo eliminare perché ci vuole sempre almeno un fotone per illuminare l’elettrone. Δx =

65

Capitolo 2


Stimiamo ora l’incertezza sulla quantità di moto p dell’elettrone a causa della sua interazione con il fotone. Il fotone porta con sè una quantità di moto pγ = h/λ e viene diffuso dall’urto a un angolo ϕ′ (vedi la diffusione di Compton nel capitolo 1). Quando il fotone entra nella lente in corrispondenza del suo bordo destro (ϕ′ = ϕ) la componente x della quantità di moto totale del sistema e + γ sarà: h sin ϕ (2.13) p′x + λ′ mentre per un fotone che entra in corrispondenza del bordo sinistro vale: p′′x −

h sin ϕ λ′′

(2.14)

Le due quantità (2.13) e (2.14) devono essere uguali alla quantità di moto iniziale e, quindi, uguali tra di loro. Inoltre, se l’apertura della lente e` piccola, λ′ ≈ λ′′ ≈ λ. L’incertezza sulla quantità di moto dell’elettrone e` pari all’intervallo dei valori possibili e vale: Δpx = p′x − p′′x =

2h sin ϕ λ

(2.15)

Moltiplicando l’incertezza sulla quantità di moto per l’incertezza sulla posizione si ottiene: Δpx ⋅ Δx =

λ 2h sin ϕ ⋅ =h λ 2 sin ϕ

(2.16)

confrontabile con il valore minimo previsto dalla relazione di indeterminazione. 7. Supponiamo di misurare la coordinata x di un elettrone, facente parte di un fascio, costringendolo a passare attraverso una fessura sottile di larghezza a. Cosa si può dire sull’incertezza Δpx relativa alla componente x della quantità di moto dell’elettrone dopo la fenditura? Analogamente a quanto si verifica per un’onda elettromagnetica, la fenditura produce una diffrazione del fascio di elettroni, come rappresentato in

66


Capitolo 2

figura 2.10. La frangia centrale corrisponde a elettroni emessi in una direzione compresa tra −θ e θ dove θ e` l’angolo a cui si verifica il primo minimo di diffrazione dato dalla formula usuale: a sin θ = 1 ⋅ λ → sin θ =

λ a

Se chiamiamo p la quantità di moto del fascio di elettroni prima della fenditura, dopo la fenditura la componente x della quantità di moto sarà compresa tra −px e px con un’incertezza Δpx data da: Δpx = px = p sin θ = p ⋅ che diventa: Δpx =

λ a

h a

ricordando che λ = h/p. Come risultato di un tale esperimento avremmo una misura della coordinata x con un’incertezza pari all’ampiezza della fenditura Δx = a. Il prodotto delle incertezze Δx e Δpx varrebbe allora: Δpx ⋅ Δx =

h ⋅a=h a

in accordo con il limite inferiore ħ/2 imposto dalla relazione di indeterminazione. 8. Un atomo di sodio eccitato si diseccita in un intervallo temporale che vale tipicamente Δt ∼ 1 × 10−8 s irradiando un fotone avente lunghezza d’onda λ = 589 nm. Calcolare l’incertezza ΔE sull’energia dello stato eccitato e l’incertezza relativa sulla frequenza del fotone di diseccitazione. Il principio di indeterminazione prescrive che: ΔE ⋅ Δt ≥

ħ 2

quindi, prendendo il valore minimo: ΔE =

ħ 2Δt

67

Capitolo 2


e numericamente: 1.05 × 10−34 = 5.3 × 10−27 J. 2 × 1 × 10−8 Siccome ΔE = hΔν, allora: 1 1 Δν = ΔE = h 4πΔt e l’incertezza relativa sulla frequenza vale: Δν 1 λ = /(c/λ) = ν 4πΔt 4πcΔt quindi: Δν 589 × 10−9 = = 1.6 × 10−8 ν 4π × 3 × 108 × 1 × 10−8 cioè circa 2 parti su 100 milioni. ΔE =

2.5 Complementarietà onda/particella Abbiamo visto, in questo capitolo e in quello precedente, che sia la radiazione elettromagnetica sia i corpi materiali esibiscono un comportamento duale, potendo apparire o come onda o come particella a seconda delle circostanze. E` importante però notare che in una data situazione si applica solo uno dei due modelli possibili. Per quanto riguarda le onde, ad esempio, esse agiscono come entità localizzate quando interagiscono e vengono rivelate, mentre quando si muovono lo fanno come onde, estese e non localizzate. Questo apparente paradosso venne descritto da Bohr8 nel suo principio di complementarietà: Il modello particellare e quello ondulatorio sono complementari: se una misura prova il carattere ondulatorio (o particellare) della radiazione o della materia allora e` impossibile nella stessa misura rivelare l’aspetto particellare (o ondulatorio). Il modello da applicare è determinato dalla natura della misura. 8

Niels H.D. Bohr (1885-1962), fisico danese vincitore del Premio Nobel per la Fisica nel 1922 per le sue teorie sulla struttura dell’atomo. 68

Applicazioni

Capitolo 2

In conclusione radiazione e materia non sono né semplicemente onde né semplicemente particelle, ma qualcosa di più complicato che segue una modalità o l’altra a seconda delle circostanze. Sarà la natura dell’esperimento e le modalità secondo le quali esso e` condotto, a fare emergere un aspetto o l’altro e a richiedere, nella trattazione, un modello fisico o l’altro.

2.6 Applicazioni Il fatto che particelle microscopiche si comportino, in date circostanze, come onde ha delle implicazioni importanti che possono essere sfruttate per applicazioni concrete, come nel caso della microscopia elettronica e della diffrazione di neutroni.

2.6.1

Microscopia elettronica

La risoluzione di un microscopio o di una qualsiasi apparecchiatura ottica composta da lenti e` legata alla proprietà diffrangente di un foro circolare. Un foro di diametro d illuminato con luce avente lunghezza d’onda λ produce, infatti, un’immagine composta da un disco centrale attorniato da anelli concentrici di raggio crescente. L’ampiezza del disco centrale e` data dall’espressione: λ (2.17) sin θ = 1.22 d dove θ e` l’angolo misurato rispetto all’asse della lente. Due sorgenti i cui raggi vengono focalizzati da una lente su uno schermo formano immagini distinte (secondo il criterio di Rayleigh9) se i raggi provengono da due direzioni separate almeno da un angolo: θ R = 1.22 9

λ d

(2.18)

Il criterio di Rayleigh richiede almeno, per avere due immagini risolte cioè distinte, che il massimo della figura di diffrazione di un’immagine vada a sovrapporsi con il primo minimo dell’altra immagine.

69

Capitolo 2


La minima dimensione dei dettagli distinguibili del campione in esame e`, quindi, dell’ordine di grandezza di λ. Ecco perché in microscopi ottici converrebbe illuminare il campione con luce ultravioletta. Come visto nel capitolo 1 e` possibile studiare la struttura cristallina ricorrendo a esperimenti di diffrazione di raggi X che consentono di “osservare” distanze interplanari dell’ordine del nanometro. Un’altra possibilità e` fornita dal fatto che anche gli elettroni (in certe circostanze) si comportano come onde che possono avere una lunghezza d’onda (quella di De Broglie) molto piccola (se la loro quantità di moto e` molto grande rispetto al valore di h). Un “microscopio” che usi elettroni per “illuminare” il campione avrebbe allora un potere risolutivo molto più grande di un comune microscopio ottico, consentendo ingrandimenti molto maggiori che nel caso ottico. Si passa da ingrandimenti di circa un fattore 1.000, possibili nei migliori microscopi ottici, a ingrandimenti dell’ordine del milione per i microscopi elettronici. Semplificando la descrizione, un microscopio elettronico usa un sistema di “lenti” elettrostatiche ed elettromagnetiche per focalizzare un fascio di elettroni, prodotti da un sistema ad alto voltaggio, sul campione da esaminare. L’immagine del campione viene poi ricostruita a partire dagli elettroni stessi, con diverse modalità. Il primo microscopio elettronico, inventato nel 1931 da Ruska10 e Knoll11 , fu successivamente modificato secondo due tipologie: il microscopio a trasmissione e quello a scansione. Riassumiamo qui le caratteristiche distintive dei due modelli: − Microscopio a trasmissione. In questo caso il fascio di elettroni attraversa il campione in esame per essere poi raccolto dal sistema di formazione dell’immagine. Le informazioni sulla struttura del campione vengono amplificate da un sistema di lenti elettromagnetiche e registrate su un dispositivo sensibile come, ad esempio, uno schermo fluorescente seguito da una 10

Ernst Ruska (1906-1988), fisico tedesco vincitore nel 1986 del Premio Nobel per la Fisica per l’invenzione del microscopio elettronico. 11 Max Knoll (1897-1969), ingegnere tedesco.

70

Applicazioni

Capitolo 2

Figura 2.11: immagine di un mitocondrio presa con un microscopio elettronico a trasmissione. Per gentile concessione di Centre of Microscopy and Microanalysis, University of Queensland, Australia.

lastra fotografica o un dispositivo elettronico sensibile alla luce (letto tramite CCD12 ). L’immagine raccolta dalla lastra fotografica o tramite i CCD può essere poi registrata su un computer o trasferita su un monitor. La risoluzione di un microscopio a trasmissione e` influenzata soprattutto dalle prestazioni del sistema di focalizzazione (la cosiddetta aberrazione sferica13 ) che può essere parzialmente corretta a livello software, consentendo l’osservazione di atomi separati da distanze dell’ordine di 1 angstrom, con ingrandimenti pari a qualche decina di milioni di volte. Un esempio di immagine fornita da un microscopio a trasmissione e` riportata nella figura 2.11, dove si distinguono i dettagli interni di un mitocondrio. 12

Il CCD, cioè il Charged-Coupled Device, e` un dispositivo elettronico analogico in cui le cariche elettriche vengono trasferite in stadi successivi composti da condensatori. In questo modo i CCD vengono usati per memorizzare o ritardare dei segnali analogici oppure per serializzare dei segnali che arrivano in parallelo. 13 Nel caso di lenti ottiche si parla di aberrazione sferica per descrivere il fatto che una lente, le cui superfici sono porzioni di sfera, non e` in grado di fare convergere in un punto i raggi provenienti da una sorgente puntiforme (soprattutto quelli più spostati rispetto all’asse della lente). Non si forma un’immagine puntiforme, ma estesa. Tale limitazione può essere corretta modificando opportunamente la forma delle superfici della lente.

71

Capitolo 2


− Microscopio a scansione. Gli elettroni energetici che vengono inviati sul campione producono l’emissione di elettroni secondari che vengono raccolti a formare l’immagine. Il fascio viene spostato attraverso il campione (scansione) e gli elettroni secondari vengono osservati e registrati in funzione della posizione del fascio. Rispetto al microscopio a trasmissione, la risoluzione di quello a scansione e` un po’ peggiore (di circa un fattore 10). C’è però il vantaggio che l’emissione degli elettroni secondari proviene non solo dalla superficie, ma da tutto il campione, consentendo una rappresentazione in tre dimensioni della struttura del campione in esame. Un esempio di immagine fornita da un microscopio a scansione e` riportata nella figura 2.12; e` evidente che in questo caso l’ingrandimento dell’immagine risulta molto minore di quello relativo alla figura 2.11. Rispetto a queste due tipologie principali sono stati sviluppate nel seguito altri modelli basati su modalità diverse. In ogni caso la caratteristica generale dei microscopi elettronici e` che sono molto costosi, difficili da utilizzare, sensibili a disturbi di vario tipo e utilizzabili solo per determinati tipologie di campione che devono essere preparate in qualche modo speciale. Questi microscopi sono oggi uno strumento essenziale per ricerche sui materiali, per lo studio di campioni biologici e per molteplici applicazioni industriali.

2.6.2

Diffrazione di neutroni

Anche i neutroni hanno un’onda associata di De Broglie e, quindi, anche per essi e` possibile essere soggetti a diffrazione, come avviene per le onde elettromagnetiche. Quello che conta e` che le dimensioni della struttura diffrangente siano confrontabili con la lunghezza d’onda di De Broglie dei neutroni usati. I primi esperimenti di diffrazione di neutroni vennero condotti nel 1945 da Wollan14 e Shull15 che formularono i principi fondamentali conducendo 14

Ernest O. Wollan (1902-1984), fisico statunitense. Clifford Shull (1915-2001), fisico statunitense vincitore nel 1994 del Premio Nobel per la Fisica, assieme ad altri scienziati, per lo sviluppo della tecnica di diffrazione di neutroni. 15

72

Applicazioni

Capitolo 2

Figura 2.12: immagine di una zampa di vespa presa con un microscopio elettronico a scansione. Per gentile concessione di Centre of Microscopy and Microanalysis, University of Queensland, Australia.

una serie di misure (vedi la figura 2.6) studiando, tra le altre cose, i momenti magnetici dei materiali. La diffrazione di neutroni e` usata in cristallografia per misurare la struttura atomica/molecolare e magnetica dei materiali, fornendo informazioni sulla posizione dei nuclei degli atomi e sulla loro dimensione. Le informazioni che si possono ottenere sono simili a quelle ottenibili dalla diffrazione dei raggi X (vedi capitolo 1) con il vantaggio che, usando fasci di tipo diverso, si possono ottenere informazioni in qualche modo complementari. I neutroni sono particelle elettricamente neutre e, quindi, non sarebbe possibile agire su di essi né attraverso campi elettrici né attraverso campi magnetici. Tali particelle (cos`ı come i protoni) risultano però essere composte da dei costituenti elementari chiamati quark16 . A differenza dei neutroni i 16

I quark sono, assieme all’elettrone e a particelle simili all’elettrone chiamate leptoni, tra i costituenti fondamentali della materia. Essi compaiono in 6 varietà indicate con le lettere u, d, s, c, b e t, hanno spin 1/2 e sono dotati di carica elettrica frazionaria (−(1/3)e o +(2/3)e). Il fatto che la carica risulti essere frazionaria non e` in contraddizione con la quantizzazione della carica elettrica che prevede cariche che siano multipli interi della carica elementare e, perché non e` possibile avere quark isolati, ma solo combinazioni tipicamente di 2 o 3 quark con carica intera.

73

Capitolo 2


Figura 2.13: immagine di una giunzione metallica presa con una tomografia a neutroni. Per gentile concessione del servizio Neutra del Paul Scherrer Institute, Zurigo, Svizzera.

quark sono dotati di carica elettrica e fanno acquisire al neutrone un momento di dipolo magnetico non nullo. Grazie a questo momento di dipolo magnetico i neutroni possono essere orientati da un campo magnetico esterno e a loro volta possono interagire con i momenti magnetici degli elettroni. Per questo motivo, a differenza della diffrazione con raggi X, la diffrazione di neutroni e` sensibile alla struttura magnetica del materiale in esame. Anche se i neutroni sono una componente stabile del nucleo essi non esistono normalmente allo stato libero perché sono instabili e tendono a disintegrarsi rapidamente, vivendo in media solo circa quindici minuti. Neutroni liberi sono però prodotti abbondantemente nelle reazioni di disintegrazione nucleare (ad esempio, la fissione) che avvengono nei reattori nucleari o nelle cosiddette sorgenti di spallazione17. I neutroni prodotti dai reattori vengono chiamati neutroni termici o neutroni freddi, a seconda dei valori di energia cinetica, temperatura e lunghezza d’onda di De Broglie, come indicato in tabella 2.1. Tali neutroni ven17

Neutroni di spallazione vengono prodotti bombardando atomi pesanti (ad esempio, piombo) con particelle molto energetiche (protoni o elettroni) provenienti da un acceleratore. 74


NEUTRONI Termici Freddi

TEMPERATURA (K) 120 ÷ 1000 10 ÷ 120

Capitolo 2

K (meV) λ (nm) 15 ÷ 130 0.08 ÷ 0.23 1.3 ÷ 15 0.23 ÷ 0.8

Tabella 2.1: valori √ tipici di temperatura, energia cinetica (K = 3kT/2) e lunghezza d’onda (λ = h/p = h/ 2mK) per neutroni cosiddetti termici e freddi.

gono collimati attraverso un sistema di fenditure e inviati sul campione da esaminare. A differenza dei raggi X, che interagiscono con gli elettroni che circondano l’atomo, i neutroni interagiscono direttamente con il nucleo. Nel primo caso l’intensità della radiazione diffratta aumenta con il numero atomico Z ed e` la stessa per isotopi diversi dello stesso elemento. Nel caso dei neutroni, invece, l’intensità diffratta dipende dal numero di massa A ed e` diversa nel caso di isotopi differenti. In certi casi l’intensità diffratta per neutroni risulta essere grande anche per atomi con basso Z, contrariamente a quello che succede con i raggi X. In figura 2.13 riportiamo un esempio di tomografia18 a neutroni in cui la sensibilità dei neutroni a materiali idrogenati li rende utili, ad esempio, per investigare la presenza di tali materiali dentro strutture metalliche. Nella figura si vede la tomografia di una giunzione metallica incollata, dove viene evidenziata la distribuzione della colla. Una tale immagine non si potrebbe ottenere con tomografia a raggi X.

2.7 Quesiti di riepilogo 1. A parità di velocità, chi ha lunghezza d’onda di De Broglie maggiore, un granello di sabbia o una biglia di vetro? 18

Nella tomografia, sia essa a raggi X o con neutroni, vengono prese immagini di sezioni di un oggetto irradiandolo da direzioni differenti e misurando variazioni nell’assorbimento. Tramite il calcolo si ottiene da queste una ricostruzione in 3 dimensioni. 75

Capitolo 2


2. Immaginando di misurare la posizione di un elettrone con il microscopio di Heisemberg (vedi esempio 6), converrebbe usare luce rossa o blu per avere la minor incertezza sulla misura di posizione? 3. Per una certa entità fisica quale delle seguenti affermazioni e` corretta? a) si manifesta sempre come corpo o sempre come onda; b) si può manifestare nello stesso esperimento sia come corpo sia come onda; c) si manifesta o come corpo o come onda, ma non contemporaneamente. 4. Se si vuole aumentare la risoluzione di un microscopio elettronico conviene usare elettroni più energetici o meno energetici? 5. Nella diffrazione di neutroni si otterrebbero risoluzioni migliori con neutroni termici o neutroni freddi? 6. Si immagini di poter misurare la posizione di una particella in un istante t con incertezza Δx. L’incertezza Δx ′ con cui sarà nota la posizione in un istante successivo t ′ risulta essere direttamente o inversamente proporzionale a Δx? Si giustifichi.

2.8 Esercizi 1. Calcolare la lunghezza d’onda di De Broglie per i seguenti corpi: a) un pallone da calcio (massa m = 250 g) che si muove alla velocità di 6 m/s; b) un proiettile sferico (m = 20 g) che si muove con v = 1000 m/s; c) un elettrone con energia cinetica di 100 eV; d) un neutrone termico da 100 meV. 2. Un elettrone che si muove con velocità v = 106 m/s incide su un bersaglio avente una fenditura lunga e sottile di spessore a = 100 μm. Quanto vale l’incertezza relativa sulla velocità dell’elettrone oltre la fenditura? 3. Per un elettrone e un fotone aventi entrambi lunghezza d’onda λ = 0.01 nm

76

Esercizi

Capitolo 2

calcolare quantità di moto, energia totale e cinetica (usando per l’elettrone le formule relativistiche19 ). 4. In un esperimento di diffrazione su un cristallo (avente spaziatura tra i piani dell’ordine di qualche angstrom) si usano alternativamente elettroni e fotoni aventi energia cinetica pari a 20 keV. Quanto vale il rapporto θ γ /θ e tra gli angoli (piccoli) corrispondenti al primo ordine nella riflessione di Bragg? E` necessario conoscere la spaziatura tra i piani cristallini? 5. In un esperimento di diffrazione di neutroni aventi energia cinetica Kn = 30 meV si osserva un massimo di intensità in corrispondenza di un angolo ϕ = 82○ tra raggio incidente e diffuso. Quanto vale in questo caso la distanza interplanare minima? 6. Quanto vale l’energia cinetica e la lunghezza d’onda di De Broglie per un neutrone termico alla temperatura ambiente T = 300 K?

19

Vedi capitolo 1. 77

Capitolo 3 I fondamenti della meccanica quantistica Nel capitolo precedente abbiamo visto che i risultati sperimentali confermano l’ipotesi che le particelle microscopiche si comportino, in determinate circostanze, come onde la cui lunghezza d’onda venne prevista da De Broglie. In seguito si e` visto che l’idea di poter localizzare particelle materiali con precisione arbitraria va riconsiderata alla luce del principio di Heisemberg. Born1 , a sua volta, sugger`ı il modo di formalizzare queste due proprietà.

3.1 L’ipotesi di Born Born introdusse un’interpretazione probabilistica per fornire il collegamento tra il modello corpuscolare e il modello ondulatorio per la materia. Nell’ipotesi di Einstein per i fotoni, la media del quadrato dell’ampiezza del campo elettrico ⟨E 2 ⟩ e` proporzionale all’intensità dell’onda che, a sua volta, e` una misura del numero medio di fotoni presenti nell’unità di volume. La quantità ⟨E 2 ⟩ rappresenta, quindi, la probabilità di trovare un fotone che attraversi l’unità di area nell’unità di tempo. In analogia con questa interpretazione Born sugger`ı che anche la probabilità di osservare una particella in un certo volume sia proporzionale al quadrato dell’ampiezza di un’onda chiamata funzione d’onda Ψ, la cui lunghezza d’onda e` proprio la lunghezza d’onda di De Broglie λ = h/p. Per una particella con quantità di moto p e energia E, che si muove lungo 1

Max Born (1882-1970), fisico tedesco vincitore del premio Nobel per la Fisica nel 1954 per le sue ricerche fondamentali sulla meccanica quantistica.

Capitolo 3

I fondamenti della meccanica quantistica

la direzione x, la sua funzione d’onda sarebbe: Ψ(x, t) = A sin (

2π x − 2πνt) λ

(3.1)

dove A rappresenta l’ampiezza massima della funzione, λ = h/p e ν = E/h. La quantità ⟨Ψ2 ⟩ fornisce allora la probabilità di trovare la particella in un certo punto dello spazio in un certo istante. In questo modo le ipotetiche “onde di materia” introdotte da De Broglie diventano “onde di probabilità”. Secondo Born l’evoluzione dinamica di un sistema e` regolata dalle leggi della probabilità: a un certo stato corrisponde una certa probabilità e l’evoluzione dinamica del sistema e` legata all’evoluzione della funzione d’onda associata al sistema. Una delle conseguenze di questa ipotesi e` che viene meno l’aspetto deterministico delle leggi della meccanica secondo cui, note le condizioni iniziali e le forze alle quali e` sottoposto un sistema fisico, si possono ricavare in modo idealmente esatto le condizioni raggiunte dal sistema in un istante successivo. Per illustrare tale concetto traduciamo qui una parte del discorso fatto da Born in occasione della cerimonia per il conferimento del Premio Nobel: Il determinismo della fisica classica si è rivelato un’illusione creata da concetti logico-matematici sopravvalutati. E` un idolo e non un ideale della ricerca scientifica e non può perciò essere usato come una obiezione all’interpretazione statistica essenzialmente indeterministica della meccanica quantistica. Questa idea, che assieme ad altri principi quali quello di indeterminazione e quello di complementarietà va sotto il nome di interpretazione di Copenhagen, incontrò l’opposizione di molti scienziati tra cui Einstein stesso che non credeva che le leggi della natura potessero, in ultima istanza, non essere deterministiche, ma dettate dal caso. In meccanica classica note le condizioni iniziali possiamo prevedere quelle finali se conosciamo le forze a cui e` soggetto il corpo; nella meccanica quantistica non e` più possibile farlo in modo esatto perché si possono conoscere solamente le probabilità che le condizioni iniziali e finali assumano 80

L’equazione di Schrodinger ¨

Capitolo 3

certi valori. Valori leggermente diversi avranno probabilità diverse originando diversi stati finali possibili. Questa visione si accorda naturalmente con il principio di indeterminazione di Heisemberg.

¨ 3.2 L’equazione di Schrodinger Nel 1926 Schrödinger2 , partendo dall’idea di quantizzazione dell’energia di Planck e dall’ipotesi dell’onda associata di De Broglie, sviluppò uno schema unificato chiamato meccanica ondulatoria per estendere le leggi della meccanica classica, comunemente accettata per corpi macroscopici, al dominio del microscopico, cioè dei fenomeni atomici o nucleari. Questa nuova teoria fu in grado di spiegare con successo il comportamento della materia non solo su scala atomica, ma anche su scala macroscopica in quanto la meccanica ondulatoria si riduce alla meccanica classica newtoniana per corpi aventi dimensioni e massa grandi. La teoria introdotta da Schrödinger risulta essere un approccio alternativo ed equivalente rispetto alla teoria sviluppata da Heisemberg chiamata meccanica matriciale; allo stesso tempo essa e` di più facile collegamento con situazioni fisiche osservabili, ed e` quella che descriveremo qui. Nella formulazione di Schrödinger della meccanica quantistica a un qualsiasi sistema dinamico viene associata una certa funzione d’onda Ψ(x, y, z, t), funzione delle coordinate spaziali e del tempo e soddisfacente a una certa equazione differenziale. Le proprietà dinamiche del sistema dipenderanno da questa equazione e saranno determinabili quando la funzione d’onda risulti essere nota. Per la funzione d’onda si postulano le proprietà seguenti: 1. Ψ(x, y, z, t) e` una funzione complessa associata al sistema; 2. la funzione d’onda e le sue derivate devono essere finite, continue e univoche; 2

Erwin Schrödinger (1887-1961), fisico austriaco vincitore del Premio Nobel per la Fisica nel 1933 assieme a Paul Dirac per la scoperta di nuove forme di teoria atomica.

81

Capitolo 3


3. la quantità Ψ∗ Ψ e` una quantità reale e rappresenta la densità di probabilità, nel senso che Ψ∗ Ψdτ e` la probabilità che la particella si trovi all’istante t entro il volumetto dτ; 4. alle grandezze fisiche classiche, come la quantità di moto p e energia E, vanno sostituiti degli operatori3 : ad esempio, E → −(ħ/i)∂/∂t e p → (ħ/i)∇; 5. i valori di aspettazione di una qualsiasi variabile dinamica v, a cui va associato l’operatore vop , si ottengono risolvendo il seguente integrale: ⟨v⟩ = ∫ Ψ∗vop Ψdτ

(3.2)

6. partendo dall’espressione classica per l’energia totale di un corpo di massa m come somma di energia cinetica e potenziale: E=

p2 + U(x, y, z, t) 2m

(3.3)

e sostituendo p ed E con i rispettivi operatori, agenti sulla funzione d’onda, si ottiene la equazione di Schrödinger: −

ħ2 2 ħ ∂Ψ ∇ Ψ + U(x, y, z, t)Ψ = − 2m i ∂t

(3.4)

dove l’operatore ∇2 , chiamato operatore Laplaciano, corrisponde a: ∇2 ≡

∂2 ∂2 ∂2 + + ∂x 2 ∂y2 ∂z 2

(3.5)

Queste condizioni sono dei postulati, su cui si basa tutta la meccanica ondulatoria di Schrödinger, che non possono essere provati se non attraverso le previsioni che possono essere ottenute a partire da essi, e il loro accordo con i risultati sperimentali. Come abbiamo visto, la quantità Ψ∗ Ψdτ rappresenta la probabilità di osservare una particella in un certo volumetto: trattandosi di probabilità non si può conoscere con precisione né la posizione né la traiettoria della particella, 3

Questi operatori sono delle quantità matematiche che agiscono in modo definito sulla funzione d’onda.

82


Capitolo 3

come del resto ci veniva suggerito dal principio di indeterminazione di Heisemberg. Nel caso di oggetti macroscopici, cioè aventi dimensioni e masse grandi rispetto alla scala rappresentata dalla costante di Planck, la quantità Ψ∗ Ψ va ad assumere valori non trascurabili solo entro i confini dell’oggetto stesso; in questo caso la meccanica newtoniana ritorna a funzionare.

3.2.1

¨ Equazione di Schrodinger degli stati stazionari

L’equazione di Schrödinger e` un’equazione differenziale che mescola derivate spaziali e temporali, ma in certe situazioni nelle quali il potenziale U non risulta essere funzione del tempo, essa può essere risolta attraverso la tecnica della separazione delle variabili. Si assume in questi casi che la funzione d’onda Ψ(x, y, z, t) possa essere fattorizzabile in una parte puramente spaziale e una puramente temporale: Ψ(x, y, z, t) = ψ(x, y, z)ϕ(t)

(3.6)

Sostituendo questa espressione nell’equazione di Schrödinger si ottiene una nuova equazione valida per ψ(x, y, z), detta equazione di Schrödinger degli stati stazionari: 2m ∇2 ψ(x, y, z) + 2 [E − U(x, y, z)] ψ(x, y, z) = 0 (3.7) ħ che viene utilizzata tutte le volte in cui le proprietà del sistema (cioè i valori di U) non cambiano nel tempo. Per la parte temporale vale invece: ϕ(t) = e −iE t/ħ

(3.8)

Se una certa variabile non dipende dal tempo allora il suo valore di aspettazione può essere ricavato a partire da ψ(x, y, z) anziché da Ψ(x, y, z, t): ⟨v⟩ = ∫ ψ∗ vop ψdτ

(3.9)

Il requisito di finitezza, continuità e univocità della funzione d’onda e delle sue derivate può, in determinate condizioni, selezionare a partire da un 83

Capitolo 3


insieme infinito e continuo di soluzioni solo alcune di esse che corrispondono a certi valori discreti dell’energia. Se si considerano inoltre le condizioni al contorno, solo un certo insieme discreto di soluzioni ψn (x, y, z) legate a un insieme di valori En dell’energia risultano accettabili. Le funzioni accettabili vengono chiamate autofunzioni e i corrispondenti valori dell’energia autovalori.

3.2.2

Esempi

L’evoluzione dinamica di un sistema dipende dalle forze a esso applicate. Se possibile, esprimere le equazioni del moto in funzione non delle forze, ma del potenziale comporta una semplificazione della trattazione, mantendendo gli aspetti essenziali. Per poter illustrare il metodo senza troppe complicazioni matematiche ci limiteremo qui a potenziali indipendenti dal tempo e in una sola dimensione. Sotto queste condizioni l’equazione di Schrödinger degli stati stazionari diventa allora: d2 2m ψ + 2 [E − U(x)] ψ = 0 (3.10) 2 dx ħ Discutiamo ora, nel modo più semplificato possibile, come si può risolvere tale equazione nel caso di due casi speciali: la barriera di potenziale e la buca di potenziale. 1. Risolvere l’equazione di Schrödinger nel caso di una barriera di potenziale. Per barriera di potenziale, avente larghezza ℓ e altezza U0 , si intende un potenziale del tipo rappresentato in figura 3.1 e scritto come: ℓ ℓ <x< 2 2 ℓ (3.11) U(x) = 0 per ∣x − ∣ > 0 2 Consideriamo una particella che si avvicini provenendo dalla regione x < −ℓ/2 con energia E. Se E < U0 la fisica classica prevede che la particella giunga in corrispondenza del bordo sinistro della barriera e ivi venga riflessa U(x) = U0 per −

84


Capitolo 3

U(x)

U0

I

II − 2ℓ

III 0

+ 2ℓ

x

Figura 3.1: rappresentazione di una barriera di potenziale.

con certezza. Se invece vale E > U0 la particella ha la certezza di superare la barriera e di proseguire verso destra. Andiamo a ricavare ora il comportamento che ci si aspetta dalla meccanica quantistica risolvendo l’equazione di Schrödinger degli stati stazionari, assumendo che le soluzioni siano rappresentate da funzioni corrispondenti a onde viaggianti lungo la direzione +x del tipo4 : ψ(x) = e ikx

(3.12)

o viaggianti lungo la direzione −x del tipo: ψ(x) = e −ikx

(3.13)

Anzi, per generalità, considereremo la sovrapposizione delle due: ψ(x) = Ae ikx + Be −ikx

(3.14)

Una funzione d’onda complessa del tipo e i(kx−ωt) e` equivalente a cos(kx − ωt) + i sin(kx − ωt). La sua parte reale e` una funzione oscillante i cui nodi si spostano verso x crescenti. Per questo motivo diciamo che la funzione e i(kx−ωt) rappresenta un’onda viaggiante nella direzione +x. In seguito alla fattorizzazione Ψ(x) = ψ(x)ϕ(t) si ottiene l’espressione ψ(x) = e i kx . 4

85

Capitolo 3


secondo due coefficienti complessi A e B che devono soddisfare le condizioni al contorno. Nel caso in questione dobbiamo considerare le tre regioni individuate dalla barriera (x < −ℓ/2, −ℓ/2 < x < ℓ/2 e x > ℓ/2) e usare non solo dei valori specifici per i coefficienti A e B, ma anche per il numero d’onda k. Partiamo dalla regione x < −ℓ/2, che chiamiamo regione I. In questo caso l’equazione (3.10) diventa: d2 2m ψ + 2 Eψ = 0 2 dx ħ

(3.15)

Prendiamo la funzione generica ψ(x) = AI e ikI x + B I e −ikI x e deriviamola una volta: d ψ(x) = AI ik I e ikI x − B I ik I e −ikI x (3.16) dx Deriviamo una seconda volta: d2 ψ(x) = AI i 2 k I2 e ikI x + B I i 2 k I2 e −ikI x = −k I2 ψ(x) dx 2

(3.17)

e sostituendo in (3.15) si ottiene: 2m Eψ(x) = 0 (3.18) ħ2 √ che e` soddisfatta se: 2mE (3.19) kI = ħ Nella regione x > ℓ/2, che chiamiamo regione III, ci aspettiamo una soluzione simile: ψ(x) = AIII e ikIII x + B III e −ikIII x (3.20) −k I2 ψ(x) +

√ 2mE (3.21) k III = ħ Rispetto alla regione I non ci aspettiamo però che ci sia un’onda viaggiante nella direzione −x perché non c’è niente a destra della barriera che possa produrre una riflessione. Si impone allora B III = 0. Per quanto riguarda la regione II, per −ℓ/2 < x < ℓ/2, bisogna distinguere due casi: E > U0 e E < U0 . dove:

86


Capitolo 3

ψ∗ ψ

I

II

− 2ℓ

III

0

+ 2ℓ

x

Figura 3.2: densità di probabilità ψ ∗ ψ nel caso di una barriera di potenziale con E < U 0 .

Nel primo caso E − U0 > 0 e, quindi, la soluzione generale e` ancora del tipo: ψ(x) = AII e ikII x + B II e −ikII x dove:

√ 2m(E − U0 ) k II = ħ

(3.22)

(3.23)

Nel secondo caso invece E − U0 < 0 e il secondo termine di (3.10) diventa negativo. Affinché la somma dei due termini dia zero, la derivata seconda deve essere proporzionale a ψ(x) e con il suo stesso segno. La soluzione generale e` quindi del tipo: ′

′

ψ(x) = A′II e kII x + B′II e −kII x

(3.24)

√ 2m(U0 − E) (3.25) k II′ = ħ e si tratta di una funzione esponenziale e non oscillante. Abbiamo fin qui ricavato delle soluzioni generali. Resterebbero da calcolare i valori dei vari coefficienti A e B imponendo la continuità della funcon:

87

Capitolo 3


zione ψ(x) e della sua derivata prima nei punti x = −ℓ/2 e x = ℓ/2. Per brevità non facciamo ciò, ma andiamo a rappresentare direttamente la soluzione attraverso il grafico della densità di probabilità Ψ∗ Ψ = ψ∗ ψ. Nel caso di maggiore interesse, cioè E < U0 , si ottiene il grafico di figura 3.2. Infatti, nella regione I vale: ψ∗ (x)ψ(x) = (A∗I e −ikI x + B∗I e +ikI x )(AI e ikI x + B I e −ikI x ) = = (A2I + B2I + A∗I B I e −i2kI x + AI B∗I e +i2kI x )

(3.26)

che corrisponde a una funzione oscillante con minimo più grande di zero. Nella regione III vale: ψ∗ (x)ψ(x) = (A∗III e −ikIII x )(AIII e ikIII x ) = A∗III AIII = A2III

(3.27)

che e` un valore costante su tutto x > ℓ/2. Nella regione II abbiamo: ′

′

′

′

′

′

ψ∗ (x)ψ(x) = (AII∗ e kII x + B II∗ e −kII x )(A′II e kII x + B′II e −kII x ) = ′

′

′

′

′

′

= AII2 e 2kII x + B II2 e −2kII x + AII∗ B′II + A′II B II∗

(3.28)

che e` un’esponenziale in cui domina la parte decrescente. Il risultato fondamentale e` che nella regione III la densità di probabilità assume un valore non nullo. Ciò significa che una particella proveniente da x < 0 che incide sulla barriera ha una certa probabilità di essere riflessa, ma anche una probabilità non nulla di penetrarla e di passare al di là della barriera anche se la sua energia e` minore dell’altezza della barriera stessa. In questo caso si parla del fenomeno quantistico di penetrazione della barriera (o effetto tunnel). Si tratta di un fenomeno quantistico senza analogo classico nel senso che per la fisica classica non potrebbe aver luogo. L’esistenza dell’effetto tunnel e` verificata sperimentalmente in molti casi. Un esempio e` dato dalla disintegrazione α di nuclei radioattivi. In questo caso particelle α 5 aventi energia cinetica Kα = 4.2 MeV vengono emesse, ad 5

Le particelle α altro non sono che nuclei dell’atomo di elio, formati da una coppia di protoni e una coppia di neutroni. 88


Capitolo 3

esempio, dal nucleo di 238 U. Le forze che trattengono la particella α entro il nucleo corrisponderebbero a una barriera di potenziale di altezza almeno doppia di Kα , quindi l’emissione di tale particelle non potrebbe aver luogo secondo la fisica classica. 2. Risolvere l’equazione di Schrödinger nel caso di una buca di potenziale finita. Una buca di potenziale finita, avente larghezza ℓ e profondità U0 , può essere scritta come: ℓ U(x) = U0 per ∣x − ∣ > 0 2 ℓ ℓ (3.29) U(x) = 0 per − < x < 2 2 corrispondente alla rappresentazione di figura 3.3. Supponiamo di avere una particella di energia E < U0 . La previsione classica e` che la particella si possa trovare solo entro la buca (cioè in una posizione x soddisfacente a −ℓ/2 < x < ℓ/2), che possa avere qualsiasi valore di energia e che oscilli avanti e indietro rimbalzando in corrispondenza delle pareti della buca. Quando andiamo a risolvere l’equazione di Schrödinger per gli stati stazionari possiamo seguire l’approccio usato nell’esempio precedente e dividere lo spazio in tre regioni: la regione I per x < −ℓ/2, la regione II per −ℓ/2 < x < ℓ/2 e la regione III per x > ℓ/2. Nella regione della buca, cioè nella regione II, la soluzione generale e` ancora del tipo: (3.30) ψ(x) = AII e ikII x + B II e −ikII x √ 2mE (3.31) k II = ħ Una tale espressione corrisponderebbe alla sovrapposizione di onde viaggianti nel verso positivo e in quello negativo delle x. La buca di potenziale e` simmetrica rispetto a x = 0 e ci si aspetta che lo sia anche la soluzione (o meglio ψ∗ψ) che, quindi, deve essere AII = ±B II . Poiché le due onde viaggianti in direzione opposta hanno la stessa frequenza e ampiezza la loro sovrapposizione e` un’onda stazionaria del tipo CII cos k II x o CII sin k II x, dove la nuova dove:

89

Capitolo 3


U(x) U0

− 2ℓ

0

+ 2ℓ

x

Figura 3.3: rappresentazione di una buca finita di potenziale.

ψ3

x ψ2

x ψ1

− 2ℓ

0

+ 2ℓ

x

Figura 3.4: le prime tre autofunzioni nel caso di una buca finita di potenziale con E < U 0 .

90


Capitolo 3

costante CII vale semplicemente CII = 2AII . In questo caso la soluzione più generale sarebbe del tipo: CII cos k II x + CII′ sin k II x

(3.32)

Nella regione I o III le soluzioni generali sono, invece, esponenziali reali del tipo: (3.33) ψ(x) = AI e kI x e: ψ(x) = B III e −kIII x

(3.34)

√ 2m(U0 − E) (3.35) k I = k III = ħ Si noti che, per mantenere la finitezza della funzione d’onda per x → −∞ e x → +∞, abbiamo imposto B I = 0 e AIII = 0. A differenza del caso classico, l’energia E non può assumere qualsiasi valore, ma solo certi valori discreti. L’energia di una particella intrappolata in una buca di potenziale e`, quindi, quantizzata. In corrispondenza di ciascun autovalore En di energia si otterrebbe allora una autofunzione differente. In figura 3.4 si rappresentano tre di queste autofunzioni, ψ1 , ψ2 e ψ3 , in cui all’aumentare dell’energia (E3 > E2 > E1 ) aumenta il numero d’onda k e, quindi, aumenta il numero di oscillazioni entro la buca di potenziale e il numero di nodi6 dell’onda stazionaria. In figura 3.5 mostriamo la forma della densità di probabilità per una di queste autofunzioni. dove:

3. Risolvere l’equazione di Schrödinger nel caso di una buca di potenziale infinita. Sfruttiamo quanto imparato nel caso precedente per risolvere il caso di una buca di potenziale infinita, in cui la profondità U0 della buca e` molto grande, senza entrare in troppi dettagli. Se U0 → ∞ i valori di k I e k III tendono a +∞. Affinché le funzioni d’onda restino comunque finite nelle regioni 6

I nodi di un’onda stazionaria sono i punti in cui l’ampiezza dell’onda e` sempre nulla.

91

Capitolo 3


ψ∗ ψ

− 2ℓ

0

+ 2ℓ

x

Figura 3.5: densità di probabilità ψ ∗ ψ nel caso di una buca di potenziale finita con E < U 0 . Si fa riferimento alla terza autofunzione.

I e III bisogna che i coefficienti AI di (3.33) e B III di (3.34) vadano a zero e, quindi, ψ(x) ≡ 0 su tutta la regione I e tutta la regione III. Come già visto, nella regione II la soluzione ha la forma CII cos k II x o CII sin k II x, ma per raccordarsi alle regioni I e III la soluzione deve valere 0 nei punti x = ±ℓ/2. Ciò significa che kℓ/2 deve essere pari a un multiplo intero di π/2. Il numero d’onda k assume allora dei valori che dipendono dal multiplo intero n: π (n = 1, 2, 3, ...) (3.36) kn = n ℓ dove si esclude ovviamente n = 0 perché in tale caso non si avrebbe nessuna onda. Sfruttando la (3.31) si ricavano i valori possibili per l’energia: En =

ħ2 k 2 ħ2 π 2 2 = n (n = 1, 2, 3, ...) 2m 2mℓ2

(3.37)

Si vede allora che esiste un valore minimo dell’energia (energia di punto zero) che e` sempre maggiore di zero. Per quanto riguarda le autofunzioni, in corrispondenza dei multipli dispari l’autofunzione sarà del tipo: ψn (x) = Cn cos k n x 92

(3.38)

Momenti angolari e spin

Capitolo 3

ψ∗ ψ

− 2ℓ

0

+ 2ℓ

x

Figura 3.6: densità di probabilità ψ ∗ ψ nel caso di una buca di potenziale infinita. Si fa riferimento alla terza autofunzione.

mentre per i multipli pari sarà del tipo: ψn (x) = Cn sin k n x

(3.39)

Si noti che nel caso di una buca finita la densità di probabilità ψ∗ ψ si estende un po’ oltre i confini della buca, mentre se U0 → ∞ la densità di probabilità diventa identicamente nulla al di fuori della buca (vedi figura 3.6). Si ottiene cos`ı nuovamente il risultato classico, cioè che la particella debba trovarsi con certezza entro la buca.

3.3 Momenti angolari e spin Alcuni concetti semplici dell’elettromagnetismo classico, uniti a certi principi della meccanica quantistica, consentono di ottenere dei risultati abbastanza in accordo con quelli che si otterrebbero con una trattazione quantomeccanica più rigorosa. Usiamo qui un tale approccio per ricavare i momenti angolari atomici e fare vedere che essi corrispondono a dei momenti di dipolo magnetici. Consideriamo un elettrone di massa m e carica −e che percorre un’orbita di Bohr circolare di raggio r attorno al nucleo. La carica in moto con velocità 93

Capitolo 3


v descrive la circonferenza 2πr in un periodo T = 2πr/v, ed equivale a una corrente elettrica di intensità: i=

ev e = T 2πr

(3.40)

Dall’elettromagnetismo classico sappiamo che una corrente i su una spira di area A equivale a un dipolo magnetico avente momento di dipolo magnetico: (3.41) μ = iA = iπr 2 Del resto per un elettrone in moto attorno al nucleo si può definire un momento angolare L avente modulo: L = mvr

(3.42)

Siccome tale momento si riferisce a un moto orbitale dell’elettrone attorno al nucleo, lo chiamiamo momento angolare orbitale (detto anche azimuthale). Sostituendo il valore di corrente dato dalla (3.40) in (3.41) e sfruttando la (3.42) si ottiene: e evr = L (3.43) μL = 2 2m dove abbiamo reso esplicita la dipendenza di μ da L apponendo a μ il pedice L. Poiché sia il momento di dipolo magnetico sia il momento angolare orbitale sono vettori, possiamo riscrivere la (3.43) in forma vettoriale come: μL = −

e L 2m

(3.44)

dove il segno negativo e` dovuto alla carica negativa dell’elettrone, il verso della corrente elettrica essendo opposto al moto della particella. La meccanica quantistica prescrive che il momento angolare L sia quantizzato, il suo modulo, cioè, può assumere solo dei valori discreti forniti dall’espressione: √ L = ℓ(ℓ + 1)ħ (3.45) 94


Capitolo 3

dove ℓ e` un numero intero positivo chiamato numero quantico orbitale. Quando si va a considerare la componente di L lungo una direzione z arbitraria, anche tale componente Lz risulta essere quantizzata secondo l’espressione: (3.46) Lz = m ℓ ħ dove mℓ e` un numero intero chiamato numero quantico magnetico, che assume valori compresi tra −ℓ e ℓ. Siccome L ∝ ħ, per il modulo del momento di dipolo magnetico vale: μL ∝

eħ 2m

(3.47)

cioè, e` proporzionale alla quantità elementare: μB =

eħ = 9.27 × 10−24 J/T 2m

(3.48)

chiamata magnetone di Bohr. Con questa definizione riscriviamo la (3.44) come: μB (3.49) μL = − L ħ Questa formula e` stata ricavata per un singolo elettrone in orbita attorno al nucleo. Nel caso di un atomo generico bisognerebbe considerare il momento angolare orbitale totale L = ∑i Li dato dalla somma vettoriale dei momenti angolari di ciascun elettrone. In corrispondenza si ottiene un momento di dipolo magnetico atomico μ L = ∑i μ Li . L’espressione (3.49) vale allora anche per i momenti atomici. Un momento di dipolo magnetico in presenza di un campo magnetico esterno e` soggetto, secondo l’elettromagnetismo classico, a una coppia: τ = μL × B

(3.50)

che tende ad allineare il dipolo con il campo magnetico. Alternativamente, l’azione tra dipolo e campo magnetico può essere descritta da una energia potenziale di interazione: U = −μ L ⋅ B 95

(3.51)

Capitolo 3


Se consideriamo la situazione in cui il dipolo magnetico immerso nel campo magnetico mantiene un’energia costante, allora deve essere costante anche l’energia potenziale di interazione U e, quindi, il dipolo magnetico non può allinearsi con B, ma deve formare un angolo θ costante nel tempo rispetto al campo magnetico. Si dice allora che il momento di dipolo magnetico μ L e L precedono attorno alla direzione di B (precessione di Larmor) con una frequenza angolare di precessione (frequenza di Larmor) che vale: ω=

μB B ħ

(3.52)

Tale formula si può ricavare ricorrendo alla meccanica classica, ma è ottenibile, nella stessa forma, anche seguendo una trattazione quantomeccanica rigorosa. Se il campo magnetico a cui e` sottoposto l’atomo non e` uniforme, ma varia lungo la direzione z, oltre alla coppia τ interviene una forza, dovuta alla disuniformità del campo magnetico, avente componente: Fz = (μ L )z

∂Bz ∂z

(3.53)

che tende a traslare il dipolo magnetico lungo la direzione z.

3.3.1

L’esperimento di Stern-Gerlach

Nel 1922 Stern7 e Gerlach8 condussero un esperimento volto a misurare il momento di dipolo magnetico atomico. Nel loro esperimento i due scienziati usarono un fascio di atomi di argento prodotto facendo evaporare l’argento in un forno e collimando i vapori a formare un fascio da inviare entro un lungo magnete, come mostrato in figura 3.7. All’uscita dal magnete gli atomi andavano a depositarsi condensandosi su uno schermo. Il magnete era costruito in modo da fornire un campo magnetico disuniforme con un forte gradiente in una certa direzione (che chiameremo z). 7

Otto Stern (1888-1969), fisico tedesco vincitore del Premio Nobel per la Fisica nel 1943 per la scoperta del momento magnetico del protone. 8 Walther Gerlach (1889-1979), fisico tedesco. 96


Capitolo 3

Gli atomi di argento sono elettricamente neutri, quindi, su di essi può agire solo la forza (3.53) agente sul momento di dipolo magnetico μ L , forza che e` proporzionale alla componente μ Lz . Dal punto di vista della fisica classica la componente μ Lz può assumere qualsiasi valore compreso tra −μ L e +μ L e di conseguenza la forza sugli atomi può assumere valori Fz soddisfacenti alla diseguaglianza: ∂Bz ∂Bz ∣ ≤ Fz ≤ +μ L ∣ ∣ (3.54) ∂z ∂z che porterebbe gli atomi a depositarsi sullo schermo in un’unica fascia continua (figura 3.8, sopra). Sullo schermo fu osservato, invece, un deposito di argento diviso in due fasce distinte (figura 3.8, sotto), osservazione in netto disaccordo con quanto ci si sarebbe aspettato classicamente. L’esperimento fu ripetuto con atomi di altri elementi e si osservò sempre che il fascio si separava, lungo la direzione z, in due o più componenti discrete e distinte. E` chiaro che se ci sono componenti discrete e distinte allora e` la forza Fz che deve assumere valori discreti e distinti. Facendo riferimento alla (3.53) l’unico modo affinché ciò avvenga e` effettivamente che il momento angolare sia quantizzato. Se il momento angolare orbitale e` quantizzato secondo la (3.46) la componente z del momento di dipolo magnetico vale: −μ L ∣

μLz = −mℓ μ B

(3.55)

dove il numero quantico mℓ assume i valori: mℓ = −ℓ, −ℓ + 1, ..., 0, ..., ℓ − 1, ℓ

(3.56)

Notando che c’è un numero dispari di valori possibili di mℓ e di μ Lz , quindi, ci si aspetta che il fascio si separi in un numero dispari di componenti, in contrasto, invece, con quanto osservato per l’argento. Per evitare possibili complicazioni legate alla presenza di molti elettroni in un atomo come quello d’argento, Phipps e Taylor hanno ripetuto l’esperimento nel 1927 con fasci di idrogeno a temperatura relativamente bassa. 97

Capitolo 3


sorgente

magnete

rivelatore z

x

Figura 3.7: rappresentazione schematica dell’apparato usato da Stern e Gerlach.

In questo caso il numero quantico orbitale vale ℓ = 0 e, quindi, non ci si aspetterebbe la separazione del fascio che, invece, avviene in due componenti distinte e simmetriche. La teoria quantistica e` chiaramente necessaria per spiegare la separazione discreta del fascio, ma non c’è un accordo quantitativo. C’è un ingrediente mancante e questo ingrediente e` il momento angolare intrinseco dell’elettrone detto anche spin9 .

3.3.2

Lo spin dell’elettrone

Per spiegare i risultati dell’esperimento di Stern-Gerlach e di quello di PhippsTaylor bisogna assumere che l’elettrone, anche se e` per quanto ne sappiamo una particella puntiforme, possieda comunque un momento angolare intrinseco S, il cui modulo e componente z sono anch’essi quantizzati secondo le formule: √ (3.57) S = s(s + 1)ħ 9

Lo spin dell’elettrone venne inizialmente suggerito da Samuel A. Goudsmith (1902-1978) e George E. Uhlenbeck (1900-1988) nel 1925 per spiegare una proprietà degli spettri di emissione dell’idrogeno e di altri elementi alcalini. In questi casi si osserva, infatti, che le righe spettrali presentano uno sdoppiamento chiamato struttura fine. Lo spin dell’elettrone risultò anche indispensabile per costruire una teoria quantistica compatibile con la teoria relativistica, come mostrato nel 1929 da P. Dirac.

98


Capitolo 3

z

x Previsto dalla teoria classica z

x Osservato

Figura 3.8: rappresentazione del deposito di argento osservato sullo schermo nell’esperimento di Stern e Gerlach.

e: S z = ms ħ

(3.58)

in funzione dei numeri quantici s e ms . Analogamente a quanto succede nel caso del momento angolare orbitale, a S e` associato un momento di dipolo magnetico: μB μ S = −g S (3.59) ħ che differisce dalla (3.49) solo per l’introduzione del fattore g di spin. Dall’osservazione sperimentale della formazione di due fasci separati si deduce che ms può assumere solo i due valori: 1 (3.60) ms = ± 2 quindi, il numero quantico di spin deve valere: 1 (3.61) s= 2 99

Capitolo 3


Se si va poi a misurare l’entità della separazione sullo schermo dei due fasci si può ricavare l’entità della forza: ∂Bz ∂Bz = −gms μ B (3.62) Fz = (μ S )z ∂z ∂z e, quindi, del fattore g. Queste misure forniscono il valore g = 2.

3.3.3

Interazione spin-orbita

Se gli elettroni possiedono un momento di dipolo magnetico intrinseco μ S allora ci deve essere un’interazione tra questo e il campo magnetico prodotto internamente all’atomo dagli elettroni stessi in orbita attorno al nucleo. Tale interazione viene chiamata interazione spin-orbita ed è descritta da un’energia potenziale: 1 μB U = −μ S ⋅ B = g S ⋅ B (3.63) 2 ħ dove il fattore 1/2 nasce da un’effetto relativistico10 . Del resto il campo magnetico, essendo proporzionale alla corrente elettrica, risulta essere proporzionale alla velocità v e, quindi, al momento angolare orbitale L. Si dimostra allora che: U ∝S⋅L (3.64) A causa dell’interazione tra S e L i due vettori non sono indipendenti l’uno dall’altro e il risultato e` che a essere quantizzato e` il momento angolare totale: J=L+S (3.65) I due vettori S e L precedono dunque attorno alla direzione di J anziché attorno all’asse z quindi, in caso di interazione spin-orbita, le componenti Sz e Lz non sono quantizzate ma lo e` Jz . Vengono introdotti due nuovi numeri quantici j e m j per i quali vale: √ J = j( j + 1)ħ (3.66) 10 `

E necessario, infatti, passare dal sistema di riferimento solidale con l’elettrone a un sistema di riferimento solidale con il nucleo. Tale passaggio comporta la comparsa del fattore 1/2. 100


Capitolo 3

assieme a: Jz = m j ħ

(3.67)

dove i valori interi assunti da m j sono: m j = − j, − j + 1, ..., 0, ..., j − 1, j

(3.68)

Poiché J = L + S i valori che il numero quantico j può assumere sono: j=ℓ+

1 1 o j=ℓ− 2 2

(3.69)

corrispondenti rispettivamente a due vettori L e S paralleli o antiparalleli. L’interazione spin-orbita risulta essere fondamentale nella comprensione dei livelli energetici dell’atomo di idrogeno, cos`ı come nella trattazione quantomeccanica degli atomi a molti elettroni, e per capire le strutture nucleari.

3.3.4

Momenti magnetici nucleari

I protoni, similmente agli elettroni, sono dotati sia di carica elettrica sia di spin. Per questo motivo essi sono dotati anche di momento di dipolo magnetico (orbitale e intrinseco). Il momento intrinseco (vedi la (3.59)) vale in questo caso: μN p (3.70) μS = g p S ħ dove abbiamo sostituito il magnetone di Bohr μ B = eħ/2m con il magnetone nucleare μ N = eħ/2M dove M e` la massa del protone. Il magnetone nucleare risulta essere allora circa 1800 volte più piccolo di quello di Bohr. Il fattore g p , chiamato fattore di Landé, vale circa 5.59 unità da confrontarsi con il valore gs = 2 per l’elettrone. I neutroni, d’altro canto, non essendo forniti di carica elettrica non dovrebbero avere momento di dipolo magnetico. In realtà, i neutroni risultano essere dotati anch’essi di spin e acquisiscono cos`ı un momento di dipolo magnetico di spin: μN (3.71) μ nS = g n S ħ ove il fattore di Landé del neutrone vale g n = −3.83 unità. 101

Capitolo 3


Figura 3.9: immagine di una sezione di un cervello umano, prodotta tramite TAC. Per gentile concessione di http://www.Imaginis.com.

Il motivo per cui il neutrone e` dotato di momento di dipolo magnetico, anche se elettricamente neutro, sta nel fatto che il neutrone (come il protone) e` una particella composta da tre quark dotati di carica elettrica. I momenti di dipolo magnetico nucleari sono formati dai momenti angolari orbitali e di spin di tutti i protoni e neutroni che compongono il nucleo. In ogni caso, poiché il magnetone nucleare e` circa 1800 volte più piccolo di quello di Bohr, il nucleo assume momenti di dipolo magnetico che sono tre ordini di grandezza più piccoli di quelli atomici. Di conseguenza, per l’allineamento dei dipoli magnetici nucleari c’è bisogno di campi magnetici molto più intensi.

3.4 Applicazioni Un esempio di applicazione di quanto studiato in questo capitolo e` dato dai dispositivi chiamati SQUID che sono dei misuratori di campo magnetico 102

Applicazioni

Capitolo 3

estremamente sensibili e che sfruttano le proprietà dell’effetto tunnel e la superconduttività. Tali dispositivi saranno però discussi nel capitolo 4. Un’altra applicazione estremamente rilevante nella pratica medica e` quella della visualizzazione di organi interni tramite risonanza magnetica.

3.4.1

Risonanza magnetica (nucleare)

La risonanza magnetica e` una tecnica usata nella diagnostica medica per visualizzare la struttura interna del corpo umano, attraverso la produzione di immagini dettagliate di una qualsiasi sezione della struttura in esame. Questa tecnica sfrutta il fenomeno della risonanza magnetica nucleare, ma nonostante il termine “nucleare” e diversamente dalle tecniche diagnostiche basate su raggi X come la TAC11 , non ha niente a che fare con le radiazioni ionizzanti e, quindi, non e` né invasiva né potenzialmente dannosa. Rispetto alla TAC la risonanza magnetica ha anche maggiore contrasto nella visualizzazione di tessuti molli tipo il cervello, come mostrato nelle figure 3.9 e 3.10. L’uso della risonanza magnetica si e` diffuso nella pratica diagnostica anche grazie all’eliminazione, dal nome originale, dell’aggettivo “nucleare”. In questo modo si sono ridotte eventuali apprensioni da parte dei soggetti in esame evitando associazioni negative (e non giustificate) con la radioattività e le radiazioni ionizzanti. Vediamo ora in che cosa consiste il fenomeno della risonanza magnetica. I nuclei degli atomi che compongono il corpo in esame, e soprattutto i nuclei di idrogeno presenti nell’acqua che e` contenuta in tutti i tessuti del corpo umano, vengono orientati grazie a un campo magnetico molto intenso e uniforme. I nuclei sono, infatti, composti da protoni e neutroni ciascuno dei qua11

La TAC, o Tomografia Assiale Computerizzata, usa dei raggi X per acquisire delle immagini secondo direzioni diverse. Queste immagini vengono poi rielaborate al computer per ottenere delle rappresentazioni tridimensionali di sezioni del corpo in esame. Rispetto alla risonanza magnetica questa tecnica e` più diffusa, più veloce e molto meno costosa.

103

Capitolo 3


li e` dotato di un momento di dipolo magnetico che si allinea con il campo magnetico applicato a causa della coppia τ = μ × B. Oltre al campo magnetico uniforme vengono applicati dei campi magnetici, oscillanti a frequenze radio (ν ∼ 10 ÷ 100 MHz), che hanno la frequenza giusta per avere un assorbimento risonante e modificare l’allineamento dei dipoli presenti nei nuclei di idrogeno. Quando il dipolo torna all’allineamento originario lo fa producendo un campo magnetico oscillante che può essere rivelato come una piccola corrente su una bobina dell’apparecchiatura ricevente. Il segnale viene raccolto ed elaborato per produrre un’immagine delle zone che hanno risposto di più o di meno, a indicazione della maggiore o minore concentrazione di nuclei di idrogeno. Le proprietà del segnale dipendono anche della natura del tessuto perché protoni presenti in tessuti diversi (ad esempio, muscolo o grasso) si riallineano con tempi diversi. L’utilizzo di altri tre campi magnetici, aventi orientazioni spaziali mutuamente ortogonali e con intensità variabile con la distanza, consente di ottenere le condizioni di risonanza in qualsiasi piano e, quindi, di ottenere una visualizzazione secondo qualsiasi sezione del corpo in esame, in orientamento e profondità. Si e` già detto che questa tecnica non ha alcuna controindicazione medica. L’unico problema e` il costo elevato del’apparecchiatura dovuto soprattutto alla necessità di produrre un campo magnetico molto intenso (dell’ordine di 1 tesla) ed estremamente uniforme. Per fare ciò si ricorre in genere a magneti superconduttori (vedi capitolo 4) che sono estremamente costosi. Il costo totale di un’apparecchiatura per la risonanza magnetica si aggira, infatti, sul milione di euro. L’importanza di questa tecnica e` stata riconosciuta con l’attribuzione nel 2003 del Premio Nobel per la Medicina a due scienziati (Lauterbur e Mansfield12 ) per le loro scoperte a riguardo della visualizzazione con risonanza magnetica. 12

Paul C. Lauterbur (1929-2007), chimico statunitense, e Peter Mansfield (1933-), fisico britannico.

104


Capitolo 3

Figura 3.10: immagine di una sezione di un cervello umano, prodotta tramite risonanza nucleare. Per gentile concessione di The whole brain Atlas vedi http://www.med.harvard.edu/AANLIB/.

3.5 Quesiti di riepilogo 1. Se una corpo e` soggetto a un potenziale U = U(x) che non dipende dal tempo, può dipendere dal tempo il valore medio della sua coordinata x? (Si consideri come valore medio il valore di aspettazione ⟨x⟩ e xop = x). 2. In una buca di potenziale infinita il valore minimo dell’energia può essere nullo? 3. Cosa si può inferire dal principio di indeterminazione a proposito dell’energia minima per un corpo in una buca di potenziale infinita? 4. Guardando alle densità di probabilità delle figure 3.5 e 3.6, cosa si può dire sul valore medio atteso per la coordinata x di un corpo in una buca di potenziale finita o infinita? 5. Perché per una buca di potenziale finita (con E < U0 ) c’è un numero finito di autofunzioni possibili?

105

Capitolo 3


6. Se nel caso dell’esperimento di Stern-Gerlach con l’argento si sono osservate 2 fasce discrete, cosa si può concludere sul numero quantico orbitale ℓ di tale atomo?

3.6 Esercizi 1. Ricavare, nel caso di una buca di potenziale infinita, il valore di aspettazione della coordinata di una particella, partendo dalla definizione (3.9) che in una dimensione diventerebbe ⟨x⟩ = ∫ ψ∗ xop ψdx e usando xop = x. 2. Ricavare, nel caso di una buca di potenziale infinita, il valore di aspettazione della componente della quantità di moto di una particella, usando pop = (ħ/i)d/dx = (−iħ)d/dx. 3. Verificare che, nel caso di una buca di potenziale finita, le soluzioni generali (3.33) e (3.34) soddisfano l’equazione di Schrödinger stazionaria corrispondente alle regioni fuori della buca. 4. Verificare che, nel caso di una buca di potenziale finita, la soluzione generale (3.32) soddisfa l’equazione di Schrödinger stazionaria corrispondente alla regione dentro la buca. 5. Si consideri un elettrone confinato in un atomo come una particella in una ˚ Calcolare, buca di potenziale infinita, in cui ℓ/2 e` pari al raggio tipico 1 A. secondo questa approssimazione, l’energia di punto zero. 6. Si consideri un atomo con momento di dipolo magnetico pari a 1 magnetone di Bohr. Supponendo che il dipolo sia allineato parallelamente a un campo magnetico esterno B di 0.5 tesla, che energia bisognerebbe fornire per ruotare di 180○ il dipolo?

106

Parte II Proprietà elettriche, magnetiche, ottiche e termiche Una spiegazione, abbastanza soddisfacente, dei fenomeni di natura elettrica, magnetica, ottica o termica si può ottenere facendo ricorso a una trattazione atomistica classica. Ci sono però, come vedremo nel seguito, alcuni fenomeni incomprensibili secondo la fisica classica che possono essere interpretati solo ricorrendo alla meccanica quantistica, partendo dalla natura ondulatoria dell’elettrone e sfruttando il principio di esclusione di Pauli. La trattazione degli elettroni liberi entro un metallo richiede, ad esempio, l’introduzione della distribuzione di Fermi-Dirac per giustificare come gli elettroni vadano a occupare i livelli energetici possibili. I livelli energetici si trasformano poi in bande energetiche sulla base delle quali risulta facilmente comprensibile la distinzione tra materiali conduttori, isolanti e l’estremamente interessante classe dei semiconduttori. E` soprattutto grazie a questi ultimi che nella seconda metà del secolo scorso si e` assistito alla rivoluzione della microelettronica con tutte le sue ricadute tecnologiche e scientifiche. Infatti, con l’eccezione di alcuni oggetti semplici, sostanzialmente tutte le apparecchiature elettroniche che rappresentano il cuore di innumerevoli dispositivi sono basate sull’utilizzo di semiconduttori. La tecnologia moderna non può fare a meno di ricorrere a materiali magnetici e alle loro proprietà distintive. Esempi comuni in questo senso sono rappresentati da motori, generatori, trasformatori, supporti magnetici per computer (nastri e dischi), altoparlanti, microfoni e quant’altro. Nei capitoli

dedicati a questi temi vedremo che ci sono almeno cinque tipi di magnetismo: diamagnetismo, paramagnetismo, ferromagnetismo, antiferromagnetismo e ferrimagnetismo, che si realizzano con modalità differenti in materiali diversi. La meccanica quantistica risulterà ancora indispensabile per giustificare tali differenze e prevedere la risposta di tali materiali all’applicazione di un campo magnetico esterno. La materia solida ha delle proprietà ottiche particolari: alcuni solidi sono trasparenti e altri opachi rispetto alle radiazioni elettromagnetiche; inoltre alcuni tipi di superficie risultano estremamente riflettenti, mentre altri tendono ad assorbire fortemente la radiazione incidente. I metalli si distinguono poi per la loro lucentezza caratteristica. Tutti questi effetti dipendono non solo dalla natura del materiale ma, come si vedrà, anche dalla frequenza della radiazione elettromagnetica incidente e si possono caratterizzare in termini di pochi parametri quali riflettività, assorbimento e trasmissività. Sia nel caso delle proprietà elettriche sia in quello delle proprietà magnetiche e ottiche, la maggior parte dei fenomeni e` riconducibile alle proprietà fisiche degli elettroni e, quindi, ci sono considerazioni ed elementi comuni alle discussioni sui tre tipi di proprietà. In tutti e tre i casi risulta comunque fondamentale una trattazione secondo i principi della meccanica quantistica proprio perché l’elettrone e` un oggetto quantistico. All’inizio del XIX secolo gli atomi di un reticolo cristallino venivano considerati come degli oscillatori e con questo modello classico semplice si era ricavata una legge secondo la quale tutte le sostanze dovevano assorbire la stessa quantità di calore per aumentare di un grado la temperatura di una mole di sostanza. Ciò si verifica sperimentalmente per alcune sostanze, ma non per tutte. Questa importante discrepanza restò insoluta fino all’avvento nel XX secolo della fisica quantistica, che riusc`ı invece a dare un’interpretazione soddisfacente introducendo, a fianco degli elettroni, degli altri oggetti quantistici chiamati fononi. La maggior parte del testo e` dedicata allo stato solido; cos`ı per completare almeno parzialmente la descrizione delle proprietà fisiche fondamentali della materia viene trattata, per ultima e in modo conciso, una fase di aggre-

108

gazione della materia diverse da quella solida, cioè quella di cristallo liquido. Una tale fase si differenzia dagli stati principali della materia, cioè lo stato aeriforme, liquido o solido, per delle peculiarità interessanti. A riguardo discuteremo soprattutto le proprietà ottiche che vengono sfruttate per applicazioni di estremo interesse.

109

Capitolo 4 La conduzione elettrica nei metalli La corrente elettrica e` definita come un flusso netto di carica elettrica attraverso una qualsiasi sezione del corpo in esame. L’entità di tale corrente e` legata sia alla differenza di potenziale applicata agli estremi del corpo sia alla conducibilità elettrica del corpo, cioè alla sua proprietà di lasciarsi attraversare dalla carica elettrica. Dal punto di vista della conduzione elettrica i materiali si dividono, in modo grossolano, tra quelli conduttori, nei quali la corrente elettrica fluisce con una certa facilità, e quelli isolanti, che si oppongono invece al passaggio della corrente. Introducendo il concetto di resistività come caratteristica intrinseca che descrive quanto un corpo si oppone al passaggio di corrente, si definiscono come isolanti i materiali aventi resistività più grande di circa 1014 Ω ⋅ m. I materiali conduttori hanno, invece, una resistività molto più piccola, tipicamente attorno a 10−8 Ω ⋅ m. A queste due classi estreme si aggiungono i materiali detti semiconduttori, aventi resistività tipicamente1 superiore a 10−2 Ω ⋅ m, e i semi-metalli (tra cui arsenico, selenio e antimonio) che hanno resistività attorno a 30 × 10−8 Ω ⋅ m. In questo capitolo verranno discusse le proprietà elettriche dei materiali conduttori e specificamente dei metalli, con particolare riferimento alla conduzione di corrente elettrica. Per quanto riguarda la conduzione si osserva sperimentalmente che la corrente elettrica che attraversa un conduttore e` direttamente proporzionale alla differenza di potenziale V applicata ai capi del 1

Questi sono valori di resistività tipici per semiconduttori puri. La resistività cambia però drasticamente a seconda della purezza del materiale e della sua temperatura.

Capitolo 4

La conduzione elettrica nei metalli

conduttore stesso. Tale comportamento viene descritto dalla legge di Ohm: i=

V R

(4.1)

dove la resistenza R e` un parametro caratteristico del corpo conduttore, funzione2 della resistività del mezzo. Valori di resistività, valutati a temperatura ambiente per alcuni metalli comuni3 , sono riportati in tabella 4.1 e abbracciano due ordini di grandezza. La fisica classica, e i modelli che a essa fanno riferimento, erano stati in grado di fornire, ad esempio, un’espressione per la resistività di un metallo che spiegava la legge sperimentale di Ohm. La teoria classica non e` però stata capace di spingersi oltre e spiegare perché due solidi cristallini composti da materiale diverso siano uno conduttore e l’altro isolante. Resta da spiegare anche perché due metalli, quali ad esempio il rame e il ferro, abbiano conducibilità parecchio diversa. Per rispondere a queste e ad altre domande e` necessario ricorrere alla meccanica quantistica, introdotta nella prima parte di questo testo. Prima di fare ciò, passiamo in rassegna le caratteristiche distintive di diverse categorie di solidi e riassumiamo il modello di conduzione classico.

4.1 Classificazione dei solidi Per comprendere le proprietà di conduzione di un corpo solido e` bene cominciare considerando i diversi tipi di solido presenti in natura. Queste diverse categorie dipendono sostanzialmente dalla struttura del solido stesso e dal tipo di forze e legami che tengono assieme le molecole. La caratteristica distintiva delle sostanze allo stato gassoso e` che le distanze tra molecole sono molto grandi rispetto alle dimensioni stesse delle molecole. Di conseguenza le forze di natura elettrica tra le molecole, diminuendo 2

Ricordiamo che per un conduttore omogeneo di sezione A e lunghezza L la resistenza vale R = ρL/A. 3 Per confronto forniamo i valori di resistività di alcuni isolanti (in Ω ⋅ m): 1017 per la paraffina, 7.5 × 1017 per il quarzo fuso, 1020 per il polietilene e 1022 − 1024 per il teflon. 112

Classificazione dei solidi

METALLO Ag Cu Au Al W Fe Pt Pb Ti Hg

ρ (×10−8 Ω ⋅ m) 1.6 1.7 2.4 2.7 5.6 9.7 10.6 22 42 98

Capitolo 4

α (1/○ C) 0.0061 0.0068 0.0034 0.0043 0.0045 0.0065 0.0039 0.0039 0.0009

Tabella 4.1: resistività e coefficiente di temperatura per alcuni metalli, valutati a temperatura ambiente.

esse all’aumentare della distanza, risultano essere molto deboli e per questo motivo le molecole si possono considerare isolate l’una rispetto all’altra. A valori di temperatura e pressione ordinari (cioè simili ai valori ambiente) molte sostanze appaiono allo stato solido e in questo caso gli atomi e le molecole non possono più essere considerati come isolati. La distanza tra atomi e molecole viene a essere dello stesso ordine di grandezza della loro dimensione e allo stesso tempo le forze intermolecolari risultano avere intensità simile a quella delle forze che legano gli atomi a formare le molecole. Ne segue che le proprietà di una molecola vengono influenzate fortemente dalla presenza delle molecole vicine e bisogna, quindi, esaminare il sistema nel suo complesso, considerandone la struttura. Per una certa classe di solidi, chiamati solidi cristallini, le molecole o gli atomi si dispongono nello spazio in un modo regolare, secondo un modello ripetuto, a formare quella struttura, complessa ma dotata di una certa regolarità, chiamata reticolo cristallino. Esistono, invece, altri tipi di solidi, chiamati solidi amorfi, in cui la regolarità del modello può valere nei dintorni di una

113

Capitolo 4


qualsiasi molecola ma non si estende a tutto il solido. Non essendo caratterizzati da alcuna regolarità macroscopica, le proprietà dei solidi amorfi sono più difficili da generalizzare. Per questo motivo, nel seguito, faremo riferimento solo ai solidi cristallini. I solidi cristallini vengono classificati, a seconda del tipo di legame dominante che li tiene assieme, in: − Solidi molecolari, per i quali gli elettroni nelle molecole sono tutti accoppiati cosicché non si possono formare legami covalenti tra atomi appartenenti a molecole diverse. Le molecole sono cos`ı stabili che mantengono la loro individualità anche quando sono vicine ad altre molecole e solo la debole forza di van der Waals lega tra di loro molecole vicine. Tale forza trae origine dai dipoli elettrici che si formano in ciascuna molecola a causa di fluttuazioni quantomeccaniche degli orbitali atomici. Questi dipoli inducono a loro volta dipoli elettrici nelle molecole vicine risultando in una debole forza attrattiva con energie di legame dell’ordine di 10−2 eV. Nel complesso non ci sono elettroni liberi e tale assenza rende questi solidi molto poco conduttori sia di elettricità sia di calore. Composti organici, gas inerti e gas ordinari formano solidi molecolari a temperature molto basse. − Solidi ionici, costituiti da un’alternanza regolare e tridimensionale di ioni positivi e negativi, disposti come tante sfere impaccate l’una contro l’altra. L’attrazione elettrostatica netta che si esercita tra tali ioni e` intensa e rende la struttura particolarmente stabile. In questi solidi non ci sono elettroni liberi e risultano, quindi, essere scarsi conduttori di elettricità o calore. Un esempio di solido ionico e` rappresentato dal cloruro di sodio. − Solidi covalenti, dove sono i legami covalenti, in cui elettroni di valenza vengono condivisi, a tenere assieme le molecole. Anche in questo caso non ci sono elettroni liberi, quindi, il solido non e` un buon conduttore né per l’elettricità né per il calore. − Solidi metallici, infine, nei quali gli elettroni sono condivisi da tutti gli ioni del solido. Gli elettroni dei livelli più esterni possono essere debolmente legati e si muovono con una certa libertà all’interno del cristallo. Il metallo appare allora come un reticolo cristallino di ioni positivi entro il quale si

114

Il modello di conduzione classico

Capitolo 4

muovono gli elettroni, quasi liberi, come se fossero molecole di un gas. Per questo motivo i solidi metallici sono ottimi conduttori sia di elettricità che di calore. La classificazione qui presentata e` chiaramente una semplificazione: esistono solidi in cui la struttura cristallina non e` regolare a causa della presenza di imperfezioni oppure in cui non c’è un unico tipo di legame tra le molecole. Queste deviazioni dalla classificazione ideale possono produrre comportamenti peculiari dal punto di vista della conduzione elettrica e richiederebbero una trattazione specifica. La classe di solidi che ci interessa studiare in questo capitolo e` quella dei metalli per i quali si può costruire una teoria generale della conduzione a partire dalla meccanica quantistica.

4.2 Il modello di conduzione classico All’interno di un metallo gli elettroni di conduzione possono essere assimilati agli atomi in un gas classico, come proposto inizialmente da Drude4 e poco dopo da Lorentz5 . L’idea e` che gli elettroni di conduzione si muovano liberi tra una collisione e l’altra, dove le collisioni non avvengono con altri elettroni, ma con gli ioni del reticolo. Con un tale modello si può ricavare un’espressione per la resistività di un metallo che e` in accordo con la legge di Ohm. In assenza di un campo elettrico esterno applicato al conduttore gli elettroni risultano essere in moto con velocità dirette in modo arbitrario, come mostrato in figura 4.1. Gli elettroni collidono con gli ioni del cristallo e mutano a ogni urto la loro direzione in modo casuale poiché la posizione dello ione all’interno della struttura cristallina oscilla rispetto alla posizione di 4

Paul Drude (1863-1906), fisico tedesco, propose la sua teoria sugli elettroni liberi nel 1900. 5 Hendrick A. Lorentz (1853-1928), fisico olandese, propose la sua teoria sugli elettroni nel 1909. Vincitore del Premio Nobel per la Fisica nel 1902 assieme al fisico olandese Pieter Zeeman (1865-1943) per la scoperta della separazione delle righe spettrali in presenza di campo magnetico (il cosiddetto effetto Zeeman). 115

Capitolo 4


equilibrio a causa della sua agitazione termica. Dopo un certo numero di urti l’elettrone si troverà in una posizione che non dista molto da quella di partenza. Inoltre, data l’arbitrarietà delle direzioni delle velocità di elettroni indipendenti, il flusso netto di carica attraverso una qualsiasi sezione del conduttore risulta essere nullo e nulla e`, quindi, la corrente elettrica. Si definisce cammino libero medio λ la distanza mediamente percorsa da un elettrone tra un urto e il successivo. Tale distanza dipende sia dalla velocità degli elettroni sia dai dettagli della struttura cristallina. Considerando il moto di agitazione termica degli elettroni, moto che avviene con una velocità istantanea media v i , tra un urto e il successivo intercorre un intervallo di tempo medio τ = λ/v i . L’applicazione di un campo elettrico esterno fa s`ı che il moto casuale che ciascun elettrone segue dopo un urto venga modificato privilegiando una direzione rispetto ad altre. Conseguentemente tutti gli elettroni di conduzione tendono, in media, a spostarsi (derivare) nella direzione opposta al campo elettrico, come evidenziato in figura 4.1. L’effetto degli urti e` quello di impedire un’accelerazione continua degli elettroni anche se essi sono soggetti a una forza costante. Dopo ciascun urto e` come se la velocità degli elettroni ripartisse da zero e l’effetto complessivo e` quello di spostare il punto di arrivo, dopo un certo intervallo di tempo e un certo numero di urti, nella direzione opposta a quella del campo elettrico applicato. Al moto casuale, di origine termica, si sovrappone cos`ı un moto di origine elettrica detto di deriva. Tale movimento avviene con una velocità media vd , detta velocità di deriva, che assume valori dell’ordine del decimo di millimetro al secondo, molto più piccoli della velocità v i del moto casuale che e` dell’ordine di 106 m/s. Il campo elettrico E esercita una forza F = −eE che si traduce in una accelerazione avente modulo a = eE/m. Subito dopo un urto tra elettrone e ione l’elettrone riparte con velocità nulla e direzione arbitraria e l’accelerazione a nel tempo medio τ cambia la velocità della quantità aτ, che e` proprio la velocità di deriva: aλ eE λ = (4.2) vd = aτ = vi m vi 116

Il modello di conduzione classico

Capitolo 4

E⃗

A

B − B’ e

Figura 4.1: rappresentazione del moto casuale degli elettroni all’interno del reticolo cristallino di un metallo, prima e dopo (linee tratteggiate) l’applicazione di un campo elettrico. Il moto di deriva totale e` stato esagerato rispetto al cammino degli elettroni tra un urto e l’altro.

La velocità di deriva e` legata all’intensità i della corrente nel conduttore attraverso l’introduzione di una densità di corrente j definita come la corrente che attraversa l’unità di superficie. Il legame tra queste quantità risulta essere allora: j (4.3) vd = ne dove n e` il numero di elettroni liberi presenti nell’unità di volume. Mettendo assieme le due equazioni (4.2) e (4.3) e ricordando che la legge di Ohm e` esprimibile anche come ρ = E/ j, si ottiene la seguente espressione: ρ=

m ne 2 τ

(4.4)

che dipende da alcune costanti universali, quali la massa m dell’elettrone e la sua carica elementare e, cos`ı come da proprietà del metallo, cioè la densità di elettroni n e il tempo medio tra collisioni τ. Si vede, quindi, che la resistività viene a essere indipendente dalla differenza di potenziale applicata, come osservato nel caso dei materiali ohmici quali, appunto, i metalli. Osserviamo che la resistività dipende dalla temperatura del conduttore perché da essa dipende il tempo τ = λ/v i . Infatti, all’aumentare della tempe117

Capitolo 4


ratura aumenta il moto di agitazione termica e, quindi, aumenta v i . Di conseguenza diminuisce τ, aumenta ρ e perciò dρ/dT > 0. Sperimentalmente si osserva che la dipendenza esplicita dalla temperatura segue un andamento lineare ed e` descritta dalla formula: ρ = ρ0 [1 + α(T − T0 )]

(T in ○ C)

(4.5)

dove T0 e` una temperatura di riferimento (generalmente T0 = 20 ○ C) a cui viene valutata la resistività standard ρ0 e α e` il coefficiente di temperatura. Nei materiali puri questa formula viene seguita accuratamente per temperature comprese tra qualche decina di gradi kelvin e la temperatura di fusione del metallo. Tale linearità di comportamento può essere usata, ad esempio, per costruire un termometro estremamente preciso. A temperature più basse di qualche decina di gradi kelvin la linearità viene persa e la resistività assume un valore minimo maggiore di 06 . Esempi di valori per α sono riportati in tabella 4.1. Talvolta si preferisce fare riferimento alla conducibilità σ che viene definita come il reciproco della resistività: σ≡

1 ne 2 τ = ρ m

(4.6)

Si vede allora che la conducibilità e` proporzionale alla concentrazione7 n di elettroni liberi. Per un buon conduttore il valore di n e` molto grande (dell’ordine di 1028 elettroni per metro cubo), per un isolante e` molto piccolo (n ∼ 107 e/m3 ), mentre per un semiconduttore n assume un valore intermedio, valendo ad esempio 1.5 × 1016 e/m3 per il silicio a temperatura ambiente. 6

La resistività può infatti, secondo la cosiddetta regola di Matthiesen, essere suddivisa in due termini: una resistività ideale, che dipende dalle vibrazioni termiche degli atomi e che cresce quasi linearmente con la temperatura, più una resistività residua dovuta a impurità e difetti, essenzialmente indipendente dalla temperatura. 7 La concentrazione n per un metallo monovalente si può ottenere da n = N A δ/M dove N A e` il numero di Avogadro (6.02 × 1023 mol−1 ), δ e` la densità (espressa in g/cm3 ) e M la massa molare dell’elemento (pari alla massa atomica espressa in grammi). 118

Verso un modello quantistico

Capitolo 4

Si usa poi definire la mobilità μ degli elettroni come il valore medio della velocità di deriva corrispondente ad un campo elettrico unitario, cioè: μ=

1 eτ vd j/ne = = = E ρj neρ m

(4.7)

e, quindi, il legame tra mobilità e conducibilità e` dato da: σ = ne μ

(4.8)

Riassumendo, il modello classico di Drude-Lorentz giustifica la legge di Ohm, fornisce cioè una resistività indipendente da i e da V. Tale modello non e` però in grado di spiegare tre fatti fondamentali: 1) Perché un materiale sia conduttore e un altro no. 2) L’enorme differenza tra i valori di resistività dei solidi. Si passa, infatti, da valori dell’ordine di 10−8 Ω ⋅ m per metalli puri, fino a circa 1020 Ω ⋅ m per buoni isolanti. 3) L’esistenza di materiali (i semiconduttori) che hanno un comportamento intermedio tra quello dei conduttori e degli isolanti e in cui la resistività cambia anche drasticamente con la temperatura. Per dare una risposta a questi quesiti e` stato indispensabile ricorrere ai principi della meccanica quantistica.

4.3 Verso un modello quantistico Cos`ı come fatto nel modello classico usato per la conduzione, continuiamo a usare un modello a gas di elettroni per rappresentare gli elettroni nel metallo, descrivendo però il sistema secondo i dettami della meccanica quantistica. All’interno del reticolo cristallino ciascun elettrone di conduzione andrà descritto da una funzione d’onda stazionaria, cioè indipendente dal tempo ψ(r), che e` funzione del vettore posizione r. Siccome l’elettrone si troverà da qualche parte all’interno del metallo, ma sicuramente non al di fuori di esso, la densità di probabilità ψ∗ ψ deve essere nulla al di fuori del metallo e sulla sua superficie. L’elettrone si viene a trovare in una specie di buca di 119


D(E) (1028/m3 · eV)

Capitolo 4

5 4 3 2 1 0

0

3

6

9

12

Energia (eV) Figura 4.2: densità degli stati elettronici in funzione dell’energia.

potenziale e andando a risolvere l’equazione di Schrödinger per l’elettrone e imponendo le condizioni al contorno suddette si ottiene come conseguenza che l’elettrone può assumere solo certi valori discreti della sua energia totale E. Il numero enorme di elettroni presenti in un volumetto finito di metallo fa s`ı che i possibili livelli discreti di energia siano estremamente vicini, dato il grande numero di onde stazionarie che possono soddisfare le condizioni al contorno. Questi livelli sono molto vicini, ma non coincidenti, cioè non degeneri, altrimenti si andrebbe contro il principio di esclusione di Pauli8 . Per poter trattare il numero degli elettroni nei livelli possibili si ricorre a un approccio statistico, introducendo la densità di stati D(E) definita come il numero di stati per unità di volume aventi energia compresa tra E e E + dE, diviso per l’incremento energetico. Assumendo che gli elettroni di condu8

Wolfgang Pauli (1908-1958), fisico austriaco vincitore del Premio Nobel per la Fisica nel 1945, per la sua scoperta del principio di esclusione. Il principio di esclusione da lui elaborato prescrive che non ci possano essere più di due elettroni in un certo stato quantico. Di conseguenza in un certo livello energetico quantizzato possono starci al più due elettroni con spin opposto.

120


Capitolo 4

E

k 0 Figura 4.3: energia di un elettrone libero in funzione del suo numero d’onda k.

zione si comportino come in un gas, ed estendendo a tre dimensioni quanto imparato per i valori di energia per una buca di potenziale infinita, si ricava che la densità di stati vale: √ 3 8 2πm 2 √ E (4.9) D(E) = h3 dove m e` la massa dell’elettrone. Questa densità di stati, il cui andamento in funzione dell’energia e` riportato in figura 4.2, dipende solo da quante onde stazionarie sono possibili nell’unità di volume ed e`, quindi, una quantità puramente geometrica che non dipende dal tipo di materiale che compone il solido. Nell’esempio 1, trattato più avanti, viene calcolato il numero di stati possibili presente in un volumetto di un centimetro cubo e si vedrà che si tratta di un numero enorme. Alla luce del dualismo onda-corpuscolo sarà conveniente fare riferimento al numero d’onda k, ricordando che p = ħk. Se si esprime l’energia di un elettrone libero in funzione di k si ottiene allora: E=

ħ2 2 p2 = k 2m 2m

(4.10)

cioè si ottiene un dipendenza parabolica per E(k), come mostrato in figura 4.3.

121

Capitolo 4

4.3.1


Stati permessi

La densità di stati elettronici, descritta in figura 4.2, sembrerebbe corrispondere a un numero totale di elettroni infinito, cos`ı come infinita e` l’area che sottende la curva. In realtà ciò non avviene perché non tutti gli stati possibili vengono effettivamente riempiti da un elettrone. Consideriamo un campione di metallo di volume unitario alla temperatura pari allo zero assoluto. Il campione in questione ha un certo numero di elettroni e questi elettroni riempiono i livelli energetici permessi, partendo dal basso, senza avere più di due elettroni in ciascun livello. Supponendo allora che gli elettroni abbiano una certa energia massima Emax , i livelli energetici con E < Emax saranno riempiti, mentre quelli con E > Emax saranno necessariamente vuoti. Ragionando in termini probabilistici, nel primo caso i livelli hanno probabilità p = 1 (cioè certezza) di essere occupati, mentre nel secondo caso la probabilità di essere occupati vale p = 0. Si definisce allora una funzione di probabilità p(E), funzione dell’energia, che e` descritta da una cosiddetta funzione a gradino (vedi figura 4.4): p(E) = 1 per E < EF p(E) = 0 per E > EF

(4.11)

L’energia EF , corrispondente al livello riempito più energetico, si chiama energia di Fermi9 e dipende dal metallo in questione. In tabella 4.2 sono riportate le energie di Fermi per alcuni tra i metalli più comuni; si tratta di valori dell’ordine di qualche elettron-volt. A differenza della densità D(E), la probabilità p(E) dipende dalla natura del materiale perché da esso dipende il valore di EF . Avendo definito sia la densità di stati sia la probabilità di occupare un certo stato energetico, la densità di stati occupati vale: N(E) ≡ D(E)p(E) 9

(4.12)

Enrico Fermi (1901-1954), fisico italiano vincitore del Premio Nobel per la Fisica nel 1938 per la scoperta di reazioni nucleari indotte da neutroni lenti.

122


Capitolo 4

p(E) EF 1

0.5

0

0 1 2 3 4 5 6 7 8 9 10 11 12 13 14

Energia (eV)

Figura 4.4: probabilità di occupazione allo zero assoluto. Questa figura si riferisce al rame.

e segue il comportamento mostrato in figura 4.5. Se andiamo a integrare la funzione N(E) tra E = 0 e E = EF otteniamo il numero totale di stati occupati nocc in un volume unitario che, come si vede nell’esempio 2, risulta essere un numero enorme. Tale numero deve essere uguale alla densità n degli elettroni di conduzione e si ottiene cos`ı un’espressione che lega n a EF , che può essere invertita per ottenere EF . Infatti: n = nocc = ∫ 0

EF

N(E)dE = ∫ 0

EF

D(E)p(E)dE

(4.13)

che diventa10

√ √ 3 3 EF √ 8 2πm 2 8 2πm 2 2 32 n= EdE = ⋅ EF ∫0 h3 h3 3

(4.14)

dalla quale si può ricavare l’energia di Fermi: 2

h 2 3n 3 ( ) EF = 8m π

(4.15) 3

Ai fini del calcolo numerico, possiamo scrivere n = (4.53×1027 )×EF2 dove EF va espresso in eV. 10

123


N(E ) (1028 /m3 ⋅ eV)

Capitolo 4

EF

3 2 1 0

0

2

4

6

8 10 12

Energia (eV)

Figura 4.5: densità di stati occupati allo zero assoluto. L’area ombreggiata rappresenta il numero di stati occupati nell’unità di volume. Questa figura si riferisce al rame.

E` sufficiente allora conoscere la densità di elettroni di conduzione n per ricavare la energia di Fermi e viceversa. Nell’esempio 3 andremo a calcolare il valore dell’energia di Fermi per alcuni metalli, note le loro densità n. Nell’esempio 4 calcoleremo, invece, il valore dell’energia media degli elettroni di conduzione. Si noti che si e` assunto che il corpo sia allo zero assoluto e, nonostante ciò, l’energia media degli elettroni non e` nulla, contrariamente a quanto si potrebbe ingenuamente immaginare. Infatti, allo zero assoluto viene meno il moto di agitazione termica, ma ci deve essere comunque un’energia non nulla perché gli elettroni non possono trovarsi tutti nello stesso stato energetico (E = 0 ad esempio), come richiesto dal principio di esclusione di Pauli. Fino a qui abbiamo considerato le distribuzioni previste alla temperatura dello zero assoluto, andiamo ora a considerare cosa cambia in funzione della temperatura. Aumentando la temperatura la densità di stati D(E) non cambia, essendo una grandezza che dipende solo dalla geometria. La probabilità di occupazione p(E) subisce invece un lieve, ma significativo cambiamento, come rappresentato in figura 4.6. Quello che succede e` che non tutti gli stati occu124


ELEMENTO EF (eV) v F (×106 m/s) Li 4.74 1.29 Be 14.3 2.25 Na 3.24 1.07 Mg 7.08 1.58 Al 11.7 2.03 K 2.12 0.86 Mn 10.9 1.96 Fe 11.1 1.98 Cu 7.00 1.57 Zn 9.47 1.83 Ga 10.4 1.92 Ag 5.49 1.39 Sn 10.2 1.90 Cs 1.59 0.75 Pt 8.8 1.76 Au 5.53 1.40 Pb 9.47 1.83

Capitolo 4

TF (×104 K) 5.51 16.6 3.77 8.23 13.6 2.46 12.7 13.0 8.16 11.0 12.1 6.38 11.8 1.84 10.2 6.42 11.0

Tabella 4.2: energia, velocità e temperatura di Fermi per alcuni metalli. La temperatura di √ Fermi e` definita come TF = EF /k dove k e` la costante di Boltzmann, mentre v F = 2E/m.

pati hanno energia necessariamente inferiore all’energia di Fermi11 . Alcuni stati aventi energia superiore a quella di Fermi risulteranno essere occupati, liberando altrettanti stati al di sotto di EF . Conseguenza di ciò e` che l’energia massima Emax > EF e che il valore medio, proporzionale all’integrale della distribuzione e, quindi, all’area sottostante la curva, risulta essere leggermente maggiore che nel caso relativo a T = 0. La distribuzione rappresentata in figura 4.6 è rappresentata analiticamen11

Quindi non si può più definire EF come l’energia massima.

125

Capitolo 4


p(E) EF

1 0.5 0

0 1 2 3 4 5 6 7 8 9 10 11 12 13 14

Energia (eV) Figura 4.6: probabilità di occupazione alla temperatura di 1000 K. Questa figura si riferisce al rame.

te dalla funzione: p(E) =

1 e (E−EF )/kT

+1

(4.16)

chiamata funzione di distribuzione di Fermi-Dirac, sviluppata da Fermi e da Dirac12 . Questa funzione di probabilità, valida per gli elettroni, e` tipica delle particelle chiamate fermioni13 . In questo caso14 EF non e` definito più come il valore che separa p = 1 da p = 0, ma come il valore per il quale la funzione (4.16) assume il valore 1/2. Si noti come la funzione (4.16) tenda, per T → 0, alla funzione a gradino 12

Paul A. M. Dirac (1902-1984), fisico inglese vincitore del Premio Nobel in Fisica nel 1933 assieme a Schrödinger per la sua teoria atomica. 13 I fermioni sono particelle a spin semi-intero (come l’elettrone, il protone e il neutrone) che soddisfano proprietà statistiche dette di Fermi-Dirac. Le particelle a spin intero (come il fotone) vengono invece chiamate bosoni e soddisfano proprietà statistiche differenti dette di Bose-Einstein. 14 Con questa definizione, EF viene a coincidere con la quantità μ chiamata potenziale chimico che e` funzione della temperatura. Va notato che μ(T) diventa sensibilmente diverso da EF solo per temperature molto grandi, maggiori di qualche migliaio di gradi kelvin. A rigore, nella funzione di Fermi-Dirac dovrebbe comparire il potenziale chimico e non l’energia di Fermi. 126

N(E ) (1028 /m3 ⋅ eV )


Capitolo 4

EF

3 2 1 0

0

2

4

6

8 10 12

Energia (eV) Figura 4.7: densità di stati occupati alla temperatura di 1000 K. L’area ombreggiata rappresenta il numero di stati occupati nell’unità di volume. Questa figura si riferisce al rame.

(4.11). Per T → 0 l’esponente (E − EF )/kT → ±∞ a seconda del segno di (E − EF ), quindi per E < EF l’esponenziale e (E−EF )/kT → 0 e p(E) → 1, mentre per E > EF l’esponenziale e (E−EF )/kT → ∞ e p(E) → 0. Dall’esame di (4.16) si vede che la quantità rilevante non e` tanto l’energia in sè, quanto la differenza (E −EF ) che, anche se piccola, produce una drastica variazione nella funzione p(E). Per quanto riguarda la densità di stati occupati N(E), si ottiene la distribuzione rappresentata dalla figura 4.7. Nel confronto tra la figura 4.5 e la figura 4.7 possiamo dire che un piccolo numero di elettroni di conduzione, aventi energia molto vicina a EF , e` passato da stati energetici di poco al di sotto di EF a stati energetici di poco al di sopra di EF . La stragrande maggioranza degli elettroni di conduzione e` rimasta dove si trovava perché l’energia dovuta all’agitazione termica non e` sufficiente a variarne il moto e il livello energetico.

127

Capitolo 4

4.3.2


Esempi

1. Si calcoli il numero di stati energeticamente possibili in 1 cm3 di un solido metallico, tra E = 4 e E + ΔE = 4.01 eV, e quanto distano tra di loro in energia. L’equazione (4.9) ci fornisce il valore della densità. Sostituendo i valori numerici, espressi tutti in unità del SI, si ottiene: √ 3 8 2π(9.1 × 10−31 ) 2 √ 4 × 1.6 × 10−19 D(E) = (6.63 × 10−34 )3 A causa dei valori molto grandi degli esponenti non possiamo operare con la calcolatrice come indicato, ma scriviamo piuttosto: √ 3 8 2π(9.1) 2 √ 93 19 4 × 1.6 × 10(− 2 − 2 +102) D(E) = 3 (6.63) cioè: D(E) = 8.4 × 1046 J−1 m−3 Se si vuole poi trasformare in eV, basta moltiplicare per il fattore di conversione 1.6 × 10−19 J/eV per ottenere D(E) = 1.4 × 1028 m−3 ⋅ eV−1 . Il numero di stati energeticamente possibili si ottiene moltiplicando D(E) per ΔE e per il volume: N = D(E)ΔE × (10−2 )3 = 1.4 × 1020 Tale numero enorme di livelli energetici vicini corrisponderebbe a una separazione energetica δE tra due livelli contigui pari a: δE =

0.01 ΔE = ≈ 7 × 10−23 eV N 1.4 × 1020

praticamente indistinguibile dal continuo. 2. Si calcoli il numero di stati occupati in 1 cm3 di rame, allo zero assoluto. Sostituiamo nella formula (4.14) le costanti numeriche e il valore dell’energia di Fermi per il rame, cioè 7 eV, per ottenere la densità di stati occupati √ nocc : 3 8 2π(9.1 × 10−31 ) 2 2 −19 32 (7 × 1.6 × 10 ⋅ ) nocc = (6.63 × 10−34 )3 3 128


che diventa: nocc

Capitolo 4

√ 3 3 8 2π(9.1) 2 2 (− 93 − 57 +102) 2 × 10 2 2 (7 × 1.6) = ⋅ (6.63)3 3

cioè: nocc = 8.4 × 1028 m−3 Questo numero va moltiplicato per il volume per ottenere il numero di stati occupati nel volume in questione: Nocc = 8.4 × 1028 × (1 × 10−2 )3 = 8.4 × 1022 3. Si calcoli il valore dell’energia di Fermi per rame, argento e ferro, note le densità di elettroni di conduzione (nCu = 8.5 × 1028 m−3 , n Ag = 5.9 × 1028 m−3 , n Fe = 17.0 × 1028 m−3 ). Si confrontino i risultati con quelli della tabella 4.2. Ricorriamo alla formula (4.15) cioè: 2 (6.63 × 10−34 )2 3 3 2 × ( ) n3 EF = 8 × 9.1 × 10−31 π pari a: 2 5.85 × 10−38 × n 3 Sostituendo i valori di n si ottiene EF = 1.12×10−18 , 0.89×10−18 e 1.80×10−18 J, per Cu, Ag e Fe, rispettivamente. Dividendo per il fattore di conversione 1.6 × 10−19 J/eV si ottengono i valori EF = 7.0, 5.5 e 11.2 eV, che tornano con quanto riportato in tabella 4.2. 4. Si calcoli l’energia media per gli elettroni di conduzione del rame, allo zero assoluto. L’energia media e` definita attraverso la formula: ∞ ∫0 E D(E)p(E)dE E= ∞ ∫0 D(E)p(E)dE Allo zero assoluto la funzione di probabilità p(E) e` una funzione a gradino, quindi, l’energia media diventa: EF ∫0 E D(E)dE E

F ∫0 D(E)dE

129

Capitolo 4


Sostituendo l’espressione (4.9) otteniamo: √ 3 3 E 8 2πm 2 ∫0 F E 2 dE/h 3 √ 3 1 E 8 2πm 2 ∫0 F E 2 dE/h 3 che si semplifica in: E

5

3

F 2 2 ∫0 E 2 dE 5 EF 3 EF E = EF 1 = 3 = ∫0 E 2 dE 23 EF2 5

che, nel caso del rame (EF = 7 eV), diventa E = 4.2 eV. 5. Quanto vale, a temperatura ambiente, l’intervallo δE tra il valore corrispondente a p(E) = 0.95 e p(E) = 0.05? Chiamiamo E ′ il valore dell’energia per cui p(E ′ ) = 0.95 e E ′′ quello per cui p(E ′′ ) = 0.05. Da (4.16) ricaviamo che: 1 e (E ′ −EF )/kT che diventa:

+1

= 0.95

′

0.95e (E −EF )/kT + 0.95 = 1 cioè:

′

e (E −EF )/kT =

0.05 1 = 0.95 19

che diventa: E ′ = EF − kT ln 19 = EF − 2.94kT Analogamente si ricava che: E ′′ = EF + kT ln 19 = EF + 2.94kT quindi: δE = E ′′ − E ′ = 5.9kT Alla temperatura ambiente T = 300 K l’intervallo δE vale allora 0.15 eV, cioè circa 1/50 di EF . Ciò significa che la discesa della curva di probabilità e` estremamente rapida.

130

Teoria delle bande

Capitolo 4

4.4 Teoria delle bande Si considerino inizialmente due atomi di un certo elemento metallico, posti a grande distanza tra di loro. In questo caso la funzione d’onda complessiva del sistema contiene una combinazione delle funzioni d’onda individuali, con gli stessi valori per l’energia discreta degli elettroni (i cosiddetti livelli energetici); si dice allora che i livelli sono degeneri e ci sono due tipi di funzione d’onda distinti15 che corrispondono allo stesso livello energetico. Quando gli atomi vengono avvicinati la sovrapposizione delle funzioni d’onda individuali porta a uno sdoppiamento dei livelli energetici del sistema e la separazione tra le coppie di livelli prodotti aumenta quanto più vengono avvicinati gli atomi. Se anziché avere a che fare con due atomi che vengono avvicinati, si parte da N atomi con N livelli degeneri, quando gli atomi cominciano ad avvicinarsi e le funzioni d’onda a sovrapporsi, la degenerazione tra i livelli sparisce e i livelli prima degeneri si suddividono in N sotto-livelli diversi, N/2 con energia minore e N/2 con energia maggiore. La separazione in energia tra questi sotto-livelli diminuisce all’aumentare del numero di atomi, quindi, considerando il fatto che un solido contiene tipicamente 1023 atomi per centimetro cubo, risulta chiaro che questi sotto-livelli sono cos`ı finemente separati in energia da costituire una banda di energia praticamente continua. Gli elettroni non possono avere valori di energia che stiano al di fuori di queste bande e un elettrone può solo essere “promosso” da una banda inferiore a una superiore se gli viene fornita l’energia sufficiente al salto. Per semplificare la trattazione consideriamo strutture cristalline semplici e unidimensionali. Dal punto di vista del cristallo quello che conta e` la cella unitaria e il numero di elettroni di valenza che essa contiene, cioè l’occupazione della cella. Comunque, in un reticolo uniforme e unidimensionale di atomi identici l’occupazione per cella o per atomo coincidono, essendoci un atomo per cella. Quando ci sono due elettroni di valenza, questi, avendo i due valori possibili di spin, occuperanno completamente un livello energetico e, 15

L’esistenza di due funzioni d’onda deriva dalle proprietà statistiche degli elettroni (cioè il fatto di essere fermioni) e dalla loro indistinguibilità.

131

Capitolo 4


Energia

1

2

3

N

Atomi

Figura 4.8: rappresentazione della formazione di bande energetiche all’aumentare del numero di atomi in un sistema. Nella colonna più a destra si noti che le due bande a energia maggiore sono parzialmente sovrapposte (la fascia più scura).

quindi, per N celle unitarie gli N livelli della banda saranno completamente riempiti. Come mostrato in figura 4.8 si viene a creare una situazione in cui si alternano bande permesse, corrispondenti all’insieme continuo di livelli permessi, e bande vietate dove non ci sono livelli energetici permessi. Siccome gli elettroni dei livelli energetici più bassi sono quelli più interni che risentono poco della presenza degli atomi vicini, in questo caso il numero di atomi da sovrapporre e` più piccolo e, quindi, la larghezza della banda risulta minore. Ne segue che muovendosi dai sottogusci più interni a quelli occupati più esterni le bande diventano progressivamente più estese. Le bande più basse in energia risultano essere completamente riempite e, quindi, non sono loro, in genere, a caratterizzare il comportamento elettrico del materiale. Considerando, invece, le bande di energia più elevata si nota che esse possono essere completamente distinte o parzialmente o totalmente 132

Teoria delle bande

Capitolo 4

sovrapposte. Nel caso in cui una banda non si sovrappone con altre essa viene chiamata isolata. Le bande corrispondenti agli elettroni dei sottogusci più interni di un atomo isolato sono completamente riempite per definizione. Le bande (bande di valenza) prodotte dagli elettroni di valenza, quelli dei sottogusci più esterni, possono invece essere parzialmente occupate. In questo caso l’applicazione di un campo elettrico può sollecitare gli elettroni della banda di valenza solo se ci sono bande vicine vuote o parzialmente occupate (bande di conduzione). Se tali bande non ci sono, ma tutti i livelli energetici sono occupati, allora il corpo si comporta come un isolante. Se invece una banda completamente riempita si sovrappone a una banda completamente vuota si hanno due bande parzialmente riempite e il solido si comporta da conduttore. Questo criterio ci consente una prima distinzione tra solidi isolanti e conduttori: Un solido con un numero dispari di elettroni di valenza non può riempire completamente una banda e, quindi, non può essere un isolante. Cristalli di elementi alcalini monovalenti (sodio, potassio, cesio) non hanno una banda di valenza completamente riempita e si comportano, quindi, da conduttori. Al contrario, esempi di isolante si trovano, invece, tra i solidi ionici come il cloruro di sodio o covalenti come il diamante (cioè carbonio in forma cristallina) perché hanno un numero pari di elettroni di valenza per cella. In generale possiamo dire che la condizione secondo la quale un solido cristallino si comporta da conduttore o da isolante dipende dalla separazione tra la bande permesse e quelle vietate e dalla loro occupazione. A temperature superiori allo zero assoluto gli elettroni possiedono un’energia vibrazionale che può essere sufficiente a fornire l’energia necessaria per saltare una banda vietata e passare a un livello energetico disponibile della banda permessa, lasciando un vuoto nella banda di partenza. Questo salto di banda produce una banda quasi piena (banda di valenza) e una quasi vuota (banda di conduzione). Il processo e` tanto più probabile quanto più grande e` la temperatura e,

133

Capitolo 4


p(v) E⃗

−v F

Velocità

vF

Figura 4.9: distribuzione di Fermi della componente della velocità, per un metallo a temperatura superiore allo zero assoluto. La curva tratteggiata rappresenta la distribuzione che si ottiene in presenza di un campo elettrico. La traslazione di una curva rispetto all’altra e` esagerata rispetto a quanto avviene in realtà.

quindi, l’energia vibrazionale degli elettroni e quanto meno separata e` la banda di conduzione da quella di valenza. Esisteranno allora dei materiali che restano isolanti anche ad alte temperature e materiali (i semiconduttori) che, a causa della piccola separazione tra le bande, possono diventare conduttori a temperatura ambiente.

4.5 La conduzione elettrica La conduzione elettrica e` legata al moto degli elettroni liberi cioè quelli in livelli parzialmente riempiti della banda di conduzione. Mentre allo zero assoluto i livelli parzialmente riempiti stanno tutti al di sotto di EF , per una temperatura differente ci saranno dei livelli parzialmente riempiti e, quindi, degli elettroni liberi anche per valori di energia di poco al di sopra di EF . Chiamiamo velocità di Fermi v F il valore della velocità di un elettrone corrispondente a una energia cinetica pari a EF . Se consideriamo v F come la

134

La conduzione elettrica

Capitolo 4

componente della velocità piuttosto che il suo modulo si ottiene a partire da (4.16) la distribuzione di Fermi delle velocità rappresentata in figura 4.9. Tale distribuzione risulta essere simmetrica cioè uguale per componenti di velocità positive e negative. Se si integra tale funzione o alternativamente se ne considera l’area sottostante si può affermare che esistono tanti elettroni che si muovono verso la direzione positiva (con componente positiva della velocità) quanti sono quelli che si muovono in direzione negativa (con componente negativa della velocità). La velocità media risulta, quindi, essere nulla e se si andasse a misurare l’intensità di corrente elettrica attraverso una qualsiasi sezione del corpo metallico si ricaverebbe una corrente nulla. Le cose però cambiano se il corpo metallico e` soggetto a un campo elettrico E prodotto da una differenza di potenziale applicata agli estremi del metallo. In questo caso la forza elettrica F = qE = −eE produce un’accelerazione degli elettroni e, quindi, una variazione della loro velocità. La distribuzione di Fermi cambia nel modo indicato in figura 4.9: l’effetto complessivo e` quello di una traslazione rigida della distribuzione in direzione opposta a quella del campo elettrico applicato (poiché gli elettroni hanno carica negativa). Dal confronto tra le distribuzioni di velocità in assenza e in presenza di campo elettrico si può notare che una piccola frazione di elettroni, aventi velocità leggermente inferiore a v F e diretta come E, può passare da uno stato occupato a uno stato libero. La cosa opposta accade agli elettroni che si muovono in direzione opposta a E. L’effetto complessivo e` quello di uno svuotamento di stati attorno a −v F con corrispondente comparsa nella regione più chiara vicino a +v F . Allo stesso tempo la velocità media non e` più nulla, ma assume una componente diversa da zero nella direzione opposta a E. Tale velocità media risulta essere molto più piccola di v F e viene chiamata velocità di deriva vd . Un valore non nullo della velocità di deriva e` imputabile a quel piccolo numero di elettroni (corrispondenti all’area chiara della figura 4.9) che, a causa dell’accelerazione dovuta al campo elettrico, assumono una velocità superiore a v F . Dalla tabella 4.1 si vede che le velocità di Fermi per i metalli sono molto grandi, dell’ordine di 1/100 della velocità della luce. Le velocità di deriva sono

135

Capitolo 4


invece molto più piccole, dell’ordine del decimo di millimetro al secondo. Il ragionamento precedente evidenzia la fondamentale differenza tra il modello classico e quello quantistico. Nel caso classico la conduzione e` dovuta a tutti gli elettroni che derivano con velocità vd . Nel caso quantistico invece solo una piccola porzione degli elettroni liberi, in moto con velocità pari circa a v F , e` responsabile effettivamente della conduzione.

4.6 Conduttore o isolante? Che cos’è allora che fa s`ı che un elemento si comporti come conduttore o come isolante? Che cos’è cioè che determina la resistività di un materiale? A parità di campo elettrico applicato, si hanno una corrente elettrica intensa e, quindi, una bassa resistività se c’è un grande numero di elettroni di conduzione liberi di muoversi all’interno del reticolo cristallino. Tali elettroni devono trovarsi in una banda parzialmente occupata (banda di conduzione) perché solo cos`ı potranno rispondere al campo elettrico applicato incrementando la propria energia. Nel caso dei metalli avviene allora che la banda di conduzione e quella di valenza siano parzialmente sovrapposte (vedi figura 4.10) oppure la separazione tra le due bande ΔE, cioè l’intervallo energetico proibito (detto anche energia di gap), risulta essere molto piccolo, dell’ordine dell’energia associata all’agitazione termica ΔE ≈ kT. Nel secondo caso sarà energeticamente possibile per alcuni elettroni passare dalla banda di valenza a quella di conduzione. Un comportamento da isolante si ha per i materiali caratterizzati da un grande valore per l’intervallo energetico proibito, tipicamente maggiore di 3 eV. In questo caso, come discusso nell’esempio 6, ΔE risulta essere molto più grande dell’energia termica media kT per temperature ordinarie, da fare s`ı che la probabilità che venga occupato un qualsiasi livello nella banda di conduzione sia minuscola e di conseguenza sia pressoché impossibile trovare elettroni nella banda di conduzione. Il terzo caso, rappresentato al centro della figura 4.10, mostra un intervallo energetico proibito di valore intermedio. In questo caso si avrebbe una 136

Conduttore o isolante?

ΔE

Conduttore

Semiconduttore

Capitolo 4

ΔE

Isolante

Figura 4.10: rappresentazione schematica delle bande energetiche di valenza (chiare) e di conduzione (scure) nel caso di un materiale conduttore (a sinistra), isolante (a destra) o semiconduttore (al centro).

probabilità piccola, ma non trascurabile di avere elettroni che grazie alla loro agitazione termica vengono promossi dalla banda di valenza a quella di conduzione originando corrente elettrica. Tale probabilità e la corrente elettrica conseguente verrebbero a crescere all’aumentare della temperatura. Materiali che hanno un valore piccolo di ΔE vengono chiamati semiconduttori. La distinzione tra materiali isolanti e semiconduttori non e` assoluta, ma dipende anche dalla temperatura. Infatti, allo zero assoluto sarebbe impossibile per un’elettrone di valenza saltare nella banda di conduzione sia per un materiale isolante sia per un semiconduttore. All’aumentare della temperatura però, la differenza tra un isolante e un semiconduttore si manifesta in modo via via crescente. Notiamo che per i conduttori la resistività aumenta all’aumentare della temperatura (dρ/dT > 0) mentre per i semiconduttori avviene l’opposto (dρ/dT < 0), come vedremo nel prossimo capitolo.

137

Capitolo 4


4.7 L’effetto della struttura reticolare Il modello di Fermi-Dirac a gas di elettroni fornisce in modo semplice e diretto le proprietà di conducibilità elettrica di un solido. Tale modello non spiega però pienamente come mai alcuni materiali siano conduttori e altri no. In questo modello gli elettroni si muovono soggetti solamente al vincolo di essere confinati entro il materiale. In realtà, la struttura reticolare del cristallo ha degli effetti importanti sul moto degli elettroni. Vanno prese in considerazione soprattutto tre cose: 1) Il meccanismo che e` alla base della trattazione classica della conduzione e` il ripristino dell’equilibrio, dovuto agli urti degli elettroni con gli ioni del reticolo, che ridistribuisce in modo casuale la velocità degli elettroni. Nel caso di elettroni che si muovono in un reticolo cristallino perfettamente periodico essi non sarebbero soggetti a urti con gli ioni del reticolo e non verrebbe ostacolata la corrente elettrica. Sono invece gli urti con impurità (cioè atomi estranei), imperfezioni (atomi assenti o posizionati male rispetto alla struttura cristallina ideale) o aperiodicità di un qualche tipo all’interno del reticolo cristallino, a determinare una certa resistenza al passaggio di corrente. Ad esempio, la presenza di impurità in un cristallo perfetto determinerebbe la diminuzione del tempo medio τ tra urti, con conseguente diminuzione della conducibilità σ. D’altro canto anche in un cristallo idealmente perfetto l’agitazione termica degli atomi produce una leggera perturbazione locale e, quindi, una lieve aperiodicità del potenziale. All’aumentare della temperatura tende, allora, ad aumentare il numero di urti, con conseguente riduzione di τ e, quindi, della conducibilità. Altro modo di influenzare la conducibilità sarebbe quello di sottoporre il cristallo a sforzi meccanici intensi in modo da aumentare le imperfezioni nel cristallo, diminuire τ e ridurre σ. 2) Il potenziale al quale sono soggetti gli elettroni nel cristallo ha delle variazioni periodiche in ampiezza dovute alla ripetizione periodica delle celle elementari all’interno del cristallo. Il potenziale a cui e` soggetto l’elettrone e` del tipo rappresentato in figura 4.11 e può essere approssimato per 138

L’effetto della struttura reticolare

Capitolo 4

a V0

V0

a Figura 4.11: potenziale a cui e` soggetto un elettrone all’interno di un reticolo cristallino (sopra) e la sua approssimazione secondo il modello Kronig-Penney (sotto) come successione di barriere di potenziale aventi altezza V0 e spaziate della distanza a pari alla separazione tra gli ioni (●) del reticolo.

mezzo di una successione di barriere di potenziale secondo il modello di Kronig-Penney16 . Tale idealizzazione e` una rozza approssimazione di quello che succede all’interno di un cristallo, ma e` comunque utile a descrivere importanti caratteristiche del comportamento degli elettroni entro un reticolo cristallino. 3) Il comportamento degli elettroni all’interno del reticolo cristallino, cos`ı come può essere ricavato andando a risolvere l’equazione di Schrödinger, risulta essere in accordo con quello che ci si aspetterebbe per elettroni diffratti dal reticolo cristallino in modo simile a quanto avviene per la riflessione di Bragg. Quando la lunghezza d’onda di De Broglie dell’elettrone risulta essere pari alla periodicità del reticolo cristallino si ha allora un’interazione particolarmente intensa tra l’elettrone e il reticolo, con conseguente cambiamento nelle proprietà di conduzione del cristallo. Come visto nel capitolo 3 e` la forma del potenziale a determinare la solu16

Ralph de L. Kronig (1904-1995), fisico tedesco-americano, e William G. Penney (19091991), fisico inglese, introdussero questo modello nel 1931.

139

Capitolo 4


zione dell’equazione di Schrödinger. Mentre per un elettrone confinato entro il volume del metallo ci si aspetterebbe come soluzione un’autofunzione data da un’onda viaggiante ad ampiezza costante, nel caso del potenziale che varia con periodicità la funzione d’onda diventa un’onda viaggiante con ampiezza variabile e periodica. Supponiamo, infatti, di avere un’onda che viaggia verso destra e che incide sulle barriere di potenziale. In corrispondenza di ciascuna barriera si avrà una parziale riflessione dell’onda dove l’onda riflessa non risulta essere, in generale, in fase con quella incidente. Per questo motivo la combinazione di tutte le onde riflesse non dà luogo a interferenza costruttiva. Se, invece, la lunghezza d’onda λ e la spaziatura a tra le barriere soddisfano alla condizione di Bragg: 2a = nλ (n = 1, 2, 3, ...)

(4.17)

le onde riflesse risultano essere in fase e interferiscono costruttivamente a formare un’onda riflessa con la stessa ampiezza di quella incidente. La sovrapposizione delle due onde, incidente e riflessa, con stessa ampiezza e viaggianti in direzione opposta, dà luogo a un’onda stazionaria che può essere ottenuta sia sommando sia sottraendo le due onde, corrispondente a funzioni d’onda periodiche chiamate funzioni di Bloch17. Il risultato finale e` che in corrispondenza dei valori di k che soddisfano alla condizione di Bragg: k = ±n

π (n = 1, 2, 3, ...) a

(4.18)

(ove si sono considerate sia le onde che si propagano verso destra sia quelle che si propagano verso sinistra aventi valori negativi di k) ci sono due valori possibili di energia e, quindi, i livelli energetici permessi risultano spaziati da un intervallo proibito, come si vede in figura 4.12, in cui le soluzioni dell’equazione di Schrödinger contengono dei termini esponenziali decrescenti molto rapidamente. 17

Le funzioni di Bloch hanno la proprietà generale di fornire una densità di probabilità ψ ψ che e` la stessa in ciascuna cella unitaria del reticolo cristallino. Tali funzioni hanno periodo pari alla spaziatura a. ∗

140

Massa efficace

Capitolo 4

E

k 0

π 2π 3π 4π a a a a

Bande di energia

Figura 4.12: energie permesse in funzione di k per un elettrone soggetto a barriere di potenziale equispaziate (sinistra) e bande energetiche risultanti (destra).

Rispetto alla funzione parabolica e continua del caso dell’elettrone libero (vedi figura 4.3) compaiono delle discontinuità in corrispondenza dei valori di k multipli di π/a, in corrispondenza delle quali la funzione si incurva. Questi valori critici di k individuano quelle che vengono chiamate le zone di Brillouin dove la prima si riferisce all’intervallo ∣k∣ < π/a, la seconda a π/a < ∣k∣ < 2π/a e cos`ı via. Passando a trattare dei cristalli reali, con un reticolo tridimensionale, si ottiene lo stesso comportamento qualitativo fin qui descritto, con la differenza che ci sono più di due valori di k per ciascun autovalore di energia.

4.8 Massa efficace Nel modello classico per la conduzione abbiamo visto (secondo la (4.6)) che la conducibilità risultava essere inversamente proporzionale alla massa dell’elettrone. Vedremo ora come tale proporzionalità inversa valga ancora nella trattazione quantomeccanica dell’elettrone soggetto a un potenziale reticolare periodico, se si sostituisce la vera massa dell’elettrone con una quantità variabile a seconda delle condizioni chiamata massa efficace. 141

Capitolo 4


Il moto dell’elettrone risulta essere soggetto alla forza esterna elettrica dovuta al campo elettrico applicato e anche alle forze interne di interazione con gli ioni del reticolo cristallino. L’elettrone in moto all’interno del reticolo cristallino ha un’energia E(k) della forma definita in (4.10). Se si applica un campo elettrico esterno E il lavoro fatto dalla forza qE sull’elettrone, che nel tempo dt effettua uno spostamento dx, vale dW = qEdx e va ad aumentare l’energia dell’elettrone della quantità: dE = dW = qEdx = qE

dx dt = qEvdt = qEv g dt dt

(4.19)

dove abbiamo ricordato che la velocità v dell’elettrone risulta essere uguale alla velocità di gruppo v g del pacchetto d’onda associato (secondo quanto visto nell’esempio 3 del capitolo 2). Poiché E = ħω allora: dE = ħ

dω dk = ħv g dk dk

(4.20)

e perciò, derivando rispetto al tempo, si ricava: dv g d 1 dE 1 d 2 E dk = ( )= dt dt ħ dk ħ dk 2 dt

(4.21)

Del resto, uguagliando (4.19) e (4.20) si ottiene: dk qE = dt ħ

(4.22)

e, poiché v g = v, si ottiene infine un’espressione dinamica del tipo: dv qE = dt m⋆ dove: m⋆ =

ħ2 d 2 E/dk 2

(4.23)

(4.24)

La quantità m⋆ e` la massa efficace dell’elettrone entro un reticolo cristallino e risulta essere pari al rapporto tra la forza qE e l’accelerazione dv/dt. 142

Massa efficace

Capitolo 4

E

(II)

− πa

(I)

π a

k (II)

Figura 4.13: energie permesse in funzione di k per la prima (I) e la seconda (II) zona di Brillouin.

La peculiarità di questa definizione e` che qE non sarebbe la risultante di tutte le forze agenti sull’elettrone, ma solo la forza esterna. Con l’introduzione di questa massa efficace possiamo semplificare la trattazione del moto dell’elettrone come se il moto fosse dovuto solamente alle forze esterne, mentre quelle interne vengono considerate attraverso il loro effetto sulla massa. La differenza tra massa efficace e massa normale e` legata allora all’interazione tra gli elettroni in moto e gli atomi del cristallo. In base a queste considerazioni, il modello a elettroni liberi e` ancora giustificato nella trattazione della conduzione di un metallo se si fa riferimento alla massa efficace. In altre parole, i risultati ottenuti da tale modello valgono ancora se si sostituisce, ovunque, la massa dell’elettrone con la sua massa efficace. Si noti che il reciproco della massa efficace 1/m⋆ risulta essere proporzionale alla curvatura della funzione E(k), data appunto da d 2 E/dk 2 . Come si vede dalla figura 4.13, vicino al centro della prima zona di Brillouin (cioè per k ≈ 0) l’energia vale tanto quanto ci si aspetta da un elettrone libero, cioè E ≈ ħ2 k 2 /2m. Andando a calcolare la massa efficace secondo la formula (4.24) si otterrebbe m⋆ ≈ m e, quindi, un comportamento reale del-

143

Capitolo 4


l’elettrone simile al caso dell’elettrone libero. In questa regione, infatti, il reticolo influenza molto poco l’elettrone e le forze sono sostanzialmente quelle esterne. Ricorrendo alla massa efficace si può scrivere l’energia di un elettrone all’interno del reticolo cristallino come: ħ2 k 2 (4.25) 2m⋆ con la sola differenza che m⋆ non e` una quantità costante. Poiché i valori di k sono distribuiti uniformemente, la densità dei livelli energetici corrispondenti risulta essere più grande quando E(k) varia più lentamente e, quindi, quando la curvatura e` più piccola. Di conseguenza livelli energetici molto densi si hanno quando 1/m⋆ e` piccola, e viceversa. Il legame tra densità di livelli energetici e massa efficace può essere utilizzato per spiegare il valore della conducibilità di un metallo. Sostituendo m con m⋆ nella formula (4.6) si ottiene che: E(k) ≈

σ∝

1 m⋆

(4.26)

e, quindi, la conducibilità di un metallo e` maggiore quando la densità dei livelli e` minore. Sulla base di questa argomentazione si capisce, come discusso nell’esempio 6, perché un metallo quale il ferro abbia una conducibilità inferiore rispetto a quella del rame.

4.9 Elettroni e lacune In alcuni metalli quali lo zinco e il berillio si osserva, studiando l’effetto Hall18 , che i portatori di carica devono avere segno positivo. Questi portatori di carica positiva non sono certo gli ioni positivi del cristallo né i protoni del nucleo, ma vengono associati al concetto di lacune intese come livelli energetici non 18

Nell’effetto Hall un conduttore piatto percorso da corrente e sottoposto a un campo magnetico perpendicolare alle facce piatte del conduttore esibisce una differenza di potenziale, nella direzione ortogonale a corrente e campo magnetico, il cui segno dipende dal segno dei portatori di carica. Una discussione più dettagliata e` fornita nel capitolo 5. 144

Elettroni e lacune

Capitolo 4

occupati della banda di valenza dovuti a elettroni migrati dalla banda di valenza a quella di conduzione. Queste lacune si comportano a tutti gli effetti come portatori liberi di carica positiva e contribuiscono, quindi, alla corrente di conduzione totale. Nel caso di una banda di valenza quasi completamente riempita e` più comodo ragionare in termini del moto di un piccolo numero di lacune invece che fare riferimento a un grande numero di elettroni. Le velocità associate alle lacune sarebbero quelle corrispondenti a quelle che avrebbero gli elettroni assenti. Queste lacune si trovano generalmente ai livelli superiori della banda di energia, dove la funzione E(k) tende a incurvarsi verso il basso e ad avere d 2 E/dk 2 negativo e, quindi, massa efficace negativa. Una particella (l’elettrone) con carica negativa e massa efficace negativa tenderebbe a muoversi, sotto l’azione di un campo elettrico E, nello stesso verso di E allo stesso modo di una particella (la lacuna) con carica positiva e massa efficace positiva. Quando in un conduttore intervengono sia elettroni sia lacune il segno dell’effetto Hall dipende da quale dei due portatori di carica sia dominante e da quale tra i due portatori di carica abbia la mobilità più elevata.

4.9.1

Esempio

6. Sulla base della distribuzione degli elettroni di valenza nei corrispondenti orbitali, si giustifichi il fatto che la conducibilità del rame risulta essere più grande di quella del ferro. Il ferro ha numero atomico 26 e i suoi elettroni riempiono gli orbitali 1s 2 , 2s 2 , 2p6 , 3s 2 , 3p6 , fino al 3d 8 che risulta parzialmente riempito. L’orbitale 3d fa parte di un sottoguscio interno e, quindi, i livelli 3d non sono molto spaziati e la banda corrispondente non e` molto estesa. Di conseguenza, essendo la banda stretta, la densità di livelli e` alta e il reciproco della massa efficace e` piccolo, risultando 1/m⋆Fe ≈ 0.1 × 1/m Nel caso del rame, i suoi 29 elettroni riempiono totalmente gli orbitali 3d, occupando parzialmente l’orbitale 4s corrispondente a una banda molto larga perché relativa a un sottoguscio esterno. Ne deriva una densità di livelli piccola e un valore grande del reciproco della massa efficace, corrispondente 145

Capitolo 4


a 1/m⋆Cu ≈ 1/m. Poiché σ ∝ 1/m⋆ ne risulta che la conducibilità del rame e` circa 10 volte quella del ferro.

4.10 Superconduttività Per completare la trattazione della conduzione elettrica, nei solidi in generale e nei metalli in particolare, descriviamo in breve il fenomeno della superconduttività. Come abbiamo visto, la resistività di un metallo diminuisce gradualmente al diminuire della temperatura, ma non si dovrebbe annullare neanche avvicinandosi allo zero assoluto. Si raggiunge, invece, un valore di saturazione dipendente dalla purezza del metallo poiché la presenza immancabile di impurità e imperfezioni comporta comunque delle collisioni dissipative con gli ioni del reticolo. Esistono però dei materiali detti superconduttori in cui, una volta raggiunta una certa temperatura critica Tc , si verifica una transizione brusca a un altro regime per il quale la resistività va a zero. Questo fenomeno e` stato scoperto da Onnes19 nel 1911, raffreddando del mercurio alla temperatura di 4.2 K impiegando elio liquido. Se si guarda al comportamento della resistività in funzione della temperatura (vedi figura 4.14) si vede che un superconduttore non e` un conduttore migliore degli altri, ma qualcosa di diverso. Il brusco andamento della resistività fa pensare, infatti, all’attivazione di un meccanismo di conduzione diverso da quello usuale, che viene a instaurarsi quando la temperatura scende al di sotto di quella critica. La superconduttività si manifesta in molti elementi metallici, leghe o composti, anche in assenza di pressione. In tabella 4.3 riportiamo alcuni esempi di elementi superconduttori, indicando la loro temperatura critica. Esistono poi altri elementi che possono, invece, diventare superconduttori solo se sottoposti a pressioni elevate. 19

Heike K. Onnes (1853-1926), fisico olandese vincitore del Premio Nobel per la Fisica nel 1913 per la liquefazione dell’elio. 146

Superconduttività

ELEMENTO Ti Zr Hf Zn Cd Hg Al La

Tc (K) 0.4 0.5 0.1 0.9 0.6 4.2 1.1 6.0

H c (104 A/m) ELEMENTO Tc (K) 0.8 V 5.4 0.4 Nb 9.5 Ta 4.5 0.4 Ga 1.1 0.2 In 3.4 3.3 Tl 2.4 0.8 Sn 3.7 8.8 Pb 7.2

Capitolo 4

H c (104 A/m) 11.3 15.8 6.6 0.4 2.3 1.4 2.5 6.4

Tabella 4.3: temperatura critica e campo magnetizzante critico (a 0 K) per alcuni elementi superconduttori.

ρ

superconduttore

conduttore 0

T

Tc

Figura 4.14: andamento della resistività in funzione della temperatura per un materiale superconduttore e per un conduttore normale.

147

Capitolo 4


Quello che avviene in un superconduttore a temperatura T < Tc e` che gli elettroni sono liberi di muoversi indefinitamente senza incontrare resistenza e senza dissipazione di energia. Ciò e` stato effettivamente verificato in anelli superconduttori in cui sono state osservate correnti circolare per anni senza attenuazione. Altro aspetto importante della superconduttività riguarda le proprietà magnetiche che vengono a manifestarsi e che sono altrettanto sorprendenti di quelle elettriche. Nella fattispecie un cilindro di materiale non magnetico, in presenza di un campo magnetico esterno, viene attraversato dalle linee di campo come indicato in figura 4.15. Un corpo superconduttore, a temperatura al di sotto di Tc , si comporta invece come un diamagnete perfetto nel senso che espelle dal suo volume le linee del campo magnetico, come rappresentato nella figura 4.16. Questo fenomeno e` chiamato effetto Meissner e non può, in alcun modo, essere spiegato assumendo che il superconduttore sia in realtà un conduttore perfetto a resistività pressoché nulla. Infatti, se si parte da un conduttore normale, in presenza di campo magnetico esterno, e si abbassa la sua temperatura fino a portarlo, idealmente, a essere un conduttore perfetto, non si ha l’espulsione totale del campo magnetico, cosa che avviene invece per un superconduttore. Detto in altro modo, la magnetizzazione di un superconduttore e` la stessa sia raffreddandolo in assenza di campo magnetico sia raffreddandolo con un campo applicato. Ciò non e`, invece, vero nel caso di un conduttore perfetto. Il campo magnetico non riesce a penetrare all’interno del corpo superconduttore perché gli elettroni assolutamente liberi di muoversi entro il corpo lo fanno in modo tale da produrre un campo magnetico uguale e opposto. Questo effetto di bilanciamento, e la conseguente espulsione del campo magnetico, si mantiene fintantoché la corrente elettrica e` in grado di persistere, cioè finché il corpo resta superconduttore. Infatti, quando il superconduttore torna normale, data la resistività mimima non nulla, la magnetizzazione non risulta più sufficiente ad annullare, bilanciandolo, il campo esterno. Campi magnetici intensi possono distruggere la superconduttività ed esi-

148

Superconduttività

Capitolo 4

T > Tc Figura 4.15: per un cilindro non magnetico o di materiale superconduttore al di sopra della temperatura critica Tc le linee del campo magnetico attraversano il cilindro.

ste un valore critico H c del campo magnetizzante20 al di sopra del quale il metallo superconduttore cessa di comportarsi come superconduttore e torna alla normalità. Il valore di H c dipende dalla temperatura del corpo; all’aumentare di H c diminuisce la temperatura critica Tc , come indicato in figura 4.17 dove si evidenzia anche la regione di separazione tra il comportamento normale e quello superconduttore. Superconduttori di questo tipo vengono detti superconduttori di tipo I e tra di essi troviamo i metalli puri. L’andamento della magnetizzazione in funzione di H c e` rappresentato nella figura 4.18-sinistra. Esiste un’altra categoria di superconduttori (di tipo II), tra cui troviamo generalmente i materiali composti, per i quali la magnetizzazione si comporta come mostrato in figura 4.18-destra. Esistono due valori critici H c1 e H c2 tali che per H < H c1 si ha una magnetizzazione lineare con conseguente effetto Meissner, mentre per H c1 < H < H c2 si ha una magnetizzazione non lineare, ancora di tipo diamagnetico (vedi capitolo 6), che porta a un effetto Meissner parziale. In questo caso il campo penetra parzialmente en20

Per una definizione della magnetizzazione e del campo magnetizzante si veda il capitolo

6.

149

Capitolo 4


T < Tc Figura 4.16: rappresentazione dell’effetto Meissner per un cilindro di materiale superconduttore al di sotto della temperatura critica Tc . In questo caso le linee del campo magnetico sono espulse dal cilindro.

tro il corpo sotto forma di tubi di flusso che si dispongono in modo ordinato all’interno del corpo. Infine, per H > H c2 la superconduttività sparisce. Lo stato di superconduttività può essere distrutto dal campo magnetizzante prodotto dalla corrente stessa se H > H c . In questo caso sono favoriti i superconduttori di tipo II perché la soppressione della superconduttività avviene gradualmente fino a quando non si raggiunge H c2 che può essere anche molto più grande di H c1 . Nel modello a gas di elettroni ci si basa sull’assunzione, giustificata a posteriori dall’esperimento, che gli elettroni di conduzione si comportino in modo indipendente l’uno dall’altro. Questa assunzione viene meno nel caso della superconduttività perché diventa essenziale il comportamento collettivo degli elettroni.

150

Superconduttività

4.10.1

Capitolo 4

La teoria BCS per la superconduttività

Bardeen, Cooper e Schrieffer21 elaborarono nel 1957 una teoria, detta comunemente teoria BCS, per spiegare il fenomeno della superconduttività. In questa teoria, che qui semplifichiamo, gli elettroni sono legati in coppie (dette coppie di Cooper). Tali coppie risultano energeticamente favorite rispetto ai due elettroni separati in quanto la loro energia totale e` minore. L’energia della coppia risulta, infatti, minore a causa dello scambio di fononi22 tra di loro. In condizioni normali gli elettroni di queste coppie hanno uguale velocità, ma verso opposto, corrispondendo a una corrente nulla. Quando con l’applicazione di un campo elettrico esterno si genera una corrente, la coppia di elettroni acquista un incremento di velocità e il centro di massa della coppia si mette in moto. La cosa peculiare e` che tutte le coppie di Cooper che si formano acquistano lo stesso incremento della quantità di moto a causa di un fenomeno cooperativo tra le coppie. Quando viene applicato un campo elettrico esterno tutte le coppie di Cooper derivano come cariche elettriche usuali, ma poiché tutte devono avere la stessa quantità di moto esse si muovono tutte assieme e nessuna di esse può essere implicata in un urto casuale con imperfezioni del reticolo cristallino. E` l’assenza di tali urti a rendere il corpo superconduttore e per questo motivo si può guardare alla superconduttività come a uno stato ordinato degli elettroni di conduzione. La transizione allo stato di superconduttività avviene bruscamente perché quando la temperatura scende al di sotto di Tc la formazione di alcune coppie di Cooper provoca la produzione, moltiplicativa, di altre coppie. Esistono delle condizioni che devono essere soddisfatte affinché si possa formare un grande numero di coppie di Cooper e si possa avere, quindi, superconduttività. E` importante, ad esempio, che la temperatura sia molto bassa in modo tale che sia debole l’interazione con il reticolo cristallino vibrante per agitazione termica. E` essenziale che gli elettroni abbiano spin antiparallelo perché in questo caso tendono a essere più vicini che nel caso di spin 21

John Bardeen (1908-1991), Leon N. Cooper (1930-) e J. Robert Schrieffer (1931-), ricevettero nel 1972 il premio Nobel per la Fisica per la loro teoria sulla superconduttività. 22 I fononi sono quanti di vibrazione del reticolo cristallino.

151


H c (104 amp/m)

Capitolo 4

6

Normale

4

Superconduttore

2 0 0

2

4

6

8

Tc (K) Figura 4.17: dipendenza del campo magnetizzante critico H c dalla temperatura critica Tc . Questa figura si riferisce al piombo.

parallelo. Inoltre, in assenza di campo elettrico esterno, gli elettroni di una coppia devono avere quantità di moto uguale in modulo, ma opposta in direzione. In questo modo la quantità di moto totale della coppia sarebbe nulla e la meccanica quantistica prevederebbe un’elevata probabilità di formare un grande numero di coppie di Cooper. La scoperta della superconduttività ha suscitato un notevole interesse e grandi sforzi sono stati dedicati alla ricerca di nuovi materiali superconduttori e alla determinazione della loro temperatura critica. Nel corso degli anni si e` scoperta una nuova classe di materiali superconduttori che hanno valori di temperatura critica relativamente elevati, fino a circa 100 K. Si tratta in generale di ossidi ceramici per i quali il meccanismo di insorgenza della superconduttività non e` stato ancora chiarito in modo esauriente. Un esempio di tale superconduttore e` il materiale chiamato YBCO che ha formula chimica YBa2 Cu3O7 e una temperatura critica Tc = 90 K. Gli sviluppi più recenti, con materiali ossigenati a base di tallio, mercurio, rame, bario e calcio, indicano che si possono ottenere superconduttori con temperatura critica ancora più alta (Tc ≈ 140 K).

152

Applicazioni

−M

Capitolo 4

−M Tipo I

Hc

Tipo II

H c1

H

H c2 H

Figura 4.18: comportamento della magnetizzazione in funzione del campo magnetizzante. Superconduttori di tipo I (a sinistra) e di tipo II (a destra).

La scoperta di materiali superconduttori a temperatura ambiente avrebbe importanti conseguenze tecnologiche consentendo, ad esempio, la trasmissione di energia elettrica senza dissipazione e la costruzione di dispositivi e motori elettrici con consumo energetico ridotto.

4.11 Applicazioni Le proprietà di conduzione dei metalli hanno innumerevoli applicazioni scientifiche e tecnologiche, tra cui, ad esempio, la termocoppia. Discutiamo, inoltre, due applicazioni di estremo interesse che, più propriamente, hanno a che fare con la superconduttività: i magneti superconduttori e gli SQUID.

4.11.1

Termocoppia

La termocoppia e` un dispositivo che può essere usato sia come sensore di temperatura sia come generatore di forza elettromotrice. In entrambi i casi il dispositivo si basa sull’effetto termoelettrico scoperto nel 1821 da Seebeck23 , 23

Thomas J. Seebeck (1770-1831), fisico estone-tedesco. 153

Capitolo 4


riguardante la produzione di una forza elettromotrice a partire da differenze di temperatura. Questo fenomeno, detto anche effetto Seebeck, si manifesta quando i due estremi di un conduttore sono posti a temperatura diversa. Per poter sfruttare questo effetto conviene considerare un secondo conduttore, congiunto con il primo ai due estremi, che genera una forza elettromotrice diversa (vedi figura 4.19). La differenza di tensione tra i due conduttori può essere, in questo modo, misurata e dipende dalla differenza di temperatura tra i due estremi. In un metallo gli elettroni sono allo stesso tempo portatori di carica elettrica e portatori di calore. Quando esiste una differenza di temperatura tra due punti di un conduttore gli elettroni più caldi, presenti con concentrazione maggiore a un estremo, si diffonderanno all’altro estremo. Gli elettroni più freddi si diffonderanno, invece, seguendo il percorso inverso. Siccome la velocità di diffusione dei due tipi di elettroni dipende dalla loro energia24 , si viene a creare una differente concentrazione di elettroni ai due capi del conduttore. Tale differenza di densità su un conduttore neutro equivale a una distribuzione di cariche negative e positive separate e, quindi, alla produzione di una differenza di potenziale ai capi del conduttore. D’altro canto, quando si portano a contatto due metalli diversi aventi diverso lavoro di estrazione, gli elettroni migrano dal metallo avente energia di Fermi maggiore a quello con energia di Fermi minore, cioè verso il metallo con lavoro di estrazione maggiore. Il processo di migrazione termina quando l’energia di Fermi assume lo stesso valore nei due metalli e uno dei due metalli assume una carica negativa rispetto all’altro. Se si considera in aggiunta l’effetto del riscaldamento di uno dei due estremi si ha che un numero maggiore di elettroni migra attraverso la giunzione, producendo un maggiore accumulo di carica negativa, con conseguente produzione di una differenza di potenziale. Le differenze di potenziale che si vengono a produrre in una termocoppia sono piccole e ammontano all’incirca a qualche decina o al più centinaio di microvolt per ogni grado kelvin. La forza elettromotrice corrispondente vale 24

Perché dipende dall’energia l’interazione con il reticolo cristallino.

154

Applicazioni

+

Capitolo 4

+

metallo 1

T0

T1 V

−

metallo 2

metallo 2

−

Figura 4.19: schema di una termocoppia formata da due metalli diversi congiunti ai due estremi.

approssimativamente: ΔV = ∫

T T0

[S1 (T) − S2 (T)]dT ≈ (S1 − S2 )(T − T0 )

(4.27)

dove S1 e S2 sono i valori per i due metalli diversi del coefficiente di Seebeck S (detto anche potenza termoelettrica), coefficiente che dipende dal materiale25 , ma anche dalla temperatura stessa. Misurando la differenza di potenziale prodotta ai capi della termocoppia, e conoscendo il valore di S per i due metalli, si ottiene una misura della temperatura T dell’estremo sonda della termocoppia rispetto alla temperatura di riferimento T0 : ΔV (4.28) T = T0 + S1 − S2 L’effetto Seebeck può essere amplificato disponendo più termocoppie in serie. In questo modo si può ottenere un generatore di forza elettromotrice sufficientemente grande, chiamato termopila. L’effetto Seebeck può essere rovesciato e in questo caso si parla di effetto Peltier, dal nome del suo scopritore26 , in cui una corrente elettrica che fluisce attraverso il sistema di due conduttori produce una differenza di temperatura. La differenza di temperatura può essere invertita27 cambiando il verso 25

Nel caso di materiali semiconduttori il coefficiente di Seebeck S viene a valere anche qualche millivolt per grado. 26 Jean Charles A. Peltier (1785-1845), fisico francese. 27 Si noti che sia l’effetto Peltier che quello Seebeck sono reversibili, a differenza dell’effetto Joule che e` invece irreversibile e comporta una dissipazione dell’energia. 155

Capitolo 4


della corrente, quindi, l’effetto Peltier può essere usato in dispositivi che agiscono come pompa di calore tra due punti, riscaldando o raffreddando un estremo del dispositivo rispetto all’altro.

4.11.2

Magneti superconduttori

I magneti superconduttori sono degli elettromagneti che sfruttano la superconduttività per raggiungere correnti estremamente elevate e ottenere campi magnetici molto intensi, dell’ordine di qualche decina di tesla, non raggiungibili con normali elettromagneti. La maggior parte dei magneti superconduttori contiene bobine formate da fili composti da una lega di niobio e titanio (superconduttore di tipo II), che ha temperatura critica di 10 K e che e` in grado di restare superconduttrice fino a 15 tesla. Per renderli superconduttori, questi fili vengono raffreddati alla temperatura dell’elio liquido (4.2 K), con i problemi che ciò comporta. Rispetto ai magneti convenzionali i magneti superconduttori hanno generalmente il vantaggio di essere più stabili, di essere più piccoli e di consumare meno energia una volta portati al regime di superconduzione. Quando però una porzione della bobina superconduttrice torna a essere conduttrice essa e` soggetta a un rapido riscaldamento per effetto Joule, con conseguente riscaldamento delle regioni vicine. L’effetto finale (detto quench) comporta, in tempi molto brevi, il ritorno del magnete superconduttore allo stato normale, con conseguente riscaldamento del liquido criogenico. Per evitare il danneggiamento dell’apparato e` necessario tenere conto di questa eventualità dal punto di vista sia termico sia meccanico. Uno degli esempi più imponenti di magnete superconduttore e` rappresentato dal magnete del rivelatore CMS installato presso l’acceleratore LHC del CERN28 . In questo magnete viene prodotto un campo di 4 tesla uniforme su un volume cilindrico avente un raggio di 6 metri e una lunghezza di 12.5 metri. 28

Il CERN e` l’Organizzazione Europea per la Ricerca Nucleare situata a Ginevra. LHC, da poco completato, e` l’acceleratore di protoni in grado di raggiungere l’energia più elevata al mondo (5 TeV). CMS e` uno dei quattro grandi rivelatori installati presso LHC. 156

Applicazioni

4.11.3

Capitolo 4

Effetto Josephson e SQUID

Quando si collegano tra di loro due fili di rame attorcigliandoli si osserva un passaggio di corrente anche se la superficie esterna dei fili, essendo costituita da rame ossidato, dovrebbe comportarsi da isolante e impedire il flusso di elettroni. La conduzione avviene comunque grazie a un effetto quantomeccanico: il sottile strato di materiale isolante agisce come una barriera di potenziale che può però essere attraversata dagli elettroni per effetto tunnel, come discusso nel capitolo 3. Un fenomeno simile si osserva attraverso due superconduttori separati da uno strato sottile di materiale isolante. Anche in questo caso l’effetto tunnel si manifesta come una corrente elettrica che fluisce attraverso la giunzione e questo fenomeno si chiama effetto Josephson29 . Una corrente continua fluisce senza differenza di potenziale ai capi del sistema (effetto Josephson in corrente continua). Se, invece, si applica una tensione fissa ai capi della giunzione si produce una corrente oscillante (effetto Josephson in corrente alternata). Un’interessante applicazione dell’effetto Josephson (in corrente alternata) si ha nel dispositivo chiamato SQUID30 che e` un magnetometro estremamente sensibile. Gli SQUID sono basati su un sistema di due giunzioni Josephson in parallelo, come rappresentato in figura 4.20, che vengono attraversate da un campo magnetico. Se si mantiene una corrente costante in ingresso allo SQUID si osserva ai capi delle due giunzioni una differenza di potenziale oscillante la cui frequenza dipende dal flusso magnetico che attraversa lo SQUID. Queste oscillazioni sono dovute all’interferenza tra le correnti nei due rami del sistema e contando le oscillazioni si può fare una misura di flusso magnetico (e, quindi, di campo magnetico) con una sensibilità molto grande. Si riescono in questo modo a misurare campi magnetici minuscoli, dell’ordine di 10−15 T, con una sensibilità irraggiungibile da altri strumenti. Questa estrema sensibilità degli SQUID li rende in grado, tra le altre cose, 29

Previsto nel 1962 dal fisico britannico Brian D. Josephson (1940-). Per questa sua idea Josephson vinse nel 1973 il Premio Nobel per la Fisica. 30 Dall’inglese Superconducting QUantum Interference Device.

157

Capitolo 4


i iB

iA ×

×

superconduttore isolante superconduttore

B ×

× i

Figura 4.20: schema di uno SQUID formato da due giunzioni Josephson attraversate da un flusso di campo magnetico.

di fare misure di encefalografia magnetica misurando l’attività magnetica del cervello (che ha ampiezza dell’ordine di 10−14 T).

4.12 Quesiti di riepilogo 1. L’energia di Fermi dipende dal volume del metallo in questione? 2. L’energia di Fermi di un metallo dipende dalla sua temperatura? 3. In un metallo a temperatura ambiente, e` più grande la velocità di Fermi o quella di agitazione termica? 4. Come mai la conducibilità del ferro e` minore di quella del rame anche se la densità di elettroni di conduzione e` maggiore nel ferro rispetto al rame? 5. Un superconduttore può essere considerato come un conduttore perfetto? Spiegare perché. 6. Un superconduttore di tipo II soggetto a un campo magnetizzante H com-

158

Esercizi

Capitolo 4

preso tra H c1 e H c2 e` perfettamente diamagnetico o parzialmente diamagnetico?

4.13 Esercizi 1. Conoscendo la massa molare del ferro (55.8 g/mole) e la sua densità (7.9 g/cm3), ricavare il numero di atomi per unità di volume. 2. Conoscendo l’energia di Fermi del ferro, si ricavi il numero di elettroni liberi per unità di volume. Si confronti con il risultato ottenuto nell’esercizio precedente. 3. Un conduttore di ferro a temperatura ambiente (20 ○ C) ha una resistenza di 1 kΩ. Collegato a un generatore di forza elettromotrice viene percorso da corrente elettrica e, a causa dell’effetto Joule, la temperatura del conduttore diventa di 250 ○ C. Quanto varrebbe la resistenza a tale temperatura? 4. Nota la resistività del ferro (ρ = 9.7 × 10−8 Ω ⋅ m a temperatura ambiente) ricavare il valore del tempo medio τ tra urti successivi. 5. Quanto vale l’energia media degli elettroni del ferro allo zero assoluto? 6. Conoscendo la massa molare dell’oro (197 g/mole) e la sua densità (19.3 g/cm3), si ricavi l’energia di Fermi sapendo che l’atomo di oro contribuisce alla conduzione con 1 elettrone.

159

Capitolo 5 I semiconduttori I semiconduttori sono dei solidi covalenti in cui, alla temperatura dello zero assoluto, la banda di valenza e` completamente occupata mentre la banda di conduzione e` completamente vuota, come mostrato in figura 4.10. A differenza degli isolanti, però, l’intervallo proibito di energia ΔE e` sufficientemente piccolo da consentire ad alcuni elettroni di passare dalla banda di valenza a quella di conduzione. Come vedremo più avanti, la probabilità di passaggio dipende dalla temperatura e, quindi, questi materiali possono essere considerati alla temperatura dello zero assoluto come materiali isolanti, diventando semiconduttori con conducibilità crescente all’aumentare della temperatura. I principali materiali semiconduttori sono elementi quadrivalenti come il silicio e il germanio, ma sono possibili anche composti di elementi trivalenti e pentavalenti quali l’arseniuro di gallio (GaAs) che hanno in media quattro elettroni di valenza per atomo. La relativa piccolezza1 dell’intervallo proibito tra la banda di valenza e quella di conduzione (1.14 eV per il silicio e 0.67 per il germanio) comporta per i semiconduttori delle modifiche nelle proprietà di conduzione che si manifestano in modo rilevante all’aumentare della temperatura. Ci sono altre condizioni che influenzano la conducibilità. Ad esempio, la resistività a temperatura ambiente per un semiconduttore puro vale tipicamente tra 10−2 e 109 Ω ⋅ m, ma essa viene influenzata fortemente da fattori quali la presenza di impurità nel reticolo cristallino. 1

In generale un materiale con ΔE minore di circa 3 eV viene considerato un semiconduttore, mentre se ΔE > 3 eV viene considerato un isolante.

Capitolo 5

I semiconduttori

5.1 I semiconduttori intrinsechi Nel caso di silicio e germanio, essendo quadrivalenti, la banda di valenza e` completamente riempita grazie ai legami covalenti, mentre quella di conduzione e` completamente vuota. A temperatura ambiente l’energia associata all’agitazione termica e` dell’ordine di kT ≈ 0.026 eV e tale valore per quanto piccolo risulta sufficiente per fornire a qualche elettrone l’energia necessaria a vincere l’intervallo proibito e passare alla banda di conduzione. Ne segue che l’elettrone viene sottratto al legame covalente diventando un elettrone libero di muoversi. Per capire come ciò sia possibile bisogna ricorrere a una trattazione statistica, considerando la funzione di Fermi-Dirac per la probabilità, e calcolare la probabilità che il livello inferiore della banda di conduzione venga occupato. Come discusso nell’esempio 1, trattato più avanti, tale probabilità non e` trascurabile e si produce allora una promozione alla banda di conduzione per un discreto numero di elettroni. La probabilità cresce rapidamente con la temperatura e si ottiene di conseguenza un notevole aumento della conducibilità, come descritto nell’esempio 2. Questa conducibilità e la conduzione elettrica corrispondente vengono chiamate intrinseche e dipendono dall’eccitazione termica del materiale. Sia nel caso del silicio sia in quello del germanio ci sono quattro elettroni di valenza che partecipano a dei legami covalenti. Per ciascuna eccitazione di un elettrone dalla banda di valenza a quella di conduzione, resta una lacuna nella banda di valenza. Questa lacuna agisce come un portatore libero di carica positiva e contribuisce anch’essa alla conducibilità intrinseca del semiconduttore. In un semiconduttore puro (intrinseco) il numero di elettroni liberi e` uguale al numero di lacune nella banda di valenza. L’agitazione termica continua a produrre nuove coppie elettrone-lacuna che spariscono successivamente a causa di un fenomeno di ricombinazione in cui un elettrone viene riassorbito nella banda di valenza annullando una lacuna e portando al riassorbimento della coppia.

162

I semiconduttori intrinsechi

Capitolo 5

Se chiamiamo n la concentrazione di elettroni liberi e p quella delle lacune, per un semiconduttore puro vale n = p = ni

(5.1)

dove n i viene chiamata concentrazione intrinseca. Il valore della concentrazione intrinseca in semiconduttori puri (n i ∼ 106 ÷1013 cm−3 ) e` inferiore di parecchi ordini di grandezza rispetto alla concentrazione di elettroni di conduzione in un metallo (n ∼ 1022 cm−3 ), comportando una grossa differenza di conducibilità. Notiamo che in un semiconduttore intrinseco il numero di stati liberi nella banda di valenza e` uguale al numero di stati occupati nella banda di conduzione e se le due densità di stati sono simmetriche allora l’energia di Fermi si trova a metà dell’intervallo proibito. Il materiale semiconduttore, che alla temperatura dello zero assoluto si comporta come un isolante, aumenta la sua conducibilità grazie all’eccitazione termica dei suoi elettroni di valenza, ma qualsiasi altro tipo di eccitazione, purché dotata di energia sufficiente, può contribuire alla conducibilità. Un esempio di ciò si trova nella fotoconduttività dove l’energia di eccitazione viene fornita da radiazione elettromagnetica, con frequenza e intensità opportune, che incide sul cristallo semiconduttore. Ricordando che un fotone ultravioletto ha energia di qualche elettronvolt, sufficiente a espellere gli elettroni da un metallo, osserviamo che anche radiazione a lunghezza d’onda maggiore, nel visibile o nell’infrarosso dove i fotoni hanno energie di qualche decimo di elettron-volt, può portare alla promozione di un numero considerevole di elettroni dalla banda di valenza a quella di conduzione. Tale numero aumenta con l’aumentare dell’intensità della radiazione producendo una corrente elettrica crescente.

5.1.1

Proprietà elettriche di un semiconduttore

Nel caso di un semiconduttore la corrente elettrica dipende dal moto sia degli elettroni sia delle lacune. Nel modello di conduzione classico avevamo scritto 163

Capitolo 5

I semiconduttori

ELEMENTO Si Numero atomico 14 Massa atomica 28.1 3 Densità (g/cm ) 2.33 3 Atomi/cm 5.0 × 1022 ΔE0 (eV) a 0 K 1.21 ΔE (eV) a 300 K 1.14 n i (in cm−3 ) 1.5 × 1010 Resistività intr. (Ω ⋅ cm) 2.3 × 105 μ n (in cm2 /V ⋅ s) 1300 2 μ p (in cm /V ⋅ s) 500

Ge 32 72.6 5.32 4.4 × 1022 0.79 0.67 2.5 × 1013 45 3800 1800

Tabella 5.1: parametri fondamentali per silicio e germanio a temperatura ambiente (300 K). In questa tabella deroghiamo dalla scelta usuale di unità di misura del SI.

la conducibilità (vedi la (4.8)) come: σ = ne μ

(5.2)

che, nel caso di un semiconduttore, diventa: σ = (nμ n + pμ p )e

(5.3)

dove la mobilità degli elettroni (μ n ) e delle lacune (μ p ) può assumere valori differenti. E` la mobilità allora, assieme alla concentrazione, a determinare la conducibilità/resistività di un cristallo, come mostrato nell’esempio 3. In tabella 5.1 riportiamo i valori di alcuni parametri fondamentali per il silicio e il germanio; si noti la grande differenza in resistività (un fattore 5 mila) dovuta alla piccola differenza nel valore dell’intervallo proibito. Il valore della concentrazione intrinseca n i aumenta con la temperatura perché aumenta il numero delle coppie elettrone-lacuna che si formano di continuo a causa dell’agitazione termica. In un intervallo di temperatura di 164

I semiconduttori intrinsechi

Capitolo 5

±100 ○ C attorno alla temperatura ambiente, cioè per temperature comprese tra circa 200 e 400 K, la concentrazione varia approssimamente secondo: n2i ∼ T 3 e −ΔE0 /kT

(5.4)

dove ΔE0 e` il valore dell’intervallo proibito allo zero assoluto. Questa formula (compreso il fattore moltiplicativo non indicato) e` ricavabile integrando l’espressione per gli stati elettronici occupati (vedi capitolo 4) per energie superiori al livello più basso della banda di conduzione. Nel caso del silicio a temperatura ambiente si calcola che ci siano circa 1010 elettroni per cm3 nella banda di conduzione, cioè circa uno ogni 1013 atomi. Ecco perché il silicio puro e` scarsamente conduttore. Il valore dell’intervallo proibito ΔE decresce, invece, leggermente all’aumentare della temperatura, diminuendo di circa 3/100 di eV ogni 100 K di aumento. Anche la mobilità delle cariche diminuisce all’aumentare della temperatura sia per quanto riguarda gli elettroni sia per le lacune. Essa viene influenzata anche dal campo elettrico, per valori di campo intensi, maggiori di circa 103 V/cm. L’effetto combinato e` di aumentare la conducibilità di circa il 6 ÷ 8% per il silicio e il germanio per ogni grado di aumento della temperatura. Questa dipendenza non trascurabile della conducibilità dalla temperatura potrebbe comportare dei problemi sulla stabilità delle proprietà di un dispositivo semiconduttore. D’altro canto questa dipendenza può essere sfruttata nei termistori per effettuare misure di temperatura estremamente accurate. Si noti che nel caso dei semiconduttori e` dρ/dT < 0 mentre per i metalli e` dρ/dT > 0.

5.1.2

Esempi

1. Calcolare per il silicio e per il germanio la probabilità che, a temperatura ambiente, venga occupato il livello inferiore della banda di conduzione. La probabilità di occupazione e` data dalla funzione di Fermi-Dirac: 1 p(E) = (E−E )/kT F e +1 165

Capitolo 5

I semiconduttori

che dipende dalla differenza E − EF . Assumiamo che l’energia di Fermi si trovi all’incirca a metà tra la banda di conduzione e quella di valenza, separate dall’intervallo proibito ΔE, per cui: E − EF ≈

ΔE 2

Il valore di tale differenza e` 0.57 eV per il silicio (0.33 eV per il germanio) e risulta, quindi, essere molto più grande del valore di kT ≈ 0.026 eV. Per questo motivo la quantità e (E−EF )/kT domina il denominatore e la probabilità può essere approssimata da: p(E) ≈ e −(E−EF )/kT = e −ΔE/2kT Per il silicio si ottiene: p(E) = e −1.14/(2×0.026) = 3 × 10−10 mentre per il germanio: p(E) = e −0.67/(2×0.026) = 2.5 × 10−6 e queste sono le probabilità di avere un elettrone che salti alla banda di conduzione. 2. Calcolare, nel caso del silicio, l’aumento del numero di elettroni eccitati alla banda di conduzione, a seguito del riscaldamento del cristallo da T = 300 K a T ′ = 400 K. L’aumento del numero di elettroni di conduzione e` dovuto all’aumento della probabilità di occupare un livello energetico nella banda di conduzione. Usando l’approssimazione ottenuta nell’esempio precedente calcoliamo il rapporto tra le due probabilità p(T) e p(T ′ ): ′

p(T ′ ) e −ΔE/2kT = −ΔE/2kT p(T) e che diventa:

p(T ′ ) ΔE 1 1 = e 2 ( kT − kT ′ ) p(T) 166

Semiconduttori drogati

Capitolo 5

pari a: e

1.14 1 1 ( 0.026 − 0.035 ) 2

= 280

Poiché il numero di elettroni che passano alla banda di conduzione e` proporzionale a questa probabilità, il numero degli elettroni di conduzione aumenta di circa 300 volte. 3. Ricavare la resistività di un cristallo puro di silicio alla temperatura di 300 K e confrontarla con il valore sperimentale ρ = 2.3 × 105 Ω ⋅ cm. Ricaviamo la resistività a partire dalla mobilità μ e la concentrazione intrinseca n i , prese dalla tabella 5.1: 1 1 ρ= = σ (n i e μ n + n i e μ p ) che vale: 1 = 2.5 × 105 Ω ⋅ cm ρ= 10 1.5 × 10 × 1.6 × 10−19 × (1300 + 500) valore molto vicino a quanto misurato sperimentalmente.

5.2 Semiconduttori drogati Oltre alla conducibilità intrinseca e alla fotoconduttività c’è un altro meccanismo, molto più rilevante, per aumentare la conducibilità di un semiconduttore ed e` quello dell’inserimento nel reticolo cristallino di silicio o germanio di impurità, cioè di atomi di altro tipo, scelti opportunamente. Tale meccanismo e` chiamato drogaggio e i semiconduttori cos`ı ottenuti vengono detti semiconduttori drogati. Per differenziarsi da quanto succede per la conducibilità intrinseca si parla, in questo caso, di semiconduttori estrinsechi. Facendo riferimento alla figura 5.1, che rappresenta in due dimensioni la struttura reticolare di un cristallo di silicio, osserviamo che ciascun atomo di silicio mette a disposizione i suoi quattro elettroni di valenza per formare altrettanti legami covalenti con i quattro atomi vicini, completando l’occupazione dell’orbitale più esterno. Se ora (vedi figura 5.2) immaginiamo di sostituire un atomo di silicio con un atomo di un elemento pentavalente, quale, ad 167

Capitolo 5

I semiconduttori

Si

Si

Si

Si

Si

Si

Si

Si

Si

Figura 5.1: rappresentazione schematica bidimensionale della disposizione degli atomi di silicio entro un cristallo. I pallini rappresentano gli elettroni di valenza mentre le fasce rappresentano i legami covalenti.

esempio, il fosforo si nota che uno dei cinque elettroni di valenza del fosforo non viene usato nei quattro legami covalenti con gli atomi vicini. L’energia di legame dell’elettrone in eccesso e` molto piccola (∼ 0.05 eV) e a temperature vicine a quelle ambiente l’elettrone e` praticamente dissociato dall’atomo e libero di derivare entro il cristallo. Questo elettrone va a occupare uno dei livelli energetici discreti immediatamente al di sotto della banda di conduzione (vedi figura 5.3) e che distano da essa di una quantità Ed dell’ordine del centesimo di eV. Poiché Ed e` molto piccolo, anche a bassa temperatura gli elettroni vengono con molta facilità eccitati termicamente fino alla banda di conduzione. In questo caso si dice che l’atomo pentavalente si comporta come un atomo donatore e che l’elettrone in eccesso si trova su un livello di donazione. Il semiconduttore drogato con elementi donatori si dice di tipo “n” in quanto c’è un eccesso di portatori di carica negativi. La conducibilità elettrica del cristallo semiconduttore drogato dipende dal numero di elettroni disponibili a passare alla banda di conduzione e dipende, quindi, dalla concentrazione relativa dell’elemento donatore. Non c’è

168


Si

Si

Capitolo 5

Si

elettrone Si

P

Si

Si

Si

Si

Figura 5.2: rappresentazione schematica bidimensionale della disposizione degli atomi di silicio entro un cristallo drogato con l’aggiunta di fosforo. I pallini rappresentano gli elettroni di valenza mentre le fasce rappresentano i legami covalenti. Si noti un elettrone in eccesso vicino all’atomo di fosforo posto al centro del disegno.

bisogno però di concentrazioni elevate per ottenere un effetto consistente sulla conducibilità: come ricavato nell’esempio 4, con un drogaggio di una parte su dieci milioni si ottiene già un aumento notevole della conducibilità, rispetto a quella del semiconduttore intrinseco. Nei semiconduttori di tipo n gli elettroni nella banda di conduzione vengono chiamati portatori maggioritari, mentre le lacune nella banda di valenza partecipano anch’esse alla conduzione elettrica ma, essendo poche, vengono dette portatori minoritari. Se, invece, si introducono delle impurità trivalenti, cioè se si sostituisce un atomo di silicio con uno, ad esempio, di boro, la situazione che si presenta e` quella descritta nella figura 5.4. Questa volta l’atomo trivalente, detto accettore, partecipa solamente a tre legami covalenti e manca un elettrone per poter formare il quarto legame. Questa mancanza di un elettrone corrisponde a una lacuna che si muove con una certa libertà all’interno del cristallo comportandosi, a tutti gli effetti, come una carica positiva libera di muoversi. La presenza dell’impurità trivalente comporta la comparsa di livelli ener169

Capitolo 5

I semiconduttori

Banda di conduzione Ed

Livello di donazione

ΔE

Banda di valenza

Figura 5.3: livelli di donazione in un semiconduttore di tipo n. La loro distanza dalla banda di conduzione Ed e` molto minore dell’intervallo proibito ΔE. I pallini nella banda di conduzione rappresentano gli elettroni in eccesso eccitati termicamente alla banda di conduzione; i puntini bianchi nella banda di valenza rappresentano, invece, delle lacune minoritarie.

getici (detti livelli di accettazione, vedi figura 5.5) leggermente al di sopra della banda di valenza (Ea ∼ 0.01 eV). Questi livelli possono essere facilmente raggiunti da elettroni eccitati dalla banda di valenza lasciando lacune nella banda di valenza che si comportano come portatori maggioritari. Un elettrone che si muove per riempire una lacuna lascia una lacuna nella sua posizione originaria che verrà a sua volta riempita da un altro elettrone e cos`ı via. La lacuna si muove effettivamente in direzione opposta a quella degli elettroni e si origina un meccanismo di conduzione che non riguarda elettroni liberi. In questo caso il semiconduttore si dice di tipo “p” perché sono positive le cariche maggioritarie. Gli elettroni che si trovano nella banda di conduzione si comportano come cariche minoritarie, essendo relativamente poche. Va notato che i livelli di donazione o accettazione, posti entro la banda proibita, non significano che ci siano effettivamente elettroni o lacune mobili entro la banda proibita. I livelli servono, invece, come rappresentazione per la presenza nel cristallo di elettroni/lacune in eccesso che passano agevolmente alla banda di conduzione/valenza. Se a un semiconduttore drogato si aggiungono impurità di tipo n dimi170


Si

Si

Capitolo 5

Si

lacuna Si

B

Si

Si

Si

Si

Figura 5.4: rappresentazione schematica bidimensionale della disposizione degli atomi di silicio entro un cristallo drogato con l’aggiunta di boro. I pallini rappresentano gli elettroni di valenza, mentre le fasce rappresentano i legami covalenti. Si noti un elettrone in meno (cioè una lacuna) vicino all’atomo di boro posto al centro del disegno.

nuisce il numero di lacune nel semiconduttore. Similmente se si aggiungono impurità di tipo p diminuiscono gli elettroni liberi. Questo comportamento viene riassunto nella legge dell’azione di massa secondo la quale, all’equilibrio termico, il prodotto delle concentrazioni di elettroni liberi e lacune rimane costante al variare della concentrazione di donatori o accettori. La formula corrispondente e`: np = n2i (5.5) dove però la concentrazione intrinseca dipende dalla temperatura. Ecco che il drogaggio di un semiconduttore serve non solo ad aumentare la conducibilità, ma anche a produrre un conduttore in cui i portatori di carica hanno un segno dominante. Supponiamo che in un semiconduttore drogato ci sia una concentrazione Nd di atomi donatori che sono praticamente tutti ionizzati. Il numero di cariche positive per metro cubo sarà allora Nd + p. Se N a e` la concentrazione di atomi accettori, ciascuno dei quali contribuisce una carica negativa, il numero di cariche negative per metro cubo e` N a +n. Siccome il semiconduttore 171

Capitolo 5

I semiconduttori

Banda di conduzione

Ea

Livello di accettazione

ΔE

Banda di valenza

Figura 5.5: livelli di accettazione in un semiconduttore di tipo n. La loro distanza dalla banda di valenza E a e` molto minore dell’intervallo proibito ΔE. I puntini bianchi nella banda di valenza rappresentano delle lacune, mentre i pallini nella banda di conduzione rappresentano gli elettroni minoritari.

e` comunque elettricamente neutro, deve valere: Nd + p = N a + n

(5.6)

Se il materiale e` puramente di tipo n allora N a = 0 e n ≫ p, e la (5.6) diventa (5.7) n ≈ Nd Quindi, in un semiconduttore di tipo n la concentrazione di elettroni liberi e` pressoché uguale alla concentrazione degli atomi donatori. La concentrazione delle lacune risulta essere invece: n2 (5.8) p≈ i Nd Nel caso di un semiconduttore di tipo p i ruoli sono invertiti: la concentrazione di portatori positivi vale p ≈ N a , e per i portatori negativi n ≈ n2i /N a . Osserviamo che partendo da un semiconduttore drogato, ad esempio di tipo n, se aggiungiamo degli atomi accettori con concentrazione N a = Nd riportiamo il semiconduttore alla condizione di semiconduttore intrinseco. 172


Capitolo 5

Contrariamente a quanto succede con i semiconduttori intrinsechi, in un semiconduttore di tipo n l’energia di Fermi si trova al di sopra della metà dell’intervallo proibito perché ci sono più elettroni nella banda di conduzione che lacune nella banda di valenza. In un semiconduttore di tipo p succede l’opposto, cioè che l’energia di Fermi si trova al di sotto della metà dell’intervallo proibito. In entrambi i casi l’energia di Fermi si discosta dal centro dell’intervallo proibito tanto più quanto maggiore e` la concentrazione delle impurità e quanto minore e` la temperatura. A temperature molto basse, tali che kT ≪ ΔE, la conduzione in un semiconduttore e` dovuta essenzialmente alle impurità perché e` molto difficile che gli elettroni di valenza possano essere eccitati termicamente. A temperature più alte tutti gli elettroni/lacune dovuti alle impurità hanno contribuito alla conducibilità, quindi, l’aumento di questa dipende solo dalla conducibilità intrinseca. C’è una distinzione che va fatta tra semiconduttori a intervallo proibito diretto o indiretto, distinzione che e` importante soprattutto nei dispositivi ottici. In generale il valore più alto della banda di valenza e il valore più basso della banda di conduzione non si verificano in corrispondenza dello stesso valore per il numero d’onda k. Si chiamano diretti i semiconduttori in cui ciò avviene e indiretti tutti gli altri. Il silicio e il germanio sono esempi di semiconduttore indiretto mentre l’arseniuro di gallio e` un esempio di semiconduttore diretto (avente valore di intervallo proibito2 ΔE = 1.42 eV a temperatura ambiente). Nel caso di semiconduttori indiretti le transizioni elettroniche tra la banda di valenza e quella di conduzione, dovute all’interazione con un fotone avente energia Eγ > ΔE, possono avvenire solo se c’è interazione anche con il reticolo cristallino3 o altrimenti non si conserva la quantità di moto. Il processo indiretto avviene allora a un ritmo più lento perché riguarda tre entità (e, γ e reticolo) anziché due (e e γ). 2

Il relativemente elevato valore di ΔE per il GaAs lo rende interessante perché elimina, praticamente, il contributo intrinseco anche a temperature elevate. Il GaAs e` vantaggioso anche per l’elevata mobilità degli elettroni, il che favorisce le applicazioni ad alta velocità. Purtroppo il costo commerciale del GaAs e` circa 10 volte maggiore di quello del silicio. 3 Cioè interazione con fononi. 173

Capitolo 5

5.2.1

I semiconduttori

Proprietà elettriche di un semiconduttore drogato

La formula (5.3), ricavata per la conducibilità di un semiconduttore intrinseco, continua a valere nel caso di un semiconduttore drogato. La differenza in questo caso e` che la concentrazione dei portatori maggioritari e` essenzialmente dominata dalla concentrazione degli elementi droganti. Di conseguenza la conducibilità del cristallo può essere variata a piacere agendo sull’entità del drogaggio.

5.2.2

Effetto Hall

Consideriamo una lamina semiconduttrice di lunghezza L, avente sezione rettangolare A con larghezza ℓ e spessore t (vedi figura 5.6). Se ai capi P e P ′ della lamina viene applicata una differenza di potenziale V si viene a produrre una corrente elettrica i che fluisce nel senso della lunghezza: AV ℓtV V =σ (5.9) i= =σ R L L Misurando il valore della corrente e conoscendo la differenza di potenziale applicata e i parametri geometrici della lamina, si può determinare la conducibilità σ che risulta, nel caso di un semiconduttore fortemente drogato p, essere pari a pμ p e. In un secondo momento si viene ad applicare un campo magnetico B, uniforme e perpendicolare alla lamina. Su ciascuna delle lacune in moto con velocità pari a quella di deriva vd viene ad agire la forza di Lorentz: FL = evd × B

(5.10)

che, nelle condizioni della figura 5.6, e` diretta a sinistra. Questa forza comporta la deflessione delle lacune che vengono cos`ı a concentrarsi sulla faccia sinistra della lamina, determinando un accumulo crescente di carica positiva. Data la neutralità elettrica della lamina si ha, corrispondentemente, un accumulo di carica negativa crescente sulla faccia destra della lamina. Queste distribuzioni di carica producono un campo elettrico, di

174


Capitolo 5

i

B P Q FL

Q’ vd L

t

P’ i ℓ

Figura 5.6: rappresentazione schematica di una lamina percorsa da corrente di lacune e soggetta a effetto Hall.

ampiezza anch’essa crescente, uniforme e diretto verso destra. La forza elettrica crescente che agisce sulle lacune viene a essere diretta allora in senso opposto rispetto a quella di Lorentz. In un certo istante si raggiunge la situazione in cui forza elettrica e forza di Lorentz si bilanciano esattamente. A partire da quel momento si e` in condizioni di regime e le lacune in moto non subiscono più deflessione. Il valore del campo elettrico a regime corrisponde a una differenza di potenziale, tra i punti Q e Q ′ sulle due facce opposte della lamina, detta tensione di Hall. Tale tensione può essere ricavata dalla condizione di equilibrio: eE = evd B ⇒

eVH = evd B ⇒ VH = vd Bℓ ℓ

175

(5.11)

Capitolo 5

I semiconduttori

D’altro canto la velocità di deriva vale: i j vd = = (5.12) pe ℓt pe in funzione della concentrazione di lacune p, quindi la tensione di Hall risulta essere pari a: iB VH = (5.13) t pe Si introduce una grandezza R H , chiamata coefficiente di Hall, definita come: 1 (5.14) RH = pe che risulta essere pari a: VH t RH = (5.15) iB e, quindi, e` ricavabile a partire dalla misura di corrente e di tensione di Hall, e conoscendo lo spessore della lamina e il valore del campo magnetico applicato. In conclusione, attraverso la misura prima della conducibilità σ = pμ p e e poi del coefficiente di Hall R H = 1/pe, si può determinare sperimentalmente il valore della concentrazione di lacune p = 1/eR H e della loro mobilità μ p = σ RH . Un discorso analogo può essere fatto per un semiconduttore fortemente drogato n, per il quale gli elettroni che formano la corrente elettrica si muovono con velocità opposta e vanno ad accumularsi sulla faccia sinistra della lamina. Si produce allora un campo elettrico e una tensione di Hall di verso/segno opposto rispetto al caso precedente. In questo caso il coefficiente di Hall risulta essere R H = −1/ne e allora dal segno di R H si può stabilire il tipo di drogaggio. Nel caso in cui, invece, siano presenti con proporzioni confrontabili sia lacune sia elettroni, la conducibilità vale σ = (pμ p + nμ n )e, mentre: pμ 2p − nμ 2n RH = (5.16) e(pμ p + nμ n )2 In questo caso, misurando σ e R H e usando i valori di mobilità misurati precedentemente, si possono ricavare i valori delle concentrazioni p e n simultaneamente. 176


Capitolo 5

L’effetto Hall può essere usato, ad esempio, per costruire dispositivi atti a misurare il campo magnetico. Come visto nel capitolo 4, l’effetto Hall si verifica anche nel caso di una lamina conduttrice. La sensibilità di misura risulta però essere molto maggiore nel caso dei semiconduttori che per i metalli (vedi esempio 5) e, quindi, i primi vengono preferiti ai secondi.

5.2.3

Esempi

4. Ricavare la resistività di un cristallo di silicio drogato con un atomo donatore ogni 107 atomi di silicio. Se c’è un atomo donatore ogni 107 atomi di silicio allora: atomi 1 Nd = 7 × 5.0 × 1022 = 5.0 × 1015 10 cm3 e la concentrazione di portatori negativi vale n ≈ Nd . Dall’equazione (5.8) ricaviamo che: lacune (1.5 × 1010 )2 = 4.5 × 104 p= 15 5.0 × 10 cm3 Poiché p ≪ n, nel calcolo della conducibilità possiamo trascurare le lacune. La conducibilità vale allora: σ = ne μ n = 5.0 × 1015 × 1.6 × 10−19 × 1300 = 1.04 (Ω ⋅ cm)−1 e la resistività vale: 1 = 0.962 Ω ⋅ cm σ che e` circa 240 mila volte più piccola rispetto al semiconduttore intrinseco: la conducibilità e` aumentata di tale fattore. ρ=

5. Calcolare il coefficiente di Hall per una lamina di silicio puro a temperatura ambiente. Confrontare con il valore atteso per un metallo tipo. In questo caso le concentrazioni di elettroni e lacune sono pari a quella intrinseca: n = p = n i = 1.5 × 1016 m−3 . Le mobilità valgono invece μ n = 0.13 m2 /V⋅s e μ p = 0.05 m2 /V⋅s. Il coefficiente di Hall vale allora: 1.5 × 1016 × (0.052 − 0.132 ) = −185 m3 /A ⋅ s RH = 1.6 × 10−19 × (1.5 × 1016 )2 × (0.05 + 0.13)2 177

Capitolo 5

I semiconduttori

Nel caso di un metallo tipo la concentrazione di elettroni vale all’incirca n = 1029 m−3 , cui corrisponde: RH = −

1 1 = − 29 = −6 × 10−11 m3 /A ⋅ s ne 10 × 1.6 × 10−19

Notiamo che il valore R H (Si) ≫ R H (Fe) il che comporta che, in corrispondenza di una certa corrente e di un certo campo magnetico, si produca una tensione di Hall molto più grande e, quindi, più facilmente misurabile. Ecco perché i dispositivi basati sull’effetto Hall usano preferibilmente semiconduttori.

5.3 Dispositivi semiconduttori Il comportamento dei semiconduttori drogati può essere usato per costruire dei dispositivi con determinate proprietà elettriche ben diverse da quelle osservate in dispositivi quali i resistori e i condensatori. Come esempio descriveremo due dispositivi fondamentali, la giunzione p-n e il transistor, che sono ampiamente utilizzati all’interno dei circuiti elettronici discreti o integrati.

5.3.1

La giunzione p-n

Se noi partiamo da un semiconduttore puro e lo droghiamo con impurità trivalenti otteniamo un semiconduttore di tipo p. Se poi andiamo ad aggiungere, solo entro una certa profondità del semiconduttore, degli atomi pentavalenti otteniamo la creazione di una regione di tipo n separata da quella di tipo p, come esemplificato in figura 5.7, chiamata giunzione p-n. Il passaggio dalla regione p a quella n può essere brusco o graduale con un drogaggio che diminuisce man mano che ci si avvicina alla giunzione per poi cambiare segno. Consideriamo nel seguito il caso di un passaggio brusco perché più facile da trattare; quanto diremo vale comunque, qualitativamente, anche per la giunzione graduale. La porzione p del semiconduttore e` ricca di lacune mentre quella n e` ricca di elettroni. Quando le due regioni si trovano a contatto si ha la diffusione 178

Dispositivi semiconduttori

Capitolo 5

di elettroni/lacune da una parte all’altra del piano di giunzione. Gli elettroni che si trovano immediatamente a destra della giunzione si diffondono verso sinistra ricombinandosi con le lacune della regione p. A loro volta le lacune della regione p diffondono verso destra andandosi a ricombinare con gli elettroni della regione n. La diffusione delle cariche porta a dei fenomeni di ricombinazione elettrone/lacuna a seguito dei quali la porzione immediatamente a sinistra della giunzione assume carica negativa (perché sono “sparite” delle lacune), mentre la porzione immediatamente a destra della giunzione assume carica positiva (perché sono “spariti” degli elettroni). Queste cariche non sono cariche libere, ma cariche localizzate nella regione spessa circa 0.5 μm a ridosso della giunzione e per questo motivo vengono chiamate cariche spaziali. Tali cariche producono un campo elettrico E0 diretto verso la parte p della giunzione p-n e conseguentemente una differenza di potenziale V0 ai capi della giunzione che risulta essere pari a: V0 =

kT Nd N a ln e n2i

(5.17)

come discusso nell’esempio 6. Tale differenza di potenziale, dell’ordine di pochi decimi di volt, appare praticamente tutta agli estremi della regione di carica spaziale. L’effetto del campo E0 e` quello di esercitare una forza elettrica che, all’equilibrio, impedisce l’ulteriore diffusione degli elettroni e delle lacune. Detto diversamente, la differenza di potenziale agisce come una barriera di potenziale che impedisce alle lacune/elettroni liberi di continuare a migrare verso la regione n/p. Anche una volta raggiunto l’equilibrio si verifica un continuo passaggio di cariche attraverso la giunzione. Infatti, l’agitazione termica produce continuamente coppie elettrone-lacuna che, sottoposte al campo elettrico (diretto verso sinistra) di cui sopra, portano a una corrente di generazione (detta anche corrente termica o di deriva) diretta dal lato n a quello p perché gli elettroni prodotti nella regione p deriverebbero in direzione opposta al campo elettrico cioè verso destra. 179

Capitolo 5

I semiconduttori

p p

n − − ++ − − ++ − − ++

n

densità di carica x

spaziale campo elettrico

E0 x

potenziale

V0

x

eV0

x

energia potenziale

Figura 5.7: rappresentazione schematica di una giunzione p-n, assieme a (dall’alto verso il basso) densità di carica spaziale, campo elettrico, potenziale elettrostatico, barriera di energia potenziale (per elettroni).

180


Capitolo 5

A tale corrente si oppone la corrente di ricombinazione (detta anche di diffusione) che, invece, e` diretta dal lato p a quello n perché corrisponde a elettroni che dalla banda di conduzione nella regione n, grazie a una piccola fluttuazione nell’energia, passano alla banda di conduzione nella regione p andando ad annullare una delle tante lacune presenti nella regione p. In condizioni di equilibrio, a circuito aperto, la corrente netta stazionaria deve essere nulla, quindi, corrente di generazione e corrente di ricombinazione si annullano a vicenda. Questo fatto e` comprensibile anche dal punto di vista della termodinamica: se ci fosse una corrente essa circolerebbe e farebbe lavoro sulle cariche senza attingere energia all’esterno della giunzione, in violazione del primo principio della termodinamica. Si supponga di collegare la giunzione a un generatore di forza elettromotrice. Si dice che la giunzione p-n viene polarizzata inversamente se si applica una differenza di potenziale V (detta anche tensione) negativa ai suoi capi, cioè se si collega il polo negativo del generatore alla porzione p e il polo positivo alla porzione n della giunzione, come mostrato in figura 5.8. In tale caso le lacune nella regione p si allontanano dalla giunzione migrando verso il catodo mentre gli elettroni della regione n si allontanano dalla giunzione (e vengono raccolti all’anodo del generatore). Di conseguenza la regione di carica spaziale si estende a sinistra e a destra della giunzione e lo fa tanto più quanto più negativa e` la tensione. Se si continua ad aumentare la differenza di potenziale negativa si può raggiungere un valore in cui tutto il volume della giunzione p-n e` completamente svuotato di lacune ed elettroni liberi. La polarizzazione inversa fa aumentare l’altezza della barriera di potenziale (vedi figura 5.9) andando a bloccare il flusso di cariche maggioritarie e a ridurre la corrente di ricombinazione, mentre la corrente di generazione resta pressoché immutata poiché la corrente di generazione dipende solo dalla temperatura e dall’intervallo proibito di energia. L’effetto netto in condizioni di polarizzazione inversa sarà quello di avere una corrente estremamente piccola dovuta praticamente alla corrente di generazione. Tale piccola corrente minoritaria non e` bloccata dalla barriera di potenziale a causa del segno delle cariche e viene detta corrente di saturazione inversa. La corrente di saturazio-

181

Capitolo 5

I semiconduttori

i gen/der iric/di f f p

n −

V

+

Figura 5.8: giunzione p-n polarizzata inversamente. Sono indicate le direzioni e le intensità relative delle correnti di generazione e di ricombinazione.

ne inversa cresce all’aumentare della temperatura perché aumenta il numero di coppie elettrone-lacuna che si formano. Se, invece, si applica una differenza di potenziale V positiva, come rappresentato in figura 5.10 dove il polo positivo del generatore di forza elettromotrice e` collegato alla porzione p e quello negativo alla porzione n della giunzione, si dice che la giunzione e` polarizzata direttamente. In questo caso si abbassa l’altezza della barriera di potenziale e le lacune della regione p attraversano con facilità la giunzione e migrano nella regione n, dove esse costituiscono una corrente minoritaria iniettata (vedi figura 5.11). Similmente, molti degli elettroni liberi della regione n, vicini all’energia di Fermi EF , avranno energia sufficiente per migrare attraverso la giunzione e passare alla banda di conduzione della regione p perché il livello inferiore di questa banda si e` abbassato. Questi elettroni diventano una corrente minoritaria nella regione p. La direzione convenzionale di queste due correnti e` la stessa e si ha come risultato una corrente dovuta ai portatori minoritari che fluisce nella direzione da p a n. Siccome la corrente di generazione non dipende dalla tensione di polarizzazione l’effetto netto e` di avere una corrente nella direzione della corrente

182


Banda di conduzione

Capitolo 5

E eV0 giunzione non polarizzata

e(V0 − V)

giunzione polarizzata

Banda di valenza

p

n

Figura 5.9: diagrammi di energia per elettroni in una giunzione p-n polarizzata inversamente (V < 0).

di ricombinazione, cioè nella direzione da p a n. Per un dato valore di tensione, la corrente di polarizzazione diretta risulta molto più grande di quella di polarizzazione inversa. Va osservato che la tensione di polarizzazione viene applicata alla giunzione p-n per mezzo di contatti metallici e che entrambi i contatti metallosemiconduttore introducono un potenziale di contatto. Tali contatti sono però costruiti in modo da mantenere un potenziale di contatto costante indipendentemente dalla direzione della polarizzazione e vengono detti contatti ohmici4 . In questo caso i due potenziali di contatto si bilanciano e la tensione di polarizzazione applicata alla giunzione va a modificare di altrettanto l’altezza della barriera di potenziale. Se la differenza di potenziale ai capi della giunzione e` nulla, la giunzione risulta in corto-circuito e, quindi, anche la corrente elettrica e` nulla. In 4

I contatti ohmici consentono il passaggio di corrente nei due versi e non sono raddrizzatori. Il lavoro di estrazione ϕ del metallo, definito come l’energia necessaria a rimuovere l’elettrone, deve essere minore del lavoro di estrazione del semiconduttore per un contatto metallo-semiconduttore di tipo n. Se il semiconduttore e` di tipo p la relazione si inverte. L’alluminio e` usato in genere per contatti con semiconduttori di tipo p perché ϕ Al > ϕ Si .

183

Capitolo 5

I semiconduttori

i gen/der iric/di f f p

n +

V

−

Figura 5.10: giunzione p-n polarizzata direttamente. Sono indicate le direzioni e le intensità relative delle correnti di generazione e di ricombinazione.

questo caso deve essere nulla anche la somma delle differenze di potenziale lungo il circuito chiuso, quindi, il potenziale di giunzione V0 viene a essere compensato dai potenziali di contatto nei contatti ohmici. Ecco allora il motivo per cui V0 non può essere misurato direttamente con un voltmetro, perché tagliando il circuito si misurerebbero sia V0 sia i potenziali di contatto, ottenendo un valore risultante nullo. Se si immagina di aumentare la tensione di polarizzazione diretta, finché si raggiunge il valore V0 , l’altezza della barriera di potenziale diventerebbe nulla e di conseguenza gli elettroni sarebbero liberi di muoversi attraverso la giunzione, portando a una corrente elettrica arbitrariamente grande. Nella realtà questo non succede perché all’aumentare della corrente aumenta la resistenza del cristallo e dei contatti ohmici, con conseguente limitazione della corrente stessa. In queste condizioni non si può più pensare che tutta la tensione di polarizzazione vada ad abbassare la barriera di potenziale.

184


Banda di conduzione

Capitolo 5

E e(V0 − V) giunzione non polarizzata giunzione polarizzata

eV0 Banda di valenza

p

n

Figura 5.11: diagrammi di energia per elettroni in una giunzione p-n polarizzata direttamente (V > 0).

5.3.2

Il diodo

La giunzione p-n può essere usata come diodo raddrizzatore5 che e` un dispositivo in cui la corrente che fluisce ha valore trascurabile nel caso di polarizzazione inversa, mentre se la giunzione e` polarizzata direttamente la corrente cresce esponenzialmente e assume valori molto grandi. Il comportamento della corrente in funzione della tensione applicata al diodo e` rappresentato in figura 5.12 che fornisce quella che si chiama curva caratteristica del diodo. Tale curva e` rappresentata dalla funzione: i = i0 (e eV /kT − 1)

(5.18)

giustificabile teoricamente, dove V e` la tensione applicata alla giunzione (V > 0 nel caso di polarizzazione diretta) e i0 la corrente di saturazione in5

Anche un contatto metallo-semiconduttore può agire come raddrizzatore, cioè consentire il passaggio di corrente in una sola direzione, con curva caratteristica simile a quella di figura 5.12. In questo caso il contatto raddrizzatore viene chiamato diodo Schottky. Per avere un contatto raddrizzatore il lavoro di estrazione del metallo deve essere maggiore di quello del semiconduttore di tipo n. Per un semiconduttore di tipo p la relazione si inverte.

185

Capitolo 5

I semiconduttori

i

i0

V Figura 5.12: curva caratteristica corrente-tensione per una giunzione p-n. Tensioni positive corrispondono a una giunzione polarizzata direttamente.

versa, che e` dell’ordine del microampere per il germanio e del nanoampere per il silicio. Per valori grandi della tensione di polarizzazione diretta, il comportamento del diodo viene a essere dominato dalla resistenza del cristallo e dei contatti ohmici e la curva caratteristica diventa praticamente una retta. La forma della curva caratteristica nella regione di polarizzazione diretta mostrata in figura 5.13 e` tale che la corrente risulti pressoché nulla per valori di tensione minori di una tensione di soglia Vs , mentre per valori maggiori la corrente cresce esponenzialmente con la tensione. La tensione di soglia Vs vale circa 0.2 V per il germanio e 0.6 V per il silicio. La curva caratteristica di figura 5.13 può essere approssimata da una forma lineare del tipo rappresentato in figura 5.14. Per differenze di potenziale minori di Vs la corrente e` quasi nulla mentre per valori maggiori la corrente cresce linearmente con una pendenza pari a 1/Rd dove Rd viene chiamata resistenza diretta del diodo. Per tensioni minori di Vs si può assumere che la curva abbia una pendenza molto piccola, corrispondente a una resistenza inversa R i molto grande, pressoché infinita. Quando un circuito elettrico contiene uno o più diodi, ciascuno di essi

186


Capitolo 5

i Ge

0.2

0.4

0.6

Si

0.8

1.0

V (V)

Figura 5.13: curva caratteristica corrente-tensione per un diodo di silicio e germanio polarizzati direttamente. Si noti il valore diverso della tensione di soglia.

può essere sostituito da (approssimazione lineare): − un resistore avente resistenza Rd collegato in serie a un generatore avente forza elettromotrice Vs , se il diodo e` polarizzato direttamente; − un resistore avente resistenza inversa R i (praticamente infinita), se il diodo e` polarizzato inversamente. La figura 5.15 mostra la sostituzione equivalente. Il simbolo grafico usato per rappresentare i diodi indica con il verso della freccia il verso della corrente diretta. La base del triangolo rappresenta il lato p della giunzione mentre la barretta ne rappresenta il lato n. Operativamente, nei circuiti contenenti uno o più diodi (vedi esempi 7 e 8), si assume uno dei due possibili stati per ciascun diodo (acceso se polarizzato direttamente, spento se polarizzato inversamente), si va a sostituire il diodo secondo la ricetta di cui sopra e si va a risolvere il circuito. Una volta trovata la corrente e la differenza di potenziale ai capi dei diodi bisogna verificare però se l’assunzione da noi fatta e` soddisfatta, altrimenti si inverte lo stato del diodo e si risolve nuovamente il circuito. Si ricordi che il diodo e` effettivamente acceso se viene attraversato da una corrente nel verso diretto (cioè dall’anodo al catodo) o se, equivalentemente, la differenza di potenziale

187

Capitolo 5

I semiconduttori

i pendenza= R1d

0

Vs

V

Figura 5.14: approssimazione lineare della curva caratteristica corrente-tensione per un diodo.

nella direzione diretta supera la soglia Vs .

5.3.3

Il transistor

Il transistor, inventato nel 1948 da Shockley, Bardeen e Brattain6 , e modificato successivamente da Shockley, consiste in un cristallo di silicio (o di germanio) in cui uno strato sottile di tipo n si trova in mezzo a due strati di tipo p, come rappresentato in figura 5.16. Un tale transistor si dice di tipo “pn-p”, ma comportamenti analoghi si osservano in transistor di tipo “n-p-n” (vedi figura 5.17) in cui si inverte il tipo di drogaggio. In entrambi i casi si tratta in sostanza di una giunzione bipolare il cui comportamento può essere compreso considerando il transistor come due diodi collegati in serie. Le tre porzioni del transistor sono chiamate emettitore, collettore e base e tali termini fanno anche da attributo alle correnti che fluiscono verso il connettore corrispondente. La rappresentazione circuitale di un transistor p-n-p e` riportata in figura 5.16 (5.17 per il transistor n-p-n), dove le correnti sono 6

William Shockley (1910-1989), John Bardeen (1908-1991) e Walter Brattain (1902-1987) vincitori del Premio Nobel per la Fisica nel 1956 per l’invenzione del transistor.

188


i

Capitolo 5

anodo

Vs ∼

∼

1 Rd

Rd

1 Ri

Ri

catodo diretta inversa 0

Vs

V

Figura 5.15: sostituzione circuitale equivalente a un diodo polarizzato direttamente o inversamente.

considerate positive se fluiscono nel verso della freccia. Il verso della freccia nel simbolo usato per il transistor sta allora a indicare la direzione della corrente quando la giunzione emettitore-base e` polarizzata direttamente. Le proprietà circuitali di un transistor dipendono sostanzialmente da due cose: 1) come le due giunzioni sono polarizzate; 2) come il transistor viene collegato al circuito esterno. In base a queste condizioni il transistor può agire come amplificatore di corrente, di tensione o di potenza e come tale viene usato nei circuiti elettronici. In seguito andremo a descrivere le modalità principali del funzionamento di un transistor facendo riferimento a un transistor p-n-p di tipo simmetrico, in cui le due giunzioni (cioè le due porzioni p) hanno stessa dimensione e lo stesso drogaggio. Per quanto riguarda i transistor n-p-n (che tra l’altro sono più diffusi sul mercato) le proprietà sono analoghe se si invertono correnti e tensioni. Se non si applica nessuna tensione di polarizzazione, né sull’emettitore né sul collettore, tutte le correnti sono nulle e le barriere di potenziale delle due

189

Capitolo 5

I semiconduttori

p

E

p

n JE B

C

JC

VCE

E + VEB

iC

iE

VCB

iB

−

C +

−

B

Figura 5.16: schema di un transistor p-n-p (sopra) e corrispondente rappresentazione circuitale (sotto). JE e JC rappresentano le giunzioni p-n emettitore-base e collettore-base. Sono indicate, inoltre, le correnti di emettitore i E , di collettore i C e di base i B , assieme alle tensioni emettitore-base VEB , collettore-base VC B e collettore-emettitore VC E .

n

E

p JE B

C

JC

VCE

E + VEB −

n

iC

iE iB B

C + VCB −

Figura 5.17: schema di un transistor n-p-n (sopra) e corrispondente rappresentazione circuitale (sotto). JE e JC rappresentano le giunzioni n-p emettitore-base e collettore-base. Sono indicate, inoltre, le correnti di emettitore i E , di collettore i C e di base i B , assieme alle tensioni emettitore-base VEB , collettore-base VC B e collettore-emettitore VC E .

190


Capitolo 5

giunzioni, rappresentate in figura 5.18, hanno il valore V0 di circa qualche decimo di volt, come visto precedentemente. Per fare funzionare il transistor bisogna allora collegarlo a un circuito esterno che fornisca delle tensioni di polarizzazione ai capi delle due giunzioni. Se si polarizza direttamente la giunzione emettitore-base e inversamente quella collettore-base, come rappresentato in figura 5.19, il transitor si dice polarizzato in regione attiva. In questa condizione la barriera di potenziale emettitore-base si abbassa della quantità ∣VEB ∣ mentre la barriera di potenziale collettore-base si alza della quantità ∣VCB ∣, come indicato in figura 5.20. Ciò consente a lacune nell’emettitore di venire iniettate come cariche minoritarie nella base (e viceversa elettroni di venire iniettati dalla base all’emettitore). Tali lacune si diffondono attraverso la sottile base, arrivano alla giunzione base-collettore, dove “cadono” dalla barriera e vengono raccolte al collettore. Il principio di funzionamento del transistor in regione attiva e` che la corrente di collettore iC viene regolata dalla corrente di emettitore iE secondo la relazione: iC = iC0 (1 − e eVC /kT ) − αiE (5.19) dove iC0 e` la corrente di saturazione del collettore e α rappresenta la frazione della corrente di emettitore che compare come corrente minoritaria al collettore; VC , invece, e` la differenza di potenziale ai capi della giunzione JC . Il fattore α, detto anche guadagno di corrente, e` vicino a 1 (tipicamente maggiore di 0.9), ma non può essere uguale o superare 1 e non e` una costante, ma dipende dalla temperatura, dalla corrente iE e dalla tensione VCB . In condizioni operative normali VC e` negativo e ∣VC ∣ ≫ kT, quindi, il termine esponenziale risulta trascurabile e si può assumere: iC ≈ iC0 − αiE

(5.20)

che ha come interpretazione fisica il fatto che la corrente di collettore viene aumentata della frazione α di quella dell’emettitore. Si noti che iE > 0 poiché entrante nel transistor, mentre iC < 0 essendo una corrente uscente dal transistor, cos`ı come risulta essere negativa iB . Siccome α < 1 allora

191

Capitolo 5

I semiconduttori

∣iC ∣ < ∣iE ∣. Nonostante ciò il transistor agisce come amplificatore di potenza. Infatti, la giunzione emettitore-base viene ad assumere resistività piccola mentre la giunzione base-collettore avrebbe resistività molto più grande. Essendo ∣iC ∣ ≈ ∣iE ∣ allora la potenza P = Ri 2 risulta essere più grande nel circuito del collettore. Il comportamento del transistor viene descritto attraverso curve caratteristiche corrente-tensione del tipo mostrato in figura 5.21, espresse in funzione della corrente di emettitore. Se, invece, anche la giunzione di collettore e` polarizzata direttamente il transistor si dice in saturazione e una piccola variazione di VCB porta a un aumento esponenziale di iC come ci si aspetta nel caso di un diodo. Un modo diverso di collegare il transistor e` quello detto a emettitore comune, rappresentato in figura 5.22, dove abbiamo scelto di usare un transistor n-p-n. In questo caso la curva caratteristica diventa quella di figura 5.23 per un transistor nella regione attiva. In questo caso si vede che l’uscita di corrente risponde in modo molto sensibile a variazioni della corrente in ingresso alla base. Il transistor si trova nella regione attiva se la giunzione JC e` polarizzata inversamente di qualche decimo di volt, mentre VBE deve valere circa 0.7 V per il silicio e circa 0.2 V per il germanio. In questa configurazione la corrente al collettore segue l’andamento: iC = (1 + β)iC0 + βiB dove il parametro:

(5.21)

α (5.22) 1−α assume valori grandi, dell’ordine di 100. Poiché iB ≫ iC0 allora iC ≈ βiB ≫ iB nella regione attiva e la configurazione a emettitore comune può essere usata per ottenere un’amplificazione di corrente. Osserviamo che l’utilizzo di un transistor deve essere compatibile con le sue proprietà fisiche e, quindi, quando si sceglie un modello di transistor e` importante verificare che la corrente al collettore, la potenza di dissipazione β=

192


Capitolo 5

V

Base Emettitore JE

p

Collettore

V0 JC

n

p

Figura 5.18: potenziale per un transistor p-n-p a circuito aperto, cioè in assenza di tensioni di polarizzazione.

E

C + iC

iE + −

VB

VEB

R

VCB

iB B

−

+

−

VC Figura 5.19: schema di un transistor p-n-p polarizzato nella regione attiva. Questo tipo di collegamento si dice a base comune.

193

Capitolo 5

I semiconduttori

V ∣VEB ∣

Collettore

V0

Emettitore JE

p

∣VCB ∣

Base JC

n

p

Regio

ne sat urazio

ne

Figura 5.20: potenziale per un transistor p-n-p nella regione attiva.

Regione attiva iE = 25 mA -25 -20

iE = 20 mA

-15

iE = 15 mA

-10

iE = 10 mA

-5

iE = 5 mA 0

VCB (V)

0.8 0.6 iC (mA)

Figura 5.21: curva caratteristica corrente-tensione in uscita da un tipico transistor p-n-p al silicio in configurazione a base comune: i C in funzione di VC B per diversi valori di i E . La regione attiva corrisponde a VC B < 0.6 V, mentre per VC B > 0.6 V si e` in saturazione.

194


C

Capitolo 5

+ iC

B + VBE −

R

VCE

iB

VCC

iE E

−

Figura 5.22: schema di un transistor n-p-n in configurazione a emettitore comune.

al collettore e le tensioni di polarizzazione non superino i valori limite forniti dal costruttore. Oltre ai transistor bipolari, fino a qui descritti, esistono altri tipi di transistor tra cui quelli a effetto di campo, chiamati MOSFET, in cui una tensione (detta tensione di gate) regola il flusso di corrente tra due punti del transistor chiamati source e drain. Sia i transistor bipolari sia i MOSFET (o altri tipi ancora) possono essere usati come interruttori per costruire dei circuiti logici come quelli usati nei computer. Variando le tensioni applicate al transistor questo può passare da uno stato in cui circola corrente a uno stato in cui la corrente e` bloccata. I due stati vengono poi associati a due stati logici 0 e 1, fornendo le basi per una logica binaria. L’esempio 9 discute l’utilizzo di un transistor in un circuito elettrico semplice.

5.3.4

Esempi

6. Si consideri una giunzione p-n di silicio a temperatura ambiente in cui la concentrazione di donori (nella parte n) e accettori (nella parte p) valgono ri195

I semiconduttori

iC (mA)

Capitolo 5

40 30

iB = 160 μA

20

iB = 120 μA iB = 80 μA

10

iB = 40 μA

0 0

2

4

6

8

10

VCE (V) Figura 5.23: curva caratteristica corrente-tensione in uscita da un tipico transistor n-p-n al silicio nella configurazione a emettitore comune: i C in funzione di VC E per diversi valori di iB.

spettivamente Nd = 5 × 1015 cm−3 e N a = 1 × 1014 cm−3 . Che valore ci si aspetta per l’altezza V0 della barriera di potenziale? Facciamo riferimento a (5.17), quindi: V0 =

0.026eV 5 × 1015 × 1 × 1014 ln = 0.56 V e (1.5 × 1010 )2

7. Un generatore di fem alternata Vin viene collegato a un carico resistivo R ai cui capi si misura la differenza di potenziale Vout . Cosa succede inserendo un diodo come in figura 5.24? Quando Vin assume valori positivi maggiori di Vs allora il diodo e` “acceso”, lascia passare corrente e Vout risulta essere proporzionale a Vin . Quando, invece, Vin e` minore di Vs e soprattutto quando e` negativo, il diodo e` “spento”, non lascia passare corrente e Vout = 0. Qualitativamente Vout assume la forma indicata in figura 5.25, dove si e` assunto che l’ampiezza massima di Vin sia molto maggiore della tensione di soglia del diodo. E` chiaro allora il motivo per cui il diodo viene chiamato “raddrizzatore”, visto che l’oscillazione viene raddrizzata diventando sempre positiva.

196


Capitolo 5

8. Si risolva il circuito di figura 5.26 contenente, tra le altre cose, un diodo di silicio. Assumiamo prima che il diodo sia acceso, cioè polarizzato direttamente. Allora il circuito diventa equivalente al circuito della figura 5.27. Se, invece, il diodo e` spento non si ha passaggio di corrente e molto semplicemente Vout = 0. Consideriamo il primo caso. Applicando la legge delle maglie si ricava: V − R2 i − Vs − Rd i − R1 i = 0 cioè: i= e Vout = R1 i = 1.4 V.

V − Vs = 0.028 A R1 + R2 + Rd

9. Si risolva il circuito di figura 5.28 contenente tra le altre cose un transistor n-p-n al silicio, avente un guadagno β ≈ 100. L’applicazione della tensione VB col verso indicato dovrebbe polarizzare direttamente la giunzione base-emettitore. Del resto la giunzione collettorebase dovrebbe essere polarizzata inversamente e, quindi, il transistor sarebbe nella regione attiva, ipotesi però da verificare a posteriori. Supponiamo allora di essere nella regione attiva. La legge delle maglie applicata al circuito baseemettitore prescrive che: VB − R B iB − VBE = 0 cioè: 5 − 300 × 103 iB − 0.7 = 0 dove abbiamo usato il valore tipico VBE ≈ 0.7 V per un transistor al silicio. Si ricava: 5 − 0.7 = 0.014 mA iB = 300 × 103 e: iC ≈ βiB = 1.4 mA

197

Capitolo 5

I semiconduttori

Vin

Vout

R

Figura 5.24: schema di un circuito diodo-resistore.

Passiamo ora a discutere il circuito collettore-emettitore, applicando ancora la legge delle maglie: VC − RC iC − VCE = 0 cioè: 5 − 1 × 103 iC − VCE = 0 quindi: VCE = 5 − 1 × 103 iC = 3.6 V Ma VCE = VCB +VBE e perciò VCB = VCE −VBE = 2.9 V e la giunzione collettorebase risulta essere polarizzata inversamente come ipotizzato all’inizio.

5.4 Applicazioni Le applicazioni delle proprietà dei semiconduttori sono molteplici e sono presenti in qualsiasi dispositivo elettronico basato su componenti discrete o circuiti integrati e costituito essenzialmente da diodi e transistor. Riportiamo qui altre applicazioni di particolare interesse. 198

Applicazioni

Vin

Capitolo 5

Vout

t

t

Figura 5.25: tensione in ingresso Vin e in uscita Vout al sistema diodo-resistore.

R2

D

R1

V

Vout

Figura 5.26: schema di circuito elettrico. Si assuma V = 5 V, R 1 = 50 Ω, R 2 = 100 Ω, Vs = 0.6 V e R d = 6 Ω per correnti fino a 50 mA.

199

Capitolo 5

I semiconduttori

Rd

R2 Vs

Vout

R1

V

Figura 5.27: schema del circuito elettrico equivalente nel caso di diodo acceso.

C iC RB

B RC

VB

iB VC E

Figura 5.28: schema di circuito elettrico. VB = 5 V, R B = 300 kΩ, VC = 5 V, R C = 1 kΩ.

200

Applicazioni

Capitolo 5

Banda di conduzione

γ Banda di valenza

Figura 5.29: schema della ricombinazione in un LED. I pallini rappresentano elettroni, i puntini bianchi le lacune.

5.4.1

I LED

I LED7 sono dei diodi in grado di emettere luce. Il meccanismo di produzione della luce si basa sugli elettroni che dal limite inferiore della banda di conduzione vanno a ricombinarsi con lacune poste vicino al limite superiore della banda di valenza, come indicato in figura 5.29. Nella ricombinazione viene rilasciata un’energia pari all’incirca all’intervallo proibito ΔE. Tale energia va normalmente ad aumentare le vibrazioni del reticolo e la sua energia interna. Esistono però materiali semiconduttori (quelli diretti) in cui questa energia può convertirsi in radiazione elettromagnetica avente frequenza data dalla relazione di Einstein: ΔE (5.23) ν= h che può essere regolata se si sceglie un materiale semiconduttore con valore opportuno di ΔE. I fotoni emessi nella ricombinazione potrebbero a loro volta essere assorbiti da un elettrone nella banda di valenza che verrebbe portato alla banda di conduzione. Per non avere un effetto complessivo nullo c’è bisogno che il 7

Dall’inglese Light Emitting Diode.

201

Capitolo 5

I semiconduttori

numero di elettroni liberi (e le lacune) sia molto più grande di quello dovuto all’agitazione termica. Conviene usare, quindi, più che un semiconduttore, la giunzione p-n di un diodo fortemente drogato e polarizzato nel verso diretto. Si noti che nel caso dei LED e` importante il loro rendimento cioè la frazione di energia elettrica in ingresso convertita in energia radiante. Questo rendimento8 , dell’ordine di 20 ÷ 50 lumen/W, e` decisamente più grande di quello delle lampade a incandescenza (≈ 15 lumen/W), in cui la maggior parte dell’energia viene convertita in radiazione termica, e vicino a quello delle lampade a fluorescenza (≈ 150 lumen/W). Questo fatto, unito alle loro piccole dimensioni, rende i LED estremamente versatili nel loro utilizzo nelle fonti di illuminazione e importanti dal punto di vista del risparmio energetico. Altro vantaggio dei LED e` che attraverso la scelta dei materiali che compongono il diodo (e il valore corrispondente di ΔE) si può ottenere luce avente frequenza e colore diversi.

5.4.2

Il laser a semiconduttore

Il meccanismo della produzione di fotoni nei LED può essere sfruttato per produrre un fascio di luce laser monocromatico, collimato, brillante e coerente9 . Affinché il laser funzioni in modo efficace la cosa che bisogna assicurare e` che la banda di conduzione/valenza contenga un grande numero di elettroni liberi/lacune. Per produrre tale situazione di inversione di popolazione si ricorre a un meccanismo di pompaggio. In questo modo un grosso numero di elettroni e lacune vengono portati a uno stato meta-stabile cioè a vita media relativamente lunga. Da questo stato vengono soggetti a emissione 8

Come rendimento si prende usualmente l’efficacia luminosa definita come la porzione di energia dell’onda utile alla visione umana. Tale quantità si misura nel SI in lumen/watt dove il lumen e` l’unità con cui si misura la potenza luminosa percepita dall’occhio umano. 9 Con queste caratteristiche si intende che il fascio luminoso e` caratterizzato da una sola frequenza; e` un fascio praticamente rettilineo a divergenza trascurabile, con elevata intensità luminosa sulla sezione del fascio e con elevata estensione spaziale/temporale del pacchetto d’onda.

202

Applicazioni

Capitolo 5

contatto metallico p+ GaAs p AlGaAs regione attiva n AlGaAs n+ GaAs regione emettente contatto metallico

Figura 5.30: schema di un tipico diodo-laser.

spontanea ed emissione stimolata10 passando allo stato fondamentale attraverso l’emissione di un fotone avente frequenza dipendente dalla differenza energetica tra i due livelli; da qui la monocromaticità. La figura 5.30 mostra come e` fatto un tipico diodo-laser. Partendo da un cristallo semiconduttore, ad esempio di arseniuro di gallio (GaAs, che e` un semiconduttore diretto), si isola al centro uno strato sottile (avente spessore di circa 0.2 μm) che rappresenta lo strato attivo del laser. Attorno a questo strato si formano due zone drogate p e n che hanno un intervallo proibito 10

Il processo di emissione spontanea e` quello in cui un’elettrone passa da uno stato eccitato a un altro (a energia minore) emettendo un fotone. Ciò avviene spontaneamente in tempi molto brevi (∼ ns). L’emissione stimolata avviene quando un fotone avente energia pari alla differenza tra due stati “stimola” la diseccitazione (che avverrebbe comunque spontaneamente) senza essere assorbito. Per basse frequenze (hν ≪ kT) il ritmo a cui la diseccitazione stimolata avviene risulta essere maggiore che nel caso di emissione spontanea.

203

Capitolo 5

I semiconduttori

di poco superiore a quello dello strato attivo, come si vede in figura 5.31. La corrente in arrivo al diodo porta elettroni al lato n del diodo; alcuni di questi elettroni si spostano nella regione attiva dove restano intrappolati a causa della barriera di potenziale della regione p. Similmente le lacune migrano dal lato p alla regione attiva restandovi intrappolate. Elettroni e lacune imprigionati nella regione attiva producono l’effetto laser grazie all’emissione stimolata e alla ripetuta riflessione dalle pareti laterali trattate a specchio. La piccola dimensione, il basso assorbimento di potenza (dell’ordine dei milliwatt) e il costo ridotto di tali diodi ne hanno amplificato la diffusione. Oggi i diodi laser si trovano dappertutto, nei lettori di CD/DVD, nei lettori ottici dei codici a barre e nelle telecomunicazioni, accoppiati a fibre ottiche.

5.4.3

La cella fotovoltaica

In un diodo al buio e a circuito aperto non ci sono correnti stazionarie circolanti e il potenziale di contatto tra i contatti metallo-semiconduttore bilancia il potenziale della giunzione p-n. Se però la giunzione e` esposta alla luce si osservano una tensione e una corrente misurabili. Consideriamo prima il caso della giunzione a circuito aperto. La luce che incide sulle regioni p e n crea coppie elettrone-lacuna in entrambe le regioni. Elettroni presenti in eccesso nella regione p si diffondono e migrano attraverso la giunzione fino alla regione n. Analogamente lacune create dalla luce nella regione n migrano verso la regione p. Si produce, quindi, come mostrato in figura 5.32, una carica netta positiva sul lato p e una carica netta negativa sul lato n. L’effetto e` quello di abbassare la differenza di potenziale ai capi della giunzione dal valore V0 a V0 − Φ0 . Tale nuovo valore per il potenziale di giunzione non viene più bilanciato dal potenziale di contatto e, quindi, ai capi della giunzione p-n a circuito aperto si manifesta una tensione misurabile diversa da zero detta fotovoltaggio e pari a Φ0 . Questo fenomeno e` chiamato effetto fotovoltaico. Se adesso immaginiamo di chiudere il circuito, il fotovoltaggio produce la circolazione di una corrente elettrica nel circuito esterno poiché la corrente di generazione i gen (ottica in questo caso) e` maggiore di quella di ricombi204

Applicazioni

Capitolo 5

nazione iric che e` indipendente dalla luce. Tale corrente si mantiene durante tutta la fase di illuminazione, cioè fintantoché continua la produzione ottica di elettroni/lacune in eccesso. L’intensità della corrente dipende dall’intensità di illuminazione perché il numero di elettroni prodotti e` proporzionale al numero di fotoni incidenti e, quindi, all’intensità della luce. Inoltre, più grande e` la corrente di generazione, più grande e` la potenza erogata al circuito esterno con conseguente maggiore efficienza di conversione da energia luminosa a energia elettrica. Oltre all’intensità di illuminazione ci sono altri fattori che influenzano la corrente prodotta e l’efficienza di conversione. Due sono i fattori importanti: lo spessore d di semiconduttore prima della giunzione (cioè rivolto alla luce) e lo spessore D dopo la giunzione (vedi figura 5.33). Se lo spessore d e` troppo grande, la luce verrà assorbita distante dalla regione di giunzione e, quindi, la corrente di diffusione verrà ridotta a causa del maggior numero di ricombinazioni che si possono verificare prima di arrivare alla giunzione. D’altro canto se d e` troppo sottile ci sarà una probabilità minore che la luce venga assorbita a formare coppie elettrone/lacuna. Valori ottimali per d sono di circa 1 μm, mentre lo spessore D dipende dallo spessore dei cristalli che e` tipicamente di qualche centinaio di micrometri. Un altro aspetto da considerare e` la dipendenza dalla frequenza della luce incidente, tipicamente luce solare, che non e` monocromatica, ma ha un ampio spettro di frequenze. In questo caso conviene scegliere materiali semiconduttori che abbiano un intervallo proibito ΔE vicino all’energia della radiazione incidente cioè vicino al valore dell’energia dei fotoni in corrispondenza del massimo della radianza spettrale, che per la luce solare e` circa 2 eV. Ricordando che l’intervallo proibito di silicio (germanio) vale 1.14 (0.67) eV risulta chiaro il motivo per cui celle al silicio risultano più efficienti di quelle al germanio, ma anche che semiconduttori di tipo differente, tipo i composti GaP o SiC possano risultare ancora più efficienti. Le celle fotovoltaiche disponibili attualmente hanno un’efficienza tipica di circa il 20%, con tensioni in uscita attorno a 0.6 V e potenze in uscita di

205

Capitolo 5

I semiconduttori

Banda di conduzione

γ Banda di valenza tipo n

regione attiva

tipo p

Figura 5.31: configurazione delle bande in un diodo-laser. I pallini rappresentano elettroni, i puntini bianchi le lacune.

circa 200 W per m2 di superficie illuminata. Efficienze record di circa il 45% sono state raggiunte recentemente, ma si tratta di prototipi. Nonostante l’efficienza relativamente alta, al momento il costo dell’elettricità prodotta con celle fotovoltaiche e` superiore a quello dell’elettricità prodotta con altre sorgenti, e ciò non ne facilita la diffusione commerciale.

5.4.4

I rivelatori di particelle

Quando una particella carica attraversa uno strato di materiale essa può, se possiede energia sufficiente, interagire con gli elettroni e ionizzare gli atomi al suo passaggio. Si può allora evidenziare il passaggio di particelle cariche nella materia rivelando gli elettroni di ionizzazione che vengono prodotti lungo la traiettoria. A tale scopo si possono usare diversi dispositivi, ma un esempio interessante, per l’accuratezza raggiungibile sulla misura spaziale, e` dato dai cosiddetti rivelatori a microstrisce. In questo caso si usano dei cristalli di silicio drogati n su cui vengono formate delle micro-strisce fortemente drogate p (per cui si usa il simbolo p+ ), a formare un sistema di giunzioni p-n co-

206

Applicazioni

Capitolo 5

Luce

Elettroni in eccesso Lacune in eccesso

p

n + ϕ0 −

Figura 5.32: rappresentazione schematica di una giunzione p-n colpita dalla luce.

D

d Luce

Elettroni in eccesso Lacune in eccesso

p

n

i Figura 5.33: rappresentazione schematica di una cella fotovoltaica.

207

Capitolo 5

I semiconduttori

me in figura 5.34. Tali giunzioni sono polarizzate inversamente con tensioni relativamente elevate (V ∼ 100 V) in modo da produrre uno svuotamento totale della giunzione stessa, eliminando la presenza di cariche libere entro il semiconduttore. Particelle cariche che attraversano il cristallo producono un elevato numero di coppie elettrone-lacuna11 . Gli elettroni migrano verso l’anodo (la parte n+ ) mentre le lacune migrano verso il catodo rappresentato dalle strisce p+ e vengono raccolte in tempi dell’ordine della decina di nanosecondi, originando una corrente sulla striscia. La coordinata della striscia percorsa da corrente (o il baricentro nel caso di più strisce) dà un’informazione sulla coordinata di passaggio della particella ionizzante con incertezze dell’ordine di qualche micrometro (per distanze tra strisce di qualche decina di micrometri).

5.4.5

Il regolatore di tensione

Quando si polarizza un diodo con una tensione inversa molto grande si può raggiungere una regione detta di breakdown dove si verifica un brusco allontanamento dal comportamento descritto dalla curva caratteristica di figura 5.12, che diventa quella di figura 5.35. La differenza di potenziale resta fissa al valore VZ anche se la corrente varia molto, fintantoché la corrente non scende al di sotto del valore i Z0 . Il limite superiore sulla corrente tollerabile e`, invece, dettato dalla capacità del diodo di dissipare potenza elettrica. Un diodo che ha caratteristiche di dissipazione di potenza adeguate a operare nella regione di breakdown viene chiamato diodo Zener e usato come regolatore di tensione. Il meccanismo su cui si basano tali diodi ha a che fare con la realizzazione di grandi correnti elettriche inverse secondo due possibili modalità. In un caso (meccanismo a valanga) un portare minoritario generato termicamente “cadendo” dalla barriera di potenziale acquisisce energia cinetica 11

Tipicamente questi rivelatori hanno spessori di circa 300 μm, e per essi vengono prodotte circa 3 × 104 coppie elettrone-lacuna.

208

Applicazioni

Capitolo 5

Al

SiO2 p+ n+

+ − + − + − − + e ℓ + − + − + −

silicio di tipo n

V >0 Figura 5.34: rappresentazione schematica di un rivelatore di vertice a microstrisce. Le regioni p+ e n+ rappresentano porzioni di semiconduttore fortemente drogate rispetto al drogaggio della porzione n. Le strisce conduttrici di alluminio portano la corrente ai circuiti elettronici di lettura e sono isolate le une dalle altre dalle strisce di SiO2 .

sufficiente a urtare con uno ione nel cristallo e a rompere uno dei suoi legami covalenti. Si viene a produrre un’altra coppia elettrone-lacuna che può a sua volta acquisire sufficiente energia da rompere un altro legame covalente. Si produrrebbe, cos`ı, un effetto a valanga che porta a grandi correnti inverse. La tensione di breakdown in questo caso viene a dipendere dal drogaggio: maggiore e` il drogaggio e minore e` la tensione di breakdown. Secondo un’altra modalità (meccanismo Zener), l’evento scatenante la valanga e`, invece, la rottura diretta del legame a causa dell’intenso campo elettrico applicato. Questo meccanismo predomina quando il drogaggio e` intenso, lo spessore dello strato di svuotamento molto piccolo e, quindi, l’effetto tunnel rilevante. Sfruttando le due modalità si possono ottenere dei diodi Zener in grado di mantenere una differenza di potenziale fissa a valori tra la decina e le centinaia di volt, con capacità dissipativa dell’ordine della decina di watt.

209

Capitolo 5

I semiconduttori

i VZ i Z0

V

iZ

Figura 5.35: curva caratteristica corrente-tensione per un diodo Zener.

5.5 Quesiti di riepilogo 1. Quali altri elementi, a parte fosforo (boro) possono essere usati per formare un semiconduttore drogato n (p)? 2. La conducibilità di un semiconduttore intriseco aumenta o diminuisce con la temperatura? Perché? 3. Un semiconduttore intrinseco viene prima drogato con atomi donatori con concentrazione Nd e successivamente con atomi accettori con concentrazione N a . Se Nd = N a cosa succede al semiconduttore e alla sua conducibilità? 4. Quali sono i portatori maggioritari in un cristallo di silicio drogato con boro? 5. Per un semiconduttore drogato p allo zero assoluto, dove si trova l’energia di Fermi rispetto al centro dell’intervallo proibito? 6. Quali proprietà di un semiconduttore potrebbero essere determinate ricorrendo all’effetto Hall? 210


Capitolo 5

D2 R2

Vin

D1

R1

R

Vout

Figura 5.36: schema di circuito elettrico.

7. Come agiscono sul numero di elettroni liberi e di lacune i fenomeni di ricombinazione e di generazione termica? 8. Quali sono le due proprietà principali che distinguono i semiconduttori dai conduttori? 9. Cosa succede alla regione di carica spaziale quando si aumenta la tensione di polarizzazione inversa in una giunzione p-n? 10. Cosa succede alla corrente di saturazione inversa di un diodo all’aumentare della temperatura? Perché? 11. Perché la conducibilità di un semiconduttore aumenta all’aumentare della temperatura mentre per un metallo si verifica l’opposto? 12. La corrente di saturazione inversa e` tipicamente maggiore per un diodo di silicio o uno di germanio? Perché? 13. Qual e` il segno di iE , iC , VCB e VEB per un transistor p-n-p a base comune in regione attiva? (Le correnti sono considerate positive se fluiscono verso il transistor). 211

Capitolo 5

I semiconduttori

C iC RB

B RC

VB

iB VC E

Figura 5.37: schema di circuito elettrico.

5.6 Esercizi 1. Ricavare il numero di atomi di germanio per centimetro cubo e confrontare con il valore di tabella 5.1. 2. Ricavare la resistività di un cristallo puro di germanio alla temperatura di 300 K e confrontarla con il valore sperimentale riportato in tabella 5.1. 3. Ricavare la resistività di un cristallo di germanio, a temperatura ambiente, drogato con un atomo accettore ogni 106 atomi di germanio. 4. Che tipo di semiconduttore si ottiene drogando un cristallo di germanio con a) arsenico, b) gallio, c) indio, d) antimonio? 5. Calcolare il valore del coefficiente di Hall per germanio a temperatura ambiente. 6. Si risolva il circuito di figura 5.36 dove Vin = V0 sin ωt (V0 = 10 V), R1 = 50 Ω, R2 = 100 Ω, R = 100 Ω e per i due diodi Vs ≈ 0 V (per semplicità) e Rd = 10 Ω fino a 100 mA.

212

Esercizi

Capitolo 5

7. Si risolva il circuito di figura 5.37 ricavando il valore di iC . Si assuma che per il transistor p-n-p di silicio sia β = 50. Si usi VB = 5 V, R B = 200 kΩ, RC = 4 kΩ, VC = 10 V e VBE = 0.7 V, ma prima si definisca il verso di VB e VC affinché il transistor sia in regione attiva.

213

Capitolo 6 Diamagnetismo e paramagnetismo Corpi solidi privi inizialmente di proprietà magnetiche manifeste e posti in una regione in cui e` presente un campo magnetico altamente disuniforme sono soggetti a una forza, piccola o grande a seconda dei casi, diretta nella direzione in cui la disuniformità e` maggiore (cioè nella direzione del gradiente del campo magnetico) o nel verso opposto. Se un tale fenomeno avviene vuol dire che il campo magnetico va a modificare le proprietà magnetiche del corpo e, come si dice, lo magnetizza. In analogia con quanto avviene per la polarizzazione di un dielettrico, si immagina che vengano creati dei dipoli magnetici e che il corpo trasli a causa dell’interazione dei dipoli con il campo magnetico non uniforme. Per capire cosa stia alla base di un tale fenomeno andiamo a studiare le diverse modalità secondo le quali si produce la magnetizzazione tenendo presente che, come abbiamo visto nel capitolo 3, gli atomi possono possedere un momento di dipolo magnetico che dipende dal momento angolare orbitale e di spin dell’atomo. Se un mezzo viene sottoposto a un campo magnetico esterno sono i dipoli magnetici contenuti nel volume che interagiscono con il campo producendo la magnetizzazione del materiale.

Capitolo 6

Diamagnetismo e paramagnetismo

6.1 Campo magnetizzante e magnetizzazione Per affrontare l’argomento delle proprietà magnetiche della materia si preferisce qui distinguere tra il campo magnetizzante H1 , che dipende solo dalle correnti libere, e il campo magnetico vero e proprio B, che dipende anche dalle cosiddette correnti di magnetizzazione presenti in un corpo immerso in un campo H. Fatta questa distinzione, il campo magnetico all’interno di un corpo viene a valere: (6.1) B = μ0 H + μ0 M dove M rappresenta la magnetizzazione del corpo, definita come il momento di dipolo magnetico netto per unità di volume, cioè: μ ∑ μ M= = i i (6.2) V V dove la somma ∑i va intesa come somma vettoriale di tutti i dipoli magnetici μ i contenuti entro il volume V. Ricavare la magnetizzazione di un mezzo qualsiasi può essere una cosa complicata ma, in certi materiali magnetici dotati di una certa simmetria geometrica, la magnetizzazione risulta essere proporzionale al campo magnetizzante stesso secondo l’espressione: M = χm H

(6.3)

dove si e` introdotta la quantità adimensionale χm , chiamata suscettibilità magnetica2 . In queste condizioni il campo magnetico totale risulta essere allora: B = μ0 (1 + χm )H = κ m μ0 H 1

(6.4)

Il campo magnetizzante H detto anche intensità magnetica o induzione magnetica si misura in A/m e per esso la legge di Ampère diventa ∮ H ⋅ ds = i c dove i c e` la corrente totale (di cariche libere) concatenata con il percorso di integrazione. 2 Anche se χ m e` una quantità adimensionale bisogna prestare ugualmente attenzione al sistema di unità usato perché cambiano le equazioni che definiscono le grandezze fisiche in gioco. Nel SI infatti e` B = μ 0 (H + M) mentre nel CGS si scrive B = H + 4πM, quindi, χ SI = 4π χ CG S . 216

Campo magnetizzante e magnetizzazione

Capitolo 6

dove la quantità κ m = 1 + χm e` chiamata permeabilità magnetica relativa e caratterizza la risposta magnetica del mezzo rispetto a quella del vuoto. Studiando la magnetizzazione di corpi sottoposti a campo magnetizzante si scopre che esistono classi di materiali per cui la suscettibilità magnetica risulta essere piccola e negativa oppure piccola e positiva. Nel primo caso si ha a che fare con materiali detti diamagnetici, mentre nel secondo caso si parla di materiali paramagnetici. Esistono poi altre classi, tra le quali quella dei materiali ferromagnetici, in cui, invece, la suscettibilità assume valori positivi anche molto grandi. Tali materiali saranno però oggetto del prossimo capitolo. Data la piccolezza (in modulo) del valore della suscettibilità nei materiali diamagnetici e paramagnetici, possiamo assumere: B (6.5) B ≈ μ0 H, M ≈ χm μ0 e, quindi, la suscettibilità stessa può essere definita come: μ0 M χm = (6.6) B Per questi materiali risulta in genere più semplice fare riferimento a B anziché H, e cos`ı faremo nel seguito. La differenza tra il comportamento diamagnetico e quello paramagnetico dipende dalla presenza nel materiale di momenti di dipolo magnetici. Il diamagnetismo corrisponde allora al caso di assenza di magnetizzazione intrinseca e si verifica sostanzialmente nei materiali in cui tutti gli atomi hanno momento di dipolo magnetico nullo. Affinché ciò avvenga deve essere nullo sia il momento angolare orbitale L sia quello di spin S. Non essendoci dipoli magnetici permanenti per questi materiali si produce comunque, come vedremo più avanti, una magnetizzazione estremamente debole che tende a ridurre il campo magnetico esterno. Se o L o S o entrambi sono non nulli allora gli atomi sono dotati di momento di dipolo magnetico che andrà a interagire con il campo magnetizzante producendo una debole magnetizzazione del mezzo che aumenta il campo magnetico all’interno del mezzo stesso: questo e` il caso dei materiali paramagnetici. 217

Capitolo 6


Senza entrare nei dettagli osserviamo che, anche se si possono impostare dei ragionamenti classici per cercare di spiegare i fenomeni dia- e paramagnetici, una spiegazione corretta e coerente può essere data solo dalla meccanica quantistica3 .

6.2 Diamagnetismo Il fenomeno del diamagnetismo, inizialmente osservato in corpi che venivano respinti da un magnete molto intenso, ha a che fare con la proprietà delle cariche elettriche in moto entro gli atomi di schermare il corpo cercando di impedire alle linee del campo magnetico di entrare in esso. Ciò può essere compreso alla luce della legge di Lenz4 per le correnti indotte. Dal punto di vista dell’elettromagnetismo classico una corrente indotta, che va ad aggiungersi alla corrente associata a un elettrone orbitante attorno al nucleo, sarebbe equivalente alla sovrapposizione di un moto di precessione5 dell’elettrone con frequenza angolare pari a quella di Larmor6: ω = ωL =

eB 2m

(6.7)

dove B e` il campo magnetico applicato al corpo e m la massa dell’elettrone. Se introduciamo il periodo del moto orbitale T = 1/ν = 2π/ω allora la corrente dovuta agli Z elettroni dell’atomo può essere scritta come: i=

Ze eB −Ze =− ⋅ T 2π 2m

3

(6.8)

Già Bohr aveva dimostrato ciò nella sua tesi di dottorato (1911). La legge di Lenz per l’induzione elettromagnetica prescrive che a seguito di una variazione di flusso magnetico si generi una corrente indotta che si oppone alla variazione stessa. 5` E il momento angolare dell’elettrone a precedere attorno a B cos`ı come per una trottola o giroscopio in rotazione il suo asse di rotazione precede attorno alla verticale. 6 Il teorema di Larmor prescrive che, in presenza di campo magnetico, il moto degli elettroni attorno al nucleo sia lo stesso di quello in assenza di campo, con la sovrapposizione di un moto di precessione con frequenza angolare ω L . 4

218

Diamagnetismo

SOSTANZA Bismuto Germanio Oro Mercurio Argento Berillio Carbonio (diamante) Piombo Carbonio (grafite) Cloruro di sodio Rame Acqua Silicio Anidride carbonica (1 atm) Azoto (1 atm)

Capitolo 6

χm (×10−5 ) −16.6 −7.1 −3.4 −2.9 −2.6 −2.3 −2.1 −1.8 −1.6 −1.4 −1.0 −0.9 −0.4 −1.1 × 10−3 −5.4 × 10−4

Tabella 6.1: suscettibilità magnetica a temperatura ambiente per alcune sostanze diamagnetiche. (Ordinate per valori assoluti decrescenti).

e considerando la definizione di momento di dipolo magnetico μ = iA, dove A = πr 2 e` l’area dell’orbita circolare, si ottiene: μ=−

Ze 2 B 2 ⟨r ⟩ 6m

(6.9)

La formula fa riferimento a orbite in tre dimensioni anziché in due e, quindi, per ricavarla si e` diviso per 3/2 per tenere conto che il valore medio di r 2 in tre dimensioni e` 3/2 di quello in due dimensioni7 . Indichiamo esplicitamente con il segno negativo il fatto che la magnetizzazione si oppone in verso al campo applicato. In tre dimensioni ⟨r 2 ⟩3d = ⟨x 2 ⟩ + ⟨y 2 ⟩ + ⟨z 2 ⟩ = 3⟨x 2 ⟩ per una distribuzione sferica di carica. In due dimensioni sarebbe ⟨r 2 ⟩2d = ⟨x 2 ⟩ + ⟨y 2 ⟩ = 2⟨x 2 ⟩. Quindi ⟨r 2 ⟩3d = 32 ⟨r 2 ⟩2d . 7

219

Capitolo 6


Considerando ora la presenza di n atomi per unità di volume la suscettibilità magnetica diventa: χm = −

μ0 nZe 2 2 μ0 nμ = − ⟨r ⟩ B 6m

(6.10)

detta formula di Langevin. Tale formula e` stata qui ricavata seguendo argomentazioni proprie della fisica classica, ma la stessa espressione si otterrebbe seguendo i principi della meccanica quantistica. La suscettibilità magnetica di un corpo diamagnetico viene allora a dipendere dalla distribuzione spaziale degli elettroni entro l’atomo, cioè dalla quantità ⟨r 2 ⟩, che può essere ricavata solo dalla meccanica quantistica. Per fornire un’idea della grandezza della magnetizzazione riportiamo in tabella 6.1 il valore della suscettibilità magnetica per alcune sostanze diamagnetiche; si tratta comunque di valori molto piccoli, tipicamente dell’ordine di 10−9 ÷ 10−5. Il fatto che la suscettibilità magnetica delle sostanze diamagnetiche risulti negativa comporta una magnetizzazione che tende a ridurre all’interno del mezzo il campo magnetico applicato dall’esterno. Ai fini pratici, data la piccolezza di χm , si e` giustificati però ad assumere che nel mezzo B ≈ μ0 H, come nel vuoto. Ciò non impedisce che ci siano degli effetti macroscopici osservabili, infatti, in presenza di un campo magnetizzante non uniforme si sviluppa (vedi 3.53) una forza sul corpo diamagnetico opposta al gradiente del campo. Tutte le sostanze sono soggette agli effetti diamagnetici sopra descritti e sono intrinsecamente diamagnetiche. Esse restano tali a meno che altri fenomeni quali il paramagnetismo o il ferromagnetismo non prendano il sopravvento.

6.3 Paramagnetismo Esistono dei materiali, detti paramagnetici, in cui gli atomi che li compongono sono dotati di momento di dipolo magnetico diverso da zero. Questo si

220

Paramagnetismo

Capitolo 6

può verificare se gli atomi possiedono un numero dispari di elettroni di modo che il momento angolare orbitale o di spin risulti non nullo, oppure nel caso di atomi/ioni con un guscio interno parzialmente riempito8 come nel caso delle terre rare e degli attinidi. Altri esempi di materiali paramagnetici si trovano tra i metalli. In assenza di campo magnetico applicato dall’esterno tutti i dipoli magnetici sono orientati a caso e, quindi, in un certo volume la somma vettoriale dei momenti di dipolo magnetico risulta nulla, come anche la magnetizzazione. La presenza di un campo magnetizzante esterno comporta, invece, un’interazione con i singoli dipoli magnetici, che tendono ad allinearsi con il campo esterno a causa del momento di forza: τ = μ×B

(6.11)

Va notato che l’allineamento non e` perfetto perché e` ridotto dall’agitazione termica degli atomi che tende a riorientare in modo causale i dipoli atomici. E` comprensibile allora che, in generale, l’allineamento tenda a essere maggiore in presenza di campi magnetizzanti intensi e per basse temperature. Il tendenziale allineamento dei dipoli magnetici comporta che la somma vettoriale dei momenti di dipolo magnetico in un certo volume di materiale risulti non nulla e di conseguenza risulti non nulla anche la magnetizzazione. Considerando il momento angolare totale J degli elettroni dell’atomo, il momento magnetico risulta essere: μ = −g

μB J ħ

(6.12)

dove il fattore g vale circa 2 per un elettrone dotato di spin, ma non di momento angolare orbitale. In generale invece per un atomo libero vale 8

In materiali con sottogusci parzialmente riempiti gli spin tendono a disporsi secondo le regole di Hund, in modo tale da (1) massimizzare il numero quantico di spin totale s, soddisfacendo al principio di esclusione, (2) massimizzare il numero quantico orbitale totale ℓ, consistentemente con s, e (3) con un numero quantico totale j che vale j = ∣ℓ−s∣ o j = ∣ℓ+s∣ a seconda che l’orbitale sia riempito meno o più di metà. 221

Capitolo 6


U

m j = + 32 g μB B m j = + 21

U0

g μB B m j = − 21 m j = − 32

Figura 6.1: livelli energetici di un atomo sottoposto a campo magnetico, nel caso j = 3/2.

(equazione di Landé): g =1+

j( j + 1) + s(s + 1) − ℓ(ℓ + 1) 2 j( j + 1)

(6.13)

dove j, ℓ e s sono i numeri quantici associati rispettivamente al momento angolare totale, orbitale e di spin. Quando il dipolo magnetico e` sottoposto a un campo magnetico la sua energia E cambia della quantità: U = −μ ⋅ B

(6.14)

corrispondente all’interazione tra dipolo e campo magnetico. Chiamando z la direzione del campo magnetico risulta allora: U = −μz B = g

μB Jz B ħ

(6.15)

Poiché la componente Jz del momento angolare totale assume i valori quantizzati m j ħ, dove il numero quantico m j varia tra − j e j con incrementi di una unità, l’energia del sistema atomico vale U = m j g μ B B e si scinde in 2 j + 1 livelli equispaziati, come descritto in figura 6.1. 222

Paramagnetismo

Capitolo 6

Nella maggior parte dei solidi si osserva solo paramagnetismo legato agli spin. Infatti, nei cristalli le orbite elettroniche sono fortemente accoppiate al reticolo e ciò impedisce ai momenti di dipolo magnetico orbitali di allinearsi nella direzione del campo magnetico; si ha come uno spegnimento dei momenti angolari orbitali. Un’eccezione a questo comportamento si trova negli elementi delle terre rare che mostrano lo stesso comportamento magnetico sia in fase liquida sia in fase solida. Trattiamo ora il caso semplice di un atomo i cui elettroni sono dotati solo di spin e hanno momento angolare orbitale nullo. In questo caso (g = 2, j = s = 1/2 e m j = ±1/2) vale U = μ B B e si ha la scissione in solo due sottolivelli aventi energia: (6.16) E↑ = E + U e E↓ = E − U dove il primo valore si riferisce a uno spin parallelo al campo magnetico (“spin su”), mentre il secondo riguarda uno spin antiparallelo rispetto a B (“spin giù”). Se abbiamo n atomi per unità di volume essi si distribuiscono tra i due livelli con probabilità9 che sono proporzionali al fattore: e −E/kT

(6.17)

quindi, il numero di atomi, per unità di volume, con spin allineato al campo B sarà dato da: ↑ (6.18) n↑ = Ae −E /kT mentre quello degli atomi con spin antiparallelo sarà: n↓ = Ae −E

↓

/kT

(6.19)

dove A e` una costante di proporzionalità che e` la stessa nei due casi. Poiché deve essere: (6.20) n↑ + n↓ = n 9

Questo e` un risultato della meccanica statistica secondo il quale all’equilibrio termico alla temperatura T la distribuzione statistica di particelle su vari stati energetici e` tale che il numero N i di particelle nello stato di energia E i risulta proporzionale a e −E i /kT (distribuzione di Boltzmann). 223

Capitolo 6


allora la costante di proporzionalità assume il valore: A=

e −E ↑ /kT

n + e −E ↓ /kT

(6.21)

Data la carica elettrica negativa degli elettroni, gli atomi con lo spin su contribuiscono con un momento magnetico con componente −μ, mentre quelli con spin giù contribuiscono con +μ. Il momento magnetico medio vale allora: n↑ (−μ) + n↓ (μ) (6.22) ⟨μ⟩ = n cioè: ⟨μ⟩ = (−

e

−E ↑ /kT

n n −E ↑ /kT −E ↓ /kT e μ + μ) /n ↓ ↑ ↓ /kT e −E /kT −E /kT −E +e e +e ↑

↓

−e −E /kT + e −E /kT = −E ↑ /kT μ (6.23) e + e −E ↓ /kT che, in seguito all’introduzione dei valori dei sottolivelli energetici, diventa: −e −E/kT e −U/kT + e −E/kT e U/kT μ ⟨μ⟩ = −E/kT −U/kT e e + e −E/kT e U/kT =

e μ B B/kT − e −μ B B/kT e U/kT − e −U/kT μ = μ e U/kT + e −U/kT e μ B B/kT + e −μ B B/kT

(6.24)

formula usata nel caso di solo spin. La magnetizzazione e` definita come il momento magnetico per unità di volume, quindi: M = n⟨μ⟩ = nμ

μB B e μ B B/kT − e −μ B B/kT ) = nμ tanh( μ B/kT −μ B/kT B B e +e kT

(6.25)

Questa espressione, detta formula paramagnetica di Langevin, descrive la magnetizzazione in funzione del rapporto B/kT. Tale funzione ha il comportamento crescente descritto in figura 6.2, in accordo con le misure sperimentali.

224

Paramagnetismo

Capitolo 6

Notiamo che nel caso in cui μ B B ≪ kT (vedi esempio 1) la tangente iperbolica tanh(μ B B/kT) tende al valore μ B B/kT (vedi esempio 2) e, quindi, la magnetizzazione risultante per n atomi per unità di volume diventa: M ≈ nμ

μ2 B μB B =n B kT kT

(6.26)

poiché (per elettroni dotati solo di spin) μ = μ B . La suscettibilità magnetica vale allora: μ0 M μ0 nμ 2B C = = χm ≡ (6.27) B kT T dove la costante C = μ0 nμ 2B /k, detta costante di Curie, e` proporzionale al numero di atomi per unità di volume. Ricordiamo che questa formula, detta legge di Curie10 in onore di Pierre Curie11 , e` stata ricavata assumendo che gli elettroni avessero solo momento angolare di spin. Nel caso generale, invece, in cui essi abbiano anche momento angolare orbitale le cose vanno modificate tenendo conto del fattore di Landé g ≠ 2 e del fatto che i dipoli magnetici sono liberi di ruotare. Si ottiene ancora una suscettibilità magnetica inversamente proporzionale alla temperatura, secondo l’espressione: χm =

μ0 ng 2 j( j + 1)μ 2B μ0 nn2B μ 2B = 3kT 3kT

(6.28)

√ dove nB = g j( j + 1) e` il numero effettivo di magnetoni di Bohr. La legge di Curie prevede che la magnetizzazione cresca indefinitamente al crescere del campo magnetizzante. Ciò ovviamente non può essere vero infatti, come scritto in (6.2), la magnetizzazione di un corpo dipende dalla somma vettoriale dei singoli momenti di dipolo magnetico. All’aumentare dell’intensità del campo magnetizzante l’allineamento dei dipoli aumenta, 10

La legge di Curie, ricavabile classicamente, contiene in realtà un fattore 3 a denominatore, a differenza della formula quantistica. 11 Pierre Curie (1859-1906), fisico francese vincitore nel 1903 del Premio Nobel per la Fisica assieme alla moglie Maria Sklodowoska-Curie e Henri Becquerel per la scoperta della radioattività.

225

Capitolo 6


M/M s 1 0.75 0.5 0.25 0 0

1

2

3

4

B/T (T/K) Figura 6.2: rapporto M/M s in funzione del rapporto B/T. Si noti il raggiungimento della condizione di saturazione, l’allontanamento dalla legge di Curie (linea tratteggiata) e l’accordo tra la formula paramagnetica di Langevin (linea continua) e i dati sperimentali (●).

ma nel momento in cui tutti sono esattamente allineati avremmo che la magnetizzazione raggiunge il suo valore massimo Ms , chiamato magnetizzazione di saturazione, che non può aumentare in seguito a un ulteriore aumento del campo magnetizzante. Il raggiungimento della condizione di saturazione viene favorito dall’aumentare del campo magnetizzante, ma viene contrastato da un aumento di temperatura. La legge di Curie, nella forma (6.27) o (6.28), vale solo quando il corpo e` lontano dalla condizione di saturazione. Un’analisi completa secondo i principi della meccanica quantistica porta invece, a partire dalla formula paramagnetica di Langevin, a un’espressione in perfetto accordo con i risultati sperimentali, come mostrato in figura 6.2. Il comportamento di 1/χm in funzione della temperatura segue comunque una dipendenza lineare, come verificato sperimentalmente in un ampio intervallo di temperature, da pochi gradi fino a qualche centinaio di gradi kelvin. Osserviamo che per i materiali paramagnetici la suscettibilità magnetica χm assume valori piccoli ma positivi, nel senso che la magnetizzazione totale del campione risulta avere lo stesso verso del campo magnetizzante. In tabella 6.2 riportiamo il valore della suscettibilità per alcune sostanze paramagnetiche a temperatura ambiente. 226

Paramagnetismo

SOSTANZA Ossido ferroso (FeO) Biossido di manganese (MnO2 ) Ossido ferrico (Fe2 O3 ) Solfuro di ferro (FeS) Uranio (*) Cromo (*) Platino (*) Tungsteno (*) Alluminio (*) Litio (*) Magnesio (*) Sodio (*) Ossigeno (gas)

Capitolo 6

χm (×10−5 ) 720 160 150 70 40 33 26 6.8 2.2 1.4 1.2 0.7 0.2

Tabella 6.2: suscettibilità magnetica a temperatura ambiente per alcune sostanze paramagnetiche. (Ordinate per valori decrescenti). Le sostanze indicate con (*) sono di tipo metallico e per esse non vale la legge di Curie.

6.3.1

Suscettibilità magnetica per gli elettroni di conduzione

Nel caso degli elettroni di conduzione di un metallo, la teoria classica degli elettroni liberi prevederebbe una magnetizzazione del tipo (6.26), cioè inversamente proporzionale alla temperatura. Sperimentalmente si osserva, invece, che nel caso della maggior parte di metalli la magnetizzazione risulta essere indipendente dalla temperatura, risultato in netto disaccordo con la legge di Curie. Inoltre, la suscettibilità assume valori uno o due ordini di grandezza più piccoli rispetto a quella dei materiali paramagnetici non metallici. Un calcolo corretto dal punto di vista della meccanica quantistica richiederebbe l’utilizzo della distribuzione di Fermi-Dirac descritta nel capitolo 4. Come già visto precedentemente, l’applicazione di un campo magnetico 227

Capitolo 6


comporta l’aumento (o diminuzione) dell’energia totale del singolo elettrone della quantità μB per gli elettroni con momento magnetico antiparallelo (o parallelo) al campo, come evidenziato in figura 6.3-b. Successivamente, transizioni dagli stati a energia maggiore a quelli a energia minore portano il sistema alla situazione di equilibrio, rappresentata in figura 6.3-c. Le transizioni si sono verificate solamente per elettroni vicini all’energia (o temperatura) di Fermi EF (o TF ) perché solamente gli elettroni vicini a EF sono in grado di riallineare i loro spin nella direzione del campo magnetico. Il risultato e` che solo una frazione T/TF degli elettroni di conduzione contribuisce alla magnetizzazione, riducendo cos`ı il valore della suscettibilità. Il valore fornito da (6.26) andrebbe allora moltiplicato per T/TF , eliminando la dipendenza dalla temperatura. Il calcolo completo12 fornisce: M=

3 nμ 2B B 2 kTF

(6.29)

detta magnetizzazione di spin di Pauli: conseguentemente la suscettibilità non viene più a dipendere dalla temperatura. Rispetto alle altre sostanze paramagnetiche a temperatura ambiente la suscettibilità viene ridotta di un fattore TF /T ≈ 102 . L’esempio 5 discute il valore della suscettibilità magnetica per un paramagnete metallico come il litio.

6.3.2

Smagnetizzazione adiabatica

Il metodo di smagnetizzazione adiabatica merita di essere discusso perché, come suggerito da Debye nel 1926, esso consente di ottenere temperature dell’ordine del millesimo di grado kelvin e anche minori. Il metodo si basa sull’effetto magneto-calorico riguardante il fatto che, nel caso di un sistema di dipoli magnetici in equilibrio a una data temperatu12

Bisognerebbe anche tenere conto del fatto che la magnetizzazione totale e` data dalla somma del termine paramagnetico con quello diamagnetico sempre presente. Se si tiene conto di ciò la magnetizzazione totale va moltiplicata per un fattore 2/3 e, quindi, sarebbe M tot = nμ 2B B/kTF .

228

Paramagnetismo

N(E)

N(E)

EF

a)

Capitolo 6

N(E)

E

E

b)

E

c)

Figura 6.3: occupazione degli orbitali per elettroni con momento magnetico antiparallelo (sopra) o parallelo (sotto) al campo magnetico. Da sinistra verso destra viene rappresentata la situazione a) prima dell’applicazione del campo magnetico, b) subito dopo e c) una volta raggiunto l’equilibrio.

ra, l’entropia13 del sistema diminuisce in seguito all’applicazione di un campo magnetico. Ciò e` dovuto al fatto che dipoli magnetici allineati corrispondono a dipoli magnetici ordinati e, quindi, con minore entropia. D’altro canto la diminuzione della temperatura produce anch’essa una diminuzione dell’entropia perché facilita l’allineamento dei dipoli magnetici. Ricordiamo che i processi adiabatici non comportano variazioni di entropia, quindi, se mantenendo il campione isolato termicamente, eliminiamo lentamente14 il campo magnetico, l’aumento atteso di entropia deve essere compensato da un’equivalente diminuzione che può essere ottenuta solo attraverso la diminuzione della temperatura. L’entropia del sistema viene a dipendere dal rapporto B/T tra campo magnetico e temperatura. Se l’entropia deve rimanere costante e se il campo magnetico viene fatto diminuire allora diminuisce anche la temperatura. 13

Dal punto di vista della meccanica statistica l’entropia misura il grado di disordine di un sistema ed e` massima quando il disordine e` massimo. 14 La riduzione del campo magnetico deve essere fatta in modo graduale perché l’energia termica può essere trasferita oltre che ai dipoli magnetici anche al reticolo atomico. Ad alta temperatura domina il reticolo atomico mentre a bassa temperatura diventa rilevante il contributo dei dipoli magnetici. Si vuole allora cambiare lentamente le condizioni esterne per mantenere equilibrio tra il reticolo e i dipoli.

229

Capitolo 6


Il meccanismo di raffreddamento e` tanto più efficace quanto più forte e` l’allineamento dei dipoli. Usando questa tecnica si possono ottenere temperature molto basse, dell’ordine del millesimo di grado kelvin. Va osservato che i dipoli magnetici non sono completamente indipendenti l’uno dall’altro, ma i campi magnetici che essi stessi producono influenzano i dipoli vicini. Ne deriva che, anche quando il campo esterno e` nullo, ciascun dipolo individuale sente comunque il piccolo campo magnetico dei dipoli vicini. Quindi, anche se si elimina completamente il campo esterno, all’interno del corpo il campo non si annulla totalmente e non si annulla totalmente neppure la temperatura. Ciò comporta il fatto che non si riesca ad andare al di sotto di una certa temperatura. I momenti magnetici nucleari sono molto più deboli di quelli atomici e, quindi, interagiscono tra loro molto meno, con una tendenza minore all’autoallineamento. Di conseguenza l’applicazione del metodo della smagnetizzazione adiabatica dei nuclei consentirebbe il raggiungimento di temperature ancora più piccole, dell’ordine del milionesimo di grado kelvin. Questo risultato può venire raggiunto, però, solo impiegando campi magnetici molto intensi, necessari per allineare i deboli momenti magnetici nucleari e partendo da una temperatura di qualche millesimo di grado kelvin, ottenuta per smagnetizzazione atomica.

6.3.3

Esempi

1. Confrontare l’energia di interazione tra un dipolo magnetico (di spin) di un elettrone e un campo magnetizzante di intensità H = 106 A/m con l’energia termica a temperatura ambiente. Innanzitutto osserviamo che il campo magnetizzante corrisponde a un valore di B ≈ 1 T, quindi, e` parecchio intenso. Il momento di dipolo magnetico dell’elettrone vale (vedi (3.59)): μ = μ B = 9.27 × 10−24 J/T mentre l’energia di interazione e` data da: U = −μ ⋅ B = −μ ⋅ (μ0 H) 230

Paramagnetismo

Capitolo 6

che al massimo assume un valore μμ0 H = 1.17 × 10−23 J, corrispondente a 7.3 × 10−5 eV. Tale energia e` effettivamente molto più piccola (di un fattore 400 circa) dell’energia termica kT = 0.026 eV. L’approssimazione usata per ottenere la formula (6.26) e`, quindi, giustificata. 2. Ricavare l’espressione approssimata della magnetizzazione di un materiale paramagnetico quando μ B B ≪ kT. Definiamo x = μ B B/kT. Se μ B B ≪ kT allora x ≪ 1 e possiamo approssimare la funzione esponenziale con e x ≈ 1 + x. Allora: e U/kT − e −U/kT 1 + U/kT − 1 + U/kT U = ≈ e U/kT + e −U/kT 1 + U/kT + 1 − U/kT kT Quindi: M = nμ

μB B U = nμ kT kT

cioè l’espressione (6.26). 3. Valutare l’ordine di grandezza della suscettibilità magnetica di un materiale paramagnetico non metallico a temperatura ambiente, avente n = 1028 atomi per metro cubo. Supponiamo che non ci sia nessuna interazione tra gli elettroni dello stesso atomo e degli atomi diversi e supponiamo che ci sia (dell’ordine di) un dipolo magnetico per ciascun atomo, avente momento μ = μ B . Sostituiamo i valori numerici nella formula (6.27) ottenendo: χm =

4π × 10−7 × 1028 × (9.3 × 10−24 )2 = 2.6 × 10−4 1.38 × 10−23 × 300

che, nonostante le approssimazioni fatte, e` dell’ordine di grandezza dei valori di suscettibilità magnetica osservati. 4. Per un certo sale paramagnetico di cromo (s = 3/2, ℓ = 0) si misura un momento magnetico μ i per ione pari a circa 1.0μ B quando il rapporto B/T = 0.3 T/K. Verificare che tale misura risulta in accordo con la formula (6.28). La definizione della magnetizzazione data dalla formula (6.2) corrisponde a un momento magnetico per ione μ i = μ/N dove N sarebbe il numero 231

Capitolo 6


di ioni presenti in un certo volume V. Del resto μ = MV, quindi: MV M = μi = N n dove n e` il numero di ioni per unità di volume. Ricorrendo alla (6.28) si ottiene: M n2B μ B B = μB μi = n 3k T visto che μ B B/kT = 0.2 e` abbastanza più piccolo di 1. √ Il numero effettivo di magnetoni di Bohr vale nB = g s(s + 1) = 3.9 e perciò M 3.92 × 9.3 × 10−24 = × 0.3 × μ B = 1.0 × μ B μi = n 3 × 1.38 × 10−23 in accordo con l’osservazione sperimentale. 5. Ricavare la suscettibilità del litio (n = 4.6 × 1028 atomi/m3 , TF = 5.5 × 104 K). Essendo il litio un metallo, ricorriamo alla formula di Pauli (6.29) che corrisponde a una suscettibilità 3 nμ 2 χ m = μ0 B 2 kTF e sostituendo i valori numerici si ottiene: 3 × 4π × 10−7 × 4.6 × 1028 × (9.3 × 10−24 )2 = 1 × 10−5 χm = 2 × 1.38 × 10−23 × 5.5 × 104 vicino al valore riportato in tabella 6.2. La discrepanza tra i due valori e` attribuibile all’aver trascurato le interazioni elettrone-elettrone. Se avessimo usato invece la legge di Curie (6.27) avremmo ottenuto un valore χm = 1.2 × 10−3 circa 100 volte più grande di quanto osservato sperimentalmente.

6.4 Applicazioni In questo capitolo saranno discusse due applicazioni interessanti: la tecnica di raffreddamento adiabatico, indispensabile per portare dei campioni a temperature estremamente basse, e la levitazione diamagnetica in cui, senza contatto alcuno, sarebbe possibile sollevare corpi di dimensioni piccole. 232

Applicazioni

6.4.1

Capitolo 6

Raffreddamento adiabatico

Il raffreddamento adiabatico e` quella tecnica che consente di raggiungere temperature prossime allo zero assoluto sfruttando l’effetto magneto-calorico. Il raffreddamento adiabatico può essere realizzato secondo il seguente ciclo: 1. Magnetizzazione adiabatica. Si parte ponendo la sostanza refrigerante in un ambiente isolato e si applica un campo magnetico crescente che allinea i dipoli. Questo processo adiabatico non comporta una variazione dell’entropia totale, quindi, la diminuzione dell’entropia magnetica e` compensata da un aumento di entropia termica e da un riscaldamento della sostanza refrigerante. 2. Trasferimento isomagnetico. In questa fase si riporta la sostanza refrigerante alla temperatura originaria raffreddandola attraverso il contatto con un fluido (ad esempio, elio liquefatto), ma mantenendo costante il campo magnetico in modo che i dipoli non perdano l’allineamento. Quando il calore in eccesso, accumulato nella fase precedente, e` stato rimosso, si isola nuovamente la sostanza refrigerante dal fluido di raffreddamento. 3. Smagnetizzazione adiabatica. Questa e` la fase in cui avviene il vero raffreddamento. Mantenendo la sostanza refrigerante in condizioni adiabatiche, si riduce il campo magnetico con conseguente perdita dell’allineamento dei dipoli. Il disallineamento dei dipoli comporta un aumento dell’entropia magnetica che viene bilanciato da una riduzione dell’entropia termica attraverso la riduzione della temperatura della sostanza refrigerante. 4. Trasferimento isomagnetico. Per prevenire il riscaldamento della sostanza refrigerante si mantiene costante il campo magnetico. Si pone il campione da raffreddare in contatto con la sostanza refrigerante determinando un trasferimento di calore dal primo alla seconda fino al raggiungimento dell’equilibrio termico a una certa temperatura. 233

Capitolo 6


A questo punto il ciclo può ripartire per un ulteriore raffreddamento. Per il raffreddamento adiabatico sono stati inizialmente impiegati dei sali paramagnetici per i quali si possono ottenere temperature da 1 a 100 mK con campi magnetici dell’ordine di 1 tesla. Più recentemente si preferisce impiegare come sostanza refrigerante il gadolinio (sostanza ferromagnetica, vedi il prossimo capitolo) o sue leghe, che consentono un raffreddamento più efficace.

6.4.2

Levitazione diamagnetica

Il moto relativo tra due corpi (ad esempio, un oggetto che scorre su un tavolo) e` ostacolato dagli attriti dovuti al contatto tra di essi. L’uso di lubrificanti riduce l’attrito, ma non lo elimina. Se si potesse eliminare del tutto il contatto si potrebbe eliminare l’attrito, la dissipazione di energia, il riscaldamento dei corpi e l’usura degli stessi. Tutto ciò verrebbe realizzato se si potesse fare levitare un corpo rispetto all’altro, e le forze magnetiche rappresentano dei possibili candidati per questo scopo. Due magneti aventi polarità uguale (o opposta) si respingono (o attraggono) con una forza che cresce al diminuire della distanza tra i magneti. Questa repulsione farebbe immaginare di poter costruire con facilità dispositivi di levitazione magnetica, con assenza di attriti meccanici, in cui la forza di gravità viene bilanciata dalla forza magnetica. Il problema consiste, però, nell’assenza15 di stabilità in tali sistemi e nella necessità di un bilanciamento perfetto tra forza gravitazionale e magnetica, bilanciamento che può essere fornito da un sistema attivo che risponda velocemente a cambiamenti delle distanze relative variando il campo magnetico. Un altro modo di ottenere levitazione sfrutta, invece, le proprietà dei materiali diamagnetici. Il diamagnetismo e`, infatti, un fenomeno dinamico nel senso che la magnetizzazione cambia al variare del campo magnetico16 , inol15

S. Earnshaw dimostrò (teorema di Earnshaw) nel 1842 che per corpi che interagiscono con forze proporzionali a 1/r 2 non possono esserci posizioni di equilibrio stabili. 16 In questo caso l’interazione non viene più a dipendere da 1/r 2 e non vale più il teorema di Earnshaw. 234


Capitolo 6

tre i materiali diamagnetici vengono respinti dal campo magnetico e attirati da minimi locali. In tali posizioni si può ottenere stabilità sia verticale sia orizzontale, requisito fondamentale per la levitazione. Nella pratica si sfruttano dei sistemi ibridi in cui magneti permanenti intensi forniscono il grosso della forza di sollevamento, mentre materiali diamagnetici, opportunamente posizionati, forniscono la stabilità necessaria controbilanciando le piccole perturbazioni rispetto alla condizione di equilibrio.

6.5 Quesiti di riepilogo 1. Atomi dotati di sottogusci completamente riempiti possono essere paramagnetici? 2. La legge di Curie (6.27) per materiali paramagnetici e` una buona approssimazione per valori piccoli o grandi di B/T? 3. La saturazione magnetica in materiali paramagnetici avviene per valori piccoli o grandi di B/T? 4. Si può parlare di saturazione per materiali diamagnetici? 5. La magnetizzazione di un materiale diamagnetico varia sensibilmente con la temperatura? 6. Perché con la smagnetizzazione adiabatica dei nuclei si possono raggiungere temperature più basse rispetto a quelle ottenibili con la smagnetizzazione atomica?

6.6 Esercizi 1. Valutare l’ordine di grandezza della suscettibilità magnetica del rame, assumendo come raggio medio il raggio di Bohr (0.53 × 10−10 m), conoscendo la densità (δ = 8.6 g/cm3) e la massa atomica (A = 63.5). 235

Capitolo 6


2. Per un certo sale paramagnetico di ferro (s = 5/2, ℓ = 0, nB = 5.9) si misura un momento magnetico μ per ione pari a circa 1.7μ B quando il rapporto B/T = 0.2 T/K. Verificare che tale misura risulta in accordo con la formula (6.28). 3. Per un certo sale paramagnetico di gadolinio si misura un momento magnetico μ per ione pari a circa 7μ B quando il rapporto B/T = 4 T/K. In assenza di momento angolare orbitale, quanto dovrebbe valere quello di spin? 4. Per un atomo a temperatura ambiente con due livelli energetici separati di ΔE = 0.6×10−3 eV, valutare il rapporto n↑ /n↓ tra il numero di atomi (per unità di volume) con spin allineato e antiallineato rispetto al campo magnetico. 5. Per un certo sale di rame composto dallo ione Cu2+ si misura un numero effettivo di magnetoni di Bohr nB = 1.9. Confrontare il valore di n B previsto per j = 5/2 (cioè ℓ = 2, s = 1/2) con quello che si ottiene per s = 1/2 e ℓ = 0.

236

Capitolo 7 Ferromagnetismo Esiste una classe di materiali, detti ferromagnetici, per i quali si può avere magnetizzazione anche in assenza di campo magnetizzante esterno. Questo fatto suggerisce che in questi materiali i momenti angolari orbitali o di spin degli elettroni e i momenti magnetici corrispondenti siano orientati secondo una direzione privilegiata e che mantengano tale orientamento in assenza di campo esterno. Comportamenti simili si osservano anche in altre classi di materiali, detti ferrimagnetici e antiferromagnetici

7.1 Ferromagnetismo Sperimentalmente si osserva che la magnetizzazione spontanea dei materiali ferromagnetici varia con la temperatura essendo massima per temperature vicine allo zero assoluto e diventando nulla in corrispondenza di una temperatura TC detta temperatura di Curie. Al di sopra di tale temperatura il materiale perde, infatti, la magnetizzazione spontanea e si comporta effettivamente come un paramagnete con suscettibilità magnetica data dalla legge di Curie-Weiss1: C χm = (7.1) T − TC che, rispetto alla legge di Curie (6.27), presenta una singolarità per T = TC . 1

Un calcolo più dettagliato fornirebbe una dipendenza χ m ∝ 1/(T − TC )γ dove γ ≈ 1.33.

Capitolo 7

Ferromagnetismo

In questo senso la temperatura di Curie separa la fase disordinata paramagnetica (T > TC ) da quella ordinata ferromagnetica (T < TC ). Questa e altre proprietà dei materiali ferromagnetici possono essere spiegate attraverso i principi della meccanica quantistica che e` in grado di spiegare anche perché, tra tutti gli elementi, solo ferro, cobalto, nichel, gadolinio e disprosio risultano avere proprietà ferromagnetiche. Gli elementi Fe, Co e Ni sono elementi di transizione la cui configurazione orbitale presenta il sottoguscio 3d parzialmente riempito. Per essi la magnetizzazione e` dovuta agli spin piuttosto che ai momenti angolari orbitali, con gli spin allineati parallelamente. Infatti, due elettroni dell’orbitale 3d, aventi spin parallelo, tendono a stare più distanti tra di loro e, quindi, la loro energia coulombiana risulta essere minore; e minore e` l’energia di tutto l’atomo. L’accoppiamento tra gli spin degli elettroni che li porta ad allinearsi parallelamente viene chiamato interazione di scambio (o campo molecolare HM o campo di Weiss) e, grazie a essa, il singolo atomo, ad esempio, di ferro, assume un momento magnetico permanente. L’interazione di scambio viene trattata secondo un’approssimazione di campo medio supponendo che ciascun dipolo interagisca con il campo medio prodotto da tutti gli altri dipoli. Ciò comporta che l’intensità dell’interazione sia proporzionale alla magnetizzazione, cioè: (7.2) H M = λM dove λ e` una costante indipendente dalla temperatura. Questo campo molecolare H M va a sommarsi al campo applicato H a , in modo da avere un campo magnetizzante totale pari a: H = Ha + HM = Ha + λM

(7.3) p

La suscettibilità per un paramagnete era definita come χm = μ0 M/B e p valeva (vedi la (6.27)) χm = C/T in funzione della costante di Curie C. In questo caso si ricava allora: p

χm =

μ0 M μ0 M M C = = = B μ0 H H a + λM T

238

(7.4)

Ferromagnetismo

Capitolo 7

che diventa:

C (H a + λM) T Ricavando la magnetizzazione M otteniamo: M=

M=

CH a T − Cλ

(7.5)

(7.6)

e, quindi:

M C (7.7) = H a T − Cλ che e` proprio il comportamento descritto dalla (7.1), se si assume TC = Cλ. Ricorrendo poi alla (6.28) si ottiene per la costante λ il valore: χm =

λ=

3kTC μ0 nn2B μ 2B

(7.8)

La conseguenza dell’interazione di scambio e` che ogni dipolo magnetico risente della magnetizzazione media dovuta agli altri dipoli. Notiamo che l’interazione di scambio ha la dimensione di un campo magnetizzante e nei ferromagneti viene ad assumere, tipicamente, valori dell’ordine di circa 109 A/m, corrispondenti a campi magnetici dell’ordine di 103 tesla. Osserviamo, inoltre, che, anche se ha la dimensione di un campo magnetizzante, questa interazione non ha origine magnetica (vedi esempio 1), ma viene originata da effetti quantomeccanici2 . Nel caso di un reticolo cristallino si sviluppa un’interazione di scambio anche tra atomi adiacenti, con conseguente accoppiamento degli spin, e la configurazione con minore energia corrisponde al caso in cui gli spin di coppie di atomi adiacenti risultano essere paralleli (o antiparalleli). Gli elementi di transizione hanno i 5 livelli 3d sovrapposti a formare una banda energetica relativamente stretta perché si tratta di un sottoguscio interno. Quando questa banda e` completamente occupata ci sono 5 elettroni con spin su e 5 elettroni con spin giù. Gli stati con spin su e con spin giù 2

L’antisimmetria a cui deve essere soggetta la funzione d’onda degli elettroni in quanto fermioni comporta delle modalità di interazione tra gli elettroni che corrispondono a un accoppiamento tra i momenti magnetici intrinsechi. 239

Capitolo 7

Ferromagnetismo

formano due bande parziali che però vengono alzate e abbassate in energia dall’interazione di scambio. D’altro canto l’asimmetria nell’occupazione dei livelli comporta una differenza energetica e, infatti, le regole di Hund prescrivono che venga massimizzato lo spin totale. Considerando questi due meccanismi in competizione, gli elettroni di un sottoguscio 3d parzialmente riempito vanno a popolare i livelli più bassi in energia, compatibilmente con il principio di esclusione di Pauli. Nel caso di ferro, cobalto e nichel la competizione tra i due effetti e` tale che una delle due bande parziali risulta essere totalmente riempita mentre l’altra no. Conseguentemente il materiale pos` quindi, il siede una magnetizzazione spontanea particolarmente grande. E, modo in cui sono occupati i livelli 3d a separare un elemento ferromagnetico da uno no, come nel caso di ferro e rame (vedi esempio 2). Requisito fondamentale per il funzionamento dei meccanismi che portano al ferromagnetismo e` che la banda di valenza non sia troppo ampia, ma allo stesso tempo che ci sia una una buona sovrapposizione spaziale tra le funzioni d’onda di elettroni in atomi diversi in modo da avere interazione di scambio. Tale requisito e` effettivamente soddisfatto per i succitati elementi di transizione Fe, Co e Ni, cos`ı come dalle terre rare. Ciò può essere verificato ricorrendo a una trattazione quantomeccanica del ferromagnetismo che può essere semplificata considerando il problema di una coppia di atomi solamente. In questo caso l’interazione di scambio contiene l’interazione tra i due nuclei, tra i due elettroni e tra ciascun nucleo e gli elettroni vicini. Risolvendo l’equazione di Schrödinger corrispondente si ottiene una quantità contenente le autofunzioni ψ, del tipo: Isc = ∫ ψn (1)ψn′ (2)ψn (2)ψn′ (1) [ r

1 nn′

−

1 rn2

−

1 r n′ 1

+

1 ] dτ r12

(7.9)

detta integrale di scambio e descritta da una curva detta curva di BetheSlater3 rappresentata in figura 7.1. Nell’equazione, r12 e` la distanza tra i due elettroni, rnn′ la distanza tra i due nuclei e rn′ 1 o rn2 la distanza tra un nucleo 3

Hans A. Bethe (1906-2005), fisico tedesco-americano vincitore del Premio Nobel per la Fisica nel 1967 per la sua teoria sulla nucleosintesi stellare. John C. Slater (1900-1976), fisico e chimico statunitense.

240

Ferromagnetismo

Capitolo 7

Isc +

Co Fe

Ni Gd

−

r nn′ /r d

Mn Cr

Figura 7.1: andamento dell’integrale di scambio in funzione del rapporto r nn′ /r d , e curva di Bethe-Slater. (Per il gadolinio la variabile in ascissa e` r nn′ /r f dove r f e` il valore medio delle orbite f .

e gli elettroni vicini. L’integrale di volume (dτ e`, quindi, un elementino di volume) viene calcolato scambiando tra di loro le coordinate (1) e (2) degli elettroni. Un valore positivo per Isc significa che gli spin paralleli sono energeticamente favoriti rispetto agli spin antiparalleli e di conseguenza il materiale si comporta da ferromagnetico. Ciò avviene, ad esempio, quando la distanza r12 diventa piccola rispetto alla distanza internucleare. Il materiale risulta ferromagnetico quando rnn′ /rd ≳ 3.0 dove rd e` il raggio medio degli orbitali d. Guardando ai valori dell’integrale di scambio rappresentati in figura 7.1 si vede che cromo e manganese non sono metalli ferromagnetici mentre gli altri s`ı. Andando a misurare sperimentalmente la magnetizzazione di saturazione in funzione della temperatura (vedi figura 7.2) si nota che essa diminuisce all’aumentare di T fino a raggiungere un valore nullo per T = TC . Il comportamento sperimentale può essere riprodotto abbastanza bene andando a sostituire nella formula (6.25) al posto del campo magnetico B il valore

241

Capitolo 7

Ferromagnetismo

dell’interazione di scambio che risulta come già detto proporzionale alla magnetizzazione M; ciò e` possibile visto che tipicamente H a ≪ H M . Si ottiene allora: λM μμ0 λM M = nμ tanh(μ B μ0 ) = nμ tanh( ) (7.10) kT n B kT dove n B = μ/μ B . Riscriviamo l’espressione sostituendo TC = nμ 2 μ0 λ/k, ottenendo4 : 1 M TC ) (7.11) M = nμ tanh( n B nμ T per temperature comprese tra 0 e TC . Considerando che nμ rappresenta il valore massimo della magnetizzazione, cioè la magnetizzazione di saturazione, possiamo scrivere la (7.11) come: M 1 M TC ) ≡ tanh(x) = tanh( (7.12) Ms n B Ms T che può essere risolta numericamente o graficamente ed espressa come funzione di Ms (T)/Ms (0). Sperimentalmente si verifica che l’andamento di (7.12) risulta essere in discreto accordo con le misure per la magnetizzazione di saturazione (vedi figura 7.2). Attraverso misure sperimentali si costruisce la tabella 7.1 che riporta i valori di temperatura di Curie per alcuni esempi di materiali ferromagnetici, assieme alla magnetizzazione di saturazione Ms . Nella tabella sono riportati anche i valori dei momenti magnetici atomici espressi come multipli del magnetone di Bohr (μ = n B μ B ). I valori dei momenti magnetici atomici dipendono da come gli elettroni riempiono i sottogusci 3d e bilanciano i loro spin, con l’aggiunta eventuale di momento angolare orbitale. Ne consegue che i valori del multiplo n B sono tipicamente non interi. L’esempio 3 spiega perché il momento magnetico del nichel valga appunto 0.6μ B . 4

Se si usa la definizione di TC della (7.8) bisogna introdurre un fattore 1/3 che va aggiunto anche alla (7.10). Alla fine questi due fattori uguali si semplificano.

242

Ferromagnetismo

SOSTANZA Ferro Cobalto Nichel Gadolinio Disprosio CrO2

TC (K) 1043 1388 627 292 88 386

Capitolo 7

Ms (×106 A/m) n B 1.7 2.2 1.4 1.7 0.5 0.6 5.7 7.6 10.2 0.5 2.0

Ms (T)/Ms (0)

Tabella 7.1: valori di temperatura di Curie, di magnetizzazione di saturazione (a temperatura ambiente) e del numero di magnetoni di Bohr (a 0 K) per alcune sostanze ferromagnetiche.

1 0.8 0.6 0.4 0.2 0 0

0.2

0.4

0.6

0.8

1 T/TC

Figura 7.2: andamento della magnetizzazione di saturazione in funzione della temperatura, ricavato nell’approssimazione di campo medio. Viene riportato il rapporto tra la magnetizzazione alla temperatura T e quella allo zero assoluto in funzione di T/TC .

243

Capitolo 7

7.1.1

Ferromagnetismo

Domini di Weiss

All’interno di un campione di materiale ferromagnetico esistono delle regioni, chiamate domini di Weiss, nei quali i momenti magnetici individuali sono tutti allineati tra di loro, con conseguente saturazione della magnetizzazione in ciascun dominio. Domini differenti possono avere però direzione di magnetizzazione diversa e arbitraria e di conseguenza il momento magnetico risultante a livello macroscopico e` nullo. La forma e la dimensione di ciascun dominio e` quella che minimizza l’energia totale. La minimizzazione dell’energia può avvenire attraverso la creazione di molti domini le cui magnetizzazioni tendono a bilanciarsi reciprocamente, con conseguente riduzione del campo magnetico all’interno del campione e, quindi, energia associata minore. Ciò e` rappresentato qualitativamente nella figura 7.3 in cui si vede che all’aumentare del numero di domini diminuisce l’intensità del campo magnetico all’esterno del dominio e, quindi, diminuisce l’energia magnetostatica. La diminuzione dell’energia magnetostatica tende allora a favorire domini con spin antiparalleli. Le superfici di separazione tra i domini sono chiamate pareti di Bloch e attraverso queste pareti, spesse alcune distanze reticolari, si ha una progressiva rotazione dell’orientamento dei dipoli magnetici che dalle due parti della parete hanno direzione differente. Risulta energeticamente favorevole anche la formazione di domini (detti domini di chiusura) con le pareti di Bloch a 45○ rispetto alla magnetizzazione perché in tale caso la componente della magnetizzazione normale alla parete di Bloch sarebbe continua nel passaggio da un dominio all’altro. D’altro canto i bordi di ciascun dominio sono zone di transizione tra regioni con campi magnetici differenti e comportano campi magnetici non uniformi particolarmente intensi. Una configurazione avente energia minore richiederebbe, quindi, un numero piccolo di bordi, in contrasto con quanto osservato precedentemente quando il numero di domini tendeva ad aumentare. Intervengono, infine, considerazioni energetiche legate alla struttura cristallina che determinano energie diverse a seconda della direzione relativa tra magnetizzazione del dominio e assi di simmetria del cristallo. A contrastare la tendenza ad avere domini estrema244

Ferromagnetismo

N

N

S

NSNS

S

S

N

SNSN

(a)

(b)

(c)

Capitolo 7

(d)

Figura 7.3: esemplificazione della formazione dei domini di Weiss.

mente piccoli interviene poi l’interazione di scambio che tende ad accoppiare gli spin di atomi adiacenti, spingendoli a essere paralleli. La combinazione di tutti questi effetti porta alla formazione dei domini secondo la configurazione specifica osservata nel campione. In ogni caso la struttura dei domini e` conseguenza della diminuzione dell’energia del sistema in corrispondenza di una certa configurazione. L’esistenza dei domini di Weiss può essere evidenziata sperimentalmente ricorrendo a microfotografie ottenute secondo tecniche particolari. Quando il campione ferromagnetico non magnetizzato viene posto in un campo magnetizzante H l’effetto di quest’ultimo e` duplice, attraverso due processi indipendenti. Nel primo processo si ha lo spostamento dei confini dei domini e l’accrescimento dei domini orientati favorevolmente, cioè parallelamente al campo H, che aumentano il loro volume a scapito degli altri domini. Il secondo processo riguarda, invece, la rotazione della direzione di magnetizzazione di tutto un dominio verso la direzione di H. Questa seconda modalità si verifica principalmente in presenza di campi magnetizzanti particolarmente intensi. La struttura dei domini determina la permeabilità magnetica relativa. Per materiali molto puri, omogenei e con orientamenti opportuni dei cristalli, si possono ottenere permeabilità relative estremamente grandi (∼ 106 ) grazie

245

Capitolo 7

Ferromagnetismo

alla facilità con cui i confini dei domini si spostano. Se, invece, si tratta di materiali a elevata granularità, costituiti da particelle molto piccole, lo spostamento delle pareti dei domini e` sfavorito e di conseguenza il materiale si magnetizza con minore facilità.

7.1.2

Ciclo di isteresi

I due processi di modifica dei domini non avvengono in modo reversibile e se si varia in modo continuo il valore di H, riportandolo al valore di partenza, la magnetizzazione non segue una curva, percorrendola a ritroso, ma un ciclo detto ciclo di isteresi, rappresentato in figura 7.4. La magnetizzazione (e anche la suscettibilità magnetica) non risulta essere, quindi, una funzione univoca del campo magnetizzante, ma assume valori diversi a seconda di quale ramo del ciclo si stia percorrendo e viene a dipendere dalla storia del materiale cioè dal cammino seguito perché da esso dipendono i moti irreversibili e dissipativi delle pareti di Bloch. Nel ciclo di isteresi in figura 7.4 sono indicati la magnetizzazione di saturazione Ms , il valore H c detto campo coercitivo, in corrispondenza del quale si ottiene una magnetizzazione nulla, e la magnetizzazione residua Mr che e` il valore di magnetizzazione nel quale viene lasciato il campione quando il campo magnetizzante viene riportato a zero. Un ciclo analogo viene seguito anche dal campo magnetico B in funzione di quello H e in questo caso l’area compresa entro il ciclo risulta essere proporzionale all’energia dissipata durante un ciclo completo. In particolare l’energia dissipata ΔU risulta essere pari al volume del materiale moltiplicato per l’area5 racchiusa dal ciclo di isteresi di B in funzione di H. Le modifiche che avvengono sui domini di Weiss sottoponendo il ferromagnete a un campo magnetizzante (ad esempio, l’allineamento dei domini o lo spostamento delle pareti di Bloch) non e` un processo reversibile, quindi, alla fine di un ciclo si può tornare ai valori iniziali di H e di B, ma si e` dissipata energia. Il tipo di ciclo di isteresi seguito dal materiale ferromagnetico influenza 5

La densità di energia dissipata in un ciclo e` data da u = ∮ HdB.

246

Ferromagnetismo

Capitolo 7

M Ms Mr Hc H

Figura 7.4: ciclo di isteresi, cioè grafico della magnetizzazione in funzione del campo magnetizzante. La linea tratteggiata rappresenta la fase di magnetizzazione del campione a partire dal materiale vergine.

la sua utilizzazione. Nei trasformatori di tensione per correnti alternate due bobine conduttrici sono avvolte su un nucleo di materiale ferromagnetico per avere una mutua induzione molto elevata. Per ridurre le perdite energetiche si vuole che l’energia dissipata in ciascun ciclo sia piccola e, quindi, si ricorre a nuclei ferromagnetici che abbiano un ciclo di isteresi stretto cioè con bassi valori di Mr e H c . In questa tipologia entrano materiali molto puri e omogenei per i quali il meccanismo di spostamento dei confini dei domini viene facilitato con conseguente alto valore per la permeabilità magnetica. Materiali ferromagnetici di questo tipo (a basso valore di H c ) vengono chiamati soffici e includono, ad esempio, gli acciai elettrici e varie leghe di ferro, cobalto e manganese tra le quali la lega chiamata permalloy avente formula chimica Ni78 Fe22 . Si noti che il valore di H c diminuisce in cristalli molto puri e in cui le tensioni interne tra i piani cristallini sono rimosse se la cristallizzazione a partire dalla fase liquida e` avvenuta attraverso un raffreddamento lento.

247

Capitolo 7

Ferromagnetismo

Altra lega di interesse e` quella chiamata mumetal (5% di Cu, 2% di Cr, 77% di Ni e 16% di Fe), usata per schermi magnetici e nuclei di trasformatori. Tale lega e` caratterizzata da un campo coercitivo molto piccolo, e quindi, da un ciclo di isteresi di poco diverso da un segmento di retta. Materiali ferromagnetici soffici vengono usati, tipicamente, anche per gli elettromagneti (vedi più avanti) in cui si vuole che la permeabilità relativa sia molto alta, ma che la magnetizzazione residua sia pressoché nulla. Nel caso si voglia, invece, ottenere un magnete permanente si preferiscono cicli larghi corrispondenti a valori elevati per Mr e H c . Un tale tipo di magnete può essere ottenuto con campioni composti da particelle molto piccole o cristalli formati da un singolo dominio. In questo caso le particelle (con dimensioni del decimo di micrometro o meno) corrispondono a singoli domini a magnetizzazione saturata. In questo caso non e` possibile il meccanismo di accrescimento dei domini, ma invece essi devono ruotare e allinearsi al campo magnetizzante. Materiali di questo tipo sono detti duri e includono, ad esempio, la lega chiamata Alnico V (8% di Al, 14% di Ni, 24% di Co, 3% di Cu e 51% di Fe). Il confronto tra il comportamento di questa lega e il mumetal e` describile attraverso i parametri riportati in tabella 7.2. Un caso particolare di ferromagneti è rappresentato da leghe di manganese, ferro, cobalto e nichel assieme alle terre rare tipo il samario o il neodimio. In questi casi, a causa anche di grandi anisotropie della struttura cristallina, si ottengono valori molto elevati di H c che li rendono magneti permanenti a elevata magnetizzazione residua, con valori dell’ordine di 106 ÷ 107 A/m. Si noti che, anche se non c’è proporzionalità diretta tra magnetizzazione e campo magnetizzante, si può definire una permeabilità magnetica relativa ef f efficace κ m di modo che: ef f (7.13) B ≈ κ m μ0 H Questa approssimazione ha ovviamente un senso soprattutto per i materiali soffici, in cui il ciclo di isteresi e` approssimabile a una retta.

248

Ferromagnetismo

Capitolo 7

LEGA ALNICO V MUMETAL Ms (A/m) 1.12 × 106 5.2 × 105 Mr (A/m) 1.04 × 106 4.8 × 105 H c (A/m) 5.3 × 104 4 ef f κm 20 ÷ 250 2 × 104 Tabella 7.2: magnetizzazione di saturazione e residua, campo coercitivo e permeabilità ef f magnetica relativa efficace κ m per Alnico V e mumetal.

7.1.3

Esempi

1. Verificare che l’interazione magnetica tra dipoli non è sufficiente a spiegare l’allineamento in un materiale ferromagnetico. Il campo magnetico prodotto da un dipolo magnetico μ ha linee di campo ed espressione simile a quella del campo elettrico prodotto da un dipolo elettrico. La cosa fondamentale e` che lungo l’asse (definito come la retta ortogonale al dipolo e passante per il suo centro) il campo varia come 1/r 3. L’espressione completa del campo magnetico prodotto dal dipolo sarebbe: μ0 μ B= 2πr 3 e l’energia di interazione tra il campo prodotto da un dipolo e un dipolo vicino, a distanza r, vale: μ0 μ 2 ∣U∣ = ∣μ ⋅ B∣ = 2πr 3 Ricordando la (6.12) osserviamo che il momento di dipolo magnetico e` dell’ordine di μ B , mentre come distanza tra dipoli usiamo una tipica distanza ˚ = 2 × 10−10 m. Sostituiamo i valori numerici: interatomica r ≈ 2A 4π × 10−7 × (9.3 × 10−24 )2 = 2.2 × 10−24 J ∣U∣ = 2π × (2 × 10−10 )3 cioè 1.4 × 10−5 eV. Un’interazione di orientamento avente tale energia sarebbe assolutamente impotente di fronte al disallineamento prodotto dall’agitazione termica che ha un’energia media a temperatura ambiente (0.026 eV) circa 2000 volte più grande. 249

Capitolo 7

Ferromagnetismo

2. Giustificare perché il nichel è ferromagnetico, mentre il rame no. Per il rame (Z = 29) il sottoguscio 3d e` completamente riempito con uguale numero di elettroni con spin su e con spin giù. Il momento magnetico totale del sottoguscio 3d e` nullo e ciò rende il rame non ferromagnetico, ma diamagnetico. Nel caso del nichel (Z = 28) il sottoguscio 3d non e` completamente riempito e i suoi 10 elettroni di valenza vanno a occupare parzialmente anche il sottoguscio 4s. Nella configurazione che ne risulta ci sono in media circa 9.4 elettroni nei sottogusci 3d e 0.6 nel sottoguscio 4s. Per temperature al di sopra di quella di Curie i 9.4 elettroni dei sottogusci 3d si dividono equamente tra quelli con spin su e quelli con spin giù, determinando un momento magnetico netto nullo. Al di sotto della temperatura di Curie i livelli energetici per lo spin su e lo spin giù si separano a causa dell’interazione di scambio, con un’energia leggermente maggiore nel caso di spin giù, i cui livelli vengono, quindi, popolati un po’ meno. Allo zero assoluto, ad esempio, dei 9.4 elettroni dei sottogusci 3d, 5 hanno lo spin su e 4.4 lo spin giù. Lo sbilanciamento tra gli spin produce un momento magnetico netto diverso da zero e determina le proprietà ferromagnetiche del nichel. Un ragionamento analogo si potrebbe fare nel caso di cobalto (Z = 27) e ferro (Z = 26). Nel caso di gadolinio e disprosio i sottogusci interessati sono i 4f. 3. Giustificare il valore μ = 0.6μB per il nichel. Come visto sopra, la sovrapposizione tra le bande energetiche fa s`ı che nel guscio 3d ci siano 5 elettroni con lo spin su e 4.4 con lo spin giù. Lo sbilanciamento tra gli spin e` di 0.6 unità, quindi, il momento magnetico e` pari a 0.6μ B .

7.2 Ferrimagnetismo In alcuni materiali quali la magnetite (FeO ⋅ Fe2 O3 ), il valore della magnetizzazione di saturazione allo zero assoluto non e` quello corrispondente all’alli-

250

Ferrimagnetismo

Capitolo 7

8Fe3+

s=

5 2

s=

5 2

s=2

8Fe2+

8Fe3+

Figura 7.5: allineamento degli spin in un cristallo di magnetite. Sono evidenziati gli spin degli ioni Fe3+ e Fe2+ . Sono indicati gli 8 siti di tetraedro occupati (sopra) e i 16 siti di ottaedro occupati (sotto), della cella unitaria.

neamento completo di tutti i momenti magnetici e degli spin. In questo caso specifico gli ioni ferrici Fe3+ hanno spin s = 5/2 e momento angolare orbitale nullo, mentre gli ioni ferrosi Fe2+ hanno, invece, spin s = 2. Gli ioni del primo tipo contribuiscono al momento di saturazione con 5μ B , mentre gli ioni del secondo tipo con 4μ B . Se tutti gli spin fossero paralleli, per la magnetite ci si aspetterebbe un momento magnetico pari a 14 magnetoni di Bohr (14 = 2 × 5 + 1 × 4). Il valore che si osserva sperimentalmente e`, invece, circa 4, il che corrisponde alla situazione rappresentata in figura 7.5 in cui i momenti degli ioni Fe3+ sono antiparalleli tra di loro e si elidono, lasciando solo il contributo degli ioni Fe2+ . Ricordiamo che la magnetite rientra nella classe di cristalli del tipo spinello in cui la cella unitaria e` composta da 16 siti di ottaedro e 8 di tetraedro. Materiali che esibiscono il suddetto comportamento si chiamano ferrimagnetici e includono oltre alla magnetite anche le ferriti la cui formula chimica e` X ⋅ Fe2 O3 dove l’elemento X può essere zinco, ferro, nichel, rame, cobalto, magnesio o cadmio. Essi hanno valori elevati per la magnetizzazio251

Capitolo 7

Ferromagnetismo

ne di saturazione e residua, anche se inferiori rispetto a quelli dei materiali ferromagnetici. Nel caso di ferrimagneti vanno definite due costanti di Curie distinte per gli ioni di un tipo e dell’altro, con la conseguenza che la suscettibilità segue un’espressione un po’ più complicata della legge di Curie-Weiss. Una caratteristica importante delle ferriti e, quindi, di molti materiali ferrimagnetici e` la loro scarsa conducibilità elettrica che li rende buoni candidati come nuclei di trasformatori.

7.3 Antiferromagnetismo Un’altra classe di materiali che esibiscono proprietà magnetiche e` quella dei materiali antiferromagnetici che sono caratterizzati dall’avere gli spin e i momenti magnetici di coppie di ioni adiacenti che sono antiparalleli in modo da ottenere momento magnetico netto nullo. Il cristallo antiferromagnetico può essere pensato allora come composto da due sottounità ciascuna delle quali caratterizzate da spin allineati, ma che hanno allineamento opposto. Questo ordinamento e` completo allo zero assoluto e tende a diminuire al crescere della temperatura. L’ordinamento tra gli spin e i momenti magnetici si annulla in corrispondenza di una temperatura detta temperatura di Néel TN . Il risultato e` che la suscettibilità magnetica χm cresce tra T = 0 e T = TN . Per temperature al di sopra di TN il materiale si comporta, invece, da paramagnetico e la suscettibilità magnetica assume un valore massimo in corrispondenza della temperatura TN , come indicato in figura 7.6, seguendo un’espressione del tipo: C (7.14) χm = T+θ dove il parametro θ assume valori tipicamente compresi tra TN e 5TN . Esempi di sostanze antiferromagnetiche sono i cristalli di ossido di manganese (MnO, TN = 116 K, θ = 610 K), di ferro (FeO, TN = 198 K, θ = 570 K) o di cobalto (CoO, TN = 291 K, θ = 330 K).

252

Applicazioni

Capitolo 7

χm

0

TN

T

Figura 7.6: suscettibilità magnetica in funzione della temperatura per un materiale antiferromagnetico. TN e` la temperatura di Néel.

Si noti che nel caso degli antiferromagneti l’integrale di scambio (7.9) risulta negativo. Va osservato che al momento non ci sono applicazioni pratiche importanti per questi materiali. L’antiferromagnetismo gioca, però, un ruolo importante nella magneto-resistenza gigante. Si tratta di un fenomeno6 quantomeccanico che si manifesta come una forte riduzione della resistenza elettrica quando si applica un campo magnetico a un sistema composto da sottili pellicole ferromagnetiche e non.

7.4 Applicazioni Le applicazioni pratiche delle proprietà dei materiali ferromagnetici e ferrimagnetici sono molteplici. Ne riportiamo qui soltanto alcune tra le più comuni. 6

Il fenomeno della magneto-resistenza gigante fu scoperto da Albert Fert (1938-) e Peter A. Grünberg (1939-) nel 1988. Per questa loro scoperta i due fisici furono insigniti nel 2007 del Premio Nobel per la Fisica.

253

Capitolo 7

Ferromagnetismo

Hf Bf i

Hi Bi

x

i ℓ

Figura 7.7: rappresentazione di un elettromagnete a “C” con interferro di spessore x.

7.4.1

Elettromagneti

Un elettromagnete a “C” e` un elettromagnete composto da una bobina con N avvolgimenti, percorsa da una corrente i. Tale bobina e` avvolta (vedi figura 7.7) attorno a un nucleo di materiale ferromagnetico (generalmente soffice), sagomato a formare una zona in aria, detta interferro, in cui il campo magnetico può risultare particolarmente intenso. Notiamo che la legge di Gauss applicata al campo magnetico prescrive che il flusso di B sia nullo attraverso una superficie chiusa, quindi, prendendo come superficie su cui calcolare il flusso un cilindro avente basi (una dentro il ferro, l’altra nell’interferro) perpendicolari alle linee di campo e di area A, possiamo dire che: Bi A − B f A = 0 visto che il flusso sulla superficie laterale del cilindro e` nullo, non essendo tale superficie attraversata da linee di campo7 . Ne segue che B i = B f cioè che il campo nell’interferro B i e` pressoché uguale a quello entro il nucleo ferromagnetico B f . 7

Ciò e` tanto più vero quanto più piccolo e` lo spessore dell’interferro.

254

Applicazioni

Capitolo 7

Facciamo ora riferimento alla legge di Ampère (scritta per il campo magnetizzante) secondo la quale la circuitazione di H e` uguale alla corrente concatenata alla superficie delimitata dal percorso chiuso L avente lunghezza ℓ e che attraversa i punti centrali dell’elettromagnete. Data la simmetria il percorso L coincide con una linea di campo di H e la circuitazione di H diventa: H i x + H f (ℓ − x) = Ni dove x e` la lunghezza dell’interferro, mentre (ℓ − x) e` la lunghezza del percorso entro il nucleo ferromagnetico. Nell’interferro la magnetizzazione e` trascurabile e, quindi, B i = μ0 H i . Se il nucleo e` composto da un ferromagnete soffice possiamo invece scrivere ef f B f ≈ κ m μ0 H f e, sostituendo ciò nell’espressione B i = B f , si ottiene: ef f

ef f

μ0 H i = κ m μ0 H f ⇒ H i = κ m H f che, inserita nella legge di Ampère, porta a: Hf =

Ni

e, quindi:

ef f

Bi =

Tipicamente e`

ef f

ℓ + (κ m − 1)x

ef f κm

κ m μ0 Ni ef f

ℓ + (κ m − 1)x ≫ 1 perciò: Bi =

μ0 Ni ef f

x + ℓ/κ m Considerando dei valori tipici per i parametri (i = 1 A, N = 1000, ℓ = 20 ef f cm, x = 1 cm, κ m ≈ 400) si otterrebbe un campo magnetico nell’interferro di 0.12 T. Tale valore e` decisamente più grande di quello che si otterrebbe con un semplice solenoide (B = μ0 Ni/ℓ ≈ 6 mT con i valori suindicati), ma ef f risulta essere minore di quello entro il ferro (B = κ m μ0 Ni/ℓ ≈ 2.5 T con i valori suindicati). E` la presenza stessa dell’interferro a ridurre il valore del campo in aria, rispetto a quello entro il ferromagnete, ma tale interferro e` necessario se si vuole poter utilizzare il campo magnetico. 255

Capitolo 7

7.4.2

Ferromagnetismo

Magneti permanenti

Leghe di manganese, ferro, cobalto e nichel con elementi delle terre rare (lantanidi come il samario, neodimio, ecc.) hanno grandi anisotropie cristalline e, quindi, valori di campo coercitivo H c molto grandi. Ciò li rende ottimi candidati per costruire dei magneti permanenti in cui si raggiungono campi residui dell’ordine del tesla. Nel caso di una certa lega di ferro, neodimio e boro (Fe14 Nd2 B) si ottiene un campo residuo Br ≈ 1.3 T e un campo coercitivo H c ≈ 1.1×106 A/m, circa 20 volte più grande che nel materiale duro Alnico V. Sfortunatamente tale lega ha una temperatura di Curie relativamente bassa (TC ≈ 300 ○ C), ma se necessario può essere sostituita da una lega di samario e cobalto (SmCo5 ) che e` più costosa, ma ha una temperatura di Curie più alta. Questi magneti risultano essere molti fragili ed e` bene ricoprirli con materiali adeguati tipo il nichel per proteggerli anche da corrosione od ossidazione. Nonostante il loro nome, le terre rare non sono particolarmente preziose e, quindi, il costo di tali magneti non risulta essere elevato.

7.4.3

Nuclei per trasformatori

Nel caso dei trasformatori la corrente alternata cambia continuamente il verso del campo magnetizzante. Vengono percorsi allora innumerevoli cicli di isteresi e per ciascuno di essi c’è una certa energia dissipata, proporzionale all’area del ciclo. Questa energia e` persa dal punto di vista del circuito secondario e va a riscaldare il ferromagnete. Per risparmiare energia e non surriscaldare il trasformatore, si vuole che l’energia dissipata per ciclo sia la minore possibile e, quindi, si ricorre preferibilmente a nuclei del trasformatore composti da materiali soffici caratterizzati da un ciclo di isteresi molto stretto. A tali perdite vanno comunque aggiunte anche quelle dovute all’effetto Joule delle correnti parassite di Foucalt che vengono indotte nel nucleo del trasformatore. Per ridurre queste ultime si ricorre a materiali isolanti (quindi le ferriti) oppure si suddivide il nucleo del trasformatore in lamine sottili isolate l’una dall’altra. 256

Applicazioni

7.4.4

Capitolo 7

Memorie magnetiche

Per registrare dei dati (in formato digitale) su nastri, dischi o bande magnetiche, si usa un supporto non magnetico su cui sono inseriti degli elementini ferromagnetici/ferrimagnetici di forma allungata, aventi dimensioni tipiche di circa 0.1 × 0.5 μm. Tali elementini sono costituiti da un singolo dominio di Weiss che viene magnetizzato fino alla saturazione lungo l’asse maggiore dell’elementino. Materiali usati tipicamente sono il ferrimagnete Fe2 O3 (avente H c ≈ 2 × 4 10 A/m e TC ≈ 600 ○ C) o il ferromagnete CrO2 (H c ≈ 4 ÷ 8 × 104 A/m e TC ≈ 120 ○ C) per il quale l’elevato valore di H c previene la smagnetizzazione accidentale. Nel caso del biossido di cromo, però, il basso valore della temperatura di Curie rende possibile la smagnetizzazione nel caso di esposizione a calore eccessivo. La registrazione di un bit (0/1) avviene facendo scorrere il supporto magnetico in prossimità di un elettromagnete a nucleo soffice in cui il verso della corrente determina il verso del campo. Il campo magnetico prodotto dall’elettromagnete orienta come voluto la magnetizzazione dell’elementino producendo cos`ı una successione di magnetizzazioni con verso opposto, corrispondenti a una sequenza di bit 0/1 (vedi figura 7.8). Per la lettura si avvicina una bobina al supporto magnetico e le variazioni del campo magnetico inducono sulla bobina una forza elettromotrice il cui verso viene tradotto in bit 0/1.

7.4.5

Dischi magneto-ottici

I dischi magneto-ottici sono dei dispositivi su cui e` possibile immagazzinare dei dati in formato digitale e rileggerli. A differenza delle normali memorie magnetiche descritte sopra, essi si basano per la lettura sull’effetto magnetoottico. Tale effetto, chiamato anche effetto Kerr, si riferisce al cambiamento nella direzione di polarizzazione di un raggio riflesso da un mezzo magnetizzato. Tale fenomeno ha luogo anche per materiali non magnetici (cioè dia- o paramagnetici), ma diventa molto più grande per materiali ferro- o ferrima257

Capitolo 7

Ferromagnetismo

Elettromagnete

V

Supporto magnetico

Moto relativo

Figura 7.8: schema della testina di scrittura magnetica. Il verso della tensione applicata V determina il verso del campo magnetico e la direzione della magnetizzazione sul supporto magnetico. Lo scorrimento relativo consente di cambiare a piacere la magnetizzazione e quindi i bit.

gnetici. Questo effetto e` stato scoperto da Kerr8 , mentre un effetto analogo, ma riguardante i raggi trasmessi, fu osservato da Faraday9 . L’effetto magneto-ottico di Kerr assume modalità differenti a seconda della direzione del vettore magnetizzazione M rispetto alla superficie del materiale e al piano di incidenza del raggio luminoso. Il caso più comune e` quello della orientazione longitudinale (vedi figura 7.9) in cui M e` parallelo alla superficie e al piano di incidenza. In questo caso, se la luce incidente e` polarizzata linearmente (o nel piano π di incidenza o nel piano σ ortogonale a quello di incidenza), viene riflessa con polarizzazione ellittica in cui il verso e l’ampiezza dell’effetto dipende dalla magnetizzazione. In figura 7.9 si vede, ad esempio, come il raggio incidente avente il campo elettrico Eσi polarizzato nel piano σ viene riflesso con un campo corrispon8

John Kerr (1824-1907), fisico scozzese. Michael Faraday (1791-1867), fisico e chimico inglese, studioso di elettromagnetismo e elettrochimica. 9

258

Applicazioni

Capitolo 7

dente a una componente Erσ ancora nel piano σ e una componente molto più piccola Eπk ortogonale a Erσ . Siccome le due componenti non sono necessariamente in fase ne risulta una polarizzazione ellittica in cui l’asse maggiore e` ruotato di un piccolo angolo rispetto a quello di incidenza. Se si inverte la direzione di M si ha l’inversione di Eπk e l’inversione della direzione di rotazione dell’asse maggiore. I dischi magneto-ottici consistono in un materiale ferromagnetico protetto da un involucro trasparente e vengono registrati/letti attraverso un raggio laser, senza contatto fisico. In fase di scrittura il raggio laser ha potenza sufficiente da riscaldare un punto del disco a una temperatura superiore alla temperatura di Curie, cos`ı da poter cambiare la direzione di magnetizzazione grazie a un elettromagnete. Rimuovendo il raggio la temperatura scende e la magnetizzazione si fissa. In lettura un raggio laser linearmente polarizzato viene riflesso e dalla misura della rotazione di Kerr della direzione di polarizzazione si ricava il verso della magnetizzazione. A differenza degli usuali CD o DVD, che anch’essi registrano/leggono attraverso un raggio laser, la registrazione di un disco magneto-ottico risulta più affidabile perché consente un controllo in fase di registrazione di quanto effettivamente scritto sul disco.

7.4.6

Schermo magnetico

Le linee del campo magnetico sono, a differenza del caso elettrico, chiuse. Ciò e` una diretta conseguenza della legge di Gauss ∮ B ⋅ dA = 0 o, in altre parole, dell’inesistenza dei monopoli magnetici. Per questo motivo i campi magnetici non possono essere bloccati (a differenza di quanto avviene per quelli elettrici), ma si può tentare di dirigerli in modo da evitare la zona o l’oggetto che si vuole schermare. Sfruttando l’elevata magnetizzazione dei materiali ferromagnetici si può cercare di ridirigere le linee di campo facendole passare attraverso un materiale ferromagnetico che agisce da schermo. Per rendere efficace tale proces259

Capitolo 7

Ferromagnetismo

Eσi

Eπk Erσ M

Figura 7.9: rappresentazione dell’effetto Kerr.

so abbiamo bisogno di un materiale ferromagnetico a elevata permeabilità, ma che non sviluppi esso stesso una magnetizzazione residua. Il mumetal (vedi tabella 7.2) ha appunto queste proprietà, anzi e` il materiale ferromagnetico schermante più efficace. Il costo del mumetal e` relativamente elevato e lo si sostituisce in genere con altre leghe con composizione simile. Esempi di utilizzo di schermatura magnetica li troviamo nei tubi catodici dei monitor/televisori, dove ci si vuole proteggere da eventuali disturbi magnetici esterni o da quelli prodotti dai magneti degli altoparlanti. E` inoltre molto importante schermare gli elevati campi magnetici prodotti dalle apparecchiature per risonanza magnetica.

7.5 Quesiti di riepilogo 1. La suscettibilità magnetica e` definita univocamente per sostanze ferromagnetiche al di sotto della temperatura di Curie?

260

Esercizi

Capitolo 7

2. Che tipo di ferromagneti (soffici oppure duri) si preferisce impiegare per magneti permanenti e per nuclei di trasformatori? 3. Che tipo di ferromagneti (cristalli piccoli e imperfetti oppure cristalli grandi molto puri) si preferisce impiegare per magneti permanenti e per nuclei di trasformatori? 4. Quali sono le unità di misura per l’area di un ciclo di isteresi HB? 5. Da cosa dipende la dimensione dei domini di Weiss in un materiale ferromagnetico? 6. Dal punto di vista della magnetizzazione di saturazione, cosa distingue un ferromagnete da un paramagnete?

7.6 Esercizi 1. Calcolare la magnetizzazione di saturazione attesa per il ferro. 2. Conoscendo la magnetizzazione di saturazione del nichel (0.5 × 106 A/m) e la sua densità (δ = 8.9 g/cm3), valutare il numero di magnetoni di Bohr presenti in un atomo di nichel. 3. Calcolare il valore della costante di proporzionalità λ del campo molecolare nel caso del ferro e la sua magnetizzazione. A che campo molecolare corrisponderebbe? 4. Calcolare il campo magnetico ottenibile nell’interferro di un elettromagnete a “C” (N = 500 spire percorse da corrente i = 1.5 A, lunghezza totale ℓ = 15 cm, interferro x = 0.5 cm) composto da un nucleo di mumetal. 5. Calcolare l’energia dissipata in un ciclo di isteresi per un volume di 0.2 cm3 di materiale magnetico duro, a ciclo pressoché rettangolare, con Bs = 1 T e H c = 200 A/m.

261

Capitolo 8 Onde elettromagnetiche in un dielettrico Quando un’onda elettromagnetica incide su un corpo solido la superficie del solido tende a rifletterne o diffonderne1 una parte. La parte non riflessa o diffusa viene trasmessa attraverso il corpo che può assorbirla totalmente o lasciarla passare almeno in parte. Nel primo caso il corpo risulta opaco nel secondo sarà parzialmente trasparente. Le proprietà di opacità, trasparenza e riflettività di un corpo sono estremamente variabili da corpo a corpo e dipendono anche dalla natura dell’onda incidente (cioè dalla sua frequenza), oltre che dalla natura del corpo. E` possibile, comunque, ricondurre questi comportamenti variegati a un modello relativamente semplice che descrive la risposta di un corpo denso a un’onda incidente. In questo capitolo discuteremo il modo in cui le proprietà di un corpo solido influenzano la propagazione attraverso di esso di un’onda elettromagnetica.

8.1 Polarizzazione di un dielettrico Cominciamo considerando un’onda elettromagnetica che si propaga lungo la direzione x, attraverso un volume di gas. Il campo elettrico associato all’onda agisce sulle molecole del gas polarizzandole, producendo cioè dei momenti di dipolo elettrico indotti o orientando quelli eventualmente già esistenti. 1

Nel caso della riflessione l’onda viene riemessa con direzione definita, mentre ciò non avviene per la diffusione. La riflessione riguarda superfici lisce, mentre la diffusione e` una conseguenza della ruvidezza e irregolarità della superficie.

Capitolo 8

Onde elettromagnetiche in un dielettrico

Questi dipoli oscillano in risposta al campo elettrico oscillante e a loro volta emettono radiazione elettromagnetica che interferisce con l’onda incidente. L’interferenza tra l’onda incidente e quella emessa dai dipoli produce un’onda risultante che si propaga nel mezzo con velocità di fase diversa che nel vuoto. Consideriamo l’effetto del campo elettrico sugli atomi (o molecole non polari né ioniche) racchiusi in un certo volume. In assenza di campo elettrico gli elettroni sono distribuiti come una nube di carica negativa che circonda il nucleo, con baricentro coincidente con il baricentro delle cariche positive contenute nel nucleo. L’applicazione di un campo elettrico comporta lo spostamento relativo tra il baricentro delle cariche negative e il baricentro di quelle positive, inducendo cos`ı la formazione di un dipolo elettrico. Se il campo elettrico e` quello associato a un’onda elettromagnetica la sua ampiezza sarà oscillante e di conseguenza oscilleranno anche i dipoli elettrici. L’oscillazione non e` però libera, ma e` soggetta a una forza di smorzamento, una specie di attrito viscoso, dovuta all’interazione con gli atomi/molecole circostanti ed e`, inoltre, forzata dal campo elettrico dell’onda incidente. L’equazione differenziale che descrive il moto di un oscillatore smorzato e forzato e` del tipo: m(

d2x dx + ω20 x) = qE +γ 2 dt dt

(8.1)

dove ω0 e` la frequenza propria dell’oscillatore, γ il coefficiente di smorzamento, m la massa dell’oscillatore, q la carica elettrica, e E l’ampiezza del campo elettrico oscillante che descriveremo con notazione complessa come E = E0 e −iωt dove ω e` la frequenza angolare dell’onda elettromagnetica incidente. A regime, la soluzione dell’equazione differenziale e` una funzione oscillante, con la stessa frequenza angolare del campo elettrico sia per il nucleo sia per gli elettroni, che descrive lo spostamento rispetto al centro di massa. Alternativamente si può fare riferimento allo spostamento relativo al nucleo

264

Polarizzazione di un dielettrico

Capitolo 8

e usare la massa ridotta2 . In questo secondo caso la soluzione diventa: −eE0 e −iωt x(t) = (8.2) 2 m(ω0 − ω2 − iγω) dove m e` ora la massa dell’elettrone avente carica −e. Allo spostamento x corrisponde un momento di dipolo indotto p = −Zex acquistato dall’atomo, che risulta essere parallelo e concorde con il campo elettrico. Considerando un volumetto V di dielettrico, questo conterrà un certo numero N a V di atomi (o molecole) corrispondente a N a atomi per unità di volume3 . Il momento di dipolo elettrico totale per unità di volume viene chiamato polarizzazione del dielettrico P e vale: ptot ∑ p N a Vp = = = Na p P≡ (8.3) V V V dove p e` il valore medio del momento di dipolo degli atomi. Il vettore polarizzazione P, cos`ı definito, descrive la risposta di un dielettrico all’applicazione di un campo elettrico esterno e risulta, quindi, funzione del campo elettrico stesso. Nel caso di dielettrici isotropi e lineari il vettore polarizzazione risulta essere parallelo al campo elettrico e lo possiamo scrivere come: P = є0 χ e E

(8.4)

dove la quantità4 macroscopica χ e viene chiamata suscettibilità elettrica e nel caso di N a atomi per unità di volume vale: χe = Na α

(8.5)

L’uso della massa ridotta μ = (M 1 M 2 )/(M 1 + M 2 ) serve per poter considerare il moto rispetto al nucleo anziché rispetto al centro di massa. Dal momento che la massa degli elettroni e` molto più piccola di quella del nucleo, la massa ridotta coincide praticamente con quella degli elettroni. 3 Diversamente da quanto fatto nei capitoli precedenti, usiamo qui N anziché n per definire il numero per unità di volume. Facciamo cos`ı per potere, più avanti, usare n per l’indice di rifrazione. 4 In un mezzo non isotropo χ e non e` un numero ma un tensore di rango 2, cioè una grandezza a 9 componenti. 2

265

Capitolo 8


Con questa definizione la grandezza microscopica α rappresenta la polarizzabilità di volume cioè la risposta relativa del mezzo al campo elettrico applicato5 , e risulta essere pari a 1/3 del volume atomico. La suscettibilità elettrica risulta a sua volta collegata alla costante dielettrica relativa є dalla definizione: є = 1 + χe

(8.6)

Per un dielettrico lineare si potrebbe scrivere allora: P = є0 N a αE

(8.7)

ma questa espressione funziona nel caso di gas in cui, a causa della densità ridotta, il campo elettrico locale Eloc , cioè quello effettivamente sentito dai dipoli, non e` molto diverso da quello esterno E (vedi esempio 1). Diversa e` la cosa nel caso di dielettrici densi perché in questo caso bisogna tenere conto dei dipoli elettrici indotti che circondano il singolo dipolo e producono un campo elettrico a loro volta. Si dimostra in questo caso che il valore del campo elettrico locale diventa: Eloc = E +

1 P 3є0

(8.8)

dove si e` considerata (il secondo addendo) l’azione addizionale dei dipoli che circondano l’atomo in questione. Sostituendo Eloc al posto di E in (8.7) si ricava: P = є0

Na α E 1 − N a α/3

(8.9)

dalla quale si otterrebbe la equazione di Clausius-Mossotti: χe =

Na α 1 − N a α/3

5

(8.10)

In questo caso α viene definito in modo che il momento di dipolo prodotto p valga p = є 0 αE, e che χ e sia adimensionale. Si tratta di una quantità con la dimensione di un volume. In letteratura si usa talvolta una definizione differente secondo cui α si misura in Cm2 /V. 266


Capitolo 8

α orientamento

μ-onde

IR UV

ionico elettronico

ω Figura 8.1: andamento qualitativo della polarizzabilità in funzione della frequenza. Sono indicati i tre meccanismi principali e le regioni dello spettro (ultravioletto, infrarosso e microonde) in cui essi sono determinanti.

E

Figura 8.2: rappresentazione della struttura atomica di un dielettrico: i pallini scuri rappresentano il nucleo, mentre la bolla più chiara rappresenta la nube elettronica. La figura di destra descrive la polarizzazione elettronica del dielettrico a causa della deformazione della nube elettronica indotta in risposta al campo elettrico esterno.

267

Capitolo 8


E Figura 8.3: rappresentazione delle molecole ioniche in un dielettrico: i pallini scuri rappresentano lo ione positivo, mentre quelli chiari rappresentano lo ione negativo. All’interno del quadrato tratteggiato c’è un momento di dipolo netto nullo in assenza di campo elettrico esterno (sinistra) che diventa un momento netto diverso da zero dopo l’applicazione di un campo elettrico (destra).

E

Figura 8.4: rappresentazione delle molecole polari in un dielettrico (es. H2 O): i pallini scuri rappresentano gli atomi meno elettronegativi (H), mentre i cerchi chiari rappresentano gli atomi più elettronegativi (O). Nella figura di destra si vede come l’applicazione di un campo elettrico esterno comporti l’allineamento delle molecole polari.

268


Capitolo 8

scrivibile anche in funzione della costante dielettrica relativa come: є − 1 Na α = є+2 3

(8.11)

Come visto sopra, il campo elettrico agisce sugli atomi distorcendo la nube elettronica e inducendo cos`ı un dipolo elettrico. Tale effetto e` descrivibile attraverso l’introduzione della polarizzabilità elettronica α e , che assume valori tipici dell’ordine di 10−29 m3 . Se il dielettrico e`, però, composto da molecole ioniche il campo elettrico agisce cambiando la posizione degli ioni, spostando gli ioni positivi in un verso e quelli negativi nel verso opposto, producendo una distorsione del reticolo. Ne consegue che la distanza tra le coppie di ioni cambia e l’effetto complessivo in un certo volume e` quello di produrre un momento di dipolo netto. Per descrivere questo effetto si introduce la polarizzabilità ionica α i . Un dielettrico può anche essere formato da molecole polari, come nel caso dell’acqua. Tali molecole presentano un momento di dipolo elettrico intrinseco p0 a causa di una differenza tra il baricentro delle cariche negative e quello delle cariche positive. In un gas o in un liquido questi dipoli intrinseci tendono a orientarsi in presenza di un campo elettrico esterno e il loro allineamento e` tanto più efficace quanto più intenso il campo elettrico e quanto minore la temperatura e l’agitazione termica corrispondente. Si parla in questo caso di polarizzazione per orientamento e conseguentemente si introduce la grandezza αo chiamata polarizzabilità per orientamento. Tale polarizzabilità risulta essere inversamente proporzionale alla temperatura assoluta T, secondo la formula di Debye6: αo =

p20 3є0 kT

(8.12)

I tre meccanismi coesistono e in generale la polarizzabilità totale e` la somma delle tre: α = α e + α i + αo (8.13) 6

L’equazione si basa su una definizione per α o coerente con quella usata per α e . Altre definizioni per α o non contengono є 0 .

269

Capitolo 8


Si ottiene cos`ı la cosiddetta formula di Langevin-Debye per la suscettibilità: p20 ) χ e = N a (α e + α i + (8.14) 3є0 kT oppure nella forma (8.10) per dielettrici densi. Si può notare che per la suscettibilità ci si aspetta un valore costante χ e = a per molecole senza dipolo permanente e del tipo χ e = a+b/T se sono presenti invece dipoli permanenti. Questo diverso comportamento in funzione della temperatura aiuta la misura sperimentale delle polarizzabilità. La polarizzabilità elettronica e` quella che contribuisce in modo prevalente nella regione del visibile e ultravioletto. La polarizzabilità ionica diventa, invece, rilevante dall’infrarosso in giù, mentre quella per orientamento prevale a basse frequenze, dalle microonde in giù (ν ≲ 109 Hz), perché ha una risposta più lenta alla sollecitazione esterna del campo elettrico. Ciò e` descritto schematicamente dalla figura 8.1. Riassumiamo nelle figure 8.2, 8.3 e 8.4 i diversi meccanismi (principali) di polarizzazione di un dielettrico.

8.2 Equazioni di Maxwell per un dielettrico L’evoluzione del campo elettromagnetico, in qualsiasi condizione, può essere ricavata dalle quattro equazioni di Maxwell per il campo elettromagnetico: q ∮ E ⋅ dA = є (legge di Gauss per E) 0 ∮ B ⋅ dA = 0 (legge di Gauss per B) ∂ ∮ E ⋅ ds = − ∂t ∫ B ⋅ dA (legge di Faraday − Henry) ∂ ∮ B ⋅ ds = μ0 i − μ0є0 ∂t ∫ E ⋅ dA (legge di Ampère − Maxwell)

(8.15) (8.16) (8.17) (8.18)

che possono essere riscritte in forma differenziale come: ∇⋅E =

ρ (divergenza di E) є0 270

(8.19)

Equazioni di Maxwell per un dielettrico

∇ ⋅ B = 0 (divergenza di B)

Capitolo 8

(8.20)

e

∂B (rotore di E) (8.21) ∂t ∂E (rotore di B) (8.22) ∇ × B = μ0 j + є0 μ0 ∂t in funzione della densità di carica ρ e della densità di corrente j. Se non siamo nel vuoto, ma entro un dielettrico la carica totale e` la somma di tutte le cariche libere più quelle di polarizzazione. Analogamente, la densità totale vale ρ = ρ l + ρ p , somma della densità di cariche libere ρ l e di quelle di polarizzazione ρ p . Se si introduce il vettore polarizzazione P, variabile da punto a punto, la densità della carica di polarizzazione risulta essere uguale a: ∇×E = −

ρ p = −∇ ⋅ P

(8.23)

D’altro canto, se la polarizzazione varia nel tempo ci sono cariche di polarizzazione in moto e, quindi, anche una corrente di polarizzazione da sommare a quella delle cariche libere. Per le cariche libere q (di cui non specifichiamo il segno) la densità di corrente e`: jl = Nq qvd

(8.24)

dove vd e` la velocità di deriva, mentre per quelle di polarizzazione vale: ∂P (8.25) jp = ∂t Tenendo conto di (8.23) possiamo riscrivere la (8.19) come: ρl + ρ p ρl 1 ∇⋅E = = − ∇⋅P (8.26) є0 є0 є0 che, in assenza di cariche libere, diventa: 1 (8.27) ∇⋅E = − ∇⋅P є0 L’equazione di Ampère-Maxwell (8.22), a sua volta, può essere riscritta come: ∂E (8.28) ∇ × B = μ0 j l + μ0 j p + є0 μ0 ∂t 271

Capitolo 8


che, usando (8.25), si trasforma in: ∇ × B = μ0 jl + μ0

∂ (є0 E + P) ∂t

(8.29)

In assenza di cariche libere tale espressione diventa allora: ∇ × B = μ0

∂ (є0 E + P) ∂t

(8.30)

Partiamo ora dalla (8.21) e prendiamo il rotore di entrambi i membri: ∇ × (∇ × E) = −

∂ (∇ × B) ∂t

(8.31)

commutando liberamente derivate spaziali e temporali. Ricordando che: ∇ × (∇ × E) = ∇(∇ ⋅ E) − ∇2 E

(8.32)

il primo membro della (8.31) diventa: −∇2 E −

1 ∇(∇ ⋅ P) є0

(8.33)

mentre il secondo membro diventa (usando la (8.30)): −μ0 є0

∂2 E ∂2 P 1 ∂2 E 1 ∂2 P − μ = − − 0 ∂t 2 ∂t 2 c 2 ∂t 2 є0 c 2 ∂t 2

(8.34)

Riordinando i termini si ottiene l’equazione: ∇2 E −

1 ∂2 E 1 1 ∂2 P = − ∇(∇ ⋅ P) + c 2 ∂t 2 є0 є0 c 2 ∂t 2

(8.35)

Al di là dei dettagli di questa equazione, quello che conta e` che se il secondo membro fosse nullo avremmo semplicemente l’equazione di D’Alembert per il campo elettrico che avrebbe come soluzione un’onda armonica piana che si propaga con velocità c. Il secondo membro non e` nullo, ma siccome P e` funzione di E allora anche l’equazione (8.35) può avere onde come soluzioni generali, come mostrato nell’esempio 2.

272

Equazioni di Maxwell per un dielettrico

Capitolo 8

Consideriamo ora per semplicità un’onda piana che si propaga nella direzione x e che e` polarizzata linearmente con il campo elettrico diretto secondo l’asse y. L’ampiezza del campo elettrico può essere scritta come: E y = E0 e i(kx−ωt)

(8.36)

dove E0 e` l’ampiezza massima dell’onda, ω la sua frequenza angolare e k il numero d’onda. Se ricordiamo che la velocità di fase vale v = ω/k e che l’indice di rifrazione e` definito come n = c/v possiamo riscrivere l’ampiezza del campo elettrico come: (8.37) E y = E0 e iω(nx/c−t) Questa e` l’espressione generale per un’onda armonica, espressa in funzione della variabile da determinarsi n. Si verifica (vedi esempio 2) che tale espressione per il campo elettrico soddisfa all’equazione (8.35) se: n2 = 1 + N a α

(8.38)

Sostituendo a N a α il valore fornito da (8.7), cioè N a α = P/є0 E, e usando P = N a p = N(−e)x dove x e` dato dall’equazione (8.2) e N la densità di elettroni, si ottiene: 1 Ne 2 (8.39) nˆ 2 = 1 + 2 є0 m ω0 − ω2 − iγω dove abbiamo sostituito n con nˆ perché risulta evidente che l’indice di rifrazione, soluzione di (8.39), deve essere una quantità complessa. Questa espressione e` stata ricavata usando la (8.7) che però non tiene conto che la polarizzazione in un materiale denso dipende non solo dal campo esterno, ma anche dal campo prodotto dagli atomi vicini. Si può tenere conto di ciò andando a sostituire la (8.7) con la (8.9) che comporta una riscrittura della costante di proporzionalità tra P e E. Con questa sostituzione la (8.39) viene rimpiazzata da: nˆ 2 − 1 1 Ne 2 = Na α = 3 2 (8.40) nˆ + 2 є0 m ω20 − ω2 − iγω che e` un altro modo di scrivere la equazione di Clausius-Mossotti. 273

Capitolo 8


8.3 L’indice di rifrazione L’equazione di Clausius-Mossotti definisce il valore dell’indice di rifrazione nˆ che risulta essere funzione, tra le altre cose, dei parametri ω0 e γ caratteristici del dielettrico. Come si e` visto, l’indice di rifrazione non e` una quantità reale ma complessa. Scriviamola allora esplicitamente come somma di una quantità reale più una immaginaria pura: (8.41) nˆ = nR + in I La parte reale (n R ) e quella immaginaria (n I ) non sono indipendenti tra loro, ma sono legate da quelle che si chiamano relazioni di dispersione, che incontreremo più sotto. Sostituiamo questa rappresentazione per nˆ dentro l’espressione dell’onda piana (8.37) che diventerebbe: E y = (E0 e −ωnI x/c ) e iω(nR x/c−t)

(8.42)

La fattorizzazione indicata suggerisce che si tratta ancora di un’onda che si propaga lungo l’asse x con velocità di fase v = c/nR , ma la cui ampiezza E0′ non e` più costante e descresce esponenzialmente secondo: E0′ = E0 e −ωnI x/c

(8.43)

Ricordando che l’intensità di un’onda e` proporzionale al quadrato dell’ampiezza del campo elettrico, si ottiene che l’intensità e` una funzione anch’essa di x data da: (8.44) I ∝ e −2ωnI x/c ≡ e −βx dove abbiamo introdotto il coefficiente di assorbimento β = 2ωnI /c. Si usa anche definire la lunghezza di assorbimento come reciproco del coefficiente di assorbimento, cioè ℓ ass = 1/β. Con questa definizione l’intensità diventa: I ∝ e −x/ℓ ass 274

(8.45)

L’indice di rifrazione

Capitolo 8

n(ω)

1

ω0

ω

Figura 8.5: indice di rifrazione n in funzione della frequenza angolare ω dell’onda incidente. In assenza di smorzamento, cioè con γ = 0.

detta equazione di Beer, che ci dice che un’onda che si propaga entro un dielettrico riduce la sua intensità al 37% di quella incidente dopo aver attraversato una distanza pari a ℓ ass . Valori tipici per il coefficiente di assorbimento dei solidi variano tra circa zero e circa 108 m−1 con forti dipendenze dalla presenza nel cristallo di imperfezioni e impurità. In maniera corrispondente la lunghezza di assorbimento varia tra circa 10−8 m e valori molto grandi. Poiché β risulta essere proporzionale alla parte immaginaria dell’indice di rifrazione possiamo eliminare possibili ambiguità chiamando d’ora in poi n la parte reale n R e usare la coppia di coefficienti n e β. Razionalizzando l’equazione (8.40) si ottengono le seguenti espressioni7 per n(ω) e β(ω): n(ω) = 1 +

ω20 − ω2 Ne 2 2є0 m (ω20 − ω2 )2 + γ2 ω2

7

(8.46)

I coefficienti n e β non sono indipendenti tra di loro, ma legati da espressioni dette relazioni di dispersione ricavabili, a loro volta, dalle relazioni di Kramers-Kronig riguardanti la polarizzabilità di un dielettrico.

275

Capitolo 8


n(ω)

1

ω0

ω

Figura 8.6: indice di rifrazione n in funzione della frequenza angolare ω dell’onda incidente. In presenza di smorzamento, assumendo γ = ω 0 /10.

e β(ω) =

γω2 Ne 2 є0 mc (ω20 − ω2 )2 + γ2 ω2

(8.47)

Si noti che per γ → 0 il coefficiente di assorbimento β → 0 e che il fenomeno dell’assorbimento dell’onda e` legato allo smorzamento delle oscillazioni entro il dielettrico. Le funzioni n(ω) e β(ω) seguono l’andamento rappresentato in figura 8.5, 8.6 e 8.7. Nel caso di n(ω) si parla di curva di dispersione. L’andamento di β(ω) ricorda le curve di risonanza e in questo caso il picco diventa tanto più stretto quanto più piccolo e` γ. Per γ → 0 ci sarebbe un assorbimento nullo per qualsiasi frequenza angolare diversa da ω0 e infinito in corrispondenza di ω0 . Il mezzo sarebbe perfettamente opaco per onde incidenti aventi ω = ω0 e totalmente trasparente per frequenze diverse. Dal valore del coefficiente γ dipende la forma del picco, dove la larghezza Δω del picco di β(ω), calcolata a metà altezza, risulta essere pari a γ. Poiché l’indice di rifrazione e` una funzione della frequenza angolare ω dell’onda incidente, anche la velocità di fase risulta essere funzione di ω: v(ω) = c/n(ω) 276

(8.48)


Capitolo 8

β(ω)

ω0

ω

Figura 8.7: coefficiente di assorbimento β in funzione della frequenza angolare ω dell’onda incidente. In presenza di smorzamento, assumendo γ = ω 0 /10.

e per questo motivo il mezzo si dice dispersivo. Si usa il termine dispersione perché un pacchetto d’onde, esprimibile secondo quanto visto nel capitolo 2 come somma di onde armoniche di frequenza diversa, tenderebbe a disperdersi (cioè espandersi spazialmente) a causa della propagazione con velocità diversa di ciascuna componente. Tornando alle figure 8.6 e 8.7 si può evidenziare come, al di fuori di un intervallo di ampiezza Δω = γ centrato in ω0 , l’assorbimento sia trascurabile e l’indice di rifrazione n sia una funzione crescente di ω. In questo caso si parla di dispersione normale e il mezzo risulta praticamente trasparente per l’onda che vi incide. Nell’intervallo Δω attorno a ω0 si parla invece di dispersione anomala perché l’indice decresce all’aumentare di ω e l’onda viene attenuata. Nel caso di un solido i valori dei parametri che caratterizzano l’oscillatore, ω0 e γ sono diversi che nel caso di atomi liberi perché intervengono interazioni intense tra un atomo e quelli vicini. Bisogna allora considerare più oscillatori, con intensità relativa differente f j . La (8.40) diventa: 3

fj nˆ 2 − 1 Ne 2 = ∑ 2 2 nˆ + 2 є0 m j ω0 j − ω2 − iγ j ω 277

(8.49)

Capitolo 8


risultato valido anche applicando rigorosamente i principi della meccanica quantistica. Andando a ricavare la parte reale e immaginaria, o meglio n(ω) e β, si ottiene: f j (ω20 j − ω2 ) Ne 2 n(ω) = 1 + (8.50) ∑ 2є0 m j (ω20 j − ω2 )2 + γ2j ω2 e β(ω) =

f j γ j ω2 Ne 2 ∑ 2 є0 mc j (ω0 j − ω2 )2 + γ2j ω2

(8.51)

La funzione n(ω) segue un andamento come quello rappresentato nella curva di dispersione riportata in figura 8.8, caratterizzato da più frequenze proprie ω0 j . Si noti che in corrispondenza di ciascuna frequenza angolare propria si riproduce il comportamento tipico della dispersione per il singolo oscillatore. Riassumiamo quanto discusso in questa sezione dicendo che le proprietà ottiche di un corpo, osservate a livello macroscopico, possono essere espresse in funzione dell’indice di rifrazione complesso e, quindi, in funzione di n(ω) e β(ω). E` il comportamento delle due funzioni n(ω) e β(ω), alla frequenza dell’onda incidente, a determinare la risposta del corpo dal punto di vista della riflettività, trasparenza e dispersione. Siccome la riflettività e l’assorbimento sono funzioni di n e di β, si possono usare misure di riflettività e assorbimento, fatte a una certa frequenza angolare ω, per ottenere i valori di n(ω) e β(ω) corrispondenti (o alternativamente n R (ω) e n I (ω)).

8.3.1

Dispersione della luce

Discutiamo ora il caso specifico di un dielettrico colpito da un raggio luminoso, cioè un’onda elettromagnetica con frequenza angolare ω compresa tra circa 2.7 × 1015 e 4.7 × 1015 rad/s, corrispondente all’intervallo del visibile con lunghezza d’onda compresa tra 400 e 700 nm. Nel caso di dispersione normale l’indice di rifrazione riceve contributi soprattutto dal termine della sommatoria avente frequenza angolare propria 278


Capitolo 8

n(ω)

1

ω2

ω1

ω

Figura 8.8: curva di dispersione tipica di un mezzo solido. Sono evidenziate due frequenze angolari proprie.

ω0 j più vicino al valore di ω. Se, inoltre, si va a esprimere n(ω) in funzione di λ = 2πc/ω si ottiene una formula del tipo: n(λ) = A +

B λ2

(8.52)

detta formula di Cauchy, i cui coefficienti A e B dipendono, tra le altre cose, dalle frequenze angolari proprie ω0 j . Come esempio riportiamo in figura 8.9 l’andamento dell’indice di rifrazione per un cristallo dispersivo come il quarzo. In questo caso si possono ricavare sperimentalmente i valori dei coefficienti A e B che valgono, per il quarzo, A = 1.446 e B = 3.5 × 10−15 m2 .

8.3.2

Velocità di gruppo

Ricordiamo che la velocità di gruppo v g viene definita a partire da frequenza angolare e numero d’onda come: vg =

dω dk

(8.53)

Nell’esempio 3 dimostreremo che la velocità di gruppo può essere scritta 279

Capitolo 8


n(λ)

1.446

λ 0.3 0.4 0.5 0.6 0.7 (×10−6 m) Figura 8.9: indice di rifrazione del quarzo in funzione della lunghezza d’onda.

in funzione dell’indice di rifrazione come: vg =

c n + ωdn/dω

(8.54)

Si può notare subito che nei mezzi non dispersivi n non e` funzione di ω, e quindi dn/dω = 0 implica che la velocità di gruppo coincida con quella di fase. Ciò avviene anche per mezzi dispersivi in corrispondenza di un minimo o massimo di n per cui dn/dω = 0. In caso di dispersione normale abbiamo dn/dω > 0 da cui segue v g < v. Se, invece, si e` nelle condizioni di dispersione anomala, cioè vicini a una frequenza angolare propria, vale dn/dω < 0 e di conseguenza sarebbe v g > v e si potrebbe avere v g > c. Questa e` un’apparente violazione del principio di relatività di Einstein secondo cui un segnale o una perturbazione fisica non può mai propagarsi con velocità maggiore della velocità della luce nel vuoto c. In realtà ciò non rappresenta un problema perché in corrispondenza delle frequenze proprie il pacchetto d’onde subisce una forte deformazione e il concetto di velocità di gruppo non e` più adeguato a descrivere l’effettiva velocità di propagazione del segnale fisico che e` comunque sempre minore di c. 280


8.3.3

Capitolo 8

Esempi

1. Determinare la differenza relativa tra il campo elettrico locale e quello esterno nel caso di azoto gassoso (χ e = 5.8 × 10−4 a temperatura e pressione ambiente) e allo stato liquido (χ e = 5.9 × 10−1 a 80 K). Dall’equazione (8.8) ricaviamo che la differenza relativa vale: Eloc − E 1 P = E 3є0 E che, ricorrendo a (8.4), diventa in modulo: E loc − E 1 1 = єo χ e = χ e E 3є0 3 Quindi, nel caso gassoso la differenza relativa e` circa di 2 parti su 10 000 (pressoché trascurabile), mentre nel caso liquido e` di circa 2 parti su 10 (significativo). 2. Verificare che un campo elettrico oscillante, se vale la condizione (8.38), soddisfa all’equazione differenziale (8.35), nel caso di un dielettrico isotropo e assumendo che la polarizzazione sia proporzionale al campo elettrico. Il primo termine del primo membro di (8.35) vale: ∇2 E =

∂2 E y ∂2 E y ∂2 E y u + u + u y = −k 2 E y u y y y ∂x 2 ∂y2 ∂z 2

(8.55)

per l’onda descritta da (8.36). Il secondo termine del primo membro vale invece: −

1 ∂2 E ω2 = E y uy c 2 ∂t 2 c 2

(8.56)

Se il dielettrico e` isotropo allora P e` parallelo a E e, quindi, nel caso discusso la polarizzazione ha solo componente y che non dipende da y e la divergenza ∇ ⋅ P = ∂Px /∂x + ∂Py /∂y + ∂Pz /∂z diventa nulla. Il primo termine del secondo membro di (8.35) e`, quindi, nullo. Se assumiamo poi: Py = є0 N a α(ω)E y

281

(8.57)

Capitolo 8


allora il secondo termine del secondo membro vale: ∂2 E y 1 ω2 N α(ω) u = − N a α(ω)E y u y a y c2 ∂t 2 c2

(8.58)

Sostituendo queste espressioni entro (8.35) si ottiene: −k 2 E y +

ω2 ω2 E = − N a α(ω)E y y c2 c2

(8.59)

Semplificando E y e riordinando si ottiene l’equazione: k2 =

ω2 [1 + N a α(ω)] c2

(8.60)

cioè: n2 = 1 + N a α(ω)

(8.61)

Per questo valore di n l’espressione del campo elettrico soddisfa, come si voleva provare, l’equazione (8.35). 3. Ricavare la velocità di gruppo in funzione dell’indice di rifrazione (reale) n e della frequenza angolare ω. Partiamo sostituendo ω = kv nella definizione (8.53): vg = Del resto:

dv d(kv) =v+k dk dk

dv dv dω dv = = vg dk dω dk dω

inoltre:

dv d(c/n) c dn = =− 2 dω dω n dω

e, quindi: vg = v −

ω dn kc dn = v − vg vg 2 n dω n dω

da cui ricaviamo: vg =

c v = 1 + (ω/n)(dn/dω) n + ωdn/dω

282

Costante dielettrica relativa

Capitolo 8

8.4 Costante dielettrica relativa Cos`ı come avviene per l’indice di rifrazione, anche la costante dielettrica relativa di un mezzo e` una quantità complessa definibile come somma di una parte reale più una immaginaria pura: єˆ = єR + iєI

(8.62)

dove la componente reale єR e` legata all’energia elettrostatica immagazzinata nel mezzo, mentre la componente immaginaria єI e` legata alla dissipazione energetica entro il mezzo. Anche nel caso di єˆ la parte reale e quella immaginaria sono legate da relazioni di dispersione dipendenti dalla frequenza e di conseguenza la costante dielettrica viene anch’essa a dipendere8 dalla frequenza: єˆ = єˆ(ω). Il legame tra la costante dielettrica (complessa) e l’indice di rifrazione e` dato dalla relazione: √ є(ω) = nˆ (ω) = n R (ω) + in I (ω) (8.63) L’inversione della (8.63), assieme alla definizione del coefficiente di assorbimento β = 2ωn I /c, dà: c2 β2 (8.64) єR (ω) = n2R − n2I = n2 − 4ω2 e ncβ (8.65) єI (ω) = 2n R n I = ω Se si conoscono invece єR e єI si possono ottenere n R e n I come: √ √ 1 nR = √ єR + є2R + є2I (8.66) 2 e √ √ 1 nI = √ −єR + є2R + є2I (8.67) 2 La costante dielettrica relativa segue curve di dispersione analoghe a quelle dell’indice di rifrazione, cioè simili alla figura 8.8. 8

La dipendenza dalla frequenza rende improprio l’uso del termine “costante dielettrica”. Sarebbe preferibile allora usare il termine “permittività dielettrica”. 283

Capitolo 8


8.5 Riflessione sulla superficie Le proprietà di riflessione di una superficie, intesa come separazione tra due mezzi dotati di proprietà ottiche (cioè indici di rifrazione) differenti, possono essere ricavate risolvendo le equazioni di Maxwell relative ai due mezzi e imponendo delle condizioni di continuità ai campi elettrici e magnetici nell’attraversamento della superficie di separazione. Si possono ottenere cos`ı dei coefficienti (detti coefficienti di Fresnel) che forniscono il rapporto tra le ampiezze dei campi riflessi o trasmessi e quelle dei campi incidenti. Nel fare questo si usa scomporre i campi secondo due direzioni, una parallela al piano di incidenza e una ortogonale, ottenendo due insiemi di relazioni per i coefficienti. Per questo motivo risulta importante conoscere la direzione di polarizzazione (se c’è) dell’onda rispetto al piano di incidenza. In questo capitolo ci limiteremo a trattare un caso semplificato, cioè quello in cui l’onda incide normalmente rispetto alla superficie di un mezzo ottico. Il vantaggio e` che in queste condizioni non serve neanche fare riferimento alla direzione di polarizzazione perché i campi (essendo l’onda trasversa) sono sempre tangenti alla superficie stessa. Consideriamo un’onda elettromagnetica che si propaga lungo la direzione x e che incide normalmente sulla superficie piana di un mezzo isotropo. Essa sarà soggetta a parziale riflessione e a parziale trasmissione, mentre l’intensità incidente I i andrà a scindersi come somma di un’intensità riflessa Ir e un’intensità trasmessa I t secondo: I i = Ir + I t = RI i + (1 − R)I i

(8.68)

dove abbiamo introdotto il coefficiente R chiamato riflettività definito come: Ir (8.69) R≡ Ii Per ricavare R esprimiamo il campo elettrico incidente proveniente dall’aria (n = 1) come (vedi la (8.37)): E i = E i0 e iω(x/c−t) 284

(8.70)

Riflessione sulla superficie

Capitolo 8

Ei Et x Er

mezzo ottico

Figura 8.10: rappresentazione schematica della formazione di un’onda riflessa E r e trasmessa E t , in seguito all’arrivo di un’onda E i incidente normalmente sulla superficie piana di un mezzo ottico isotropo.

Tale campo verrà parzialmente riflesso a produrre un campo Er e parzialmente trasmesso a produrre un campo E t , come rappresentato in figura 8.10. Nella regione x < 0, cioè quella da cui proviene l’onda, l’ampiezza totale del campo elettrico e` la somma del campo incidente e di quello riflesso e vale: E(x) = E i + Er = E i0 e iω(x/c−t) + Er0 e −iω(x/c+t)

(8.71)

corrispondente a un’onda E i viaggiante verso destra (cioè nel verso positivo delle x) e un’onda Er viaggiante verso sinistra (nel verso negativo delle x). Entro il mezzo, cioè nella regione x > 0, il campo e` solo quello trasmesso: E(x) = E t = E t0 e iω(nx/c−t)

(8.72)

Imponendo la condizione di continuità del campo per x = 0 si ottiene: E t0 = E i0 + Er0

(8.73)

Espressioni analoghe vanno scritte per il campo magnetico, prestando attenzione al fatto che l’onda riflessa ha un campo magnetico diretto opposto a 285

Capitolo 8


quello incidente (ciò e` necessario se si vuole invertire la direzione del vettore di Poynting S = E × B/μ0 , che dà la direzione di propagazione dell’onda). Per il campo magnetico la condizione di continuità sarebbe: B t0 = B i0 − Br0 →

E t0 E i0 Er0 = − v c c

(8.74)

dove abbiamo sfruttato il fatto che in un’onda elettromagnetica l’ampiezza del campo magnetico e` pari a quella del campo elettrico divisa per la velocità di propagazione dell’onda. Ricordando che n = c/v allora la (8.74) diventa: nE t0 = E i0 − Er0

(8.75)

che si può generalizzare al caso di un indice di rifrazione complesso nˆ . Abbiamo ora due equazioni e due incognite (le ampiezze del campo riflesso e di quello trasmesso) e possiamo ricavare il rapporto tra ampiezza riflessa e ampiezza incidente: Er0 1 − nˆ = E i0 1 + nˆ

(8.76)

Essendo l’intensità dell’onda elettromagnetica proporzionale al quadrato dell’ampiezza del campo elettrico, si ottiene che la riflettività per incidenza normale R vale: 2

(n R − 1)2 + n2I 1 − nˆ 2 (1 − n R ) − in I ∣ =∣ R=∣ ∣ = 1 + nˆ (1 + nR ) + in I (nR + 1)2 + n2I

(8.77)

Nel caso in cui l’indice di rifrazione sia puramente reale la riflettività risulta essere R < 1, quindi, parte dell’intensità dell’onda incidente viene trasmessa.

8.5.1

Esempio

4. Conoscendo l’indice di rifrazione complesso del germanio (nˆ = 4.141 + i2.215 alla lunghezza d’onda λ = 400 nm), si ricavi la lunghezza di assorbimento e la riflettività per incidenza normale. 286

Trasmissione di un’onda

Capitolo 8

Anche se non si tratta propriamente di un dielettrico, le definizioni date in questo capitolo valgono lo stesso. Allora: c λ 400 × 10−9 = 1.44 × 10−8 m = = ℓ ass = 2ωnI 4πn I 4π × 2.215 La riflettività vale invece: (nR − 1)2 + n2I (4.141 − 1)2 + 2.2152 = = 0.47 R= (nR + 1)2 + n2I (4.141 + 1)2 + 2.2152 cioè viene riflesso il 47% dell’intensità incidente.

8.6 Trasmissione di un’onda Nel caso di un materiale di piccolo spessore (ad esempio, una lastra di vetro) può interessare conoscere la frazione dell’intensità incidente che emerge come intensità trasmessa dall’altra parte della lastra. Se non ci fosse assorbimento da parte del mezzo la frazione di intensità trasmessa T, detta trasmissività, si ricaverebbe dalla conservazione dell’energia9 : R+T =1 (8.78) Come visto più sopra il mezzo può assorbire in parte l’onda che lo attraversa, quindi, la trasmissività di un mezzo di spessore d vale: T = (1 − R1 )e −d/ℓ ass (1 − R2 )

(8.79)

se le riflettività delle due facce del mezzo sono differenti. In generale però le due riflettività sono identiche, se le due superfici della lastra sono uguali, e uguale e` il mezzo prima e dopo la lastra; si ottiene10 cos`ı: T = (1 − R)2 e −d/ℓ ass 9

(8.80)

I coefficienti R e T andrebbero definiti come rapporti tra le potenze piuttosto che tra le intensità, perciò quando si vogliono calcolare le intensità interverrebbero considerazioni geometriche legate alle aree delle sezioni dei fasci di luce. Per incidenza normale però il rapporto tra le potenze e il rapporto tra le intensità coincidono. 10 Questa formula ignora la possibilità di riflessioni multiple tra le facce parallele del mezzo. Nella maggior parte dei casi l’effetto e` effettivamente piccolo e può essere trascurato. 287

Capitolo 8


8.7 Applicazioni Come applicazione di quanto descritto in questo capitolo riportiamo gli esempi della spettroscopia ottica condotta utilizzando prismi di quarzo e del riscaldamento dielettrico dei corpi.

8.7.1

Spettroscopia ottica

Consideriamo un mezzo dispersivo quale il quarzo. Inviando un fascio di luce bianca (cioè contenente, con distribuzione più o meno uniforme, frequenze nel dominio del visibile) si verifica che la diffrazione nel passaggio da aria a quarzo avviene ad angoli differenti11 per ciascuna frequenza perché e` diverso il valore dell’indice di rifrazione. Se la seconda superficie quarzo-aria non e` parallela alla prima (ecco perché si usano prismi e non parallelepipedi) l’effetto non e` compensato dalla seconda rifrazione. Di conseguenza un fascio bianco incidente su una faccia del prisma di quarzo emerge dall’altra faccia come un fascio di raggi divergenti di colore (frequenza) diverso (vedi figura 8.11). Questo effetto può essere usato per separare un fascio di luce bianca nel suo spettro costituente di colori/frequenze. Un tale metodo presenta dei vantaggi rispetto alla spettroscopia fatta con reticoli di diffrazione perché funziona su uno spettro di frequenze più ampio e non risente del problema della sovrapposizione di ordini differenti, come avviene nei reticoli.

8.7.2

Riscaldamento dielettrico

Poiché i dielettrici sono dei materiali isolanti non sarebbe possibile riscaldarli in modo efficace facendoli attraversare da una corrente elettrica e sfruttando l’effetto Joule. E` possibile però riscaldarli sfruttando l’oscillazione a cui sarebbero soggetti i dipoli permanenti (nel caso in cui siano presenti) soggetti al 11

Ricordiamo la legge di Snell per la rifrazione, nel passaggio da un mezzo 1 a un mezzo 2: n 1 sin θ 1 = n 2 sin θ 2 , dove θ i sono gli angoli formati dai raggi rispetto alla normale al piano di incidenza.

288


Capitolo 8

rosso violetto Figura 8.11: dispersione della luce bianca attraverso un prisma di quarzo. La componente rossa viene deviata meno di quella violetta.

campo elettrico oscillante di un’onda elettromagnetica inviata sul corpo. In seguito all’inversione continua della direzione del campo elettrico si ha una rotazione del dipolo con conseguente aumento della sua energia vibrazionale e, quindi, della temperatura stessa del corpo. Il trasferimento di energia al corpo e` tanto più efficace quanto più ci si avvicina alla condizione di risonanza, cioè quanto più ci si avvicina alla frequenza propria del materiale che compone il corpo. Questo meccanismo risulta essere molto efficace per una molecola polare quale l’acqua e meno efficace per altri tipi di molecole; su ciò si basa il riscaldamento/cottura di alimenti all’interno di un forno a microonde. In questo caso la frequenza propria dell’acqua vale circa 20 GHz, mentre le microonde usate hanno una frequenza di circa 2 GHz. Ne segue che l’effetto riscaldante non ha la massima efficacia possibile però agisce più in profondità. Un aspetto interessante del riscaldamento dielettrico e` che e` possibile agire su materiali compositi, riscaldandoli in modo selettivo.

8.8 Quesiti di riepilogo 1. L’indice di rifrazione (nella regione del visibile) di un materiale dielettrico trasparente dipende principalmente dagli ioni, dagli elettroni o dai dipoli permanenti? 289

Capitolo 8


2. In che condizioni un dielettrico può essere totalmente trasparente? Totalmente assorbente? 3. Perché un forno a microonde e` più efficace nel riscaldare acqua rispetto a ghiaccio? Non si tratta delle stesse molecole? 4. Come varia la velocità di propagazione di un’onda luminosa nel quarzo? 5. Perché per un prisma di quarzo illuminato con un raggio di luce bianca emerge più deviata la componente violetta? (vedi figura 8.11).

8.9 Esercizi 1. Calcolare la lunghezza di assorbimento e la riflettività per un’onda infrarossa (λ = 60 μm) incidente normalmente su un cristallo di cloruro di sodio. Per λ = 60 μm l’indice di rifrazione complesso di NaCl vale nˆ = 6.2 + i7.4. 2. Per l’acqua a 25 ○ C la costante dielettrica relativa vale єˆ = 77.6 + i7.5 per onde radio aventi frequenza di 2 GHz. Calcolare l’indice di rifrazione corrispondente. 3. Il massimo assorbimento per acqua a 25 ○ C avviene per microonde di circa 20 GHz. In questo caso l’indice di rifrazione vale nˆ = 6.89 + i2.65. Calcolare la lunghezza di assorbimento e confrontarla con quella per le microonde di un tipico forno a microonde (ν ≈ 2 GHz). 4. Calcolare la frazione di intensità trasmessa da una lastrina di germanio avente lo spessore d = 1 μm nel caso di un’onda infrarossa avente frequenza 2.9 × 1014 Hz. (Si usi nˆ = 4.42 + i0.123). 5. Un raggio di luce bianca incide a 45○ su una lastra di quarzo di spessore D = 10 cm. Che distanza separa il raggio rosso (λ = 700 nm) e quello violetto (λ = 400 nm) che escono dall’altra parte della lastra? 6. Una lastrina di materiale trasparente dello spessore di 10 mm lascia pas290

Esercizi

Capitolo 8

sare il 75% dell’intensità non riflessa. Che frazione dell’intensità non riflessa attraverserebbe uno spessore di 20 mm?

291

Capitolo 9 Onde elettromagnetiche in un conduttore Consideriamo ora la propagazione di onde elettromagnetiche attraverso un conduttore omogeneo, non magnetico e in assenza di cariche libere esterne o correnti di conduzione. In aggiunta si farà riferimento a materiali in regime di risposta lineare per il quale i cambiamenti sia in densità di carica sia in corrente, indotti dal campo elettromagnetico dell’onda incidente, risultano essere proporzionali al campo stesso. Facciamo, inoltre, riferimento alle transizioni intrabanda tra bande energetiche parzialmente occupate, cosa che si verifica nel caso di metalli o di semiconduttori aventi un grande numero di portatori liberi (opposte alle transizioni interbanda che si riferiscono a bande completamente riempite o completamente vuote, come succede per materiali isolanti e per i semiconduttori in genere).

9.1 L’indice di rifrazione di un conduttore Nel caso di un conduttore possiamo partire dal modello a gas di elettroni (modello di Drude, vedi capitolo 4), cioè supporre che ci siano elettroni di conduzione liberi di muoversi entro il reticolo cristallino. Questi elettroni di conduzione sono quelli che danno il contributo più importante all’indice di rifrazione e nel seguito tratteremo solo loro. Considerando le oscillazioni a cui questi elettroni sarebbero sottoposti dall’azione di un campo elettrico associato a un’onda elettromagnetica, l’e-

Capitolo 9

Onde elettromagnetiche in un conduttore

quazione del moto (8.1) andrebbe riscritta come: m(

dx d2x + γ ) = −eE 2 dt dt

(9.1)

dove abbiamo eliminato il termine ω20 x proprio perché sull’elettrone libero non agiscono forze di richiamo e, quindi, la frequenza propria risulta essere nulla. Il termine contenente il coefficiente γ rappresenta uno smorzamento viscoso. Esso dipende dal meccanismo specifico responsabile della dissipazione che in generale e` dovuta alle collisioni casuali tra gli elettroni e le impurità e imperfezioni del reticolo cristallino. Un’altra differenza rispetto al caso dei dielettrici densi sta nel fatto che per gli elettroni di un metallo il campo elettrico locale coincide con il campo elettrico esterno poiché non c’è praticamente interazione tra gli elettroni. Per questo motivo usiamo per l’indice di rifrazione l’espressione (8.39) e non la (8.40), dove però eliminiamo il termine ω20 x: nˆ 2 = 1 +

1 Ne 2 2 mє0 −ω − iγω

(9.2)

Ricordiamo quanto trattato nel capitolo 4, dove si discuteva il moto di deriva degli elettroni di conduzione assumendo che il campo elettrico fosse costante e che l’accelerazione fosse proporzionale a esso. Nel caso di un campo oscillante il valore medio e` nullo e sarebbe nulla anche l’accelerazione media d 2 x/dt 2 in (9.1). Per questo motivo il termine di resistenza γmdx/dt risulta essere uguale alla forza applicata −eE. Ricordando l’espressione (4.2): vd = −

eE τ m

(9.3)

dove τ e` il tempo medio tra gli urti successivi (chiamato anche tempo di rilassamento), si ricava che il coefficiente γ deve valere: γ= 294

1 τ

(9.4)

L’indice di rifrazione di un conduttore

Capitolo 9

Del resto dalla (4.6) si ricava anche: τ=

m σ Ne 2

(9.5)

Il valore del coefficiente γ in funzione della conducibilità σ diventa allora: γ=

Ne 2 mσ

(9.6)

che, sostituito entro (9.2), porta a scrivere l’indice di rifrazione di un conduttore in funzione della sua conducibilità e del tempo medio tra urti come: 1 σ ωτ − i σ =1− nˆ 2 = 1 − (9.7) є0 ω ωτ + i є0 ω 1 + ω 2 τ 2 L’indice di rifrazione complesso viene, quindi, a dipendere dalla frequenza ω. Per discutere le implicazioni di ciò scegliamo due regimi di frequenza diversi, cioè basse e alte frequenze, in corrispondenza dei quali scrivere ˆ un’espressione approssimata per la parte reale e immaginaria di n.

9.1.1

Approssimazione per basse frequenze

L’espressione (9.7), nel regime di basse frequenze per cui ωτ ≪ 1, diventa: nˆ 2 = 1 −

στ στ σ σ ≈− +i +i є0 є0 ω є0 є0 ω

(9.8)

dove si e` trascurato il termine 1 rispetto a σ τ/є0 ∼ 106 per un conduttore tipico. Nell’ipotesi ωτ ≪ 1 il termine reale risulta essere molto più piccolo di quello immaginario e, quindi, scriviamo: nˆ 2 = i

σ є0 ω

che può essere risolta come1: √ √ σ σ +i nˆ = 2є0 ω 2є0 ω

(9.9)

(9.10)

√ √ √ √ 1 a ritroso: se poniamo nˆ = z/2 + i z/2 allora nˆ 2 = ( z/2 + i z/2) ⋅ √ √ Verifichiamo ( z/2 + i z/2) cioè nˆ 2 = z/2 + i 2 z/2 + 2iz/2 e, quindi, essendo i 2 = −1 si ottiene nˆ 2 = iz. 295

Capitolo 9


La parte immaginaria corrisponde al coefficiente di assorbimento: √ 2σω ωn I = (9.11) β=2 c є0 c 2 mentre la lunghezza di assorbimento vale: √ є0 c 2 1 ℓ ass ≡ = β 2σω

(9.12)

Considerando valori di conducibilità tipici di un metallo, cioè σ ∼ 108 Ω−1 m−1 , ci aspettiamo una lunghezza di assorbimento pari a circa: li ≈ ℓ metal ass

6 × 10−2 √ ω

(9.13)

metri, che nel regime di basse frequenze (tipicamente ω ≪ 1013 rad/s visto che τmetal l i ∼ 10−14 s, quindi, dall’infrarosso in giù) corrisponde a una distanza molto piccola, dell’ordine di qualche nanometro. Lastrine metalliche anche se sottili hanno comunque uno spessore d molto più grande della lunghezza di assorbimento, quindi e −d/ℓ ass → 0 e il conduttore risulta perciò opaco alla trasmissione di un’onda elettromagnetica a bassa frequenza (ω ∼ 1013 rad/s). C’è bisogno di andare a una frequenza angolare molto più bassa, pari circa a 4 × 105 rad/s, per ottenere in corrispondenza una lunghezza di assorbimento di un decimo di millimetro, quindi, non troppo più piccola di quanto possa essere lo spessore di una lastra sottile di conduttore. Solo a bassissime frequenze (ω ∼ 104 rad/s) uno spessore sottile (un millimetro o meno) di conduttore può diventare parzialmente trasparente all’onda. Per quanto riguarda la riflettività, sostituendo i valori di n R e nI dati da (9.10) nella definizione (8.77), si ottiene: √ σ/2є0 ω √ (9.14) R =1−4 σ/є0 ω + 1 + 2 σ/2є0 ω Trascurando gli ultimi due addendi al denominatore perché risultano essere molto più piccoli rispetto a σ/є0 ω la riflettività si semplifica come:

296


√ R ≈ 1−2

2є0 ω σ

Capitolo 9

(9.15)

detta equazione di Hagen-Rubens. Considerando i valori tipici di conducibilità, la riflettività per una superficie metallica diventa allora: √ R ≈ 1 − 10−9 ω (9.16) A basse frequenze il secondo addendo e` molto piccolo, quindi, R ≈ 1 e il metallo diventa quasi totalmente riflettente.

9.1.2

Approssimazione per alte frequenze

Se si considera, invece, un regime di alte frequenze per cui ωτ ≫ 1 (cioè ω ≫ 1014 rad/s, quindi, dal vicino infrarosso in su) si può trascurare il termine i rispetto a ωτ nel denominatore dell’espressione (9.7) che diventa: ω2p σ 2 =1− 2 nˆ = 1 − (9.17) є0 ω 2 τ ω dove abbiamo introdotto il parametro ω p , chiamato frequenza di plasma, definito come: √ √ σ Ne 2 = ωp = (9.18) є0 τ є0 m Per un conduttore tipico la frequenza di plasma vale ω p ∼ 1 × 1016 rad/s, corrispondente alla regione ultravioletta (vedi tabella 9.1). Si parla di frequenza di plasma perché ω p e` la frequenza alla quale gli elettroni oscillano spontaneamente, in fase tra di loro, sotto l’azione del campo elettrico prodotto da loro stessi. In questo modo si viene a produrre un moto collettivo degli elettroni di conduzione, analogo a quanto si verifica in gas ionizzati. Facendo riferimento alla (9.17) si possono individuare due casi: 1. ω > ω p . In questo caso l’indice di rifrazione nˆ risulta essere reale, quindi, il coefficiente di assorbimento diventa β = 0. Ne segue che non c’è assorbimento dell’onda e il conduttore risulta completamente trasparente per l’onda, anche se comunque si parla di dispersione perché l’indice reale n(ω) 297

Capitolo 9


dipende dalla frequenza. In tabella 9.1 vengono riportati i valori di lunghezza d’onda al di sotto dei quali un metallo diventa trasparente. Allo stesso tempo la riflettività tende a zero poiché nR → 1 e n I → 0, quindi, praticamente tutta l’intensità dell’onda viene trasmessa al di là del metallo. 2. ω < ω p (detta regione di rilassamento). Ciò comporta un assorbimento dell’onda perché l’indice di rifrazione diventa immaginario puro, infatti, trascurando nella formula (9.17) l’addendo 1 rispetto a ω2p /ω2 si ottiene: ω2p ωp 2 (9.19) nˆ = − 2 ⇒ nˆ = i ω ω La lunghezza di assorbimento viene a valere: c 1 c ℓ ass = = = ≈ 1 × 10−8 m (9.20) β 2ωnI 2ω p quindi, dell’ordine di qualche nanometro. Essendo l’indice di rifrazione quasi puramente immaginario, R ≈ 1 e si ha riflessione quasi totale dell’onda incidente. Ecco spiegato perché i metalli hanno un’elevata lucentezza: perché per essi nI ≫ n R e, quindi, sono caratterizzati da un’elevata riflettività per la luce visibile. Ricordiamo che un materiale con la parte immaginaria dell’indice di rifrazione molto grande presenta, allo stesso tempo, un forte assorbimento perché il coefficiente β e` grande. Notiamo allora la corrispondenza secondo la quale un materiale (come i metalli) che assorbe fortemente l’onda elettromagnetica ha anche una forte propensione a rifletterla. La frequenza di plasma rappresenta una frequenza critica al di sotto o al di sopra della quale si manifestano due comportamenti qualitativamente differenti. La regione del visibile (2.7 × 1015 ≤ ω ≤ 4.7 × 1015 rad/s) risulta essere al di sotto della frequenza di plasma tipica dei metalli e l’onda subisce un’attenuazione parziale mentre si propaga attraverso il metallo. Ecco perché siamo abituati a considerare i metalli come generalmente opachi e riflettenti mentre, a rigore, essi lo sono solo per la luce visibile o per onde con lunghezza d’onda maggiore. Il comportamento tipico di un metallo per frequenze vicine a quella di plasma è riportato in figura 9.1, per un metallo avente ω p = 1.4×1016 rad/s. Per 298


METALLO ω p (×1016 rad/s) Ni 1.1 Fe 1.1 Mn 1.3 Ag 1.4 Au 1.4 Zn 1.5 Cu 1.6 Mg 1.7 Al 2.4

Capitolo 9

λ t (nm) 170 170 145 135 135 126 118 111 79

Tabella 9.1: frequenza di plasma per alcuni metalli e lunghezza d’onda λ t al di sotto della quale il metallo e` trasparente (λ t = 2πc/ω p ). (Elementi ordinati per valori crescenti di ω p ).

altri metalli ci si aspetta un comportamento simile: basta immaginare di traslare le curve verso destra per i metalli aventi frequenza di plasma maggiore, o verso sinistra per quelli a frequenza di plasma minore. L’aspetto più rilevante del comportamento descritto in figura 9.1 e` la discesa netta per la riflettività in corrispondenza della frequenza di plasma. Questo comportamento, regolato esclusivamente dalla frequenza di plasma, e` vero per la maggior parte dei metalli, ma non per tutti. Un comportamento peculiare si verifica, ad esempio, nel caso del rame, dell’oro o dell’argento, comportamento che ne spiega anche il colore. Se consideriamo questi tre metalli notiamo che hanno una frequenza di plasma molto simile e hanno anche una configurazione elettronica in cui il guscio d risulta essere completamente riempito2 . In tutti e tre i casi le bande elettroniche corrispondenti ai gusci d risultano essere al di sotto dell’energia di Fermi della banda di conduzione. Ciò comporta il fatto che le transizioni dalla banda d a quella di conduzione avvengono in corrispondenza di una stretta fascia di energie EF − Ed e, 2

Le configurazioni elettroniche dei gusci più esterni sarebbero 3s2 3p6 3d10 4s1 , 4s2 4p6 4d10 5s1 e 5s2 5p6 5d10 6s1 rispettivamente per Cu, Ag e Au.

299

Capitolo 9


1.0 0.8

nR

R

0.6

nI

0.4 0.2 0

0

3

6

9

12

15

18

21 ω (rad/s) ×1015

0

2

4

6

8

10

12

14 E (eV) γ

Figura 9.1: riflettività, parte reale e parte immaginaria dell’indice di rifrazione per un metallo conduttore, in funzione della frequenza angolare della radiazione incidente. La figura si riferisce a un metallo con frequenza di plasma pari a circa 1.4 × 1016 rad/s. L’avvallamento attorno a 1.5 eV e` dovuto a una transizione interbanda.

quindi, una stretta fascia di valori di frequenza angolare ω0 = (EF − Ed )/ħ. Questa fascia di frequenze può essere modellata come un oscillatore aggiuntivo. Oltre agli elettroni liberi del modello di Drude vanno allora considerati elettroni legati del modello di Lorentz dove l’elettrone non e` libero, ma risonante e la riflettività deve tenere conto di entrambi i casi. Nel caso del rame la risonanza avviene a un’energia di circa 2 eV corrispondente a ω0 = 3 × 1015 rad/s comportando una drastica riduzione della riflettività in corrispondenza di tale frequenza angolare (vedi figura 9.2). Nel caso dell’argento la risonanza avviene attorno a circa 4 eV corrispondente a ω0 = 6 × 1015 rad/s (vedi figura 9.3). Caratterizziamo quanto detto discutendo nell’esempio 1 l’assorbimento da parte di una lastra di rame su cui incidono micronde, luce visibile o luce ultravioletta, mentre nell’esempio 2 si tratta la trasmissività di una pellicola di alluminio.

300


Capitolo 9

1.0 0.8

R

0.6 0.4 0.2 0

0

3

6

9

12

0

2

4

6

8

15

ω (rad/s)

×1015

10 E (eV) γ

Figura 9.2: riflettività del rame in funzione della frequenza angolare della radiazione incidente.

1.0 0.8

R

0.6 0.4 0.2 0

0

3

6

9

12

0

2

4

6

8

15

ω (rad/s)

×1015

10 E (eV) γ

Figura 9.3: riflettività dell’argento in funzione della frequenza angolare della radiazione incidente.

301

Capitolo 9

9.1.3


Esempi

1. Si consideri un’onda elettromagnetica incidente su una lastra di rame e si discuta l’assorbimento nel caso di microonde (ν = 1 × 1010 Hz), luce visibile (ν = 5 × 1014 Hz) e ultravioletta (ν = 1017 Hz). Per il rame la conducibilità vale circa σ = 6 × 107 Ω−1 m−1 , la densità di elettroni e` circa N = 8.5 × 1028 m−3 e il tempo medio tra collisioni vale circa τ = 2.5×10−14 s. Il valore del coefficiente γ si ricava da γ = 1/τ e vale 4×1013 s−1 . Nel caso delle microonde ωτ = 2πντ = 1.6 × 10−3 ≪ 1, quindi, si ricade nell’approssimazione delle basse frequenze per la quale la lunghezza di assorbimento vale (vedi la (9.12)): √ є0 c 2 ℓ ass = 2σω e numericamente: √ 8.86 × 10−12 × (3 × 108 )2 ≈ 3 × 10−7 m = 0.3 μm ℓ ass = 2 × 6 × 107 × 2π × 1 × 1010 perciò bastano pochi micrometri di rame per assorbire completamente l’onda e, quindi, la lastra di rame risulterà opaca per le microonde. Nel caso di luce visibile vale ωτ ≈ 80 ≫ 1 e, quindi, va usata l’approssimazione per alte frequenze. La frequenza angolare corrispondente vale ω = 3.1 × 1015 rad/s e risulta essere minore di ω p , perciò l’indice di rifrazione diventa immaginario e la lunghezza di assorbimento vale (vedi la (9.20)): ℓ ass =

c 3 × 108 = = 9 × 10−9 m 16 2ω p 2 × 1.6 × 10

quindi, anche la luce visibile viene fortemente assorbita. Passando all’ultravioletto si ha ω = 6.3 × 1017 > ω p e β = 0. Non c’è, quindi, assorbimento e la lastra di rame risulta trasparente per la radiazione ultravioletta. 2. Si valuti la frazione di intensità riflessa e trasmessa per un’onda infrarossa avente frequenza ν = 2.9 × 1014 Hz, incidente normalmente su una pellicola di alluminio (σ = 3.6 × 107 Ω−1 m−1 ) avente lo spessore di 1 micrometro. A tale 302

Effetto pelle

Capitolo 9

frequenza l’indice di rifrazione complesso dell’alluminio vale circa nˆ = 1.26 + i10.0. Conoscendo già i valori dell’indice di rifrazione passiamo a calcolare direttamente ℓ ass e R. In questo caso siamo nel regime di alte frequenze con ω < ω p e, quindi, (vedi la (9.20)): ℓ ass ≈

c 3 × 108 = ≈ 6 × 10−9 m 2ω p 2 × 2.4 × 1016

perciò, essendo e −d/ℓ ass → 0, l’onda viene completamente assorbita e T = 0. La riflettività vale invece: R=

(n R − 1)2 + n2I (1.26 − 1)2 + 10.02 = = 0.95 (nR + 1)2 + n2I (1.26 + 1)2 + 10.02

Quindi il 95% dell’onda infrarossa viene riflesso, il resto e` assorbito e niente passa oltre la pellicola.

9.2 Effetto pelle Se il campo in cui gli elettroni si muovono, tra una collisione e l’altra, può essere considerato costante allora la riflettività risulta essere funzione solo di due parametri: la conducibilità e il tempo di rilassamento elettronico τ perché da questi due parametri dipende l’indice di rifrazione nˆ . La conducibilità cos`ı come l’abbiamo discussa nel capitolo 4 e` una conducibilità rispetto a correnti continue e rendiamo ciò esplicito usando il simbolo σ0 , intendendo che la frequenza a cui si riferisce vale 0. Se il conduttore e` però sottoposto a una corrente oscillante, la sua conducibilità viene a dipendere anche dalla frequenza dell’oscillazione secondo l’espressione: σ=

σ0 1 − iωτ

(9.21)

Bisogna considerare, inoltre, la capacità dell’onda elettromagnetica di penetrare entro il metallo, capacità che come abbiamo visto dipende anch’essa dalla frequenza perché da essa dipende il coefficiente di assorbimento β. 303

Capitolo 9


La profondità di pelle δ e` una misura di quanto in profondità3 avviene la conduzione elettrica in un conduttore o in maniera equivalente la distanza entro la quale si può considerare il campo elettrico approssimativamente costante. Nel caso di un campo elettrostatico, e analogamente per un’onda con frequenza ν → 0, tale quantità risulta essere molto grande e, quindi, praticamente tutto lo spessore di conduttore partecipa alla conduzione. La profondità di pelle diminuisce, però, al crescere della frequenza. Di conseguenza per un conduttore la sua resistenza al passaggio di una corrente alternata viene a essere maggiore rispetto al valore relativo al passaggio di una corrente continua. Ciò e` dovuto al fatto che attraverso la sezione del conduttore non si ha una distribuzione uniforme della corrente, ma essa risulta essere minore al centro e maggiore in periferia. La profondità di pelle (classica) δ e` una funzione della frequenza secondo la formula: √ 2є0 δ=c (9.22) σω e per conduttori tipici (σ ≈ σ0 ∼ 5 × 107 Ω−1 m−1 ) vale: 0.2 δ≈√ ω

(9.23)

metri. La profondità vale, quindi, tipicamente qualche centimetro per ν ∼ 10 Hz, qualche millimetro per ν ∼ 1 kHz, fino a diventare minore del micrometro per ν ∼ 40 GHz (vedi esempio 3). Consideriamo l’espressione di δ. A basse temperature la conducibilità σ aumenta e può diventare molto grande in un metallo puro. La profondità di pelle diminuisce allora quanto più bassa e` la temperatura e quanto maggiore e` la frequenza. D’altro canto il percorso libero medio ℓ aumenta al diminuire della temperatura perché minore e` la vibrazione del reticolo cristallino e, quindi, minore e` la frequenza di urti con lo stesso. 3

La profondità di pelle e` definita come la distanza dopo la quale il campo elettrico viene attenuato di un fattore 1/e. Dopo uno spessore pari a 5 volte la profondità l’ampiezza del campo elettrico verrebbe ridotta a circa il 7 per mille, diventando praticamente trascurabile. 304

Effetto pelle

Capitolo 9

A un certo punto, per basse temperature e alte frequenze, si può verificare δ ≪ ℓ il che comporterebbe la violazione delle premesse a partire dalle quali e` stato discusso l’effetto pelle classico. Si parla in questo caso di effetto pelle anomalo e σ viene a dipendere da δ cos`ı come δ dipende da σ. La soglia in frequenza angolare che separa l’effetto pelle normale da quello anomalo vale tipicamente 1013 rad/s (vedi esempio 3): a queste frequenze, dell’ordine del THz (1012 Hz), la profondità di pelle vale qualche decina di nanometri, valore dell’ordine del cammino libero medio dell’elettrone, invalidando completamente la teoria classica della conduzione elettrica perché il campo elettrico agente sull’elettrone verrebbe a variare considerevolmente durante il percorso dello stesso. L’effetto pelle anomalo influenza le proprietà di riflettività e trasmissività di un metallo in una regione di frequenze compresa tra il visibile e la frequenza di plasma, cambiando di qualche percento i valori rispetto a quelli attesi nel caso dell’effetto pelle normale. Diverse espressioni sono state ricavate nel caso di riflessione speculare o diffusa e sono generalmente in buon accordo con i risultati sperimentali.

9.2.1

Esempio

3. A che frequenza angolare la profondità di pelle viene a valere altrettanto del cammino libero medio? Si consideri il rame (vedi esempio 1). Invertendo l’espressione (9.22) si ottiene: ω=

2c 2є0 σ δ2

dove eguagliamo δ al cammino libero medio che per il rame vale circa ℓ = v F τ ≈ 4 × 10−8 m (usiamo qu`ı la velocità di Fermi v F = 2 × 106 m/s). Si ottiene numericamente: ω=

2 × (3 × 108 )2 × 8.86 × 10−12 ≈ 2 × 1013 rad/s 7 −8 2 6 × 10 × (4 × 10 )

nella regione dell’infrarosso vicino.

305

Capitolo 9


9.3 Applicazioni Descriviamo ora in breve tre applicazioni di quanto trattato in questo capitolo. Nel primo caso si tratta di rendere massima la riflettività, mentre nel secondo si vuole il massimo assorbimento per onde elettromagnetiche. Nel terzo caso si mostrerà come si possa sfruttare la ionizzazione degli strati alti dell’atmosfera per le comunicazioni radio a grande distanza.

9.3.1

Argentatura degli specchi

Depositando uno strato sottile di metallo su una lastra di vetro (processo chiamato argentatura) si ottiene una superficie ad alta riflettività4 , cioè quello che comunemente viene chiamato specchio. Il tipo di metallo che conviene usare per l’argentatura dipende da considerazioni quali il costo, l’intervallo di lunghezze d’onda a cui viene usato lo specchio ed eventuali requisiti sulla riflettività. Confrontiamo, ad esempio, due casi: l’economico alluminio e il più costoso argento. Come si vede in figura 9.4, usare argento al posto dell’alluminio comporta non solo un aumento della riflettività nella porzione infrarossa (λ ≳ 1000 nm), ma anche un miglioramento della riflettività nell’intervallo tra 400 e 800 nm. Questo miglioramento diventa importante quando gli specchi5 fanno parte di un’apparecchiatura scientifica, come nel caso dei telescopi dell’osservatorio Gemini6 nei quali, usando argento anziché alluminio, 4

Se si vogliono ottenere riflettività estremamente alte si ricorre ai cosiddetti specchi dielettrici formati da strati paralleli di dielettrico alternati da altro materiale trasparente. Sfruttando l’interferenza costruttiva delle riflessioni sugli strati successivi si raggiungono valori di riflettività molto vicini al 100%, cosa molto utile, ad esempio, in un apparecchio laser. 5 Nel caso degli specchi per telescopi la parte argentata riflette direttamente i raggi, senza farli passare prima attraverso il supporto di vetro. In questo modo si evitano le deboli riflessioni secondarie e si migliora l’immagine. Questo comporta però dei problemi di annerimento della superficie argentata che richiede di essere trattata periodicamente o di essere ricoperta da uno strato protettivo. 6 L’osservatorio astronomico Gemini consiste di due telescopi gemelli operanti nell’ottico e nell’infrarosso, situati uno nelle Ande cilene e uno alle Hawaii.

306

Applicazioni

Capitolo 9

R (%) 98 96 94 92 90 88 86

Ag Al

400 600 800 1000 1200 1400 1600 1800

λ (nm)

Figura 9.4: riflettività per un’argentatura in alluminio o in argento per uno specchio del telescopio Gemini. Figura rifatta a partire dalle misure originali, per gentile concessione del Gemini Observatory, vedi http://www.gemini.edu. L’applicazione necessaria di strati protettivi riduce leggermente la riflettività dell’argento.

si migliora notevolmente la sensibilità nella regione del visibile. Altro tipo di materiale usato per l’argentatura e` l’oro, che e` ancora più costoso, ma garantisce una migliore riflettività nell’infrarosso (≈ 98%), a scapito della regione λ < 550 nm dove la riflettività scende7 sotto il 40%.

9.3.2

Schermatura elettromagnetica

La crescente diffusione di apparecchiature elettroniche usate nel calcolo, comunicazioni, automazione e molti altri campi inclusi la bio-medicina, rendono importante l’utilizzo di sistemi adeguati per ovviare a problemi di interferenza elettromagnetica che possono compromettere l’uso dell’apparecchiatura. La schermatura elettromagnetica serve nei due sensi: 1) per evitare che l’apparecchiatura interferisca con altre e 2) per evitare che dispositivi esterni interferiscano con l’apparecchio in questione. 7

Ecco spiegato il colore tipico dell’oro: in riflessione vengono soppresse le componenti verdi-bluastre dello spettro, restituendo luce riflessa giallo-rossastra.

307

Capitolo 9


Nel primo caso rientrano i forni a microonde domestici che operano a una frequenza di circa 2.4 GHz, compresa nella banda delle trasmissioni wireless. Per consentire la visione del suo interno la porta del forno ha una finestra costituita da una lastra di vetro, sulla cui superficie interna e` applicato uno strato di rete conduttrice in cui la dimensione delle maglie risulta molto minore della lunghezza d’onda (≈ 12 cm) delle microonde usate. La rete si comporta allora come se fosse una lamina metallica omogenea e bastano spessori di pochi decimi di micrometro per assorbire completamente l’onda. A proposito del secondo caso, notiamo che sorgenti tipiche di interferenza (dall’esterno) possono essere molto comuni: alimentatori elettrici, luci fluorescenti, motori elettrici, altri circuiti integrati o elettrici in cui la corrente varia rapidamente e onde a radiofrequenza (da 1 kHz a 10 GHz). Tali disturbi possono essere talvolta ridotti o eliminati aggiungendo ai circuiti dei condensatori di disaccoppiamento, ma ciò non sempre risulta possibile o sufficiente. Un modo semplice per schermare un circuito elettronico e` quello di racchiudere il circuito entro un contenitore metallico. Bastano, infatti, pochi micrometri di metallo per assorbire quasi totalmente un’onda elettromagnetica con frequenza fino all’ultravioletto (vedi esempio 1). Nella pratica ci possono essere considerazioni geometriche/costruttive che rendono difficile una tale schermatura e talvolta non tutto l’apparecchio necessita8 di schermatura. In tali casi si può ricoprire l’involucro (tipicamente di plastica) che contiene l’apparecchio, o parte di esso, con vernici conduttrici. Attualmente la maggior parte dei prodotti tipo cellulari, modem o monitor e` schermata con vernici all’argento, aventi spessore dell’ordine del micrometro.

9.3.3

Ionosfera e onde radio

La ionosfera e` la porzione più esterna dell’atmosfera, compresa tra circa 100 e 400 km di quota. In questo strato l’aria e` estremamente rarefatta, ma anche 8

Ad esempio, non c’è bisogno di schermare la batteria di un cellulare.

308


Capitolo 9

parzialmente ionizzata a causa della radiazione ultravioletta proveniente dal sole. L’aria ionizzata può essere considerata alla stregua di un metallo, con una densità N di elettroni per unità di volume. Questa densità è tipicamente compresa tra 1011 e 1012 elettroni per metro cubo, essendo maggiore nella parte più esterna della ionosfera maggiormente esposta ai raggi solari. Facendo riferimento all’intervallo di concentrazione e considerando lo strato ionizzato alla stregua di un metallo, si avrebbe una frequenza di plasma pari a ω p ≈ 1.8÷5.6×107 rad/s (vedi la (9.18)) corrispondente a una frequenza ν p ≈ 3 ÷ 9 MHz. Per onde provenienti da sorgenti sulla superficie terrestre, aventi frequenza maggiore di ν p , la ionosfera risulterebbe praticamente trasparente, mentre per le frequenze decisamente minori la superficie inferiore della ionosfera corrisponde a uno strato ad alta riflettività, che fa rimbalzare le onde verso la superficie terrestre. Per questo motivo le onde radio AM, che hanno frequenze tipiche attorno al MHz (0.5 ÷ 1.6 MHz), vengono trasmesse e ricevute a grande distanza, nonostante la curvatura terrestre impedisca il collegamento diretto, sfruttando la riflessione da parte della ionosfera. Per comunicare con i satelliti in orbita si devono usare, invece, onde radio a frequenza maggiore, ν ≈ 108 Hz. Questa frequenza e` anche quella tipica delle stazioni radio FM o TV, che, quindi, non possono, quale che sia la potenza dell’antenna emittente, essere ricevute a distanza troppo grande perché non possono sfruttare la riflessione sulla ionosfera.

9.4 Quesiti di riepilogo 1. Per quali intervalli di frequenza angolare una pellicola di alluminio non risulta essere fortemente riflettente? 2. Per quali intervalli di frequenza angolare una pellicola di alluminio diventa perfettamente trasparente? 3. E` possibile avere trasmissività non trascurabile per una pellicola di metallo 309

Capitolo 9


dello spessore di qualche micrometro rispetto a onde radio alla frequenza ν = 1 MHz? 4. Qual e` la relazione (a basse frequenze) tra la lunghezza di assorbimento e la profondità di pelle di un metallo? 5. A che frequenza risultano uguali la profondità di pelle e il cammino libero medio? Si consideri l’argento (ℓ ≈ 6 × 10−8 m, σ = 6.3 × 107 Ω−1 m−1 ). 6. Perché il rame appare rossastro in riflessione, mentre l’argento appare incolore?

9.5 Esercizi 1. Quanto vale la lunghezza di assorbimento nel caso di un’onda ultravioletta (λ = 100 nm) incidente su una pellicola di alluminio? 2. A che frequenza risulta completamente trasparente una lamina di ferro dello spessore di qualche millimetro? 3. Si consideri un’onda avente frequenza ν = 10 kHz che incide normalmente su una pellicola di alluminio dello spessore di 1 millimetro. Che frazione dell’intensità incidente viene riflessa dalla pellicola? 4. Quanto vale la trasmissività di una lastra di alluminio dello spessore di 2 mm per onde ultraviolette aventi frequenza ν = 5 × 1015 Hz? 5. L’oro ha un indice di rifrazione pari a circa nˆ = 1.24 + i1.54 per λ = 480 nm, mentre vale nˆ = 0.09 + i3.82 per λ = 700 nm. Confrontare i valori di riflettività per le due lunghezze d’onda. 6. Che spessore di metallo risulta necessario per assorbire le microonde di un forno a microonde?

310

Capitolo 10 Proprietà termiche Un corpo solido, a cui viene ceduta energia sotto forma di calore risponde principalmente in tre modi: 1) aumenta la sua temperatura, 2) trasferisce calore al resto del corpo e 3) subisce un’espansione del suo volume. In questo capitolo ci proponiamo di discutere questi tre fenomeni e di caratterizzarne gli aspetti più salienti. L’aumento di temperatura dovuto a una certa quantità di calore assorbita dipende da una caratteristica del corpo che si chiama capacità termica C. Tale parametro dipende a sua volta dalla massa m del corpo e da una caratteristica intrinseca del materiale che lo compone, detta calore specifico c = C/m1 . A tale proposito si osserva sperimentalmente che per molte sostanze solide la capacità termica di una mole assume approssimativamente lo stesso valore, indipendentemente dalla sostanza. Per quanto riguarda il fenomeno della conduzione termica esso viene descritto attraverso un parametro detto conducibilità termica. A riguardo si osserva come alcuni materiali come i metalli siano contemporanemente buoni conduttori termici e buoni conduttori elettrici, quindi, il meccanismo di conduzione nei due casi deve in qualche modo essere collegato. Per i metalli la conduzione e`, infatti, dovuta in entrambi i casi a elettroni liberi e allora si recupereranno qui argomenti trattati nel capitolo 4. Esistono però altri materiali, tipo i dielettrici, che conducono in modo efficace il calore, ma non la corrente elettrica. In questo caso ci deve essere un altro meccanismo che partecipa al fenomeno e, infatti, la conduzione termica viene a dipendere 1

Ricordiamo che il calore Q assorbito da una massa m e` legato all’aumento di temperatura ΔT dalla legge calorimetrica Q = CΔT = mcΔT.

Capitolo 10

Proprietà termiche

non dal moto degli elettroni ma da quello dei fononi, che sono i quanti della vibrazione reticolare. In ogni caso la conducibilità termica abbraccia un intervallo molto più ristretto che nel caso elettrico: nel primo caso si tratta di 3 o 4 ordini di grandezza, mentre nel secondo si tratta di più di 20 ordini. I corpi solidi assumono, con l’eccezione di quelli amorfi, una struttura cristallina che presenta certe regolarità che derivano dalla natura delle forze di legame tra gli atomi e le molecole. Le proprietà di espansione dei corpi a seguito del loro riscaldamento dipendono allora da come reagisce il reticolo cristallino all’aumento di temperatura e soprattutto da come variano le distanze interatomiche.

10.1 Capacità termica La capacità termica di un corpo viene definita come l’energia (calore) necessaria a produrre un aumento della temperatura del corpo pari a un grado kelvin. Poiché la capacità termica dipende dalla massa di materiale, e` conveniente usare invece la capacità termica molare (in J/mole⋅K), che e` la capacità che si riferisce a una mole di sostanza. Da adesso, a meno di indicazione esplicita, faremo sempre riferimento alla capacità molare. Nel definire la capacità termica si distinguono due casi: quello in cui si assume che il volume del corpo resti costante e quello in cui si assume che sia la pressione esterna a rimanere costante. In maniera corrispondente si introducono due tipi di capacità termica, CV e C p , a volume o a pressione costante. La differenza tra i due valori non e` grande per un corpo solido, ma generalmente vale C p > CV , perché nel primo caso il calore assorbito deve servire anche a un eventuale lavoro fatto contro l’ambiente esterno, a causa dell’espansione del corpo. La capacità termica a volume costante viene a essere definita come: CV = (

∂U ) ∂T V

dove U e` l’energia interna di una mole di sostanza. 312

(10.1)

CV (J/mole⋅K)

Capacità termica

Capitolo 10

25

Pb

20 15

Al

C

10 5 0 0

200

400

600

800

1000

T (K) Figura 10.1: capacità termica molare in funzione della temperatura. Le curve si riferiscono al piombo, alluminio e carbonio (diamante).

Si osserva (vedi tabella 10.1) che per una gran parte dei solidi il valore della capacità termica risulta essere pari circa a 25 J/mole⋅K, a temperatura ambiente, come scoperto sperimentalmente da Dulong e Petit2 nel 1819. In certi casi, però, il valore della capacità termica a temperatura ambiente risulta essere più piccolo (ad esempio, per il carbonio-diamante) e risulta necessario andare a temperature molto elevate per raggiungere valori vicini a 25 J/mole⋅K. Tutte le capacità termiche valgono zero per T = 0 K, come previsto dal terzo principio della termodinamica3. Al crescere della temperatura le misure della capacità termica indicano una crescita proporzionale al cubo della temperatura assoluta fino a quando la temperatura non raggiunge un valore TD , detto temperatura di Debye (vedi tabella 10.1), in corrispondenza della quale la capacità termica assume il 95% del suo valore limite (vedi nota più avanti). Questo andamento e` rappresentato in figura 10.1 per alcuni metalli, dove si capisce perché per il carbonio a temperatura ambiente non si ha il valore di Dulong-Petit. La temperatura TD rappresenta un valore di separazione tra due regimi: uno ad alta temperatura, descrivibile attraverso un mo2

Pierre L. Dulong (1785-1838) e Alexis T. Petit (1791-1820), fisici francesi. Il terzo principio della termodinamica afferma in realtà che avvicinandosi allo zero assoluto l’entropia tende a un valore minimo. In maniera equivalente il calore scambiato deve tendere a zero cos`ı come la capacità termica. 3

313

Capitolo 10

Proprietà termiche

SOSTANZA Alluminio Ferro Rame Piombo Argento Nichel Carbonio (diamante)

CV (J/mole⋅K) 23.0 24.7 23.4 24.7 24.3 24.7 7.6

TD (K) 375 360 340 95 230 450 1850

Tabella 10.1: capacità termica molare (a temperatura ambiente) e temperatura di Debye per alcune sostanze.

dello classico e uno a bassa temperatura che richiede invece una trattazione quantistica.

10.1.1

Modello classico

Ad alta temperatura la capacità termica assume il valore di circa 25 J/mole⋅K, comune a molte sostanze. Questa misura può essere giustificata classicamente assumendo che ciascun atomo del cristallo sia vincolato in posizione da forze di tipo elastico. L’atomo si comporta allora come un oscillatore armonico che assorbe energia termica dall’ambiente aumentando l’ampiezza dell’oscillazione. Tali vibrazioni non possono avere ampiezza arbitrariamente grande perché sono comunque limitate dalle forze elettrostatiche dovute agli atomi vicini. Il principio di equipartizione dell’energia prescrive che l’energia media di un oscillatore unidimensionale valga: E = kT

(10.2)

dove k e` la costante di Boltzmann. Nel caso di un oscillatore tridimensionale, come per un atomo di un cristallo isotropo, l’energia media per atomo

314

Capacità termica

Capitolo 10

risulta essere pari a: E = 3kT

(10.3)

dove (in media) metà dell’energia e` cinetica e metà e` potenziale. Considerando ora una mole di sostanza, contenente un numero di Avogadro N A di atomi, l’energia interna totale viene a essere: U = 3N A kT = 3RT

(10.4)

dove abbiamo introdotto la costante dei gas ideali R = 8.314 J/mole⋅K. La capacità termica viene a valere allora: CV =

J ∂U = 3R = 24.9 ∂T mole ⋅ K

(10.5)

in accordo con i valori sperimentali osservati per vari metalli a temperatura ambiente. Il problema insito in questo modello sta però nel fatto che la capacità termica data da (10.5) risulta essere indipendente dalla temperatura e dal tipo di sostanza, in contrasto con l’osservazione sperimentale.

10.1.2

Modello di Einstein

Come abbiamo visto nel capitolo 1, per interpretare l’effetto fotoelettrico Einstein introdusse l’ipotesi dei fotoni intesi come quanti localizzati di energia elettromagnetica. In analogia con questo modello Einstein postula nel 1907 che per gli oscillatori, usati per descrivere il comportamento degli atomi all’interno del cristallo, siano possibili solo certi valori discreti di energia. L’energia di vibrazione viene a essere allora quantizzata e i quanti di energia di vibrazione vengono chiamati fononi, per suggerire un’analogia con i fotoni. Sfruttando poi il dualismo onda-particella questi quanti vengono associati a onde elastiche fononiche che si propagano entro il cristallo con velocità pari a quella del suono nel mezzo. Il comportamento dei fononi presenta delle analogie con quello degli elettroni. Ad esempio, per essi si introduce una densità di modi vibrazionali 315

Capitolo 10

Proprietà termiche

D(ν) definita in modo che D(ν)dν fornisca il numero di modi (o fononi) aventi frequenza compresa tra ν e ν + dν. Va detto che, a differenza degli elettroni, il numero di fononi non e` una quantità conservata. I fononi vengono, infatti, prodotti in misura maggiore ad alta temperatura, con ciascun fonone avente la stessa energia hν. Il numero medio di fononi N f , prodotti a una certa temperatura T, e` dato da una funzione di distribuzione detta distribuzione di Bose4 -Einstein, espressa come: 1 (10.6) N f = hν/kT e −1 e, quindi, l’energia media di un oscillatore vale: hν E(ν) = N f hν = hν/kT (10.7) e −1 L’energia interna termica di un solido alla temperatura T viene a essere pari all’energia media dell’oscillatore, moltiplicata per il numero di oscillatori presenti in una mole, cioè 3N A: hν (10.8) U = 3N AE = 3N A hν/kT e −1 Derivando questa espressione e ricordando che N A k = R, il calore termico molare viene a valere: e hν/kT hν 2 (10.9) CV = 3R ( ) kT (e hν/kT − 1)2 che dipende ora dalla temperatura, andando a zero per T → 0 come previsto e tendendo per temperature elevate al valore di Dulong-Petit (vedi esempio 1). L’espressione (10.9) fallisce, però, a basse temperature perché prevede un andamento esponenziale descrescente come (hν/kT)2 e −(hν/kT) in contrasto con l’osservazione sperimentale di una crescita proporzionale a T 3. Il modello di Einstein fa riferimento ad atomi intesi come oscillatori indipendenti l’uno dall’altro e aventi la stessa frequenza ν che può essere ricavata andando a interpolare i risultati sperimentali per CV (T) con la funzione (10.9). 4

Satyendra N. Bose (1894-1974), fisico indiano. 316

Capacità termica

Capitolo 10

In corrispondenza del valore unico di frequenza ν = ν E si definisce la temperatura di Einstein TE in modo tale che: kTE = hν E

(10.10)

Con questa definizione la capacità termica può essere riscritta come: e TE /T TE 2 CV = 3R ( ) T (e TE /T − 1)2

(10.11)

e allora TE rappresenta la temperatura alla quale CV e` pari al 92%5 del valore limite 3R. Ciascuna sostanza ha un valore caratteristico per la temperatura di Einstein che può essere ottenuto interpolando le misure sperimentali di CV in funzione di T con la funzione (10.11). Per il rame si ottiene, ad esempio, un valore TE = 240 K, che e` tipico della maggior parte dei metalli. Se però rappresentiamo la funzione (10.11) in funzione del rapporto TE /T otteniamo una curva che vale per tutte le sostanze (vedi figura 10.2). Anche se il modello di Einstein rappresenta un miglioramento rispetto alla previsione classica, esso e` ancora insoddisfacente perché prevede una capacità termica leggermente più piccola di quanto osservato sperimentalmente e soprattutto non riesce a descrivere l’andamento sperimentale proporzionale a T 3 per piccole temperature.

10.1.3

Modello di Debye

A differenza di quanto assunto da Einstein, gli atomi in un cristallo interagiscono l’uno con l’altro e lo stesso devono fare i singoli oscillatori usati nel modello. L’interazione tra oscillatori comporta allora che, anziché l’unica frequenza ν E , esistano più frequenze da considerare. Debye sugger`ı allora di sostituire i 3N A oscillatori di Einstein, aventi tutti la stessa energia hν E , con un’integrazione sul numero di modi di vibrazione possibili: U =∫

0

5

νD

E(ν)D(ν)dν

Infatti alla temperatura di Einstein C V = 3R × e/(e − 1)2 = 0.92 × 3R. 317

(10.12)

Proprietà termiche

CV (J/mole⋅K)

Capitolo 10

25 20 15 10 5 0 0

1

T/TE (K) Figura 10.2: capacità termica molare in funzione del rapporto TE /T.

integrando da ν = 0 fino a un estremo superiore ν D detto frequenza di Debye. In questo modo si ottiene un modello che consente l’assorbimento di quanti con energia piccola, risolvendo la discrepanza a basse temperature tra il modello di Einstein e i risultati sperimentali. La densità di modi D(ν) può essere scritta per una mole come6 : D(ν) =

9N A 2 ν ν 3D

(10.13)

e l’energia interna di una mole viene a valere: U = 9R

TD /T x3 T4 dx TD3 ∫0 ex − 1

(10.14)

dove x ≡ hν/kT. Derivando rispetto alla temperatura si ottiene la capacità termica molare: CV = 9R (

T 3 TD /T x 4 e x ) dx TD ∫0 (e x − 1)2

(10.15)

Questa espressione tende ancora al valore di Dulong-Petit per temperature elevate (vedi esempio 2), ma la cosa fondamentale di questa formula e` che per basse temperature, molto più piccole cioè della temperatura di Debye, la capacità termica diventa (vedi esempio 3): 6

La densità di modi si ottiene a partire dal numero di onde stazionarie possibili in un reticolo periodico.

318

Capacità termica

T 3 12π 4 R( ) CV = 5 TD

Capitolo 10

(10.16)

e risulta, quindi, essere proporzionale a T 3 come osservato sperimentalmente. La temperatura di Debye TD e` legata alla frequenza di Debye dalla relazione: hν D (10.17) TD = k e anch’essa può essere ricavata7 tramite interpolazione di curve sperimentali. Anche nel caso del modello di Debye si può rappresentare la capacità termica in funzione del rapporto T/TD ottenendo una curva che va bene per tutte le sostanze, curva simile a quella di figura 10.2. Riassumendo, la differenza fondamentale tra il modello di Einstein e quello di Debye consiste nel fatto che il secondo modello tiene in considerazione anche le oscillazioni a bassa frequenza (implicanti bassa energia e bassa temperatura). Queste oscillazioni avvengono a bassa temperatura con probabilità piccola e perciò la differenza quantitativa tra i due modelli non e` particolarmente grande.

10.1.4

Contributo elettronico

Il contributo degli elettroni alla capacità termica e` in genere piccolo rispetto a quello dei fononi, eccetto che nel caso di metalli o leghe metalliche in cui il numero di elettroni coinvolti sia molto grande. L’energia cinetica del sistema di elettroni e` pari al contributo individuale (3/2)kT moltiplicato per il numero di elettroni coinvolti. Gli elettroni coinvolti sono quelli eccitabili, cioè quelli prossimi all’energia di Fermi. Tale numero e` pari a D(EF )kT dove la densità vale: 3 ne D(EF ) = (10.18) 2 EF 1

Calcolando numericamente l’integrale ∫0 x 4 e x /(e x − 1)2 dx si ottiene il valore 0.317. La capacità termica per T = TD vale allora C V = 0.95 × 3R cioè il 95% del valore limite. 7

319

Capitolo 10

Proprietà termiche

espressione ricavabile combinando la (4.9) con la (4.14). Assumendo che il metallo sia monovalente il numero di elettroni coincide con il numero di Avogadro N A e l’energia interna di una mole vale: 9 k2 T 2 3 3 NA kT = N A U = kT 2 2 EF 4 EF

(10.19)

e, quindi:

∂U 9 N A k 2 T = (10.20) ∂T 2 EF Imponendo agli elettroni di soddisfare al principio di esclusione, l’espressione corretta della capacità termica diventa: CVe =

CVe =

π2 NA k2 T π2 T = R 2 EF 2 TF

(10.21)

che risulta essere proporzionale alla temperatura. Tenendo conto del contributo fononico oltre che di quello elettronico, la capacità termica totale al di sotto della temperatura di Debye vale: f

CV = CVe + CV

(10.22)

e si comporta in funzione della temperatura come: CV (T) = a e T + a f T 3

(10.23)

Studiando il comportamento di CV in funzione di T si possono ricavare i valori dei coefficienti a e e a f , relativi rispettivamente agli elettroni e ai fononi. Per l’argento a bassa temperatura, ad esempio, domina il contributo Ag elettronico e si ricava a e = 0.65 × 10−3 J/mole⋅K2 . Oltre che a basse temperature, il contributo elettronico diventa rilevante f a temperature molto elevate, dove CVe continua a crescere con T mentre CV ha raggiunto il valore limite di Dulong-Petit.

10.1.5

Esempi

1. Mostrare che, per temperature elevate, l’espressione di Einstein della capacità termica tende al valore di Dulong-Petit. 320

Capacità termica

Capitolo 10

L’espressione (10.9) può essere riscritta come: CV = 3Rx 2

ex (e x − 1)2

dove x ≡ hν/kT. Tale espressione può essere approssimata sostituendo al termine esponenziale e x lo sviluppo in serie arrestato al primo termine, cioè e x ≈ 1 + x, poiché x → 0 se la temperatura T e` molto grande. Con questa sostituzione otteniamo: CV ≈ 3Rx 2

1+x 1+x = 3Rx 2 2 = 3R(1 + x) ≈ 3R 2 (1 + x − 1) x

cioè il valore atteso classicamente. 2. Mostrare che, per temperature elevate, l’espressione di Debye della capacità termica tende al valore di Dulong-Petit. Quando la temperatura T e` elevata e, in maniera corrispondente, x → 0, possiamo usare l’approssimazione dell’esempio precedente e l’integrale presente nell’espressione (10.15) diventa: ∫0

TD /T

TD /T TD /T x 4 (1 + x) 1 TD 3 2 2 ( ) dx = x (1 + x)dx ≈ x dx = ∫0 ∫0 (1 + x − 1)2 3 T

quindi: CV ≈ 3R cioè il valore atteso classicamente. 3. Mostrare che, per basse temperature, l’espressione di Debye della capacità termica tende all’espressione (10.16). A basse temperature il termine x ≡ hν/kT tende a essere grande e diventa grande anche l’estremo superiore TD /T. Assumendolo tendente all’infinito8 il termine integrale dell’espressione (10.14) può essere riscritto come: ∫0

∞

x3 π4 dx = ex − 1 15

8

Ciò e` giustificato dal fatto che per valori grandi di x l’esponenziale a denominatore diventa molto grande e l’integrando diventa molto piccolo. Non fa allora molta differenza se si prende direttamente ∞ come estremo superiore. 321

Capitolo 10

Proprietà termiche

sfruttando un integrale noto. L’energia interna diventa: U=

3π 4 RT 4 5TD3

e la capacità termica vale allora: CV =

∂U 12π 4 R 3 = T ∂T 5TD3

come riportato in (10.16).

10.2 Conduzione termica Quando un’estremità di un corpo viene riscaldata, il calore ceduto si diffonde al resto del corpo secondo il meccanismo della conduzione termica. Questo fenomeno di trasporto viene rappresentato introducendo una grandezza j q , detta flusso di calore, che rappresenta la quantità di calore che attraversa una sezione del corpo di area unitaria nell’unità di tempo. Il flusso si misura allora in J/m2 ⋅s=W/m2 e dipende dalla differenza di temperatura tra i due estremi, secondo l’espressione: dT j q = −κ (10.24) dx dove κ (in W/m⋅K) rappresenta la conducibilità termica del materiale che compone il corpo, mentre dT/dx e` il gradiente di temperatura. Tale espressione, detta legge di Fourier, si riferisce a una condizione stazionaria in cui il flusso di calore non dipende dal tempo perché viene mantenuto costante il gradiente di temperatura. Il segno − sta a indicare che la direzione del flusso di calore risulta essere opposta a quella del gradiente di temperatura, cioè dall’estremità più calda verso quella più fredda. Poiché i metalli sono buoni conduttori di calore, cos`ı come lo sono di corrente elettrica, gli elettroni liberi devono giocare una parte di rilievo nel fenomeno della conduzione termica. D’altro canto esistono materiali (tipo il carbonio-diamante) che sono isolanti elettrici, ma buoni conduttori termici. In questo caso la conduzione deve seguire un altro meccanismo che riguarda i fononi. 322

Conduzione termica

Capitolo 10

La conduzione del calore attraverso un corpo e` dovuta allora principalmente a due meccanismi: il movimento degli elettroni liberi e la propagazione delle vibrazioni reticolari, cioè dei fononi. Il primo meccanismo domina nel caso dei metalli, mentre il secondo domina nel caso dei dielettrici. Gli elettroni liberi (di conduzione) aumentano la loro energia cinetica in prossimità dell’estremità più calda del corpo. Questi elettroni migrano poi per diffusione verso l’estremità più fredda del corpo trasportando l’energia cinetica da loro guadagnata e andandola a trasferire parzialmente al reticolo cristallino che aumenta la sua energia vibrazionale e, quindi, la sua temperatura. Poiché la neutralità elettrica viene mantenuta, ci sono anche elettroni che migrano dall’estremità fredda verso quella calda. Questi elettroni, però, hanno energia cinetica minore dei primi e, quindi, possono trasferire meno energia al reticolo. L’effetto netto e` che il calore trasferito dall’estremità calda a quella fredda dipende dalla differenza di energia tra gli elettroni che a sua volta dipende dalla differenza di temperatura. Nel caso dei fononi si tratta di vibrazioni del reticolo che si trasmettono al resto del reticolo come onde elastiche che si propagano con la velocità del suono. Queste vibrazioni hanno una certa distribuzione di energie e frequenze in cui solo certi valori discreti sono permessi. Il quanto minimo di energia vibrazionale e`, come già visto, il fonone e si assume che un grande numero di essi venga creato nella parte riscaldata del volume in questione, si diffonda entro il volume e venga parzialmente assorbito/eliminato presso l’estremità fredda. Il numero di fononi che migra in verso opposto e` minore, quindi, il trasferimento di calore entro il corpo viene a essere dovuto alla migrazione netta di fononi dall’estremo riscaldato al resto del corpo, migrazione che avviene sotto forma di onde elastiche. Data la compresenza dei due meccanismi, la conducibilità termica risulta essere la somma di due contributi: κ = κe + κ f

(10.25)

uno, cioè, dovuto agli elettroni (κ e ) e uno dovuto ai fononi (κ f ). In genere però si ha la prevalenza di uno solo dei due contributi. 323

Capitolo 10

Proprietà termiche

T2 jq T′

T

T ′′ x

T1 ℓ

ℓ

Figura 10.3: rappresentazione della conduzione termica attraverso una sbarra.

Per capire l’origine della legge di Fourier facciamo prima riferimento alla conduzione elettronica e consideriamo inizialmente il caso di una sbarra metallica lunga e sottile (vedi figura 10.3) in cui la temperatura diminuisce uniformemente passando dall’estremità sinistra a quella destra. Cominciamo con un modello unidimensionale in cui gli elettroni si muovono lungo l’asse x e consideriamo un volumetto posto all’interno della sbarra e avente spessore pari a due volte il cammino libero medio ℓ e. In corrispondenza della faccia sinistra del volume gli elettroni hanno un’energia E ′ = E(T ′ ) che dipende dal valore di temperatura in quei punti. Sulla faccia di destra l’energia vale invece E ′′ = E(T ′′ ). Cos`ı come la densità di corrente era data da ∣ j∣ = nevd (vedi (4.3)), analogamente il flusso di calore, da sinistra a destra attraverso il volume in questione, e` pari al numero9 di elettroni per unità di volume n e /2, moltiplicato per la velocità v e e moltiplicato per l’energia. Il flusso netto vale perciò: j1D q =

ne ne ne v e E ′ − v e E ′′ = v e (E ′ − E ′′ ) 2 2 2

(10.26)

Essendo infinitesimo lo spessore del volumetto in questione possiamo sviluppare E ′ − E ′′ come: E ′ − E ′′ = −

dE dE dT 2ℓ e = − 2ℓ e dx dT dx

9

(10.27)

Il fattore 1/2 compare perché vanno considerati solo gli elettroni che si muovono nella direzione voluta che, in un moto unidimensionale, sono la metà del totale.

324

Conduzione termica

Capitolo 10

e, quindi:

dE dT (10.28) dT dx Per passare al caso generale in tre dimensioni bisogna moltiplicare10 per 1/3, ottenendo: dE dT 1 (10.29) jq = − ne ve ℓe 3 dT dx Confrontando questa espressione con la legge di Fourier si ricava che la conducibilità corrisponde a: j1D q = −n e v e ℓ e

dE 1 κe = ne ve ℓe 3 dT

(10.30)

Ciascun elettrone ha un’energia cinetica (dal principio di equipartizione dell’energia) pari a (3/2)kT, quindi: 3k 1 1 = n e kv e ℓ e κe = ne ve ℓe 3 2 2

(10.31)

Del resto, per un metallo monovalente l’energia cinetica media per unità di volume vale: 3 (10.32) EcV = n e kT 2 e, visto che gli elettroni liberi interagiscono debolmente tra di loro e con il reticolo, l’energia interna risulta essere pari all’energia cinetica. La capacità termica per unità di volume11 vale allora: CVV =

3 ∂U ∂EcV = = ne k ∂T ∂T 2

(10.33)

Confrontando (10.33) e (10.31) si ricava il legame tra conducibilità e capacità termica: 1 κ e = CVV v e ℓ e (10.34) 3 Perché ⟨v x2 ⟩ = ⟨v 2 ⟩/3. La capacità molare si può ottenere da quella per unità di volume C VV moltiplicando per il volume molare Vm = M/ρ dove M e` la massa molecolare espressa in grammi e ρ la densità espressa in g/cm3 . 10 11

325

Capitolo 10

Proprietà termiche

Come abbiamo visto nel capitolo 4, solo gli elettroni vicini all’energia di Fermi partecipano alla conduzione elettrica. Allo stesso modo, solo gli elettroni vicini all’energia di Fermi possono cambiare la loro energia cinetica a seguito del calore assorbito e partecipare alla conduzione termica. Per questo motivo la velocità da considerare nell’espressione (10.34) e` la velocità di Fermi v F . Analogamente il numero di elettroni per unità di volume che partecipano effettivamente alla conduzione e` pari alla densità elettronica valutata all’energia di Fermi n e = D(EF ), che e` praticamente uguale al numero di elettroni liberi per unità di volume. Sfruttando la (10.21), e sostituendo ℓF = v F τ e EF = mv F2 /2, si ottiene: π 2 n e k 2 τT (10.35) κe = 3m⋆ dove, similmente a quanto fatto nel caso elettrico, abbiamo introdotto la massa efficace m⋆ per descrivere le piccole differenze tra il valore atteso e quello misurato. Nel caso di materiali dielettrici la capacità termica e` dominata dal contributo fononico con un’espressione analoga alla (10.34), cioè: 1 κ f = CVV v f ℓ f (10.36) 3 dove la velocità dei fononi e` pari alla velocità del suono nel mezzo, mentre il cammino libero medio ℓ f dipende dagli urti tra fononi e con difetti e impurità del reticolo cristallino. A basse temperature ci sono pochi fononi eccitati e con un grande cammino libero medio. La conducibilità in questo caso e` limitata dalla capacità termica che varia come T 3 . Ad alte temperature vengono prodotti molti fononi e la conducibilità viene a essere limitata dal cammino libero medio che varia approssimativamente come 1/T. Ne deriva che la conducibilità termica in funzione della temperatura segue un andamento simile a quello descritto in figura 10.4 che presenta un massimo a temperature intermedie. L’altezza relativa del picco dipende a sua volta dalla frazione relativa di impurità o difetti presenti nel materiale; il picco diventa più alto e più stretto quanto più puro e` il materiale. 326

Conduzione termica

Capitolo 10

κ

minor purezza CV ∼

ℓf ∼

1 T

T3

T

Figura 10.4: conducibilità termica in funzione della temperatura. Si osserva che la conducibilità a bassa temperatura e` dominata dal termine C V ∼ T 3 , mentre ad alta temperatura e` dominata dal termine ℓ f ∼ 1/T. Per sostanze meno pure l’altezza del picco tende a diminuire.

10.2.1

Conduzione elettrica e termica

Nel caso dei metalli i fenomeni della conduzione termica ed elettrica sono riconducibili alle proprietà di mobilità degli elettroni liberi. Già nel 1853 Wiedemann12 e Franz osservarono che un buon conduttore elettrico e` anche un buon conduttore termico. Ricordiamo l’espressione (4.6) per la conducibilità elettrica: ne 2 τ (10.37) σ= ⋆ m dove abbiamo sostituito la massa dell’elettrone con la sua massa efficace. Se si costruisce il rapporto L tra la conducibilità termica e il prodotto di conducibilità elettrica e temperatura, si vede che vale: L=

J2 π2 k2 κe −8 = = 2.44 × 10 σT 3e 2 C2 ⋅ K2

(10.38)

Tale espressione si chiama legge di Wiedemann-Franz e il numero L e` detto numero di Lorenz13 . 12

Gustav H. Wiedemann (1826-1899), fisico tedesco. Ci si riferisce in questo caso al fisico e matematico danese Ludvig V. Lorenz (1829-1891) e non all’olandese Heindrich Lorentz. 13

327

Capitolo 10

Proprietà termiche

METALLO Alluminio Rame Oro Zinco

L (×10−8 J2 /C2 ⋅K2 ) 2.20 2.25 2.50 2.28

METALLO L (×10−8 J2 /C2 ⋅K2 ) Ferro 2.71 Argento 2.13 Nichel 2.08 Piombo 2.64

Tabella 10.2: valori assunti dal numero di Lorenz per alcuni metalli.

Il numero di Lorenz dovrebbe essere indipendente dal tipo di metallo e in tabella 10.2 ne riportiamo il valore in alcuni casi, a conferma della legge di Wiedemann-Franz.

10.2.2

Esempi

4. Conoscendo la conducibilità termica dell’argento (430 W/m⋅K) si ricavi il cammino libero medio degli elettroni a temperatura ambiente. Ricordando che l’energia di Fermi dell’argento vale 5.5 eV (vedi tabella 4.2), il valore della capacità termica elettronica e` (vedi la (10.21)): CVe =

π 2 × 6.02 × 1023 × (1.38 × 10−23 )2 × 293 J = 0.19 −19 2 × 5.5 × 1.6 × 10 mole ⋅ K

Il cammino libero medio può essere ricavato dalla (10.34) come: ℓe = 3

κe v e CVV

Come valore di v e usiamo la velocità di Fermi 1.4 × 106 m/s (vedi tabella 4.2), mentre la capacità per unità di volume si ottiene dividendo la capacità molare per il volume molare. Nel caso dell’argento il volume molare e`: Vm =

m3 cm3 M 107.9 = = 10.3 = 10.3 × 10−6 ρ 10.5 mole mole

quindi: CVV

CVe J 0.19 = = = 1.8 × 104 3 −6 Vm 10.3 × 10 m ⋅K 328

Espansione termica

Capitolo 10

Si ottiene allora: ℓe = 3

430 = 5 × 10−8 m 4 × 1.8 × 10

1.4 × 106

5. Calcolare la conducibilità termica a temperatura ambiente di un metallo avente n e = 8.5 × 1028 elettroni per metro cubo e un tempo medio tra collisioni pari a τ = 2.5 × 10−14 secondi. Ricorriamo alla formula (10.35) e sostituiamo i valori dei parametri, usando come massa efficace quella normale dell’elettrone: π 2 × 8.5 × 1028 × (1.38 × 10−23 )2 × 293 × 2.5 × 10−14 W = 430 −31 3 × 9.1 × 10 m⋅K valore vicino a quello della conducibilità del rame, a cui si riferiscono i valori scelti per i parametri. κe =

10.3 Espansione termica Per la maggior parte dei corpi solidi si osserva che un riscaldamento del corpo porta a un’espansione del suo volume. Nel caso di un corpo lungo e sottile il riscaldamento ne aumenta la lunghezza dal valore ℓ ad un valore ℓ′ = ℓ + Δℓ. La variazione relativa di lunghezza Δℓ/ℓ risulta dipendere linearmente dalla differenza di temperatura ΔT secondo l’espressione: Δℓ = αℓ ΔT (10.39) ℓ dove il parametro αℓ viene detto coefficiente di espansione lineare (in K−1 ). L’espansione avviene comunque in tutte e tre le dimensioni, quindi, per il volume si può scrivere: ΔV = αV ΔT (10.40) V in funzione di un coefficiente di espansione volumica αV . In generale i materiali sono anisotropi e, quindi, il valore di αV dipenderebbe dalla direzione in cui viene misurata l’espansione, rispetto agli assi cristallografici del reticolo. 329

Capitolo 10

Proprietà termiche

U r1 r2 r3

r E3 E2 E1

Figura 10.5: rappresentazione dell’energia potenziale in funzione della distanza interatomica. Sono indicati alcuni autovalori di energia e il corrispondente valore medio della distanza interatomica.

Nel caso invece di materiali isotropi il valore di αV risulta essere pari a circa 3αℓ . Il fenomeno dell’espansione termica può essere spiegato considerando le forze agenti tra gli atomi e andando a guardare alla curva di energia potenziale in funzione della distanza interatomica (o intermolecolare). Tale curva segue l’andamento tipico rappresentato in figura 10.5 e rappresenta una buca di potenziale asimmetrica. Il riscaldamento del corpo comporta un aumento della sua temperatura e conseguentemente un aumento dell’energia vibrazionale che passa da un autovalore a uno più elevato (E1 → E2 → E3 → ⋯ → En ). Di conseguenza i valori permessi per la distanza interatomica abbracciano un intervallo più ampio, ma e` solo a causa dell’asimmetria della buca di potenziale che il valore medio della distanza interatomica aumenta con la temperatura (rn > ⋯ > r3 > r2 > r1 ). Notiamo che quanto più legati sono gli atomi tra di loro, tanto più fonda e ripida risulta essere la buca di potenziale e tanto minore e` il valore corrispondente del coefficiente di espansione αℓ .

330

Comportamenti termici

Capitolo 10

10.4 Comportamenti termici Per descrivere il comportamento termico dei materiali facciamo riferimento a tre classi rappresentative, quella dei metalli, quella dei materiali ceramici e quella dei polimeri14 .

10.4.1

Isolamento o conducibilità

I metalli sono conduttori termici estremamente buoni perché per essi il meccanismo di migrazione degli elettroni risulta essere molto rilevante grazie al numero elevato di elettroni liberi che possono prendervi parte. La conduzione tramite elettroni domina su quella tramite fononi anche perché i primi sono soggetti meno dei secondi a interazioni con il reticolo cristallino. Valori tipici di conducibilità termica per metalli sono dell’ordine di 100 W/m⋅K (vedi tabella 10.3). La presenza di impurità nel metallo comporta una riduzione nella conducibilità termica cos`ı come comporterebbe una diminuzione nella conducibilità elettrica: infatti, le impurità contrastano il movimento degli elettroni riducendone la migrazione. Nel caso dei materiali ceramici la conducibilità termica e` dominata dal comportamento dei fononi, visto che in tali materiali il numero di elettroni liberi e` molto piccolo (e, infatti, sono tipicamente isolanti dal punto di vista elettrico). Ne risulta una conducibilità minore rispetto a quella dei metalli, che tende però a diminuire all’aumentare della temperatura perché l’ampiezza delle vibrazioni reticolari aumenta con il crescere della temperatura, ostacolando maggiormente il movimento dei fononi. Materiali ceramici di tipo amorfo (come anche il vetro) hanno una conducibilità minore rispetto ai materiali ceramici cristallini perché avendo una struttura atomica irregolare e disordinata tendono a ostacolare maggiormente i fononi, riducendone il trasporto da un’estremità all’altra del corpo. Nel caso della silice (polvere di quarzo purissima, cioè SiO2 ) si ha un valore della conducibilità termica di solo 1.4 W/m⋅K, due ordini di grandezza 14

I polimeri sono dei composti chimici formati da molecole di elevate dimensioni in cui delle piccole unità (monomeri) sono legate a formare una catena. 331

Capitolo 10

Proprietà termiche

più piccolo dei valori tipici per i metalli. Per questo motivo ceramiche a base di silice sono ottimi isolanti termici. Nel caso dei polimeri la conducibilità assume valori molto piccoli perché per loro la conduzione e` dovuta alla vibrazione e alla rotazione di lunghe catene molecolari, cosa che avviene con maggior difficoltà.

10.4.2

Dilatazione

Le tre classi di materiali introdotte sopra hanno un comportamento peculiare anche dal punto di vista della dilatazione termica. Per i polimeri il coefficiente di espansione lineare assume valori dell’ordine di 100 × 10−6 K−1 e l’espansione termica corrispondente e` relativamente grande. Nel caso dei metalli il coefficiente di espansione lineare assume valori intermedi, dell’ordine di 10 × 10−6 K−1 . Gli effetti di dilatazione termica diventano allora particolarmente rilevanti dato l’ampio intervallo di temperature a cui un metallo può essere sottoposto prima di fondersi. I materiali ceramici sono caratterizzati da intense forze di legame tra gli atomi e i valori corrispondenti per αℓ sono dell’ordine di 1 × 10−6 K−1 . In questo caso la dilatazione non sarebbe un problema se non fosse per l’estrema fragilità di questi materiali. Intervengono, infatti, considerazioni legate allo stress termico indotto dalle modifiche interne della struttura cristallina. Nel caso di materiali poco duttili l’espansione termica può portare a fratture nel materiale con conseguente frantumazione del corpo.

10.5 Applicazioni Come esempi di applicazione delle proprietà termiche riportamo due casi in cui si vuole avere un ottimo isolamento termico o viceversa un’elevata dissipazione termica, sfruttando rispettivamente materiali a conducibilità termica ridotta oppure molto elevata. Il primo caso e` quello dell’isolamento

332

Applicazioni

Capitolo 10

κ (W/m ⋅ K) αℓ ×10−6 (1/K) POLIMERI Polistirene 0.1 100 ÷ 150 Polietilene 0.40 ÷ 0.50 100 ÷ 200 Teflon 0.2 150 ÷ 200 METALLI Alluminio 240 24 Ferro 80 12 Rame 400 17 Oro 315 14 Argento 430 20 Nichel 90 13 MATERIALI CERAMICI Allumina (Al2 O3 ) 35 8 Magnesia (MgO) 38 14 Silice (SiO2 ) 1.4 0.4 Vetro pyrex 1.4 3.3 ALTRO Diamante 1000 ÷ 2600 ∼1 Silicio 150 2.6 Acqua 0.6 ○ Ghiaccio (0 C) 2.2 Asbesto 0.08 Fibra di vetro 0.04 Sughero 0.04 Aria 0.02 SOSTANZA

Tabella 10.3: valori tipici della conducibilità termica e del coefficiente di espansione lineare medio per alcune sostanze a temperatura ambiente.

333

Capitolo 10

Proprietà termiche

delle navicelle spaziali Shuttle, mentre il secondo riguarda i dispositivi di dissipazione di calore per circuiti elettronici.

10.5.1

Isolamento termico dello Shuttle

Le navicelle Shuttle, usate nelle missioni spaziali della NASA15 , sono state progettate per essere impiegate in più missioni. Essenziale per la loro riutilizzabilità e` il sistema di protezione termica TPS16 che utilizza una combinazione di materiali e tecnologie per proteggere lo Shuttle e i suoi occupanti, Nel progetto dello Shuttle si e` scelto di utilizzare del convenzionale alluminio per la fusoliera, proteggendolo però con uno strato di materiale termicamente isolante. L’alluminio ha, infatti, un punto di fusione di soli 660 ○ C e deve resistere alle temperature estremamente elevate che vengono a prodursi sulla superficie esterna dell’apparecchio a causa dell’attrito con l’atmosfera sia durante la fase di decollo sia, soprattutto, nella fase di rientro. Per l’integrità strutturale e` bene che la temperatura esterna della fusoliera non superi i 175 ○ C. Lo strato isolante impiegato consiste principalmente di due tipi di piastrelle: quelle resistenti a basse temperature (tra 370 e 650 ○ C) e quelle resistenti ad alte temperature (tra 650 e 1260 ○ C). Entrambe sono composte da fibre di silice molto puro, ma anche estremamente poroso17, aventi spessori tra i 2 e i 13 centimetri. Le piastrelle a bassa temperatura hanno una copertura di ceramica bianca per riflettere la radiazione solare quando lo Shuttle e` nello spazio, al di fuori dell’atmosfera. Quelle ad alta temperatura hanno invece una copertura di ceramica nera per favorire il loro raffreddamento tramite irradiamento termico, soprattutto durante la fase di rientro. Altri tipi di piastrelle aiutano a proteggere lo Shuttle nei punti più critici, dove si raggiungono temperature fino a circa 1600 ○ C. Il sistema TPS nel suo complesso soddisfa i requisiti di riutilizzabilità e 15

National Aeronautics and Space Administration, l’ente spaziale statunitense. Dall’inglese Thermal Protection System. 17 La piastrella contiene fino al 90% di spazio “vuoto”, riempito in realtà da aria che ha un valore di conducibilità termica estremamente piccolo, pari a circa 0.02 W/m⋅K. 16

334

Applicazioni

Capitolo 10

leggerezza. L’aspetto delicato e` dato dalla fragilità delle piastrelle che non possono essere incollate direttamente alla fusoliera per non essere sottoposte allo stress termico dovuto alla dilatazione dell’alluminio.

10.5.2

Dispersori di calore

Transistor, microprocessori, regolatori di tensione e altri dispositivi elettronici di tipo discreto o integrato sono in grado, durante il loro funzionamento, di raggiungere temperature elevate. Per impedire che il riscaldamento provochi un danneggiamento del dispositivo o del circuito risulta necessario smaltire il calore in eccesso cedendolo eventualmente all’ambiente circostante. A tal fine si possono utilizzare dei dispositivi chiamati dissipatori di calore (detti in inglese heat sinks) che sono in grado di trasferire in modo estremamente efficace il calore da un corpo a temperatura elevata a un corpo a bassa temperatura, ma con grande capacità termica. Il trasferimento di calore deve essere rapido tra il dispositivo da raffreddare e il dissipatore e tra il dissipatore e l’ambiente (tipicamente aria) circostante. Un dissipatore tipico e` composto da piccoli pannelli metallici o alette. Il metallo, data la sua elevata conducibilità termica, garantisce un veloce assorbimento di calore dal dispositivo da raffreddare, mantendendo quest’ultimo in equilibrio termico con il dissipatore. I pannelli, data la superficie relativamente grande, permettono a loro volta un trasferimento veloce del calore all’aria. Prestazioni migliori possono poi essere ottenute sfruttando una ventola per produrre circolazione forzata d’aria e raffreddare l’aria che circonda il dissipatore. I dissipatori sono fatti, in genere, di alluminio. Questo metallo ha, infatti, il vantaggio di avere un valore di conducibilità termica relativamente elevato (240 W/m⋅K) e un’estrema duttilità che consente, per estrusione, di ottenere la forma voluta. Altra scelta possibile comprende il rame che ha una conducibilità maggiore (400 W/m⋅K), ma anche costo e peso più elevati. Affinché il dissipatore agisca in modo efficace, e` importante, inoltre, che ci sia il migliore contatto possibile con il dispositivo da raffreddare, la cui superficie deve essere il più aderente possibile al dissipatore. A questo scopo 335

Capitolo 10

Proprietà termiche

si usa, talvolta, un grasso termico che ha una notevole conducibilità termica perché composto, generalmente, da particelle metalliche in sospensione colloidale.

10.6 Quesiti di riepilogo 1. Quanto vale la capacità termica molare alla temperatura di Einstein? 2. Facendo riferimento alla figura 10.1, indicare quale delle tre sostanze ha la temperatura di Einstein maggiore. 3. Sono migliori isolanti termici i materiali cristallini o quelli amorfi? Perché? 4. Conduce meglio un metallo puro o una lega? Perché? 5. Un materiale poroso conduce meglio il calore di uno compatto? 6. La dilatazione termica di un materiale ceramico dipende dalle proprietà dei suoi elettroni? E nel caso di un metallo?

10.7 Esercizi 1. Conoscendo la temperatura di Debye del rame (TD = 340 K) ricavare la sua capacità termica alla temperatura T = 50 K. 2. Conoscendo il calore specifico del rame (c = 180 J/kg⋅K) misurato alla temperatura di 60 K, si ricavi il valore della sua temperatura di Debye. 3. A quale temperatura il contributo elettronico CVe alla capacità termica diventerebbe pari a quello fononico? Si consideri il caso del rame. 4. Calcolare il calore che attraversa in un minuto una sbarra di rame di sezione pari a 25 cm2 , in cui le due estremità distanti L = 50 cm sono mantenute alla temperatura costante di 150 e 50 ○ C. 336

Esercizi

Capitolo 10

5. Di quanto si dilaterebbe un filo di rame lungo 5 metri riscaldato da 20 a 300 ○ C?

337

Capitolo 11 Cristalli liquidi Per certi materiali organici la transizione dallo stato di aggregazione solido a quello liquido avviene attraverso il passaggio per fasi successive. Tali fasi, dette mesofasi, hanno proprietà di simmetria che sono intermedie tra quelle caratteristiche del liquidi e quelle proprie dei solidi cristallini. I materiali che si trovano in tali fasi si chiamano cristalli liquidi e presentano una forte anisotropia unita a una certa fluidità. Transizioni verso le mesofasi possono essere prodotte o tramite processi puramente termici o con l’uso di solventi. Nel primo caso si parla di cristalli liquidi termotropici, nel secondo di cristalli liquidi liotropici, che non verranno qui considerati. I cristalli liquidi sono conosciuti da più di cento anni, da quando si e` notata l’esistenza, in certi composti organici, di uno stato della materia con proprietà peculiari. Questi composti cambiavano carattere al crescere della temperatura e sembravano possedere due temperature di fusione. Tali sostanze agivano in modo particolare sulla luce, cambiandone la polarizzazione e il colore. Questi comportamenti sono stati studiati in dettaglio negli anni successivi, ma e` solo a partire dagli anni ’60 del secolo scorso che si sono cominciate a cogliere le possibilità di applicazione nel campo della termografia o della visualizzazione elettro-ottica (schermi a cristalli liquidi). La disciplina che tratta queste sostanze e` un campo complesso nel quale la connessione tra chimica e fisica svolge un ruolo fondamentale e la cui rilevanza e` stata riconosciuta con l’assegnazione di un Premio Nobel a Pierre de Gennes1 . 1

Pierre G. de Gennes (1932-2007), fisico francese vincitore del Premio Nobel per la Fisica

Capitolo 11

Cristalli liquidi

Un tema cos`ı complicato verrà discusso qui in modo semplificato, facendo riferimento principalmente alle proprietà ottiche di questi cristalli e come tali proprietà possono essere modificate e sfruttate. Nel caso dei cristalli solidi le molecole sono ordinate con estrema regolarità secondo un reticolo periodico, mentre per i liquidi questo ordinamento sparisce. In un caso le molecole sono vincolate al reticolo, nell’altro caso sono libere di scorrere le une rispetto alle altre. I cristalli liquidi condividono importanti proprietà sia con i solidi sia con i liquidi, assieme ad aspetti di distinzione. Ad esempio la fluidità dei cristalli liquidi ricorda quella dei liquidi propriamente detti, ma mentre per un liquido le proprietà fisiche sono isotrope, cioè uguali in tutte le direzioni, ciò non avviene per i cristalli liquidi. Dal punto di vista della loro struttura i cristalli liquidi sono formati da molecole fortemente allungate per le quali c’è una simmetria parziale. Si possono distinguere tre tipologie principali (corrispondenti a tre tipi di fase): − i cristalli liquidi smectici, in cui non c’è un ordinamento su tre dimensioni, ma su una dimensione sola. La situazione e` equivalente a quella di strati bidimensionali sovrapposti l’uno sull’altro, con spaziatura definita. La figura 11.1 fornisce una rappresentazione di tali sostanze. − i cristalli liquidi nematici (vedi figura 11.2), caratterizzati da molecole allineate preferenzialmente in una direzione, ma senza che ci sia un ordine traslazionale su grande scala. Tale allineamento si osserva in domini aventi dimensione dell’ordine del micrometro, ma può essere esteso a tutto il cristallo applicando a esso un campo elettrico o magnetico opportuno. La direzione preferenziale definisce un vettore n chiamato vettore direttore. Per questi cristalli liquidi le molecole possono scorrere le une rispetto alle altre con fluidità, mantenendo però l’allineamento. − i cristalli colesterici2 (detti anche nematici chirali3 ). Questi cristalli linel 1991 per i suoi studi sui cristalli liquidi e sui polimeri. 2 Tale termine si ispira alla molecola di colesterolo, per alcuni derivati della quale venne evidenziata nel 1888, dal botanico austriaco Friedrich Reinitzer, l’appartenenza a una fase della materia intermedia tra quella solida e quella liquida. 3 Dotati cioè di chiralità (distinzione tra destra e sinistra), nel senso che la loro struttura

340

Figura 11.1: rappresentazione della fase smectica di un cristallo liquido. Sono raffigurati tre piani di molecole.

n

Figura 11.2: rappresentazione della fase nematica di un cristallo liquido. E` evidenziato il vettore direttore n.

341

Capitolo 11

Cristalli liquidi

n

p = P/2

Figura 11.3: rappresentazione della fase colesterica di un cristallo liquido. A sinistra sono raffigurati quattro piani aventi le molecole allineate in modo differente. A destra e` rappresentata la direzione in ciascun piano del direttore n e la lunghezza del passo p pari a metà del passo P dell’elica.

quidi sono simili a quelli nematici, ma hanno in aggiunta un’organizzazione a elica delle molecole, elica caratterizzata da un passo4 p che e` un parametro importante per descrivere le proprietà fisiche del cristallo liquido.

11.1 Proprietà elettriche e magnetiche I cristalli liquidi sono tipicamente diamagnetici (nella maggior parte dei casi) o paramagnetici. Cristalli ferromagnetici possono comunque venire prodotti inserendo materiali ferromagnetici in sospensioni colloidali di cristallo liquido. Nel seguito considereremo, però, soltanto cristalli non ferromagnetici. I cristalli liquidi sono soggetti, come qualsiasi altro materiale, a magnenon resterebbe uguale in seguito a riflessione speculare, come avviene per un’elica cilindrica o per una mano. 4 Dal punto di vista delle proprietà fisiche le due direzioni n e −n sono equivalenti, quindi la periodicità p della struttura colesterica e` in realtà metà di quella geometrica P dell’elica.

342

Proprietà elettriche e magnetiche

Capitolo 11

tizzazione descritta (vedi la (6.3)) dal vettore: M = χm H

(11.1)

A causa dell’anisotropia del cristallo liquido la suscettibilità magnetica χm non e` un numero ma un tensore simmetrico di rango 2. Dei 6 numeri che descrivono il tensore simmetrico solo due sono indipendenti per i cristalli nematici e assumono due valori che indichiamo con χ∥ e χ⊥ (riferiti rispetto alla direzione del vettore direttore e a una direzione a esso ortogonale) che differiscono della quantità Δχm = χ∥ − χ⊥ . Il tensore diventa allora: ⎛ χ⊥ 0 0 ⎞ ⎟ χm ≡ ⎜ ⎜ 0 χ⊥ 0 ⎟ ⎝ 0 0 χ∥ ⎠

(11.2)

L’interazione tra il corpo magnetizzato e il campo magnetizzante può essere descritta attraverso l’energia di interazione tra M e H e che contribuisce alla densità di energia libera5 con la quantità: 1 f H = − μ0 M ⋅ H 2

(11.3)

Tale contributo diventa (nel caso di un cristallo diamagnetico): 1 1 f H = − μ0 χ⊥ H 2 − μ0 Δχm (H ⋅ n)2 2 2

(11.4)

dove il primo termine e` una quantità costante, che non dipende dall’orientamento delle molecole rispetto a H. Questo contributo va a sommarsi alla densità di energia libera fd dovuta alla eventuale distorsione meccanica del cristallo liquido e cioè alla distorsione di n. Per i cristalli nematici vale usualmente Δχm > 0 e, quindi, l’energia viene minimizzata quando la direzione preferenziale del cristallo liquido, cioè il vettore n si allinea ad H. Se invece Δχm < 0 la minimizzazione si può ottenere con n ⊥ H. 5

Dicesi libera l’energia in grado di fare lavoro macroscopico.

343

Capitolo 11

Cristalli liquidi

I cristalli liquidi paramagnetici sono costituiti in genere da molecole al cui centro si trova un atomo metallico paramagnetico. Per questi cristalli c’è competizione con il contributo diamagnetico comunque presente. L’orientamento della molecola nel campo magnetico esterno dipende allora sia da quale tra i due contributi (paramagnetico o diamagnetico) prevale perché diminuisce maggiormente la densità di energia libera sia dal corrispondente valore di Δχm . La presenza di un campo magnetico esterno può agire allora controllando l’allineamento delle molecole del cristallo liquido, producendo un allineamento delle molecole parallelo o ortogonale al campo stesso. Una tale transizione avviene, però, se il campo magnetizzante applicato supera un valore critico6 H c che e` inversamente proporzionale allo spessore del cristallo liquido. Osserviamo, inoltre, che nel caso di cristalli colesterici l’applicazione di un campo magnetico sufficientemente intenso, con direzione parallela all’asse dell’elica, produce una torsione della struttura a elica che può essere svolta, portando il cristallo a una fase nematica. Le proprietà elettriche di un cristallo liquido sono complicate dalla possibilità di accumulo di cariche o reazioni chimiche in corrispondenza degli elettrodi, ma per quanto riguarda l’effetto di orientamento delle molecole possiamo seguire un ragionamento analogo a quello usato nel caso magnetico. La polarizzazione del cristallo liquido comporta (vedi la (8.4)) una polarizzazione P che può essere scritta come: P = є0 χ e E

(11.5)

dove la suscettibilità elettrica χ e viene rappresentata, in mezzi non isotropi, da un tensore. Si introduce poi un vettore D chiamato induzione dielettrica definito come: (11.6) D = є0 E + P = є0єE 6

Valori tipici di H c sono dell’ordine di 6 × 105 A/m per uno spessore di 10 micrometri.

344

Proprietà ottiche

Capitolo 11

dove la costante dielettrica relativa є = 1 + χ e e` anch’essa descritta da un tensore. L’interazione tra materia polarizzata e campo elettrico contribuisce alla densità di energia libera con un termine: 1 (11.7) fE = − E ⋅ D 2 In un cristallo nematico tale contributo diventa pari a: 1 1 f E = − є0є⊥ E 2 − є0 Δє(E ⋅ n)2 (11.8) 2 2 dove il primo termine e` una quantità costante, che non dipende dall’orientamento delle molecole rispetto a E. Analogamente al caso magnetico questo contributo va a sommarsi alla densità di energia libera per distorsione fd . Nei casi in cui Δє > 0 l’energia viene minimizzata quando la direzione preferenziale del cristallo liquido, cioè il vettore direttore n, si allinea a E. Se invece Δє < 0 allora la minimizzazione si può ottenere con n ⊥ E. Anche qui la transizione avviene se il campo elettrico supera un valore critico7 E c . L’interazione magnetica e` di gran lunga più debole di quella elettrica, quindi, per cambiare l’allineamento di un cristallo e` preferibile ricorrere a campi elettrici, come discusso nell’esempio 1.

11.2 Proprietà ottiche Le proprietà ottiche dei cristalli liquidi, rispetto a un’onda elettromagnetica ad alta frequenza, possono essere descritte come visto nel capitolo 8 attraverso la loro risposta in termini di riflettività, trasmissività e rifrazione, che sono concetti utili nel caso di dielettrici isotropi. Nel caso dei cristalli liquidi hanno inoltre luogo dei fenomeni peculiari quali la birifrangenza, il dicroismo e l’attività ottica, fenomeni che descriveremo brevemente nel prossimo paragrafo. 7

Valori tipici per E c sono dell’ordine di 100 V/m, ottenibili, ad esempio, applicando una differenza di potenziale dell’ordine del millivolt su uno spessore di 10 micrometri. 345

Capitolo 11

Cristalli liquidi

Per comprendere il comportamento dei cristalli ottici in risposta a un’onda elettromagnetica incidente e` importante capire come tali fenomeni cambino in seguito a variazioni di temperatura o all’azione di forze meccaniche, magnetiche o elettriche.

11.2.1

Birifrangenza

In generale per un cristallo (solido o liquido) anisotropo e non ferromagnetico la velocità di propagazione delle onde elettromagnetiche assume valori diversi a seconda della direzione di propagazione entro il cristallo. A causa delle simmetrie presenti entro il cristallo si individuano tre assi principali rispetto ai quali l’indice di rifrazione assume tre valori possibilmente distinti n1 , n2 e n3 . In molti casi due dei tre indici assumono lo stesso valore (ad esempio, n1 = n2 ≠ n3 ) e il cristallo si dice uniassico. La direzione corrispondente all’indice diverso (n3 ) rappresenta una direzione particolare, detta asse ottico, che nel caso dei cristalli liquidi corrisponde alla direzione del vettore direttore. L’indice di rifrazione relativo all’asse ottico viene chiamato straordinario (ns ) e risulta essere uguale a n3 nel caso indicato sopra. Alternativamente l’indice di rifrazione relativo a un qualsiasi asse ortogonale all’asse ottico viene detto ordinario (no ) ed e` uguale a n1 = n2 nel caso specifico. Un’onda che si propaga parallelamente rispetto all’asse ottico “vede” un mezzo isotropo, tale che un’eventuale polarizzazione dell’onda non viene alterata, e qualsiasi onda polarizzata si propagherebbe con la stessa velocità. Si parla in questo caso di raggio ordinario. Le cose cambiano se l’onda non si propaga parallelamente all’asse ottico. In questo caso onde con polarizzazione diversa “vedrebbero” un mezzo con indice di rifrazione diverso, propagandosi con velocità diversa v = c/n. Il valore dell’indice di rifrazione dipende dalla direzione di propagazione rispetto all’asse ottico ed e` compreso tra no e ns . Un tale raggio viene detto straordinario e subisce una rifrazione non soddisfacente alla legge di Snell8 . 8

Nel caso del raggio ordinario i campi E e D sono paralleli tra di loro e tangenti al fronte d’onda. Per il raggio straordinario E non e` parallelo a D e non e` più tangente al fronte d’onda. Fronte d’onda e direzione di propagazione non sono, quindi, ortogonali. 346

Proprietà ottiche

Ei

Capitolo 11

asse ottico

Es Eo

raggio ordinario

raggio straordinario

Figura 11.4: rappresentazione della birifrangenza per un cristallo uniassico. Caso particolare di incidenza obliqua rispetto alle facce del cristallo e con asse ottico obliquo rispetto alle facce del cristallo.

Nel caso di un raggio incidente su un cristallo liquido si produce allora una doppia rifrazione (vedi figura 11.4) perché l’onda emerge dal cristallo come due raggi aventi polarizzazione rettilinea mutuamente ortogonale. Questo e` il fenomeno detto birifrangenza, dove l’onda si scinde in una componente ordinaria polarizzata ortogonalmente all’asse ottico e soddisfacente alla legge di Snell, più una componente straordinaria, polarizzata perpendicolarmente a quella ordinaria e che non segue la legge di Snell.

11.2.2

Dicroismo

Se gli indici di rifrazione (complessi) assumono valore diverso a seconda della direzione di propagazione dell’onda e della sua polarizzazione rispetto all’asse ottico, e` diversa anche la loro parte immaginaria e, quindi, i due raggi prodotti dalla birifrangenza possono essere soggetti a diverso assorbimento. Si parla in questo caso di dicroismo intendendo il fatto che il coefficien-

347

Capitolo 11

Cristalli liquidi

asse ottico

Es

Eo

Figura 11.5: rappresentazione del dicroismo per un cristallo uniassico. La componente straordinaria E s dell’onda incidente si attenua rapidamente e non emerge al di là del cristallo. La componente ordinaria E o emerge, invece, pressoché senza attenuazione.

te di assorbimento β assume due valori diversi a seconda della direzione di polarizzazione dell’onda rispetto all’asse ottico (vedi figura 11.5). Osserviamo che un’onda che si propaga parallelamente all’asse ottico vede un mezzo isotropo, senza birifrangenza né dicroismo.

11.2.3

Attività ottica

Nel caso di cristalli colesterici ci può essere una differenza nella velocità di propagazione di un’onda polarizzata circolarmente in un senso o nell’altro. Ciò comporta una rotazione del piano9 di polarizzazione dell’onda. Questo fenomeno viene chiamato attività ottica. Quando il passo p e` molto maggiore della lunghezza d’onda impiegata, ma allo stesso tempo non e` troppo grande e soddisfa alla condizione: pΔn ≪ λ 9

(11.9)

Un’onda polarizzata rettilinearmente può essere pensata come sovrapposizione di due onde con uguale ampiezza polarizzate circolarmente in verso opposto.

348

Proprietà ottiche

Capitolo 11

allora il cristallo colesterico si comporta come un rotatore puro, con potere rotatore ρ dato da (equazione di de Vries): ρ = −π(Δn)2

p 2λ2

(11.10)

che, in corrispondenza all’attraversamento di uno spessore d di cristallo, produrrebbe una rotazione del piano di polarizzazione di un angolo: ϕ = ρd

(11.11)

In queste formule λ e` la lunghezza d’onda (misurata nel vuoto) dell’onda incidente, d il percorso entro il cristallo e Δn = ns − no la differenza, dovuta alla birifrangenza, tra i valori dell’indice di rifrazione straordinario e ordinario. Per cristalli colesterici valori tipici dei parametri sono Δn = 0.05 e p = 2.5 μm. Con questi valori, e usando λ = 0.5 μm, si otterrebbe per il potere rotatore un valore molto grande, pari a −2250○ mm−1 . Il segno negativo sta a indicare che la rotazione e` opposta al senso dell’elica della struttura colesterica. Osserviamo che il potere rotatore di questi cristalli liquidi e` parecchi ordini di grandezza più grande di quello relativo a liquidi o solidi cristallini dotati di attività ottica10 . In aggiunta all’attività ottica il mezzo ottico può essere dispersivo, introducendo una dipendenza di Δn dalla lunghezza d’onda. Ciò può produrre luce polarizzata con colori diversi. Quando il passo p assume valori maggiori11 e soddisfa, invece, alla condizione: pΔn ≫ λ (11.12) (detta limite di Mauguin), la luce polarizzata rettilinearmente rimane tale ma, man mano che il raggio si propaga entro il cristallo, il piano di polarizzazione segue la torsione dell’elica. Ne segue che un’onda incidente polarizzata Per il quarzo, ad esempio, ρ ≈ 20○ mm−1 . Il passo può essere modificato a piacere diluendo un materiale otticamente attivo entro un cristallo nematico. Si ottengono cos`ı valori pari a p ≈ 5 ÷ 25 μm. 10 11

349

Capitolo 11

Cristalli liquidi

Ein

Ein

n

n

Eapp n

n

Eout

Eout

Figura 11.6: rappresentazione di una cella nematica ritorta (a sinistra) che cambia la polarizzazione dell’onda ruotando di 90○ la direzione del campo elettrico in uscita E out rispetto a quello in ingresso alla cella E in . A destra si vede che l’applicazione di un campo elettrico E a pp allinea le molecole ed elimina l’attività ottica.

rettilinearmente subisce una rotazione di un angolo: πd (11.13) ϕ= p che corrisponde a 90○ se d = p/2. Un altro modo per creare attività ottica in un cristallo liquido e` quello che si usa nelle celle nematiche ritorte. In questo caso il cristallo liquido di tipo nematico e` inserito tra due lamine di vetro o materiale plastico e ha il vettore direttore omogeneo su tutto il cristallo e allineato parallelamente alle pareti. Girando una delle due lamine attorno a un asse perpendicolare alla lamina si viene ad applicare una torsione agli strati paralleli del cristallo, producendo una situazione come quella rappresentata in figura 11.6. Una tale cella acquisisce cos`ı attività ottica ed e` in grado di ruotare la polarizzazione di 90○ .

11.2.4

Riflessione di Bragg

Nel caso dei cristalli colesterici si verifica anche un’altro fenomeno. Se un raggio di luce viene inviato parallelamente all’asse dell’elica, la periodicità dell’elica produce un’interferenza in riflessione, simile a quella incontrata per i 350

Proprietà ottiche

Capitolo 11

R 1

Δλ 0.8

0.6

0.4

0.2

0

λ λ0

Figura 11.7: riflettività in funzione della lunghezza d’onda della luce polarizzata circolarmente (nel senso giusto) che incide normalmente su un cristallo liquido colesterico senza assorbimento e avente spessore molto maggiore del passo p. Il valore centrale λ 0 della lunghezza d’onda e` uguale a n2p mentre l’intervallo Δλ = 2pΔn.

raggi X diffratti dai piani di un cristallo (vedi capitolo 1). L’interferenza diventa costruttiva quando la polarizzazione circolare dell’onda incidente e` nello stesso verso dell’elica12 e il passo p soddisfa alla condizione di Bragg: 2p = λ n =

λ n

(11.14)

dove λ n e` il valore misurato nel mezzo, mentre n = (ns + no )/2 e` il valore medio dell’indice di rifrazione. In questo caso, rispetto alla condizione generale (1.13), si prende m = 1 perché gli ordini superiori risultano essere soppressi (a parte il caso di incidenza obliqua). In queste condizioni luce polarizzata circolarmente con lo stesso verso dell’elica viene riflessa quasi totalmente, mentre se la polarizzazione e` in verso opposto la luce viene trasmessa quasi totalmente. Se la luce incidente e`, 12

Ad esempio un’elica destrogira riflette luce con polarizzazione circolare destrogira. 351

Capitolo 11

Cristalli liquidi

invece, non polarizzata, il cristallo colesterico e` in grado di separarla in una componente polarizzata circolarmente in un verso, più una componente polarizzata circolarmente nel verso opposto. Una delle due viene riflessa, mentre l’altra e` trasmessa, quindi, circa il 50% della luce incidente non polarizzata viene riflesso come luce polarizzata circolarmente con lo stesso verso dell’elica. La riflettività R per incidenza normale segue allora l’andamento ideale rappresentato in figura 11.7, dove la larghezza della regione in cui R ≈ 1 corrisponde a Δλ = 2pΔn. Al di fuori di questa regione la riflettività va rapidamente a zero. Poiché il passo dell’elica varia con la temperatura, solo la frequenza che soddisfa alla (11.14) subisce un’intensa riflessione. Come risultato la lamina di cristallo liquido appare possedere un colore brillante, anche se illuminata con luce bianca, la cui tonalità dipende dalla temperatura. L’incremento relativo del passo in funzione della temperatura T può essere piuttosto grande, e assumere valori dell’ordine di: 1 dp ≈ −100 K−1 p dT

(11.15)

Ciò significa che un cristallo liquido può diventare uno strumento di misura della temperatura estremamente sensibile, come discusso nell’esempio 2.

11.3 Esempi 1. Confrontare l’azione di un campo elettrico o magnetico su un cristallo liquido nematico avente vettore direttore perpendicolare al campo. Si faccia riferimento al momento di forza per unità di volume e si considerino un campo magnetico di ampiezza H = 105 A/m e quello elettrico prodotto applicando una differenza di potenziale di 10 V ai capi di un cristallo liquido dello spessore di 100 μm. Il cristallo nematico e` uniassico e la magnetizzazione si può scrivere co-

352

Esempi

Capitolo 11

me: M = χ⊥ H + Δχm (H ⋅ n)n

(11.16)

quindi, ricordando che il momento meccanico sul dipolo magnetico μ vale τ = μ × B, il momento meccanico per unità di volume diventa: τ VB = μ0 M × H = μ0 Δχm (H ⋅ n)n × H

(11.17)

che risulta, quindi, proporzionale a: μ0 Δχm H 2 Similmente per il caso elettrico scriviamo: P = є0 [χ⊥ E + Δχ e (E ⋅ n)n]

(11.18)

quindi, ricordando che il momento meccanico sul dipolo elettrico p vale τ = p × E, il momento meccanico per unità di volume diventa: τ VE = P × E = є0 Δχ e (E ⋅ n)n × E

(11.19)

che risulta, quindi, proporzionale a: є0 Δχ e E 2 Valori tipici per l’asimmetria di suscettibilità sono dell’ordine di Δχm = e Δχ e = 0.1, mentre il campo elettrico suggerito vale E = V/h = 105 V/m. Ne risulta che: 10−7

є0 Δχ e E 2 ∼ 10−2 > μ0 Δχm H 2 ∼ 10−3 Tenuto conto che e` facile ottenere campi elettrici anche più intensi di cos`ı, possiamo dire che l’effetto dei campi elettrici e` tipicamente molto più intenso di quello dei campi magnetici. 2. Quanto vale la sensibilità di temperatura tipica di un cristallo liquido colesterico, assumendo una sensibilità del 10% sulle misure di lunghezze d’onda? 353

Capitolo 11

Cristalli liquidi

In condizioni di Bragg (λ = n2p) l’incertezza del 10% su λ si traduce in un’incertezza del 10% sul passo p, cioè Δp/p = 0.1. Ricorrendo alla (11.15) otteniamo che: Δp ∣ ∣ ≈ 100ΔT p quindi, la sensibilità sulla misura di temperatura sarebbe: ΔT =

1 1 Δp ∣ ∣= × 0.1 = 1 × 10−3 K 100 p 100

cioè un millesimo di grado kelvin, che e` una sensibilità molto buona.

11.4 Applicazioni Le applicazione pensate nel corso degli anni per sfruttare le proprietà dei cristalli liquidi sono molteplici. Qui ne riportiamo due tra le più significative.

11.4.1

Termografia a cristalli liquidi

Come già visto, nella maggior parte dei cristalli colesterici il passo dell’elica diminuisce all’aumentare della temperatura. Questa forte dipendenza dalla temperatura trova un’applicazione pratica in termografia. Attraverso miscele opportune si producono dei cristalli liquidi con un passo dell’ordine della lunghezza d’onda della luce usata. Piccole variazioni di temperatura appaiono come cambiamenti nel colore della luce diffusa dal cristallo liquido secondo la riflessione di Bragg. In questo modo si possono produrre dei termometri che possono anche fornire una mappatura punto a punto delle regioni a temperatura diversa o del flusso di calore. Tipicamente un termometro a cristalli liquidi viene costruito spruzzando un supporto dipinto di nero con una miscela opportuna di cristalli liquidi. Questa miscela ha la proprietà di avere una temperatura di attivazione (in corrispondenza della quale il cristallo liquido appare rosso) e una di estinzione (in corrispondenza della quale appare blu). Al di fuori di questo intervallo

354

Applicazioni

Capitolo 11

di temperatura13 la lamina appare scura all’occhio. A una certa temperatura corrispondono diverse intensità relative per la componente rossa, verde e blu, producendo una diversa tonalità di colore. Queste diverse intensità vengono poi tradotte in una misura della temperatura tramite una procedura di calibrazione.

11.4.2

Schermo a cristalli liquidi

Il tipico schermo a cristalli liquidi (detto anche LCD14 ) consiste di uno strato sottile (≈ 10 μm) di cristallo liquido disposto tra due superfici vetrose provviste di elettrodi trasparenti e al cui esterno si trovano due lamine polarizzatrici con asse ottico ortogonale. Lo schermo e` poi organizzato in una matrice di pixel15 che concorrono a formare l’immagine. In condizioni normali l’attività ottica del pixel, composto da cristalli liquidi colesterici o nematici ritorti, comporta una rotazione del piano di polarizzazione della luce uscente dal primo polarizzatore, consentendole di passare attraverso il secondo polarizzatore. L’elementino appare allora trasparente e il pixel appare illuminato. Sottoponendo il pixel a un campo elettrico di valore opportuno, tramite applicazione di una differenza di potenziale agli elettrodi corrispondenti, si viene a cambiare l’orientamento delle molecole del cristallo liquido e l’attività ottica sparisce eliminando la rotazione della polarizzazione. Il pixel diventa cos`ı opaco in trasmissione e appare scuro. Usando dei filtri opportuni si possono generare dei pixel di colore rosso, verde o blu, di intensità diversa, producendo una colorazione del pixel con la tonalità voluta. Si usano delle sigle del tipo R35C5W a indicare che il rosso comincia a 35 ○ C e il blu comincia cinque gradi sopra cioè a 40 ○ C. 14 Dall’inglese Liquid Crystal Display. 15 Il pixel (contrazione dell’inglese picture element) e` l’unità minima in cui l’immagine viene riprodotta sullo schermo o digitalizzata. Al massimo della risoluzione la dimensione del pixel e` quella degli elementini unitari che formano lo schermo (∼ 1/5 mm). Usiamo questo termine a indicare indifferentemente la granularità fisica dello schermo e dell’immagine prodotta. 13

355

Capitolo 11

Cristalli liquidi

11.5 Quesiti di riepilogo 1. Cosa succede tipicamente a cristalli liquidi termotropici sottoposti a temperature molto basse o elevate? para

2. Cosa succede a un cristallo liquido nematico paramagnetico (con Δχm > Δχdia m > 0) se viene applicato a esso un campo magnetizzante sufficientemente intenso? 3. Basandosi sulla figura 11.6, spiegare perché l’applicazione di un campo elettrico a una cella nematica ritorta elimina l’attività ottica. 4. Se si aumenta la temperatura di un cristallo colesterico, come cambia il colore visto in riflessione?

11.6 Esercizi 1. Partendo dalla (11.1) si verifichi la (11.4), per un cristallo liquido nematico. 2. Si verifichi la (11.8) per un cristallo liquido nematico. 3. Una lamina di cristallo colesterico appare rossa (λ = 700 nm) alla temperatura di 35 ○ C. Di quanto deve variare la temperatura affinché appaia violetta (λ = 400 nm)? Si assuma (1/p)∣d p/dT∣ = 0.09 K−1 . 4. Che rotazione viene imposta al piano di polarizzazione di luce avente λ = 0.5 μm da un cristallo nematico tipico avente spessore d = 20 μm, passo p = 5 μm e Δn = 0.05?

356

Capitolo 12 Soluzioni Riportiamo qui, in breve, le risposte ai quesiti di riepilogo e le soluzioni degli esercizi proposti alla fine di ciascun capitolo.

12.1 Quesiti di riepilogo Capitolo 1 1. La sorgente blu. 2. La risposta c. 3. L’intervallo di lunghezza d’onda della luce visibile λvis = 400 ÷ 700 nm corrisponde a Eγ = 1.8÷3.1 eV, che deve essere maggiore di W0. I metalli che vanno bene sono, quindi, Ba, Li, Cs, K. 4. a) Il numero di elettroni N e resta lo stesso; b) N e raddoppia. Infatti, N e e` uguale al numero di fotoni che e` proporzionale all’intensità. 5. Nel secondo caso si hanno cristalli polverizzati e, quindi, orientamento dei piani variabile nello spazio, con la produzione di una figura di diffrazione simmetrica rispetto all’asse del fascio, composta da anelli circolari. 6. La risposta b.

357

Capitolo 12

Soluzioni

Capitolo 2 1. Il granello di sabbia perché ha massa e, quindi, quantità di moto minore (λ = h/p). 2. Luce blu perché Δx ∝ λ. 3. La risposta c, come prevede il principio di complementarietà. 4. Elettroni più energetici che hanno λ minore e quindi θ R (dato dal criterio di Rayleigh) minore. 5. Neutroni termici, perché hanno λ minore. 6. L’incertezza sulla quantità di moto Δpx ∼ 1/Δx e Δv x ∼ Δpx ∼ 1/Δx. Nel tempo t ′ − t la particella percorre uno spazio x ′ = v x ⋅ (t ′ − t) che e` incerto allora della quantità Δx ′ ∼ Δv x ∼ 1/Δx. Capitolo 3 1. No, perché ψ non dipende dal tempo e non dipende dal tempo ⟨x⟩ = ∗ ∫ ψ (x)xψ(x)dx. 2. No, perché c’è l’energia di punto zero. 3. Poiché Δx = ℓ ≠ 0 allora deve essere Δp ≠ 0 e perciò non e` possibile E = 0 → p = 0 perché richiederebbe Δp = 0. 4. Poiché la densità di probabilità è simmetrica rispetto al centro della buca (per buca sia finita sia infinita), il valore medio di x e` 0 in entrambi i casi. 5. Perché gli autovalori En sono in numero finito dovendo essere E < V0 (e siccome la differenza tra En−1 e En aumenta al crescere di n). 6. Si conclude che m j = ±1/2 e che, quindi, non c’è momento angolare orbitale e ℓ = 0. 358


Capitolo 12

Capitolo 4 1. No, solo dal tipo di metallo. 2. No, perché e` definito (ad esempio) come energia massima allo zero assoluto. 6 3. I valori della velocit` √ a di Fermi sono v F ∼ 10 m/s mentre la velocità 5 termica vale v T ≈ 3kT/m ∼ 1 × 10 m/s, quindi, e` più grande v F .

4. Perché la massa efficace m⋆ e` circa 10 volte più grande nel ferro che nel rame e σ ∝ 1/m⋆ . 5. No, perché un conduttore perfetto non sarebbe un diamagnete perfetto con effetto Meissner completo. 6. Parzialmente diamagnetico perché la magnetizzazione non riesce a bilanciare del tutto il campo esterno. Capitolo 5 1. Al posto del fosforo si può usare arsenico o antimonio (anch’essi pentavalenti). Al posto del boro si può usare alluminio o gallio (anch’essi trivalenti). 2. Per un semiconduttore e` dρ/dT < 0 e dσ/dT > 0, quindi, la conducibilità aumenta perché aumenta il numero di elettroni promossi termicamente alla banda di conduzione. 3. Ritorna a comportarsi da semiconduttore intrinseco. 4. Il boro e` trivalente e, quindi, contribuisce con lacune che diventano portatori maggioritari. 5. Al di sotto del valore medio della banda proibita, leggermente al di sopra della banda di valenza. 359

Capitolo 12

Soluzioni

6. Il segno e la concentrazione dei portatori maggioritari e, quindi, il tipo di drogaggio. 7. La ricombinazione riduce il numero di coppie elettrone-lacuna mentre la generazione le aumenta. 8. Il fatto che dρ/dT < 0 anziché dρ/dT > 0 come per i conduttori, e il fatto che la resistenza (definita come V/i) dipende da V. 9. La regione si estende fino, eventualmente, a occupare tutto lo spessore della giunzione. 10. Aumenta perché aumentano le coppie elettrone-lacuna generate termicamente. 11. In un caso aumentano gli elettroni nella banda di conduzione, nell’altro aumentano gli urti degli elettroni con gli ioni del reticolo. 12. Per il diodo di germanio ΔE e` minore e quindi i gen maggiore, e maggiore e` la corrente di saturazione inversa. 13. Per le tensioni vale VEB > 0, VCB < 0 (ad essere precisi VCB < Vs ), mentre per le correnti e` iE > 0, iC < 0. Capitolo 6 1. No, perché L = 0 e S = 0 e, quindi, non ci sono dipoli magnetici da orientare. 2. Per valori piccoli di B/T. 3. Per valori grandi di B/T. 4. No, perché i dipoli indotti sono già allineati e non c’è niente da orientare vincendo l’agitazione termica. 5. No, vedi risposta precedente. 360


Capitolo 12

6. Perché i dipoli magnetici nucleari interagiscono meno, hanno una tendenza minore all’allineamento tra di loro e, quindi, si hanno campi interni minori (dovuti ai dipoli stessi) e, quindi, una temperatura minore. Capitolo 7 1. No, infatti il ciclo di isteresi ha 2 valori di B per ciascun valore di H. 2. Per magneti permanenti si preferiscono ferromagneti duri avente grande campo coercitivo H c e, quindi, grande magnetizzazione residua Mr . Per i trasformatori si preferiscono ferromagneti soffici aventi ciclo di isteresi molto stretto per ridurre l’energia dissipata. 3. Cristalli piccoli e imperfetti per i magneti permanenti perché hanno grandi valori di Mr ; cristalli grandi e puri per i trasformatori perché hanno bassi valori di H c e un ciclo di isteresi molto stretto. 4. Il campo magnetizzante H si misura in A/m, quello magnetico B in T cioè N/(A ⋅ m), quindi, l’unità di misura di HB e` N/m2 = N ⋅ m/m3 = J/m3 cioè l’unità di misura per una densità volumica di energia. 5. La dimensione dei domini dipende dalla minimizzazione dell’energia magnetostatica, compatibilmente con l’effetto contrastante dovuto all’interazione di scambio e alla minimizzazione del numero di bordi tra domini. 6. In entrambi i casi il momento di dipolo magnetico dei singoli atomi assume valori simili. Nel caso dei ferromagneti la saturazione viene raggiunta, al di sotto della temperatura di Curie, per valori non troppo elevati del campo magnetizzante. Per i paramagneti, invece, la saturazione a temperatura ambiente richiederebbe campi magnetizzanti estremamente intensi (∼ 108 A/m), come si ricava dalla figura 6.2.

361

Capitolo 12

Soluzioni

Capitolo 8 1. Nella regione del visibile la polarizzabilità α e` dominata dal contributo elettronico α e e lo stesso vale per l’indice di rifrazione n. 2. Nel primo caso deve essere γ = 0 e ω ≠ ω0 . Nel secondo caso deve essere β molto grande e ω ≈ ω0 . 3. Nel caso del ghiaccio le molecole sono vincolate al reticolo cristallino e, quindi, meno libere di ruotare in risposta al campo elettrico oscillante. 4. Siccome n = c/v diminuisce all’aumentare di λ allora la velocità v cresce all’aumentare di λ. 5. Siccome 1 < nR < nV allora (legge di Snell) θ i > θ R > θ V vuol dire che il raggio rosso e` più vicino alla direzione incidente θ i e quello violetto e` più deviato. Capitolo 9 1. La riflettività R → 0 per ω > ω p = 2.4 ×1016 rad/s cioè nell’ultravioletto. 2. Di nuovo, il coefficiente di assorbimento β → 0 e R → 0, quindi, la trasmissività T → 1 per ω > ω p = 2.4 × 1016 rad/s cioè nell’ultravioletto. 3. Siamo nel regime a basse frequenze e la lunghezza di assorbimento √ √ ℓ ass ≈ 6×10−2 / ω ≈ 24 μm. Allo stesso tempo però R ≈ 1−10−9 ω → 1 e, quindi, T = (1 − R)2 e −d/ℓ ass ≈ 0 perché (1 − R)2 → 0. La risposta e`, quindi, no. 4. Descrivono entrambi lo spessore d tale da attenuare di un fattore 1/e rispettivamente l’intensità o il campo elettrico: I/I0 = e −d/ℓ ass e E/E0 = e −d/δ . Poiché I ∝ E 2 allora δ = 2ℓ ass , come si può verificare anche guardando alle (9.12) e (9.22). √ 5. La profondità di pelle vale δ = c 2є0 /σω, quindi, ω = 2є0 c 2 /σ δ 2 = 7 × 1012 rad/s, se si usa δ = ℓ. 362


Capitolo 12

6. Per il rame la riflettività diminuisce fortemente per λ ≲ 630 nm, cioè passando dal rosso al violetto, In riflessione prevale, quindi, la parte rossa della luce bianca incidente. Nel caso dell’argento la risonanza di Lorentz avviene nell’ultravioletto (λ ≈ 300 nm), quindi, non influenza pesantemente la riflettività della luce visibile e il metallo non appare colorato. Capitolo 10 1. Dalla (10.11) ricaviamo per T = TE che CV = 3R × 12 × e 1 /(e 1 − 1)2 = 3R × 0.92 = 22.9 J/mol⋅K. 2. Il carbonio perché la capacità termica raggiunge il valore limite a temperature più elevate. 3. Quelli amorfi perché hanno conducibilità minore, in quanto il trasporto dei fononi e` ostacolato maggiormente. 4. Il metallo puro perché essendoci meno impurità la migrazione elettronica viene ostacolata meno. 5. No, nel materiale poroso gran parte del volume e` riempito di aria che e` estremamente isolante. 6. La risposta e` no in entrambi i casi perché la dilatazione dipende dalle forze interatomiche. Capitolo 11 1. La fase di cristallo liquido dipende dalla presenza di un certo ordinamento che viene modificato sostanzialmente da forti variazioni di temperatura. A basse temperature il cristallo liquido passa a una fase cristallina convenzionale, mentre ad alte temperature passa a una fase propriamente liquida. 363

Capitolo 12

Soluzioni

2. Anche per le sostanze paramagnetiche il contributo alla densità di enerpara gia libera e` del tipo −(1/2)μ0 Δχm (H⋅n)2 e si somma all’analogo contributo dal diamagnetismo sempre presente, che assume però intensità para minore (perché ∣Δχm ∣ > ∣Δχdia m ∣). In ogni caso essendo Δχ m > 0 la minimizzazione avviene allineando n parallelamente a H. 3. In questo caso la propagazione dell’onda avviene parallelamente all’asse ottico e, quindi, l’onda “vede” un mezzo isotropo, senza birifrangenza, dicroismo o attività ottica. 4. Poiché d p/dT < 0, il passo p diminuisce e conseguentemente diminuisce λ = np. Il colore si sposta allora verso il blu.

12.2 Esercizi Capitolo 1 1. Da T = 2898/0.85 = 3400 K ricaviamo I = σ T 4 = 7.6 × 106 W/m2 e P = I × 4πr 2 = 1.5 × 1031 W. Quindi, L/L⊙ = P/P⊙ ≈ 4 × 104 . 2. L’intensità vale I = єσ T 4 , quindi, I Fe = 6.5 × 104 W/m2 , I Ag = 8 × 103 W/m2 e I W = 2.2 × 104 W/m2 ; l’intensità maggiore si ha per il ferro. La Ag lunghezza d’onda vale λ max = 2898/T quindi λ Fe max = 2.7 μm, λ max = 2.0 μm e λW max = 2.3 μm; la lunghezza d’onda maggiore si ha per il ferro. Si ricordi di usare le temperature assolute. 3. L’energia del fotone vale Eγ = hν = 4.6 eV e deve essere Eγ > W0 , quindi, si ha la fotoemissione per tutti i metalli della tabella con l’esclusione di Co, Cu, Au, Ag e Be. 4. La pendenza della retta e` proprio h, quindi, h = Δy/Δx = (3.5 × 1.6 × 10−19 )/(13−4.4)×1014 = 6.51 J ⋅ s, vicino al valore misurato da Millikan.

364

Esercizi

Capitolo 12

5. Dalla legge di Bragg 2d sin θ = mλ ricaviamo d = λ/2 sin θ = 0.09 nm dove l’angolo di diffrazione vale θ = (180○ − ϕ)/2 = 48○ , essendo ϕ = 84○ . 6. Lo spostamento di Compton vale Δλ = h(1 − cos ϕ)/mc = 2.43 × 10−12 m; l’energia cinetica dell’elettrone vale K e = hcΔλ/[λ(λ + Δλ)] = 5.9 × 10−14 J = 369 keV; l’energia del fotone prima della diffusione vale Eγ = hc/λ = 654 keV e ΔEγ = K e , quindi, ΔEγ /Eγ = 0.56 cioè il 56%. Capitolo 2 √ 1. Usiamo λ = h/p oppure λ = h/ 2mK, quindi, λ a = 4.4 × 10−34 m, λb = 3.3 × 10−35 m, λ c = 1.2 × 10−10 m e λd = 9 × 10−11 m. 2. L’incertezza sulla quantità di moto vale Δp = h/a = 6.63×10−30 kg ⋅ m/s, quindi, Δv = Δp/m = 7.3 m/s e Δv/v = 7.3 × 10−6 . 3. Le quantità di moto valgono pγ = p e = h/λ = 6.63 × 10−23 kg ⋅ m/s. L’energia del fotone vale Eγ = hc/λ = 2 × 10−14 J = 124 keV, √ ed essendo mγ = 0 e` Kγ = Eγ . L’energia dell’elettrone vale Ee = c m2 c 2 + p2 = 8.44 × 10−14 J = 527 keV, mentre la sua energia cinetica vale K e = Ee − mc 2 = 2.5 × 10−15 J = 15.6 keV. 4. Le lunghezze d’onda nei due casi valgono λγ = hc/Eγ = 6.2 × 10−11 m √ e λ e = h/ 2mK e = 8.7 × 10−12 m. Dalla legge di Bragg 2d sin θ = mλ ricaviamo che (sin θ ≈ θ) θ γ /θ e = λγ /λ e = 7.1. Non importa allora conoscere la distanza interplanare d. √ 5. La legge di Bragg prescrive che sia 2d sin θ = mλ, dove λ = h/ 2mK = 1.66 × 10−10 m e θ = (180○ − ϕ)/2 = 49○ . Si ricava allora d min = λ/(2 sin θ) = 1.1 × 10−10 m. 6. L’energia cinetica del√neutrone vale K = (3/2)kT = 6.2 × 10−21 J = 39 meV, quindi, λ = h/ 2mK = 1.46 × 10−10 m.

365

Capitolo 12

Soluzioni

Capitolo 3 1. Partiamo da una soluzione del tipo C cos kx. Il valore di aspettazione vale ⟨x⟩ = ∫ ψ∗ xψdx = C ∗ C ∫ x cos2 kxdx = 0 perché l’integrando e` una funzione dispari e gli estremi di integrazione sono simmetrici rispetto all’origine. Stesso risultato si ottiene partendo da una soluzione del tipo C sin kx. 2. Partiamo da una soluzione del tipo C cos kx. Il valore di aspettazione vale ⟨p⟩ = ∫ ψ ∗ (−iħd/dx)ψdx = ∫ C ∗ cos kx(−iħ)(−Ck) sin kxdx = D ∫ sin 2kxdx = 0 perché l’integrando e` una funzione dispari e gli estremi di integrazione sono simmetrici rispetto all’origine. Stesso risultato si ottiene partendo da una soluzione del tipo C sin kx. 3. Basta sostituire la soluzione generale nell’equazione di Schrödinger stazionaria √(3.10) e vedere che e` soddisfatta per qualsiasi valore di AI o B III se k = 2m(U0 − E)/ħ. 4. Basta sostituire la soluzione generale nell’equazione di Schrödinger sta` zionaria √ (3.10) e vedere che e soddisfatta per qualsiasi valore di CII se k = 2mE /ħ. 5. Il primo autovalore dell’energia vale E1 = ħ2 π 2 /2mℓ2 = 1.5×10−18 J = 9.4 eV. 6. Quando il dipolo e` parallelo l’energia di interazione vale U = −μ B B, quando e` antiparallelo vale U ′ = μ B B, quindi, ci vuole un’energia ΔU = 2μ B B = 9.3 × 10−24 J = 6 × 10−5 eV. Capitolo 4 1. La densità atomica vale n A = N A δ/M = 8.5×1022 cm−3 = 8.5×1028 m−3 . 2. Secondo la (4.14) la densità di elettroni liberi vale n = (4.53 × 1027 ) × 3 EF2 = 16.8×1028 m−3 . Si hanno, quindi, circa due elettroni di conduzione per atomo. 366

Esercizi

Capitolo 12

3. La resistenza alla temperatura T ′ vale R ′ = Rρ ′ /ρ = 2.5 kΩ, dove ρ ′ = ρ[1 + α(T ′ − 20)] = 2.5. 4. Secondo la (4.4) il tempo medio tra gli urti vale τ = m/ne 2 ρ = 2.2 × 10−15 s. 5. Dall’esempio 4 si ricava E = (3/5)EF = 6.7 eV. 6. Prima si ricavi la densità atomica n A = N A δ/M = 5.9 × 1022 cm−3 = 5.9 × 1028 m−3 , da cui si ottiene, usando la formula (4.15), EF = 8.9 × 10−19 J = 5.5 eV, in accordo con la tabella 4.2. Capitolo 5 1. La densità atomica vale n A = N A δ/M = 4.4 × 1022 cm−3 come in tabella 5.1. 2. La conducibilità vale σ = (nμ n + pμ p )e = n i (μ n + μ p )e = 0.022 (Ω ⋅ cm)−1 . La resistività vale ρ = 1/σ = 44.6 Ω ⋅ cm come in tabella 5.1. 3. La concentrazione di lacune vale p ≈ N a = 10−6 n A = 4.4 × 1016 cm−3 , quindi, σ ≈ pμ p e = 12.7 (Ω ⋅ cm)−1 e ρ = 7.9 × 10−2 Ω ⋅ cm. 4. Rispettivamente n, p, p e n. 5. Per il germanio a temperatura ambiente le concentrazioni valgono n = p = n i = 2.5 × 1019 m−3 . Le mobilità valgono invece μ n = 0.38 m2 /V⋅s e μ p = 0.18 m2 /V⋅s. Il coefficiente di Hall vale allora: RH =

2.5 × 1019 × (0.182 − 0.382 ) = −0.089 m3 /A ⋅ s 1.6 × 10−19 × (2.5 × 1019 )2 × (0.18 + 0.38)2

6. Per V ≡ Vin > 0 D2 e` acceso e D1 spento, allora dalla legge delle maglie V − R2 i − Rd i − Ri = 0 si ricava i = V/(R2 + Rd + R) e Vout = RV0 sin ωt/(R2 + Rd + R), cioè Vout = 4.8 sin ωt (se sin ωt > 0). Invece, se V < 0 D1 e` acceso e D2 spento, e si ricava Vout = 6.3 sin ωt 367

Capitolo 12

Soluzioni

(se sin ωt < 0). Si ottiene in uscita ancora una tensione oscillante, ma con ampiezza massima diversa per quanto riguarda la parte positiva e quella negativa. 7. La giunzione EB deve essere polarizzata direttamente, quindi, VBE < 0 e VB < 0 ; la giunzione CB deve essere polarizzata inversamente, quindi, VCB < 0 e VC < 0. La legge delle maglie per il circuito di base prevede che −∣VB ∣−R B iB +∣VBE ∣ = 0 cioè iB = (∣VBE ∣−∣VB ∣)/R B = −0.022 mA, quindi, uscente dalla base. La corrente al collettore vale iC ≈ βiB = −1.08 mA ancora uscente. Al collettore vale ∣VC ∣−RC ∣iC ∣+VCE = 0, cioè VCE = −5.7 V e VCB = VCE − VBE = −5 V. Capitolo 6 1. Il rame e` diamagnetico, quindi, χm = −μ0 nZe 2 ⟨r 2 ⟩/6m (vedi (6.10)) 2 = 2.8 × 10−21 m2 , per dove n = N A δ/M = 8.2 × 1028 m−3 , ⟨r 2 ⟩ ≈ rBohr ottenere χm ≈ −3.9 × 10−5 dell’ordine del valore di tabella 6.1 (−1.0 × 10−5 ). 2. Il momento magnetico per ione μ = M/N viene a essere uguale a (n2B μ B B/3kT)μ B , come ottenuto combinando la (6.28) con la (6.6). Sostituendo i valori dei parametri si ottiene μ = 1.6μ B in accordo con la misura. 3. In corrispondenza di B/T = 4 T/K abbiamo μ B B/kT = 2.7, quindi, non vale l’approssimazione usata per x ≪ 1, anzi in questo caso tanh(x) → 1 e μ = M/n = gsμ B (vedi la (6.12)). Quindi, gs = 7 cioè s = 7/2. ↑

↓

↑

↓

4. Il rapporto tra le popolazioni vale n↑ /n↓ = e −E /kT /e −E /kT = e −(E −E )/kT che, per E ↑ − E ↓ = 0.6 × 10−3 eV diventa circa 0.98. √ 5. Se c’è momento√ angolare orbitale n B = g j( j + 1), mentre nel caso di solo spin nB = g s(s + 1). Nel primo caso il fattore di Landè vale (vedi la (6.13)) g = 1+[ j( j+1)+s(s+1)−ℓ(ℓ+1)]/[2 j( j+1)] = 1.2, mentre nel 368

Esercizi

Capitolo 12

secondo caso g = 2. Quindi, nel primo caso n B = 3.55 e nel secondo n B = 1.73, vicino alla misura sperimentale. Capitolo 7 1. La magnetizzazione di saturazione vale Ms = nμ = nn B μ B = 1.74 × 106 A/m dove n B = 2.2 e n = 8.5 × 1028 m−3 (vedi esercizio 4.1). Il valore torna con quanto riportato in tabella 7.1. 2. Da Ms = nn B μ B ricaviamo n B = Ms /nμ B = 0.59, dove n = N A δ/M = 9.1 × 1028 m3. 3. Per il ferro TC = 1043 K, n B = 2.2 e n = N A δ/M = 8.5×1028 m−3 . Si ottiene allora (vedi la (7.8)) λ = 3kTC /μ0 nn2B μ 2B = 970. La magnetizzazione vale M = ∑ μ i /V = nnB μ B = 1.74×106 A/m. Allora H M = λM = 1.7×109 A/m. ef f

4. Il campo nell’interferro vale B i = μ0 Ni/(x + ℓ/κ m ) = 0.19 T dove ef f abbiamo usato κ m = 2 × 104 . 5. Il ciclo e` un rettangolo avente lati 2Bs e 2H c , quindi, l’area e` pari a 4H c Bs = 800 N/m2 , che moltiplicato per il volume diventa ΔU = 1.6 × 10−4 J. Capitolo 8 1. La lunghezza si assorbimento vale ℓ ass = λ/4πnI = 6.5 × 10−7 m. La riflettività vale (vedi la (8.77)) R = 0.77. 2. Dalle formule (8.66) e (8.67) si ricava n R = 8.82 e n i = 0.43. 3. La lunghezza si assorbimento vale ℓ ass = c/4πνnI = 0.05 cm, mentre per 2 GHz (e i valori di nR e nI dall’esercizio precedente) si ricava ℓ′ass = 2.8 cm. Il vantaggio di usare la frequenza di ≈ 2 GHz nei forni a microonde e` che il calore (e la cottura) penetra maggiormente in profondità. 369

Capitolo 12

Soluzioni

4. La lunghezza si assorbimento vale ℓ ass = c/4πνnI = 0.67 μm, mentre R = 0.40 (vedi la (8.77)). Allora T = (1−R)2 e −d/ℓ ass = 0.62 ×0.22 = 0.08 cioè l’8%. 5. Il punto di uscita di uno dei due raggi dista dalla normale h = D tan θ, dove θ si ricava dalla legge di Snell e vale θ = arcsin(sin 45○ /n). Dall’equazione (8.52) si ricava nR = 1.453 e nV = 1.468, quindi, θ R = 29.1○ e θ V = 28.8○ . La distanza vale d = h R − hV = 0.7 mm. 6. La frazione di intensità non riflessa che attraversa la lastrina vale f = e −d/ℓ ass (vedi (8.80)) e cioè ln f = −d/ℓ ass e ℓ ass = −d/ ln f = 35 mm. Se ′ lo spessore diventa d ′ allora la frazione trasmessa diventa f ′ = e −d /ℓ ass = 0.57 cioè il 57%. Capitolo 9 1. La frequenza angolare vale ω = 2πc/λ = 1.9 × 1016 rad/s, mentre per i metalli τ ∼ 10−14 s, quindi, ωτ ≫ 1. Siccome ω < ω p usiamo l’approssimazione per alte frequenze nella regione di rilassamento, per la quale vale ℓ ass = c/2ω p = 6.3 nm. 2. La lamina diventa trasparente se ω > ω p = 1.1 × 1016 rad/s. Quindi, ν > ω p /2π = 1.7 × 1015 Hz. 3. La frequenza angolare vale ω = 2πν = 6.3 × 104 rad/s e in questo caso ωτ ≪ 1. Usiamo l’approssimazione per basse √ frequenze per la quale si ricava n R = n I (vedi la (9.10)). Inoltre n R = σ/2є0 ω ≫ 1, quindi, R ≈ 1, e la frazione di intensità riflessa e` pari al 100%. 4. La frequenza angolare vale ω = 3.1 × 1016 > ω p perciò si può applicare l’approssimazione delle alte frequenze, con ω > ω p . In questo caso n I = 0 e β = 0. Dalla 9.17 si ricava n R ≈ 0.63 e, quindi, R = (n R − 1)2 /(n R + 1)2 = 0.05. Allora T = (1 − R)2 = 0.9.

370

Esercizi

Capitolo 12

5. Dalla (8.77) si ricava, per le due lunghezze d’onda, R480 = 0.33 e R700 = 0.98. Quindi, la parte giallo-rossa dello spettro viene riflessa quasi tutta, contrariamente alla parte verde-blu. 6. Sostituendo la frequenza angolare ω = 2πν = 1.3×1010 rad/s nella (9.23) si ricava δ ≈ 1.8 μm, quindi, 5δ ≈ 9 μm per assorbire il 99.3%. Qualche decina di μm e` più che sufficiente. Capitolo 10 1. Poiché T ≪ TD possiamo usare l’approssimazione (10.16), quindi, CV = (12π 4 /5)R(T/TD )3 = 6.2 J/mole⋅K. 2. La capacità termica si ottiene moltiplicando il calore specifico per la massa molare (63.5 × 10−3 kg/mole) ottenendo CV = 11.4 J/mole⋅K. Sfruttando poi la (10.16) otteniamo TD = (12π 4 R/5CV )1/3 T = 333 K. (Il calore specifico e` generalmente considerato a pressione costante, quindi, il valore di CV e` leggermente sovrastimato.) 3. A basse temperature, uguagliando l’espressione (10.21) alla (10.16) si ot√ 3 tiene T = 5TD /24π 2 TF = 3.2 K, dove abbiamo usato TF = 8.2 × 104 K (vedi tabella 4.2). 4. In condizioni stazionarie e per una sbarra uniforme vale dT/dx = ΔT/δx, quindi, j q = −κΔT/Δx = 8×104 W/m2 . Il calore che attraversa la sezione A nel tempo Δt e` q = j q AΔt = 12 kJ. 5. L’allungamento vale Δℓ = αℓ ΔTℓ = 24 mm. Capitolo 11 1. Usando l’espressione (11.2), e assumendo che l’asse z sia parallelo al direttore n, si ricava M = χ⊥ H x ux + χ⊥ H y u y + χ∥ Hz uz . Aggiungendo e sottraendo il termine χ⊥ Hz uz si ottiene M = χ⊥ H x ux + χ⊥ H y u y + χ⊥ Hz uz + (χ∥ − χ⊥ )Hz uz cioè M = χ⊥ H + Δχ(H ⋅ n)n. Quindi, M ⋅ H = χ⊥ H 2 + Δχm (n ⋅ H)2 , da cui si ottiene la (11.4). 371

Capitolo 12

Soluzioni

2. Similmente a quanto visto nell’esercizio precedente, vale D = є0 [є⊥ E + Δє(E ⋅ nn)]. Quindi, D ⋅ E = є0 [є⊥ E 2 + Δє(n ⋅ E)2 ], da cui si ottiene la (11.8). 3. La variazione di temperatura può essere scritta come ΔT = (1/0.09)Δp/p. Dalla condizione di Bragg per la riflessione λ = n2p deriviamo Δλ = n2Δp e Δλ/λ = Δp/p. Quindi, ΔT = (1/0.09)Δλ/λ = (1/0.09)300/700 = 4.8 ○ C. 4. Siamo in condizione pΔn ≪ λ e, quindi, il potere rotatore vale ∣ρ∣ = π(Δn)2 p/(2λ2 ) = 4.5○ μm−1 . Il piano viene allora rotato di un angolo ϕ = ρd = 90○ .

372

Capitolo 13 Bibliografia Per approfondire i temi sviluppati in questo testo si consigliano i libri seguenti1 , divisi per argomento. Fisica quantistica: • Gasiorowicz, S. Quantum Physics, USA, John Wiley & Sons, 2003. • Landshoff, P.; Metherell, A.; Rees, G. Essential quantum physics, Cambridge, UK, Cambridge University Press, 1997. • Slater, J.C. Teoria quantistica della materia, Bologna, Zanichelli, 1980. Proprietà fisiche della materia solida: • Duan, F.; Guojun, J. Introduction to Condensed Matter Physics - vol. 1, USA, World Scientific, 2005. • Marder, M.P. Condensed Matter Physics, USA, John Wiley & Sons, 2000. • Myers, H.P. Introductory Solid State Physics, USA, CRC/Taylor & Francis, 1997. Proprietà elettriche: • Cottrell, A.H. Introduction to the modern Theory of Metals, London, The Institute of Metals, 1988. 1

Questi libri sono presenti, al momento della stampa di questo libro, nel sistema bibliotecario dell’Ateneo di Bologna.

373

Capitolo 13

Bibliografia

• Schroder, D.K. Semiconductor material and device characterization, USA, John Wiley & Sons, 1998. Proprietà magnetiche: • Jiles, D. Introduction to Magnetism and Magnetic Materials, USA, CRC/Taylor & Francis, 1998. • O’Handley, R.C. Modern Magnetic Materials, USA, John Wiley & Sons, 2000. Proprietà ottiche: • Abeles, F. Optical properties of solids, Amsterdam, North-Holland Publishing, 1972. Proprietà termiche: • Berman, R. Thermal conduction in solids, UK, Clarendon Press, 1979. • Blundell, S.J.; Blundell, K.M. Concepts in Thermal Physics, UK, Oxford University Press, 2006. Cristalli liquidi: • Chandrasekhar, S. Liquid Crystals, Cambridge, USA, Cambridge University Press, 1992. • de Gennes, P.G. The Physics of Liquid Crystals, UK, Clarendon Press, 1974. • de Gennes, P.G.; Prost, J. The Physics of Liquid Crystals, Cambridge, UK, Cambridge University Press, 1995. Trova i libri in bibliografia su www.libreriauniversitaria.it

374

Indice analitico acciai elettrici, 247 Alpher, Ralph A., 40 approssimazione di campo medio, 238 argentatura, 306 asse ottico, 346 attinidi, 221 attività ottica, 348 autofunzioni, 84, 91 autovalori, 84, 91 bande di conduzione, 133, 136, 145, 161 di energia, 131 di valenza, 133, 136, 145, 161 isolate, 133 permesse, 132 teoria delle, 131 vietate, 132 Bardeen, John, 151, 188 barioni, 40 barriera di potenziale, 84 base comune, 193 Beer equazione di, 275 Bethe, Hans A., 240 Bethe-Slater curva di, 240 Big Bang, 39

birifrangenza, 347 Bloch funzione di, 140 pareti di, 244 Bohr, Niels H.D., 68 Boltzmann costante di, 12 Boltzmann, Ludwig, 7 Born ipotesi di, 79 Born, Max, 79 Bose, Satyendra N., 316 bosoni, 126 Bragg legge di, 29, 52, 351 riflessione di, 29, 139 Bragg, William L., 28 Brattain, Walter, 188 Brillouin zone di, 141 buca di potenziale, 84 buca di potenziale infinita, 91 calore specifico, 311 cammino libero medio, 116 campo coercitivo, 246 di Weiss, 238 magnetizzante, 216

INDICE ANALITICO

molecolare, 238 capacità termica, 311, 312 molare, 312 cariche spaziali, 179 catastrofe ultravioletta, 11 Cauchy formula di, 279 CCD, 71 cella fotovoltaica, 204 unitaria, 131 celle nematiche ritorte, 350 ciclo di isteresi, 246 classificazione solidi, 112 Clausius-Mossotti equazione di, 266, 273 coefficiente di assorbimento, 274, 296 di espansione lineare, 329 di espansione volumica, 329 di Fresnel, 284 di Hall, 176 di Seebeck, 155 di temperatura, 118 complementarietà principio di, 68 Compton diffusione di, 31, 66 lunghezza d’onda di, 34 spostamento di, 31, 34, 36 Compton, Arthur H., 31 concentrazione intrinseca, 163

condizione di Bragg, 140 conducibilità elettrica, 111, 118 intrinseca, 162 termica, 311, 322 conduttori, 111 conduzione elettrica, 111, 134 conduzione termica, 322 contatti ohmici, 183 Cooper coppie di, 151 Cooper, Leon N., 151 Copenhagen interpretazione di, 80 coppie di Cooper, 151 corpo nero, 6 corrente di saturazione inversa, 181 di deriva, 179 di diffusione, 181 di generazione, 179 di magnetizzazione, 216 di ricombinazione, 181 termica, 179 costante di Boltzmann, 12 di Curie, 225 di Planck, 12, 15, 25, 35 dielettrica relativa, 266 cristalli uniassici, 346

376

INDICE ANALITICO

cristalli liquidi, 339 colesterici, 340 liotropici, 339 nematici, 340 smectici, 340 termotropici, 339 criterio di Rayleigh, 69 Curie costante di, 225, 238 legge di, 225 temperatura di, 237, 242 Curie, Pierre, 225 Curie-Weiss legge di, 237 curva caratteristica, 185 di Bethe-Slater, 240 di dispersione, 276

esperimento di, 30, 52 densità di modi vibrazionali, 315 di stati, 120 di stati occupati, 122 diagnostica medica, 38 diamagnete perfetto, 148 diamagnetismo, 218 dicroismo, 347 diffrazione neutroni, 69, 72 diffusione di Compton, 31 di Thomson, 35 diodo approssimazione lineare, 187 laser, 202 raddrizzatore, 185 Schottky, 185 Zener, 208 Dirac, Paul A., 98, 126 direttore, 340 dischi magneto-ottici, 257 disintegrazione nucleare, 74 dispersione, 277 anomala, 277, 280 curva di, 276 normale, 277, 280 relazioni di, 274, 275, 283 dissipatori di calore, 335 distribuzione di Boltzmann, 223 di Bose, 316

Davisson, Clinton, 52 Davisson-Germer esperimento di, 51 De Broglie lunghezza d’onda di, 50, 79, 139 De Broglie, Louis, 50 De Gennes, Pierre G., 339 Debye formula di, 269 frequenza di, 318 modello di, 317 temperatura di, 313, 318 Debye, Peter J.W., 30, 228 Debye-Scherrer 377

INDICE ANALITICO

di Fermi-Dirac, 126, 162, 227 domini di chiusura, 244 di Weiss, 244 donatori, 168 drogaggio, 167 Drude modello di, 300 Drude, Paul, 115 dualismo onda-particella, 57

Einstein, Albert, 23 elettromagnete, 254 emettitore comune, 192 emissione spontanea, 203 stimolata, 203 emissività, 8 encefalografia magnetica, 158 energia di gap, 136 di punto zero, 92 libera, 343 magnetostatica, 244 entropia, 229 equazione di Beer, 275 di Clausius-Mossotti, 266, 273 di de Vries, 349 di Hagen-Rubens, 297 di Landé, 222 equazioni di Maxwell, 270 espansione termica, 329 esperimento di Compton, 31 di Davisson-Germer, 51 di Phipps-Taylor, 97 di Stern-Gerlach, 96 di Thomson, 52 di Young, 47

Earnshaw teorema di, 234 effetto fotoelettrico, 19 fotovoltaico, 204 Hall, 144, 174 Josephson, 157 Kerr, 257 magneto-calorico, 228 Meissner, 148 pelle, 303 pelle anomalo, 305 Peltier, 155 Seebeck, 153 termoelettrico, 153 tunnel, 88, 157 Zeeman, 115 efficacia luminosa, 202 Einstein modello di, 315 principo di relatività di, 280 temperatura di, 317

Faraday, Michael, 258 fattore g di Landé, 101 378

INDICE ANALITICO

g di spin, 99 Fermi energia di, 122 velocità di, 134 Fermi, Enrico, 122 Fermi-Dirac distribuzione di, 126, 227 fermioni, 126 ferrimagnetismo, 250 ferriti, 251 ferromagnetismo, 237 Fert, Albert, 253 flusso di calore, 322 fononi, 151, 173, 315, 323 formula paramagnetica di Langevin, 224 di Cauchy, 279 di Debye, 269 di Langevin, 220 di Langevin-Debye, 270 di Maxwell, 11 di propagazione degli errori, 63 di Rayleigh-Jeans, 11 di Wien, 11 forza di van der Waals, 114 fotoconduttività, 163 fotoelettroni, 19 fotoni, 23 fotovoltaggio, 204 Fourier legge di, 322

sviluppo di, 57 frequenza di Debye, 318 di Larmor, 96, 218 di plasma, 297 di soglia, 21 propria, 264 Fresnel coefficienti di, 284 funzione d’onda, 79, 81, 119 di Bloch, 140 di distribuzione, 8 di probabilità, 122 Gamow, George, 40 Gerlach, Walther, 96 Germer, Lester H., 52 giunzione bipolare, 188 p-n, 178 Goudsmith, Samuel A., 98 Grünberg, Peter A., 253 grasso termico, 336 Hall coefficiente di, 176 effetto, 144, 174 tensione di, 175 Heisemberg indeterminazione di, 59 meccanica matriciale di, 81 principio di, 79

379

INDICE ANALITICO

principio di indeterminazione di, 81, 83 relazioni di indeterminazione di, 60 Heisemberg, Werner, 60 Herman, Robert, 40 Hertz, Heinrich R., 19

isolanti, 111 isteresi ciclo di, 246 Jeans, James H., 11 Josephson effetto, 157 giunzione, 157 Josephson, Brian D., 157

indeterminazione di Heisemberg, 59 indice di rifrazione ordinario, 346 straordinario, 346 induzione dielettrica, 344 integrale di scambio, 240, 253 intensità di irraggiamento, 7 di un’onda, 274 interazione di scambio, 238 spin-orbita, 100 interferro, 254 interpretazione di Copenhagen, 80 intervallo energetico proibito, 136 intervallo proibito diretto, 173 indiretto, 173 inversione di popolazione, 202 ionosfera, 308 ipotesi di Born, 79 irraggiamento, 5, 11

Kerr effetto, 258 Kerr, John, 258 Knoll, Max, 70 Kronig, Ralph de L., 139 Kronig-Penney modello di, 139 lacune, 144, 169 Landé equazione di, 222 Langevin formula di, 220 formula paramagnetica di, 224 Langevin-Debye formula di, 270 Larmor frequenza di, 96 precessione di, 96 Laue macchie di, 28, 29, 51, 54 Laue, Max von, 28 Lautebur, Paul C., 104 lavoro di estrazione, 22 380

INDICE ANALITICO

LCD, 355 LED, 201 legami covalenti, 114 legge dell’azione di massa, 171 di Bragg, 29, 52, 351 di Curie, 225 di Curie-Weiss, 237 di equipartizione dell’energia, 15 di Fourier, 322 di Lenz, 218 di Ohm, 112, 115 di Snell, 288 di Stefan-Boltzmann, 7, 15 di Wiedemann-Franz, 327 di Wien, 9, 15 Lenz legge di, 218 leptoni, 73 levitazione diamagnetica, 234 limite di Mauguin, 349 livelli di accettazione, 170 di donazione, 168 energetici, 131 Lorentz modello di, 300 Lorentz, Hendrik A., 115 Lorenz numero di, 327 Lorenz, Ludvig V., 327

lunghezza d’onda di Compton, 34 di De Broglie, 50 lunghezza di assorbimento, 274, 296 macchie di Laue, 54 magneti permanenti, 256 superconduttori, 156 magnetite, 250 magnetizzazione, 215, 216 di saturazione, 226, 241 di spin di Pauli, 228 magneto-resistenza gigante, 253 magnetometro, 157 magnetone di Bohr, 95 nucleare, 101 magnetoni di Bohr numero effettivo di, 225 Mansfield, Peter, 104 massa efficace, 141 materiali antiferromagnetici, 237, 252 ceramici, 331 diamagnetici, 217 ferrimagnetici, 237, 251 ferromagnetici, 217, 237 paramagnetici, 217, 220 Matthiesen regola di, 118 Maxwell formula di, 11 381

INDICE ANALITICO

meccanica matriciale, 81 ondulatoria, 81 quantistica, 112 meccanismo a valanga, 208 Zener, 209 memorie magnetiche, 257 mesofasi, 339 metereologia, 39 mezzo dispersivo, 277 microscopia elettronica, 69 microscopio a scansione, 72 a trasmissione, 70 elettronico, 69 Millikan, Robert A., 21 mobilità, 119 modello a gas di elettroni, 119 di Debye, 317 di Drude, 300 di Drude-Lorentz, 115 di Eistein, 315 di Kronig-Penney, 139 di Lorentz, 300 molecole polari, 269 momenti magnetici nucleari, 101 momento angolare azimuthale, 94 intrinseco, 98 orbitale, 94

totale, 100 MOSFET, 195 mumetal, 248 Néel temperatura di, 252 neutroni diffrazione di, 54 freddi, 74 termici, 74 numero di Lorenz, 327 numero quantico, 13 di spin, 99 magnetico, 95 orbitale, 95 oceanografia, 39 Ohm legge di, 112, 115 onde radio AM, 309 radio, 308 radio FM, 309 Onnes, Heike K., 146 operatore laplaciano, 82 pacchetto d’onda, 57 paramagnetismo, 220 pareti di Bloch, 244 Pauli magnetizzazione di spin, 228 principio di esclusione, 120 Pauli, Wolfgang, 120, 228 382

INDICE ANALITICO

Peltier effetto, 155 Peltier, Jean Charles A., 155 pendolo semplice, 18 penetrazione della barriera, 88 Penney, William G., 139 Penzias, Arno, 39 permalloy, 247 permeabilità magnetica relativa, 217 Phipps-Taylor esperimento di, 97, 98 pixel, 355 Planck costante di, 12, 15, 25, 35 postulato di, 13, 15 Planck, Max, 12 plasma, 40 polarizzabilità, 266 elettronica, 269 ionica, 269 per orientamento, 269 polarizzazione, 263 dielettrico, 265 diretta, 182 inversa, 181 per orientamento, 269 polimeri, 331 pompaggio laser, 202 portatori maggioritari, 169 minoritari, 169 postulato

di Planck, 13, 15 potenza termoelettrica, 155 potenziale chimico, 126 d’arresto, 21 di contatto, 183 potere rotatore, 349 principio di complementarietà, 68 di corrispondenza, 14 di equipartizione dell’energia, 11, 314 di esclusione, 120 di indeterminazione, 60, 81 profondità di pelle, 304 quantizzazione energia, 13 quark, 73, 102 quench, 156 radianza spettrale, 8 radiazione cosmica di fondo, 39 termica, 3, 38 raffreddamento adiabatico, 233 raggi X, 28, 31, 36 raggio ordinario, 346 straordinario, 346 Rayleigh criterio di, 69 Rayleigh, Lord, 11 Rayleigh-Jeans

383

INDICE ANALITICO

formula di, 11 reattori nucleari, 74 regime risposta lineare, 293 regione di rilassamento, 298 regola di Matthiesen, 118 regolatore di tensione, 208 regole di Hund, 221, 240 relazioni di dispersione, 274, 275, 283 di indeterminazione, 60 di Kramers-Kronig, 275 resistenza diretta, 186 inversa, 186 resistività, 111 reticolo cristallino, 113 ricombinazione, 162, 179 riflessione di Bragg, 29, 139 riflettività, 284, 286 ripristino dell’equilibrio, 138 risoluzione, 69 risonanza magnetica nucleare, 103 tecnica di, 103 rivelatori a microstrisce, 206 Roentgen, Wilhelm C., 28 Ruska, Ernst, 70

equazione degli stati stazionari di, 83 equazione di, 82, 120, 140 Schrödinger, Erwin, 81 Schrieffer, J. Robert, 151 Seebeck coefficiente di, 155 effetto, 153 Seebeck, Thomas J., 153 semi-metalli, 111 semiconduttori, 111, 119, 134, 137, 161 drogati, 167 estrinsechi, 167 intrinsechi, 162 Shockley, William, 188 Shull, Clifford, 72 Shuttle, 334 silice, 331, 334 Slater, John C., 240 smagnetizzazione adiabatica, 228 Snell legge di, 288 solidi amorfi, 113 covalenti, 114 cristallini, 113 ionici, 114 metallici, 114 molecolari, 114 sorgenti di spallazione, 74 specchi dielettrici, 306 spettro elettromagnetico, 3

schermo a cristalli liquidi, 355 schermo magnetico, 259 Scherrer, Paul, 30 Schrödinger 384

INDICE ANALITICO

spin, 93, 98 spinello, 251 spostamento di Compton, 31, 34, 36 SQUID, 102, 157 stati permessi, 122 Stefan, Josef, 7 Stefan-Boltzmann legge di, 7, 15 Stern, Otto, 96 Stern-Gerlach esperimento di, 96 stress termico, 332 struttura fine, 98 supeconduttività, 146 superconduttori, 146 tipo I, 149 tipo II, 149 suscettibilità elettrica, 265 magnetica, 216 sviluppo di Fourier, 57

di soglia, 186 teorema di Earnshaw, 234 di Larmor, 218 teoria BCS, 151 delle bande, 131 termistori, 165 termocoppia, 153 termografia, 38 termogramma, 38 termopila, 155 terre rare, 221, 256 Thomson diffusione di, 35 esperimento di, 52 Thomson, George P., 52 tomografia a neutroni, 75 TPS, 334 transistor, 178, 188 base del, 188 collettore del, 188 emettitore del, 188 guadagno di corrente del, 191 regione attiva del, 191 saturazione del, 192 transizioni intrabanda, 293 trasformatori, 256 trasmissività, 287

TAC, 103 temperatura critica, 146 di Curie, 237, 242 di Debye, 313, 318 di Einstein, 317 di Néel, 252 tempo di rilassamento, 294 tensione di Hall, 175

Uhlenbeck, George E., 98 van der Waals

385

INDICE ANALITICO

forza di, 114 velocità di deriva, 116, 135 di Fermi, 125 di gruppo, 62 Weiss campo di, 238 domini di, 244 Wiedemann, Gustav H., 327 Wiedemann-Franz legge di, 327 Wien formula di, 11 legge di, 9, 15 Wien, Wilhelm, 9 Wilson, Robert W., 39 Wollan, Ernest O., 72 Young esperimento di, 47 Young, Thomas, 47 Zeeman, Pieter, 115 zone di Brillouin, 141

386

.

.

.

Proprieta fisiche della materia

Poesia della-nella materia

Materia

MATERIA

MATERIA

MATERIA

MATERIA

MATERIA

Materia Oscura

Materia Gris

Ein Koder fur MATERIA

Materia Medica of Ayurveda

Der Diener der Materia

Ein Köder für MATERIA

Materia Medica гомеопатических препаратов

Materia Medica гомеопатических препаратов

Materia Medica гомеопатических препаратов

Espacio Tiempo Materia Y Vacio

Лекции по гомеопатической Materia Medica

An Illustrated Chinese Materia Medica

Materia medica of Ayurveda

Ein Koder fur MATERIA

Della

El Corazón De La Materia

Evidence-based Anticancer Materia Medica

El corazón de la materia

Лекции по гомеопатической MATERIA MEDICA

Лекции по гомеопатической Materia Medica

Лекции по гомеопатической MATERIA MEDICA

An Illustrated Chinese Materia Medica

Materia medica homeopatica de Vijnovsky

Proprieta fisiche della materia

Poesia della-nella materia

Materia

MATERIA

MATERIA

MATERIA

MATERIA

MATERIA

Materia Oscura

Materia Gris

Ein Koder fur MATERIA

Materia Medica of Ayurveda

Der Diener der Materia

Ein Köder für MATERIA

Materia Medica гомеопатических препаратов

Materia Medica гомеопатических препаратов

Materia Medica гомеопатических препаратов

Espacio Tiempo Materia Y Vacio

Лекции по гомеопатической Materia Medica

An Illustrated Chinese Materia Medica

Materia medica of Ayurveda

Ein Koder fur MATERIA

Della

El Corazón De La Materia

Evidence-based Anticancer Materia Medica

El corazón de la materia

Лекции по гомеопатической MATERIA MEDICA

Лекции по гомеопатической Materia Medica

Лекции по гомеопатической MATERIA MEDICA

An Illustrated Chinese Materia Medica

Materia medica homeopatica de Vijnovsky

Recommend Documents