Simone Secchi
Appunti di Matematica 29 dicembre 2010
Universit`a degli Studi di Milano–Bicocca
Prefazione
Le dispen...
78 downloads
1804 Views
1MB Size
Report
This content was uploaded by our users and we assume good faith they have the permission to share this book. If you own the copyright to this book and it is wrongfully on our website, we offer a simple DMCA procedure to remove your content from our site. Start by pressing the button below!
Report copyright / DMCA form
Simone Secchi
Appunti di Matematica 29 dicembre 2010
Universit`a degli Studi di Milano–Bicocca
Prefazione
Le dispense che state leggendo nascono dall’esperienza di insegnamento del corso di Matematica per gli allievi biotecnologi dell’Universit`a prima difficolt`a e` stata quella di scegliere un libro di testo. Alcune esigenze hanno reso molto difficile questo compito: innanzitutto e` opportuno utilizzare materiale in lingua italiana, onde evitare di aggiungere la difficolt`a di apprendimento in una lingua straniera a quella intrinseca della materia. Inoltre, la presenza di argomenti piuttosto avanzati (introduzione alle equazioni differenziali ordinarie, cenni ai metodi di approssimazione) esclude la maggioranza delle opere attualmente presenti sul mercato. Dalle discussioni con alcuni insegnanti di scuola media superiore, e` emerso chiaramente l’abbassamento del livello dei programmi scolastici rispetto a quelli di vent’anni fa. Basti dire che, nei licei scientifici e nei principali istituti tecnici degli anni ’90 del secolo scorso, era consuetudine insegnare tutti gli argomenti che tratteremo in queste dispense, sebbene con poche dimostrazioni rigorose. Non era raro, poi, studiare il calcolo combinatorico e qualche concetto di probabilit`a elementare. E` chiaro che i testi pi`u datati di Istituzioni di Matematica sono ormai inutilizzabili per i nuovi corsi. Questi appunti sono nati come una sorta di “scaletta” per intraprendere lo studio dei principi del calcolo differenziale ed integrale. Negli anni, ho apportato molte correzioni, molti cambiamenti e parecchie aggiunte di materiale. Il materiale costituisce ormai un testo sufficientemente completo e dettagliato di analisi matematica di base. Ogni capitolo costituisce un argomento o una serie di argomenti affini, che costituiscono l’ossatura del corso di Matematica per la laurea di primo livello in Biotecnologie, Biologia, e pi`u generalmente in tutti i corsi dove non si debba insegnare il calcolo matriciale e vettoriale. In questa versione ho inserito, per completezza, un breve capitolo sulle serie numeriche (di numeri reali). Difficilmente c’`e il tempo per insegnare anche questo argomento, che in effetti sarebbe utile affrontare. Il capitolo sulle serie non e` comunque indispensabile alla comprensione del resto delle dispense. Gli argomenti trattati sono quelli classici, esposti nell’ordine pi`u classico:1 bre1
Recentemente, sono apparsi sul mercato testi, non ancora tradotti in italiano, che vantano una
vii
viii
vi richiami di insiemistica e di teoria elementare delle funzioni, successioni e loro limiti, limiti di funzioni e funzioni continue, derivazione, integrazione secondo Riemann. I prerequisiti sono quelli di ogni corso di matematica a livello universitario, e comprendono l’algebra delle scuole superiori, i principi della geometria analitica nel piano, le pi`u importanti formule della trigonometria e possibilmente la capacit`a di usare la logica elementare. Ho evitato, con una scelta che molti potrebbero ritenere azzardata o sbagliata, di appesantire il testo con esercizi, applicazioni ed esempi svolti. Non mi sono mai piaciuti i libri che definiscono – ad esempio – la derivata, e poi si dilungano per due pagine nel tentativo di spiegare quanto sia bella ed intuitiva la definizione di derivata. La bellezza e` soggettiva, e forse la vera bellezza della matematica sta nell’eleganza e nella concisione.2 Dozzine di finte applicazioni al mondo reale non sempre rendono la matematica pi`u bella agli occhi di uno studente. D’altronde, abbondano gli eserciziari e i libri di testo colmi di esercizi, svolti e non svolti. Quasi tutti quelli indicati in bibliografia ne sono ricchi, e suggeriamo agli studenti di farne uso. Nell’ultimo decennio, l’universit`a italiana ha subito molti cambiamenti. La (presunta) urgenza di aumentare il numero di laureati ha spinto il legislatore a ridurre e semplificare il percorso formativo degli studenti. Se prima avevamo – poniamo – cento laureati provenienti da lunghi corsi annuali di otto mesi, ora abbiamo centoventi laureati che hanno assorbito come spugne gli stessi contenuti esposti per`o superficialmente. Non e` difficile comprendere che i corsi di matematica generale per le lauree scientifiche hanno sopportato tagli ed abusi di ogni sorta. Allo stato attuale delle cose (ma si sa che al peggio non c’`e mai fine), l’antico corso di matematica che si estendeva da ottobre a giugno e` ridotto ad un corso di dodici settimane all inclusive. Per amore o per forza, il programma si e` apertamente sbilanciato verso il calculus delle universit`a americane. Studiando su alcuni libri italiani pi`u recenti, sembra che tutto si riduca a qualche tecnica di calcolo da apprendere alla stregua della ricetta per fare una torta. Questo approccio non sarebbe privo di utilit`a, purch´e al primo corso di calculus ne seguisse uno di mathematical analysis. Purtroppo (per chi scrive) o per fortuna (per chi deve ancora laurearsi), nel corso di laurea in biotecnologie non c’`e spazio per un corso avanzato di matematica. Queste dispense si propongono come un ragionevole compromesso fra la praticit`a del calcolo e il rigore dell’analisi matematica. presentazione dell’analisi matematica classica secondo un ordine “naturale”. Occorre dire che il cammino cronologico della matematica non rispecchia fedelmente quello dei capitoli delle nostre dispense. La derivabilit`a e` stata studiata euristicamente prima che si fosse capito il concetto di continuit`a. Per molti anni ha fatto scuola l’approccio alla Bourbaki, in cui la deduzione logica prevale sulla storia: se tutte le funzioni derivabili risultano continue, e` meglio allora spiegare innanzitutto che cosa sia una funzione continua. Personalmente penso che per fare matematica si pi`u conveniente apprenderne le basi secondo la dipendenza logica. Uno storico della matematica ha probabilmente un’opinione diversa in materia. 2 Salvo eccezioni doverose, quando una dimostrazione matematica diventa troppo lunga, articolata, suddivisa in pi`u e pi`u punti, aumenta considerevolmente il rischio che la dimostrazione contenga qualche errore.
ix
La teoria elementare delle successioni viene esposta come primo esempio per lo studio dei limiti. Infatti, la definizione di limite per una successione (di numeri reali) e` pi`u immediata di quella per una funzione reale di una variabile reale. Sebbene l’esperienza mi abbia dimostrato che le successioni non sono un argomento che eccita gli studenti, continuo a credere che cancellarle completamente dagli argomenti trattati sarebbe una perdita pi`u che un guadagno. Nelle prime pagine ho inserito alcuni cenni, volutamente superficiali e pratici, di logica booleana elementare. Di fatto, e` emerso che la pi`u grande difficolt`a per gli studenti del primo anno e` l’abitudine a trarre conclusioni logiche da ipotesi astratte o sperimentali. E` importante, in matematica, sapere che se un insieme di oggetti e` descritto dalla “sovrapposizione” di due o pi`u condizioni, gli oggetti che non cadono in questo insieme sono quelli che non soddisfano almeno una dell e suddette condizioni. Altrettanto inevitabile e` l’uso delle espressioni “per ogni” ed “esiste”, che appaiono praticamente in ogni teorema. Ho comunque preferito non usare la simbologia della logica, come ∀ al posto di “per ogni”, ∃ al posto di “esiste”, ⇒ al posto di “implica”. La definizione di continuit`a per una funzione f : [a, b] → R in x0 si leggerebbe (∀ε > 0)(∃δ > 0)(∀x ∈ [a, b])(|x − x0 | < δ ) ⇒ (| f (x) − f (x0 )| < ε). Qualunque studente inizia a barcollare di fronte a questa scrittura. Sebbene la notazione “logica” abbia un’eleganza fuori dall’ordinario, ho preferito attenermi a un linguaggio pi`u discorsivo. In alcuni casi, ho privilegiato notazioni e convenzioni minoritarie nella letteratura italiana. Per fare qualche esempio, ho usato sistematicamente la notazione operatoriale D f per la derivata di una funzione f . Quasi tutti scrivono f 0 , ma per uno studente forse e` meno evidente che la derivazione e` un’operazione applicata alle funzioni. Nel contesto delle successioni, ho usato l’aggettivo “divergente” come negazione di “convergente”. Ci`o contrasta con la tradizione italiana, che distingue le successioni divergenti (all’infinito) da quelle oscillanti fra due valori finiti o infiniti. Per essere espliciti, i testi italiani dicono che {n2 } e` una successione divergente, mentre {(−1)n } e` indeterminata. Capiter`a spesso, tuttavia, di scrivere o pronunciare frasi come “la successione pn tende all’infinito”, al posto della pi`u corretta “la successione pn diverge a infinito”. In questa versione aggiornata ho introdotto un breve paragrafo sull’integrazione indefinita. Coerentemente con l’impostazione adottata, mi limito a qualche cenno. La scelta di trascurare completamente questo argomento appariva forse arrogante e snob: se un matematico o un fisico possono giudicare perfino noiose le tecniche di calcolo delle primitive, un biotecnologo ha bisogno anche di imparare a fare qualche calcolo di routine. Il capitolo sull’integrazione secondo Riemann fornisce una trattazione pi u` ampia di quella presente in molti libri di testo. Difficilmente c’`e il tempo per discutere tutti i dettagli in aula, ma la scelta di riassumere l’integrazione definita in due o tre pagine di teoremi calati dall’alto non mi convince.
x
L’ultimo capitolo e` un assaggio di calcolo numerico e approssimato. Sono fortemente critico sull’opportunit`a di inserire questi argomenti in un corso di matematica generale. Delle due l’una: o si insegna un’analisi numerica rigorosa, fatta di teoremi e dimostrazioni, e allora occorrono molte ore di lezione; oppure si mostra qualche tecnica senza troppi dettagli, e allora servirebbe una ausilio informatico che renda interessanti i contenuti dal punto di vista sperimentale. Poich´e risulta impossibile, per varie ragione, attuare entrambe le alternative, forse sarebbe meglio recuperare delle ore per approfondire argomenti gi`a introdotti. Concludo con un’osservazione non particolarmente originale. La matematica e` come uno sport: senza esercizio non si fa molta strada. Si impara la matematica facendola, cio`e cimentandosi con gli esercizi proposti nelle esercitazioni, con le prove d’esame degli anni precedenti, con gli esercizi dei libri di testo consigliati, e anche sfruttando le ore di ricevimento dei docenti. L’uso della rete Internet non e` stato inserito fra le fonti principali di apprendimento. Mentre i libri di testo danno una garanzia di correttezza dei contenuti, la ricerca di materiale on line pu`o portare a spiacevoli sorprese. Consiglio pertanto di scaricare appunti e esercizi solo da siti ritenuti assolutamente affidabili. Con rammarico devo sconsigliare allo studente lo studio sui libri delle scuole superiori. In effetti, il concetto stesso di “dimostrazione rigorosa” appare molto vago in quei libri, e la validit`a di un teorema e` giustificata sovente con un paio di esempi. Ricordiamo, come scherzoso ammonimento, la storiella dei tre scenziati che viaggiano in treno: un ingegnere, un fisico e un matematico. Passando accanto a un recinto di pecore, il primo esclama: “Tutte le pecore sono bianche”. Il fisico lo corregge: “Tutte le pecore di questo prato sono bianche”. Interviene infine il matematico: “No, possiamo solo dire che esiste un prato in cui ci sono delle pecore, e queste pecore hanno almeno un lato bianco”. A volte si sente dire che il matematico e` quello scienziato a cui piacciono i controesempi pi`u degli esempi. Sono certo che molti dei miei studenti hanno letto fin qui nella speranza di trovare la frase che ogni Autore si sente in obbligo di inserire nell’introduzione alla propria opera: mi sono sforzato di rendere la matematica pi`u interessante, inserendo svariati esempi e modelli presi dalla realt`a. Si e` molto discusso sull’opportunit`a di seguire il metodo “Mary Poppins” per insegnare la matematica alle matricole.3 La mia opinione e` che gli argomenti trattati sono sufficientemente classici e spesso familiari da lasciare spazio a quel poco di rigore indispensabile in tutte le discipline scientifiche moderne. Propriet`a intellettuale del materiale Queste dispense sono rese pubbliche senza oneri aggiuntivi mediante pubblicazione sul sito internet dell’Autore: http://www.matapp.unimib.it/˜secchi. Sono consentiti l’uso e la riproduzione per scopi personali di studio e senza fini di lucro. E` altres`ı vietato apportare qualsiasi modifica al testo da parte di terzi. 3
Basta un poco di zucchero, e la pillola va gi`u.
xi
Di ogni errore e imprecisione e` responsabile l’autore. Ringrazio fin d’ora quanti vorranno segnalare considerazioni e commenti sul contenuto di queste dispense.
Ringraziamenti tecnico–informatici Queste dispense sono state redatte utilizzando il sistema di scrittura LATEX4 su computer dotati dei sistemi operativi Apple Mac OS “Leopard” e “Snow Leopard”. L’autore e` profondamente grato a Donald Knuth per aver creato a sviluppato il sistema di videoscrittura TEX, senza il quale la stesura di queste note sarebbe stata molto pi`u complicata. La variante LATEX e` stata costruita da Leslie Lamport, ed e` il “dialetto” utilizzato per scrivere queste dispense. Le figure sono state prodotte dall’autore mediante i programmi XFig5 e Maple.6 La figura 5.1 e` stata creata invece con il software Asymptote.7
Cant`u e Milano, dicembre 2010.
4 5 6 7
Si legge approssimativamente “latek”. L’URL di riferimento e` http://www.tug.org http://www.xfig.org Maple e` un marchio registrato di Maplesoft Inc. http://www.maplesoft.com http://asymptote.sourceforge.net
Capitolo 1
Insiemi e proprit`a dei numeri reali
1.1 Cenni di logica elementare Qualunque scienza esatta e` fondata sul ragionamento logico–deduttivo. Per noi, questo significa che seguiremo alcune leggi di calcolo con le proposizioni. Non avendo n´e l’obiettivo, n´e tantomeno il tempo per occuparci della relativa teoria, ci limiteremo a brevi cenni. Innanzitutto, gli oggetti delle nostra logica for dummies sono le proposizioni, cio`e frasi di senso compiuto. Indicheremo le proposizioni con lettere minuscolo, ad esempio p, q, r, ecc. Una proposizione potrebbe essere “se piove, prendo l’ombrello”, oppure “la mia squadra del cuore e` l’Inter”. Esattamente come i numeri sono gli atomi del calcolo numerico, le proposizioni sono i mattoni con cui costruire il linguaggio della matematica. Si pensi ad un teorema, che ha la forma “Se e` vera p, allora e` vera q”. Ogni proposizione assume, nella logica classica, due valori: vero (V) o falso (F).1 Esaminiamo rapidamente le principali operazioni con le proposizioni.
Definizione 1.1. Data una proposizione p, la sua negazione e` la proposizione ∼ p, che risulta vera quando p e` falsa, e falsa quando p e` vera. Quindi la sua tavola di verit`a e` p∼p V F F V
1
Gli informatici usano 1 per la verit`a e 0 per la falsit`a. Segnaliamo che esiste una logica, detta “fuzzy”, in cui una proposizione pu`o essere qualcosa di diverso da vero o falso.
1
2
1 Insiemi e proprit`a dei numeri reali
Ovviamente, la negazione di una proposizione si effettua seguendo l’intuizione: la negazione di “oggi piove” e` “oggi non piove”. Occorre prestare attenzione alle insidie del linguaggio comune. Infatti, sarebbe sbagliato affermare che la negazione di “oggi piove” e` “oggi c’`e il sole”. In effetti, potrebbe anche nevicare!
Definizione 1.2. Date due proposizioni p e q, la loro congiunzione p ∧ q (si legge: p e q) e` vera se e solo se sia p che q sono vere, e falsa in tutte le altre situazioni. La tavola di verit`a della congiunzione e` pertanto p V V F F
q p∧q V V F F V V F F
In pratica, congiungere due proposizioni significa metterle a sistema: in particolare, p ∧ (∼ p) e` sempre falsa.
Definizione 1.3. Date due proposizioni p e q, la loro disgiunzione p ∨ q (si legge: p o q) e` vera quando almeno una fra p e q e` vera, e falsa altrimenti. La tavola di verit`a risulta pertanto p V V F F
q V F V F
p∨q V V V F
Osservazione 1.1. Lo studente faccia attenzione: l’operazione di disgiunzione e` intesa in senso largo, non in senso esclusivo. Nel linguaggio comune, si usa “oppure” per escludere l’eventualit`a che entrambe le proposizioni siano vere. In matematica, “oppure” non esclude affatto la verit`a simultanea dei due argomenti. In particolare non e` contraddittorio dire che “2 e` un numero pari oppure 3 e` dispari”. Veniamo infine all’operazione su cui si costruiscono i teoremi: l’implicazione.
Definizione 1.4. Date due proposizioni p e q, l’implicazione p ⇒ q (si legge: p implica q, oppure “se p allora q”) risponde alla tavola di verit`a
1.1 Cenni di logica elementare
3
p V V F F
q p⇒q V V F F V V F V
Infine, scriveremo brevemente p ⇔ q (da leggere “p se e solo se q”, oppure “p equivale a q”) per indicare la proposizione (p ⇒ q) ∧ (q ⇒ p).
Lo studente legga bene la definizione precedente. Non e` proprio in li nea con le aspettative della nostra intuizione, soprattutto nel momento in cui si afferma che “falso implica falso” e` vero. In realt`a, viene semplicemente sostenuto che da un’ipotesi falsa pu`o essere tranquillamente dedotta una conclusione falsa. Si ricordi che la logica proposizionale non giudica il contenuto delle singole proposizioni, ma solo le regole con cui si opera su di esse. Come detto, i teoremi saranno sempre scritti nella forma, o in forme a questa rincoducibili, Se p allora q. Lo studente, per esercizio, scriva la tavola di verit`a di p ⇒ q e di (∼ q) ⇒ (∼ p). Il fatto che coincidano non e` casuale, ed anzi costituisce la tecnica di dimostrazione per antinomia. Concludiamo con qualche parola sui quantificatori.
Definizione 1.5. Il quantificatore universale ∀ si legge “per ogni”, mentre il quantificatore esistenziale ∃ si legge “esiste”.
I quantificatori permettono di comporre proposizioni articolate. Ad esempio (∀x ∈ R)(∃n ∈ N)(n > x) si legge “per ogni numero reale x esiste un numero naturale n tale che n e` maggiore di x”. Inoltre i quantificatori si negano scambiandoli: la negazione di “per ogni” e` “esiste”, e viceversa. La negazione della precedente proposizione e` dunque (∃x ∈ R)(∀n ∈ N)(n ≤ x), cio`e “esiste un numero reale x tale che, per ogni numero naturale n, risulta n e` minore o uguale a x”. Vediamo ora alcuni esempi. 1. Siano p = p(x) = (“x e` un numero negativo”) e q = q(x) = (“x2 ≥ 2”). Allora l’insieme E = {x ∈ R | p(x) ∧ q(x)} e` l’insieme dei numeri reali negativi, il
4
1 Insiemi e proprit`a dei numeri reali
cui quadrato e` pi`u grande (o uguale) di 2. Dunque stiamo descrivendo l’insieme √ (−∞, 2]. 2. Usando le rispettive tavole di verit`a, si verifica in pochi istanti che p ⇒ q e` logicamente equivalente a (∼ p) ∨ q. A parole, affermare che p implica q significa affermare che o l’ipotesi p e` falsa, oppure che e` vera la tesi q. In particolare, l’implicazione ⇒ non e` un concetto primitivo, alla pari di ∧ e ∨. 3. Descriviamo il complementare dell’insieme E = {x ∈ Z | x e` dispari e ex ≤ 7}. Posto p(x) = (“x e` dispari”) e q(x) = (“ex ≤ 7”), osserviamo che E = {x ∈ Z | p(x) ∧ q(x)}. Quindi il suo complementare e` , per definizione, Z \ E = {x ∈ Z |∼ p(x) ∧ q(x)} = {x ∈ Z | (∼ p(x)) ∨ (∼ q(x))} = {x ∈ Z | x e` pari oppure ex > 7}. Poich´e log 7 ≈ 1.9, abbiamo una descrizione esplicita del complementare: Z \ E = {x ∈ Z | x e` pari} ∪ (Z ∩ [2, +∞)). 4. Vogliamo negare la proposizione “Per ogni numero reale ε > 0 esiste un numero reale δ > 0 tale che la propriet`a P e` vera”. Seguendo le regole di negazione dei quantificatori, possiamo concludere che la negazione di questa proposizione e` “Esiste un numero reale ε > 0 tale che per ogni numero reale δ > 0 la propriet`a P e` falsa”. Nel seguito avremo occasione di applicare questo ragionamento abbastanza spesso. Lo studente interessato ad approfondire la logica elementare e il calcolo proposizionale, pu`o consultare il primo capitolo del libro [26]. Per una trattazione estremamente interessante, sebbene altrettanto puntigliosa, rimandiamo a [6].
1.2 Richiami di insiemistica Un noto proverbio recita: Chi ben comincia ha la met`a dell’opera.2 E` un modo gentile per sostenere che la parte pi`u difficile di ogni impresa e` l’inizio; il resto verr`a da s´e.3 L’apprendimento dela matematica non fa eccezione a questa regola, e addirittura si prendono delle scorciatoie. Alle scuole elementari tutti noi abbiamo imparato a fare i conticini, ma forse nessuno ha imparato la definizione di numero (intero positivo). Anche il concetto di insieme e` considerato, nella matematica elementare, come un concetto primitivo. Questo significa che non faremo alcuno sforzo per definirlo 2 Non e ` un errore di battitura, e` italiano arcaico. E` senz’altro pi`u diffusa la versione in italiano moderno: Chi ben comincia, e` a met`a dell’opera. 3 Cogliamo l’occasione per un interludio di sconfortante pignoleria, tipica dei matematici. Nessun proverbio e` una proposizione logicamente vera, n´e potrebbe esserlo. Nel nostro esempio, nulla vieta di cominciare bene e, tuttavia, fallire clamorosamente ben prima della met`a dell’opera. I proverbi appartengono alla tradizione popolare, si sostengono su basi puramente “statistiche” e di buon senso, e spesso hanno un fine consolatorio o moralistico.
1.2 Richiami di insiemistica
5
in termini di altri concetti gi`a noti. Brevemente, un insieme sar`a per noi un raggruppamento4 di oggetti di natura ben specificata. Parleremo pertanto dell’insieme delle automobili di colore rosso, come pure dell’insieme dei gatti dagli occhi verdi. Nota linguistica. Nelle principali lingue neolatine il sostantivo per indicare l’insieme matematico ha lo stesso significato doppio che ha in italiano. Infatti, si usa conjunto in spagnolo, ensemble in francese, insieme in italiano. Questo si rispecchia nel significato intuitivo che un insieme e` proprio un raggruppamento di oggetti, che sono “messi insieme”. Il rumeno si discosta leggermente con mult¸ime, chiaramente indicativo di una moltitudine di oggetti. In inglese, invece, si usa il sostantivo set, e si parla di set theory. Qui si coglie una sfumatura pi`u pragmatica, come a voler sottolineare che un insieme e` qualcosa che viene organizzato, disposto, quasi “pronto all’uso”. E` consuetudine5 denotare gli insiemi con lettere maiuscole dell’alfabeto latino: A, B,C, X,Y, Z, . . . Come detto, ogni insieme e` formato dai suoi elementi, di qualunque natura essi siano. In matematica, l’appartenenza di x all’insieme X e` indicato dal simbolo x ∈ X. Quindi, per ogni insieme X, risulta che6 X = {x | x ∈ X}. Il fatto che l’elemento x non appartiene all’insieme X, si esprime scrivendo x∈ / X.
Allo studente dovrebbero essere familiari le operazioni elementari sugli insiemi, cio`e l’unione, l’intersezione, il complementare di insiemi. Ricordiamo che
X ∪Y = {x | x ∈ X oppure x ∈ Y } X ∩Y = {x | x ∈ X e x ∈ Y } X c = {x | x ∈ / X} X \Y = {x | x ∈ X e x ∈ / Y }. 4
Oppure una collezione. In certi settori della matematica, capita di denotare un insieme con una lettera minuscola o addirittura con lettere di alfabeti non latini. 6 la sbarra verticale |, spesso sostituita dai due punti, si legge “tali che”. Quindi la scrittura seguente si legge “X e` l’insieme degli elementi x tali che x appartiene ad X”. 5
6
1 Insiemi e proprit`a dei numeri reali
Ovviamente, per poter parlare dell’insieme X \ Y e` necessario che Y ⊂ X, cio`e che ogni elemento di Y sia anche un elemento di X. Esempio 1.1. Siano X = {1, 2, 3, 4},
Y = {3, 4, 5, 6},
pensati entrambi come sottoinsiemi di N. Allora X ∪ Y = {1, 2, 3, 4, 5, 6}, X ∩ Y = {3, 4}. In generale, osserviamo che {x, x} = {x}, cio`e la ripetizione di un medesimo oggetto non altera la struttura dell’insieme. Di conseguenza, possiamo elencare lo stesso oggetto pi`u volte nella descrizione di un insieme, senza che questa ripetizione modifichi l’insieme considerato. La congiunzione “oppure” viene usata dai matematici in senso lato: x ∈ X ∪ Y significa che x appartiene ad almeno uno dei due insiemi X ed Y , ed eventualmente ad entrambi. Nella lingua italiana, l’affermazione “esco oppure resto a casa” e` interpretata in maniera esclusiva, essendo piuttosto improbabile che io possa essere contemporaneamente dentro e fuori casa. A volte pu`o capitare di dover scrivere proprio un’unione esclusiva, e in matematica si usa la scrittura X∆Y = {x | x appartiene a X o a Y ma non ad entrambi} = (X ∪Y ) \ (X ∩Y ). Il fatto che gli elementi di un insieme E appartengano anche a un (altro) insieme X si scrive
E ⊂X
oppure
X ⊃ E.
Osservazione 1.2. A scanso di equivoci, sottolineiamo che, per noi, scrivere E ⊂ X non esclude affatto che E = X. Alcuni testi usano il simbolo ⊂ in senso esclusivo, mentre usano E ⊆ X per dire quello che noi diciamo con E ⊂ X.7 Si tratta di convenzioni, e crediamo che il lettore di questi appunti non avr`a mai occasione per rimpiangere le convenzioni adottate. Probabilmente meno nota e` la costruzione del prodotto cartesiano di due insiemi. Nel nostro corso non avremo grandi occasioni di farne uso, ma preferiamo spendere qualche parola visti i legami con il piano cartesiano.
7
In parole povere, su molti libri E ⊂ X significa che ogni elemento di E appartiene anche ad X, ma E non coincide con X.
1.3 Insiemi numerici
7
Definizione 1.6. Dati due insiemi X ed Y , il loro prodotto cartesiano X × Y e` l’insieme i cui elementi sono coppie ordinate del tipo (x, y) dove x ∈ X ed y ∈ Y.
L’aggettivo “ordinate” si riferisce alla seguente propriet`a: due coppie (x, y) e (x0 , y0 ) sono uguali se e solo se x = x0 , y = y0 . Osservazione 1.3. Una coppia ordinata non e` un concetto davvero primitivo: la definizione pi`u maneggevole e` (x, y) = {{x}, {x, y}}. Ma questa definizione e` poco gradita alla gran parte degli studenti di matematica, che di solito imparano ad operare con le coppie ordinate senza problemi. Chiudiamo qui la nostra breve rassegna di teoria elementare degli insiemi per principianti. Ovviamente, i matematici si divertono ad approfondire, generalizzare, e quasi smembrare i concetti introdotti. La teoria degli insiemi (Set Theory in inglese) e` uno dei rami pi`u teorici e tecnici della matematica moderna. Lo studente che volesse approfondire ulteriormente le problematiche della moderna teoria degli insiemi, pu`o riferirsi all’appendice di [24].
1.3 Insiemi numerici Durante lo studio del nostro corso, lo studente si imbatter`quasi esclusivamente con insiemi di numeri. Ci sembra utile richiamare brevemente la terminologia dei principali insiemi numerici. L’insieme dei numeri naturali, i primi numeri che l’uomo ha utilizzato nella vita quotidiana, e` indicato dal simbolo N. Pertanto,8 N = {0, 1, 2, 3, 4, 5, 6, . . . }. Se a questi numeri aggiungiamo anche i numeri negativi, otteniamo l’insieme dei numeri interi relativi Z, cio`e Z = {. . . , −5, −4, −3, −2, −1, 0, 1, 2, 3, 4, 5, . . . }. La necessit`a di dividere fra loro dei numeri interi relativi ha spinto a costruire un insieme pi`u capiente di numeri, detti numeri razionali. Questi numeri sono moralmente le frazioni, cio`e i rapporti fra due numeri interi: il primo e` chiamato numeratore, e il secondo denominatore. Richiediamo che il denominatore sia diverso da zero. Precisamente, Alcuni libri di testo preferiscono escludere lo zero 0 da N. E` una scelta supportata solo dal proprio gusto. 8
8
1 Insiemi e proprit`a dei numeri reali
Q=
p | p, q ∈ Z, q 6= 0 . q
Daremo per scontati i discorsi sulla possibilit`a di scrivere lo stesso numero razione in infiniti modi diversi, sulla riduzione delle frazioni ai minimi termini, e cos`ı via.9 L’ultimo insieme numerico che introduciamo, e` anche quello pi`u importante. Purtroppo, la sua costruzione non e` affatto elementare, n´e e` possibile specificare semplicemente che cosa occorra aggiungere a Q per ottenerlo. Si tratta dell’insieme dei numeri reali R. Possiamo pensare a R come all’insieme dei punti di una retta.10 Nonostante questa difficolt`a tecnica, i numeri reali sono ormai parte integrante della cultura di qulunque studente delle scuole superiori. E` un dato di fatto che l’uso dei numeri reali e` di facilissimo apprendimento, senza dubbio agevolato dalla diffusione delle calcolatrici tascabili negli ultimi vent’anni. Gli sparuti studenti interessati a capire meglio come nascano rigorosamente i numeri reali, possono consultare uno dei testi indicati in bibliografia, ad esempio [4, 9]. Non ci sembra il caso di insistere sul fatto che11 N ⊂ Z ⊂ Q ⊂ R. Nell’affrontare la teoria dei limiti, ci sar`a utile la seguente propriet`a dei numeri naturali rispetto ai numeri reali. La dimostrazione pu`o essere letta in [30].
Proposizione 1.1 (Propriet`a archimedea dei numeri reali). Per ogni y ∈ R ed ogni x > 0 reale, esiste n ∈ N tale che nx > y.
Per i nostri scopi, applicheremo quasi esclusivamente il seguente Corollario 1.1. Per ogni numero reale x > 0, esiste un numero naturale n tale che n > x. Dimostrazione. Ovviamente e` una conseguenza diretta della Proposizione precedente. Per`o si dimostra12 anche in modo elementare: immaginiamo che x sia scritto 9
Algebricamente, Q e` il primo insieme numerico, a parte l’ovviet`a della costruizione di Z, costruibile in maniera elementare ma non banale. Precisamente, i numeri razionali sono delle classi di equivalenza di coppie ordinate di numeri interi con segno. Se lo studente non ha capito nemmeno una parola dell’ultima frase, non e` grave. In parole povere, la frazione 1/2 e` la coppia ordinata (1, 2), e il fatto che 1/2 = 2/4 = 3/6 = . . . si rispecchia nell’introduzione di una “regola”, la relazione di equivalenza, che considera uguali le coppie (1, 2), (2, 4), (3, 6), ecc. 10 Circa mezzo secolo fa, Walter Rudin osservava nella prefazione del suo libro [30] che la maggior parte degli studenti non sente la necessit`a di costruire l’insieme dei numeri reali, almeno in prima battuta. 11 In realt` a, non si tratta di vere inclusioni insiemistiche; piuttosto dovremmo parlare di immersioni. 12 Per un matematico, questa non e ` affatto una dimostrazione. Il punto e` che non possiamo dare per scontato che ogni numero reale abbia una ed una sola rappresentazione decimale. So che, per molti studenti del primo anno, questa problematica sembra risibile, ma non lo e` .
1.3 Insiemi numerici
9
nella sua espansione decimale, e “arrotondiamolo” al numero intero n successivo. Per esempio, se x = 1475.1234567, lo arrotondiamo a n = 1476. Questo numero naturale n e` quello cercato. t u Una propriet`a meno nota (fra gli studenti, ovviamente) dei numeri reali e` la seguente.
Proposizione 1.2. Fra due numeri reali qualsiasi e distinti, cade sempre un numero razionale. Non esponiamo la dimostrazione di questo fatto, che il lettore interessato potr`a studiare in [30]. Ci limitiamo ad osservare che da questa proposizione deriva la possibilit`a di approssimare, con errore scelto a piacere, ogni numero reale con un numero razionale. Infatti, sia x un numero reale, e sia ε > 0 l’errore con cui vogliamo approssimare x mediante un numero reale. Dalla Proposizione precedente, applicata ai due numeri reali distinti x − ε e x + ε, deduciamo c he esiste un numero razionale q tale che x − ε ≤ q ≤ x + ε. Pertanto |x − q| ≤ ε, come volevasi dimostrare. Nota tipografica: simboli altrettanto diffusi per denotare i precedenti insiemi numerici sono N, Z, Q e R. Concludiamo questo paragrafo con alcune considerazioni sul valore assoluto di un numero reale.
Definizione 1.7. Il valore assoluto (spesso detto anche modulo) di un numero reale x e` definito come ( x, se x ≥ 0 |x| = −x, se x < 0
Operativamente, la definizione del valore assoluto di un qualsiasi numero reale x e` basata sul controllo del segno di x. Se x e` positivo o nullo, viene restituito il valore x. Se x e` negativo, viene restituito il valore −x. Qualche volta si trova scritto che “|x| e` il numero x, senza segno”. Questa affermazione e` suggestiva ma priva di senso: tutti i numeri reale hanno un segno!
Lemma 1.1. Per ogni x, y, z ∈ R, vale la disuguaglianza triangolare |x − y| ≤ |x − z| + |z − y|.
(1.1)
10
1 Insiemi e proprit`a dei numeri reali
Dimostrazione. Basta dimostrare che, per ogni a, b ∈ R, vale la disuguaglianza |a + b| ≤ |a| + |b|.
(1.2)
Infatti, scegliendo a = x − z e b = z − y, da questa segue subito |x − z + z − y| = |x − y| ≤ |x − z| + |z − y|, che e` la tesi. Siano quindi a e b due numeri reali qualunque. Distinguiamo vari casi. 1. Se a = 0 oppure b = 0, la tesi e` ovvia. 2. Se a > 0 e b > 0, allora a + b ≥ 0. Vogliamo dimostrare che a + b ≤ a + b, ma questo e` ovvio. 3. Se a < 0 e b < 0, allora a + b < 0. Pertanto vogliamo dimostrare che |a + b| = −a − b ≤ −a − b, e ancora una volta questa relazione e` ovvia. 4. Se i due numeri a e b sono l’uno positivo e l’altro negativo, a primo membro di (1.2) abbiamo la differenza fra due numeri positivi, e a secondo membro abbiamo la loro somma. Ovviamente il primo membro e` minore del secondo. Avendo verificato la tesi in tutti i casi possibili, la dimostrazione e` completa. t u Concludiamo con qualche informazione sulle diseguaglianze che coinvolgono i valori assoluti. Lo studente apprezzer`a queste informazioni leggendo il capitolo sui limiti.
Lemma 1.2. Per ogni ε > 0, {x ∈ R : |x| ≤ ε} = {x ∈ R : −ε ≤ x ≤ ε} {x ∈ R : |x| ≥ ε} = {x ∈ R : x ≤ −ε} ∪ {x ∈ R : x ≥ ε}
Dimostrazione. Dimostriamo la prima uguaglianza. Essendo un’uguaglianza fra due insiemi, occorre dimostrare la doppia inclusione. Sia dunque x un numero reale tale che |x| ≤ ε. Questo vuol dire che x ≤ ε se x ≥ 0, e che −x ≤ ε se x < 0. Nel primo caso, 0 ≤ x ≤ ε, nel secondo −ε ≤ x < 0. L’insieme delle “soluzioni” sar`a l’unione di queste condizioni, cio`e −ε ≤ x ≤ ε. Abbiamo dimostrato che {x ∈ R : |x| ≤ ε} ⊂ {x ∈ R : −ε ≤ x ≤ ε} Viceversa, sia x un numero reale tale che −ε ≤ x ≤ ε. Allora |x| e` un numero reale, non negativo, non superiore a ε. Quindi {x ∈ R : |x| ≤ ε} ⊃ {x ∈ R : −ε ≤ x ≤ ε} e pertanto i due insiemi a primo e a secondo membro coincidono. Lasciamo allo studente la verifica della seconda uguaglianza, imitando i ragionamenti appena visti. t u
1.4 Topologia della retta reale
11
Passando dai simboli alle parole, il Lemma precedente ci dice che la relazione |x| ≤ ε equivale a −ε ≤ x ≤ ε. Similmente, la relazione |x| ≥ ε equivale a x ≤ −ε
oppure
x ≥ ε.
Osservazione 1.4. Occorre fare attenzione quando si utilizzano quantit`a arbitrarie. Ad esempio, se x e` un numero reale tale che |x| < ε per ogni ε > 0, allora x = 0. Se infatti x fosse diverso da zero, allora potremmo scegliere ε = |x|/2 e avremmo la contraddizione |x| ≥ ε. A parole, stiamo dicendo che l’unico numero non negativo arbitrariamente piccolo e` lo zero.
1.4 Topologia della retta reale In questa breve sezione, il lettore vedr`a delle idee e dei simboli certamente gi`a noti fin dalle scuole medie. Eppure, dubitiamo che i professori delle scuole medie gli abbiano mai parlato di topologie. La topologia13 e` un ramo della matematica che si occupa di studiare in astratto il concetto di “forma”. In che senso possiamo deformare un oggetto di gomma, cambiandone l’aspetto esteriore, senza per`o dire che si rtatta di un oggetto differente? A questa e ad altre domande tenta di rispondere proprio la topologia. Ovviamente, i nostri numeri reali sono un caso molto particolare di “spazio topologico”, e noi ci accontenteremo di formalizzare alcuni concetti utili nel resto del corso. Definizione 1.8. Siano a e b due numeri reali. Diciamo che a < b (a e` minore di b) se b − a e` un numero positivo. Se b − a e` un numero negativo, diremo al contrario che a > b. Il simbolo a ≤ b indica il fatto che b − a e` positivo oppure zero, e analogamente a ≥ b. 14
Definizione 1.9. Sia E ⊂ R un sottoinsieme dei numeri reali. Un numero M ∈ R e` un maggiorante per E se 13
Dal greco topos e logos, dunque “conoscenza della forma”. Questa definizione, a pensarci bene, fatica a stare in piedi. Come definire un numero positivo x, se non chiedendo che x > 0? E` un circolo vizioso. Tuttavia, speriamo che lo studente sappia distinguere un numero positivo da uno negativo in maniera quasi inconscia. 14
12
1 Insiemi e proprit`a dei numeri reali
x≤M
per ogni x ∈ E.
Analogamente, un numero m ∈ R e` un minorante per E se x≥m
per ogni x ∈ E.
Un insieme E di numeri reali e` limitato dall’alto se possiede un maggiorante, mentre e` limitato dal basso se possiede un minorante.
Per esempio, N e` limitato dal basso poich´e ogni numero naturale e` maggiore o uguale a zero. Tuttavia N non e` limitato dall’alto, perch´e esistono numeri naturali grandi quanto vogliamo.
Definizione 1.10. Sia E un sottoinsieme di R, limitato dall’alto. L’estremo superiore di E, denotato con sup E, e` definito come il pi`u piccolo di tutti i maggioranti di E. Analogamente, l’estremo inferiore di E, inf E, e` definito come il pi`u grande di tutti i minoranti di E.
Osservazione 1.5. In generale, inf E e sup E non appartengono ad E. Si confronti con la definizione di minimo e massimo nelle prossime pagine. A differenza dei maggioranti e minoranti, gli estremi inferiore e superiori di un insieme limitato esistono sempre. Si tratta di una propriet`a fondamentale di R, che ci limitiamo ad enunciare.
Teorema 1.1. Ogni sottoinsieme limitato di R possiede estremo inferiore e superiore.
Sar`a comodo, nel seguito, usare delle notazioni meno rigide per inf e sup. Ad esempio, scriveremo 1 inf = 0 n∈N n invece di
inf
1 | n ∈ N = 0. n
1.4 Topologia della retta reale
13
La prima notazione, che sembra interpretare inf come un’operazione sui numeri invece che sugli insiemi, fa il paio con la notazione per le unioni e le intersezioni di insiemi. Infatti, se A1 , A2 e A3 sno tre insiemi qualsiasi, si scrive 3 [
Ai
i=1
invece di [
{A1 , A2 , A3 } =
[
A j | i ∈ {1, 2, 3} .
Queste notazioni abbreviate hanno qualche risvolto curioso. Se E e` un insieme di numeri reali, la scrittura sup x x∈E
coincide in tutto e per tutto con sup E, ma questa volta non possiamo dire che sia preferibile. Ne traiamo una morale: le notazioni con il pedice sono preferibili quando l’insieme su cui agiscono inf e sup hanno una descrizione di tipo “funzionale” { f (x) | x ∈ E}. Per un approfondimento delle notazioni insiemistiche, consigliamo il libro di P. Halmos [20] e quello di J. Kelley [24]. In quest’ultimo si suggerisce anche la notazione E x2 < 1 x∈R
per significare l’insieme {x ∈ R | x2 < 1}. Possiamo ritenerci fortunati che questa notazione non abbia mai preso piede!
Lemma 1.3. M ∈ R e` l’estremo superiore di E se e solo se 1. M ≥ x per ogni x ∈ E; 2. per ogni ε > 0 esiste x ∈ E tale che M − ε ≤ x.
Una caratterizzazione analoga vale per l’estremo inferiore.
Lemma 1.4. m ∈ R e` l’estremo inferiore di E se e solo se 1. m ≤ x per ogni x ∈ E; 2. per ogni ε > 0 esiste x ∈ E tale che x ≤ m + ε.
Spendiamo qualche parola sul significato di questi lemmi. Il primo, ad esempio, ci dice che l’estremo superiore di un sottoinsieme E di R e` quel numero M che innanzitutto e` un maggiorante. E, in secondo luogo, ci devono essere elementi di E vicini a piacere a M.
14
1 Insiemi e proprit`a dei numeri reali
Dimostrazione. Proponiamo per esteso la dimostrazione nel caso dell’estremo inferiore: lo studente dovrebbe riuscire ad adattare gli argomenti al caso dell’estremo superiore. Sia dunque m = inf E: dobbiamo verificare le propriet`a 1 e 2 del Lemma. Poich´e m e` il pi`u grande dei minoranti di E, la propriet`a 1 e` vera. Fissiamo arbitrariamente ε > 0, consideriamo il numero m + ε. Poich´e m + ε > m, m + ε non pu`o essere un minorante di E: altrimenti, sarebbe un minorante pi`u grande di inf E, e questo e` in contraddizione con la definizione di estremo inferiore. Negando la definizione di minorante, deduciamo che deve esistere almeno un elemento x ∈ E tale che x ≤ m + ε. Abbiamo cos`ı dimostrato anche la propriet`a 2. Viceversa, supponiamo che m ia un numero che gode delle propriet`a 1 e 2 del Lemma, e mostriamo che necessariamente m = inf E. Dalla propriet`a 1, m e` un minorante di E: ci basta far vedere che deve essere il pi`u grande minorante. Supponiamo che non lo sia, cio`e che esista un minorante m0 > m. Quindi x ≥ m0 per ogni x ∈ E. Di conseguenza, posto ε = m0 − m > 0, nell’intervallo [m, m + ε) non possono cadere elementi di E, in contraddizione con la propriet`a 2. Concludiamo che m deve essere il pi`u grande fra tutti i minoranti di E, e dunque m = inf E. Definizione 1.11. Sia E un sottoinsieme limitato (dall’alto e dal basso) di R, e poniamo m = inf E, M = sup E. Diciamo che m e` il minimo di E se m ∈ E, e che M e` il massimo di E se M ∈ E. Notiamo che questa definizione non e` superflua. Nessuno ci garantisce che l’estremo superiore di un insieme sia un elemento di tale insieme. In generale, e` solo un numero reale. Quindi, l’estremo superiore diventa il massimo esattamente quando appartiene all’insieme in considerazione. Simili considerazioni valgono ovviamente per l’estremo inferiore. Definizione 1.12. Siano a < b due numeri reali. Gli insiemi (a, b) = {x ∈ R | a < x < b} [a, b] = {x ∈ R | a ≤ x ≤ b} [a, b) = {x ∈ R | a ≤ x < b} (a, b] = {x ∈ R | a < x ≤ b}.
si chiamano rispettivamente intervallo aperto, chiuso, chiuso a sinistra, chiuso a destra, di estremi a e b. Osservazione 1.6. Per ricordare queste definizioni, possiamo dire che la parentesi quadra corrisponde ad un estremo compreso, mentre quella tonda corrisponde ad un estremo escluso. Alcuni libri usano la notazione ]a, b[ al posto di (a, b), ecc.
Definizione 1.13. Sia x0 ∈ R un numero reale fissato. Si chiama intorno di x0 qualunque intervallo aperto (a, b) tale che x ∈ (a, b).
1.5 L’infinito
15
Quindi ogni numero reale possiede infiniti intorni. Spesso conviene utilizzare intorni simmetrici, della forma (x0 − δ , x0 + δ ), dove δ > 0 si chiama raggio dell’intorno. Esercizio. Invitiamo lo studente a dimostrare che, se E = (a, b), allora inf E = a, sup E = b. Inoltre, inf[a, b) = a = min[a, b), e sup[a, b) = b, ma b non e` il massimo di [a, b).
1.5 L’infinito Nello studio dell’analisi matematica, lo studente si imbatte in un concetto assolutamente nuovo: quello di infinito. Mentre Algebra e Geometria elementari si occupano di quantit`a finite (numeri, rette, piani, ecc.), l’Analisi vuole formalizzare l’idea vaga di avvicinarsi indefinitamente a qualcosa. Introduciamo in questa sezione, secondo una logica assai pratica, il simbolo ∞ e il suo significato. Definizione 1.14. Per i nostri scopi, ∞ e` un simbolo privo di significato numerico. Invitiamo il lettore a trattenere il sorriso sarcastico che la definizione precedente potrebbe generare.15 Chiunque abbia studiato per qualche tempo la filosofia antica e medioevale ricorda certamente gli sforzi e le acrobazie messi in atto dai pensatori per motivare il conceto di infinito: qualcosa senza limiti spaziali o temporali, addirittura un ente metafisico vicino alla divinit`a. Nell’economia del nostro corso, non serve definire rigorosamente il simbolo ∞. A noi interessa piuttosto usare ∞ come abbreviazione per esprimere concetti gi`a noti. Si tratta dunque di stipulare opportune convenzioni nelle quali ∞ e` una mera abbreviazione tipografica, quasi un simbolo stenografico. Per esempio, se un insieme E ⊂ R non e` limitato dall’alto, si conviene di scrivere sup E = +∞. e se E non e` limitato dal basso, inf E = −∞. In particolare, +∞ sembra nascondere l’idea di muoversi indefinitamente verso destra lungo la retta (orientata) dei numeri reali. Per analogia, −∞ significa in qualche senso muoversi indefinitamente verso sinistra su tale retta. Vogliamo per`o mettere in guardia lo studente dal compiere un errore fra i pi`u frequenti ed ingenui: +∞ e −∞ non sono numeri reali! In particolare, ad essi non si applicano le consuete operazioni algebriche di somma, sottrazione, moltiplicazione e divisione.16 15 Chi scrive, ricorda una definizione sul proprio libro di Algebra, in cui si diceva “... dove x e ` un simbolo al quale non attribuiremo alcun significato”. 16 Sappiamo che qualche studente pi` u esperto potrebbe dire che, con i limiti, si fanno le operazioni su ∞. Questo e` parzialmente vero, e in certe discipline conviene definire 0 · ∞ = 0. L’esistenza
16
1 Insiemi e proprit`a dei numeri reali
Vogliamo tuttavia ricordare che la Matematica moderna introduce il concetto di infinito anche con significati diversi. In Geometria Proiettiva e in Analisi Complessa si parla altrettanto spesso di infinito, sebbene da un punto di vista pi`u geometrico. ¯ = R∪ Osservazione 1.7. Molti libri introducono la cosiddetta retta reale estesa R {−∞} ∪ {+∞}, ottenuta aggiungendo ai consueti numeri reali i due infiniti dotati di segno. Ovviamente, si richiede che, per ogni numero reale x, −∞ < x < +∞. ¯ estendendo le quattro operazioni: E` possibile una (parziale) aritmetizzazione di R per ogni x ∈ R si definisce x + ∞ = +∞, x − ∞ = −∞ +∞ + ∞ = +∞, −∞ − ∞ = −∞ e
( +∞ x · (+∞) = −∞ (+∞) · (+∞) = +∞,
se x > 0 se x < 0,
( −∞ x · (−∞) = +∞
(+∞) · (−∞) = −∞,
se x > 0 se x < 0,
(−∞) · (−∞) = +∞.
Non si d`a invece alcun senso alle scritture +∞ − ∞,
−∞ + ∞.
Il caso 0 · (±∞) e` particolare: esistono settori della matematica in cui conviene porre 0 · (±∞) = 0, ad esempio la Teoria della Misura. Nell’Analisi Matematica elementare, e` opportuno evitare di definire questo prodotto, poich´e creerebbe pericolose confusioni al calcolo dei limiti. Per uno studente di un primo corso di matematica, l’uso della retta reale estes a non presenta particolari utilit`a, e nel resto delle dispense non utilizzeremo mai questo ambiente numerico. Osservazione 1.8. Le potenze “ad esponente infinito” sono pi`u problematiche da definire. Innanzitutto, elevare un numero negativo ad una potenza infinita appare incoerente, poich´e gi`a in ambito reale non si definiscono potenze con base negativa ed esponente reale qualsiasi. In secondo luogo, per rispettare l’intuizione, e` necessario distinguere fra basi maggiori di 1 e basi minori di 1. Ad esempio, si pu`o definire se 0 < x < 1 0 +∞ x = 1 se x = 1 +∞ se x > 1. Per analogia, delle forme di indecisione ci lascia per`o intendere che in questa definizione il simbolo ∞ ha un significato diverso da quello che gli abbiamo finora attibuito.
1.6 Punti di accumulazione
17
+∞ se 0 < x < 1 x−∞ = 1 se x = 1 0 se x > 1. Lo studente deve prestare particolare attenzione ai casi 1+∞ e 1−∞ . In questa aritmetizzazione, il valore di tali espressioni e` 1. Fra poche pagine incontreremo la forma indeterminata [1∞ ], e ci convinceremo che per l’ordinaria teoria dei limiti questa e` davvero una forma indeterminata, poich´e tutti i risultati sono possibili. C’`e dunque una contraddizione? No, perch´e la teoria dei limiti che studieremo e` ambientata in R. Morale della favola: e` difficile utilizzare coerentemente l’infinito nel calcolo numerico, e quasi sempre si fa meglio a rinunciare. L’infinito non e` un numero, e non possiamo aspettarci di costringerlo ad esserlo.
1.6 Punti di accumulazione Introduciamo un concetto che appartiene di diritto alla matematica moderna e che permette notevoli semplificazioni nei discorsi che faremo pi`u avanti.
Definizione 1.15. Sia E un sottoinsieme di R. Diremo che il punto x0 ∈ R e` un punto di accumulazione per l’insieme E se, preso un qualsiasi intorno I di x0 , si verifica che (I \ {x0 }) ∩ E 6= 0. / A parole, ogni intorno I di x0 contiene un punto di E, diverso da x0 .
Per esempio, il punto x0 = 0 e` di accumulazione per 1 1 1 1 E = 1, , , , . . . , , . . . . 2 3 4 n Infatti, sia I = (a, b) un intorno di 0; in particolare a < 0. Scegliamo n naturale tale che 1/n < b. Perci`o 1/n ∈ I ∩ E, e poich´e 1/n 6= 0 abbiamo verificato la nostra affermazione. Lo studente potr`a verificare senza sforzo che i punti di accumulazione per un intervallo chiuso qualsiasi [a, b] sono tutti e soli i punti di [a, b]. Invece, i punti di accumulazione di un intervallo aperto (a, b) sono i punti di [a, b] (ci sono anche i punti a e b!). Un esempio di natura opposta e` il seguente. L’insieme N ⊂ R non possiede punti di accumulazione. Infatti, se scegliamo un qualsiasi numero naturale n ∈ N, l’intorno I = (n − 1/2, n + 1/2) non contiene alcun numero naturale ad eccezione di n stesso. Per mettere ulteriormente in luce il senso dell’esclusione del punto x0 nella definizione di punto di accumulazione, consideriamo l’insieme E = {0} ∪ (1, 2). A parole, E e` composto dal singolo punto 0 e dall’intervallo aperto (1, 2). Domanda: quali sono i punti di accumulazione di E?
18
1 Insiemi e proprit`a dei numeri reali
La risposta e` che i punti di accumulazione di E sono esattamente i punti dell’intervallo [1, 2]. Infatti, il punto “isolato” 0 non pu`o essere di accumulazione, visto che ogni suo intorno (−δ , δ ) con δ < 1 interseca E solo nel punto 0 stesso. Torneremo su questi concetti quando avremo a disposizione il linguaggio delle successioni. Pu`o essere utile, in certi casi, adattare al simbolo ∞ alcuni concetti propri dei punti al finito. Ad esempio, un intorno di +∞ e` un qualsiasi intervallo della forma (a, +∞), e similmente un intorno di −∞ e` un qualsiasi intervallo della forma (−∞, b). Lasciamo allo studente il seguente spunto di riflessione: se E e` un sottinsieme di R, quando +∞ e` un punto di accumulazione per E? E quando lo e` −∞? Le risposte sono abbastanza semplici. In particolare, lo studente si convincer`a che +∞ e` un punto di accumulazione per E = N, l’insieme dei numeri naturali.
1.7 Appendice: la dimostrazione per induzione Nello studio del calcolo, si incontrano spesso identit`a e formule che coinvologno i numeri naturali. Cerchiamo di formalizzare un metodo di dimostrazione valido in queste situazioni. Supponiamo che, per ogni valore dell’indice naturale n, P(n) sia una proposizione logica. Supponiamo inoltre di poter dimostrare le seguenti affermazioni: 1. esiste n0 ∈ N tale che P(n0 ) e` vera; 2. Se e` vera P(n), allora e` vera anche P(n + 1). Le propriet`a dell’insieme N dei numeri naturali permettono di dimostrare che la proposizione P(n) e` allora vera per ogni n ≥ n0 . A parole, per dimostrare la validit`a di un’affermazione per ogni n naturale, basta dimostrarla per n = 1, e poi dimostrare che la validit`a di P(n) implica la validit`a di P(n + 1). Cerchiamo di chiarire il concetto con un esempio. Esempio: la disuguaglianza di Bernoulli. Dimostriamo che (1 + x)n ≥ 1 + nx,
per ogni x > −1 e per ogni n ∈ N.
Procediamo per induzione sul numero naturale n. Per n = 1, dobbiamo dimostrare che 1 + x ≥ 1 + x, il che e` palesemente vero. Supponiamo che la disuguaglianza sia vera per n, e dimostriamo che deve essere vera anche per n + 1. Quindi, per ipotesi, (1 + x)n ≥ 1 + nx,
per ogni x > −1 e per ogni n ∈ N.
Che cosa dobbiamo dimostrare? Scriviamo n + 1 al posto di n nella disuguaglianza di Bernoulli, e troviamo (1 + x)n+1 ≥ 1 + (n + 1)x.
1.7 Appendice: la dimostrazione per induzione
19
Questo e` il nostro obiettivo. Ma (1 + x)n+1 = (1 + x)n (1 + x) ≥ (1 + nx)(1 + x) = 1 + x + nx + nx2 ≥ 1 + x + nx = 1 + (n + 1)x. Osserviamo che abbiamo usato la validit`a della disuguaglianza per n e abbiamo trascurato il termine nx2 ≥ 0 nell’ultimo passaggio. Il principio di induzione garantisce allora che la disuguaglianza di Bernoulli e` sempre vera.17 Esempio: somme di quadrati. Vogliamo dimostrare l’identit`a18 n−1
∑ k2 = k=1
n(n − 1)(2n − 1) . 6
(1.3)
Procediamo per induzione su n. Per n = 2,19 l’identit`a si riduce a 12 =
2·1·3 = 1. 6
Supponiamo che l’identit`a sia vera per n, e dimostriamo che deve essere vera anche per n + 1. Per n + 1, il primo membro di (1.3) diventa n
n−1
∑ k2 = ∑ k2 + n2 , k=1
k=1
e sfruttando l’ipotesi per n possiamo scrivere n
n−1
∑ k2 =
∑ k 2 + n2 =
k=1
k=1
n(n − 1)(2n − 1) + n2 . 6
Se togliamo le parentesi a secondo membro e mettiamo a denominatore comune, troviamo dopo qualche passaggio elementare n(n − 1)(2n − 1) n(n + 1)(2n + 1) + n2 = , 6 6 espressione che coincide con il secondo membro di (1.3) in cui n e` rimpiazzato da n + 1. Questo significa esattamente che la nostra identit`a continua a valere anche per n + 1, e dunque il procedimento per induzione e` terminato.20 17
La condizione x > −1 e` stata usata nel passaggio (1 + x)n (1 + x) ≥ (1 + nx)(1 + x). Se il termine 1 + x fosse negativo, dovremmo invertire il senso della disuguaglianza, e il ragionamento perderebbe validit`a. 18 L’estremo superiore n − 1 appare in questa forma perch´ e ci servir`a in un esempio nel capitolo sull’integrale di Riemann. 19 Poich´ e l’estremo n − 1 della somma deve essere almeno pari a quello inferiore, occorre chiedere che n − 1 ≥ 1, cio`e n ≥ 2. 20 La prima curiosit` a di molti studenti e` chi abbia “indovinato” l’identit`a (1.3). Infatti, la dimo2 strazione per induzione non e` costruttiva, e non serve a dedurre quanto valga ∑n−1 k=1 k . Se nessuno ci scrivesse la formula, per induzione non riusciremmo mai a ricostruirla. Questo tipo di formule erano il divertimento di matematici del calibro di F. Gauss, che era solito calcolarle da bambino,
20
1 Insiemi e proprit`a dei numeri reali
1.8 Appendice: una costruzione dei numeri reali Questa sezione, da ritenersi del tutto facoltativa e riservata agli studenti pi`u coraggiosi, e` dedicata alla costruzione del campo dei numeri reali. Se, da una parte, e` innegabile che poche matricole sentono l’impellente necessit`a di definire rigorosamente i numeri reali, dall’altra sembra istruttivo toccare con mano quanto possa essere complicato dare un senso matematicamente consistente ad oggetti che non facciamo fatica a concepire ed utilizzare. Parlando in modo un po’ vago, esiste un solo campo dei numeri reali, ma esistono varie costruzioni di tale campo. In pratica questo vuol dire che, qualunque sia la costruzione di R che ci piace di pi`u, non corriamo il rischio di perdere alcuna propriet`a: e` un’applicazione matematica del motto “tutte le strade portano a Roma”! L’approccio che presentiamo e` quello delle sezioni di Dedekind (“Dedekind cuts” in inglese), e seguiamo quasi alla lettera la presentazione di Rudin [30]. Definizione 1.16. Una sezione di Dedekind e` un qualunque insieme α ⊂ Q che goda delle seguenti propriet`a: (I) α non e` vuoto, e α 6= Q; (II) se p ∈ α, q ∈ Q e q < p, allora q ∈ α; (II) se p ∈ α, allora p < r per qualche r ∈ α. L’insieme di tutte le sezioni di Dedekind si chiama R. Le lettere p, q, r . . . denoteranno sempre dei numeri razionali, mentre le lettere greche α, β , γ . . . denoteranno delle sezioni. La propriet`a (III) dice semplicemente che una sezione non ha massimo, mentre la (II) dice che una sezione contiene tutti numeri razionali pi`u piccoli di un elemento qualunque della sezione stessa. Geometricamente, possiamo immaginare che una sezione sia una specie di semiretta composta da numeri razionali, estesa indefinitamente verso sinistra (ma non verso destra). Definiamo ora un ordinamento sulle sezioni, dicendo cio`e quando una sezione e` minore di un’altra. Definizione 1.17. Siano α e β due sezioni. Scriviamo che α < β se α e` un sottoinsieme proprio di β . Questa relazione < e` un ordinamento totale, nel senso precisato dalla seguente Proposizione. Proposizione 1.3. Se α e β sono due sezioni, allora vale al pi`u una desse seguenti relazioni: α < β , α = β , β < α. mentre il maestro spiegava un’aritmetica evidentemente troppo noiosa. Nel libro di M. Spivak, Calculus, c’`e un esercizio del primo capitolo che suggerisce un metodo costruttivo per calcolare somme finite come quella appena vista.
1.8 Appendice: una costruzione dei numeri reali
21
Dimostrazione. Supponiamo che le prime due relazioni siano false, e dimostriamo che deve essere necessariamente vera la terza. Quindi α non e` un sottoinsieme proprio di β , cio`e esiste p ∈ α con p ∈ / β . Se q ∈ β , allora q < p (poich´e p ∈ / β ), e quindi q ∈ α per la (II). Perci`o β ⊂ α. Poich´e β 6= α, si pu`o concludere che β < α. t u Questa propriet`a dell’ordinamento implicher`a, a tempo debito, che due numeri reali possono sempre essere confrontati. Sembra ovvio, ma matematicamente non lo e` . Proposizione 1.4. L’insieme ordinato R ha la propriet`a dell’estremo superiore: ogni sottoinsieme non vuoto e limitato dall’alto di R possiede estermo superiore. Dimostrazione. Sia A un sottoinsieme di R, non vuoto e limitato dall’alto. Supponiamo che β ∈ R sia un maggiorante di A. Sia γ l’uonione di tutti le sezioni α ∈ A. In altre parole, p ∈ γ se e solo se p ∈ α per qualche α ∈ A. Dimostreremo che γ = sup A. Innanzitutto, dimostriamo che γ ∈ R. Poich´e A e` non vuoto, esiste almeno una sezione α0 ∈ A. Questa sezione α0 e` non vuota. Essendo α0 ⊂ γ, anche γ e` non vuoto.Segue che γ ⊂ β (visto che α ⊂ γ per ogni α ∈ A), e perci`o γ 6= Q. Quindi γ soddisfa la propriet`a (I). Per dimostrare la (II) e la (III), si scelga p ∈ γ; allora p ∈ α1 per qualche α1 ∈ A. Se q < p, allora q ∈ α1 e quindi q ∈ γ; con questo abbiamo dimostrato la (II). Se si sceglie r ∈ α1 in modo che r > p, si ha che r ∈ γ (visto che α1 ⊂ γ) e perci`o γ soddisfa anche la (III). Quindi γ ∈ R. E` evidente che α ≤ γ per ogni α ∈ A. Supponiamo che δ < γ. Allora esiste s ∈ γ, tale che s ∈ / δ . Dal momento che s ∈ γ, s ∈ α per qualche α ∈ A. Perci`o δ < α e δ non e` un maggiorante di A. Siamo cos`ı arrivati al risultato desiderato: γ = sup A. t u Ora che abbiamo messo a posto la relazione d’ordine fra numeri reali, dobbiamo ancora definire le quattro operazioni. La somma e` relativamente facile da definire, mentre il prodotto richiede pi`u attenzione. Preferiamo quindi separare le definizioni. Definizione 1.18. Se α ∈ R e β ∈ R, la somma α + β e` definita come l’insieme di tutte le somme r + s, al variare di r ∈ α e di s ∈ β . Definiamo infine 0∗ come l’insieme di tutti i numeri razionali negativi. Proposizione 1.5. Sono soddisfatti i seguenti assiomi dell’addizione: (A1) se α ∈ R e β ∈ R, allora α + β ∈ R; (A2) se α ∈ R e β ∈ R, allora α + β = β + α (propriet`a commutativa); (A3) se α ∈ R, β ∈ R e γ ∈ R, allora (α + β ) + γ = α + (β + γ) (propriet`a associativa; (A4) 0∗ +α = α +0∗ = 0∗ per ogni α ∈ R (0∗ e` l’elemento neutro dell’addizione); (A5) ad ogni α ∈ R corrisponde un elemento −α ∈ R tale che α + (−α) = 0∗ (esistenza dell’opposto). Dimostrazione. (A1) Dobbiamo dimostrare che α + β e` una sezione. E` ovvio che α + β e` un sottoinsieme non vuoto di Q. Siano r0 ∈ / α, s0 ∈ / β . Allora r0 + s0 > r + s 0 0 per ogni scelta di r ∈ α e s ∈ β . Perci`o r + s ∈ / α + β . Segue che α + β ha la
22
1 Insiemi e proprit`a dei numeri reali
propriet`a (I). Si scelga p ∈ α + β . Allora p = r + s, con r ∈ α e s ∈ β . Se q < p, allora q − s < r e quindi q − s ∈ α e q = (q − s) + s ∈ α + β . Perci`o vale la (II). Si scelga t ∈ α tale che t > r. Allora p < t + s e t + s ∈ α + β . Perci`o vale la (III). (A2) α + β e` l’insieme di tutti i numeri della forma r + s, con r ∈ α e s ∈ β . Per la stessa definzione, β +α e` l’insieme dei numeri della forma s+r. Poich´e s+r = r +s per ogni r ∈ α ed ogni s ∈ β , risulta α + β = β + α. (A3) Come sopra, segue dalla propriet`a associativa della somma di numeri razionali. (A4) Se r ∈ α e s ∈ 0∗ allora r + s < r, da cui r + s ∈ α. Perci`o α + 0∗ ⊂ α. Per ottenere l’inclusione inversa, si scelgano p ∈ α e r ∈ α, con r > p. Allora p − r ∈ 0∗ e p = r + (p − r) ∈ α + 0∗ . Perci`o α ⊂ α + 0∗ . Possiamo concludere che α = α + 0∗ . (A5) Fissiamo α ∈ R Sia β l’insieme di tutti i p razionali con le seguente propriet`a: esiste r > 0 tale che −p − r ∈ / α. In altre parole, esistono dei numeri razionali pi`u piccoli di −p che non appartengono ad α. Dimostriamo che β ∈ R e che α + β = 0∗ . Se s ∈ / α e p = −s − q, allora p − −1 ∈ / α e quindi p ∈ β . Quindi β non e` vuoto. Se q ∈ α, allora −q ∈ / β . Perci`o β 6= Q. Dunque β soddisfa la (I). Scegliamo p ∈ β e r > 0 in modo che −p−r ∈ / α. Se q < p, allora −q−r > −p−r e quindi −q−r ∈ / α. Allora q ∈ β e vale la (II). Poniamo t = p + r/2. Allora t > p e −t − r/2 = −p − r ∈ / α e quindi t ∈ β . Allora β soddisfa la (III). Abbiamo dimostrato che β e` una sezione, cio`e β ∈ R. Se r ∈ α e s ∈ β , allora −s ∈ / α e, di conseguenza, r < −s, r + s < 0. Perci`o α + β ⊂ 0∗ . Viceversa, si scelga v ∈ 0∗ e si ponga w = −v/2. Allora w > 0 ed esiste un intero n tale che nw ∈ α, ma (n + 1)w ∈ / α (visto che Q ha la propriet`a archimedea!). Si ponga p = −(n + 2)w. Allor p ∈ β , visto che −p − w ∈ /α e v = nw + p ∈ α + β . Perci`o 0∗ ⊂ α + β . Possiamo concludere che α + β = 0∗ . Naturalmente, indicheremo questo β con −α. t u Corollario 1.2. Se α, β e γ sono numeri reali tali che β < γ, allora α + β < α + γ. In particolare, α > 0∗ se e solo se −α < 0∗ . Dimostrazione. Per come e` stata definita l’addizione in R, e` ovvio che α + β ⊂ α + γ. Se fosse α + β = α + γ, allora β = γ, contro l’ipotesi che β < γ. Il resto della dimostazione e` lasciato per esercizio. t u Veniamo adesso alla seconda operazione, quella della moltiplicazione. Come anticipato, dobbiamo rispettare le ben note regole dei segni, e questo ci obbliga a dare definizioni diverse del prodotto, a seconda dei sengi dei due fattori. Definizione 1.19. Poniamo R+ = {α ∈ R | α > 0∗ }. Se α ∈ R+ e β ∈ R+ , allora il prodotto αβ e` l’insieme di tutti i p tali che p ≤ rs per ogni scelta di r ∈ α, s ∈ β , r > 0 ed s > 0. Definiamo poi 1∗ come l’insieme degli elementi q < 1. Estendiamo questa definizione come segue: ∗ ∗ (−α)(−β ) se α < 0 e β < 0 ∗ ∗ αβ = −[(−α)β ] se α < 0 e β > 0 −[α(−β )] se α > 0∗ e β < 0∗ .
1.8 Appendice: una costruzione dei numeri reali
23
Proposizione 1.6. Valgono i seguenti assiomi della moltiplicazione: (M1) se α ∈ R e β ∈ R allora αβ ∈ R; (M2) se α ∈ R e β ∈ R allora αβ = β α (propriet`a commutativa della moltiplicazione); (M3) se α ∈ R, β ∈ R e γ ∈ R, allora (αβ )γ = α(β γ) (propriet`a associativa della moltiplicazione); (M4) esiste un elemento 1∗ ∈ R tale he 1∗ α = α1∗ = α per ogni α ∈ R; (esistenza dell’elemento neutro per la moltiplicazione); (M5) se α ∈ R e α 6= 0∗ , allora esiste un elemento α −1 ∈ R tale che αα −1 = α −1 α = 1∗ (esistenza dell’inverso per la moltiplicazione); (D) per ogni α, β , γ ∈ R, vale α(β + γ) = αβ + αγ (propriet`a distributiva). Dimostrazione. La dimostrazione e` del tutto simile a quella delle propriet`a dell’addizione, e omettiamo i lunghi dettagli. t u Osservazione 1.9. E` consuetudine scrivere
1 α
invece di α −1 .
La costruzione di R e` essenzialmente completa. Resta da chiarire come si possano “leggere” i numeri razionali come numeri reali. Definizione 1.20. Ad ogni r ∈ Q associamo l’insieme r∗ dei numeri p < r. Proposizione 1.7. Per ogni r razionale, r∗ e` un numero reale (sezione di Dedekind). Inoltre valgono le seguenti propriet`a: per ogni r, s ∈ Q, (a) (b) (c)
r∗ + s∗ = (r + s)∗ ; r∗ s∗ = (rs)∗ ; r∗ < s∗ se e solo se r < s.
Dimostrazione. Per dimostrare la (a), si scelga p ∈ r∗ + s∗ . Si ponga p = u + v, dove u < r e v < s. Da ci`o p < r + s, che e` come dire che p ∈ (r + s)∗ . Viceversa, supponiamo p ∈ (r + s)∗ . Allora p < r + s. Si scelga t in modo che 2t = r + s − p e si ponga r0 = r − t, s0 = s − t. Allora r0 ∈ r∗ , s0 ∈ s∗ e p = r0 + s0 . Di conseguenza p ∈ r∗ + s∗ . La dimostrazione della (b) e` simile. Veniamo alla (c). Se r < s, allora r ∈ s∗ , ma r ∈ / r∗ ; perci`o r∗ < s∗ . Se r∗ < s∗ , allora esiste un p ∈ s∗ tale he p ∈ / r∗ . Dunque r ≤ p < s e di conseguenza r < s. t u Osservazione 1.10. La proposizione precedente permette di immergere i numeri razionali in quelli reali. Con strumenti piuttosto difficili, si potrebbe dimostrare che tutti i campi ordinati con la propriet`a dell’estremo superiore sono “matematicamente identici”. Non possiamo spiegare qui questa terminologia,21 ma ci limitiamo ad osservare che nei fatti qualunque costruzione di un insieme ordinato, con due operazioni che godono dei rispettivi assiomi, e con la propriet`a dell’estremo superiore e` a tutti gli effeti ancora R!
21
Dovremmo parlare di isomorfismi di struttura.
24
1 Insiemi e proprit`a dei numeri reali
Osservazione √ 1.11. Ma alla fine, dopo tutte queste pagine di calcoli e definizioni, che cos’`e 2? Nella nostra costruzione dei numeri reali, ogni numero reale e` in realt`a un sottoinsieme dei numeri razionali. Quindi e` poco sensato dire che la radice quadrata di 2 e` quell’unico numero reale il cui quadrato vale 2. Non vogliamo dire che sia sbagliato, ma dovremmo dimostrare che l’equazione x2 = 2 e` risolvibile quando x e` una sezione di Dedekind. Di fatto, se ci provassimo, ci accorgeremmo che, nel dialetto delle sezioni di Dedekind, √ 2 = {p ∈ Q | p2 < 2}. Sebbene del tutto rigoroso, l’approccio ai numeri reali con le sezioni non e` il pi`u intuitivo, n´e il pi`u flessibile. Un approccio alternativo, presentato in tanti testi (ad esempio [32]), consiste nell’uso di successioni di Cauchy formate da numeri razionali. Sorvolando sulle questioni tecniche, il risultato e` che un numero reale si identifica con una successione di numeri razionali “che lo approssimano” arbitrariamente bene. Non e` sbagliato pensare che, con questa costruzione delle successioni, un numero reale sia la successione formata dale sue cifre decimali (finite o infinite che siano). Evidentemente, la definizione di numero reale mediante le successioni di Cauchy e` del tutto equivalente alla definizione mediante lo sviluppo decimale. In aggiunta, l’idea su cui si basa questa costruzione alternativa di R ha il grande pregio di essere adattabile a situazioni estremamente generali, che si presentano spontaneamente nell’Analisi Funzionale, nella Topologia Generale, ecc.
1.9 I numeri complessi Cos`ı come l’equazione x2 = 2 non possiede soluzioni x ∈ Q, allo stesso modo l’equazione x2 = −1 non e` risolubile nel campo dei numeri reali R. Infatti, se x ∈ R verificasse x2 = −1, dovremmo concludere che 0 ≤ x2 = −1 < 0, il che e` palesemente contraddittorio! In un certo senso, la struttura di ordine di R impedisce l’estrazione della radice √ quadrata dei numeri negativi. Se il nostro scopo e` dare un senso a simboli come −1, dobbiamo costruire un nuovo ambiente numerico che contiene R ma che non rispetta l’ordinamento di R stesso.
Definizione 1.21. Un numero complesso z e` una coppia ordinata (x, y) di numeri reali. L’aggettivo “ordinata” significa che (x, y) e` considerato diverso da (y, x) se x 6= y. Il numero x si chiama parte reale di z, e il numero y si chiama parte immaginaria di z. In simboli, scriveremo x = ℜz e y = ℑz. La collezione di tutti i numeri complessi si indica con il simbolo C.
In particolare, due numeri complessi z e w sono uguali se, e solo se, le rispettive parti reali e immaginarie sono uguali. E` poi consuetudine identificare i numeri
1.9 I numeri complessi
25
complessi della forma (x, 0) con x: quindi possiamo identificare R con il sottoinsieme di C formato dai numeri complessi aventi parte immaginaria nulla. Addirittura, scriveremo x al posto di (x, 0) quando x ∈ R.
Definizione 1.22. Siano z = (x, y) e w = (x0 , y0 ) due numeri complessi. sono definite le operazioni di somma e di prodotto secondo le regole seguenti: • z + w = (x + x0 , y + y0 ); • zw = (xx0 − yy0 , x0 y + xy0 ).
E` facile verificare, usando la definizione precedente, che C diventa una struttura algebrica dotata delle usuali propriet`a alle quali siamo abituati: ad esempio le propriet`a commutativa, associativa, distributiva. Inoltre (0, 0) e` l’elemento neutro per la somma, e (1, 0) e` l’elemento neutro per il prodotto. Esplicitamente, z + (0, 0) = z e z(1, 0) = (1, 0)z = z per ogni z ∈ C. Torneremo pi`u avanti sulla definizione del prodotto, apparentemente oscura.
Definizione 1.23. Il modulo p di un numero complesso z = (x, y) e` il numero reale non negativo |z| = x2 + y2 . Il complesso coniugato di z e` z¯ = (x, −y).
Per onore di cronaca, segnaliamo che molti Autori utilizzano la notazione z∗ per indicare il complesso coniugato di z. Osservazione 1.12. Il modulo di un numero complesso e` stato denotato con lo stesso simbolo che indica il valore assoluto di un numero reale. Questa apparente confusione e` giustificata p immediatamente: se z ∈ R, nel senso che ℑz = 0, allora p |z| = (ℜz)2 + (ℑz)2 = (ℜz)2 = |ℜz|. In termini formali, possiamo dire che la restrizione del modulo complesso al campo reale coincide con il gi`a noto valore assoluto. Osserviamo che z¯z = (x, y)(x, −y) = (x2 +y2 , 0) = (|z|2 , 0) = |z|2 . Questo semplice calcolo ci permette di rispondere ad un quesito molto importante: come si calcola l’inverso di un numero complesso? Per essere precisi, dobbiamo evitare di dividere per zero (lo zero complesso): quindi fissiamo z 6= 0 in C, e cerchiamo un numero z−1 tale che zz−1 = z−1 z = 1. Dal calcolo svolto sopra, deduciamo che z−1 =
z¯ . |z|2
26
1 Insiemi e proprit`a dei numeri reali
Ovviamente |z| 6= 0, poich´e z 6= 0. Sebbene sia perfettamente rigoroso definire un numero complesso come una coppia ordinata di due numeri reali, e` innegabile che questa non e` la via piu`u intuitiva per maneggiare i numeri complessi. La soluzione consiste nel separare pi`u visivamente la parte reale dalla parte immaginaria.
Definizione 1.24. i = (0, 1).
Questa definizione ci consente di utilizzare una notazione pi`u leggera e agile per lavorare con i numeri complessi. Infatti, un numero z = (x, y) si pu`o scrivere z = (x, 0) + (0, 1)y = x + yi. La definizione di moltiplicazione diventa ora estremamente intuitiva. Se notiamo che i2 = ii = −1, basta usare la propriet`a distributiva: (x + yi)(x0 + y0 i) = xx0 + xy0 i + x0 yi + yy0 i2 = xx0 − yy0 + (xy0 + x0 y)i. Raccogliamo nella successiva Proposizione qualche facile propriet`a dell’operazione di coniugio. Proposizione 1.8. Se z e w sono numeri complessi, allora 1. z + w = z¯ + w¯ 2. zw = z¯w¯ 3. z + z¯ = 2ℜz, z − z¯ = 2iℑz. In particolare, ℜz =
z+¯z 2
e ℑz =
z−¯z 2i .
Lasciamo le facili dimostrazioni come esercizio per lo studente. Pi`u complessa ed interessante e` la dimostrazione delle seguente disuguaglianza.
Proposizione 1.9 (Disuguaglianza di Cauchy–Schwarz). Se z e w sono due numeri complessi, vale la disuguaglianza |zw| ¯ ≤ |z||w|.
(1.4)
Dimostrazione. Poniamo A = |z|2 , B = |w|2 e C = zw. ¯ Se B = 0, la disuguaglianza si riduce a 0 ≤ 0. Supponiamo che B > 0. Risulta che ¯ − BCC¯ 0 ≤ |Bz −Cw|2 = (Bz −Cw)Bz −Cw = |Bz|2 + |C|2 B − BCC = |Bz|2 + |C|2 B = B(BA − |C|2 ). Quindi B(BA − |C|2 ) ≥ 0; siccome B > 0, necessariamente |C|2 ≤ AB. Estraendo la radice quadrata, otteniamo (1.4).
1.9 I numeri complessi
27
Proposizione 1.10 (Propriet`a del modulo). Siano z, w ∈ C. (i) |z| = 0 se e solo se z = 0. (ii) |λ z| = |λ ||z| per ogni λ ∈ C (iii) |ℜz| ≤ |z| e |ℑz| ≤ |z|. (iv) |z + w| ≤ |z| + |w|. Dimostrazione. Per (i), ovviamente |0| = 0. Viceversa, se |z| = 0, allora ℜz = ℑz a (ii). Scriviamo λ = a + bi. Allora |λ z| = p p = 0, e dunque z = 0. Passiamo (ax − by)2 + (ay + bx)2 = (x2 + y2 )(a2 + b2 ) = |λ ||z|. La propriet`a (iii) e` quasi ovvia: x2 + y2 ≥ x2 implica |z|2 ≥ (ℜz)2 . Del tutto analoga e` il calcolo per la parte immaginaria. Infine, (iv) discende dal seguente sviluppo: ¯ |z + w|2 = (z + w)z + w = |z|2 + |w|2 + 2ℜ(zw) ≤ |z|2 + |w|2 + 2|z||w| = (|z| + |w|)2 . • Forma polare dei numeri complessi Oltre alla scrittura “cartesiana”, esiste un’ulteriore rappresentazione dei numeri complessi. Immaginiamo di collocare un numero complesso z nel piano cartesiano, segnando in ascissa ℜz e in ordinata ℑz. Il segmento uscente dall’origine e diretto al punto (ℜz, ℑz) forma un angolo θ con il semiasse positivo dell’asse delle ascisse. Misuriamo quest’angolo in senso antiorario, e selezioniamo la prima determinazione, in modo che 0 ≤ θ < 2π. Se definiamo ρ = |z|, possiamo concludere che z e` univocamente individuato dai numeri ρ ≥ 0 e θ ∈ [0, 2π). Il primo si chiama, appunto, modulo di z, e il secondo la sua fase.22 Sempre dall’interpretazione geometrica descritta sopra, e` chiaro che ℜz = ρ cos θ ,
ℑz = ρ sin θ .
Dunque z = ℜz + (ℑz)i = ρ (cos θ + i sin θ ).
Definizione 1.25 (Identit`a di Eulero). eiθ = cos θ + i sin θ , per ogni θ ∈ R.
Osserviamo che ci asteniamo dall’attribuire qualunque significato algebrico al primo membro dell’identit`a di Eulero. Sebbene assomigli pericolosamente ad un elevamento a potenza23 , per noi sar`a solo un’abbreviazione per denotare la quantit`a a secondo membro. Alcuni Autori scrivono cis θ = cos θ + i sin θ .
22
Esiste una certa arbitrariet`a nella definizione della fase. Molti Autori preferiscono scegliere θ ∈ [−π, π). Ovviamente qualunque intervallo di ampiezza 2π caratterizza completamente la fase. 23 Ed infatti lo e ` , ma non abbiamo ancora gli strumenti per definire una potenza con esponente complesso.
28
1 Insiemi e proprit`a dei numeri reali
La forma polare z = ρ (cos θ + i sin θ ) e` particolarmente utile per eseguire le moltiplicazioni. Se z1 = ρ1 eiθ1 e z2 = ρ2 eiθ2 , allora24 z1 z2 = ρ1 eiθ1 ρ2 eiθ2 = ρ1 ρ2 ei(θ1 +θ2 ) . Inoltre, se z 6= 0, 1 1 1 = iθ = e−iθ . z ρ ρe E` un vero peccato che la forma polare sia totalmente inutilizzabile per effettuare le somme di numeri complessi. Lo studente si rassegni: una notazione agevola le somme, un’altra le moltiplicazioni. Nessuna agevola entrambe le operazioni. Conseguenza delle osservazioni precedenti e` che la notazione polare permette di elevare i numeri complessi a potenze intere (positive o negative) con molta facilit`a. Lemma 1.5. Se z = ρeiθ e n ∈ Z, allora zn = ρ n enθ i . Ovviamente dobbiamo supporre che z 6= 0 se n < 0. Dimostrazione. Basta applicare ripetutamente la formula di moltiplicazione in forma polare. A parole, il modulo viene elevato alla potenza data, mentre la fase viene moltiplicata per la potenza. Quindi la fase raddoppia elevando al quadrato, triplica elevando al cubo, ecc. Ma come si estraggono le radici di un numero complesso?
Definizione 1.26. Siano w ∈ C e n ∈ N. Diciamo che z ∈ C e` una radice n– esima di w se zn = w.
Il nostro problema e` quello di trovare tutte le radici n–esime di un numero w assegnato. Scriviamo w nella forma polare: w = reiα . Cerchiamo z = ρeiθ tale che ρ n enθ i = reiα . Pertanto ρ = r1/n . Non e` sufficiente imporre nθ = α, poich´e la fase di un numero complesso e` individuata solo a meno di multipli interi di 2π. Pertanto dobbiamo imporre nθ = α + 2kπ, k ∈ Z. Dividendo per n, α 2kπ + , k ∈ Z. n n Iniziando da k = 0, ci accorgiamo che i primi angoli corrispondenti a k = 0, 1, 2, . . . , n − 1 sono tutti distinti, mentre per k = n otteniamo nuovamente α/n + 2π, la θ=
24 Il fatto che eiθ1 eiθ2 = ei(θ1 +θ2 ) non e ` banale, e lo studente dovrebbe verificarlo partendo dall’identit`a di Eulero ed usando le formule di somma di addizione per seno e coseno.
1.9 I numeri complessi
29
stessa fase fornita da k = 0. Possiamo finalmente rispondere alla domanda iniziale: le radici n–esime di w = reiα sono i numeri complessi rappresentati in forma polare come ρeiθ , dove ρ = r1/n α 2kπ , θ = + n n
k = 0, 1, . . . , n − 1.
Forse senza esserne del tutto consapevoli, abbiamo dimostrato un notevole teorema. Teorema 1.2. Ogni numero complesso (diverso da zero) possiede esattamente n radici n–esime complesse. Forse qualche studente si star`a chiedendo perch´e esiste un solo numero reale x tale che x3 = 1, mentre ne esistono ben tre complessi z tali che z3 = 1. Questo non e` contraddittorio; semplicemente R non e` abbastanza grande da contenere tutte le radici cubiche del numero (complesso) 1 = 1 + 0i. Osservazione 1.13 (Radici dell’unit`a). Per esercizio, ci proponiamo di calcolare tutte le radici n–esime dell’unit`a, cio`e di trovare tutti e soli i numeri z ∈ C tali che zn = 1, dove n ∈ N e` un numero intero assegnato. Scrivendo al solito z = ρeiθ e 1 = e0i , sappiamo dalla teoria generale che ρ = 1 e θ=
2kπ , n
k = 0, 1, . . . , n − 1.
Quindi le radici n–esime dell’unit`a sono numeri complessi unimodulari, cio`e di modulo pari ad uno, le cui fasi sono ottenute dividendo l’angolo 2π in n parti uguali. Geometricamente, questo si rappresenta segnando i vertici del poligono regolare con n lati sulla circonferenza unitaria del piano complesso, avendo cura di collocare il primo vertice in (1, 0). Ne segue che le radici quadrate dell’unit`a sono i vertici dell’unico poligono regolare a due lati, che poi sarebbe semplicemente il segmento dell’asse delle ascisse interno alla circonferenza unitaria. Le radici cubiche dell’unit`a sono i vertici del triangolo equilatero inscritto nella solita circonferenza unitaria, con un vertice in (1, 0). Sebbene queste considerazione appaiano spesso affascinanti, non c’`e nulla di misterioso: e` solo la definizione di elevamento a potenza nel campo complesso. Osservazione 1.14. Dalle considerazioni geometriche appena svolte, deduciamo un fatto piuttosto notevole: le radici n–esime dell’unit`a si presentano a coppie. Se ω e` una radice n–esima di 1, allora anche ω¯ e` una radice n–esima. Ovviamente qualche caso e` poco significativo: ad esempio le radici quadrate dell’unit`a sono {−1, 1}, che banalmente coincidono con i propri complessi coniugati. In generale, qualunque sia n, la radice ω = 1 e` reale e quindi non ci “accorgiamo” dell’esistenza del suo complesso coniugato. Ma tutto ci`o non e` specifico delle radici n–esime. Supponiamo di voler risolvere un’equazione della forma a0 + a1 z + a2 z2 + . . . + an zn = 0,
30
1 Insiemi e proprit`a dei numeri reali
dove i coefficienti delle potenze di z sono numeri reali. Poich´e zk = z¯k per ogni k ∈ N, possiamo dire che a0 + a1 z¯ + a2 (¯z)2 + . . . + an (¯z)n = a0 + a1 z + a2 z2 + . . . + an zn = 0¯ = 0, sicch´e il complesso coniugato z¯ di ogni soluzione z e` un’altra soluzione della stessa equazione. Questo “teorema” sarebbe falso se i coefficienti ak fossero numeri complessi. Volete un esempio? Facile: l’equazione iz = 1 e` risolta solo da z = 1/i = −i. Il numero z¯ = i si guarda bene dall’essere una seconda soluzione! Per concludere, ritorniamo alla ben nota equazione algebrica del secondo ordine az2 + bz + c = 0,
(1.5)
dove a, b e c sono, in generale, tre numeri complessi assegnati, e z ∈ C e` l’incognita. Per evitare ovviet`a, supporremo che a 6= 0, sicch´e l’equazione e` effettivamente di secondo grado. Osservando che, posto al solito ∆ = b2 − 4ac, c b b2 c b2 b =a z2 + 2 z + 2 + − 2 az2 + bz + c = a z2 + z + a a 2a 4a a 4a ! 2 b ∆ =a z+ − 2 , 2a 4a possiamo concludere che z risolve (1.5) se e solo se ∆ b 2 = 2. z+ 2a 4a b A parole, z + 2a e` una radice quadrata di 4a∆2 . Indicando ancora, con un notevole abuso di notazione, le radici quadrate di 4a∆2 con il simbolo
r ±
∆ , 4a2
ritroviamo la formula per la soluzione generale di (1.5): √ −b ± ∆ . z= 2a Questa formula e` identica alla formula risolutiva delle equazioni algebriche del secondo ordine in campo reale. Ora, per`o, possiamo sostenere senza possibilit`a di confusione, che l’equazione (1.5) possiede sempre due soluzioni complesse, eventualmente coincidenti. In ambito reale, supponendo per coerenze che a, b e c siano numeri reali, l’equazione non possiede soluzioni reali quando ∆ < 0. Ancora una volta, il campo C costituisce un ampliamento algebrico del campo reale, e la peculiarit`a e` la possibilit`a di risolvere le equazioni algebriche senza restrizioni.
Capitolo 2
Funzioni fra insiemi
Ora che abbiamo conquistato una certa familiarit`a con il linguaggio degli insiemi, rivediamo rapidamente il linguaggio della teoria delle funzioni fra insiemi.
Definizione 2.1. Siano X ed Y due insiemi qualsiasi. Una funzione f : X → Y (si legge: f da X in Y ) e` una legge che ad ogni x ∈ X associa precisamente uno ed un solo elemento y ∈ Y , denotato anche con f (x). La notazione completa e` f: X →Y x 7→ f (x) Utilizzeremo sovente la notazione pi`u compatta f : x ∈ X 7→ f (x) ∈ Y . L’insieme X si chiama dominio (di definizione) di f , mentre Y si chiama codominio di f .
Notiamo che la definizione appena data nasconde una certa ambiguit a` . Che cosa sarebbe una legge? In realt`a, gli studenti del corso di Matematica imparano fin dall’inizio una definizione pi`u rigorosa di funzione. Quella che abbiamo proposto ricalca la definizione ingenua delle scuole superiori, e si affida all’idea innata di legge che permette di mettere in corrispondenza due elementi di due insiemi noti. Purtroppo la definizione rigorosa richiederebbe l’introduzione di ulteriori concetti che non verrebbero pi`u utilizzati nel nostro corso. Riportiamo il seguente commento, tratto da [1]. Possiamo pensare una funzione f : X → Y come una specie di scatola nera, con un ingresso e un’uscita. Ogni volta che in ingresso entra un elemento del dominio, la scatola nera – la funzione – lo elabora e poi emette dall’uscita un elemento del codominio. Non e` importante la natura degli elementi del dominio e del codominio (possono essere numeri, rette, patate, cavalleggeri prussiani o qualsiasi altra cosa) n´e il tipo di processi digestivi che avvengono all’interno della scatola. Siano somme, prodotti, classifiche o formine da sabbia, tutte e` ammissibile purch´e il procedimento usato sia sempre lo stesso: ogni volta che in ingresso
31
32
2 Funzioni fra insiemi infiliamo la stessa patata, in uscita dobbiamo ottenere sempre la stessa cipolla – ad ogni elemento del dominio viene associato uno ed un solo elemento del codominio, appunto.
Avvertenza. Molti studenti, ma anche molti docenti e qualche libro di testo, hanno l’abitudine di riferirsi “alla funzione f (x)” invece che “alla funzione f ”. Come abbiamo visto, una funzione e` una legge, mentre f (x) e` semplicemente il valore che f assume in x. Per fare un paragone, sarebbe come confondere la persona Simone Secchi con le dispense scritte da Simone Secchi.1 Quindi non esiste la funzione sin x, n´e la funzione x2 . Pi`u corretto, e senz’altro pi`u accettabile, e` parlare della funzione x 7→ x2 , indicata anche con (#)2 in alcun i libri. Quest’ultima notazione, o l’equivalente (·)2 , e` ampiamente tollerata. La scrittura (sin #)/# significherebbe “la funzione x 7→ (sin x)/x”, e quindi # assumerebbe il valore di carattere “jolly” per la variabile indipendente. Sfortunatamente, questa notazione e` comune in molti libri avanzati come [13], ma non ha mai fatto breccia nella tradizione dei testi elementari.2 Lo studente, a regola, non capisce perch´e occorra perdere tempo in queste disquisizioni, che non giovano molto alla sua premura di superare l’esame finale. Lasciando da parte il doveroso rimprovero a chi crede che gli esami universitari siano inutili scocciature da superare balbettando qualche frase davanti al professore, stiamo parlando di un concetto veramente profondo. La x non e` una divinit`a, nessun medico ce ne prescrive l’uso, e solo la tradizione invoglia a usare tale lettera per la variabil e indipendente.3 Le due scritture x 7→ ex e ζ 7→ eζ denotano la stessa funzione: x e ζ , ma potremmo usare α, ρ o anche z, sono soltanto simboli. Una celebre battuta dice che, in matematica, un cappello rosso non e` necessariamente un cappello, e anche se lo fosse non sarebbe necessariamente rosso. Quello che conta veramente e` il significato attribuito ai simboli, nel nostro caso la legge, cio`e la funzione, alla quale tali simboli vengono sottoposti. In alcuni contesti avanzati, la “funzione f (x)” potrebbe anche indicare il nome di una funzione che agisce come f (x) : t 7→ f (x)(t). Sembra un paradosso, ma non lo e` , ed anzi tali notazioni sono pressoch´e obbligatorie in Geometria Differenziale e in Analisi Funzionale. Domanda provocatoria per lo studente: chi parlerebbe della funzione g(1/2)? Se x denota un numero, g(1/2) dovrebbe essere tanto legittimo quanto g(x)... Per amore di verit`a, molti docenti continuano a ritenere essenzialmente (o totalmente) corretta un’espressione come “sia f (x) una funzione continua”. Seguendo la
1
In cenrti ambienti, questa sovrapposizione e` piuttosto comune. Io e i miei colleghi del corso di laurea in matematica parlavano sempre “del Rudin”, per indicare in effetti il libro [30] scritto da Rudin. 2 Purtroppo, la tendenza a confondere ci` o che un soggetto e` con ci`o che quel soggetto fa, e` un errore sempre pi`u diffuso anche nella nostra societ`a. 3 I fisici preferiscono usare t, come se parlassero di un tempo.
2 Funzioni fra insiemi
33
prassi italica che si fanno le regole e poi si tollerano le trasgressioni,4 i trasgressori non verranno perseguiti in sede d’esame. Esempi. Siano X l’insieme di tutti gli uomini della Terra, e Y l’insieme di tutti i colori. Se ad ogni uomo di X associamo il colore del suo occhio destro,5 abbiamo costruito una funzione da X in Y . Se X e` l’insieme di tutte le scatolette di tonno di un certo negozio, e Y e` l’insieme dei numeri razionali Q, possiamo associare ad ogni x ∈ X il suo prezzo y ∈ Q = Y , ottenendo una funzione. La scelta di Y = Q nasconde la presunzione che nessun negoziante ci far`a mai pagare π euro per una scatoletta di tonno. Sembra perci`o ragionevole che i prezzi delle scatole di tonno siano numeri con una quantit`a finita di numeri decimali, e dunque numeri razionali. Se infine X e` l’insieme di tutte le circonferenze del piano cartesiano e Y = R, possiamo associare ad ogni circonferenza il suo raggio. Anche questa e` una funzione. Scegliamo ora X = Y come l’insieme di tutti gli individui viventi sulla Terra. Associando ad ogni individuo vivente i suoi genitori, non definiamo una funzione: esistono gli orfani, e inotre potremmo associare a un x ∈ X due elementi di Y , madre e padre. Nel seguito, useremo quasi esclusivamente insiemi numerici e funzioni fra di essi.
Definizione 2.2. Se f : X → Y e` una data funzione, l’insieme f (X) = {y ∈ Y | esiste x ∈ X tale che y = f (x)} ⊂ Y si chiama immagine di X rispetto a f . Se invece V ⊂ Y , l’insieme f −1 (V ) = {x ∈ X | f (x) ∈ V } si chiama controimmagine (o preimmagine, o ancora anti-immagine) dell’insieme V . Per i nostri scopi, il codominio Y e` decisamente meno importante del dominio X. Effettivamente, per specificare una funzione, ci servono in maniera essenziale il dominio e la legge, mentre il codominio pu`o essere “allargato” senza influire troppo sulla funzione. Infatti, ci`o che conta sembra essere f (X): gli elementi di Y che non sono immagini di elementi di X possono essere sacrificati in prima battuta. Oppure, potremmo aggiungere ulteriori elementi all’immagine, senza alterare la funzione. Invitiamo il lettore a ritornare sull’esempio delle scatolette di tonno. E` 4
Ogni riferimento socio–politico e` pienamente voluto. Ci sono esseri umani – pochi – con occhi di colori differenti, dunque parlare di “colore degli occhi” non definirebbe una funzione. Escludiamo implicitamente gli individui privi dell’occhio destro. 5
34
2 Funzioni fra insiemi
vero che i prezzi sono (ragionevolmente) numeri razionali,6 ma se avessimo scelto come codominio l’insieme dei numeri reali non avremmo compromesso la nostra funzione.
Convenzione didattica. Abbiamo appena detto che una funzione si compone di tre elementi: un dominio, un codominio, e una legge. Ogni studente sa gi`a, per`o, che in certi esercizi si chiede di “trovare” il dominio di definizione di una certa funzione, scritta solitamente f (x) = . . . E` una richiesta poco chiara, a cui si conviene di attribuire un senso convenzionale preciso. Quando si lavora con funzioni reali di una variabile reale, il dominio e` inteso come il “dominio naturale”, cio`e il pi`u grande sottoinsieme di √R in cui tutte le operazioni scritte nella formula di f hanno senso. Se f (x) = x − 1, il dominio e` l’insieme delle x tali che x − 1 ≥ 0. Questo perch´e si pu`o estrarre la radice quadrata solo di numeri maggiori o uguali a zero. Se f (x) = log(3x − 1), il dominio e` l’insieme delle x tali che 3x − 1 > 0, poich´e solo i numeri strettamente positivi hanno un logaritmo. Chiedere di trovare il dominio di una data funzione significa chi edere allo studente di ricordare quali sono i domini di definizioni delle principali funzioni elementari, e di fargli risolvere alcune disequazioni. E` vero che f (x) = log x pu`o essere legittimamente definita sul dominio [1, π], ma non si tratta del dominio naturale. Nel linguaggio introdotto in questi appunti, sono semplicemente due funzioni diverse.
Osservazione 2.1. Una situazione che solitamente risulta insidiosa per gli studenti e` il caso delle funzioni contenenti potenze in cui sia la base che l’esponente sono variabili. Ad esempio, qual e` il dominio di definizione di x 7→ xx ? O di x 7→ (sin x)log x ? La risposta e` che per definire un’espressione quale f (x)g(x) occorre imporre la condizione f (x) > 0.La ragione si capisce solo ricordando quella teoria delle potenze che ormai non viene quasi pi`u insegnata nelle scuole medie. Si veda anche il successivo angolo dello smemorato. L’angolo dello smemorato: le potenze. Ricordiamo che, dato un qualsiasi numero reale (positivo, nullo o negativo) x, si definisce la sua potenza n– esima, per n ∈ N mediante la formula xn = x · x · . . . · x (n fattori). Indi, si definiscono le potenze con esponente intero relativo, dicendo che 6
Quasi sempre i prezzi sono espressi da numeri razionali con due cifre dopo il punto (o la virgola) decimale, ma esistono eccezioni: si pensi al prezzo del carburante, che e` quasi sempre espresso con i millesimi di euro.
2 Funzioni fra insiemi
35
x−n =
1 . xn
Naturalmente, occorre richiedere che x 6= 0. I primi dubbi arrivano per esponenti razionali. Infatti, come definire x1/q , dove q ∈ N, q 6= 0? Di solito si dice che x1/q = y
se e solo se x = yq .
Pertanto, bisogna distinguere fra q pari e q dispari. Nel primo caso, poich´e ogni numero elevato ad una potenza pari diventa non negativo, dovremo imporre x ≥ 0. Nel secondo caso, invece, ogni numero x ∈ R pu`o essere elevato alla potenza 1/q, q dispari. Si pensi, per ricordarlo, alla radice cubica x1/3 , definita per ogni x reale. Ad esempio, l’espressione x1/8 ha senso solo per x ≥ 0, mentre x1/17 e` definita per ogni x reale. Ultimo passaggio, il caso dell’esponente razionale qualunque: x p/q . Ovviamente, possiamo pensare che la frazione p/q sia gi`a ridotta ai minimi termini. Poniamo allora x p/q = (x p )1/q se p ≥ 0, mentre 1 x−p/q se p < 0. Ovviamente, dobbiamo controllare che le potenze scritte abbiano significato: se q e` un numero pari, (x p )1/q ha senso solo per x p ≥ 0, cio`e per x ≥ 0. Se q e` dispari, possiamo scrivere (x p )1/q per ogni x reale. Per p < 0, dobbiamo inoltre escludere x = 0 dalla definizione. Per esempio, x p/q =
x2/3 = (x2 )1/3 , definita dunque per ogni x reale (perch´e il denominatore 3 dell’esponente e` dispari), mentre x5/2 = x5
1/2
definita solo per x ≥ 0 perch´e il denominatore 2 dell’esponente e` un numero pari. Infine, 1 x−4/3 = 4/3 , x definita per ogni x 6= 0: l’unica condizione e` infatti che il denominatore x4/3 sia diverso da zero. Dopo questa lunga digressione, non e` affatto chiaro come definire xα , per un qualunque numero α ∈ R. La risposta e` insita nella costruzione dell’insieme dei numeri reali.7 Ci limitiamo ad un cenno: fissato α, si approssima α con una successione di numeri razionali {pn /qn }n∈N . La tentazione e` di definire
7
Questo e` uno dei momenti, non troppo frequenti per fortuna, in cui si rimpiange di non avere le basi di teoria dei sistemi numerici.
36
2 Funzioni fra insiemi
xα = lim x pn /qn . n→+∞
Il problema per`o e` che non possiamo avanzare pretese sui numeri qn : potrebbero √essere alternativamente√positivi o negativi. Per esempio, se volessimo definire (−1) 2 , osserveremmo che 2 ≈ 1.414213562373 . . . e dunque vorremmo approssimare √ (−1) 2 con (−1)14/10 , (−1)141/100 , (−1)1414/1000 , . . . Ma gi`a la seconda approssimazione e` insensata, perch´e 141 e` dispari, e dovremmo calcolare la radice centesima di −1, che non e` definita. Allora, per essere certi che x pn /qn abbia senso, l’unica via d’uscita e` chiedere che x > 0. Morale del discorso: possiamo elevare ad una potenza reale generica solo le basi positive. Un approccio alternativo, dovuto a Dedekind, propone di definire xα come il valore di sup {rα | r ∈ Q, r ≤ x} = inf {rα | r ∈ Q, r ≥ x} . Questa uguaglianza e` per`o falsa per x < 0. Resta un ultimo, tremendo, dubbio: siccome N ⊂ Z ⊂ Q ⊂ R, come ci comportiamo davanti all’espressione x2/3 ? Pensiamo 2/3 come un numero razionale oppure come un numero reale? Gi`a, perch´e nel primo caso possiamo scegliere x reale, mentre nel secondo solo x > 0! La risposta e` quella pi`u complicata8 : quando l’esponente e` un numero razionale, lo trattiamo come tale, senza pensarlo come un numero reale. Osservazione 2.2. Per togliere qualsiasi ambiguit`a, converrebbe distinguere rigorosamente e senza eccezioni la funzione esponenziale dalla funzione inversa delle potenze. In altri termini, dovremmo considerare separatamente (per esempio) le due funzioni f (x) = x2/3 √ 3 g(x) = x2 .
f : (0, +∞) → R, g : R → R,
Si pu`o seguire senz’altro questa strada, ma i matematici amano ammorbidire le asperit`a della loro materia con qualche cedimento alle convenzioni. Per concludere, c’`e una situazione che molti studenti non sanno come affrontare: come si calcola 00 ? E` una domanda insidiosa, che in effetti ha gi`a avuto implicitamente la risposta nella discussione precedente: l’operazione 00 non e` definita. Per x 6= 0, possiamo pensare che x0 = xm−m = xm /xm , dove m e` un numero intero (diverso da zero) qualunque. Allora, viene spontaneo dire che x0 = 1 per x 6= 0. Ma questo ragionamento non e` convincente per x = 0, poich´e x−m e` gi`a privo di significato. A volte, i matematici convengono di dare un senso ad un’espressione indefinita, e lo fanno con lo scopo di semplificare o unificare argomenti che richiederebbero una trattazione diversa caso per caso. Molti studiosi di analisi matematica usano la convenzione 00 = 1, pensando che 00 = limx→0 x0 = limx→0 1 = 1. Altri, invece, 8 I matematici scelgono spesso la strada pi` u ricca di bivi, almeno quando questi bivi arricchiscano la teoria.
2 Funzioni fra insiemi
37
preferiscono pensare che 00 = limx→0 0x = limx→0 0 = 0. Questo, da un punto di vista avanzato, si interpreta con il fatto che la funzione di due variabili f (x, y) = xy , definita per x > 0 e y ∈ R, non e` prolungabile per continuit`a in (0, 0). Chi scrive, se proprio e` obbligato, ha una maggiore simpatia per la convenzione 00 = 1, ma si tratta di gusti. Per amor di verit`a, i matematici che si occupano di Algebra astratta si trovano unanimemente concordi nel sostenere che 00 = 1 per definizione di elevamento a potenza. La faccenda e` ingarbugliata, e cerchiamo di fornire una spiegazione in poche righe. In Algebra, ogni volta che sia definita un’operazione di moltiplicazione9 e` conveniente porre x0 = 1, qualunque sia l’elemento x. Di conseguenza, un algebrista scrive 00 = 1 senza provare il minimo imbarazzo. Chi si occupa di Analisi Matematica nutre di solito qualche perplessit`a di fronte a questo tipo di scrittura. Il punto e` che un algebrista interpreta l’esponente 0 come il numero naturale 0 ∈ N. Invece, l’analista lo pensa quasi sempre come 0 ∈ R. Sfortunatamente, la procedura con cui si definisce bx in analisi funziona solo per 0 < b < +∞ e x reale qualunque. Per un algebrista non e` strano porre 00 = 1, ma per un analista questa convenzione mette a repentaglio una propriet`a fondamentale delle operazioni algebriche: la continuit`a rispetto agli argomenti. Per capire il problema, consideriamo due successioni, pn → 0 e qn → 0 per n → +∞. Formalmente, lim pqn n→+∞ n
= 00 ,
e ci verrebbe spontaneo concludere che questo limite vale 1. Ma sappiamo che [00 ] e` una delle forme di indecisione nel calcolo dei limiti, e si possono costruire semplici esempi di successioni {pn } e {qn } come sopra, tali che {pqnn } non tende a 1. Intuitivamente, questo significa che la funzione di due variabili (x, y) 7→ xy non pu`o essere estesa per continuit`a in (0, 0). Dunque si presenta un dilemma: meglio conservare alcune propriet`a formali delle operazioni algebriche, o meglio conservare la continuit`a delle operazioni stesse? La risposta non e` scontata, e ci sono analisti che privilegiano le propriet`a formali, mentre scarseggiano gli algebristi che privilegiano la continuit`a. Definizione 2.3. Supponiamo che f : X → Y sia una funzione fra i due insiemi X e Y . Se Z e` un sottoinsieme di X, la nuova funzione f |Z : Z → Y definita da f |Z(x) = f (x) per ogni x ∈ Z prende il nome di restrizione di f all’insieme Z.10 Restringere l’azione di una funzione a un dominio di definizione pi`u piccolo pu`o apparire inutile. Il punto e` che, per noi, una funzione e` individuata in modo univoco dal suo dominio, dal suo codominio, e dalla sua legge. Ad esempio, vedremo pi`u avanti che la funzione f : R → R definita dalla legge
9
In generale, in ogni gruppo ha senso definire le potenze di un elemento. A volte si usa il simbolo f|Z .
10
38
2 Funzioni fra insiemi
−1, se x < 0 f (x) = 0, se x = 0 1, se x > 0 e` discontinua nel punto x = 0, ma la sua restrizione a qualsiasi intervallo che non contiene il punto x = 0 e` continua. Questo ci convince che le restrizioni di una funzione possono godere di propriet`a che la funzione di partenza non possiede.
2.1 Operazioni sulle funzioni Quando lavoriamo con funzioni a valori reali, e` facile estendere ad esse le quattro operazioni dell’aritmetica. Basta infatti operare sulle immagini, come nella definizione che segue. Definizione 2.4. Sia X un insieme, e siano f : X → R e g : X → R due funzioni a valori reali. Definiamo la loro somma, il loro prodotto e il loro quoziente come 1. f + g : X → R, x 7→ f (x) + g(x) 2. f g : X → R, x 7→ f (x)g(x) 3. f /g : X \ {x ∈ X | g(x) = 0} → R, x 7→ f (x)/g(x), Anche le funzioni possiedono delle operazioni, senza dubbio meno familiari di quelle algebriche. A noi ne serviranno due: la composizione e l’inversione.
Definizione 2.5. Siano f : X → Y e g : Y → Z due funzioni. La funzione g ◦ f : X → Z definita da g ◦ f : x ∈ X 7→ g( f (x)) ∈ Z si chiama funzione composta di g ed f .
Osservazione 2.3. La composizione, per usare un’espressione mnemonica, si legge da destra a sinistra. Qualche Autore, soprattutto quelli che si occupano di algebra, usano la convenzione della composizione in ordine inverso rispetto al nostro. Per costoro, g ◦ f significa calcolare prima g e poi f . La “scusa” addotta e` che e` preferibile rispettare il senso della scrittura occidentale, da sinistra a destra. E` chiaro che basta ribattere che e` proprio il senso della scrittura che spinge a scrivere l’argomento a destra della funzione (cio`e f (x) e non (x) f ), e dunque l’argomento di g va scritto a destra: g ◦ f . Nella pratica, comporre due funzioni significa applicarle in successione, facendo attenzione all’ordine di scrittura. Graficamente,
2.1 Operazioni sulle funzioni
39
x ∈ X 7→ f (x) ∈ Y 7→ g( f (x)) ∈ Z, dove la prima freccia indica l’azione di f su x e la seconda freccia l’azione di g su f (x). Questa rappresentazione evidenzia l’ipotesi che il codominio di f coincidesse con il dominio di g.11 In generale, non ha senso scrivere f ◦ g, perch´e il codominio di g non e` il dominio di f . E anche se questa condizione strutturale e` soddisfatta, e` facile costruire un esempio in cui f ◦ g e g ◦ f sono due funzioni ben distinte. Osservazione 2.4. Il concetto di composizione pu`o essere esteso a tre o pi`u funzioni: l’importante e` che domini e codomini siano “del tipo giusto”. Pi`u precisamente, consideriamo tre funzioni f1 : X → Y , f2 : Y → Z, e f3 : Z → W . Allora possiamo definire h = f3 ◦ f2 ◦ f1 : X → W come segue: per ogni x ∈ X, h(x) = f3 ( f2 ( f1 (x))). Si potrebbe dimostrare facilmente che la composizione gode della propriet`a associativa: ( f3 ◦ f2 ) ◦ f1 = f3 ◦ ( f2 ◦ f1 ). A parole, possiamo comporre prima f3 con f2 , e successivamente comporre il risultato con f1 . Oppure fare prima la composizione di f2 e f1 , e solo alla fine comporre il risultato con f3 . In entrambi i casi, otteniamo la medesima funzione. Osservazione 2.5. La composizione di due funzioni pu`o essere definita in un contesto leggermente pi`u generale. Consideriamo due funzioni f : X → Y e g : Y˜ → Z. Finora abbiamo imposto che Y = Y˜ , ma capiamo subito che non e` del tutto necessario per dare un senso a g ◦ f . Infatti, quello che ci serve veramente e` che l’immagine f (X) sia un sottoinsieme del dominio Y˜ di g: f (X) ⊂ Y˜ . Insomma, per comporre g con f , quello che occorre (e basta) e` che l’immagine di f sia un sottoinsieme del dominio di g. Pi`u macchinosa e` la definizione di funzione inversa. Premettiamo una definizione fondamentale.
Definizione 2.6. Sia f : X → Y una funzione. Diciamo che f e` iniettiva se ad elementi x1 6= x2 di X sono associate sempre immagini f (x1 ) 6= f (x2 ) in Y . Diciamo invece che f e` suriettiva se f (X) = Y , cio`e se per ogni y ∈ Y esiste un x ∈ X tale che f (x) = y. Diciamo infine che f e` biunivoca se e` iniettiva e suriettiva. Supponiamo che f : X → Y sia una funzione biunivoca. Ad ogni y ∈ Y si associa un elemento x ∈ X tale che f (x) = y. Ora, tale elemento x e` unico: se ce ne fossero due, chiamiamoli x1 e x2 , ovviamente x1 6= x2 e l’iniettivit`a di f implicherebbe y = f (x1 ) 6= f (x2 ) = y, cio`e y 6= y. Questo e` chiaramente impossibile, dunque esiste uno (per la suriettivit`a) ed uno solo (per l’iniettivit`a) x ∈ X tale che f (x) = y. Ma allora abbiamo costruito 11
In base a quanto detto poco sopra, basterebbe che f (X) fosse un sottoinsieme del dominio di g.
40
2 Funzioni fra insiemi
una funzione da y in X. Questa funzione, che chiameremo f −1 , gode della propriet`a che f ◦ f −1 : y ∈ Y 7→ y ∈ Y (2.1) e f −1 ◦ f : x ∈ X 7→ x ∈ X.
(2.2)
Definizione 2.7. Sia f : X → Y una funzione biunivoca. La funzione f −1 : Y → X costruita sopra si chiama funzione inversa di f , ed e` caratterizzata dalle condizioni (2.1) e (2.2).
Diversamente da alcuni libri di testo, saremo piuttosto rigidi sul concetto di funzione invertibile. Come visto, per noi una funzione e` invertibile quando e` biunivoca. Altri chiedono sono l’iniettivit`a: il dominio della funzione inversa sar`a l’immagine della funzione diretta. Questa e` una convenzione legittima e addirittura comoda in certi contesti elementari. Noi privilegiamo la definizione pi`u comune fra i matematici puri. Tuttavia, lo studente si convincer`a facilmente di questo: qualsiasi funzione diventa suriettiva, a patto di scegliere come codominio l’immagine della funzione. Se ci viene data una funzione iniettiva f da un dominio X in un codominio Y , la nuova funzione f˜ : X → f (X) e` una funzione biunivoca e perci`o invertibile. Sebbene f˜ sia una funzione diversa da f , e` comodo indulgere in questa confusione. Riassumendo, le (2.1) e (2.2) dicono che la funzione inversa e` effettivamente quell’operazione che “inverte” una funzione biunivoca rispetto alla composizione ◦. Quando allo studente dovr`a dimostrare che una certa funzione e` invertibile, dovr`a verificare che la funzione e` iniettiva e suriettiva. Pu`o far comodo usare la caratterizzazione contenuta nella prossima proposizione. Proposizione 2.1. Sia f : X → Y . 1. f e` iniettiva se e solo se dall’uguaglianza f (x1 ) = f (x2 ) discende x1 = x2 . 2. f e` suriettiva se e solo se, per ogni y ∈ Y , l’equazione (nell’incognita x ∈ X) f (x) = y possiede almeno una soluzione. 3. f e` biunivoca se e solo se, per ogni y ∈ Y , l’equazione f (x) = y possiede esattamente una soluzione x ∈ X. In tal caso, x = f −1 (y). Concretamente, tutto si riduce a risolvere equazioni. Purtroppo non tutte le equazioni sono risolvibili in termini espliciti, e i metodi del calcolo differenziale ci verranno in aiuto. Osservazione 2.6. Ci sarebbe molto da discutere sull’aggettivo “esplicito” usato un paio di righe sopra. A volte si sostiene che non esiste una rappresentazione “esplicita” per l’unica soluzione reale dell’equazione cos x = x. Se per`o tutti gli scienziati convenissero di denotare questo numero con il simbolo ♠, potremmo scrivere tranquillamente log ♠, tan ♠, ecc. Quello che intendiamo dire e` che in matematica
2.2 Funzioni monot`one e funzioni periodiche
41
nulla e` intrinsecamente esplicito o implicito. Quante volte lo studente ha usato il simbolo π per intendere il famoso 3.14 che la maestra insegnava alle scuole elementari? Possiamo dire che π e` pi`u esplicito di ♠ solo perch´e ce l’hanno inculcato da bambini?
2.2 Funzioni monot`one e funzioni periodiche Spendiamo qualche parola sui rapporti fra le funzioni reali di variabile reale e la relazione d’ordinamento fra numeri reali. Dati due numeri reali x1 e x2 , esattamente una delle seguenti affermazioni deve essere vera: x1 < x2 , oppure x1 = x2 , oppure x1 > x2 .
Definizione 2.8. Sia X ⊂ R un sottoinsieme, e sia f : X → R una funzione reale di una variabile reale. Diremo che f e` monotona crescente (risp. crescente in senso stretto) se e` soddisfatta la condizione seguente: se x1 , x2 ∈ X e se x1 < x2 , allora f (x1 ) ≤ f (x2 ) (risp. f (x1 ) < f (x2 )). Diremo che f e` monotona decrescente (risp. decrescente in senso stretto) se e` soddisfatta la condizione seguente: se x1 , x2 ∈ X e se x1 < x2 , allora f (x1 ) ≥ f (x2 ) (risp. f (x1 ) > f (x2 )).
A parole, le funzioni monotone crescenti rispettano l’ordinamento dei numeri reali, mentre quelle monotone decrescenti lo invertono. Osservazione 2.7. Attenzione alla pronuncia dell’aggettivo “monotona”: l’accento cade sulla seconda lettera o. Il professore di matematica pu`o essere mon`otono (accento sulla prima o), mentre le funzioni sono monot`one (accento sulla seconda o). Teorema 2.1. Sia [a, b] un intervallo, e sia f : [a, b] → R una funzione strettamente crescente (oppure strettamente decrescente). Allora f e` iniettiva. Dimostrazione. Siano x1 e x2 due elementi distinti di [a, b]. Non e` restrittivo supporre che x1 < x2 . Siccome f e` strettamente crescente (oppure decrescente), avremo che f (x1 ) < f (x2 ) (oppure f (x1 ) > f (x2 )), e in particolare f (x1 ) 6= f (x2 ). Pertanto f e` una funzione iniettiva. t u Corollario 2.1. Una funzione strettamente monotona e` invertibile sulla sua immagine, e la funzione inversa e` strettamente monotona nello stesso senso della funzione diretta. Lasciamo allo studente pi`u volenteroso la dimostrazione di questo corollario. Una sola avvertenza: la funzione inversa rispetta il senso della monotonia. Per qualche suggestione psicologica, molti studenti sono convinti che l’inversa di una funzione crescente debba essere una funzione decrescente. Basta pensare all’esempio della funzione esponenziale e della funzione logaritmo per non sbagliarsi.
42
2 Funzioni fra insiemi
Introduciamo infine un’ulteriore propriet`a di alcune funzioni che incontreremo spesso.
Definizione 2.9. Una funzione f : R → R e` periodica di periodo T > 0 se f (x + T ) = f (x),
per ogni x ∈ R.
e T e` il pi`u piccolo numero positivo che soddisfi questa uguaglianza.
Ne consegue che, per conoscere una funzione T –periodica, basta conoscerla su un qualunque intervallo di ampiezza T , ad esempio [0, T ] o [−T /2, T /2]. La clausola di minimalit`a di T e` parte integrante della definizione di periodicit`a. La funzione seno ha periodo T = 2π, ma sin(α + T ) = sin α e` vera anche per tutti i multipli interi di 2π.
2.3 Grafici cartesiani Il piano cartesiano sar`a, per noi, l’insieme dei punti di un piano nel quale sono stati scelte due rette perpendicolari. Queste rette si intersecano in un punto detto origine, e sono chiamati assi cartesiani. I punti di questo piano sono copppie ordinate di numeri reali, ed e` suggestivo usare il simbolo R2 = R × R per indicare brevemente il piano cartesiano.
Definizione 2.10. Sia f : X → Y una funzione, dove X, Y sono due insiemi. Il grafico di f e` il sottoinsieme di X ×Y Γ ( f ) = {(x, f (x)) ∈ X ×Y | x ∈ X}.
In pratica, il grafico di una funzione e` costituito dalle coppie ordinate il cui primo elemento appartiene al dominio, e il secondo elemento e` l’immagine del primo elemento. Per le nostre funzioni reali di una variabile reale, il grafico e` una sottoinsieme di R2 . Di solito si tratta di una curva (nel senso intuitivo del termine), √ ma potrebbe anche essere un solo punto. Pensiamo infatti alla funzione x 7→ −x2 , definita evidentemente solo in {0}. Il suo grafico e` formato dal punto {(0, 0)} ∈ R2 . Ci sembra opportuno insistere su un punto: non tutte le curve che si possono disegnare nel piano cartesiano sono grafici di funzioni. Prendiamo per esempio una circonferenza o un’ellisse: sono rappresentanti delle ben note coniche, ma non sono certamente grafici di funzioni reali di una variabile reale. Esistono infatti rette
2.4 Alcune (cosiddette) funzioni elementari
43
verticali che intersecano tali curve in due punti distinti, contro la definizione di funzione. Ma come si “leggono”, su un grafico cartesiano, le propriet`a di una funzione? In genere, tutte le principali caratteristiche di una data funzione hanno una visibilit`a notevole nel grafico cartesiano. Per esempio, la suriettivit`a corrisponde al fatto che qualunque retta orizzontale interseca il grafico almeno una volta. Se ogni retta orizzontale interseca il grafico al massimo una volta,12 la funzione e` iniettiva. Se ogni r etta orizzontale interseca il grafico una ed una sola volta, allora la funzione e` biunivoca. La periodicit`a si rispecchia invece in una ripetizione esatta del grafico ogni volta che l’ascissa si sposta di una quantit`a pari al periodo. Come detto sopra, basta pertanto tracciare il grafico su un intervallo di ampiezza pari al periodo.
2.4 Alcune (cosiddette) funzioni elementari In quest’ultima sezione introduttiva, riepiloghiamo le caratteristiche di alcune funzioni di natura elementare. Queste costituiranno in un certo senso un archivio a cui attingere esempi e controesempi nel corso del programma. Innanzitutto, lo studente ricorder`a le funzioni lineari affini, cio e` le rette del piano. Fatta eccezione per le rette verticali13 , la generica funzione linere affine ha la forma x 7→ mx + q, per opportuni valori di m, q ∈ R. Le funzioni rappresentate invece da polinomi di secondo grado sono invece parabole, e hanno la forma x 7→ ax2 + bx + c, dove i coefficienti a, b e c sono numeri reali. Il lettore dovrebbe avere una certa familiarit`a anche con le funzioni esponenziali, quelle rappresentate dalla formula x 7→ ax , dove a ∈ (0, +∞).14 Il caso a = 1 non merita tante parole: la funzione e` chiaramente costante, poich´e 1x = 1 qualunque sia l’esponente x. Nel caso 0 < a < 1, la funzione esponenziale di base a e` positiva, monotona decrescente. Nel caso a > 1, essa e` invece positiva ma monotona crescente. 12
Cio`e non lo interseca oppure lo interseca esattamente una volta. Che non rappresentano grafici di funzioni! 14 La base a e ` un numero positivo per ipotesi. Infatti, e` problematico elevare un numero negativo ad un esponente reale, e questo ci costringerebbe a distinguere vari casi. 13
44
2 Funzioni fra insiemi
Per quanto visto, la funzione esponenziale di base a ∈ (0, 1) ∪ (1, +∞) e` invertibile, e la sua funzione inversa si chiama logaritmo in base a. Si scrive x ∈ (0, +∞) 7→ loga x. Per a > 1, la funzione logaritmica e` strettamente crescente, attraversa l’asse delle ascisse per x = 1, e` negativa per 0 < x < 1 e positiva per x > 1. Per 0 < a < 1, la funzione logaritmica e` strettamente decrescente, positiva per 0 < x < 1 e negativa per x > 1. L’unico valore in cui si annulla e` x = 1. Concludiamo la panoramica con le funzioni goniometriche. Poich´e una definizione rigorosa di tali funzioni pu`o essere data solo avendo a disposizione strumenti che introdurremo pi`u avanti, ci affidiamo alle conoscenze pregresse dello studente. Probabilmente, sapr`a che il seno di un angolo e` il rapporto fra cateto opposto e ipotenusa di un certo triangolo rettangolo, e cos`ı via. Per iniziare, questa “definizione” geometrica ci basta.15 Abbiamo dunque a nostra disposizione due funzioni, x ∈ R 7→ sin x x ∈ R 7→ cos x, chiamate rispettivamente seno e coseno, definite sull’intero insieme dei numeri reali, periodiche di periodo 2π. A queste si affianca la funzione tangente, definita come tan x =
sin x cos x
per ogni x ∈ R \ {kπ/2 | k ∈ Z}. 16 La tangente e` una funzione periodica di periodo π, e sull’intervallo (−π/2, π/2) e` strettamente crescente, nulla in x = 0. Osservazione 2.8. Gli angoli saranno sempre misurati in radianti. L’uso dei gradi sessagesimali, cui lo studente e` forse pi`u abituato, si adatta male al calcolo differenziale. Ricordiamo che la relazione fra la misura αgradi in gradi sessagesimali e quella αrad in radianti di un angolo α e` stabilita dalla seguente proporzione: αrad : αgradi = 2π : 360. Quindi αrad =
π αgradi . 180
Formule trigonometriche. Per comodit`a dello studente, riportiamo di seguito un elenco di utili formule goniometriche, che spesso sono difficilmente reperibili sui testi universitari. Certamente non e` obbligatorio memorizzarle tutte, ma occorre una 15
Una definizione rigorosa delle funzioni elementari appare in [32]. Sono per`o richiesti i metodi del calcolo integrale, e non ci sembra opportuno insistere su questa richiesta di rigore. 16 Questa scrittura apparentemente complicata e ` la scrittura simbolica per la frase “x diverso da qualunque multiplo intero di π/2”.
2.4 Alcune (cosiddette) funzioni elementari
45
certa familiarit`a almeno con le formule di addizione e sottrazione. Nel seguito, le lettere greche indicherranno angoli espressi in radianti. 1. 2. 3. 4. 5. 6. 7. 8. 9. 10. 11. 12.
(sin α)2 + (cos α)2 = 1; sec α = cos1 α ; cosec α = (sec α)2 = 1 + (tan α)2 sin(α ± β ) = sin α cos β ± cos α sin β cos(α ± β ) = cos α cos β ∓ sin α sin β tan α±tan β tan(α ± β ) = 1∓tan α tan β
1 sin α
α−β sin α + sin β = 2 sin α+β 2 cos 2 α−β sin α − sin β = 2 cos α+β 2 sin 2 α+β cos α + cos β = 2 cos 2 cos α−β 2 α−β cos α − cos β = −2 sin α+β sin 2 2 sin(2α) = 2 sin α cos α cos(2α) = (cos α)2 − (sin α)2 = 2(cos α)2 − 1 = 1 − 2(sin α)2 2 tan α tan(2α) = 1−(tan α)2
13. 2(sin α2 )2 = 1 − cos α; 2(cos α2 )2 = 1 + cos α sin α 1−cos α 14. tan α2 = 1+cos α = sin α .
Capitolo 3
Successioni di numeri reali
In questo capitolo, introdurremo uno degli strumenti pi`u importanti di tutta l’Analisi Matematica, le successioni. Ci imbatteremo per la prima volta nella definizione di limite, e dimostreremo un certo numero di teoremi fondamentali che avranno dei corrispettivi nella teoria dei limiti per le funzioni.
3.1 Successioni e loro limiti
Definizione 3.1. Una successione di numeri reali e` una qualunque funzione p : N → R. Per consuetudine, useremo la scrittura pn invece della pi`u rigida notazione funzionale p(n) per denotare il valore della funzione p in n ∈ N. Parleremo poi, sempre con un certo abuso di notazione, della successione {pn }.
Una successione viene spesso presentata come un allineamento (infinito) di numeri reali p1 , p2 , p3 , . . . , pn , pn+1 , . . . Per questo motivo, si trova frequentemente la notazione {p1 , p2 , p3 , . . . , pn , pn+1 , . . . }
(3.1)
per indicare la successione {pn }. C’`e sfortunatamente un aspetto che richiede molta attenzione da parte dello studente. La notazione (3.1) si confonde del tutto con l’insieme {p1 , p2 , p3 , . . . , pn , pn+1 , . . . } ⊂ R. Tutto ci`o e` spiacevole, dato che una funzione e` un oggetto ben diverso dalla sua immagine. A costo di essere ripetitivi, consideriamo la successione cos`ı definita:
47
48
3 Successioni di numeri reali
( 1, se n e` pari pn = −1, se n e` dispari. L’immagine di {pn } e` formata dall’insieme {−1, 1}, mentre la successione e` costituita da infiniti numeri reali. In questo senso l’uso delle parentesi graffe per denotare tanto la successione quanto l’insieme dei punti sulla retta reale da essa individuati e` azzardata. La tradizione didattica, cos`ı consolidata, rende inutile ogni battaglia contro questo abuso di notazione. Osservazione 3.1. La definizione di successione non e` universalmente accettata. Alcuni testi definiscono una successione come una funzione il cui dominio di definizione e` un sottoinsieme E di N con la seguente propriet`a: per ogni j ∈ N, esiste un elemento n j > j tale che n j ∈ E. In parole povere, il deve essere possibile scegliere elementi del dominio E grandi a piacere. In particolare, E potrebbe essere N (come nella nostra definizione), oppure un intervallo del tipo N ∩ (a, +∞). In effetti, secondo questa definizione pi`u generale, una successione potrebbe essere una qualsiasi funzione definita sull’insieme E = 4 j2 | j ∈ N . Nella pratica, le successioni sono definite per ogni indice naturale, oppure per tutti gli indici naturali n maggiori di un opportuno n0 ∈ N. Si pensi alla successione 1 }n , chiaramente definita solo per n ≥ 4. Nel seguito, chiameremo successioni { n−3 anche queste funzioni che, a rigore, non sodisfano la definizione precedente. Osservazione 3.2. Osserviamo che qualunque successione e` in realt`a la restrizione a N di infinite funzioni di una variabile reale. Data infatti una qualunque successione {pn }, possiamo definire infinite funzioni f : R → R in maniera tale che f (n) = pn per ogni n ∈ N. Ad esempio, possiamo specificare assolutamente a caso i valori di f (x) per x ∈ R \ N. L’Osservazione sopra ci permette di fare una divagazione divertente con un finale polemico. Tutti ci siamo imbattuti, prima o poi, nel seguente “rompicapo”: data una sequenza di quattro o cinque numeri (solitamente naturali), dire quale sar`a il numero successivo. E` chiaro che, per un matematico, questo e` un rompicapo assolutamente ozioso: basta scrivere un numero a caso! Chiaramente non sar`a mai la soluzione prevista da chi pone il dilemma. Ad esempio, se la sequenza e` “1, 3, 5, 7, 9”, sembra plausibile congetturare che il numero successivo sar`a 11, data l’assonanza evidente con i primi numeri dispari. In tutti questi casi, il vero rompicapo e` capire che cosa significhi scrivere un numero che segue logicamente quelli dati. Un buon rompicapo dovrebbe possedere una soluzione inequivocabile, e soprattutto utilizzare questi problemi per selezionare le future matricole universitarie appare un’idea abbastanza discutibile.
3.1 Successioni e loro limiti
49
Definizione 3.2. Una successione {pn } e` crescente (risp. strettamente crescente) se pn ≤ pn+1 (risp. pn < pn+1 ) per ogni n, e decrescente (risp. strettamente decrescente) se vale la disuguaglianza opposta (risp. la disuguaglianza stretta opposta). La successione {pn } e` limitata se esiste una costante M > 0 tale che |pn | ≤ M per ogni n.
Definizione 3.3. Diremo che la successione {pn } tende al valore ` ∈ R per n → +∞, e scriveremo limn→+∞ pn = ` oppure pn → ` per n → +∞, se, per ogni ε > 0 esiste N ∈ N tale che |pn − `| < ε
per ogni n > N.
Osservazione 3.3. La richiesta che N ∈ N e` solo una scelta: non cambierebbe nulla se richiedessimo che n ∈ R. Infatti, da una parte N ⊂ R. Dall’altra, per la propriet`a archimedea di R, preso un qualunque numero reale x, esiste sempre un numero n ∈ N tale che n > x. Quindi, nella definizione di limite e` equivalente pretendere l’esistenza di un numero naturale N oppure di un numero reale N con le propriet`a cercate. Definizione 3.4. Diremo che una successione {pn } di numeri reali e` convergente se essa possiede un limite nel senso della definizione precedente. In caso contrario, diremo che la successione e` divergente. Osservazione 3.4. Un primo avvertimento che ci sembra doveroso dare e` che i libri di testo italiani usano una terminologia molto pi`u descrittiva. Noi abbiamo usato l’aggettivo “divergente” per la negazione logica di “convergente”. La tradizione italiana usa tale aggettivo per indicare che la successione tende all’infinito, come vedremo fra poco. La negazione della convergenza si divide cos`ı in due sotto-classi: tendere all’infinito e assumere infinite volte valori prossimi a piacere a due numeri distinti. Chi scrive, senz’altro sotto l’influsso del bellissimo libro di Walter Rudin [30], preferisce evitare questa ulteriore distinzione. Nell’economia di questo corso, per inciso, sarebbe anche poco saggio dare eccessiva importanza alle successioni che “oscillano” fra due valori diversi. Osservazione 3.5. E` fondamentale che lo studente si renda conto del seguente fatto: se esiste un numero N ∈ N che soddisfa le richieste contenute nella definizione di limite, anche tutti i numeri naturali N˜ > N andranno bene. Osservazione 3.6. Ma ε e` piccolo a piacere? Questa domanda, un po’ peregrina, e` basata su un’abitudine didattica in voga nelle scuole superiori. I liceali che imparano la teoria dei limiti, si abituano a recitare la frase “per ogni ε piccolo a piacere...”
50
3 Successioni di numeri reali
Perch´e noi non abbiamo inserito la piccolezza di ε nella nostra definizione? La risposta e` semplice: perch´e non serve. Se richiediamo che una propriet`a valga per ogni ε, stiamo gi`a coprendo tutti i casi possibili. D’altronde, se riusciamo a verificare la definizione di limite per ogni ε > 0 “piccolo”, a maggior ragione tutto continuer`a a valere per qualsiasi ε 0 > ε. Infatti, se io so che tutti i termini di una successione, tranne un numero finito, distano da un numero ` meno di ε, automaticamente essi disteranno meno di ε 0 > ε. Dunque non sar`a restrittivo partire da un ε > 0 che sia anche in qualche modo “piccolo”, ad esempio ε < 1/2, o ε < 10−100 . Qualche volta, volendo verificare una relazione di limite mediante la definizione, questo accorgimento risulta vantaggioso nel fare i calcoli. Insomma, dire “per ogni ε > 0 piccolo a piacere” non aggiunge alcuna informazione alla frase pi`u breve “per ogni ε > 0”. Un’osservazione particolarmente importante e` che i “primi” termini di una successione sono ininfluenti al fine dell’esistenza del limite. Proposizione 3.1. Siano {pn } e {qn } due successioni, e supponiamo che esista un numero naturale n0 tale che pn = qn per ogni n > n0 . Sotto queste ipotesi, la successione {pn } possiede limite (finito oppure infinito) se e solo se la successione {qn } possiede limite, ed in tal caso i due limiti coincidono. Dimostrazione. Supponiamo che limn→+∞ pn = ` ∈ R. Per definizione, fissato ε > 0 esiste N ∈ N tale che |pn −`| < ε per ogni n > N. Posto N1 = max{N, n0 }, ovviamente |qn − `| < ε per ogni n > N1 , dal momento che qn = pn per tali valori dell’indice n. Quindi limn→+∞ qn = `. Poich´e questo ragionamento e` perfettamente simmetrico, possiamo scambiare il ruolo di {pn } e di {qn }, e concludere che se limn→+∞ qn = ` allora anche limn→+∞ pn = `. Il caso del limite infinito e` lasciato per esercizio. t u Lo studente non deve comunque sopravvalutare la portata della Proposizione appena dimostrata: se il limite rappresenta il comportamento della successione per indici molto grandi, e` naturale che si disinteressi dell’andamento della successione per valori “piccoli” dell’indice. Esempio importante. Ma come si controlla, operativamente, che una successione n−1 }, sia convergente? Vediamolo con un esempio. Consideriamo la successione { n+1 e verifichiamo che e` convergente al limite ` = 1. In base alla definizione, dobbiamo fissare a nostro piacere un numero ε > 0, e verificare che la disequazione n−1 N? Per rispondere, “risolviamo” la disequazione n+1
n>
2 − 1. ε
Pertanto, se scegliamo N uguale al primo numero naturale1 maggiore di ε2 − 1, abbiamo finito la verifica del limite proposto. Dunque la verifica di un limite si riduce nel “risolvere” una disequazione e nel dimostrare che l’insieme delle soluzioni contiene tutti i numeri naturali maggiori di un opportuno valore. Prima di passare oltre, osserviamo che il valore del limite ` e` stato “regalato”, e che non saremmo riusciti a calcolarlo con la sola definizione. Vedremo fra poco quali strumenti esistano per l’effettivo calcolo dei limiti. La prossima domanda e` se possano esistere due numeri `1 e `2 che siano entrambi il limite di {pn }? La risposta e` negativa.2
Proposizione 3.2 (Unicit`a del limite). Se pn → `1 e pn → `2 , allora `1 = `2 .
Dimostrazione. Supponiamo che `1 < `2 e mostriamo che questo porta ad una contraddizione. Un ragionamento del tutto simile vale anche sotto l’ipotesi (assurda) `1 > `2 , e perci`o non resta che `1 = `2 . Dunque, sia ε = 21 (`2 −`1 ) > 0. Applichiamo la definizione di limite per `1 : esiste N1 ∈ N tale che |pn − `1 | < ε
se n > N1 .
Applicando la definizione a `2 , troviamo che esiste N2 ∈ N tale che |pn − `2 | < ε
se n > N2 .
Scegliamo N > max{N1 , N2 }. Quindi `2 − `1 ≤ |pn − `1 | + |pn − `2 | < `2 − `1 , assurdo. t u
In base all’Osservazione 3.3, basterebbe prendere il numero reale N = ε2 − 1. Per tradizione, continueremo a cercare un numero naturale N che soddisfi la condizione scritta nella definizione di limite. 2 Almeno per successioni di numeri reali. In contesti molto pi` u generali, una successione potrebbe addirittura ad infiniti limiti diversi.
1
52
3 Successioni di numeri reali
Osservazione 3.7. La dimostrazione mette in luce che l’unicit`a del limite e` una conseguenza immediata del seguente fatto: se a e b sono numeri reali diversi, allora esistono un intorno I di a ed un intorno J di b tali che I ∩ J = 0. / Ad esempio, posto δ = 12 |a − b|, possiamo scegliere I = (a − δ , a + δ ) e J = (b − δ , b + δ ). In matematica superiore, questa propriet`a di separazione si chiama propriet`a di Hausdorff. Come appena visto, R gode di questa propriet`a, cos`ı come tutti gli spazi metrici. Tuttavia esistono spazi di oggetti, di interesse matematico, che sono privi di questa propriet`a. In questi spazi, generalmente, una successione pu`o convergere a due o pi`u limiti diversi. Nella dimostrazione abbiamo usato la disuguaglianza triangolare |x − y| ≤ |x − z| + |z − y|
(3.2)
valida per ogni terna x, y, z di numeri reali. Un’altra propriet`a delle successioni convergenti, cio`e delle successioni che tendono a un limite nel senso della nostra definizione, e` che sono successioni limitate. Proposizione 3.3. Ogni successione convergente e` limitata. Dimostrazione. Infatti, se limn→+∞ pn = `, allora esiste N ∈ N, corrispondente alla scelta di ε = 1, tale che |pn − `| < 1 se n > N. Quindi, per la disuguaglianza triangolare, |pn | < M = max{|p1 |, |p2 |, . . . , |pN |, 1 + |`|}. t u Osservazione 3.8. E` per`o falso che ogni successione limitata converge. La successione {1, −1, 1, −1, 1, −1, . . . } e` limitata (M = 1 nella definizione), ma non converge. Vedremo comunque che tutte le successioni limitate hanno una sottosuccessione convergente. Prima di proseguire, osserviamo che alle successioni possono essere applicate le quattro operazioni algebriche. Precisamente, se {pn }, {qn } sono successioni e se α ∈ R, possiamo definire le successioni pn + qn , α pn , pn qn ,
pn qn
sotto l’ovvia condizione che qn 6= 0 quando qn appare a denominatore. Il seguente teorema afferma che l’operazione di limite rispetta le operazioni algebriche.
Teorema 3.1. Siano {pn } e {qn } due successioni. Se pn → ` e qn → m per n → +∞, allora
3.1 Successioni e loro limiti
53
1. pn + qn → ` + m; 2. α pn → α`; 3. pn qn → `m; 4. qpnn → m` se m 6= 0.
Dimostrazione. Le affermazioni 1 e 2 sono ovvie. Vediamo la 3, un po’ pi`u difficile. Per ipotesi, dato ε > 0 esistono N1 ed N2 in N tali che |pn − `|| < ε e |qn − m| < ε rispettivamente per n > N1 ed n > N2 . Fissiamo N > max{N1 , N2 } e osserviamo che per n > N |pn qn − `m| = |pn qn − `qn + `qn − `m| ≤ |pn − `||qn | + |`||qn − m|
(3.3)
per la disuguaglianza triangolare. Poich´e ogni successione convergente e` limitata, avremo |qn | < M, e dunque |pn qn − `m| ≤ Mε + |`|ε = (M + |`|)ε. Poich´e ε > 0 e` arbitrario, altrettanto arbitrario e` il numero (M +|`|)ε, e quindi anche 3 e` dimostrata. La dimostrazione del punto 4 richiede qualche ragionamento preliminare. Poich´e m 6= 0, dalla definizione di limite e dalla disuguaglianza triangolare |m| segue che esiste N ∈ R tale che |qN | > |m| 2 per ogni n > N. Infatti, scegliendo ε = 2 nella definizione di limite, definitivamente |qn | ≥ ||m| − ε| = |m| 2 . Per concludere la dimostrazione, fissiamo ε > 0 piccolo a piacere, e possiamo supporre che, per ogni n > N, risulti |pn − `| < ε, |qn − m| < ε. Allora pn ` pn m − `qn pn m − `m + `m − `qn − = = qn m mqn mqn (pn − `)m + `(qn − m) = mqn |pn − `| |`| |qn − m| + ≤ |qn | |m| |qn | 2 |`| < + 2 2 ε. |m| m La dimostrazione e` conclusa. t u Nell’ultima dimostrazione, ci sono due passaggi la cui importanza non va sottovalutata. Lo studente deve capirli bene e saperli adattare a situazioni simili. Il primo passaggio e` di natura logica. Se un numero ε e` piccolo a piacere, altrettanto lo e` 2ε, o anche 100ε. L’importante e` che il fattore moltiplicativo di ε sia indipendente da ε stesso.3 3
Ovvio, perch´e ε −1 ε = 1 non e` affatto piccolo a piacere.
54
3 Successioni di numeri reali
Il secondo passaggio, e` la tecnica di sommare e sottrarre una medesima – o anche pi`u – quantit`a per raggruppare termini che fanno comodo. Nell’equazione (3.3), sommare e sottrarre `qn ci ha permesso di raccogliere a fattor comune termini come |pn − `|, che sapevamo stimare con ε. Avremo l’occasione di applicare questa tecnica molto spesso, e l’unica regola per scoprire che cosa aggiungere e togliere e` l’esperienza. All’inizio, si procede by trial and error, cio`e provando senza paura di sbagliare. Molti studenti ricorderanno che quando si studiano i limiti, i guai vengono dalle forme di indecisione. Per poterne parlare, occorre per`o estendere la definizione di limite.
Definizione 3.5. Sia {pn } una successione. Diciamo che {pn } tende a +∞ (risp. a −∞), e scriviamo limn→+∞ pn = +∞ (risp. limn→+∞ pn = −∞) se per ogni numero reale M > 0 esiste un indice N ∈ N tale che pn > M per ogni n > N (risp. pn < −M per ogni n > N).
Osservazione 3.9. Fra i matematici e` in voga la locuzione “la successione {pn } esplode”. Di solito, con questo linguaggio un po’ colorito intendono dire che limn→+∞ pn = +∞. Per esercizio, verifichiamo mediante questa definizione che limn→+∞ log n = +∞. Fissiamo arbitrariamente un numero reale M > 0, e cerchiamo di scegliere N ∈ N tale che log n > M per ogni n > N. Poich´e la disuguaglianza log n > M equivale a n > eM , ci basta scegliere il primo numero naturale N maggiore di eM . E` ovvio che non tutte le relazioni di limite possono essere verificate appliacndo pedissequamente la definizione. E` conveniente dicorrere alle regole per il calcolo algebrico dei limiti, ogni volta che ci`o sia possibile in virt`u dei teoremi visti nella pagine precedenti. Sfortunatamente, esistono situazioni in cui le regole algebriche non possono essere conclusive: stiamo parlando delle forme di indeterminazione. Dando per scontato che n → +∞ e 1/n → 0 quando n → +∞, vediamo che n·
1 =1→1 n
e dovremmo ipotizzare che +∞ · 0 = 1. Se per`o cambiamo l’esempio, n2 ·
1 = n → +∞ n
e dunque +∞ · 0 = +∞. C’`e di che diventare matti. Ma insomma, quanto fa “zero per infinito”? La risposta e` che... non fa! E` la prima forma di indecisione che incontria-
3.2 Successioni e insiemi
55
mo, e nasconde un fatto piuttosto sottile: non tutti gli infiniti sono uguali fra loro.4 Si usa scrivere [0 · ∞] fra parentesi, per sottolineare che la moltiplicazione scritta richiede ulteriori precisazioni. Altre forme di indecisione molto popolari fra gli studenti sono h i ∞ 0 , [+∞ − ∞]. , 0 ∞ Altrettanto indeterminate sono le espressioni 0 0 , [1∞ ] , sebbene risultino pi`u sgradite e apparentemente problematiche. A parte l’ultima e “patologica” espressione,5 tutte le altre sono caratterizzate dalla presenza di 0 e ∞. La forma di indecisione pi`u complicata e` probabilmente [+∞ − ∞], mentre per quelle di natura moltiplicativa esistono tecniche raffinate e potenti che incontreremo a tempo debito. L’aspetto sgradevole e` che queste tecniche richiedono il calcolo differenziale, e non sono pertanto direttamente applicabili alle successioni. Osservazione 3.10. Scrivere [00 ] o [1∞ ] non significa che abbiamo elevato 0 alla potenza 0, n´e 1 alla potenza ∞. Le parentesi quadra sono l`ı proprio per ricordarci che si tratta di limiti, e non di numeri. Si rifletta sul fatto (da dimostrare mediante la definizione di limite) che limn→+∞ 1n = 1. Questa non e` una forma indeterminata, poich´e la base vale costantemente 1. Quindi la successione {1n }n e` formata da un allineamento infinito di 1. E` una successione costante, che ovviamente converge ad 1. Osservazione 3.11. Perch´e introdurre la teoria dei limiti per le successioni, considerato che impareremo presto la teoria dei limiti per tutte le funzioni di una variabile reale? La risposta e` che le successioni sono uno strumento molto utile e forniscono tecniche dimostrative particolarmente intuitive di alcuni teoremi. Inoltre, tutto il mondo informatico che ci circonda e` basato sulle successioni: i numeri vengono rappresentati come approssimazioni decimali (o meglio binarie), ed anche i pi`u avanzati software di calcolo utilizzano tecniche basate sulle successioni per fornire risposte.
3.2 Successioni e insiemi Le successioni convergenti hanno un ruolo importante anche nella topologia dei numeri reali. Ad esempio, dimostriamo un legame fra i punti di accumulazione e i limiti di successioni convergenti. 4 5
A conferma del fatto che ∞ non designa un numero. Ci sono nascosti dei logaritmi, come vedremo pi`u avanti.
56
3 Successioni di numeri reali
Proposizione 3.4. Sia E ⊂ R. Se p e` un punto di accumulazione di E, allora esiste una successione {pn }n di punti di E tale che pn → p per n → +∞.
Dimostrazione. Per definizione, ogni intorno di p contiene un punto di E, diverso da p stesso. Allora, per ogni n naturale, l’intorno (p − 1/n, p + 1/n) contiene un punto pn ∈ E, diverso da p. Abbiamo evidentemente costruito una successione {pn }n di punti di E, non tutti uguali a p. Dimostriamo che pn → p. Infatti, poich´e p−
1 1 ≤ p ≤ p+ , n n
dal teorema di confronto segue che limn→+∞ pn = p. Osservazione 3.12. Il contrario e` falso: la successione costante {p}n , che assume sempre il valore p, converge evidentemente a p. Ma questo non basta per concludere che p e` un punto di accumulazione di E. Ad esempio, per l’insieme E = {0} ∪(1, 2), il punto 0 non e` di accumulazione (basta osservare che l’intorno (−1/2, 1/2) non contiene punti di E, eccetto 0), ma ovviamente e` il limite della successione costante {0}n . E` facile per`o verificare che se p e` limite di una successione di punti pn di E, infiniti dei quali sono diversi da p, allora p e` di accumulazione per E. L’Osservazione precedente lascia un dubbio: quali punti sono limiti di successioni dell’insieme E? La risposta e` contenuta nel resto del paragrafo.
Definizione 3.6. Sia E un insieme di numeri reali, e sia E 0 l’insieme di tutti i punti di accumulazione di E. La chiusura di E e` l’insieme E = E ∪ E 0 .
Proposizione 3.5. Un punto p appartiene alla chiusura di E se e solo se esiste una successione di punti {pn }n di E tale che pn → p. Dimostrazione. Se p ∈ E, allora p ∈ E oppure p ∈ E 0 . In quest’ultimo caso, la Proposizione 3.4 garantisce l’esistenza di una successione di punti di E, convergente a p. Se invece p ∈ E, basta definire pn = p per ogni n naturale, ottenendo cos`ı una successione convergente a p. Viceversa, supponiamo che pn → p, dove ogni pn ∈ E. Dobbiamo verificare che / E. Preso un qualsiasi inp ∈ E. Se p ∈ E, abbiamo finito. Supponiamo allora p ∈ torno I di p, per definizione di convergenza esiste un N naturale tale che pN ∈ I. Siccome pN ∈ E e p ∈ / E, necessariamente pN 6= p. Ma allora p ∈ E 0 , e quindi p ∈ E.
3.3 Propriet`a asintotiche delle successioni
57
Esempio 3.1. La chiusura di (a, b) e` [a, b]. In effetti, ogni punto di [a, b] e` limite di una successione di punti di (a, b). La chiusura di {0} ∪ (1, 2) e` {0} ∪ [1, 2]. Il punto 0 non e` di accumulazione, ma evidentemente e` un punto dell’insieme, ed e` anche il limite di una successione costante di punti dell’insieme. Ancora una volta, notiamo che la fondamentale differenza fra i punti di accumulazione e quelli della chiusura e` che ogni intorno di un punto di accumulazione p deve contenere almeno un punto dell’insieme diverso da p stesso. Per la chiusura, la condizione di essere diverso da p non e` richiesta.
3.3 Propriet`a asintotiche delle successioni In questa lezione, vedremo una serie di risultati riguardanti le propriet`a delle successioni, che valgono “da un certo indice in poi”. Innanzitutto, formalizziamo questa frase. Definizione 3.7. Data una successione {pn }, diremo che una propriet`a vale definitivamente per {pn } quando esiste un indice N ∈ N tale che la propriet`a vale per ogni pn con indice n > N. Osservazione 3.13. L’aggettivo “definitivamente” dipende in modo essenziale dalla successione. Per essere pi`u chiari, “definitivamente” per una successione {pn } non significa “definitivamente” anche per un’altra successione {qn }. Infatti, l’indice N che funziona per la prima successione potrebbe non essere abbastanza grande da funzionare anche per la seconda successione. Tuttavia, non siamo di fronte ad un grande problema. Se per la prima successione troviamo un indice N1 e per la seconda un altro indice N2 , e` chiaro che l’indice N = max{N1 , N2 } va bene per entrambe, in quanto N e` pi`u grande sia di N1 che di N2 .6 Ad esempio, una successione e` definitivamente positiva se tutti i termini sono positivi tranne (al pi`u) un numero finito. Inoltre, una successione converge a ` se e solo se la disuguaglianza ` − ε < pn < ` + ε e` vera definitivamente. Il primo teorema che dimostriamo e` molto importante.
Teorema 3.2 (Permanenza del segno). Supponiamo che limn→+∞ pn = ` ∈ R. 1. Se ` > 0 (risp. ` < 0), allora pn > 0 (risp. pn < 0) definitivamente. 2. Se pn ≥ 0 (risp. pn ≤ 0) definitivamente, allora ` ≥ 0 (risp. ` ≤ 0).
6 La scrittura N = max{N , N } significa precisamente che N e ` il pi`u grande fra N1 e N2 . Ancora 1 2 pi`u esplicitamente, si confrontano fra loro N1 e N2 , e si sceglie il maggiore dei due: quello sar`a N.
58
3 Successioni di numeri reali
Dimostrazione. Infatti, supponiamo ` > 0. Fissiamo ε = 12 `, e scegliamo N ∈ N tale che ` − ε < pn < ` + ε per ogni n > N. Quindi, in particolare, pn > ` − ε = 12 ` > 0 per n > N. Questo dimostra il punto 1. Il punto 2 segue dal punto 1. Infatti, se ` < 0, allora sarebbe anche pn < 0 definitivamente, contro l’ipotesi pn ≥ 0. t u Nel punto 2 del teorema precedente, la disuguaglianza stretta nell’ipotesi non garantisce la disugualianza stretta nella tesi. Infatti, consideriamo la successione pn = 1/n. Chiaramente, pn > 0 per ogni n, ma pn → 0 per n → +∞. C’`e sempre un punto sul quale gli studenti dimostrano molta difficolt`a: rendersi conto che certe successioni non hanno limite, n´e finito n´e infinito. Volendo fare un esempio, possiamo considerare la successione {1, −1, 1, −1, 1, −1, 1, −1, . . . }. Questa successione alterna i due valori 1 e −1 periodicamente, e dovrebbe essere chiaro che non pu`o esistere alcun numero reale ` che sia limite della successione. Si tratta di un principio generale che, per i limiti di questo corso, preferiamo non approfondire.7 Come gi`a accennato in precedenza, preferiamo distinguere solo due categorie di successioni: quelle convergenti e quelle divergenti. La successione appena vista e` pertanto divergente. Molti testi elementari aggiungono anche la categoria delle successioni oscillanti. Sebbene sia intuitivamente chiaro che una successione oscillante e` una successione che “rimbalza” indefinitamente fra due valori diversi, l’unico mezzo per definire rigorosamente queste successioni consiste nell’introdurre i limiti superiore ed inferiore. In queste dispense, abbiamo relegato questo concetto ad un paragrafo facoltativo, dal momento che e` possibile capire dignitosamente l’analisi matematica elementare anche senza parlarne affatto. Vi e` una categoria di successioni il cui comportamento e` piuttosto regolare. Si tratta delle successioni monotone.
Proposizione 3.6. Sia {pn } una successione monotona crescente (o decrescente). Se {pn } e` limitata, allora {pn } converge, e il limite coincide con supn∈N pn (oppure con infn∈N pn se {pn } e` decrescente.)
Dimostrazione. Infatti, supponiamo che {pn } sia crescente, e poniamo S = supn∈N pn . L’ipotesti di limitatezza della successione implica che S ∈ R.8 Sia ε > 0 fissato arbitrariamente. Per definizione di estremo superiore, esiste N ∈ N tale che S − ε < pN < S. Per la monotonia di {pn }, se n > N allora 7 8
Lo studente pi`u interessato trover`a maggiori informazioni nel paragrafo 3.8. A volte, scriveremo S < +∞.
3.3 Propriet`a asintotiche delle successioni
59
S − ε < pN ≤ pn < S, e questo significa che pn → S per n → +∞. La dimostrazione nel caso in cui {pn } sia decrescente e` analoga. t u Forse lo studente avr`a notato che la Proposizione precedente ammette una immediata generalizzazione. Proposizione 3.7. Una successione crescente e illimitata dall’alto diverge a +∞. Una successione decrescente e illimitata dal basso diverge a −∞. Dimostrazione. In effetti, la Proposizione precedente dimostra che una successione monotona tende9 sempre all’estremo superiore oppure all’estremo inferiore. Se una successione e` illimitata, almeno uno di tali estremi e` infinito. Osservazione 3.14. In realt`a, la gran parte dei teoremi che parlano di successioni e dei loro limiti hanno un’immediata generalizzazione secondo la terminologie del “definitivamente”. Solo per fare un esempio, una successione definitivamente monotona, cio`e una successione che comincia ad essere monotona dopo un certo indice,10 ovviamente possiede un limite, finito o infinito. Questo dovrebbe essere abbastanza chiaro, dal momento che i primi termini di una successione non ne influenzano il comportamento asintotico. Enunciamo e dimostriamo uno dei criteri pi`u usati per dimostrare la convergenza delle successioni. Come accade sovente in matematica, il principio e` quello di ricondursi al caso precedente.
Teorema 3.3 (Due carabinieri). Siano {an }, {bn } e {pn } tre successioni. Supponiamo che limn→+∞ an = limn→+∞ bn = ` ∈ R, e che an ≤ pn ≤ bn definitivamente. Allora limn→+∞ pn = `. Se invece an → +∞ allora pn → +∞, e se bn → −∞ allora pn → −∞.
Dimostrazione. Infatti, fissiamo ε > 0 e scegliamo N ∈ N tale che `−ε < an < `+ε e ` − ε < bn < ` + ε. Quindi ` − ε < an ≤ pn ≤ bn < ` + ε, e la prima parte del teorema e` dimostrata. Se am → +∞, allora pn e` definitivamente maggiore di qualunque numero fissato, dato che pn ≥ an . Lasciamo allo studente il caso bn → −∞, che si tratta in maniera del tutto analoga. t u 9
Usiamo questo verbo con una certa imprecisione. Resta inteso che la monotonia deve sussistere per sempre, oltre quel valore dell’indice.
10
60
3 Successioni di numeri reali
Una parola di commento sulla terminologia. L’appellativo “dei due carabinieri” rappresenta la classica immagine di due carabinieri ({an } e {bn }) che scortano in prigione (il limite) il prigioniero ({pn }), affiancandolo passo dopo passo. E` un’immagine che appare in molti libri per ragazzi di cento anni fa.11 Apparentemente, i corpi di polizia dei paesi anglosassoni non hanno mai avuto l’abitudine di scortare i malfattori in questo modo, ed infatti nessun testo di calculus dimostra alcun “two–cops theorem”. Un’altra spiegazione e` che associare galeotti e teoremi non e` un buon modo di rendere la matematica pi`u affascinante! Spesso il Teorema dei due carabinieri si applica alle successioni positive, scegliendo an = 0 per ogni n. Pensiamo all’esempio sin n . n Non e` affatto immediato verificare che questa successione ha limite, dato che {sin n} ha un comportamento piuttosto bizzarro. Tuttavia, basta osservare che | sin n| ≤ 1, e quindi sin n 1 ≤ , 0≤ n n per concludere che la successione tende a zero. Il teorema dei due carabinieri si applica con an = 0 e bn = 1/n. In realt`a non e` veramente restrittivo pensare alle successioni che convergono a zero. Vale il seguente risultato, la cui dimostrazione immediata e` lasciata per esercizio. Proposizione 3.8. Una successione {pn } converge a ` ∈ R se e solo se la successione di numeri non negativi {|pn − `|} converge a zero. Osservazione 3.15. In un’ottica di riduzione degli sforzi, la Proposizione precedente ci dice che sarebbe sufficiente dare una definizione di convergenza verso zero, per poi ricondurre la convergenza ad un generico limite reale mediante la Proposizione. Non e` consuetudine essere cos`ı avari di dettagli, anche se i matematici sono soliti dimostrare che una successione {pn } converge ad un limite ` cercando di trovare una stima del tipo |pn − `| ≤ εn , dove εn → 0 per n → +∞. Nei fatti, si tratta esattamente della Proposizione precedente, unita al teorema dei due carabinieri.
11
Credo che ci sia una celebre illustrazione in un’edizione del libro di Carlo Collodi, Pinocchio. Ma a qualcuno l’immagine dei due carabinieri che scortano la successione ricorda la canzone Il pescatore di Fabrizio De Andr´e.
3.5 Sottosuccessioni
61
3.4 Infinitesimi ed infiniti equivalenti In questa sezione, vogliamo introdurre un linguaggio piuttosto diffuso e comodo per confrontare due successioni con lo stesso comportamento. Definizione 3.8. Sia {pn } e {qn } due successioni, entrambe tendenti a zero (rispettivamente ad infinito). Diciamo che {pn } e` un infinitesimo (rispettivamente un infinito) equivalente a {qn }, in simboli12 pn qn , se
pn = 1. n→+∞ qn lim
Osservazione 3.16. Ovviamente, se due successioni {pn } e {qn } sono tali che limn→+∞ pn /qn = ` 6= 0, allora pn `qn . La principale utilit`a degli infinitesimo (ed infiniti) equivalenti e` contenuta nella seguente Proposizione 3.9. Supponiamo che {an }, {pn } e {qn } siano successioni, e che pn qn . Allora lim an pn = lim an qn . n→+∞
n→+∞
Dimostrazione. Infatti, lim an pn = lim an
n→+∞
n→+∞
pn qn = lim an qn , n→+∞ qn
nel senso che il limite limn→+∞ an pn esiste se e solo se esiste limn→+∞ an qn , e i due valori coincidono. t u In breve, e` possibile sostituire fra di loro gli infinitesimi (o gli infiniti) equivalenti nelle strutture moltiplicative. Lo studente faccia attenzione a non tentare questa strada nel caso additivo: e` falso che lim an + pn = lim an + qn
n→+∞
se pn qn .
3.5 Sottosuccessioni Immaginiamo di avere una successione 12
Su alcuni testi si trova pn ∼ qn , oppure pn ≈ qn .
n→+∞
62
3 Successioni di numeri reali
{p1 , p2 , p3 , . . . , pn , . . . } e di selezionare alcuni elementi da essa, avendo cura di prenderli in ordine crescente di indici. Per esempio, potremmo selezionare p3 , p10 , p11 , p50 , p100 , . . . Anche se a prima vista sembra un po’ curioso, abbiamo costruito un’altra successione. Diamo una definizione generale per questo procedimento.
Definizione 3.9. Una successione {qn } e` una sottosuccessione di {pn } se qn = pk(n) , dove k : N → N e` una funzione strettamente crescente. Per brevit`a, si scrive spesso {pkn }.
Teorema 3.4. Una successione converge a un limite ` se e solo se tutte le sue sottosuccessioni convergono a `. Omettiamo la dimostrazione di questo teorema, ma vogliamo evidenziarne l’importanza. Per esempio, la successione {1/n2 } converge a zero perch´e e` una sottosuccessione di {1/n}. Per lo stesso motivo, per ogni numero naturale κ > 0 la successione {1/nκ } converge a zero. Lo studente non deve pensare che questo ragionamento giustifichi la scrittura limn→+∞ 1/nα = 0 per ogni numero reale α > 0. Infatti, quando α non e` un numero naturale, {nα } non e` una sottosuccessione di {n}. Per esempio, quando α = 1/2, la successione √ √ √ 1, 2, 3, 4, . . . , non e` una sottosuccessione di 1, 2, 3, 4, . . . , Concludiamo con un teorema di esistenza. E` un caso molto speciale di uno dei teoremi pi`u usati in tutta l’analisi matematica, il teorema di compattezza per successioni degli insiemi chiusi e limitati di Rn .
Teorema 3.5. Sia [a, b] un intervallo chiuso e limitato di R. Ogni successione {pn } tale che pn ∈ [a, b] per ogni n, possiede una sottosuccessione convergente a qualche elemento di [a, b].
Ad esempio, la successione {1, −1, 1, −1, 1, −1, . . . } cade nelle ipotesi di questo teorema.13 Infatti una sottosuccessione convergente esiste senz’altro: {1, 1, 1, 1, . . . }. Molto meno scontato e` il fatto che la successione {sin n} possegga una sottosuccessione convergente. 13
Si pu`o scegliere [a, b] = [−1, 1].
3.6 Il numero e di Nepero
63
Corollario 3.1. Ogni successione limitata di numeri reali possiede una sottosuccessione convergente. Dimostrazione. Se {pn } e` limitata, esiste M > 0 tale che |pn | < M per ogni n. Allora pn ∈ [−M − 1, M + 1] per ogni n, e dunque si applica il teorema precedente. t u
3.6 Il numero e di Nepero Lo studente avr`a senza dubbio gi`a sentito parlare del numero di Nepero,14 indicato dalla lettera e. E` uno dei numeri √ pi`u celebri della matematica elementare, insieme a π e all’unit`a immaginaria i = −1.15 Il numero e e` anche la base di logaritmi universalmente utilizzata nelle scienze, avendo ormai soppiantato in quasi tutti i settori la pi`u classica base 10.16 Occorre una definizione che individui tale numero senza possibilit`a di errore. Esistono due definizioni (evidentemente equivalenti) di e. La prima, e anche la pi`u comoda per fare i calcoli, e` ∞
e=
1
∑ n! .
n=0
Il simbolo n! = 1 · 2 · 3 · · · · · (n − 1) · n e` il fattoriale di n, ma il guaio e` che noi non sappiamo sommare infiniti numeri reali, come richiesto dalla formula precedente. Dovremmo addentrarci nella teoria delle serie numeriche, ma usciremmo dai limiti di questo corso. Proponiamo invece la seguente definizione, ormai comprensibile allo studente: 1 n e = lim 1 + . (3.4) n→+∞ n Insomma, e e` il limite della successione di termine n-esimo 1 n en = 1 + . n Ma chi garantisce che {en } abbia un limite, e che questo limite sia finito? Poich´e [1∞ ] e` una forma di indecisione,17 certo non i teoremi sul calcolo algebrico dei limiti. Si potrebbe dimostrare con un po’ di fatica, ma noi non lo faremo, che {en } e` una 14
O meglio di John Napier. La formula eiπ + 1 = 0 e` considerata una delle relazioni pi`u belle di tutta la matematica, poich´e coinvolge in maniera semplice i cinque numeri pi`u importanti: 0, 1, e, π ed i. 16 Questa affermazione e ` vera quando si vuole usare il calcolo differenziale. Un tempo i logaritmi servivano per fare velocemente i calcoli, ed era inevitabile scegliere come base 10, poich´e siamo abituati ad usare il sistema decimale per esprimere i numeri. Se fossimo abituati ad operare nel sistema binario dei computer, useremmo con maggior profitto la base 2. 17 Lo studente mediti sul fatto che lim pn n→+∞ 1 = 1, qualunque sia la successione {pn } che diverge a ∞. Non e` in contraddizione con l’affermazione che [1∞ ] e` una forma indeterminata? 15
64
3 Successioni di numeri reali
successione monotona crescente e limitata. Di conseguenza, {en } ha un limite finito, e battezziamo e tale limite. Usando un programma di calcolo, si trova la seguente approssimazione con cinquanta cifre decimali esatte: e ≈ 2.7182818284590452353602874713526624977572470937000 . . . Si dimostra che e e` un numero irrazionale e che 1 n +∞ 1 =∑ . lim 1 + n→+∞ n n=0 n!
3.7 Appendice: successioni di Cauchy Supponiamo che {pn }n sia una successione convergente ad un limite (finito) `. Per ogni ε > 0, esiste n ∈ N tale che per ogni n > N si ha |pn − `| < ε/2. Sia m > N; dalla disuguaglianza triangolare deduciamo che |pn − pm | ≤ |pn − `| + |pm − `|
0 esiste N ∈ N tale che |pn − pm | < ε
per ogni n, m > N.
(3.5)
Dalla discussione precedente, tutte le successioni convergenti sono successioni di Cauchy. Ora, di fronte a questo genere di implicazione, viene spontaneo domandarsi se le successioni di Cauchy coincidano con le successioni convergenti. La risposta e` contenuta nel seguente teorema.
Teorema 3.6 (Completezza di R). Ogni successione di Cauchy di numeri reali e` convergente.
Premettiamo un risultato che interverr`a nella dimostrazione. Proposizione 3.10. Sia {pn }n una successione di Cauchy. Se una sottosuccessione {pnk }k converge a un limite `, allora tutta la successione {pn }n converge a `.
3.8 Appendice: massimo e minimo limite di una successione
65
Dimostrazione. Sia ε > 0. Esiste N ∈ N tale che, per ogni n, m > N risulta |pn − pm | < ε. Per ipotesi, in corrispondenza di ε, esiste un indice K ∈ N tale che |pnK − ˜ risulta `| < ε. Fissiamo un numero naturale N˜ > max{N, nK }. Per ogni indice n > N, |pn − `| ≤ |pn − pnK | + |pnK − `| < ε + ε = 2ε. In conclusione, limn→+∞ pn = `. t u Dimostrazione (Dim. del teorema di completezza). Sia {pn }n una successione di Cauchy formata da numeri reali. Dalla definizione di successione di Cauchy segue che {pn }n e` necessariamente limitata.18 Sappiamo (si veda il Teorema 3.5) che ogni successione limitata possiede una sottosuccessione convergente, e chiamiamo ` tale limite. Dalla precedente Proposizione, tutta la successione {pn }n deve convergere a `, e questo conclude la dimostrazione. Il nome di questo teorema e` legato al fatto che gli spazi metrici in cui tutte le successioni di Cauchy sono necessariamente convergenti vengono chiamati completi.
3.8 Appendice: massimo e minimo limite di una successione Releghiamo in questa appendice un concetto di grande importanza nella matematica avanzata, che per`o potrebbe essere tranquillamente ignorato in un corso elementare di calcolo infinitesimale. Cerchiamo di introdurre questa nozione a partire da un’esigenza familiare a chi abbia gi`a studiato il limiti. La successione {(−1)n }n , i cui termini sono alternativamente −1 e +1, ovviamente non e` convergente. Similmente, la successione {cos(nπ)}n non e` convergente, dato che vale −1 per ogni n dispari e 1 per ogni n pari. In entrambi gli esempi, il tratto in comune e` che, mandando n all’infinito in modo opportuno, la successione presenta comportamenti differenti. Questo motiva la seguente definizione. Definizione 3.11. Sia {pn }n una successione di numeri reali. Definiamo lim inf pn = sup inf pn ,
(3.6)
lim sup pn = inf sup pn ,
(3.7)
n→+∞
n→+∞
N∈N n>N
N∈N n>N
chiamati rispettivamente il minimo limite e il massimo limite di {pn }n . Prendiamo pn = (−1)n . Allora lim infn→+∞ pn = −1: infatti, fissato N ∈ N, risulta chiaramente che infn>N (−1)n = −1. Pertanto 18
Lo studente si convinca di questa affermazione. Suggerimento: fissato ε = 1, tutti i numeri della successione, ad esclusione di un numero finito N, distano l’uno dall’altro meno di 1, e possono dunque essere inseriti in un intervallo di ampiezza 1. Allarghiamo ora l’ampiezza di questo intervallo finch´e non vengano intrappolati tutti i primi N termini della successione...
66
3 Successioni di numeri reali
lim inf(−1)n = sup −1 = −1. n→+∞
N∈N
Similmente si verifica che lim supn→+∞ (−1)n = 1. Osservazione 3.17. E` fondamentale osservare che il minimo ed il massimo limite di una successione esistono sempre, finiti o infiniti. Questo segue dal fatto che ogni sottoinsieme della retta reale possiede un estremo inferiore ed un estremo superiore, eventualmente infiniti. Osservazione 3.18. Consideriamo le due successioni p0n = inf pk k>n
p00n = sup pk . k>n
Ora, p0n+1 = infk>n+1 pk ≥ infk>n pk = p0n , mentre p00n+1 = supk>n+1 pk ≤ supk>n pk = p00n . Quindi {p0n }n e` onotona crescente, mentre {p00n }n e` monotona decrescente. Pertanto entrambe possiedono limite, finito o infinito, e risulta lim p0 = lim inf pn n→+∞ n n→+∞ 00 lim p = lim sup pn . n→+∞ n n→+∞ In questo senso, e` letteramente vero che il lim inf e` il “lim dell’inf”, e analogamente per il lim sup. Teorema 3.7. Una successione {pn }n converge al limite ` se e solo se lim inf pn = lim sup pn = `. n→+∞
n→+∞
Di questo teorema non daremo una dimostrazione per esteso. Tuttavia, proponiamo una definizione equivalente di limite inferiore e superiore che lo rende quasi ovvio. Proposizione 3.11. Per una successione {pn }n , il minimo limite e` caratterizzato anche come l’estremo inferiore dell’insieme costituito da tutti i limiti di sottosuccessioni di {pn }n . Similmente, il massimo limite e` caratterizzato anche come l’estremo superiore dell’insieme costituito da tutti i limiti di sottosuccessioni di {pn }n . Osservazione 3.19. In simboli, la proposizione ci dice che lim infn→+∞ pn = inf E, dove E = x ∈ R | esiste una sottosuccessione {pnk }k convergente a x . La caratterizzazione del massimo limite si ottiene evidentemente come lim sup pn = sup E. n→+∞
3.9 Appendice: convergenza secondo Ces`aro
67
3.9 Appendice: convergenza secondo Ces`aro Definizione 3.12. Sia {pn } una successione numerica. Diremo che {pn } converge a p nel senso di Ces`aro, se lim
n→+∞
p1 + p2 + · · · + pn = p. n
(3.8)
Questo tipo di convergenza pu`o essere pensato come una convergenza in media, poich´e il primo membro di (3.8) e` esattamente il limite delle medie della successione {pn }.19 Osservazione 3.20. L’idea della convergenza in media e` senz’altro meno raffinato dell’idea di convergenza in senso ordinario. Ad esempio, la successione divergente20 −1, 1, −1, 1, . . . , e` convergente a zero nel senso di Ces`aro. Infatti, la somma dei primi n termini vale 0 oppure −1, a seconda che n sia pari oppure dispari. In entrambi i casi, la media tende a zero per n → +∞. A ben guardare, la stessa conclusione continua a valere per ogni successione le cui somme p1 + . . . + pn si mantengano limitate rispetto a n. Se la precedente Osservazione mostra che alcune successioni non convergenti in senso ordinario possano invece convergere secondo Ces`aro, il viceversa e` pi`u chiaro. Proposizione 3.12. Ogni successione convergente e` anche convergente secondo Ces`aro, e i limiti coincidono. Dimostrazione. Supponiamo che limn→+∞ pn = p. Per ogni ε > 0, esiste N, numero naturale, tale che |pn − p| < ε per ogni n > N. Quindi, per n > N, (p1 − p) + · · · + (pn − p) p1 + p2 + · · · + pn = ≤ − p n n (p1 − p) + (p2 − p) + · · · + (pN − p) + n (pN+1 − p) + (pN+2 − p) + · · · + (pn − p) . + n Ora, nel termine
19
(p1 − p) + (p2 − p) + · · · + (pN − p) n
Scriviamo queste parole in una nota perch´e non vogliamo turbare eccessivamente chi sta leggendo. Il numeratore della frazione (3.8) e` ottenuta sommando un numero sempre maggiore di termini della successione. In qualche modo, stiamo cercando di sommare infiniti numeri reali. Si vede qui, per la prima volta nel nostro corso, il tentativo di lavorare con le serie numeriche. Ne parleremo dettagliatamente nel prossimo capitolo. 20 In questo caso, si tratta di una successione oscillante.
68
3 Successioni di numeri reali
il numeratore e` indipendente da n, e il denominatore diverge all’infinito. Quindi tale termine sar`a piccolo a piacere, diciamo pi`u piccolo di ε, a patto di scegliere n sufficientemente grande. Nel secondo termine, (pN+1 − p) + (pN+2 − p) + · · · + (pn − p) ≤ n n−N −1 1 ε < ε. ≤ (|pN+1 − p| + · · · + |pn − p|) ≤ n n Quindi, per ogni n > N, abbiamo dimostrato che p1 + p2 + · · · + pn < 2ε, − p n e questo completa la dimostrazione. t u Una interessante generalizzazione, la cui dimostrazione e` assolutamente analoga a quella appena conclusa e` la seguente. Proposizione 3.13. Sia {pn } una successione, e sia {mn } una successione di numeri positivi tali che limn→+∞ m1 + m2 + . . . + mn = +∞. Se pn → p, allora lim
n→+∞
m1 p1 + m2 p2 + . . . + mn pn = p. m1 + m2 + . . . + mn
Ovviamente, scegliendo mn = 1 per ogni n, otteniamo la proposizione dimostrata sopra. Corollario 3.2. Sia {mn } una successione di numeri positivi tali che limn→+∞ m1 + m2 + . . . + mn = +∞. Se {zn } e` una successione tale che lim
n→+∞
allora lim
n→+∞
zn = z, mn
z1 + . . . + zn = z. m1 + m2 + . . . + mn
Dimostrazione. Basta porre mn pn = zn nella Proposizione precedente. t u Corollario 3.3. Sia {Zn } una successione numerica, e sia {Mn } una successione monotona crescente tale che limn→+∞ Mn = +∞. Se lim
n→+∞
allora
Zn − Zn−1 = z, Mn − Mn−1
Zn = z. n→+∞ Mn lim
3.9 Appendice: convergenza secondo Ces`aro
69
Dimostrazione. Se poniamo zn = Zn −Zn−1 e mn = Mn −Mn−1 , allora z1 +z2 +. . .+ zn = Zn e m1 + m2 + . . . + mn = Mn , e il Corollario precedente implica la tesi. t u Osservazione 3.21. Qualche studente avr`a notato che l’ultimo Corollario assomiglia notevolmente al famoso teorema di De l’Hospital (che affronteremo in un successivo capitolo). In qualche senso, possiamo pensare che lim
n→+∞
Zn − Zn−1 = z, Mn − Mn−1
sia una sorta di limite del rapporto fra derivate. Questi teoremi sono essenzialmente dovuti al matematico italiani Ces`aro. Dimostrazioni alternative, e una panoramica di altri casi analoghi, possono essere reperite in [3].
Capitolo 4
Serie numeriche
Per spiegare che cosa sia una serie numerica,1 pensiamo di raccogliere una quantit`a finita di numeri reali, di ordinarli in un certo modo p1 , p2 , . . . , pN e di sommarli: p1 + p2 + . . . + pN . Si pu`o abbreviare questa scrittura introducendo il simbolo di sommatoria ∑: N
∑ pi = p1 , p2 , . . . , pN .
i=1
Osservazione 4.1. L’indice i e` una variabile muta. Qualunque altra lettera potrebbe essere usata senza alterare il valore della somma: N
N
N
∑ pi = ∑ p j = ∑ pk = . . .
i=1
j=1
k=1
Questa operazione e` chiara se sommiamo un numero finito di termini, mentre diventa confusa se vogliamo sommare gli infiniti termini di una successione.
Definizione 4.1. Sia {pn }n una successione di numeri reali. La serie associata a {pn }n e` la successione {sn }n definita dalla formula n
sn =
∑ p j.
j=1
Useremo il simbolo 1
Esistono anche altri tipi di serie: di funzioni, di vettori, ecc.
71
72
4 Serie numeriche
∞
∑ pn ,
n=1
o anche l’abbreviazione ∑n pn , per indicare la successione {sn }n . La successione {sn }n prende il nome di successione delle somme parziali della serie.
Osservazione 4.2. Esplicitamente, s1 = p1 , s2 = p1 + p2 , s3 = p1 + p2 + p3 , ecc. Osserviamo che, data una serie {sn }n , risulta pn = sn − sn−1 , e pertanto e` univocamente individuata la successione che genera la serie. Osservazione 4.3. In esatta analogia con le successioni del capitolo precedente, poco importa da quale valore parte l’indice della serie. Se e` vero che ∞
∑
∞
pn
e
∑ pn
n=1
n=0
rappresentano due serie diverse, tuttavia e` noto che la convergenza della prima equivale alla convergenza della seconda. Per questo motivo, capiter`a di far partire la serie dall’indice 0 o dall’indice 1, a seconda della convenienza. Ovviamente, certe volte la forma della serie impone dei limiti all’indice. Si pensi ad una serie come ∞
1
∑ n−1,
n=2
il cui primo indice e` n = 2 perch´e n = 1 annullerebbe il denominatore. Osservazione 4.4. In relazione all’osservazione precedente, possiamo sfruttare il fatto che l’indice di somma e` una variabile muta per effettuare un’operazione che sar`a il cambiamento di variabile nella teoria dell’integrale di Riemann. Operiamo su un esempio: la serie ∞ 1 ∑ 3n n=1 si trasforma nella serie
∞
1
1
∞
1
∑ 3k+1 = 3 ∑ 3k
k=0
k=0
mediante il cambiamento di indice k = n − 1. Per convincercene, scriviamo “con i puntini” le due serie: ∞ 1 1 1 1 ∑ 3n = 3 + 32 + 33 + . . . n=1
4 Serie numeriche
73
1 1 ∞ 1 = ∑ k 3 k=0 3 3 =
1 1 1 1 + + + . . . + 30 3 32 33
1 1 1 + + +... 3 32 33
Dunque una serie e` semplicemente una successione, il cui termine generale e` costruito sommando i primi termini di un’altra successione. Si pone naturalmente il problema della convergenza delle serie numeriche.
Definizione 4.2. La serie ∑∞ n=1 pn converge al valore S se n
S = lim
n→+∞
∑ p j,
j=1
o, con la notazione usata finora, se S = limn→+∞ sn . Con un leggero abuso di notazione, si scrive S = ∑∞ n=1 pn .
L’angolo dello psichiatra. Gli studenti pi`u attenti si saranno senz’altro accorti della notazione paradossale usata comunemente per indicare una serie. Siccome abbiamo definito una serie come la successione {∑nk=1 pk }n , usare il simbolo ∑∞ n=1 pn significa confondere la serie con il suo limite! Se pensassimo di estendere questo abuso di notazione a tutte le successioni, ci accorgeremmo immediatamente della pazzia compiuta: invece della successione {1/n}n , parleremmo della successione 0, il suo limite. La scrittura abbreviata ∑n pn e` gi`a migliore, ma non esente da critiche. Possiamo confrontare quest’uso “leggero” dei simboli con l’espressione “la funzione x3 ”, che alla lettera non e` affatto una funzione, ma – al massimo – un numero reale. Probabilmente tutto ci o` e` un retaggio della confusione fra successioni, numeri e funzioni che caratterizzava gli albori dell’analisi matematica. Esiste una condizione necessaria e sufficiente per caratterizzare le serie convergenti.
Teorema 4.1 (Criterio di convergenza di Cauchy). Una serie ∑∞ ` n=1 pn e convergente se e solo se, per ogni ε > 0 esiste un numero N ∈ N tale che q
∑ |pn | < ε
n=p
per ogni p, q ∈ N tali che p > N, q > N.
74
4 Serie numeriche
Dimostrazione. E` la traduzione, nel linguaggio delle serie, del teorema di completezza di R. t u A volte si riassume il contenuto di questo teorema dicendo che “le code della serie sono piccole a piacere”.
Corollario 4.1. Se la serie ∑∞ ` convergente, allora limn→+∞ pn = 0. n=1 pn e
Dimostrazione. Se la serie e` convergente, il criterio di Cauchy garantisce che, fissato arbitrariamente ε > 0, esiste N ∈ N tale che, in particolare, k
|pn | = |pk | < ε
∑ n=k−1
per ogni k > N. Ma questa e` la definizione del limite limn→+∞ pn = 0. t u Questo corollario, letto in negativo, afferma che se il termine generale pn di una serie n−1 non tende a zero, allora la serie non pu`o convergere. Ad esempio, la serie ∑n n+2 n−1 non converge, dato che limn→∞ n+2 = 1. Purtroppo, non e` possibile invertire questo ragionamento: vedremo presto che la serie ∑n n12 converge, mentre la serie ∑n n1 non converge. Entrambe hanno tutavia un termine generale tendente a zero. Osservazione 4.5. Dato che una serie e` semplicemente una successione particolare, una serie pu`o convergere o divergere. Nella divergenza sono inclusi tanto la divergenza all’infinito, quanto l’oscillazione. Per esempio, la serie ∑n (−1)n oscilla fra i valori −1 e 0. Esempio: la serie geometrica. Sia q ∈ [0, +∞) un numero fissato. Consideriamo la serie ∞
∑ qn = 1 + q + q2 + q3 + q4 + . . .
n=0
Ci chiediamo se esistano scelte della ragione q che portano ad una serie convergente. Togliendo le parentesi, e` facile convincersi che (1 − q) 1 + q + q2 + q3 + q4 + . . . + qn = 1 − qn+1 . Pertanto,
n
sn =
∑ qk = k=0
1 − qn+1 . 1−q
La successione {sn }n delle somme parziali converge se e solo se limn→+∞ qn+1 esiste finito, e questo accade se se solo se 0 < q < 1. Inoltre, abbiamo anche il valore della serie:
4 Serie numeriche
75 ∞
1
∑ qn = 1 − q
n=0
per 0 < q < 1. Esempio: le serie telescopiche. Vanno sotto tale nome le serie ∑n pn il cui termine generale pu`o essere scritto come pn = qn − qn+1 per una scelta opportuna di {qn }n . E` allora chiaro che n
n
∑ pk = ∑ qk − qk+1 = q1 − q2 + q2 − q3 + q4 − q5 + . . . = q1 − qk+1 . k=1
k=1
Si conclude subito che n
∞
lim ∑ pk = q1 − lim qn+1 . ∑ pn = n→+∞ n→+∞
n=1
(4.1)
k=1
Una serie telescopica converge se e solo se limn→+∞ qn esiste finito. La serie di Mengoli e` un esempio di questa classe di serie: ∞
1
∑ n(n + 1) .
n=1
Poich´e
1 1 1 = − , n(n + 1) n n + 1
possiamo porre qn = 1/n e concludere da (4.1) che la serie di Mengoli converge a 1. In generale, potrebbe non essere evidente fin dall’inizio che una serie e` telescopica. Di primo acchito, la serie ∞
(n + 1)2
∑ log n(n + 2)
n=1
non sembra molto telescopica. Usando per`o le propriet`a dei logaritmi, vediamo che log
(n + 1)2 = 2 log(n + 1) − log n − log(n + 2) n(n + 2) = [log(n + 1) − log n] − [log(n + 2) − log(n + 1)].
La serie e` telescopica con qn = log(n + 1) − log n. Poich´e qn → 0 per n → +∞, da (4.1) deduciamo che questa serie converge a log 2.
76
4 Serie numeriche
4.1 Serie a termini positivi Vanno sotto questo nome le serie i cui termini sono numeri maggiori o uguali a zero. Queste serie presentano una forte peculiarit`a: o convergono o divergono all’infinito. Infatti, se pn ≥ 0 per ogni n, allora n
sn =
n+1
∑ pk ≤ ∑ pk = sn+1 , k=1
k=1
e dunque la serie e` monotona crescente. Sappiamo che una successione monotona o converge o diverge all’infinito, e questo giustifica la precedente affermazione sulle serie a termini positivi. In effetti, vale di pi`u.
Proposizione 4.1. Sia ∑n pn una serie a termini positivi. Questa serie e` convergente se e solo se la successione {sn }n delle sue somme parziali e` limitata dall’alto.
Dimostrazione. Infatti, sappiamo che {sn }n e` monotona crescente. Dalla teoria vista nel capitolo precedente, {sn }n converge se e solo se supn |sn | < +∞, cio`e se e solo se esiste una costante C > 0 tale che sn ≤ C per ogni n. t u Il principale strumento per l’analisi della convergenza delle serie a termini positivi e` il seguente teorema di confronto.
Teorema 4.2. Siano ∑n pn e ∑n qn sue serie a termini positivi. Supponiamo che pn ≤ qn per ogni n sufficientemente grande. 1. Se ∑n qn converge, allora anche ∑n pn converge. 2. Se ∑n pn diverge, allora anche ∑n qn diverge.
Dimostrazione. Nel primo caso, le somme parziali della prima serie sono pi`u piccole delle somme parziali della seconda serie, le quali per ipotesi restano limitate. Perci`o saranno limitate anche le somme parziali della prima serie. Nel secondo caso, le somme parziali della seconda serie sono maggiori delle somme parziali della prima serie. Poich´e queste ultime non sono limitate, non lo saranno nemmeno quelle della serie ∑n qn . t u Osservazione 4.6. Il criterio del confronto e` destinato a fallire per le serie di termini arbitrari. Ad esempio, 1 1 − < 2, n n
4.1 Serie a termini positivi
77
ma la serie − ∑n 1n diverge (a −∞), mentre la serie ∑n n12 converge. Si veda il Corollario 4.3.
Corollario 4.2 (Criterio del confronto asintotico). Siano ∑n pn e ∑n qn sue serie a termini positivi. Supponiamo che lim
n→+∞
pn = ` ∈ (0, +∞). qn
Allora le due serie sono simultaneamente convergenti o divergenti.
Dimostrazione. Per l’ipotesi sul limite, esiste un numero N ∈ N tale che 3 ` qn ≤ pn ≤ `qn 2 2
(4.2)
per ogni n > N. La conclusione segue immediatamente dal criterio di confronto.
t u
Per comprendere la potenza di questo criterio, applichiamolo all’analisi della serie ∞
1
∑ sin n2 .
n=1
Innanzitutto, i termini della serie sono positivi, dal momento che 0 < 1/n < π/2 per ogni n ≥ 1 e la funzione seno e` positiva nell’intervallo (0, π/2). Dal limite notevole limx→0 sinx x = 1 deduciamo che la serie data ha lo stesso comportamento della serie ∞
1
∑ n2 ,
n=1
e presto imparareremo che questa serie e` convergente. Il criterio del confronto asintotico garantisce che anche la serie iniziale converge. Osservazione 4.7. Se nel criterio del confronto asintotico risulta ` = 0, non e` pi`u possibile dedurre che le serie ∑n pn e ∑n qn hanno lo stesso comportamento rispetto alla convergenza. Per convincerci di questo, consideriamo pn = 1/n2 e qn = 1/n. Ovviamente limn→+∞ pn /qn = limn→+∞ 1/n = 0, ma impareremo presto che ∑n n1 diverge, mentre ∑n n12 converge. Non tutto e` comunque perduto: se ` = 0, possiamo concludere che la convergenza di ∑n qn implica la convergenza di ∑n pn . Infatti, per ` = 0 vale solo la seconda disuguaglianza di (4.2), perci`o ∑n pn ≤ (3/2)` ∑n qn . 2 2
Siamo volutamente imprecisi: la conclusione rigorosa sarebbe che le somme parziali della serie con pn sono maggiorate dalle somme parziali della serie con qn . Come sappiamo, il criterio asintotico non pu`o garantire la (4.2) anche per i primi valori di n, e questo potrebbe invalidare la relazione ∑n pn ≤ (3/2)` ∑n qn .
78
4 Serie numeriche
4.2 Criteri di convergenza Ma esistono metodi generali per decidere se una data serie sia convergente? La risposta e` ampiamente affermativa per le serie a termini positivi, ed solo parzialmente affermativa per le serie qualunque. Nel seguito, esporremo alcuni criteri classici per studiare la natura di una serie numerica.
Teorema 4.3 (Criterio della radice). Sia ∑n pn una serie a termini positivi. Supponiamo che √ lim n pn = L. n→+∞
Se L < 1, allora la serie converge; se L > 1, allora la serie diverge. Il criterio non e` applicabile se L = 1.
Dimostrazione. Supponiamo dapprima che L < 1. Preso ε − (1 − L)/2, esiste un √ numero naturale N tale che n pn < L + ε = (1 + L)/2 per ogni n > N. Elevando questa diseguaglianza alla potenza n, 1+L n pn < , 2 1+L n e poich´e la serie geometrica ∑∞ e` convergente3 dal criterio del confronto n=0 2 concludiamo che ∑n pn converge. Se invece L > 1, prendiamo ε = (L −1)/2, e come prima arriviamo a 1+L n √ n p > >1 n 2 per ogni n > N. Quindi {pn }n non tende a zero, e la serie non pu`o convergere. t u
Teorema 4.4 (Criterio del rapporto). Sia ∑n pn una serie a termini positivi. Supponiamo che pn+1 lim = L. n→+∞ pn Se L < 1, allora la serie converge; se L > 1, allora la serie diverge. Il criterio non e` applicabile se L = 1.
Dimostrazione. Supponiamo dapprima che L < 1. Preso ε − (1 − L)/2, esiste un numero naturale N tale che pn+1 /pn < L + ε = (1 + L)/2 per ogni n > N. Quindi pn+1 < pn (1 + L)/2 per ogni n > N. Ma allora 3
Infatti
1+L 2
< 1.
4.2 Criteri di convergenza
79
1+L pn−1 < pn < 2
1+L 2
2
pn−2 < . . .
1+L N+1 2 2
ed ancora una volta il termine generale pn non tende a zero. t u Osservazione 4.8. Lo studente avr`a notato che questi criteri sono semplicemente applicazioni del criterio del confronto con opportune serie geometriche. Le divergenze, invece, sono dedotte dal fatto che viene violata la condizione necessaria per la convergenza di una serie. Intuitivamente, questo fatto ci induce a sospettare che i due criteri non siano particolarmente fini nei casi meno accademici. Come anticipato, nel caso L = 1 nessuno dei criteri e` efficace. Rimandiamo la disamina di questo fatto all’osservazione successiva. Osservazione 4.9. Il criterio del rapporto, di solito, e` di applicazione pi`u immediata. Ormai sappiamo che in matematica non si fanno sconti, e puntualmente ci`o accade anche in questa situazione. Si potrebbe mostrare che il criterio della radice e` pi`u potente: quando e` efficace, lo e` anche il criterio del rapporto. Quando non e` conclusivo (per L = 1), anche il criterio del rapporto non porta ad alcuna conclusione. Per i dettagli, rimandiamo a [30]. Volendo fare dell’ironia, n´e l’uno n´e l’altro sono criteri utili nella “pratica”. Risultano invece importanti nella teoria delle serie di potenze, da cui prende vita l’analisi matematica nel piano complesso. Un criterio piuttosto efficace e` il seguente, a dispetto della formulazione vagamente misteriosa.
Teorema 4.5 (Criterio di condensazione). Sia ∑n pn una serie a termini positivi. Supponiamo che pn+1 ≤ pn per ogni n. Sotto tali ipotesi, la serie ∑n pn converge se e solo se converge la serie
∑ 2k p2k . k
80
4 Serie numeriche
Dimostrazione. Poich´e stiamo lavorando con serie a termini positivi, ci basta dimostrare che le somme parziali di ∑n pn e di ∑k 2k p2k sono simultaneamente limitate o non limitate dall’alto. Siano sn = p1 + p2 + . . . + pn , tk = p1 + 2p2 + . . . + 2k p2k le somme parziali delle due serie. Per n < 2k , sn ≤ p1 + (p2 + p3 ) + . . . + (p2k + . . . + p2k+1 −1 ) ≤ p1 + 2p2 + . . . + 2k p2k = tk e quindi sn ≤ tk . Invece, per n > 2k , sn ≥ p1 + p2 + (p3 + p4 ) + . . . + (p2k−1 +1 + . . . + p2k ) 1 ≥ p1 + p2 + 2p4 + . . . + 2k−1 p2k 2 1 = tk 2 e quindi tk ≤ 2pn . Unendo le due conclusioni, le succesisoni delle somme parziali {sn }n e {tk }k sono simultaneamente limitate oppure illimitate, e questo conclude la dimostrazione. t u Corollario 4.3. Sia α ∈ R fissato. La serie ∑n n1α converge se α > 1, e diverge se α ≤ 1. Dimostrazione. Il caso α ≤ 0 e` semplice, perch´e il termine generale non tende a zero. Applichiamo il criterio di condensazione, e ci riduciamo a studiare la serie 1
∑ 2k 2kα k
= ∑ 2(1−α)k . k
Si tratta di una serie geometrica di ragione 21−α . Essa sar`a convergente se e solo se 21−α < 1, cio`e se e solo se α > 1, e divergente all’infinito per α ≤ 1. Osservazione 4.10. Il Corollario ci convince che i criteri del rapporto e della radice 1 1 ∞ sono insoddisfacenti quando L = 1. Ad esempio, le due serie ∑∞ n=1 n e ∑n=1 n2 hanno entrambe L = 1 (per entrambi i criteri), ma la prima diverge, mentre la seconda 1 converge. La serie ∑∞ o n=1 n prende il nome di serie armonica. La sua divergenza pu` essere mostrata anche direttamente. Chiamando al solito sn la somma dei suoi primi n termini, abbiamo
4.2 Criteri di convergenza
81
s1 = 1 1 3 = 2 2 3 1 1 3 1 1 s3 = + + > + + = 2 2 3 4 2 4 4 1 1 1 1 5 1 1 1 1 s4 = 2 + + + + > 2 + + + + = 5 6 7 8 8 8 8 8 2 s2 = 1 +
e in generale s2n = 1 +
1 1 1 1 +···+ + +···+ = 2 n n+1 2n 1 1 1 1 1 = sn + +···+ ≥ sn + +···+ = sn + . n+1 2n 2n 2n 2
Raddoppiando quindi il numero degli addendi, la somma aumenta almeno di un termine 1/2. Deduciamo che |s2n − sn | ≥ 1/2, e quindi non pu`o essere soddisfatto il criterio di convergenza di Cauchy. Questa serie ci consente un’osservazione di natura pratica. Volendo studiare al computer le serie, pu`o essere molto fuorviante leggere le prime somme parziali e trarne conclusioni sulla convergenza. Infatti, per la serie armonica si ha s1 = 1 s3 < 2 s7 < 3 s15 < 4.
Per arrivare a 10 bisogna sommare pi`u di 1000 termini, e pre superare 20 occorrono fpi`u di un milione di addendi. Se si vuole arrivare a 100, che pure non e` un segno inqeuivocabile della divergenza della serie, occorre sommare circa 1030 termini! 4 E` abbastanza evidente che questa quantit`a di addendi supera ampiamente le capacit`a di calcolo di molti personal computer. Il punto e` che le serie numeriche sono molto sensibili alle piccole perturbazioni dei loro termini. La serie ∞ 1 ∑ n1.01 n=1 ha termini numericamente molto prossimi a quelli della serie armonica, ma nonostante questo e` convergente. Il celebre filosofo francese Voltaire suggeriva maliziosamente al matematico tedesco Gauss che prima di mettersi a fare conti per tre giorni, e` meglio controllare se non si possa usare qualche ragionamento per arrivare in porto in tre minuti.5 4 5
1030 si scrive come 1 seguito da 30 zeri. K.F. Gauss, uno dei pi`u importanti matematici dell’era moderna, aveva una caparbia invidiabile
82
4 Serie numeriche
4.3 Convergenza assoluta e convergenza delle serie di segno alterno Tutti i criteri esposti si applicano alle serie a termini positivi. 6 Ci sono criteri di convergenza per le serie qualunque? Prima di rispondere – e la risposta non sar`a del tutto soddisfacente – introduciamo il concetto di serie assolutamente convergente.
Definizione 4.3. Una serie ∑n pn e` assolutamente convergente se ∑n |pn | e` convergente.
Poich´e |pn | ≥ 0, il concetto di serie assolutamente convergente e` di pertinenza delle serie a termini positivi. Inoltre, le serie assolutamente convergenti sono convergenti. Proposizione 4.2. Ogni serie assolutamente convergente e` anche convergente. Dimostrazione. Basta osservare che pn ≤ |pn | ed applicare il criterio del confronto. qed Osservazione 4.11. La Proposizione non si inverte: vedremo che la serie
∑ n
(−1)n n
converge, ma ovviamente non converge assolutamente (perch´e?). Questo non diminuisce l’utilit`a della Proposizione 4.2. Non saremmo altrimenti in grado di stabilire la convergenza della serie sin n ∑ n3 , n visto che i suoi termini non sono tutti dello stesso segno. Usando per o` la maggiorazione | sin n| ≤ 1, possiamo concludere che questa serie converge assolutamente, e quindi anche in senso ordinario. 7 nel mettersi a fare calcoli. Oggi lo potremmo definire simpaticamente uno “smanettone”. Ad onor del vero, certi problemi matematici possono essere risolti solo ricorrendo a lunghe pagine di calcoli. Quello del matematico come uno scienziato che risolve problemi difficili senza scrivere una sola riga di conti e` un falso mito che lusinga tutti gli studenti del primo anno. L’eleganza formale con cui vengono presentati i teoremi non dovrebbe far passare in secondo piano i sacrifici e gli sforzi dei matematici che li hanno dimostrati per la prima volta. 6 E ` giunto il momento di sfatare un mito: ovviamente questi criteri si applicano altrettanto bene alle serie a termini negativi. L’importante e` che tutti i termini della serie abbiano lo stesso segno. 7 A volte conviene dire che una serie converge semplicemente quando essa converge secondo la definizione generale. In questo modo, si usa un aggettivo per distinguere la convergenza dalla convergenza assoluta.
4.3 Convergenza assoluta e convergenza delle serie di segno alterno
83
Una classe di serie a termine di segno variabile e` quella delle serie a termini di segno alterno. Definizione 4.4. Una serie ∑n pn e` detta serie a termini di segno alterno quando pn pn+1 ≤ 0 per ogni n. Di fatto, la Definizione richiede che ogni coppia di termini successivi nella serie sia costituita da due numeri di segno opposto (o eventualmente nulli). Il caso pi`u frequente e` quello delle serie del tipo
∑(−1)n pn , n
dove pn ≥ 0 per ogni n. Per queste serie esiste un potente criterio di convergenza (ma non di divergenze). Premettiamo un lemma che corrisponde alla formula di integrazione per parti nel calcolo integrale. Lemma 4.1 (Sommatoria per parti). Siano {pn }n e {qn }n due successioni. Poniamo s−1 = 0 e n
sn =
∑ pk k=0
per n ≥ 0. Se 0 ≤ m ≤ n sono numeri naturali, allora m
m−1
∑ pk qk = ∑ sk (qk − qk+1 ) + sm qm − sn−1 qn . k=n
(4.3)
k=n
Dimostrazione. m
m
m
m−1
∑ pk qk = ∑ (sk − sk−1 )qk = ∑ sk qk − ∑ k=n
k=n
k=n
sk qk+1
k=n−1
e l’ultima espressione e` uguale a (4.3). t u
Teorema 4.6 (Criterio di Leibniz). Supponiamo che 1. le somme parziali {sn }n di ∑n pn formino una successione limitata; 2. q0 ≥ q1 ≥ q2 ≥ . . .; 3. limn→+∞ qn = 0. Allora ∑n pn qn converge.
Dimostrazione. Scegliamo M > 0 tale che |sn | ≤ M per ogni n. Fissato arbitrariamente ε > 0, per l’ipotesi 3 esiste un numero naturale N tale che qN ≤ ε/(2M). Per N ≤ n ≤ m, dal Lemma precedente ricaviamo
84
4 Serie numeriche
m m−1 ∑ pk qk = ∑ sk (qk − qk+1 ) + sm qm − sn−1 qn k=n k=n m−1 ≤ M ∑ (sk − sk+1 ) + qm + qn = 2Mqn ≤ 2MqN = ε. k=n Questo dimostra che la serie ∑n pn qn soddisfa la condizione di Cauchy, e quindi converge. t u Corollario 4.4. Supponiamo che 1. |c1 | ≥ |c2 | ≥ |c3 | ≥ . . .; 2. c2n−1 ≥ 0, c2n ≤ 0; 3. limn→+∞ cn = 0. Allora ∑n cn converge. Dimostrazione. Applicare il Teorema precedente con pn = (−1)n+1 e qn = |cn |. t u n
Questo corollario garantisce ad esempio che ∑n (−1) e |cn | = 1/n n converge. poich´ e` decrescente e tende a zero. Si noti il contrasto con la convergenza assoluta, che in questo caso non sussiste. Esistono “infiniti” criteri di convergenza e/o divergenza per le serie (prevalentemente a termini positivi). In questo breve capitolo ne abbiamo discussi alcuni estremamente classici. Lo studente interessato potr`a trovarne altri in [27] e nei testi classici di analisi matematica come [21]. I testi pi`u recenti sembrano dare molto meno peso a questi criteri, dal momento che sono tutti riconducibili al criterio di confronto (eventualmente asintotico). Osservazione 4.12. Mi e` capitato di sfogliare molti libri di analisi matematica. Da matricola ero impressionato dal numero stratosferico di criteri per la convergenza delle serie numeriche. Di primo acchito, lo sconforto prendeva il sopravvento. Poi ho capito che anche in matematica bisogna imparare un po’ di tutto, ma senza esagerare. Quasi nessun working mathematician usa le dozzine di varianti del criterio di convergenza di Raabe, e di sicuro non ha senso impararle tutte a memoria. E` questo uno dei motivi che mi hanno fatto amare il libro di Rudin ( [30]): perch´e la matematica che serve, anche ad alto livello, e` relativamente poca ma densa di significato. Con dieci pagine di topologia generale, si e` pronti per capire tutta l’analisi matematica di base, ma anche molto altro.
Capitolo 5
Limiti di funzioni e funzioni continue
Con questo capitolo, lasciamo il mondo delle successioni, cio`e delle funzioni definite sul dominio N, ed entriamo in quello delle funzioni reali di una variabile reale. Vedremo che anche per queste funzioni e` sensato pensare a un concetto di limite, ed anzi c’`e una maggiore flessibilit`a. Come lo studente avr`a osservato, i limiti delle successioni si calcolano solo per l’indice n → +∞. Parlando in termini estremamente imprecisi, questo non ci sorprende pi`u di tanto. D’altronde, se lo spirito dei limiti e` quello di vedere cosa succede quando una variabile si avvicina a piacere a un valore, una variabile n ∈ N non pu`o avvicinarsi a piacere a un numero reale. Invece, una variabile reale x pu`o senza dubbio essere vicina a piacere a qualunque altro numero reale.
5.1 Limiti di funzioni come limiti di successioni
Definizione 5.1. Sia f : (a, b) → R una funzione, e sia x0 un punto di accumulazione di (a, b). Diremo che limx→x0 f (x) = L, o che f (x) → L per x → x0 , se limn→+∞ f (xn ) = L per ogni successione {xn } di numeri xn ∈ (a, b) con limn→+∞ xn = x0 e xn 6= x0 per ogni n.
Logicamente parlando, questa definizione e` rigorosa: sappiamo calcolare i limiti di succesioni e questo e` tutto quello che la definizione richiede. Confrontando con la definizione di limite per successioni, troviamo immediatamente una diversa caratterizzazione dei limiti di funzioni.1 Per inciso, verificare una relazione di limite con la Definizione 5.1 e` praticamente impossibile. Vedremo fra poco che la condizione (ii) del seguente teorema rende le verifiche pi`u agevoli. 1
In certi testi italiani, il prossimo teorema viene chiamato teorema ponte. Questa terminologia e` per`o poco suggestiva. In matematica, quasi ogni teorema e` un ponte fra due concetti.
85
86
5 Limiti di funzioni e funzioni continue
Teorema 5.1. Siano f e x0 come nella Definizione. Sono equivalenti (i) limx→x0 f (x) = L; (ii) per ogni ε > 0 esiste δ > 0 tale che | f (x) − L| < ε per ogni x ∈ (a, b) tale che 0 < |x − x0 | < δ .
Dimostrazione. Supponiamo che sia vera la (i) ma che la (ii) sia falsa. Allora esiste ε > 0 ed esiste una successione {xn } tale che xn → x0 , xn 6= x0 , ma | f (xn ) − L| ≥ ε. Quest`a e` una contraddizione con l’ipotesi (i), e perci`o anche (ii) deve essere vera. Viceversa, supponiamo che sia vera (ii) e dimostriamo la (i). Sia {xn } una qualunque successione di elementi di (a, b), distinti da x0 e tali che xn → x0 . Fissiamo ε > 0 e sia δ > 0 il numero la cui esistenza e` garantita dall’ipotesti (ii). Definitivamente, 0 < |xn − x0 | < δ , e dunque | f (xn ) − L| < ε. Questo significa esattamente che limn→+∞ f (xn ) = L. t u Invitiamo lo studente ad osservare e memorizzare la richiesta “xn 6= x0 ” e l’equivalente 0 < |x − x0 |. Entrambe significano che, nell’effettuare l’operazione di limite per x → x0 , possiamo (e dobbiamo) trascurare completamente tutto ci`o che avviene nel punto x0 . Nel punto x0 a cui tende la x la funzione f potrebbe tranquillamente non essere definita. Ma anche se lo fosse, il valore f (x0 ) non importerebbe nulla. Per esempio, le due funzioni f (x) = x e
∀x ∈ R
( x, x 6= 0 g(x) = 1, x = 0
assumono valori diversi in x0 = 0, e tuttavia limx→x0 f (x) = limx→x0 g(x) = 0. L’Autore di [17] sottolinea che la richiesta “|x − x0 | > 0” potrebbe tranquillamente essere omessa, perch´e le funzioni che in questo modo non avrebbero limite sarebbero “senza importanza”. Chi scrive rispetta ovviamente questo punto di vista, ma non lo condivide. Il concetto di limite sembra infatti particolarmente significativo proprio perch´e e` applicabile in quei punti vicini a piacere al dominio di definizione (i cosiddetti punti di accumulazione per il dominio di definizione) ma non necessariamente appartenenti al dominio medesimo. Quindi, una scrittura come limx→0+ 1x = +∞ perderebbe di significato. Osservazione 5.1. E` fondamentale che lo studente capisca il seguente fatto: se esiste un δ > 0 come nel punto (ii) del Teorema precedente, anche tutti i numeri positivi δ˜ < δ vanno bene. Nella pratica, questo significa che possiamo sempre considerare restrizioni come δ ≤ 1 quando verifichiamo un limite. In effetti, la dimostrazione di limite non pretende che si individui il migliore δ > 0 che verifichi le richieste.
5.1 Limiti di funzioni come limiti di successioni
87
Per chiarire come si applica la definizione di limite, dimostriamo che per ogni a>0 √ √ lim x = a. x→a √ √ √ √ Infatti, consideriamo la quantit`a x − a; moltiplicando e dividendo per x + a si ottiene2 √ √ |x − a| x − a = √|x − a| √ < √ . x+ a a √ √ √ Fissato allora ε > 0, si avr`a | x − a| < ε non appena x ≥√0 e |x − a| < ε a; la relazione (ii) del Teorema sar`a allora verificata con δ = ε a. Osserviamo che il √ √ x − 0| = risultato vale anche per a = 0, con una diversa dimostrazione. Infatti, | √ x < ε non appena 0 ≤ x < ε 2 . Baster`a scegliere δ = ε 2 . Lo studente ha √ certamente notato che il valore del limite altro non e` che il vax quando x = a. Insomma, sarebbe bastato sostituire x = a nella lore assunto da √ funzione ·. Certamente non e` un caso, e capiremo nel capitolo successivo tutte le ragioni di questa apparente coincidenza. Osservazione 5.2. Una definizione pi`u generale di limite e` la seguente. Sia f : E → R una funzione, definita sull’insieme E ⊂ R. Sia x0 e` un punto di accumulazione di E; diciamo che lim f (x) = L x→x 0
x∈E
se, per ogni successione {xn } di elementi xn ∈ E, escluso al pi`u x0 stesso, convergente a E, accade che limn→+∞ f (xn ) = L. Oppure, in maniera equivalente, se per ogni ε > 0 esiste δ > 0 tale che, per ogni x ∈ E ∩ ((x0 − δ , x0 + δ ) \ {x0 }), accade che | f (x) − L| < ε. Questa definizione si riduce alle precedenti quando E e` un intervallo, e contiene automaticamente i limiti per x → ∞, ma in un corso elementare c’`e il rischio che l’eleganza di questa definizione non venga apprezzata. Introduciamo ora i limiti all’infinito. Vediamo come si esprimono le corrispondenti definizioni.
Definizione 5.2. Sia f : (a, b) → R e sia x0 ∈ [a, b]. Diremo che limx→x0 f (x) = +∞ se per ogni K > 0 esiste δ > 0 tale che f (x) > K per ogni x ∈ (x0 − δ , x0 + δ ).
2
Aumentando il denominatore, la frazione diminuisce. Poich´e disuguaglianza.
√ √ √ x + a > a, e` valida l’ultima
88
5 Limiti di funzioni e funzioni continue
Definizione 5.3. Sia f : (a, b) → R e sia x0 ∈ [a, b]. Diremo che limx→x0 f (x) = −∞ se per ogni K > 0 esiste δ > 0 tale che f (x) < −K per ogni x ∈ (x0 − δ , x0 + δ ).
Definizione 5.4. Sia f : (a, +∞) → R una funzione definita su un intervallo illimitato a destra.3 Diremo che limx→+∞ f (x) = L ∈ R se per ogni ε > 0 esiste M > 0 tale che | f (x) − L| < ε per ogni x > M.
Definizione 5.5. Sia f : (−∞, b) → R una funzione definita su un intervallo illimitato a sinistra. Diremo che limx→−∞ f (x) = L ∈ R se per ogni ε > 0 esiste M > 0 tale che | f (x) − L| < ε per ogni x < −M.
Definizione 5.6. Sia f : (a, +∞) → R una funzione definita su un intervallo illimitato a destra. Diremo che limx→+∞ f (x) = +∞ ∈ R se per ogni K > 0 esiste M > 0 tale che f (x) > K per ogni x > M.
Definizione 5.7. Sia f : (a, +∞) → R una funzione definita su un intervallo illimitato a destra. Diremo che limx→+∞ f (x) = −∞ ∈ R se per ogni K > 0 esiste M > 0 tale che f (x) < −K per ogni x > M.
Ripetiamo che le definizioni scritte qui sopra non sono definizioni indipendenti dalla 5.1. Le abbiamo riportate solo per convenienza, ed invitiamo lo studente a formularle con il linguaggio della Definizione 5.1. Concludiamo con la definizione di limiti per eccesso e per difetto. Definizione 5.8. Sia f : (a, b) → R e sia x0 ∈ (a, b). Diremo che lim f (x) = L
x→x0 −
se per ogni ε > 0 esiste δ > 0 tale che | f (x) − L| < ε per ogni x ∈ (x0 − δ , x0 ). Analogamente, diremo che
5.2 Traduzione dei teoremi sulle successioni
89
lim f (x) = L
x→x0 +
se per ogni ε > 0 esiste δ > 0 tale che | f (x) − L| < ε per ogni x ∈ (x0 , x0 + δ ). La differenza rispetto alla definizione completa di limite e` che alla x e` permesso di avvicinarsi a x0 solo per valori minori oppure maggiori di x0 stesso. La seguente proposizione afferma che una funzione ha limite se, e soltanto se, esistono finiti ed uguali i limiti da destra e da sinistra.
Proposizione 5.1. Sia f : (a, b) → R e sia x0 ∈ (a, b). Sono equivalenti 1. limx→x0 f (x) = L 2. limx→x0 − f (x) = limx→x0 + f (x) = L.
Dimostrazione. E` chiaro che se il limite esiste, a maggior ragione esistono i due limiti direzionali, e coincidono con il valore del limite. Viceversa, supponiamo che i due limiti direzionali esistano e coincidano: sia L il valore comune di questi due limiti. Dalle definizioni, fissato ε > 0, esistono δ − > 0 e δ + > 0 tali che | f (x) − L| < ε se x0 − δ − < x < x0 e | f (x) − L| < ε se x0 < x < x0 + δ + . Definiamo δ = min{δ − , δ + }. Allora, qualunque sia x0 ∈ (x0 − δ , x0 + δ ) \ {x0 }, risulta | f (x) − L| < ε. Poich´e ε > 0 e` arbitrario, questo dimostra che limx→x0 f (x) = L. t u Osservazione 5.3. La precedente Proposizione e` piuttosto intuitiva. Dopotutto, ci sono solo due modi di avvicinarsi ad un punto: da sinistra o da destra. E se il comportamento durante l’avvicinamento da sinistra coincide con il comportamento avvicinandosi da destra, e` naturale credere che il limite debba esistere. Il discorso cambia radicalmente in dimensione maggiore o uguale a due. Gi`a nel piano cartesiano, esistono infiniti modi di avvicinarsi ad un punto: lungo una retta, lungo una spirale, “saltando” da una parte all’altra, ecc. Questo fa presagire che lo studio dei limiti per funzioni di due o pi`u variabili sia alquanto complicato, e che l’avvicinamento lungo direzioni privilegiate non baster`a mai a descrivere interamente i limiti.
5.2 Traduzione dei teoremi sulle successioni La Definizione 5.1 e` come la chiave di un codice segreto: ci permette di tradurre nel linguaggio delle funzioni le propriet`a dei limiti viste per le successioni.4 Ne enunciamo alcune, con l’avvertenza che si tratta solo di alcuni dei casi possibili 4
In questo senso, le successioni sono sufficienti a caratterizzare tutti i limiti delle funzioni reali di una variabile reale. Non si tratta di una banalit`a, visto che concettualmente i limiti di funzione diventano un caso speciale dei limiti di successione. Al fondo c’`e una propriet`a topologica di R che non abbiamo la possibilit`a di discutere in queste pagine.
90
5 Limiti di funzioni e funzioni continue
per le funzioni. Per comodit`a, diamo gli enunciati per limiti al finito, ma enunciati corrispondenti valgono per i limiti all’infinito.
Teorema 5.2 (Unicit`a del limite). Sia f : (a, b) → R e sia x0 ∈ [a, b]. Se limx→x0 f (x) = L1 e limx→x0 f (x) = L2 , allora L1 = L2 .
Teorema 5.3 (Limitatezza locale). Sia f : (a, b) → R e sia x0 ∈ [a, b]. Se esiste finito il limite limx→x0 f (x), allora f e` localmente limitata vicino a x0 . Pi`u esplicitamente, esiste un intorno I di x0 ed esiste un numero C > 0 tali che | f (x)| < C per ogni x ∈ I.
Teorema 5.4. Sia f : (a, b) → R e sia x0 ∈ [a, b]. Se limx→x0 f (x) = L > 0, allora esiste un intorno U di x0 in cui f > 0. Se f ≥ 0 in un intorno di x0 e se esiste il limx→x0 f (x) = L, allora L ≥ 0.
Teorema 5.5 (Due carabinieri). Siano f , g ed h tre funzioni definite in (a, b), e sia x0 ∈ [a, b]. Supponiamo che, per ogni x ∈ (a, b), risulti g(x) ≤ f (x) ≤ h(x). Se limx→x0 g(x) = limx→x0 h(x) = L, allora limx→x0 f (x) = L.
Teorema 5.6. Sia f : (a, b) → R una funzione monotona (crescente oppure decrescente). (i)
Se f e` crescente, allora lim f (x) = sup f (x),
x→b−
(ii)
x∈(a,b)
lim f (x) = inf f (x).
x→a+
x∈(a,b)
Se f e` decrescente, allora lim f (x) = sup f (x),
x→a+
x∈(a,b)
lim f (x) = inf f (x).
x→b−
x∈(a,b)
5.3 Raccolta di limiti notevoli
91
5.3 Raccolta di limiti notevoli I limiti contenuti in questa sezione vanno imparati a memoria, perch´e costituiscono l’ossatura di tutti i limiti che incontreremo nel nostro corso. Osservazione 5.4. Per quanto possa apparire paradossale, praticamente tutti i limiti notevoli sono parte fondamentale della definizione stessa delle varie funzioni elementari. Capita spesso di provare una sgradevole sensazione di smarrimento, pensando ai limiti notevoli: che senso ha calcolare un limite per funzioni che non abbiamo mai definito precisamente? Se qualche studente si sentisse assalito dall’ansia, si rilassi: e` normale!
Proposizione 5.2. Valono le seguenti relazioni di limite. sin x =1 x→0 x 1 − cos x 1 lim = 2 x→0 x 2 tan x =1 lim x→0 x
(5.2)
lim (1 + x)1/x = e
(5.4)
lim
x→0
ex − 1
=1 x log(1 + x) lim =1 x→0 x lim
x→0
(5.1)
(5.3)
(5.5) (5.6)
Dimostrazione. Il primo limite ha una dimostrazione dal sapore geometrico. Innazitutto, la funzione x 7→ sinx x e` pari (lo studente lo verifichi secondo la definizione), e pertanto ci baster`a dimostrare il limite notevole per x → 0+ . Sia x > 0 un angolo “piccolo”. Dalla definizione geometrica di sin x, discende che sin x ≤ x ≤ tan x.5 Nella figura 5.1, Q e` il punto di intersezione fra la circonferenza e il segmento OT , x e` la lunghezza dell’arco PQ, tan x quella del segmento T P. Invece sin x e` la lunghezza del segmento che scende perpendicolarmente dal punto Q fino ad incontrare il segmento OP. Poich´e sin x > 0 per 0 < x < π2 , possiamo dividere queste disuguaglianze per sin x e ottenere x 1 1≤ ≤ , sin x cos x 5 Si tratta di una dimostrazione in cui molto e ` lasciato all’intuizione geometrica, e dunque soggetta a critiche. La prima cosa che si impara quando si affronta la cosiddetta geometria elementare e` che non dobbiamo mai fidarci dei nostri disegni per dimostrare propriet`a geometriche. Rassicuriamo tuttavia lo studente che tutto ci`o che appare in questa dimostrazione potrebbe essere verificato rigorosamente.
92
5 Limiti di funzioni e funzioni continue
e il teorema dei due carabinieri garantisce che limx→0+ sinx x = 1.
Q O
Fig. 5.1 Il limite notevole limx→0+
sin x x
T P
=1
Il secondo limite notevole si ottiene dal primo: 1 − cos x (1 − cos x)(1 + cos x) 1 − cos2 x sin2 x = = 2 = 2 . 2 2 x x (1 + cos x) x (1 + cos x) x (1 + cos x) Quindi sin x 2 1 − cos x 1 1 lim = lim lim 2 = . 2 x→0 x→0 x→0 x x x (1 + cos x) 2 sin x Il terzo limite e` quasi ovvio, basta scrivere tan x = cos x ed usare il primo limite notevole. Il quarto limite e` di solito usato come definizione del numero di Nepero e. Spesso lo si trova scritto nella forma equivalente 1 x lim 1 + = e. x→±∞ x
Gli ultimi due limiti, fra loro equivalenti (suggerimento: cambiare la variabile
5.4 Continuit`a
93
1 + x = et ), possono essere dimostrati solo utilizzando la definizione della funzione esponenziale. Non avendo tempo di discutere la costruzione delle potenze reali con base reale, ci accontentiamo di sapere il valore dei limiti. t u
5.4 Continuit`a E` semplice convincersi che non sempre una funzione ha limite. La funzione f : [0, 1] → R definita da ( 0, x ∈ Q f (x) = 1, x ∈ R \ Q non ha limite per x → 1. Infatti, ogni intorno di 1 contiene infiniti valori di x in cui f (x) = 0, e infiniti valori di x in cui f (x) = 1. 6 D’altronde, anche se il limite esiste, pu`o non aver niente a che vedere con il valore della funzione in quel punto. Abbiamo proprio sottolineato che l’operazione di limite ignora per definizione il valore della funzione nel punto verso cui ci stiamo avvicinando. Tuttavia, tutti noi abbiamo avuto l’impressione, studiando per la prima volta i limiti, che per calcolare un limite di una funzione basta “quasi sempre” sostituire nella funzione il valore a cui ci avviciniamo. Il fatto e` che “quasi tutte” le funzioni di cui calcoliamo i limiti sono continue.
Definizione 5.9. Sia f : [a, b] → R una funzione reale di una variabile reale, e sia x0 ∈ [a, b]. Diciamo che f e` continua nel punto x0 se per ogni ε > 0 esiste δ > 0 tale che | f (x) − f (x0 )| < ε per ogni x ∈ (x0 − δ , x0 + δ ) ∩ [a, b]. Diremo che f e` continua in [a, b] se e` continua in ogni punto x0 ∈ [a, b].
Confrontando questa definizione con quella di limite, abbiamo una caratterizzazione della continuit`a in termini di limiti.7
6
Sempre per lo studente pi`u curioso, risulta lim infx→1− f (x) = 0 < 1 = lim supx→1− f (x) e quindi il limite non esiste. 7 Mentre la Definizione 5.9 ha validit` a generale, il teorema di caratterizzazione non pu`o coprire una caso particolare: quello di una funzione come f : (0, 1) ∪ {2} → R. Ci chiediamo che cosa significhi dire che f e` continua in x0 = 2. La Definizione 5.9 ci dice che nei fatti f e` sempre continua in tale punto, qualunque “sia il valore di f (2). Mentre il teorema di caratterizzazione e` privo di senso: non si pu`o far avvicinare x a 2 restando nel dominio di f . In altri termini, non ha senso scrivere limx→2 f (x). Sembra che la definizione” di continuit`a proposta in [17, Definizione 7.1] risenta di questa scorrettezza. In ogni caso, per un corso come il nostro, il dominio delle funzioni non contiene punti isolati, ed il teorema di caratterizzazione contiene una condizione necessaria e sufficiente per la continuit`a.
94
5 Limiti di funzioni e funzioni continue
Teorema 5.7. Sia f : [a, b] → R una funzione reale di una variabile reale, e sia x0 ∈ [a, b]. La funzione f e` continua in x0 se e solo se limx→x0 f (x) = f (x0 ).
Corollario 5.1. Una funzione f e` continua in un punto x0 appartenente al suo dominio se e solo se lim f (x) = lim f (x) = f (x0 ).
x→x0 −
x→x0 +
Dalle regole per il calcolo algebrico dei limiti, segue immediatamente che tutte le funzioni polinomiali, cio`e le funzione rappresentate da un polinomio a0 + ∑Ni=1 ai xi di qualsiasi grado N ≥ 1 sono continue in ogni punto di R. Infatti, la somma e il prodotto di funzioni continue sono continue. Sono inoltre continue praticamente tutte le funzioni elementari che lo studente conosce: seno, coseno, esponenziali, logaritmi. Osservazione. Capita spesso di sentir dire, anche da persone autorevoli, che la funzione x 7→ 1/x e` discontinua nel punto x = 0. Ora, tale funzione non e` definita in x = 0, ed e` pertanto imbarazzante applicare la definizione di continuit`a in questo caso. Di solito, non si fanno affermazioni relative ad oggetti inesistenti. Per esempio, e` vero o falso che i mandarini alati hanno quattro ruote motrici? E` chiaro che questa discussione ha una natura filosofica: e` lecito attribuire propriet`a a ci`o che non esiste? Io credo che non si possa parlare razionalmente del nulla, ma capisco anche l’altra posizione: il nulla non possiede alcuna propriet`a, proprio perch´e e` nulla. Quindi, una funzione non definita in un punto non possiede la continuit`a, e dunque e` discontinua.8 Poich´e la matematica non e` un dogma di fede, siamo liberi di proporre i nostri punti di vista. Personalmente mi rifiuto di parlare di discontinuit`a al di fuori del dominio di definizione. Torniamo al nostro programma. Abbiamo osservato che effettuando le quattro operazioni algebriche su funzioni continue, otteniamo ancora funzioni continue. Ma che accade se componiamo due funzioni continue? La risposta e` che la composizione e` ancora una funzione continua. A questo risultato premettiamo una Proposizione sul calcolo dei limiti.
Proposizione 5.3 (Cambiamento di variabile nei limiti). Siano date due funzioni f : (a, b) → R e g : (c, d) → R, e siano x0 ∈ (a, b), y0 ∈ (c, d). Se 8
Molti dei pi`u celebri scienziati erano anche filosofi, e queste diatribe hanno a volte rallentato il progresso scientifico. Nelle scienze umane, la sovrapposizione fra progresso scientifico e insegnamento religioso ha generato molte pagine buie della storia del pensiero moderno. In questo senso, una disciplina astratta come la matematica ha sempre goduto di maggiore libert`a.
5.4 Continuit`a
95
(i) g(y) → L per y → y0 , y ∈ (c, d); (ii) f (x) → y0 per x → x0 , x ∈ (a, b); (iii) o g(y0 ) = L o f (x) 6= y0 per ogni x 6= x0 allora limx→x0 g( f (x)) = L.
Dimostrazione. Dimostriamo la Proposizione nel caso in cui valga la seconda alternativa in (iii). Fissiamo ε > 0. Per (i) esiste σ > 0 tale che se y ∈ (c, d), y 6= y0 , |y − y0 | < σ , allora |g(y) − L| < ε. D’altra parte se si ha f (x) ∈ (c, d), per la (iii) f (x) 6= y0 e per la (ii) esiste δ > 0 tale che se 0 < |x − x0 | < δ allora | f (x) − y0 | < σ . Dunque in definitiva se x ∈ (a, b) ∩ f −1 (c, d), x 6= x0 , |x − x0 | < δ , allora |g( f (x)) − L| < ε. Per l’arbitrariet`a di ge > 0, la tesi e` dimostrata. Lasciamo al lettore la dimostrazione, pi u` facile, nel caso in cui g(y0 ) = L. Notiamo che questo significa che g e` continua in y0 . t u Un commento sulla Proposizione. Perch´e abbiamo dovuto introdurre l’alternativa in (iii)? La ragione sta tutta nella condizione “0 < |x − x0 | < δ ” della definizione di limite. In altre parole, non ci interessiamo al valore della funzione nel punto. Quando facciamo la composizione g ◦ f e facciamo tendere x a x0 , per poter usare l’ipotesi (i) dobbiamo accertarci che y = f (x) 6= y0 . In caso contrario, potrebbe accadere un fenomeno bizzarro. Consideriamo la funzione costante f : x 7→ y0 , e la funzione ( 0, y 6= y0 g(y) = 1, y = y0 . Quindi, la funzione composta g ◦ f e` la funzione costante che vale ovunque 1. Si ha f (x) → y0 per x → x0 , g(y) → 0 per y → y0 , ma nessuna delle alternative in (iii) e` soddisfatta. E infatti limx→x0 g( f (x)) = 1 6= 0.
Teorema 5.8. Siano f : (a, b) → R e g : (c, d) → R due funzioni, e siano x0 ∈ (a, b), y0 ∈ (c, d). Se f e` continua in x0 e se g e` continua in y0 = f (x0 ), allora g ◦ f e` continua in g(y0 ).
Dimostrazione. Basta applicare la Proposizione precedente. t u Il problema della continuit`a della funzione inversa si pone in termini analoghi: data una funzione continua ed invertibile, e` vero che la funzione inversa e` continua? Nei limiti del nostro corso, la risposta e` affermativa.9 Proponiamo un enunciato apparentemente pi`u debole di quello che ci piacerebbe dimostrare. 9
Mentre il teorema di continuit`a delle funzioni composte e` un teorema valido in generale, quello di continuit`a della funzione inversa non lo e` . Se studiassimo funzioni definite su insiemi pi`u “grandi” di R occorrerebbero ipotesi supplementari.
96
5 Limiti di funzioni e funzioni continue
Teorema 5.9 (Continuit`a della funzione inversa). Sia f : [a, b] → R una funzione continua e strettamente crescente.10 Allora f e` invertibile, e la funzione inversa f −1 e` strettamente crescente e continua in ogni punto dell’intervallo [ f (a), f (b)].
Dimostrazione. Dobbiamo dimostrare tre cose. 1. La funzione f −1 e` definita nell’intervallo [ f (a), f (b)]. Sia y0 un punto di questo intervallo. Per il teorema dei valori intermedi, essendo f (a) < y0 < f (b), esiste un punto x0 ∈ (a, b) dove f (x0 ) = y0 . QUesto punto x0 e` ovviamente unico, poich´e la funzione f e` strettamente crescente. Quindi ogni punto di [ f (a), f (b)] e` l’immagine di uno ed un solo punto di [a, b], e pertanto f e` biunivoca ed invertibile. Possiamo definire f −1 (y0 ) = x0 . 2. La funzione f −1 e` strettamente crescente. Dobbiamo verificare che y1 < y2 implica che f −1 (y1 ) < f −1 (y2 ). Per il punto precedente, possiamo dire che x1 = f −1 (y1 ) e x2 = f 1 (y2 ). Il nostro scopo e` verificare che x1 < x2 . Se per assurdo x1 ≥ x2 , allora f (x1 ) > f (x2 ) (essendo f strettamente crescente), cio`e y1 > y2 . Ma questo e` impossibile, perch´e abbiamo scelto y1 < y2 . 3. La funzione f −1 e` continua in [ f (a), f (b)]. Questa e` la parte pi`u delicata della dimostrazione. Finora sappiamo che f −1 e` strettamente crescente, ed assume qualunque valore compreso fra f (a) e f (b). Fissiamo un punto y0 ∈ ( f (a), f (b)), quindi un punto interno all’intervallo di definizione di f −1 . Preso arbitrariamente un numero ε > 0, abbiamo gi`a osservato che esistono due punti y1 e y2 tali che f −1 (y1 ) = f −1 (y0 )−ε e f −1 (y2 ) = f −1 (y0 )+ε. Questi punti sono univocamente determinati, poich´e f −1 e` strettamente crescente. Se y1 < y < y2 , abbiamo che f −1 (y1 ) < f −1 (y) < f −1 (y2 ), e dunque f −1 (y0 ) − ε < f −1 (y) < f −1 (y0 ) + ε. Ricapitolando, abbiamo dimostrato che, preso ε > 0, esiste un intorno (y1 , y2 ) di y0 dove la funzione f −1 resta compresa fra f −1 (y0 ) − ε e f −1 (y0 ) + ε. Questa e` la definizione di continuit`a nel punto y0 . La verifica della continuit`a di f −1 anche nei punti f (a) e f (b) richiede solo piccole modifiche. Come anticipato, questo teorema assume per ipotesi la monotonia stretta della funzione, e non gi`a la sua invertibilit`a. Se da un lato sappiamo che ogni funzione strettamente monotona e` invertibile (e lo abbiamo dimostrato poche riga sopra), non e` del tutto scontato che una funzione continua ed invertibile debba essere strettamente monotona. Fortunatamente e` vero, e lo scriviamo in un teorema per dare la giusta enfasi a questa propriet`a. Teorema 5.10. Una funzione f : [a, b] → R continua ed iniettiva, e` strettamente monotona (crescente oppure decrescente). La dimostrazione rigorosa e` un po’ pedante, e ci limitiamo ad invitare lo studente ad intuirla. In breve, prendiamo un punto x1 , e cominciamo a spostare i valori dell’ascissa a destra di x1 : le ordinate devono aumentare oppure diminuire. Non possono
5.6 Infinitesimi ed infiniti equivalenti
97
restare invariate, altrimenti f non sarebbe iniettiva. Supponiamo dunque che f cresca a destra di x1 . Se continua a crescere fino a b, abbiamo finito. Altrimenti arriver`a un momento in cui f smette di crescere ed inizia a decrescere. Ma allora il grafico di f assomiglia al vertice di una parabola, e dunque non pu`o essere una funzione iniettiva!
5.5 Limiti come conseguenza della continuit`a Abbiamo studiato nei paragrafi precedenti che la continuit`a di una funzione in un punto e` , di fatto, la mera uguaglianza del valore della funzione in quel punto e del suo limite. In realt`a, e` possibile anche definire il limite di una funzione mediante una richiesta di continuit`a. Definizione 5.10. Sia f : (a, x0 ) ∪ (x0 , b) → R una funzione reale. Diciamo che limx→x0 f (x) = ` ∈ R se la funzione f˜ : (a, b) → R definita da ( ˜f (x) = f (x) x 6= x0 ` x = x0 e` continua un x0 . E` immediato verificare che questa definizione di limite e` equivalente a quella data qualche paragrafo fa. Riassumendo, e` possibile partire dalla definizione di limite, e definire la continuit`a. Viceversa, e` possibile definire la continuit`a e ricostruire il concetto di limite. Sebbene il primo approccio sia tradizionalmente quello pi`u diffuso, il secondo appare in qualche testo classico di analisi matematica, ad esempio [28]. Possiamo anche parafrasare questa discussione come segue. Proposizione 5.4. Una funzione reale f possiede limite finito ` per x → x0 se e solo se possiede una discontinuit`a eliminabile in x0 . Osservazione 5.5. Restano ovviamente esclusi i limiti infiniti (al finito). Questo non ci deve soprendere troppo, poich´e si tratta di un concetto del tutto distinto da quello dei limiti finiti. Di pi`u, l’idea di limite “finito” si generalizza a funzioni definite su strutture pi`u generali della retta reale, mentre il concetto di infinito e` tipico dei numeri reali.
5.6 Infinitesimi ed infiniti equivalenti Anche per le funzioni e` possibile parlare di infinitesimi ed infiniti equivalenti. Dovrebbe essere chiaro, a questo punto, che le definizioni richiedono qualche sottigliezza.
98
5 Limiti di funzioni e funzioni continue
Definizione 5.11. Siano f e g due funzioni, definite almeno in un intorno bucato (x0 −δ , x0 +δ )\{x0 } di un punto x0 . Supponiamo che limx→x0 f (x) = limx→x0 g(x) = 0 (rispettivamente ∞). Diciamo che f e g sono infinitesimi (rispettivamente infiniti) equivalenti per x → x0 se f (x) = 1, lim x→x0 g(x) e scriviamo f g
per x → x0 .
Osservazione 5.6. E` indispensabile specificare che l’equivalenza sussiste per x → x0 . Ad esempio f (x) = x(x − 1)4 e g(x) = x(x − 1)2 sono infinitesimi equivalenti per x → 0 ma non per x → 1. Osservazione 5.7. A costo di sembrare ottusi, ribadiamo con forza che il quoziente f (x)/g(x) deve tendere a 1: nessun altro numero permetterebbe la sostituzione degli infinitesimi ed infiniti equivalenti nel calcolo dei limiti (vedi sotto). Osservazione 5.8. Siamo stati pedanti nella definizione precedente, almeno nel caso degli infinitesimi. In effetti, avremmo potuto supporre addirittura che f e g fossero continue in x0 . Infatti, le funzioni ( f (x) se x 6= x0 f˜(x) = 0 se x = x0 e
( g(x) se x 6= x0 g(x) ˜ = 0 se x = x0
sono continue in x0 , e si verifica facilmente che f g se e solo se f˜ g˜ per x → x0 . Nel caso degli inifiniti, e` ovviamente insensato pretendere che f e g siano continue se entrambe divergono all’infinito. Osservazione 5.9. E` chiaro che definizioni simili si possono dare per x → ±∞. Ovviamente, la due funzioni dovranno essere definite (almeno) in un intervallo del tipo (a, +∞) oppure (−∞, b). Ad esempio, f (x) = sin(1/x) e g(x) = 1/x sono infinitesimi equivalenti per x → +∞. Vale infine un criterio di sostituzione degli infinitesimi (e degli infiniti) equivalenti, che lo studente potr`a ricostruire per esercizio a partire dall’analogo visto per le successioni (Proposizione 3.9). Per convincere lo studente che il principio di sostituzione degli infinitesimi (ed infiniti) equivalenti non vale in ambito additivo, consideriamo il classico limite lim
x→0
sin x − x . x3
Impareremo presto che tale limite vale −1/6. Ma questo conta poco: vogliamo invece mostrare che sbaglieremmo, se pensassimo di calcolarlo sostituendo sin x con
5.7 Teoremi fondamentali per le funzioni continue
99
x. Infatti, arriveremmo alla situazione assurda lim
x→0
x−x 0 sin x − x = lim 3 = lim 3 . x→0 x x→0 x x3
Ma perch´e stiamo sbagliando? Apparentemente, dovremmo concludere che il limite esiste e vale zero. Invece questo ragionamento non sta in piedi, e ce ne rendiamo conto se proviamo a capire i passaggi nascosti: sin x x sinx x − x x sinx x − 1 sin x − x x −1 = lim = lim = lim , lim 3 3 3 x→0 x→0 x→0 x→0 x x x x2 e questo limite e` ancora una forma di indecisione [0/0]. Insomma, possiamo dire un po’ paradossalmente, che il principio di sostituzione resta “quasi” vero, ma non serve a concludere!
5.7 Teoremi fondamentali per le funzioni continue A parte le traduzioni dei teoremi sui limiti, le funzioni continue godono di propriet`a peculiari, alcune abbastanza intuitive. Se lo studente torna con la memoria alle parole certamente pronunciate dal suo professore di matematica alle scuole superiori, “le funzioni continue sono quelle che si disegnano senza staccare la penna dal foglio”, gli sembrer`a quasi ovvio che una funzione continua che parte negativa e arriva positiva debba necessariamente annullarsi.
Teorema 5.11 (Teorema degli zeri). Sia f : [a, b] → R una funzione continua. Se f (a) f (b) < 0, allora esiste (almeno) un punto x0 ∈ (a, b) tale che f (x0 ) = 0.
Dimostrazione. Supponiamo per comodit`a che f (a) < 0 e f (b) > 0. Il caso f (a) > 0 e f (b) < 0 e` identico. Definiamo l’insieme E = {x ∈ [a, b] | f (x) < 0}. Ovviamente E contiene il punto a, ed e` limitato dall’alto poich´e b ∈ / E. Perci`o esiste in R il numero x0 = sup E. Affermiamo che f (x0 ) = 0. Infatti se f (x0 ) < 0, evidentemente x0 < b. Inoltre per il teorema di permanenza del segno in un intervallo a destra di x0 f sarebbe negativa. Ci sarebbero dunque punti di E maggiori di x0 , e questo non e` possibile perch´e x0 e` l’estremo superiore di E. Se f (x0 ) > 0, allora x0 > a e di nuovo per la permanenza del segno ci sarebbe un intervallo sinistro (x0 − δ , x0 ) di x0 in cui f sarebbe strettamente positiva. I punti di
100
5 Limiti di funzioni e funzioni continue
E sarebbero allora tutti minori di x0 − δ , e dunque x0 ≤ x0 − δ , assurdo. Non resta che f (x0 ) = 0, e il teorema e` dimostrato. t u Di questo, e di altri teoremi che vedremo, esiste una dimostrazione che fa uso delle successioni.11 E` istruttivo presentarne le idee. Si prende a1 = a e b1 = b. Poi si calcola f nel punto mediano, cio`e a1 + b1 . f 2 1 Se questo numero e` negativo, si definisce a2 = a1 +b 2 , altrimenti si definisce b2 = a1 +b1 a1 +b1 2 . Supponiamo, per fissare le idee, che a2 = 2 . Si divide in due l’intervallo a2 +b1 1 [a2 , b1 ] e si calcola f ( 2 ) Se troviamo un valore negativo, definiamo a3 = a2 +b 2 , a2 +b1 altrimenti definiamo b2 = 2 . Facendo sempre lo stesso tipo di ragionamento, si costruiscono due successioni {an } e {bn }, con la propriet`a che f (an ) < 0 e f (bn ) > 0. Inoltre la prima successione e` monotona crescente, mentre la seconda e` monotona decrescente. Infine, poich e´ ogni volta abbiamo dimezzato l’intervallo precedente, risulta b−a (5.7) 0 ≤ bn − an ≤ n . 2
Le successioni monotone limitate12 hanno limite, siano a∞ = lim an , n→+∞
b∞ = lim bn . n→+∞
La relazione (5.7) dice che a∞ = b∞ e il teorema della permanenza de segno dice che f (a∞ ) ≤ 0, mentre f (b∞ ) ≥ 0. Poich´e questi numeri coincidono, dev’essere f (a∞ ) = 0. Abbiamo pertanto individuato un punto di [a, b] dove f si annulla. Il metodo con cui abbiamo costruito a∞ = b∞ si chiama metodo di bisezione, ed e` uno dei primi metodi per il calcolo approssimato delle soluzioni di equazioni del tipo f (x) = 0 con f funzione continua. Pur essendo indubbiamente efficace ed elegante, sono stati sviluppati metodi pi`u veloci basati sul calcolo differenziale.13 Proponiamo un’interessante conseguenza del teorema degli zeri.
11
Del teorema precedente esiste anche una dimostrazione molto elegante basata su argomenti topologici. Si veda [30]. 12 Ovviamente {a } e {b } sono limitate, perch´ e composte di punti dell’intervallo [a, b]. n n 13 Non insistiamo sul fatto che questi metodi funzionano solo per le funzioni del calcolo differenziale, mentre quelle continue sono indiscutibilmente pi`u numerose. D’altra parte, molti problemi delle scienze applicate assumono tacitamente che tutte le quantit`a in gioco siano funzioni estremamente “addomesticate”.
5.7 Teoremi fondamentali per le funzioni continue
101
Teorema 5.12 (Valori intermedi). Una funzione continua definita su un intervallo [a, b] assume tutti i valori compresi fra f (a) e f (b).
Dimostrazione. Senza ledere la generalit`a del discorso, supponiamo f (a) ≤ f (b). Scegliamo y0 ∈ [ f (a), f (b)] e dimostriamo che esiste x0 ∈ [a, b] tale che f (x0 ) = y0 . Se y0 = f (a), basta prendere x0 = a. Analogamente se y0 = f (b). Se f (a) < y0 < f (b), definiamo la funzione ausiliaria g(x) = f (x) − y0 . Ovviamente g : [a, b] → R e` continua, e g(a) = f (a) − y0 < 0, g(b) = f (b) − y0 > 0. Per il teorema degli zeri, esiste x0 ∈ [a, b] tale che g(x0 ) = 0. Ma questo vuole dire che f (x0 ) = y0 . Il teorema e` dimostrato. t u Osservazione 5.10. Come si legge in [17], per molti decenni i matematici hanno ritenuto che la continuit`a fosse del tutto equivalente alla propriet`a dei valori intermedi. Pi`u precisamente, essi pensavano che se una funzione soddisfa la propriet`a dei valori intermedi in un certo intervallo [a, b], allora deve essere continua in [a, b]. Oggi sappiamo bene che questo e` falso, come dimostra la funzione ( sin 1x , se x 6= 0 f (x) = 0, se x = 0. E` facile vedere che, preso arbitrariamente y ∈ [−1, 1], esiste almeno un numero x ∈ R tale che sin 1x = y. 14 Tuttavia f presenta una discontinuit`a in x = 0. Un’altra conseguenza del teorema degli zeri e` il cosiddetto principio dell’intersezione. Lo presentiamo con un ragionamento euristico molto intuitivo: supponiamo che i grafici di due funzioni, f e g, si “scavalchino” passando da un’ascissa a ad un’ascissa b. Se le due funzioni sono continue, e` immediato immaginare che fra a e b i due grafici si debbano intersecare. La giustificazione e` contenuta nel prossimo teorema. Teorema 5.13 (Principio dell’intersezione dei grafici). Siano f e g due funzioni continue, definite nell’intervallo [a, b]. Se f (a) < g(a) e f (b) > g(b), oppure se f (a) > g(a) e f (b) < g(b), allora esiste un punto c ∈ (a, b) tale che f (c) = g(c). Dimostrazione. Supponiamo, per fissare le idee, che f (a) < g(a) e f (b) > g(b). Definiamo una terza funzione h, mediante la formula h(x) = f (x) − g(x) per ogni x ∈ [a, b]. Per ipotesi, h(a) = f (a) − g(a) < 0, mentre h(b) = f (b) − g(b) > 0. Naturalmente, h e` una funzione continua, in quanto differenza di due funzioni continue. Il teorema degli zeri permette di concludere che esiste c ∈ (a, b) tale che h(c) = 0, cio`e f (c) = g(c).
14
Ad esempio x = 1/ arcsin y per y 6= 0. Il caso y = 0 e` altrettanto facile.
102
5 Limiti di funzioni e funzioni continue
Fig. 5.2 La funzione f dell’Osservazione 5.10
5.8 Massimi e minimi In tutte le scienze, pure ed applicate, si pone un problema che possiamo formulare in questi termini: massimizzare (o minimizzare) una certa quantit`a, a sua volta dipendente da altre quantit`a. Massimizzare il risparmio, minimizzare l’attrito, scegliere il percorso mi gliore per raggiungere un indirizzo: sono tutti esempi di ottimizzazione. Poich´e il nostro corso ha carattere elementare, ci limiteremo ad alcune considerazioni relative alle funzioni reali di una variabile reale. Avvertiamo per`o lo studente che si tratta solo del primo approccio ad una teoria molto ricca e difficile, che e` oggetto di ricerca attiva.
Definizione 5.12. Sia f : A ⊂ R → R una funzione definita su un insieme A. Diremo che x0 ∈ A e` un punto di minimo assoluto per f se f (x0 ) = inf f (x). x∈A
Analogamente diremo che x0 ∈ A e` un punto di massimo assoluto per f se f (x0 ) = sup f (x). x∈A
5.8 Massimi e minimi
103
In parole povere, x0 e` un punto di minimo assoluto se f (x0 ) ≤ f (x) per ogni x ∈ A. Invece x0 e` un punto di massimo assoluto se f (x0 ) ≥ f (x) per ogni x ∈ A. Ad esempio, se f (x) = x2 per ogni x ∈ R, e` ovvio che 0 e` un punto di minimo assoluto. Infatti, f (0) = 0 ≤ x2 = f (x) per ogni x ∈ R. Avvertenza. Capita molto spesso di commettere delle piccole inesattezze formali, parlando di massimi e minimi. Il pi`u frequente e` quello di dire “un minimo x0 ” invece di “un punto di minimo x0 ”. A rigor di logica, il minimo e` il valore f (x0 ) della funzione nel punto di minimo. D’altra parte, una volta individuati i punti di massimo e minimo, e` immediato calcolare il valore della funzione in tali punti. Questo spiega la tendenza a privilegiare la variabile indipendente rispetto a quella dipendente. Di solito, il contesto chiarisce da s´e se si stia parlando di punti di minimo oppure di valori di minimo. Consideriamo ora la funzione x 7→ (1 − x2 )2 definita per ogni x reale. Essa e` sempre maggiore o uguale a zero, e vale zero se e solo se x ∈ {−1, 1}. Quindi x = −1 e x = 1 sono gli unici due punti di minimo assoluti. Poich´e limx→±∞ (1 − x2 )2 = +∞, la funzione non e` limitata dall’alto, e non esistono punti di massimo assoluti. Per`o e` intuitivo che la nostra funzione, nell’intervallo [−1, 1], deve avere dei valori maggiori di zero, e per simmetria rispetto all’asse delle ordinate in x = 0 c’`e una “specie di massimo”.
Definizione 5.13. Sia f : A ⊂ R → R una funzione definita su un insieme A. Diremo che x0 ∈ A e` un punto di minimo relativo per f se esiste un intorno U di x0 tale che f (x0 ) ≤ f (x) per ogni x ∈ U ∩ A. Diremo che x0 ∈ A e` un punto di massimo relativo per f se esiste un intorno U di x0 tale che f (x0 ) ≥ f (x) per ogni x ∈ U ∩ A.
Quando si parla di punti di minimo o massimo relativi, si guarda in realt`a la funzione solo “vicino” a tali punti, disinteressandosi completamente di quanto accade “lontano” da essi. Inutile sottolineare che un punto di minimo (o massimo) assoluto e` anche un punto di minimo (o massimo) relativo. Non e` per`o vero il viceversa. Torneremo su queste considerazioni nel capitolo della derivata. Ma la ricerca dei punti di massimo e di minimo e` basata solo su considerazioni speciali, peculiari di volta in volta per la funzione in esame? Se cos`ı fosse, non esisterebbe nemmeno una teoria, ma solamente una raccolta di “trucchi”. Il teorema
104
5 Limiti di funzioni e funzioni continue
pi`u famoso15 che fornisce una garanzia per l’esistenza di punti di massimo e minimo (assoluti) e` dovuto al grande matematico tedesco C. Weierstrass.16
Teorema 5.14 (Weierstrass). Sia f : [a, b] → R una funzione continua, definita su un intervallo chiuso e limitato. Allora f possiede almeno un punto di minimo assoluto ed un punto di massimo assoluto.
Dimostrazione. Presentiamo una tipica dimostrazione che usa le successioni ottimizzanti. Diamo i dettagli per l’esistenza del massimo assoluto, lasciando le ovvie modifiche allo studente per il caso del minimo. Sia M = supx∈[a,b] f (x). Se M = +∞, pe rle propriet`a dell’estremo superiore, per ogni n ∈ N esiste xn ∈ [a, b] tale che f (xn ) > n, Dunque f (xn ) → +∞ per n → +∞. Se M ∈ R, per ogni n ∈ N esiste xn ∈ [a, b] tale che 1 M − < f (xn ) ≤ M n e perci`o f (xn ) → M per n → +∞. In ogni caso, esiste una successione {xn } di punti di [a, b] tale che limn→+∞ f (xn ) = M. Per il Teorema 3.5, la successione {xn } possiede una sottosuccessione {xnk } convergente ad un punto x1 ∈ [a, b]. Siccome f e` continua, f (xn ) → f (x0 ) per n → +∞. Ma allora M = lim f (xn ) = lim f (xnk ) = f (x1 ). n→+∞
k→+∞
Abbiamo cos`ı dimostrato che f (x1 ) = M = supx∈[a,b] f (x). Ci`o implica che M ∈ R e che x1 e` un punto di massimo assoluto per f . t u Di questo importantissimo teorema vogliamo presentare una seconda dimostrazione, basata sul metodo della bisezione. Seguiamo abbastanza fedelmente [17]. Dimostrazione (alternativa). Dimostriamo ad esempio che f ha massimo assoluto. Detto S = supx∈[a,b] f (x), dividiamo l’intervallo I = [a, b] in due intervalli uguali, e siano S1 e S2 gli estremi superiori di f in questi due sottointervalli. Poich´e I e` l’unione di questi sottointervalli, necessariamente S = max{S1 , S2 }. Abbiamo cos`ı individuato un intervallo I1 = [a1 , b1 ] tale che supx∈[a1 ,b1 ] f (x) = S e b1 − a1 = (b − a)/2. Proseguendo allo stesso modo, troveremmo degli int ervalli In = [an , bn ] tali che In ⊂ In−1 , bn − an = (b − a)/2n , e supx∈[an ,bn ] f (x) = S per ogni n ≥ 1. La successione {an } e` monotona crescente, e la successione {bn } e` monotona decrescente. Siccome entrambe sono limitate, necessariamente sono dotate di limite finito. Inoltre, limn→+∞ bn = limn→+∞ an + (b − a) limn→+∞ 2−n = limn→+∞ an . Detto x0 ∈ [a, b] il valore comune dei due limiti, vogliamo dimos trare che f (x0 ) = S. 15 16
Talmente famoso da essere citato perfino in una pubblicit`a televisiva nei primi anni 2000. Una pronuncia accettabile e` [vaierstrass].
5.8 Massimi e minimi
105
Si ha ovviamente f (x0 ) ≤ S. Se fosse f (x0 ) < S, posto 2p = S − f (x0 ), si avrebbe f (x0 ) = S − 2p < S − p e dunque, per il teorema della permanenza del segno, esisterebbe un intorno J di x0 tale che f (x) < S − p per ogni x ∈ J. D’altra parte le successioni {an } e {bn } tendono a x0 , e quindi per n abbastanza grande sia an che bn cadranno in J, e dunque In = [an , bn ] ⊂ J. Ma allora si dovrebbe avere f (x) < S − p per ogni x ∈ In , il che e` in contraddizione con il fatto che supx∈[an ,bn ] f (x) = S. Concludiamo che f (x0 ) = S, e per definizione ci`o significa che x0 e` un punto di massimo assoluto per la funzione f . t u Osservazione 5.11. Per gli studenti pi`u curiosi, segnaliamo che la seconda dimostrazione e` basata sulla forma del dominio di f , un intervallo chiuso e limitato. Il teorema di Weierstrass continua a valere per qualunque funzione continua definita su un insieme chiuso e limitato (ma non necessariamente un intervallo). La dimostrazione alternativa non pu`o essere estesa a questo caso pi`u generale, mentre la prima dimostrazione resta essenzialmente valida. Per capirci, una funzione continua definita sull’insieme (chiuso e limitato) A = {0}∪{1/n | n ∈ N, n ≥ 1} possiede almeno un punto di massimo ed un punto di minimo assoluti in A, ma non e` chiaro come generalizzare l’idea della bisezione all’insieme “stravagante” A. Osserviamo che A e` costituito dai punti della successione {1/n}n≥1 e dal limite 0 di tale successione. Pi`u esplicitamente, questo teorema ci dice che, sotto le ipotesi fatte, esiste un punto x0 ∈ [a, b] di minimo assoluto per f , ed esiste un punto x1 ∈ [a, b] di massimo assoluto per f . Lo studente deve ricordare che il contenuto del Teorema di Weierstrass e` tutto qui. Non si afferma nulla sul numero di punti di massimo o minimo, n´e sulla loro localizzazione nell’intervallo [a, b]. Potrebbero coincidere con gli estremi, potrebbero essere dieci, cento oppure mille. E, purtroppo, non dice come individuarli. In una giornata di pioggia, saremmo tentati di sostenere che allora e` un teorema inutile. In tal caso, faremmo bene ad attendere una giornata di sole per schiarirci le idee. Il teorema appena enunciato ci dice che, sotto le ipotesi scritte, i punti di massimo e minimo assoluti esistono! Sarebbe una tortura dover cercare qualcosa che forse non esiste. Ci sarebbero studenti ormai decrepiti, ancora impegnati a controllare se una funzione ha massimi e minimi.17 Che le ipotesi del teorema di Weierstrass servano proprio tutte, si capisce dai prossimi esempi. Se il dominio della funzione non e` un intervallo chiuso e limitato18 possono sorge problemi. Prendiamo la funzione f : x ∈ (0, 1] 7→ 1/x ∈ R. E` continua sul suo dominio, ma non possiede massimo assoluto. Infatti supx∈(0,1] f (x) = +∞. Il dominio e` un intervallo primo di uno degli estremi. Ma il teorema fallisce anche quando il dominio e` un intervallo non limitato: f : x ∈ R 7→ ex ∈ R e` una funzione continua, priva di massimo e di minimo assoluti. Infine, e` evidente che la continuit`a sia fondamentale. Definiamo f : [−1, 1] 7→ R come 17 E ` un dato di fatto che questi studenti ci sono. Forse perch´e il perfido professore ha chiesto di studiare una funzione che non verifica le ipotesi del teorema di Weierstrass. La matematica e` interessante soprattutto quando obbliga a usare strumenti non ordinari. 18 In realt` a la formulazione generale del teorema di Weierstrass non si limita agli intervalli, ma non abbiamo le conoscenze per scendere nei particolari.
106
5 Limiti di funzioni e funzioni continue
( |x|, x 6= 0 f (x) = 1, x = 0. Questa funzione ha due punti di massimo assoluti negli estremi −1 e 1. Ma non ha minimo assoluto. Infatti infx∈[−1,1] f (x) = 0 ma non esiste nessun x0 ∈ [−1, 1] tale che f (x0 ) = 0. E` chiaro che f non e` continua in x = 0.
5.9 Punti di discontinuit`a
Definizione 5.14. Una funzione e` discontinua in un punto appartenente al suo dominio di definizione, se non e` continua in quel punto.
Osservazione 5.12. La definizione precedente e` opinabile. Ad esempio, tanti studenti sono fermamente convinti che la funzione x 7→ 1/(x − 2) sia discontinua nel punto x = 2. In base alla nostra definizione, la stessa funzione e` continua in tutto il suo dominio di definizione. Chi ha ragione? In matematica la ragione sta sempre dalla parte di chi rispetta assiomi e definizioni. Quindi il problema si scarica sulla “giusta” definizione di punto di discontinuit`a. Quelli che pensano sia pi`u corretto privilegiare l’idea di disegnare un grafico senza staccare la penna dal foglio, diranno sicuramente che c’`e una discontinuit`a in x = 2. Quelli che pensano le funzioni come oggetti dotate inevitabilmente di un dominio di definizione, probabilmente penseranno che non ha senso parlare del comportamento di una funzione laddove non e` nemmeno definita. Poich´e la libert`a di pensiero e` sacra, ma per andare avanti dobbiamo scegliere da che parte stare, d’ora in poi converremo che i punti di discontinuit`a debbano appartenere al dominio di definizione. Pertanto, la nostra funzione x 7→ 1/(x − 2) sar`a considerata continua in tutti i punti del suo campo di esistenza. Pi`u esplicitamente, negando la definizione di continuit`a nel punto x0 del dominio di definizione di f , si ottiene la seguente caratterizzazione.
Proposizione 5.5. Sia f : [a, b] → R una funzione, e sia c ∈ [a, b]. Sono equivalenti: • f e` discontinua in x0 • esiste ε0 > 0 tale che, per ogni δ > 0 esiste almeno un punto xδ ∈ [a, b] con la propriet`a che |xδ − x0 | < δ , ma | f (xδ ) − f (x0 )| > ε0 .
5.9 Punti di discontinuit`a
107
In pratica, una funzione f e` discontinua in x0 se vale una delle seguenti alternative: 1. limx→x0 f (x) esiste (finito o infinito) ma e` diverso dal valore f (x0 ); 2. limx→x0 f (x) non esiste. Questo ci conduce ad una grossolana classificazione dei punti di discontinuit`a. Un primo caso e` quello dell’ultimo esempio della sezione precedente. La nostra funzione “vorrebbe” essere continua, per`o noi le imponiamo di non esserlo. Formalmente, ci`o accade quando limx→x0 f (x) esiste finito, ma e` diverso da f (x0 ). Si usa parlare di discontinuit`a eliminabile in x0 . Per quanto detto sopra, il punto x0 dovrebbe necessariamente appartenere al dominio di definizione della funzione f . Tuttavia, proprio per il fatto che ci accingiamo a definire opportunamente il valore f (x0 ), non e` il caso di essere troppo rigidi. In pratica, se abbiamo una funzione fatta in modo che limx→x0 f (x) esiste finito, parliamo comunque di discontinuit`a eliminabile in x0 , senza neanche controllare se x0 appartenga oppure non appartenga al dominio di f . Basta infatti definire una nuova funzione ( x 6= x0 ˜f (x) = f (x), limx→x0 f (x), x = x0 . Questa funzione coincide con f dappertutto, tranne in x0 . Inoltre f˜ e` continua in x0 , poich´e f˜(x0 ) = limx→x0 f˜(x) = limx→x0 f (x).19 Un secondo caso e` quello di una funzione in cui lim f (x) 6= lim f (x),
x→x0 −
x→x0 +
pur essendo entrambi numeri reali. Il valore di f (x0 ) poco importa, non ci sono speranze che f sia continua in x0 . Intuitivamente, f “salta” dal valore limx→x0 − f (x) al valore limx→x0 + f (x). Si parla di discontinuit`a a salto in x0 . Infine, restano... tutti gli altri casi immaginabili. Ad esempio se almeno uno dei due limiti destro e sinistro e` infinito, oppure se il limite limx→x0 f (x) non esiste, oppure se uno solo dei limiti destro e sinistro non esiste. Parleremo di discontinuit`a di terza specie, senza addentrarci in ulteriori classificazioni. Per concludere, segnaliamo un comodo criterio per dimostrare che una funzione e` discontinua in un certo punto.
Proposizione 5.6. Sia f : [a, b] → R una funzione, e sia x0 ∈ [a, b]. Se esistono due successioni {xn0 }n e {xn00 }n di punti di [a, b] tali che xn0 → x0 , xn00 → x0 , ma limn→+∞ f (xn0 ) 6= limn→+∞ f (xn00 ), allora f e` discontinua in x0 .
19 Uno studente spiritoso potrebbe sollevare la seguente obiezione: se e ` permesso cambiare la funzione, qualunque funzione diventa continua. E` un po’ provocatorio, ma ha un fondo di verit`a: se iniziamo giocando a pallacanestro, non possiamo finire giocando a briscola.
108
5 Limiti di funzioni e funzioni continue
Dimostrazione. Infatti, se per assurdo f (x0 ) = limx→x0 f (x), allora tutte le successioni {xn }n di punti di [a, b], convergenti a x0 , dovrebbero essere tali che f (xn ) → f (x0 ). Questo evidentemente contraddice l’esistenza delle due successioni {xn0 }n e {xn00 }n .
5.10 Appendice: limite inferiore e superiore per una funzione Anche per le funzioni reali di una variabile reale e` possibile introdurre un concetto di limite inferiore e superiore, analogamente a quanto gi`a fatto per le successioni di numeri reali. Definizione 5.15. Sia f : I → R una funzione definita sull’insieme I ⊂ R, e sia x0 un punto di accumulazione di I. Un numero `, finito o infinito, e` un valore limite di f per x → x0 se, per ogni intorno U di x0 ed ogni intorno V di `, esiste almeno un elemento x ∈ I ∩U e distinto da x0 , tale che f (x) ∈ V . Infine, si chiama classe limite della funzione f per x → x0 l’insieme Λ 20 dei valori limite. Qualche parola di commento: I e` , molto spesso, un intervallo. Ad esempio, se I = (a, b], allora x0 dovr`a appartenere a [a, b]. Se I = (a, +∞), la definizione precedente permette di considerare ogni x0 ≥ a, ed anche x0 = +∞. In questo modo, abbiamo riunito in un’unica definizione tanto il caso in cui x tenda ad un numero reale, quanto il caso in cui tenda all’infinito. Segue dalla definizione che i valori limite possiedono una caratterizzazione “dinamica”, intermini di limiti di successioni. Lemma 5.1. Nelle ipotesi della definizione precedente, ` e` un valore limite se e solo se esiste una successione {xn }n di punti di I \ {x0 } tale che limn→+∞ xn = x0 e limn→+∞ f (xn ) = `. Definizione 5.16. Il limite inferiore di f , per x → x0 , e` il numero (finito o infinito) lim infx→x0 f (x) = infΛ . Analogamente, il limite superiore di f per x → x0 e` il numero (finito o infinito) lim supx→x0 f (x) = supΛ . Vediamo qualche esempio. Sappiamo gi`a che il limx→0 1x non esiste. Infatti, lim infx→0 1x = −∞. Per verificarlo, usiamo la caratterizzazione “dinamica”. Se consideriamo la successione xn = −1/n, che ovviamente tende a 0 per difetto, vediamo che f (xn ) = −n → −∞. Quindi −∞ e` un valore limite, ed ovviamente e` il pi`u piccolo valore limite. In maniera del tutto analoga, si verifica che lim supx→0 1x = +∞. Meno diretto, ma pi`u sorprendente, e` il caso delle funzioni goniometriche all’infinito. Ad esempio, quanto vale lim supx→+∞ sin x? Per rispondere, usiamo la definizione di valore limite. Consideriamo il grafico della funzione seno, che e` una funzione periodica di periodo 2π. Innanzitutto, poich´e −1 ≤ sin x ≤ 1 per ogni x, 20
Si pronuncia: lambda.
5.10 Appendice: limite inferiore e superiore per una funzione
109
la classe limite e` necessariamente un sottoinsieme di [−1, 1]. Ci proponiamo di dimostrare che Λ = [−1, 1]. Infatti, scegliamo un qualsiasi numero ` ∈ [−1, 1], e tracciamo nel grafico la retta orizzontale y = `. Essa incontrer`a il grafico della funzione seno infinite volte. Se ordiniamo questi punti di intersezione in una successione {xn }n , ci accorgiamo che limn→+∞ xn = +∞, e che sin xn = ` per ogni n. Quindi ` appartiene alla classe limite della funzione seno per x → +∞. Perci`o [−1, 1] ⊂ Λ . Per definizione lim supx→+∞ sin x = sup[−1, 1] = 1. Lasciamo allo studente il compito di verificare (ma in realt`a si tratta quasi di ricopiare le frasi appena lette) che lim infx→+∞ sin x = −1. Un esercizio pi`u impegnativo, ma istruttivo, e` quello di dimostrare la seguente affermazione. Proposizione 5.7. Nelle ipotesi della Definizione 5.15, la funzione f ammette limite (finito o infinito) per x → x0 se, e solo se, lim infx→x0 f (x) = lim supx→x0 f (x). Osservazione 5.13. Nell’esposizione di questi argomenti, abbiamo volutamente considerato in un contesto unitario sia i limiti finiti che quelli infiniti. Ovviamente, chi preferisce essere “massimalista”, e sostiene che limx→0+ 1/x non esiste perch´e i limiti devono essere numeri reali, si trover`a obbligato ad introdurre un gran numero di casi particolari. Si rifletta sul fatto che, anche se non l’abbiamo mai scritto esplicitamente, il limite inferiore e quello superiore di una funzione esistono sempre, finiti o infiniti. Questo sarebbe falso, se ci limitassimo a considerare i limiti finiti.
Capitolo 6
Il calcolo differenziale
Siamo arrivati al cuore del nostro corso: introdurremo finalmente lo strumento principale per analizzare il comportamento di una funzione. Molti studenti universitari conoscono gi`a la derivata e le sue applicazioni. Li invitiamo a non commettere uno degli errori pi`u spiacevoli, quello di vivere di rendita sui ricordi liceali. Vedremo presto che a noi interessa esporre con rigore la teoria delle funzioni derivabili, mentre nelle scuole superiori c’`e la comprensibile tendenza a nascondere sotto il tappeto le difficolt`a e le patologie. Non tutte le funzioni sono derivabili, anzi la famiglia delle funzioni derivabili e` una sparuta minoranza nell’universo delle funzioni continue.1
6.1 Variazioni infinitesime Spiegare che cosa sia la derivata senza essere bourbakisti2 non e` un compito facile. C’`e chi ama parlare di rette tangenti, chi di velocit`a ed accelerazione. Per tutte queste motivazioni storico–filosofiche, rimandiamo lo studente ad uno dei testi citati in bibliografia. In ogni caso, l’idea innovativa in comune e` quella di variazione infinitesima di una funzione. Ricordiamo che, data una funzione f : (a, b) → R, la variazione di f nel punto x0 ∈ (a, b) di incremento h e` il rapporto 1
Questa frase non e` una sciocchezza. Esistono strumenti matematici che “misurano” la percentuale di funzioni derivabili fra le funzioni continue. E il risultato, sorprendente sono per chi si avvicina all’ Analisi Matematica per la prima volta, e` che le funzioni derivabili sono davvero poche. 2 Dal nome di Nicholas Bourbaki. E ` il nome collettivo di un gruppo di matematici francesi che, nel XX secolo, decisero di rifondare la matematica moderna da un punto di vista completamente deduttivo. Nei loro libri non si trovano spiegazioni discorsive, ma solo definizioni seguite da teoremi e corollari. E` un approccio affascinante alla matematica, ma considerato da molti pedagogicamente disastroso. Chi scrive ha sempre considerato i libri pieni di grafici, figure e divagazioni ` pi`u dura. varie piuttosto fuorvianti. Danno la sensazione che tutto sia facile, mentre la realt`a ben Se a molti basta avere una percezione del proprio giardino, a molti altri farebbe comodo dare uno sguardo all’intera citt`a. Le parabole sono funzioni continue, ma ci sembra pi`u conveniente definire in astratto la continuit`a e poi applicarne i risultati alle parabole.
111
112
6 Il calcolo differenziale
∆f f (x0 + h) − f (x0 ) (x0 , h) = . ∆x h Questo rapporto e` ben definito quando |h| e` sufficientemente piccolo, in modo che x0 + h ∈ (a, b). Ha allora senso domandarsi che cosa rappresenti il limite lim
h→0
f (x0 + h) − f (x0 ) ∆f (x0 , h) = lim . h→0 ∆x h
Spesso questo limite non esiste nemmeno; se consideriamo il punto x0 = 0 e la funzione f (x) = |x|, allora lim
h→0−
|h| f (x0 + h) − f (x0 ) = lim = −1, h→0− h h
mentre lim
h→0+
f (x0 + h) − f (x0 ) |h| = lim = 1, h→0+ h h
Per altre funzioni, tale limite esiste banalmente. Prendiamo le funzioni costanti: f (x) = q per ogni x reale. Allora lim
h→0
q−q f (x0 ) + h) − f (x0 ) = lim = 0, h→0 h h
qualunque sia x0 . Questo non ci soprende, dato che la variazione di una funzione costante non pu`o che essere nulla, anche prima di prendere il limite per h → 0. Se invece f (x) = mx + q e` una generica funzione lineare, calcoliamo lim
h→0
f (x0 ) + h) − f (x0 ) [m(x0 + h) + q] − [mx0 + q] = lim = m. h→0 h h
La variazione infinitesima di una funzione lineare coincide in ogni punto con il coefficiente angolare m. Anche per la parabola f (x) = x2 si fanno i calcoli agevolmente: lim
h→0
(x0 + h)2 − x02 f (x0 ) + h) − f (x0 ) = lim h→0 h h x02 + 2x0 h + h2 − x02 = lim h→0 h = lim 2x0 + h = 2x0 . h→0
Per la funzione x 7→ x2 , la variazione infinitesima dipende esplicitamente dal punto x0 in ci la calcoliamo, e il risultato e` 2x0 .
Definizione 6.1. Sia f : (a, b) → R una funzione data, e sia x0 ∈ (a, b) un
6.1 Variazioni infinitesime
113
punto di (a, b). Chiamiamo derivata di f in x0 il numero D f (x0 ) = lim
h→0
f (x0 + h) − f (x0 ) , h
(6.1)
a patto che tale limite esista finito. Diremo che f e` derivabile in x0 se esiste la derivata D f (x0 ).
Altre notazioni di uso comune per la derivata sono d f df 0 , f˙(x0 ) (x0 ), f (x0 ), dx dx x=x0 La prima e` forse la pi`u diffusa e popolare, la seconda e la terza sono dovute a Leibniz, mentre la quarta e` dovuta ad Isaac Newton. Quest’ultima e` ancora oggi la notazione preferita in Fisica e in Meccanica, dove la Seconda Legge di Newton ha la forma mx¨ = F. Avvertenza. La derivata e` un’operazione che dipende dalla funzione f e dal punto x0 . In particolare, il nome della variabile indipendente non riveste alcun ruolo. Ecco perch´e non amiamo particolarmente la notazione ddxf . Quella x a denominatore ha un’evidenza che non le compete. Infatti, se usiamo una scrittura come f (t) = t 2 , dobbiamo scrivere ddtf . Il grande vantaggio della notazione “frazionaria” ddxf e` che permette di scrivere formule come d sin x = cos x. dx La notazione D(x 7→ sin x)(x) = cos x, per quanto logicamente pi`u corretta, sembra improponibile. Lo studente e` libero di scegliere la notazione preferita, con la consapevolezza che d sin x = cost dt e` una immane sciocchezza. L’importante e` che, compiuta una scelta, ad essa ci si attenga con coerenza. Prima di procedere, osserviamo che la derivata e` anche caratterizzata dall’uguaglianza f (x) − f (x0 ) D f (x0 ) = lim . x→x0 x − x0
114
6 Il calcolo differenziale
Infatti, basta cambiare variabile: x = x0 +h e osservare che x → x0 se e solo se h → 0.
Proposizione 6.1. Ogni funzione derivabile in un punto e` anche continua in quel punto.
Dimostrazione. Sia f derivabile in x0 . Allora lim f (x0 + h) − f (x0 ) = lim
h→0
h→0
f (x0 + h) − f (x0 ) · h = D f (x0 ) · 0 = 0. h
Quindi, ricordando l’osservazione che precede questa Proposizione, vediamo che u f (x0 ) = lim f (x), e la tesi e` dimostrata. t x→x0
Non soltanto esistono funzioni continue ma non derivabili in un singolo punto: Carl Weierstrass ha dimostrato il seguente, sorprendente, risultato. Teorema 6.1 (Weierstrass). E` possibile costruire una funzione, definita in tutto R, che non e` derivabile in alcun punto. Il bello e` che la dimostrazione e` costruttiva, cio`e si pu`o scrivere una formula che definisce tale funzione. Si tratta comunque di una definizione un po’ particolare, che richiede la conoscenza delle serie di funzioni. Una dimostrazione alternativa e` contenuta in [27, Theorem 1.2, pag. 192], ma richiede un paio di pagine di calcoli! Vediamo adesso che la derivata identifica in modo univoco una retta che rappresenta la migliore approssimazione lineare di ogni funzione derivabile. Proposizione 6.2. Sia f : (a, b) → R una funzione, e sia x0 ∈ (a, b). Sono equivalenti: (i) f e` derivabile in x0 ; (ii) f e` continua in x0 , e la retta di equazione y = D f (x0 )(x − x0 ) + f (x0 ) approssima la funzione f localmente, nel senso che lim
x→x0
f (x) − (D f (x0 )(x − x0 ) + f (x0 )) = 0. x − x0
Lasciamo la dimostrazione per esercizio. La retta y = D f (x0 )(x − x0 ) + f (x0 ) si chiama retta tangente al grafico di f nel punto (x0 , f (x0 )).
6.2 Il calcolo delle derivate Quando un esercizio chiede di calcolare la derivata della funzione
6.2 Il calcolo delle derivate
115
f (x) = sin
p 5
1 + log(x − 2),
di sicuro nessuno studente di buon senso cercher`a di applicare la definizione di derivata. Esistono infatti alcune regole di derivazione, piuttosto facili da memorizzare, che ci aiutano a calcolare senza fatica le derivate di funzioni anche molto complicate.
Teorema 6.2. Siano f e g due funzioni derivabili in un punto x0 . Sia c un numero reale. Allora le funzioni x 7→ f (x) + g(x), x 7→ f (x)g(x) e x 7→ c f (x) sono derivabili in x0 , e valgono le identi`a 1. D( f + g)(x0 ) = D f (x0 ) + Dg(x0 ); 2. D(c f )(x0 ) = cD f (x0 ); 3. D( f g)(x0 ) = D f (x0 )g(x0 ) + f (x0 )Dg(x0 ) (regola di Leibniz). Infine, se Dg(x0 ) 6= 0, allora anche la funzione x 7→ f (x)/g(x) e` derivabile in x0 , e vale l’identit`a D f (x0 )g(x0 ) − f (x0 )Dg(x0 ) f (x0 ) = . D g (g(x0 ))2
Dimostrazione. Le prime due formule sono facilissime da dimostrare, e lasciamo i dettagli allo studente. La terza formula richiede il trucco di aggiungere e togliere una quantit`a opportuna. Facciamo il limite del rapporto incrementale per la funzione f g: f (x)g(x) − f (x0 )g(x0 ) x − x0 f (x)g(x) − f (x0 )g(x) + f (x0 )g(x) − f (x0 )g(x0 ) = lim x→x0 x − x0 f (x) − f (x0 ) g(x) − g(x0 ) = lim g(x) − f (x0 ) x→x0 x − x0 x − x0 = D f (x0 )g(x0 ) + f (x0 )Dg(x0 ). lim
x→x0
La dimostrazione della formula per la derivata del quoziente potrebbe essere fatta in modo analogo. Invece, dimostriamola innanzitutto nel caso f (x) = 1 per ogni x: lim
x→x0
1 g(x)
− g(x1
0)
x − x0
Osservando che, per ogni x risulta
g(x0 ) − g(x) 1 x − x0 g(x)g(x0 ) Dg(x0 ) =− . (g(x0 ))2 = lim
x→x0
116
6 Il calcolo differenziale
f (x) 1 = f (x) , g(x) g(x) possiamo applicare la regola per la derivata del prodotto e l’ultima formula, ottenendo la derivata del quoziente. t u Quindi, attenzione: la derivata della somma e` la somma delle derivate, ma la derivata del prodotto e` molto diversa dal prodotto delle derivate! Un’altra regola di derivazione riguarda le funzioni composte.
Teorema 6.3 (Regola della catena). Siano f : (a, b) → R, g : (c, d) → R con f ((a, b)) ⊂ (c, d).3 Se f e` derivabile in x e se g e` derivabile in f (x), allora g ◦ f e` derivabile in x e vale la relazione D(g ◦ f )(x) = Dg( f (x))D f (x).
Dimostrazione. La funzione v : (c, d) → R data da ( g(y)−g( f (x)) y− f (x) , se y 6= f (x) v(y) = Dg( f (x)), se y = f (x) e` continua in f (x) perch´e g e` per ipotesi derivabile in f (x). Inoltre per ogni h sufficientemente piccolo si pu`o scrivere g( f (x + h)) − g( f (x)) f (x + h) − f (x) = v( f (x + h)) h h come si verifica subito distinguendo i due casi f (x + h) 6= f (x) e f (x + h) = f (x). Per h → 0 si ha f (x + h) → f (x), v( f (x + h)) → v( f (x)) = Dg( f (x)) per il teorema di continuit`a delle funzioni composte. Quindi g( f (x + h)) − g( f (x)) = Dg( f (x))D f (x), h→0 h lim
e il teorema e` dimostrato. t u Osservazione 6.1. La precedente dimostrazione contiene in realt`a una definizione equivalente di derivabilit`a per una funzione f , introdotta da Weierstrass. Una funzione f , definita almeno in un intorno del punto x0 , e` derivabile in x0 se e solo se esiste una funzione continua ω tale che f (x) = f (x0 ) + ω(x)(x − x0 ),
per ogni x.
Infatti, la funzione continua ω e` univocamente individuata dalla formula
6.2 Il calcolo delle derivate
117
( ω(x) =
f (x)− f (x0 ) , x−x0
D f (x0 ),
x 6= x0 x = x0 .
Leggendo fra le righe la dimostrazione del teorema precedente, lo studente osserver`a che la funzion v gioca esattamente il ruolo di ω per la funzione g invece che per f . Usando la notazione “frazionaria” per le derivate, ponendo y = y(x),
w = w(y),
la regola di derivazione delle funzioni composte prende la forma suggestiva dw dw dy = . dx dy dx Lo studente avr`a notato che la dimostrazione dell’ultimo teorema non e` affatto scontata. Per spiegarne l’aspetto pi`u delicato, introduciamo la notazione ∆f f (x + h) − f (x) = ∆x h per il rapporto incrementale. Scriviamo per semplicit`a y = f (x). Ora, non e` vero che ∆ (g ◦ f ) ∆ g ∆ y = . ∆x ∆y ∆x Il punto e` che potremmo aver diviso per zero, operazione vietata in matematica. Nessuno pu`o garantire che ∆ y = f (x+h)− f (x) 6= 0, a meno di supporre che D f (x) 6= 0. Tuttavia, sarebbe assolutamente pretestuoso aggiungere questa ipotesi nel teorema, che infatti vale comunque.4 Per applicare la regola della catena, occorre imparare ad isolare gli “atomi” che compongono una funzione. Tutte le funzioni di questo corso sono solo somme, prodotti, quozienti e composizioni delle solite funzioni elementari. Per esempio x 7→ sin(1 + x) si decompone nella composizione x 7→ 1 + x 7→ sin(1 + x). Quindi d sin(1 + x) = cos(1 + x) · 1, dx poich´e f (x) = 1 + x e g(y) = sin y. E` molto utile ragionare come se fossimo una calcolatrice: ci viene fornito x, e su tale variabile facciamo delle operazioni. Nell’esempio, prima calcoliamo 1 + x, e poi calcoliamo il seno del risultato. Ecco dunque 4 D’accordo, lo studente e ` libero di credere che si commetterebbe un peccato veniale. In matematica, purtroppo, le dimostrazioni sono giuste o sbagliate. Spiace comunque notare che parecchi libri di testo, sia per le scuole superiori che per l’universit`a, propongono una dimostrazione sbagliata della regola della catena.
118
6 Il calcolo differenziale
le due funzioni che compongono x 7→ sin(1 + x). Non c’`e nulla di sbagliato in questo approccio, anche se presto si impara a raggruppare le operazioni pi`u comuni. Se e` vero che per la funzione x 7→ 3x + 2 si prende x, si trova 3x e poi si trova 3x + 2, ben poche persone applicano la regola della catena a questa funzione. Pi`u semplicemente, si nota che d d d (3x + 2) = (3x) + 2 = 3. dx dx dx Il risultato deve essere lo stesso, ma l’esperienza aiuta sempre a scegliere quale strada prendere per giungere rapidamente al traguardo. Esiste naturalmente una formula di derivazione della funzione inversa. Purtroppo, l’enunciato sembra pi`u difficile di quanto non lo sia davvero.
Teorema 6.4 (Derivata della funzione inversa). Sia f : (a, b) → (c, d) una funzione biunivoca e derivabile nel punto x0 ∈ (a, b). Allora la funzione inversa f −1 : (c, d) → (a, b) e` derivabile nel punto y0 = f (x0 ) ∈ (c, d), e vale la relazione 1 D f −1 (y0 ) = . (6.2) D f (x0 )
Dimostrazione. La dimostrazione e` diretta: siano y0 = f (x0 ) e k = f (x0 + h) − f (x0 ). Per la continuit`a della funzione inversa, k → 0 per h → 0. Quindi lim
k→0
f −1 (y0 + k) − f −1 (y0 ) h = lim . h→0 f (x0 + h) − f (x0 ) k
Ma questa e` esattamente la relazione (6.2). t u Illustriamo questo teorema con un esempio. Vogliamo calcolare la derivata della funzione logaritmo, definita da y ∈ (0, +∞) 7→ log y. E` noto che questa e` la funzione inversa della funzione f : x ∈ R 7→ ex , nel senso che log ex = x per ogni x ∈ R e elog y = y per ogni y > 0. Quindi stiamo calcolando la derivata di f −1 . Poich´e D f (x0 ) = ex0 per ogni x0 reale, la regola del precedente teorema ci garantisce che , se y0 = ex0 , allora 1 D f −1 (y0 ) = x . e0 Quindi 1 1 D log(y0 ) = x = , 0 e y0 e questo vale per ogni y0 > 0. Abbiamo quindi trovato la derivata della funzione logaritmo, senza nemmeno scriverne il rapporto incrementale.5 Seguendo questo 5
Ovviamente, il rapporto incrementale e` stato scritto nella dimostrazione del teorema di derivazione della funzione inversa. In matematica, nessuno fa sconti.
6.3 I teoremi fondamentali del calcolo differenziale
119
schema, si calcolano le derivate delle funzioni inverse di seno, coseno, tangente. Lo studente potr`a ricavare le rispettive formule per esercizio, e trover`a i dettagli nei testi citati in bibliografia.
6.3 I teoremi fondamentali del calcolo differenziale Finora, l’introduzione della derivata non sembra questa gran rivoluzione. Si tratta di calcolare qualche limite di rapporti incrementali, usando di volta in volta un’accorgimento particolare. Invece sono svariate le applicazioni delle derivate all’analisi delle funzioni, e in questo paragrafo ce ne occuperemo dettagliatamente. Per prima cosa, pu`o essere utile definire le derivate sinistra e destra in un punto. Definizione 6.2. Sia f : (a, b) → R una funzione continua, e sia x0 ∈ (a, b). Diciamo che f possiede derivata sinistra in x0 se esiste finito il limite lim
h→0−
f (x0 + h) − f (x0 ) . h
Analogamente, f possiede derivata destra in x0 se esiste finito il limite lim
h→0+
f (x0 + h) − f (x0 ) . h
Proposizione 6.3. Una funzione f : (a, b) → R e` derivabile nel punto x0 ∈ (a, b) se e solo se f ha derivata destra e derivata sinistra in x0 , e queste sono uguali fra loro. Dimostrazione. E` una conseguenza immediata della Proposizione 5.1. t u Una prima applicazione di questo fatto e` alle funzioni definite per “incollamento”.
Teorema 6.5. Siano p : (a, b) → R e q : (a, b) → R due funzioni continue e derivabili. Sia x0 ∈ (a, b) un punto fissato. Definiamo la funzione f : (a, b) → R come ( p(x), x ∈ (a, x0 ) f (x) = q(x), x ∈ [x0 , b). Allora 1. f e` continua in x0 se e solo se p(x0 ) = q(x0 ); 2. f e` derivabile in x0 se e solo se p(x0 ) = q(x0 ) e Dp(x0 ) = Dq(x0 ).
La dimostrazione e` evidente. Sottolineiamo che la sola condizione Dp(x0 ) = Dq(x0 ) non e` sufficiente a garantire la derivabilit`a di f . Infatti le due
120
6 Il calcolo differenziale
funzioni p(x) = x e q(x) = x + 1 hanno la stessa derivata in x0 = 0, ma la funzione f costruita incollandole nell’origine ha un salto. Esempio 6.1. Applichiamo questa “ricetta” alla funzione f (x) = |x|. In effetti, in base alla definizione del valore assoluto, possiamo scrivere ( x, (x ≥ 0) f (x) = −x, (x < 0) e da ci`o deduciamo che f non e` derivabile in x0 = 0. Infatti l’incollamento e` continuo in questo punto, ma la derivata di x differisce da quella di −x. In ogni altro punto x 6= 0, la derivata vale ( 1, (x ≥ 0) f (x) = −1, (x < 0). A volte si introduce la funzione segno sign : R \ {0} → R definita da sign x = Per esercizio, lo studente verifichi che f 0 (x) = sign x per ogni x 6= 0.
x |x| .
Il prossimo teorema, dovuto al matematico francese Fermat,6 e` di fondamentale importanza nella ricerca di massimi e minimi di una data funzione.
Teorema 6.6 (Fermat). Sia f : (a, b) → R una funzione, e sia x0 ∈ (a, b) un punto di massimo (o di minimo) relativo. Se f e` derivabile in x0 , allora D f (x0 ) = 0.
Dimostrazione. Supponiamo che x0 sia un minimo relativo. Dunque, esiste un intorno [x0 − δ , x0 + δ ] di x0 tale che f (x0 ) ≤ f (x) per ogni x di tale intorno. Sia h ∈ (−δ , δ ), e costruiamo il rapporto incrementale di f in x0 : f (x0 + h) − f (x0 ) . h Poich´e x0 + h ∈ [x0 − δ , x0 + δ ], il numeratore e` sempre maggiore o uguale a zero. Ne deduciamo che D f (x0 ) = lim
f (x0 + h) − f (x0 ) ≤ 0, h
D f (x0 ) = lim
f (x0 + h) − f (x0 ) ≥ 0. h
h→0−
mentre h→0+
6
Si pronuncia ferm` a.
6.3 I teoremi fondamentali del calcolo differenziale
121
Se un numero e` simultaneamente ≤ 0 e ≥ 0, allora tale numero e` 0. Il teorema e` cos`ı dimostrato per i minimi relativi. Per i massimi relativi, si applicano le stesse considerazioni, e l’unica differenza e` l’inversione delle ultime due disuguaglianze. t u Concretamente, il procedimento per individuare i punti di massimo e minimo relativi di una funzione assegnata e` : isolo i punti dove f non e` derivabile, e isolo gli (eventuali) estremi del dominio di definizione. Infine cerco gli zeri della derivata. Attenzione, il teorema di Fermat e` falso se x0 cade in uno degli estremi di (a, b). Come esempio, sia f : x ∈ [0, 1] 7→ x. Il minimo assoluto e` in x = 0, il massimo assoluto in x = 1. Per`o f 0 (x) 6= 0 per ogni x ∈ [0, 1]. Pi`u precisamente, quando i punti estremanti cadono su bordo dell’intervallo di definizione, sono vere solo delle disuguaglianze.
Proposizione 6.4. Sia f : [a, b] → R una funzione derivabile in [a, b]. Valgono le seguenti implicazioni: (a) (b) (c) (d)
se a e` un punto di minimo (relativo), alllora D f (a) ≥ 0; se a e` un punto di massimo (relativo), allora D f (a) ≤ 0; se b e` un punto di minimo (relativo), alllora D f (b) ≤ 0; se b e` un punto di massimo (relativo), allora D f (b) ≥ 0.
Dimostrazione. Le dimostrazioni sono contenute in quella del teorema di Fermat: in ciascuno dei quattro casi, bisogna conseiderare solo i limiti direzionali del rapporto incrementale, nell’unica direzione di volta in volta ammissibile. Ad esempio, nel caso (a) possiamo fare solo il limite per h → 0+ del rapporto incrementale. Invitiamo lo studente a fare un disegno qualitativo di tutte le situazioni considerate. La Proposizione appena enunciata e` utile in certe situazioni, ma e` indubbio che i punti dove la derivata si annulla meritano qualche considerazione particolare. Cominciamo a dar loro un nome.
Definizione 6.3. I punti critici di una funzione derivabile f sono i punti x tali che D f (x) = 0.
Questa definizione non e` superflua: non tutti gli zeri della derivata sono massimi oppure minimi. Se poniamo f (x) = x3 per ogni x ∈ R, troviamo facilmente l’unico zero della derivata prima, x = 0. Ora, se x > 0 allora x3 = f (x) > 0, mentre se x < 0 e` x3 = f (x) < 0. Quindi, l’origine non e` un minimo n´e un massimo per f , visto che in ogni intorno dell’origine cadono punto in cui f vale meno di 0 e punti in cui f vale pi`u di 0. L’origine e` dunque un punto critico di f che non sa ppiamo ancora
122
6 Il calcolo differenziale
descrivere bene.7 Infine, la funzione x 7→ |x| e` un classico esempio di funzione con un punto di minimo assoluto (quale?) dove la derivata non esiste. Il prossimo teorema d`a una condizione sufficiente affinch´e una funzione derivabile abbia almeno un punto critico. Invitiamo lo studente a convincersi con esempi che la condizione posta non e` necessaria per l’esistenza di punti critici.8
Teorema 6.7 (Rolle). Sia f : [a, b] → R una funzione continua e derivabile in (a, b). Se f (a) = f (b), allora esiste ξ ∈ (a, b) tale che 9 D f (ξ ) = 0.
Dimostrazione. Per il teorema di Weierstraß la funzione f ha massimo e minimo (assoluti) in [a, b]. Siano xM un punto di massimo e xm un punto di minimo. Esistono solo due casi: 1. sia xm che xM cadono agli estremi dell’intervallo [a, b]. Poich´e f assume (per ipotesi) lo stesso valore in questi due punti, il massimo assoluto di f coincide con il minimo assoluto, e pertanto la funzione e` costante. La sua derivata e` dunque sempre uguale a zero, e non c’`e altro da dimostrare. 2. Uno almeno dei due punti xm e xM cade all’interno dell’intervallo [a, b]. Per il teorema di Fermat, in questo punto la derivata di f si annulla, e la dimostrazione e` completa anche in questo caso. In ogni caso, abbiamo verificato che la derivata di f si annulla in almeno un punto di (a, b). t u Osservazione. Il precedente teorema inaugura la serie10 di enunciati in cui si tratta di funzioni continue su un intervallo chiuso [a, b] e derivabili nell’intervallo aperto (a, b). Non si tratta di un’inutile complicazione introdotta da qualche docente particolarmente cattivo, bens`ı di un’effettiva necessit`a. L’esistenza delle derivate nei punti a e b non e` necessaria. Anzi, la dimostrazione del teorema di De l’Hospital richiede l’uso di questi teoremi esattamente come li abbiamo enunciati. Il Teorema di Fermat ci dice che i punti di massimo e di minimo si nascondono fra i punti critici. Ma esiste un modo per stabilire se un punto critico e` un massimo, un minimo, o nessuno dei due? Ne esiste pi`u di uno, e il modo pi`u facile per capirlo e` studiare la monotonia della funzione. Se essa cresce a sinistra del punto critico, e decresce dopo averlo superato, siamo inequivocabilmente in presenza di un massimo relativo. Simmilmente per i minimi relativi. Ma come si studia la monotonia di una funzione? Se la funzione e` derivabile, i metodi del calcolo differenziale ci sono utili. La chiave e` un teorema celeberrimo. La figura successiva ne fornisce l’interpretazione geometrica. 7
Qualche studente ricorder`a che 0 e` un punto di flesso per f , ma ci arriveremo fra un po’. Quello che vogliamo dire e` : esistono funzioni dotate di punti critici, ma che non soddisfano l’ipotesi fondamentale del teorema di Rolle. 10 Per fortuna, non si tratta di una serie nel senso matematico del termine!
8
6.3 I teoremi fondamentali del calcolo differenziale
123
Teorema 6.8 (del valor medio, o di Lagrange). Sia f : [a, b] → R una funzione continua e derivabile in (a, b). Allora esiste ξ ∈ (a, b) tale che D f (ξ ) =
f (b) − f (a) . b−a
Dimostrazione. La tecnica dimostrativa consiste nell’applicare il teorema di Rolle a una funzione ausiliaria che ne verifica le ipotesi. A tale scopo, definiamo g : [a, b] → R mediante la formula g(x) = f (x) − f (a) −
f (b) − f (a) (x − a). b−a
In pratica, facciamo la differenza fra f e la retta che unisce gli estremi (a, f (a)) con (b, f (b)). E` chiaro che g e` continua in [a, b], derivabile in (a, b), e g(a) = g(b) = 0 Dunque g soddisfa le ipotesi del teorema di Rolle, sicch´e esiste ξ ∈ [a, b] dove f (a) Dg(ξ ) = 0. Le regole di derivazione affermano che Dg(x) = D f (x) − f (b)− , e la b−a condizione Dg(ξ ) = 0 si legge D f (ξ ) =
f (b) − f (a) . b−a
Questo completa la dimostrazione del teorema. t u Corollario 6.1. Sia f : [a, b] → R una funzione continua e derivabile in (a, b). Se D f (x) = 0 per ogni x ∈ (a, b), allora f e` una funzione costante, cio`e esiste c ∈ R tale che f (x) = c per ogni x ∈ [a, b]. Dimostrazione. Prendiamo due punti qualsiasi α e β in [a, b]. Possiamo supporre, scambiandoli fra di loro, che α ≤ β . Vogliamo dimostrare che f (α) = f (β ). Se α = β , non c’`e nulla da dimostrare; quindi supponiamo liberamente che α < β . Applichiamo il teorema del valor medio alla funzione f ristretta all’intervallo [α, β ]. Esister`a un punto ξ ∈ [α, β ] tale che f (β ) − f (α) = D f (ξ ). β −α Ma il seondo membro di questa uguaglianza vale zero per ipotesi, e quindi f (β ) − f (α) = 0. Poich´e α e β sono del tutto arbitrari, la funzione f assume lo stesso valore in tutti i punti dell’intervallo [a, b]. Quindi e` una funzione costante. Osservazione 6.2. Applicando alla funzione f (x) = log x il teorema del valor medio, si dimostra la relazione di Nepero
124
6 Il calcolo differenziale
Fig. 6.1 Interpretazione geometrica del teorema di Lagrange
1 log b − log a 1 < < , b b−a a valida per ogni 0 < a < b. Lasciamo i dettagli (semplicissimi) allo studente. E` frequente trovare il teorema di Lagrange come caso particolare di un altro teorema molto famoso, dovuto al matematico francese Louis Augustin Cauchy. Lo enunciamo e diamo solo uno spunto per completarne la dimostrazione.
Teorema 6.9 (Cauchy). Siano f e g due funzioni continue su [a, b] e derivabili in (a, b). Suppponiamo inoltre che Dg(x) 6= 0 per ogni x ∈ (a, b). Allora esiste ξ ∈ [a, b] tale che f (b) − f (a) D f (ξ ) = g(b) − g(a) Dg(ξ )
Dimostrazione. Lasciata per esercizio. Suggerimento: trovare un numero erale k tale che il teorema di Rolle sia applicabile alla funzione ausiliaria h(x) = f (x) − kg(x). Osserviamo che l’ipotesi Dg(x) 6= 0 per ogni x ∈ (a, b) implica in particolare g(b) − g(a) 6= 0. E` una conseguenza del teorema di Rolle. t u Il teorema di Lagrange appare dunque come un caso particolare (per g : x 7→ x) del teorema precedente. Il fatto che le applicazioni del teorema di Lagrange siano
6.4 Punti singolari
125
molte pi`u di quelle del teorema di Cauchy, ci ha indotti ad attribuirgli un’evidenza maggiore. Tuttavia, il solo teorema di Lagrange non e` sufficiente a dimostrare un’altra pietra miliare del cacolo differenziale: il teorema di De l’Hospital. Il prossimo risultato mostra che la derivata di una funzione (derivabile) non pu`o avere salti.
Teorema 6.10 (Darboux). Sia f : (a, b) → R una funzione derivabile. Se D f (a) < λ < D f (b), allora esiste ξ ∈ (a, b) tale che D f (ξ ) = λ .
Dimostrazione. Definiamo una funzione ausiliaria g : x ∈ (a, b) 7→ f (x) − λ x. Per ogni x ∈ (a, b), e` Dg(x) = D f (x) − λ . Inoltre Dg(a) < 0, Dg(b) > 0. Quindi g e` decrescente in un intorno di a e crescente in un intorno di b. In particolare, esiste un punto di minimo ξ ∈ (a, b) per g. Per il teorema di Fermat, Dg(ξ ) = 0, cio`e D f (ξ ) = λ . t u
6.4 Punti singolari Sappiamo che una funzione derivabile in un punto deve essere ivi continua. Rovesciando logicamente questa affermazione, nessuna funzione e` derivabile in un punto di discontinuit`a. Quindi la discontinuit`a e` la causa pi`u “rozza” di perdita di derivabilit`a. D’altronde, abbiamo gi`a imparato che la funzione x 7→ |x| e` continua ovunque ma non e` derivabile in 0. Definizione 6.4. I punti singolari di una funzione sono quelli in cui la funzione e` continua ma non derivabile. Elenchiamo alcuni tipi di punti singolari. 1.
I punti angolosi. Sono quelli in cui la derivata destra e la derivata sinistra esistono, ma non coincidono. La funzione del valore assoluto ne e` un esempio. 2. I flessi a tangente verticale. Sono quelli in cui il limite del rapporto incrementale esiste ma e` infinito. 11 3. Le cuspidi. Sono quelli in cui almeno una fra la derivata destra p e la derivata sinistra e` infinita.12 Il punto 0 e` una cuspide per la funzione x 7→ |x|. 4. L’ultima situazione si presenta quando il limite del rapporto incrementale non esiste, n´e finito n´e infinito. E` in generale una situazione spiacevole, che molti 11
Usiamo un linguaggio in parziale contraddizione con le nostre convenzioni. Intendiamo solo f (x0 ) affermare che x0 e` un flesso a tangente verticale quando limh→0 f (x0 +h)− = +∞ oppure −∞. h 12 Il linguaggio e ` comprensibile ma impreciso. Una derivata non pu`o essere infinita, in base alle nostre definizioni. Qui intendiamo piuttosto dire che una delle due derivate destra o sinistra non esiste proprio perch´e il corrispondente limite del rapporto incrementale e` infinito.
126
6 Il calcolo differenziale
studenti faticano perfino a concepire. Un esempio e` il punto x0 = 0 per la funzione cos`ı definita: ( x sin 1x (x 6= 0) f (x) = 0 (x = 0). In x0 = 0 risulta lim
h→0
f (x0 + h) − f (x0 ) 1 = lim sin , h→0 h h
e questo limite non esiste. Infatti, la quantit`a sin(1/h) oscilla infinite volte f (x0 ) = −1 e fra i due valori −1 e +1: matematicamente, lim infh→0 f (x0 +h)− h lim suph→0
f (x0 +h)− f (x0 ) h
= +1.
6.5 Applicazioni allo studio delle funzioni
Teorema 6.11. Sia f : (a, b) → R una funzione derivabile. 1. Se f e` monotona crescente (risp. decrescente) allora D f (x) ≥ 0 (risp. D f (x) ≤ 0) per ogni x ∈ (a, b). 2. Se D f (x) ≥ 0 (risp. D f (x) ≤ 0) per ogni x ∈ (a, b), allora f e` monotona crescente (risp. decrescente). 3. Se D f (x) > 0 (risp. D f (x) < 0) per ogni x ∈ (a, b), allora f e` strettamente crescente (risp. strettamente decrescente).
Dimostrazione. La prima affermazione discende dal teorema della permanenza del segno applicato al rapporto incrementale. Le altre affermazioni sono conseguenza del teorema di Lagrange. Fissati arbitrariamente x1 < x2 in (a, b), esiste un punto ξ ∈ (x1 , x2 ) tale che f (x2 ) − f (x1 ) = D f (ξ )(x2 − x1 ). Quindi il segno di f (x2 ) − f (x1 ) e` individuato dal segno di D f (ξ ). t u Iil teorema precedente fornisce una regola per decifrare la monotonia di una funzione derivabile. Salvo qualche cautela sulla monotonia stretta, occorre identificare gli intervalli dove la derivata e` positiva: in tali intervalli, la funzione cresce. La funzione invece decresce negli intervalli dove la derivata e` negativa. Una seconda applicazione del teorema di Lagrange riguarda la derivabilit`a stessa. Supponiamo che una certa funzione sia continua in (a, b) e derivabile in tutti i punti dell’intervallo eccettuato al pi`u un punto x0 . Come si fa a decidere se la funzione e` derivabile anche in x0 ? Si pu`o pensare di ricorrere alla definizione, scrivendo il rapporto incrementale centrato in x0 e facendo tendere a zero l’incremento. Oppure si pu`o usare il seguente criterio.
6.5 Applicazioni allo studio delle funzioni
127
Proposizione 6.5. Sia f : (a, b) → R una funzione continua. Sia x0 ∈ (a, b) un punto, e supponiamo che f sia derivabile in (a, x0 ) ∪ (x0 , b). Se esiste finito λ = limx→x0 D f (x0 ), allora f e` derivabile in x0 e D f (x0 ) = λ . Dimostrazione. Sia x ∈ (a, b), x 6= x0 . Per il teorema di Lagrange, esiste ξ = ξ (x) tale che f (x) − f (x0 ) = D f (ξ )(x − x0 ). Ovviamente, siccome ξ ∈ (x0 , x), si avr`a ξ → x0 per x → x0 . L’ipotesi della Proposizione garantisce allora che lim
x→x0
f (x) − f (x0 ) = lim D f (ξ ) = λ . x→x0 x − x0
Perci`o f e` derivabile in x0 , e D f (x0 ) = λ . t u Occorre per`o fare attenzione, perch´e il criterio della Proposizione precedente e` sufficiente ma non necessario per l’esistenza della derivata in x0 .13 Consideriamo infatti la funzione ( x2 sin(1/x) x 6= 0 f (x) = 0 x = 0. Poich´e
1 0 ≤ | f (x)| = x sin ≤ x2 → 0 x 2
per x → 0, f e` continua un x = 0. Inoltre lim
x→0
1 f (x) − f (0) = lim x sin = 0. x→0 x−0 x
Dunque D f (0) = 0. Se x 6= 0, la derivata vale 1 1 D f (x) = 2x sin − cos , x x che non ha limite per x → 0. La Proposizione non e` perci`o applicabile, mentre la derivata di f in 0 esiste.14 Osservazione 6.3. Se riflettiamo un istante sull’enunciato della Proposizione, ci accorgiamo che la sua tesi va oltre la mera esistenza della derivata in x0 . In realt`a, le ipotesi ci permettono di concludere che la funzione derivata f 0 e` continua in x0 : limx→x0 f 0 (x) = λ = f 0 (x0 ). Nei controesempi appena discussi, e` chiaro che la derivata risultava sempre discontinua in x0 .
13 In parole povere, se il criterio si applica allora la funzione e ` derivabile; se il criterio fallisce, non siamo autorizzati a trarre alcuna conclusione. Invito lo studente a fare molta attenzione. 14 L’accanimento con cui presentiamo controesempi non deve indurre lo studente a pensare che tutti i teoremi siano “deboli”. Piuttosto, vogliamo evidenziare l’ottimalit`a delle ipotesi.
128
6 Il calcolo differenziale
6.6 Derivate successive Se una funzione f : (a, b) → R e` derivabile in (a, b), la funzione x ∈ (a, b) 7→ D f (x) definisce una funzione reale di una variabile reale, che chiamiamo naturalmente funzione derivata di f .
Definizione 6.5. Diremo che la funzione f e` derivabile due volte nel punto x0 ∈ (a, b) se la funzione derivata di f e` derivabile a sua volta in x0 . La derivata seconda di f in x0 e` denotata con uno dei simboli D2 f (x0 ),
f 00 (x0 ),
d2 f (x0 ), dx2
f¨(x0 ).
Evidentemente, e` possibile iterare il ragionamento precedente, e parlare cos`ı di derivata terza, quarta, ecc. In generale, per indicare la derivata n–esima si usano i simboli dn f Dn f (x0 ), f (n) (x0 ), (x0 ). dxn Impareremo presto ad usare uno strumento, il polinomio di Taylor, in cui le derivate successive rivestono un ruolo di fondamentale importanza. Nel resto di questo paragrafo, ci concentreremo sulla derivata seconda, l’ultima ad avere qualche interpretazione geometrica degno di nota. Prima per`o dobbiamo introdurre una definizione.
Definizione 6.6. Sia f : (a, b) → R una funzione. Si dice che f e` convessa in (a, b) se, per ogni x1 , x2 ∈ (a, b) e per ogni λ ∈ [0, 1], risulta f ((1 − λ )x1 + λ x2 ) ≤ (1 − λ ) f (x1 ) + λ f (x2 ).
(6.3)
Si dice invece che f e` concava in (a, b) se la funzione − f , che agisce come x 7→ − f (x), e` convessa.
Posto x = (1 − λ )x1 + λ x2 , la disuguaglianza di convessit`a si pu`o riscrivere come f (x) ≤ f (x1 ) +
f (x2 ) − f (x1 ) (x − x1 ), x2 − x1
x ∈ [x1 , x2 ].
Essa quindi equivale all’affermazione geometrica: per ogni x1 , x2 con x1 < x2 , il grafico di f in [x1 , x2 ] sta al di sotto della corda per i punti (x1 , f (x1 )), (x2 , f (x2 )). Immaginiamo che lo studente sia stato introdotto, seppure brevemente, alla convessit`a durante le scuole superiori. Quasi certamente gli sar`a stato insegnato un lin-
6.6 Derivate successive
Fig. 6.2 Una tipica funzione convessa
Fig. 6.3 Una tipica funzione concava
129
130
6 Il calcolo differenziale
guaggio un po’ diverso: invece di funzione convessa, funzione che volge la concavit`a verso l’alto. Pur sentendoci in grado di affermare che “convessit`a” e` l’unica denominazione in voga nella matematica contemporanea, poco importano i nomi e gli aggettivi. Osservazione. Come visto, per noi la definizione di funzione convessa e` di natura globale, e non daremo un significato a frasi quali “la funzione e` convessa in un punto”.
Teorema 6.12. Ogni funzione convessa f in un intervallo aperto (a, b) e` continua in (a, b).
Dimostrazione. Supponiamo che a < s < x < y < t < b. Scriviamo S per denotare il punto di coordinate cartesiane (s, f (s)), e similmente per x, y e t. Allora X e` sulla retta SY o al di sotto di essa, e pertanto Y e` al di sopra della retta SX. Similmente Y e` sotto la retta XT . Quando y → x deduciamo che Y → X, cio`e f (y) → f (x). Questo dimostra che limy→x+ f (y) = f (x). Con un ragionamento del tutto analogo, si dimostra che lims→x− f (s) = f (x), e dunque f e` continua nel generico punto x ∈ (a, b). t u Osservazione 6.4. La dimostrazione appena fatta dipende in modo essenziale dalla possibilit`a di avvicinarsi ad x tanto da destra quanto da sinistra. Questo e` possibile perch´e x appartiene all’intervallo aperto (a, b). Al contrario, una funzione convessa e definita in un intervallo chiuso pu`o essere discontinua. Ad esempio, definiamo f (x) = 0 per ogni x ∈ [0, 1), e f (1) = 1. Lo studente verificher`a facilmente che f e` convessa, ma ovviamente il punto x = 1 e` una discontinuit`a di salto. Il Teorema 6.12 afferma che e` impossibile prolungare questa funzione a destra di 1, rispettando la convessit`a. Osservazione 6.5. Sarebbe sbagliato credere che le funzioni convesse (definite su un intervallo aperto) siano anche derivabili. Pensiamo infatti al solito valore assoluto x 7→ |x|, che e` evidentemente una funzione convessa ma non derivabile in x = 0. In realt`a, si potrebbe dimostrare che tutte le funzioni convesse in un intervallo aperto possiedono derivate destra e sinistra finite. Ma chiaramente potrebbero essere diverse fra loro. Un altro punto sul quale condividiamo le perplessit`a dello studente e` l’applicabilit`a della disuguaglianza di convessit`a. Se, per esempio, non e` difficile dimostrare con tale definizione che la funzione x 7→ x2 e` convessa in tutto R, per funzioni pi`u complicate risulta impossibile gestire elementarmente le disuguaglianze. Occorrono dunque dei criteri, cio`e delle condizioni atte ad assicurare la convessit`a di una data funzione mediante test maneggevoli. Eccone uno. Proposizione 6.6. Sia f : [a, b] → R una funzione derivabile. Sono equivalenti:
6.6 Derivate successive
131
(i) f e` convessa. (ii) La funzione x 7→ D f (x) e` monotona crescente in (a, b). (iii) Il grafico di f e` sopra tutte le sue tangenti, cio`e per ogni x, x0 ∈ [a, b] f (x) ≥ f (x0 ) + D f (x0 )(x − x0 ). La caratterizzazione pi`u utile e` l’equivalenza di (i) e (ii). La convessit`a di una funzione derivabile equivale in tutto e per tutto alla monotonia della sua derivata prima. Siccome sappiamo che la monotonia di una funzione si riflette nel segno della derivata della funzione, abbiamo il seguente criterio di convessit`a per le funzioni derivabili due volte.
Proposizione 6.7. Sia f : (a, b) → R una funzione derivabile due volte. Sono equivalenti: (i) (ii)
f e` convessa. D2 f (x) ≥ 0 per ogni x ∈ (a, b).
Definizione 6.7. Sia f : (a, b) → R una funzione. Diremo che x0 ∈ (a, b) e` un punto di flesso per f se f e` convessa in (a, x0 ) e concava in (x0 , b), o viceversa.
In altre parole, in un punto di flesso la retta tangente al grafico di f , se esiste, attraversa tale grafico. Vogliamo invece sfatare un mito assai diffuso. Non tutti gli zeri della derivata seconda sono punti di flesso. Sia f : x 7→ x4 . Si ha D2 f (0) = 0, ma 0 e` evidentemente un punto di minimo assoluto per f . Vale per o` il seguente teorema.
Teorema 6.13. Una funzione f derivabile due volte e dotata di un punto di flesso in x0 , deve verificare D2 f (x0 ) = 0.
Dimostrazione. Infatti, f deve essere convessa a sinistra di x0 e concava a destra di x0 (o viceversa). Pertanto la derivata prima di f cambia il senso di monotonia attraversando il punto x0 . Questo implica che x0 e` un punto di massimo (o di minimo) per D f . Il teorema di Fermat garantisce allora che D(D f )(x0 ) = D2 f (x0 ) = 0. t u Osservazione 6.6. Non e` facile trovare in letteratura una definizione definitiva di punto di flesso. Il motivo e` che si tratta di un’idea tipica per le funzioni di una variabile. Volendo generalizzare la convessit`a a funzioni di un numero maggiore di
132
6 Il calcolo differenziale
variabili, ci si imbatte nel problema seguente: mentre un punto spezza l’asse reale R in due parti, un punto nello spazio (per esempio tridimensionale, cio`e quello in cui viviamo) non suddivide lo spazio stesso in parti disgiunte. Non sembra dunque ragionevole parlare di punti di flesso per funzioni di due, tre o pi`u variabili. Concludiamo questa sezione con qualche altra propriet`a delle funzioni convesse. Lemma 6.1 (Disuguaglianza di Jensen, caso discreto). Supponiamo che f sia una funzione convessa definita in un intervallo I. Allora f (α1 x1 + . . . + αn xn ) ≤ α1 f (x1 ) + . . . + αn f (xn ) per ogni n ∈ N, x1 , . . . , xn ∈ I, α1 , . . . , αn ≥ 0 con α1 + . . . αn = 1. Corollario 6.2. Supponiamo che f sia una funzione convessa definita in un intervallo I. Allora α1 f (x1 ) + . . . + αn f (xn ) α1 x1 + . . . + αn xn , ≤ f α1 + . . . αn α1 + . . . αn per ogni x1 , . . . , xn ∈ I, α1 , . . . , αn > 0. Corollario 6.3. Fissiamo arbitrariamente n ∈ N, ed n punti xi > 0, per i = 1, . . . , n. Siano poi αi ≥ 0, per i = 1, . . . n, n numeri reali non negativi tali che α1 + . . . + αn = 1. Allora x1α1 x2α2 · · · xnαn ≤ α1 x1 + . . . + αn xn . Osservazione 6.7. Se scegliamo α1 = α2 = . . . = αn = 1/n nel precedente corollario, otteniamo la nota relazione fra la media algebrica e media aritmetica di n numeri reali positivi: √ x1 + . . . + xn n x1 x2 · · · xn ≤ . n Definizione 6.8. Sia I un intervallo della retta reale, e sia f : I → R una funzione. Diremo che f e` Jensen–convessa se x+y f (x) + f (y) f ≤ 2 2 per ogni x, y ∈ I. Ovviamente, tutte le funzioni convesse son oanche Jensen–convesse. Il viceversa e` in generale falso, ma diventa vero limitatamente alle funzioni continue. Proposizione 6.8. Ogni funzione Jensen–convessa e continua in un intervallo I e` convessa in I. Dimostrazione. Si veda, ad esempio, [27, Proposition 6.3]. t u
6.8 Grafici di funzioni
133
6.7 Classi di regolarit`a Per abbreviare alcuni enunciati, conviene introdurre una terminologia progressiva per la regolarit`a di una funzione. Vorremmo assegnare alla continuit`a il grado di regolarit`a pi`u basso, per poi passare alla derivabilit`a una, due, tre, o pi`u volte.
Definizione 6.9. Sia f : (a, b) → R una funzione. Diremo che f e` di classe Ck (a, b), e scriveremo f ∈ Ck (a, b), se f possiede k derivate in ogni punto di (a, b), e se queste derivate sono tutte funzioni continue in (a, b). Per estensione, diremo che f e` di classe C∞ (a, b), se f possiede derivate di ordine arbitrariamente alto in (a, b). Convenzionalmente, una funzione di classe C0 (a, b) e` semplicemente una funzione continua in (a, b). Una funzione di classe C1 (a, b) e` una funzione che possiede una derivata continua in (a, b). Invitiamo lo studente a prestare attenzione alla richiesta di continuit`a per tutte le derivate coinvolte. Potrebbe infatti accadere che una funzione sia derivabile, ma che la derivata abbia una discontinuit`a: in questo caso non possiamo attribuire la regolarit`a C1 . Per dare qualche esempio, tutti i polinomi sono di classe C∞ (R), cos`ı come la funzione esponenziale, il seno e il coseno. Nei fatti, praticamente tutte le funzioni elementari sono di classe C∞ nel loro dominio di definizione.
6.8 Grafici di funzioni Abbiamo ormai tutti gli strumenti per effettuare uno studio qualitativo del grafico di una funzione. Sappiamo che, in buona sostanza, il segno della derivata prima e` un indicatore della monotonia, mentre il segno della derivata seconda descrive la convessit`a. Per avere un grafico rappresentativo di una funzione, conviene mettere in risalto gli eventuali asintoti. Nella sostanza, un asintoto e` semplicemente una retta verso la quale il grafico di una funzione si avvicina indefinitamente. Piuttosto che affrontare una difficile definizione unitaria di asintoto, preferiamo presentare tre definizioni. Sebbene la terza possa inglobare la seconda con poco sforzo, e` didatticamente consigliabile tenerle separate.
Definizione 6.10. Sia f una funzione reale di variabile reale, definita almeno su un intervallo (a, b). La retta di equazione x = a e` un asintoto verticale destro per f se limx→a+ f (x) = ±∞. Similmente, la retta x = b e` un asintoto verticale sinistro se limx→b− f (x) = ±∞.
134
6 Il calcolo differenziale
Nulla impedisce che una retta x = c sia simultaneamente un asintoto verticale sinistro e destro. Ovviamente, la funzione f deve essere definita almeno in un intorno di c, escluso al pi`u {c}.
Definizione 6.11. Sia f una funzione definita almeno su un intervallo illimitato (a, +∞). La retta di equazione y = q e` un asintoto orizzontale destro se limx→+∞ f (x) = q. Analogamente, se f e` definita almeno su un intervallo illimitato (−∞, a), la retta y = q e` un asintoto orizzontale sinistro se limx→−∞ f (x) = q.
Meno ovvia e` la definizione di asintoto obliquo, e soprattutto e` meno immediato capire se una funzione ammetta asintoti obliqui.
Definizione 6.12. Sia f una funzione definita almeno su un intervallo illimitato (a, +∞). La retta di equazione y = mx + q, m 6= 0, e` un asintoto obliquo per x → +∞ se limx→+∞ | f (x) − (mx + q)| = 0. Analogamente, possiamo definire un asintoto obliquo per x → −∞.
Osservazione 6.8. E` chiaro che il segno di valore assouto nella definizione sopra e` completamente superfluo. Infatti, una quantit`a, sia questa una successione o una funzione, tende a zero se e solo se tende a zero il suo valore assoluto. In primo luogo, osserviamo che una condizione necessaria affinch´e una funzione f abbia un asintoto obliquo (diciamo per x → +∞) e` che lim f (x) = ±∞.
x→+∞
Questo e` chiaro: se y = mx + q e` un asintoto obliquo, allora lim f (x) = lim f (x) − mx − q + mx + q = lim mx + q = ±∞.
x→+∞
x→+∞
x→+∞
Vediamo come calcolare i coefficienti m e q di un asintoto obliquo. Se limx→+∞ | f (x)− (mx + q)| = 0, a maggior ragione f (x) q lim x −m− = 0. x→+∞ x x Quindi la parentesi deve tendere a zero, e
6.8 Grafici di funzioni
135
m = lim
x→+∞
f (x) . x
(6.4)
Ora che abbiamo trovato il coefficiente angolare m, dalla definizione stessa di asintoto obliquo deduciamo q = lim f (x) − mx. x→+∞
(6.5)
Non c’`e bisogno di dire che considerazioni del tutto analoghe devono essere fatte per gli asintoti obliqui per x → −∞. Evidenziamo poi che abbiamo sempre supposto m 6= 0. Da un lato, il caso m = 0 corrisponde all’asintoto orizzontale. Dall’altro, se la relazione (6.4) fornisce m = 0, non e` corretto affermare che esiste un asintoto √ orizzontale. Ad esempio, la funzione x 7→ x non ha asintoti per x → +∞, eppure m = 0. Osservazione 6.9. Pu`o essere utile la seguente osservazione. Supponiamo che f (x) = mx + g(x), dove m 6= 0 e limx→+∞ g(x) = q ∈ R. Allora la retta y = mx + q e` l’asintoto obliquo di f per x → +∞. Per verificarlo, basta osservare che f (x) − (mx + q) = mx +g(x)−(mx +q) = g(x)−q, e dunque limx→+∞ f (x)−(mx +q) = 0 per l’ipotesi su g. Da ultimo, una stessa funzione pu`o presentare due asintoti obliqui distinti, il primo per x → −∞ e il secondo per x → +∞. Dunque le formule (6.4) e (6.5) devono essere applicate sia per x → +∞ che per x → −∞, senza alcuna possibilit`a di fare economia sui calcoli.15 Riassumendo, studiare l’andamento di una funzione e` un esercizio che possiamo suddividere in vari passi. In particolare, lo studente potr`a seguire questo schema. • Identificare eventuali simmetrie, anche in senso lato, o periodicit`a della funzione, cos`ı come le zone in cui la funzione e` continua, derivabile, ecc. • Studiare l’andamento asintotico della funzione vicino ai punti estremi del dominio di definizione. Questo comprende anche il calcolo dei limiti all’infinito, e l’individuazione degli asintoti. • Identificare il segno della derivata prima, cio`e le zone in cui f e` monotona, e i punti critici. Determinare la natura degli eventuali punti critici, e, quando possibile, studiare il segno della derivata seconda per definire le regioni di convessit`a e gli eventuali punti di flesso. • Studiare gli eventuali punti singolari. • Disegnare il grafico cartesiano della funzione, avendo cura di dare risalto alle conclusioni ottenute con l’analisi dei punti precedenti.
15 Lo studente non prenda questa affermazione come un’accusa di scarsa volont` a. In un corso non specialistico come il nostro, buona parte degli esercizi consiste nel fare conti. Prafrasando Pasolini, “calcolare stanca”, ma e` anche l’unico modo per verificare se lo studente sa usare le idee presentate a lezione.
136
6 Il calcolo differenziale
6.9 Il teorema di De l’Hospital La collocazione di questo paragrafo pu`o sembrare bizzarra, dal momento che e` consuetudine introdurre il Teorema di De l’Hospital subito dopo il teorema del valor medio. Inoltre, averlo a disposizione prima di affrontare lo studio del grafico di una funzione e` di grande aiuto in determinate circostanze. Abbiamo preferito collocarlo in coda ai teoremi fondamentali del calcolo differenziale per due ragioni: la prima e` che questa scelta porta diritti a parlare del polinomio di Taylor. La seconda e` che tanto pi`u un teorema e` utile per gli esercizi, tanto pi`u lo studente tende ad abusarne. Alcuni fra gli errori pi`u grossolani negli elaborati d’esame riguardano esattamente questo teorema. Certo, il docente spesso contribuisce a seminare “trappole” negli esercizi; ma anche questo e` il suo lavoro. Proponiamo una dimostrazione apparsa in un articolo di A. E. Taylor di alcuni decenni fa (l’articolo originale e` [33], mentre un adattamento della dimostrazione appare in [30]), che possiede il pregio di dimostrare con un unico ragionamento tutti i casi coperti dall’enunciato. Non si tratta della dimostrazione pi`u elementare: il caso della forma indeterminata [0/0] e` pi`u semplice di quello della forma [∞/∞], e tradizionalmente i testi elementari propongono due dimostrazioni piuttosto differenti.
Teorema 6.14 (De l’Hospital). Sia I un intervallo dell’asse reale (eventualmente illimitato). Sia c uno degli estremi di I (se I e` illimitato, c pu`o essere −∞ o +∞). Supponiamo che f e g siano due funzioni reali, definite sull’intervallo I, e che (1)
le derivate D f e Dg siano definite in I. Inoltre, g(x) 6= 0 e Dg(x) 6= 0 per ogni x ∈ I.
Supponiamo inoltre che una delle seguenti condizioni sia verificata: (2) (3)
limx→c f (x) = limx→c g(x) = 0; limx→c |g(x)| = +∞.
Se lim
x→c
D f (x) = A, Dg(x)
(6.6)
f (x) = A. g(x)
(6.7)
allora lim
x→c
In questo teorema il valore A pu`o essere finito oppure infinito.
Dimostrazione. Se vale l’ipotesi (2) oppure (3), allora
6.9 Il teorema di De l’Hospital
137
D f (x) D f (x) = lim sup , Dg(x) x→c Dg(x)
lim inf x→c
e dal prossimo teorema 6.15 deduciamo che A ≤ lim inf x→c
sicch´e lim inf x→c
f (x) f (x) ≤ lim sup ≤ A, g(x) g(x) x→c
f (x) f (x) = lim sup = A, g(x) x→c g(x)
e la dimostrazione e` completa. t u Osservazione 6.10. Vogliamo sottolineare che nel caso (3) dell’enunciato non si fanno ipotesi sul comportamento del numeratore f nell’intorno di c. Qualche Autore ha scritto che il Teorema di De l’Hospital tratta i limiti della forma [0/0] e [?/∞]. Il teorema precedente e` una conseguenza diretta del seguente risultato, pi`u generale. Teorema 6.15. Supponiamo che valgano (1) e (2) o (3) del teorema precedente. Allora lim inf x→c
D f (x) f (x) f (x) D f (x) ≤ lim inf ≤ lim sup ≤ lim sup . x→c g(x) Dg(x) g(x) x→c x→c Dg(x)
(6.8)
Dimostrazione. Partiamo dalla formula di Cauchy f (x) − f (y) D f (X) = , g(x) − g(y) Dg(X)
(6.9)
dove x, y sono punti di I e X e` un punto opportuno compreso fra x ed y. L’ipotesi (1) implica che g(x) 6= g(y): altrimenti, per il teorema di Lagrange, esisterebbe un punto compreso fra x ed y dove la derivata di g si annulla, contrariamente all’ipotesi (1). Sia x ∈ I, e definiamo m(x) = inf c 0, abbiamo A−ε
0 tali che C1 |g(x)| ≤ | f (x)| ≤ C2 |g(x)| per ogni x ∈ I. In altre parole, f = O(g) significa che il rapporto | f (x)/g(x)| si mantiene limitato nelle vicinanze di x0 . Nel caso particolare in cui g e` una funzione costante,19 la scrittura f = O(g) significa esattamente che nelle vicinanze del punto x0 la funzione f resta limitata. Per capirci, questo esclude la presenza di un asintoto verticale in x0 . Non ci soffermiamo oltre su questo linguaggio, che non useremo mai nel resto del corso. Per approfondimenti, il lettore potr`a consultare il classico libro di Prodi [28]. Scegliendo nella Definizione 6.13 come g la funzione costante ed uguale a 1, f = o(1) significa semplicemente che f (x) → 0 per x → a. Lo studente si convinca che la definizione di derivata pu`o essere riscritta f (x) = f (x0 ) + D f (x0 )(x − x0 ) + o(x − x0 ) per x → x0 Definizione 6.14. Siano f e g due funzioni definite almeno in un intorno del punto x0 . Diremo che g approssima f all’ordine n se f − g = o((x − x0 )n ) per x → x0 . Esplicitamente, richiediamo che
E` un peccato, perch´e il simbolo di uguaglianza perde in questa situazione la propriet`a simmetrica: Se f = o(g), non e` affatto vero che in generale g = o( f ). Insomma, bisogna usare il simbolo = con grandissima cautela. 19 Qui non importa il valore di tale costante. 18
142
6 Il calcolo differenziale
lim
x→x0
f (x) − g(x) = 0. (x − x0 )n
Un caso noto e particolarmente significativo e` l’approssimazione all’ordine 1, chiamata anche approssimazione lineare. Ogni funzione derivabile in un punto e` approssimabile linearmente in tale punto, e la funzione che realizza l’approssimazione e` la funzione lineare affine rappresentata dalla retta tangente nel punto. D’altronde, senza ulteriori condizioni dobbiamo aspettarci una gran quantit`a di funzioni approssimanti. Per esempio, la funzione quadratica f : x 7→ x2 e` approssimata linearmente in x0 = 0 da qualunque funzione g : x 7→ αxn , con α ∈ R e n ≥ 2. Infatti x2 − αxn = lim x − αxn−1 = 0. lim x→0 x→0 x Per`o abbiamo gi`a imparato che la retta tangente e` l’unica retta che approssima linearmente una funzione derivabile in un dato punto. Poniamo dunque il seguente problema: determinare, se esiste, un polinomio di grado n che approssima una funzione all’ordine n nell’intorno di un punto x0 . Procediamo per passi successivi, chiamando f la funzione da approssimare e supponendo x0 = 0. Il caso di x0 qualunque verr a` discusso fra poco. Per n = 1 sappiamo gi`a che l’unico polinomio cercato e` P1 (x) = f (0) + D f (0)x. Per n = 2, la cosa migliore e` scrivere il generico polinomio di secondo grado P2 (x) = a0 + a1 x + a2 x2 e imporre la condizione di approssimazione: lim
x→0
f (x) − P2 (x) = 0. x2
Il denominatore tende a zero, il numeratore a f (0) − a0 . Quindi e` necessario che a0 = f (0). Il limite si riscrive lim
x→0
f (x) − f (0) − a1 x − a2 x2 = 0. x2
Possiamo applicare la regola di De l’Hospital, e ci riconduciamo al limite del quoziente delle derivate D f (x) − a1 − 2a2 x . lim x→0 2x La speranza e` che tale limite valga zero, e come prima e` necessario che D f (0) = a1 . Applicando una seconda volta la regola di De l’Hospital, troviamo la condizione necessaria D2 f (0) = 2a2 . Se un polinomio approssimante c’`e, l’unica possibilit`a e` che
6.10 Il polinomio di Taylor
143
1 P2 (x) = f (0) + D f (0)x + D2 f (0)x2 . 2 Lasciamo allo studente la verifica banale che questo P2 e` effettivamente un’approssimazione di ordine 2 di f in x0 = 0. Con la notazione di Landau, 1 f (x) = f (0) + D f (0)x + D2 f (0)x2 + o(x2 ). 2 Se avessimo scelto un punto x0 anche diverso da zero, la conclusione sarebbe stata analoga ma un po’ meno trasparente. Il “trucco” consiste nello scrivere il generico polinomio nella forma P2 (x) = a0 + a1 (x − x0 ) + a2 (x − x0 )2 . I valori per i tre coefficienti a0 , a1 e a2 sarebbero stati gli stessi. Applicando pi`u volte l’argomento del teorema di De l’Hospital, si dimostra il seguente risultato.
Teorema 6.16 (Taylor). Sia f : (a, b) → R una funzione derivabile n volte, e sia x0 ∈ (a, b) un punto fissato. Allora esiste uno ed un solo polinomio Pn di grado (al pi`u) n, che approssima f in x0 con ordine n. I coefficienti di Pn sono a0 = f (x0 ),
ak =
1 k D f (x0 ) per k ≥ 1, k!
e conseguentemente n
1 k D f (x0 )(x − x0 )k . k! k=1
Pn (x) = f (x0 ) + ∑
Notazione. Il simbolo ∑ e` quello della sommatoria. Dato un insieme finito di numeri reali {p1 , p2 , . . . , pn }, scriviamo n
∑ pk = p1 + p2 + · · · + pk . k=1
Forse qualche lettore avr`a sentito parlare della possibilit`a di sommare infiniti numeri reali, l’operazione alla base della teoria delle serie numeriche. Questo argomento esula dal programma del nostro corso. In ogni caso, il simbolo di sommatoria ∑ e` solo un’abbreviazione comoda sommare una quantit`a finita di numeri. Il bello della matematica e` che, a parole, tutto e` semplice. Adesso che abbiamo definito il polinomio di Taylor, calcolarlo e` concettualmente una sciocchezza. Abbiamo infatti la “ricetta” che ci restituisce meccanicamente tutti i coefficienti. Basta saper calcolare le derivate. In alcuni casi, tali calcoli sono davvero facilissimi. Ad
144
6 Il calcolo differenziale
esempio, il polinomio di Taylor di una funzione polinomiale e` evidentemente la funzione stessa. Non c’`e neanche bisogno di fare calcoli, dato che basta inserire Pn = f nella definizione del polinomio di approssimazione. Calcoliamo i primi tre termini del polinomio di Taylor della funzione f (x) =
1 1 − x − x2
con punto iniziale x0 = 0. Ci servono le prime due derivate di f : D f (x) = D2 f (x) =
1 + 2x (1 − x − x2 )2 2(1 − x − x2 )2 + 2(1 + 2x)2 (1 − x − x2 ) (1 − x − x2 )4
Quindi 1 P2 (x) = f (0) + D f (0)x + D2 f (0)x2 = 1 + x + 2x2 , 2 e perci`o f (x) = 1 + x + 2x2 + o(x2 ) per x → 0. Osserviamo che l’approssimazione ottenuta vale solo per x in un intorno di x0 = 0, e lo studente deve rifuggire la tentazione di estendere questa approssimazione a valori diversi di x. Giunti fin qui, ci resta un dubbio: e` possibile stimare l’errore compiuto con la sostituzione di Pn al posto di f ? Abbiamo visto che tale errore deve tendere a zero pi`u velocemente di (x − x0 )n , per x → x0 . Ma di funzioni che tendono a zero e` pieno il mondo. Sarebbe bello poter scrivere in termini pi`u espliciti tale errore. Per il momento ci limitiamo al prossimo risultato. Quando avremo anche gli integrali definiti nella nostra cassetta degli attrezzi, potremo dare una stima d iversa e spesso pi`u utile.
Teorema 6.17 (Formula di Taylor con resto di Lagrange). Supponiamo che f : [a, b] → R. Sia n ∈ N e supponiamo che la derivata (n − 1)–esima Dn−1 f sia una funzione continua in (a, b) e che Dn f (x) esista per ogni x ∈ (a, b). Siano x, x0 ∈ [a, b] due punti distinti, e sia Pn−1 il polinomio di Taylor di f centrato nel punto x0 di ordine n − 1. Allora esiste un punto ξ compreso fra x0 e x tale che Dn f (ξ ) f (x) = Pn−1 (x) + (x − x0 )n . n!
Dimostrazione. Sia M quell’unico numero reale tale che f (x) = Pn−1 (x) + M(x − x0 )n . Definiamo la funzione g : (a, b) → R come g(t) = f (t) − Pn−1 (t) − M(t − x0 )n .
6.10 Il polinomio di Taylor
145
Vogliamo dimostrare che esiste ξ compreso fra x0 e x tale che n!M = Dn f (ξ ). Derivando ripetutamente la funzione g, troviamo che Dn g(t) = Dn f (t) − n!M. Ci basta allora dimostrare che Dn g si annulla fra x0 e x. Poich´e Dk Pn−1 (x0 ) = Dk f (x0 ) per k = 0, . . . , n − 1, abbiamo g(x0 ) = Dg(x0 ) = · · · = Dn−1 g(x0 ) = 0. La nostra scelta di M implica g(x) = 0, e applicando il teorema di Lagrange in [x0 , x] deduciamo l’esistenza di x1 ∈ [x0 , x] tale che Dg(x1 ) = 0. Poich´e Dg(x0 ) = 0 lo stesso teorema applicato in [x0 , x1 ] garantisce l’esistenza di x2 in tale intervallo con Dg(x2 ) = 0. Dopo n passi, troviamo infine un punto xn = ξ ∈ [x0 , xn−1 ] tale che Dn g(ξ ) = 0. Poich´e xn−1 e` compreso per costruzione fra x0 e x, la dimostrazione e` conclusa. t u Un invito alla calma. Lo studente deve osservare con attenzione che la formula di approssimazione dell’ultimo teorema e` f (x) = Pn−1 (x) +
Dn f (ξ ) (x − x0 )n . n!
C’`e un’apparente sfasatura negli indici: infatti per il termine finale Dn f (ξ ) (x − x0 )n = o((x − x0 )n−1 ). n! Ma questo non e` in contraddizione con la formula ricavata precedentemente. Per avere un’approssimazione lineare dobbiamo scegliere n = 2 nell’ultimo teorema. Non e` il massimo della comodit a` , ma da un punto di vista teorico ci sembra meglio privilegiare il ruolo della regolarit`a di f . Se la formula di Taylor con il resto “o piccolo” richiede n derivate per avere un’approssimazione all’ordine n, la formula con il resto di Lagrange richiede n + 1 derivate, per avere lo stesso ordine di appross imazione. Per avere l’approssimazione lineare con resto “o piccolo”, basta che la funzione sia derivabile. Se per`o vogliamo la stima del resto del tipo D2 f (ξ ) (x − x0 )2 , 2! chiaramente f deve avere due derivate. Lo studente non far`a fatica a riconoscere come caso particolare del Teorema 6.17 proprio il teorema di Lagrange (n = 1). Uno degli usi pi`u frequenti delle formule di Taylor e` il calcolo dei limiti. Supponiamo di voler calcolare il limite
146
6 Il calcolo differenziale
ex − 1 − x . x→0 x2 lim
E` una forma di indecisione evidente, e nessun limite notevole pu`o risolverla senza fare ulteriori indagini. Ma se ricordiamo la formula di Taylor per la funzione esponenziale e la definizione di “o piccolo”, possiamo scrivere o(x2 ) ex − 1 − x 1 + x + x2 + o(x2 ) − 1 − x = = 1 + →1 x2 x2 x2 per x → 0. Una via alternativa20 consiste nell’applicare due volte la regola di De l’Hospital. Lasciamo allo studente i dettagli relativi. Qualche studente intraprendente potrebbe credere che i principali limiti possano essere dedotti dagli sviluppi di Taylor. Purtroppo, tali deduzioni sarebbero quasi certamente scorrette da un punto di vista logico. Pensiamo al famoso limite sin x = 1. x→0 x lim
(6.16)
Se usiamo lo sviluppo di Taylor sin x = x − 3!1 x3 + o(x3 ), arriviamo immediatamente al risultato. Ma calcolare il polinomio di Taylor richiede il calcolo delle derivate. Come si calcola la derivata della funzione seno in x = 0? Facendo il limite del rapporto incrementale: lim
x→0
sin x − sin 0 sin x = lim . x→0 x x−0
C’`e qualcosa che non va: stiamo calcolando un limite notevole, ma abbiamo bisogno di conoscerlo prima di calcolarlo. Questo apparente paradosso dovrebbe farci riflettere sull’importanza di costruire una casa partendo dalle fondamenta, e non dal primo piano. Dando per scontata la definizione “ingenua” delle funzioni goniometriche seno e coseno, prima dobbiamo calcolare i limiti notevoli, e solo poi possiamo calcolare le derivate. Quelle noiose disuguaglianze geometriche che costituiscono la dimostrazion e elementare del limite notevole (6.16) non sembrano facilmente evitabili.21 Infine, proponiamo un’applicazione della formula di Taylor al’analisi dei punti critici.
20
Alternativa per modo di dire. Il polinomio di Taylor e` sostanzialmente equivalente all’uso di De l’Hospital, come visto. Se dovessimo calcolare ogni volta i coefficienti del polinomio, tanto varrebbe usare De l’Hospital. Fortunatamente esistono le tabelle degli sviluppi di Taylor per le principali funzioni, e il loro uso riduce sensibilmente la mole di calcoli necessaria per calcolare molti limiti in forma indeterminata. Ovviamente, molti software sono capaci di scrivere i polinomi di Taylor di funzioni arbitrarie in pochi secondi. 21 I matematici puri danno spesso definizioni pi` u raffinate per la funzione seno, e questo permette di calcolarne la derivata seguendo strade diverse. Purtroppo, nell’economia di un primo corso di matematica questi escamotages sono troppo complicati.
6.10 Il polinomio di Taylor
147
Proposizione 6.10. Sia f : (a, b) → R una funzione derivabile n volte in (a, b). Inoltre sia D f (x0 ) = D2 f (x0 ) = · · · = Dn−1 f (x0 ) = 0, Dn f (x0 ) 6= 0. Allora 1. se n e` pari e Dn f (x0 ) > 0, x0 e` un punto di minimo; 2. se n e` pari e Dn f (x0 ) < 0, x0 e` un punto di massimo; 3. se n e` dispari, x0 non e` n´e un punto di massimo n´e un punto di minimo.
Dimostrazione. Tutte le affermazioni discendono dal teorema di Taylor. Infatti, per ipotesi si pu`o scrivere f (x) = f (x0 ) +
Dn f (x0 ) (x − x0 )n + o((x − x0 )n ) n!
per x → x0 . Se n e` pari, allora, in un intorno di x0 , f (x) − f (x0 ) ha lo stesso segno di Dn f (x0 ), e si conclude. Se n e` dispari, in ogni intorno di x0 ci sono punti x in cui f (x) − f (x0 ) e` positivo, e altri punti in cui la stessa quantit`a e` negativa. Pertanto, x0 non e` n´e u massimo n´e un minimo relativo. t u La proposizione precedente gode di una certa popolarit`a soprattutto nei testi di matematica per le scuole superiori.22 In effetti, quasi tutte le tecniche meccaniche, che richiedono tanti calcoli e poco ragionamento, sembrano avere grande fortuna nell’insegnamento secondario. Tuttavia, il calcolo delle derivate successive pu`o essere fonte di banali errori di calcolo; conviene allora cercare di studiare il segno della derivata prima attorno a x0 , per applicare il criterio di monotonia descritto in precedenza. Fra l’altro, esistono funzioni “maleducate” alle quali la Proposizione dimostrata adesso non si applica. Per esempio, la funzione P : R → R definita da23 ( exp(−1/x2 ), x 6= 0 P(x) = 0 x=0 ha un evidente minimo in x = 0. Tuttavia si potrebbe dimostrare che per ogni j ∈ N D j P(0) = 0.
22
Un rapido sondaggio fra le matricole dell’ultimo anno mi ha convinto che questa affermazione e` ormai obsoleta. Sembra infatti che nemmeno i docenti dei licei insegnigno pi`u il criterio delle derivate successive per l’analisi dei punti critici. 23 P e ` l’iniziale di “piatta”.
148
6 Il calcolo differenziale
A parole, tutte le derivate di P calcolate in x = 0 sono nulle! Non c’`e speranza di descrivere la natura dell’origine mediante la Proposizione. Senza voler essere rigorosi, potremmo dire che P e` “indefinitamente piatta” nell’origine. L’andamento qualitativo di P e` evidenziato nella prossima figura.
0.35
0.3
0.25
0.2
0.15
0.1
0.05
–1
–0.8
–0.6
–0.4
–0.2
0
0.2
0.4
0.6 x
0.8
1
Capitolo 7
Teoria dell’integrazione secondo Riemann
Ogni studente universitario ha, o dovrebbe avere, una certa familiarit`a con il calcolo di aree e volumi. A livello elementare, diciamo fino alle scuole superiori, si impara a misurare perimetri, aree e volumi di speciali figure geometriche. Fra queste compaiono i quadrilateri, i triangoli, i parallelepipedi, e cos`ı via. Gi`a la lunghezza della circonferenza pone diversi problemi tecnici, generalmente superati d’autorit`a insegnando che la circonferenza unitaria misura 2π.1 Sorvolando sulla definizione stessa di π, che spesso si dice valere circa 3.14 senza altri particolari, la misurazione della lunghezza della circonferenza e` resa attraente mediante il classico trucco dello spago arrotolato attorno alla circonferenza. Con le aree, la faccenda si fa ancora pi`u spinosa. Infatti, se ci pu`o sembrare intelligente ed anche intuitivo dire che il rettangolo di lati a e b ha un’area pari a ab (base × altezza), ben pi`u inquietante e` l’affermazione che il cerchio di raggio r ha un’area pari a πr2 (raggio × raggio × 3.14). Qui non c’`e pi`u lo spago da arrotolare. Nei casi pi`u fortunati, impariamo che la misura dell’area del cerchio si ottiene inscrivendo in esso poligoni regolari con un numero sempre maggiore di lati, e facendo tendere all’infinito il numero di lati. L’area del cerchio sar`a allora il limite, per n → +∞, dell’area del poligono regolare di n lati inscritto. Ancora pi`u in generale, consideriamo una funzione f : [a, b] → R, positiva e continua. Nel piano cartesiano, il suo grafico y = f (x) rappresenta una curva continua: che significato potremmo dare all’area di piano che giace fra l’asse delle x e il grafico della funzione? Non e` facile dare una risposta completamente comprensibile da uno studente di terza media. Fu solo nel corso del XVIII secolo che celebri matematici di nome Chauchy, Riemann, ecc. furono in grado di introdurre una teoria potente e compatibile con l’intuizione stessa di area. Nelle sezioni seguenti presenteremo un approccio ormai classico all’integrazione secondo Riemann, introdotto dal matematico francese Gaston Darboux. Seguiamo da vicino [30] e l’appendice di [31]. Non e` d’altronde l’unico approccio possibile, e infatti in [9, 17] lo studente pu`o trovare presentazioni diverse dalla nostra. In [7], la teoria dell’integrale non e` veramente svolta, tranne per le funzioni continue. 1
Ovviamente, occorrerebbe specificare un’unit`a di misura: metri, centimetri, chilometri.
149
150
7 Integrale di Riemann
Osservazione 7.1. Per molti decenni, i primi corsi di analisi matematica per gli studenti di Scienze ed Ingegneria presentavano una teoria ristretta dell’integrazione, dovuta a L. A. Cauchy. Si introduce un integrale definito solo per le funzioni continue. Il risultato e` pertanto una teoria che non si applica direttamente a funzioni con discontinuit`a a salto. Quel poco di semplicit`a che si guadagna non bilancia probabilmente la perdita di generalit`a rispetto all’integrale secondo Riemann. Per una trattazione distinta dell’integrale per le funzioni continue, rimandiamo a [32]. Avvertenza. In queste note, abbiamo deciso di trattare la cosiddetta integrazione indefinita solo marginalmente in un paragrafo successivo. Riteniamo infatti che la ricerca delle primitive sia una questione di esercizio, pi`u che di teoria. Sul mio libro di quinta liceo scientifico,2 l’Autore scriveva che “tutta la teoria dell’integrale indefinito consiste di una definizione e di una decina di integrali immediati”. La definizione e` ovviamente quella di primitiva. Si usa dire che alla base di tale teoria stia la necessit`a di invertire l’operazione di derivazione. Data una funzione, vorremmo scriverne (almeno) un’altra la cui derivata coincida con la funzione assegnata. Problema legittimo e alquanto interessante, che si risolve comunque in una definizione, un paio di osservazioni e due regolette. Tutto il resto e` esercizio. Ci piacerebbe che lo studente prendesse consapevolezza di un fatto: in matematica la teoria dell’integrazione e` quella definita.
7.1 Partizioni del dominio Situazione: abbiamo una funzione f : [a, b] → R, limitata, definita sull’intervallo chiuso e limitato [a, b]. Osservazione 7.2. L’ipotesi di limitatezza della funzione f sar`a tacitamente mantenuta in tutto la trattazione dell’integrazione secondo Riemann. Nella sezione dedicata agli integrali impropri e generalizzati vedremo fino a che punto sia possibile parlare di integrazione definita per funzioni non limitate. Ovviamente, l’ipotesi di limitatezza potrebbe essere rimossa fin dall’inizio facendo ricorso all’integrazione secondo Lebesgue.
Definizione 7.1. Una partizione di [a, b] e` un insieme finito di punti P = {x0 , x1 , . . . , xn } tali che a = x0 < x1 < x2 < · · · < xn−1 < xn = b. Una partizione P0 e` pi`u fine di P se contiene pi`u punti di P. Date due partizioni P e P0 , il loro raffinamento comune e` la partizione P? = P ∪ P0 . 2
R. Ferrauto, Lezioni di Analisi Matematica. Casa editrice Dante Alighieri.
7.1 Partizioni del dominio
151
Osservazione 7.3. Poich´e le partizioni sono semplici insiemi, ad esse si applicano tutte le consuete operazioni fra insiemi: unioni, intersezioni, ecc. Nei fatti, il raffinamento comune di due partizioni si ottiene mettendo insieme i punti di entrambe, e ovviamente disponendoli in ordine crescente di grandezza. Definizione 7.2. L’ampiezza di una partizione P si definisce come σ (P) = max |xi − xi−1 |. i=1,...,n
Notazione. Se P = {x0 , x1 , . . . , xn } e` una partizione di [a, b], si pone ∆ xi = xi − xi−1 . In corrispondenza di una partizione P, introduciamo due approssimazioni, l’una per difetto e l’altra per eccesso, dell’area sottesa dal grafico di f e dall’asse delle ascisse. Per ogni i ∈ {0, 1, . . . , n} mi =
inf
xi−1 ≤x≤xi
f (x),
Mi =
sup
f (x).
(7.1)
xi−1 ≤x≤xi
La limitatezza di f garantisce ovviamente che mi e Mi sono numeri reali, cio`e −∞ < mi ≤ Mi < +∞. E` chiaro che questa conclusione diviene falsa senza ipotesi di limitatezza. Se, per esempio, f avesse un asintoto verticale x = x0 interno all’intervallo [a, b], almeno uno fra mi e Mi diventerebbe infinito per ogni partizione contenente il punto x0 . Siano ora n
n
L(P, f ) = ∑ mi ∆ xi ,
U(P, f ) = ∑ Mi ∆ xi .
i=1
i=1
Geometricamente, L(P, f ) e` la somma delle aree dei rettangoli di base ∆ xi e di altezza mi , che rappresentano i rettangoli inscritti fra l’asse delle ascisse e il grafico di f . Analogamente, i rettangoli di base ∆ xi e altezza Mi sono circoscritti al grafico di f . Intuitivamente, L(P, f ) e` un’approssimazione per difetto dell’area sottesa dal grafico di f , mentre U(P, f ) e` un’approssimazione per eccesso della stessa area. Si vedano le successive figure.
Definizione 7.3. Il numero Z b
f (x) dx = sup L(P, f ) a
P
prende il nome di integrale inferiore di f su [a, b]. Analogamente, il numero Z b
f (x) dx = inf U(P, f ) a
P
152
7 Integrale di Riemann
Fig. 7.1 Approssimazione per difetto dell’area
prende il nome di integrale superiore di f esteso ad [a, b]. Segue dall’ovvia relazione L(P, f ) ≤ U(P, f ) che ab f (x) dx ≤ ab f (x) dx. Inoltre, la limitatezza di f implica che i due integrali inferiore e superiore sono sempre numeri reali finiti. Infatti, da m ≤ f (x) ≤ M per ogni x ∈ [a, b] discende che R
R
−∞ < m(b − a) ≤ L(P, f ) ≤ U(P, f ) ≤ M(b − a) < +∞ per ogni partizione P. La conclusione segue prendendo l’inf e il sup al variare delle partizioni P.
Definizione 7.4. Una funzione f : [a, b] → R e` integrabile secondo Riemann se
Rb a
f (x) dx =
Rb a
f (x) dx. In questo caso il valore comune dei due integrali
7.1 Partizioni del dominio
153
Fig. 7.2 Approssimazione per eccesso dell’area
inferioreRe superiore prendo il nome di integrale definito di f , e si denota col simbolo ab f (x) dx.
Osservazione. In queste note, abbiamo privilegiato la notazione tipica dei libri di R R Calcolo ab f (x) dx invece di quella, logicamente pi`u coerente, ab f .3 In effetti, dalle nostre definizioni consegue che solo f e l’intervallo [a, b] sono coinvolti nella definizione di integrale. La variabile x e` perfettamente superflua. Tuttavia, capita spesso di scrivere espressioni quali Z 1 1 x2 dx = . 3 0 Un attimo di riflessione ci convince che quella appena scritta e` un’inesattezza paragonabile a d 3 x = 3x2 . dx Capita di veder scritto ab f (x) dx, I( f , a, b), oppure ab dx f (x). Quest’ultima notazione, a mio parere detestabile, e` particolarmente popolare nei libri di fisica. 3
R
R
154
7 Integrale di Riemann
Sarebbe una battaglia persa convincere che la scrittura corretta e` pi`u o meno d (t 7→ t 3 )(x) = 3x2 . dx C’`e stato qualche coraggioso che ha tentato di introdurre nell’Analisi matematica elementare queste notazioni, ma ormai nessuno ne ricorda il nome! R R Morale della favola, i simboli ab f (x) dx e ab f (y) dy rappresentano il medesimo ente matematico. Proposizione 7.1. Sia P una partizione, e sia P0 pi`u fine di P. Allora L(P0 , f ) ≥ L(P, f ), e U(P0 , f ) ≤ U(P, f ). Dimostrazione. Cominciamo a supporre che P0 contenga esattamente un punto pi`u di P. Se x¯ e` questo punto, esiste un indice i tale che xi−1 < x¯ < xi , dove xi−1 e xi sono due punti consecutivi di P. Posto w1 =
inf
xi−1 ≤x≤x¯
f (x),
w2 = inf f (x), x≤x≤x ¯ i
e` chiaro che w1 ≥ mi e w2 ≥ mi . Quindi L(P0 , f ) − L(P, f ) = w1 (x¯ − xi−1 ) + w2 (xi − x) ¯ − mi (xi − x¯ + x¯ − xi−1 ) = (w1 − mi )(x¯ − xi−1 ) + (w2 − mi )(xi − x) ¯ ≥ 0. Un ragionamento del tutto analogo mostra che U(P0 , f ) ≤ U(P, f ). Se poi P0 contiene un numero k > 1 di punti pi`u di P, basta ripetere4 k volte il discorso appena visto. t u La definizione di integrale appena introdotta non e` molto significativa rispetto al calcolo effettivo degli integrali definiti. Inoltre, non abbiamo ancora costruito una classe maneggevole di funzioni che possono essere integrate. Quest’affermazione non dovrebbe pi`u sorprendere lo studente: sappiamo gi`a che solo alcune funzioni sono continue, altre sono derivabili. Certamente non possiamo aspettarci che “tutte” le funzioni siano integrabili. Quella che segue e` una caratterizzazione molto forte dell’integrabilit a` . Essendo una condizione necessaria e sufficiente per l’integrabilit`a, sar`a possibile utilizzarla in maniera del tutto equivalente alla definizione di integrabilit`a.
Teorema 7.1. Una funzione limitata f : [a, b] → R e` integrabile se e solo se, per ogni ε > 0 esiste una partizione Pε tale che U(Pε , f ) − L(Pε , f ) < ε.
4
(7.2)
Ricordiamo che le nostre partizioni sono insiemi costituiti da un numero finito di punti.
7.1 Partizioni del dominio
155
Dimostrazione. Per ogni partizione P, e` L(P, f ) ≤ Se vale la (7.2), allora deduciamo che 0 ≤ Rb
Rb a
Rb a
f (x) dx ≤
f (x) dx −
Rb a
Rb a
f (x) dx ≤ U(P, f ).
f (x) dx < ε, e l’arbitrariet`a
Rb
di ε garantisce che a f (x) dx = a f (x) dx. Questo significa che f e` integrabile. Viceversa, supponiamo che f sia integrabile. Fissato ε > 0, esistono due partizioni Pq e P2 tali che U(P2 , f ) −
Z b a
ε f (x) dx < , 2
Z b a
ε f (x) dx − L(P1 , f ) < . 2
Se P? e` il raffinamento comune di P1 e P2 , allora U(P? , f )−L(P? , f ) < ε, e possiamo scegliere pertanto Pε = P? . t u La condizione (7.2) sar`a quella che verificheremo sistematicamente per controllare l’integrabilit`a delle funzioni. Prima di proseguire, vogliamo per`o dare un’interpretazione pi`u intuitiva dell’integrale di Riemann. Per quanto ne sappiamo finora, per calcolare l’integrale di una data funzione, dovremmo calcolare un estremo inferiore ed un estremo superiore al variare di tutte le possibili partizioni dell’intervallo [a, b]. Non e` n´e comodo, n´e intuitivo. Vedremo fra un attimo che l’inte grale e` in realt`a un limite di aree di rettangoli al tendere a zero della lunghezza delle basi dei rettangoli.
Definizione 7.5. Sia P = {x0 , . . . , xn } una partizione di [a, b]. Una somma di Riemann per la funzione limitata f su [a, b] e` una somma del tipo n
Σ (P, f ) = ∑ f (ti )∆ xi , i=1
dove ti ∈ [xi−1 , xi ] e` un punto qualsiasi nell’intervallino [xi−1 , xi ].
Il teorema che segue permette di vedere l’integrale come un’operazione di limite.
Teorema 7.2. Una funzione limitata fR e` integrabile se e solo se esiste finito limσ (P)→0 Σ (P, f ). In tal caso, risulta ab f (x) dx = limσ (P)→0 Σ (P, f ).
Dimostrazione. Supponiamo dapprima che A = limσ (P)→0 Σ (P, f ) esista finito. Fissato ε > 0, esiste δ > 0 tale che σ (P) < δ implica, per ogni scelta di t1 , . . . ,tn , A−
ε ε ≤ Σ (P, f ) ≤ A + . 2 2
156
7 Integrale di Riemann
Sia P una partizione qualsiasi, con σ (P) < δ . Facendo assumere a t1 , . . . ,tn tutti i valori possibili e passando all’estremo inferiore e superiore delle corrispondenti somme di Riemann, si ha inf Σ (P, f ) = L(P, f ),
t1 ,...,tn
sup Σ (P, f ) = U(P, f ). t1 ,...,tn
e quindi A−
ε ε ≤ L(P, f ) ≤ U(P, f ) ≤ A + . 2 4
Ma allora f e` integrabile, ed anzi A = ab f (x) dx per l’arbitrariet`a di ε. R Viceversa, sia ε > 0 fissato. Esiste una partizione P0 tale che U(P0 , f ) ≤ ab f (x) dx+ ε 0 2 . Supponiamo che P sia costituita da n+1 punti e quindi divida [a, b] in n intervalli. Siano ε M = sup | f (x)|, 0 < δ1 < . 8Mn x∈[a,b] R
Consideriamo una partizione P tale che σ (P) < δ1 , e denotiamo con P? il raffinamento comune a P0 e P. Allora U(P, f ) = U(P, f ) −U(P? , f ) +U(P? , f ) ≤ U(P, f ) −U(P? , f ) +U(P0 , f ) ≤ U(P, f ) −U(P? , f ) +
ε + 4
Z b
f (x) dx. a
I punti di P0 interni a intervalli di P sono al massimo n − 1, e quindi U(P, f ) −U(P? , f ) ≤ (n − 1) · 2Mδ1
0 tale che per ogni partizione P con σ (P) < δ2 risulta L(P, f ) ≥
Z b a
ε f (x) dx − . 2
Se σ (P) < δ = min{δ1 , δ2 }, allora Z b a
f (x) dx −
ε ε ≤ L(P, f ) ≤ U(P, f ) ≤ + 2 2
Poich´e L(P, f ) ≤ Σ (P, f ) ≤ U(P, f ), si ha
Z b
f (x) dx. a
7.1 Partizioni del dominio
157
Z Σ (P, f ) −
b
a
f (x) dx ≤ ε
per ogni partizione P con σ (P) < δ e per ogni scelta dei punti t1 , . . . ,tn . Per R definizione, questo vuol dire che ab f (x) dx = limσ (P)→0 Σ (P, f ). t u Osservazione 7.4. Molte attribuzioni vengono fatte per la teoria dell’integrazione definita. L. A. Cauchy dimostr`o che il limite delle somme di Riemann al tendere a zero dell’ampiezza della partizione esiste finito per tutte le funzioni continue. Alcuni Autori chiamano pertanto integrale secondo Cauchy quello costruito mediante il limite delle somme di Riemann applicate a funzioni continue. L’estensione al caso delle funzioni limitate sembra essere dovuta a Riemann, mentre l’approccio con gli integrali inferiore e superiore e` dovuto al matematico francese Darboux. Come vedremo, tutte queste “teorie” vengono a coincidere per la maggior parte delle funzioni elementari e addirittura per tutte le funzioni (limitate) che possiedono un numero finito di punti di discontinuit`a nell’intervallo di integrazione [a, b]. Calcolo di un integrale mediante la definizione. Usando la teoria delle serie numeriche e il Teorema precedente, mostriamo come calcolare un integrale definito. Seguendo l’esempio di Archimede, calcoliamo l’area del segmento parabolico: Z 1
S=
x2 dx.
0
Fissato arbitrariamente n ∈ N, consideriamo la partizione equi-distribuita 0=
0 1 2 n−1 n < < < ... < < = 1. n n n n n
Dando per scontato che la funzione x 7→ x2 sia integrabile in [0, 1], il Teorema precedente garantisce che la somma di Riemann n
Sn =
∑ k=1
k−1 n
2
1 n
converge al valore S dell’integrale cercato per n → +∞. Per calcolare Sn , osserviamo che 1 n 1 Sn = 3 ∑ (k − 1)2 = 3 12 + 22 + 32 + . . . + (n − 1)2 , n k=1 n e dunque ci serve un’espressione chiusa per la somma dei quadrati dei primi n − 1 numeri naturali. La formula per questa espressione e` nota, ma non e` molto intuitiva. L’espressione chiusa e` 1 1 3 1 2 1 n − n + n . Sn = 3 n 3 2 6 Per quanto detto sopra,
158
7 Integrale di Riemann
Z 1 0
1 x2 dx = lim Sn = . n→+∞ 3
E` piuttosto sorprendente che questo risultato, ottenuto praticamente con lo stesso ragionamento esposto, fosse noto gi`a nell’antica Grecia! La verifica dell’integrabilit`a della funzione x 7→ x2 e` contenuta nel prossimo Teorema. Una prima classe di funzioni certamente integrabili e` quella delle funzioni monotone (crescenti oppure decrescenti).
Teorema 7.3. Sia f : [a, b] → R una funzione monotona e limitata. Allora f e` integrabile.
Dimostrazione. Dimostriamo l’enunciato nel caso in cui f sia monotona crescente. Prendiamo ε > 0 arbitrariamente piccolo, e sia n un numero naturale maggiore di ( f (b) − f (a))(b − a)/ε. Consideriamo i punti equispaziati (nel senso che ∆ xi = xi − xi−1 = (b − a)/n per ogni valore dell’indice i) xi = a +
b−a i, n
i = 0, . . . , n.
La partizione P = {xi }i=0,...,n verifica la condizione (7.2). Infatti, con ovvio significato dei simboli, n
U(P, f ) − L(P, f ) =
n
∑ (Mi − mi )∆ xi = ∑ ( f (xi+1 ) − f (xi ))
i=0
i=0
b−a n
n
=
b−a b−a ∑ ( f (xi+1 ) − f (xi )) = n ( f (b) − f (a)) < ε. n i=0
Dunque f e` integrabile su [a, b]. Il caso in cui f sia decrescente e` analogo. Di pi`u, si deduce dal caso gi`a dimostrato: infatti se f decresce, allora − f cresce. Poich´e e` evidente che una funzione f e` integrabile se e solo se lo e` − f , abbiamo concluso. t u Osservazione. Il teorema precedente non d`a informazioni di alcun tipo sul valore di Rb f (x) dx. Ci dice soltanto che questo integrale di Riemann esiste. a Come sappiamo, una funzione monotona non e` necessariamente una funzione continua. Si potrebbe dimostrare che non pu`o essere “troppo” discontinua, ma questo va oltre gli scopi del nostro corso. Quindi, l’integrabilit`a delle funzioni continue non e` un caso particolare del teorema sulle funzioni monotone. Purtroppo la dimostrazione che tutte le funzioni continue sono integrabili richiede qualche fatica aggiuntiva.
7.2 Continuit`a uniforme
159
7.2 La continuit`a uniforme e l’integrazione delle funzioni continue Ripensiamo alla definizione di continuit`a: una funzione f e` continua nel punto x0 se per ogni ε > 0 esiste δ > 0, dipendente da ε e da x0 , tale che |x − x0 | < δ implichi | f (x) − f (x0 )| < ε. Pensiamo alla continuit`a della funzione x 7→ x2 ; si riesce a determinare esplicitamente un δ che soddisfa questa condizione, ma non si pu`o pretendere che lo stesso δ vada bene per ogni x0 .5 Decisamente diverso e` il caso della funzione x 7→ x. Per questa funzione, basta scegliere δ = ε, senza specificare in quale punto x0 stiamo verificando la continuit`a. Questa propriet`a e` cos`ı importante che le si attribuisce un nome speciale.
Definizione 7.6. Una funzione f : D ⊂ R → R e` uniformemente continua in D se per ogni ε > 0 esiste δ > 0 tale che | f (x1 ) − f (x2 )| < ε per ogni scelta di x1 , x2 ∈ D tali che |x1 − x2 | < δ .
La continuit`a uniforme e` un concetto diverso dalla semplice continuit`a: la funzione exp : R → (0, +∞), definita da exp x = ex , non e` uniformemente continua in R. Infatti, negare la definizione di continuit`a uniforme significa dimostrare che: esiste ε > 0 tale che, scelto arbitrariamente δ > 0, esistono punti x1 e x2 ∈ D tali che |x1 − x2 | < δ ma | f (x1 ) − f (x2 )| ≥ ε. Ora, se scegliamo δ > 0 abbastanza piccolo, e se poniamo x1 = δ + 1/δ e x2 = 1/δ , ovviamente |x1 − x2 | = δ e δ 1 e − 1 1 δ → +∞ | exp x1 − exp x2 | = e δ e − 1 = δ e δ δ per δ → 0+ . Per questa ragione, la funzione continua exp non pu`o essere uniformemente continua in R. L’ostacolo che si e` frapposto fra la continuit`a e la continuit`a uniforme e` stato la possibilit`a di far tendere x1 e x2 all’infinito mentre δ → 0. Il prossimo risultato ci dice che tutte le funzioni continue su un intervallo chiuso e limitato sono addirittura uniformemente continue.
Teorema 7.4. Tutte le funzioni continue, definite su un intervallo chiuso e limitato della forma [a, b], sono uniformemente continue su tale intervallo.
Dimostrazione. Dimostreremo il teorema ragionando per assurdo. Se neghiamo la definizione di continuit`a uniforme, arriviamo all’enunciato: esiste ε ? > 0 ed esistono 5 Scriviamo un cenno della dimostrazione. Sia x 6= 0, e fissiamo ε > 0. Se δ < ε/(2|x |) e |x − 0 0 x0 | < δ , allora |x2 − x02 | = |(x − x0 )(x + x0 )| < δ · 2|x0 | < ε. E` evidente che δ → 0 se |x0 | → +∞. Questo rende impossibile la scelta di δ indipendentemente dal punto x0 .
160
7 Integrale di Riemann
due successioni {xn } ed {yn } di punti in [a, b] tali che limn→+∞ |xn − yn | = 0 ma | f (xn ) − f (yn )| ≥ ε ? . Ora, per il Teorema 3.5, esistono due sottosuccessioni {xnk } di {xn } e {ynk } di {yn } tali che xnk → x∞ ∈ [a, b] e ynk → y∞ ∈ [a, b] per k → +∞, ma | f (xn ) − f (yn )| ≥ ε ? . L’ipotesi che limn→+∞ |xn − yn | = 0 implica x∞ = y∞ , e la continuit`a di f implica che f (xnk ) → f (x∞ ) e f (ynk ) → y∞ per k → +∞. Ma allora 0 < ε ? ≤ lim | f (xnk ) − f (ynk )| = f (x∞ ) − f (y∞ ) = 0. k→+∞
Questa catena assurda di disuguaglianze implica che era assurda la negazione della continuit`a uniforme. Pertanto, f e` uniformemente continua. t u Osserviamo che la funzione x ∈ R 7→ x2 ∈ [0, +∞) non e` uniformemente continua, come si pu`o verificare imitando il ragionamento utilizzato per la funzione exp. Lo e` invece ogni sua restrizione a intervalli chiusi e limitati. Per inciso, questo dovrebbe convincere lo studente che l’insieme di definizione di una funzione e` tanto importante quanto la formula analitica che la rappresenta. Abbiamo ormai a nostra disposizione tutti gli ingredienti per formulare e dimostrare un teorea di integrabilit`a per le funzioni continue su un intervallo.
Teorema 7.5. Una funzione continua f : [a, b] → R e` integrabile.
Dimostrazione. Per il teorema UC di uniforme continuit`a, la funzione f e` uniformemente continua. Dato ε > 0, esiste δ > 0 tale che | f (x1 ) − f (x2 )| < ε/(b − a) per ogni scelta di x1 , x2 ∈ [a, b] tali che |x1 − x2 | < δ . Sia P = {x0 , . . . , xn } una partizione di ampiezza σ (P) < δ . Allora n
U(P, f ) − L(P, f ) = ∑ (Mi − mi )∆ xi i=1
n
ε ε (xi − xi−1 ) = (b − a) = ε. b−a i=0 b − a
≤∑
ε poich´e |xi − xi−1 | < δ e di conseguenza Mi − mi < b−a . Abbiamo costruito una partizione P che soddisfa la (7.2), dunque f e` integrabile. t u
Pi`u in generale, si dimostra il seguente risultato di integrabilit`a. Avvisiamo lo studente che la dimostrazione e` abbastanza complicata. Teorema 7.6. Una funzione limitata f : [a, b] → R, avente un numero finito di punti di discontinuit`a, e` integrabile. Dimostrazione. Fissato arbitrariamente ε > 0, poniamo M = maxx∈[a,b] | f (x)| e sia E l’insieme (costituito da un numero finito di elementi) dove f e` discontinua. Siccome E e` un insieme finito, possiamo ricoprirlo con un numero finito di intervalli
7.2 Continuit`a uniforme
161
aperti [u j , v j ] in modo che |v j − u j | < ε. Inoltre possiamo pensare di posizionare questi intervalli in modo che ogni elemento dell’insieme E ∩ (a, b) sia contenuto in qualche (u j , v j ). Rimuoviamo ora gli intervalli (u j , v j ) da [a, b]. L ’insieme K che resta e` chiuso e limitato. Quindi f e` uniformemente continua su K: esiste allora δ > 0 tale che | f (x) − f (y)| < ε se x, y ∈ K e |x − y| < δ . Costruiamo adesso una partizione P di [a, b] come segue: 1. ogni u j ed ogni v j appartengono a P; 2. nessun punto di (u j , v j ) appartiene a P; 3. se x j non e` uno dei punti u j , allora ∆ x j < δ . Osserviamo che Mi − mi ≤ 2M per ogni i, e che Mi − mi ≤ ε a meno che xi−1 non sia uno dei punti u j . Pertanto U(P, f ) − L(P, f ) ≤ (b − a)ε + 2Mε. Dal momento che ε e` arbitrario, abbiamo dimostrato l’integrabilit a` di f . t u Osservazione 7.5. Al di l`a dei tecnicismi, l’idea della dimostrazione pu`o essere riassunta cos`ı: si tolgono da [a, b] dei piccoli intorni di ogni punto di discontinuit`a, e si osserva che le somme di Riemann si spezzano in due. Da un lato le somme dove f risulta continua e quindi integrabile. Dall’altra le somme relative ai piccoli intorni appena costruiti. Ricordando che somme, prodotti, quozienti di funzioni continue sono ancora funzioni continue, alla luce del teorema di integrabilit`a per le funzioni continue siamo spinti a credere che l’integrabilit`a rispetti le usuali operazioni aritmetiche. Questo e` vero, ma naturalmente richiede una dimostrazione indipendente dalla continuit`a. Ci limitiamo all’enunciato preciso.
Teorema 7.7. Siano f e g due funzioni limitate, definite sull’intervallo [a, b]. Se f e g sono integrabili, allora le funzioni f + g ed f g sono integrabili. Per ogni costante reale c, la funzione c f e` integrabile. Se g(x) 6= 0 per ogni x ∈ [a, b], allora anche f /g e` integrabile. Valgono inoltre le formule Z b
Z b
f (x) + g(x) dx = a
Z b
f (x) dx + a
Z b
g(x) dx, a
Z b
f (x) dx c f (x) dx = c Za b Z ba a f (x) dx ≤ a | f (x)| dx.
Dobbiamo rifuggire dalla tentazione di estendere al prodotto f g e al quoziente f /g le formule di integrazione. Non e` vero che l’integrale del prodotto e` il prodotto
162
7 Integrale di Riemann
degli integrali! Gli esempi si sprecano, e li vedremo quando sapremo come calcolare di fatto un integrale definito di una funzione assegnata. L’integrale di Riemann gode poi di una propriet`a molto interessante: l’additivit`a rispetto al dominio di integrazione.
Proposizione 7.2. Sia f : [a, b] → R una funzione integrabile. Se c ∈ [a, b], allora f e` integrabile su [a, c] e su [c, b], e risulta Z b
Z c
f (x) dx = a
Z b
f (x) dx + a
f (x) dx. c
L’ultima operazione inportante da analizzare e` quella di composizione. Si preserva l’integrabilit`a componendo funzioni integrabili? S`ı e no: la funzione “esterna” deve essere almeno continua. Vale precisamente il seguente teorema.
Teorema 7.8. Sia f : [a, b] → R una funzione integrabile su [a, b], e supponiamo che c ≤ f (x) ≤ d per ogni x ∈ [a, b]. Sia ϕ : [c, d] → R una funzione continua. Allora la funzione composta ϕ ◦ f : [a, b] → R e` integrabile su [a, b]. Deduciamo una conseguenza notevole: se f e` positiva ed integrabile, anche ogni potenza ad esponente reale positivo di f e` ancora integrabile. Anche x 7→ e f (x) e` integrabile. Lasciamo al lettore il piacere di costruirsi altri corollari dei risultati precedenti sull’integrabilit`a.
7.3 Il teorema fondamentale del calcolo integrale Arriviamo cos`ı al momento pi`u atteso da ogni studente: la “regoletta” per calcolare gli integrali. In altri termini, la formula che esprime il legame fra l’integrale definito e le primitive di una funzione assegnata. Ci arriveremo con la dovuta calma, passando attraverso una formula “esplicita” per scrivere le primitive di una funzione continua.
Teorema 7.9. Sia f : [a, b] → R una funzione limitata e integrabile. Allora la funzione definita da Z x
F(x) =
f (t) dt, a
(a ≤ x ≤ b)
(7.3)
7.3 Teorema fondamentale del calcolo
163
e` continua. Se f e` continua nel punto x0 ∈ [a, b], allora F e` derivabile in x0 e F 0 (x0 ) = f (x0 ).
Dimostrazione. Sia M = supx∈[a,b] | f (x)|. Allora, presi x < y in [a, b], abbiamo che Zy Z y | f (t)| dt ≤ M(y − x). f (t) dt ≤ |F(y) − F(x)| = x x Quindi F e` addirittura uniformemente continua. Supponiamo che f sia continua in un certo x0 . Fissiamo ε > 0 e sappiamo che esiste δ > 0 tale che |x − x0 | < δ implica | f (x) − f (x0 )| < ε. Allora, se |h| < δ , F(x0 + h) − F(x0 ) 1 Z x0 +h ≤ − f (x ) | f (t) − f (x0 )| dt ≤ ε, 0 h x h 0 e questo dimostra che F 0 (x0 ) = lim
h→0
F(x0 + h) − F(x0 ) = f (x0 ). h
La dimostrazione e` conclusa. t u Abbiamo appena visto che tutte le funzioni continue su un intervallo hanno una primitiva abbastanza esplicita, ottenibile mediante integrazione definita. Sottolineiamo che non si pu`o prescindere dalla continuit`a di f . Infatti, prendiamo a = 0 e b = 2. La funzione discontinua ( 0 se 0 ≤ x ≤ 1 f (x) = 1 se 1 < x ≤ 2 definisce la funzione integrale F(x) = 0x f (t) dt mediante la formula ( 0 se 0 ≤ x ≤ 1 F(x) = x − 1 se 1 < x ≤ 2. R
Questa funzione F e` continua, ma non e` una primitiva di f . Infatti, la derivata di F nel punto x = 1 non esiste, trattandosi di un punto angoloso. Il risultato che segue, noto sotto il nome di Teorema di Torricelli– Barrow, contiene un primo legame fra integrazione definita e integrazione indefinita.
Teorema 7.10. Sia f : [a, b] → R una funzione continua. Se F e` una primitiva di f , cio`e F e` derivabile in ogni punto e F 0 = f , allora
164
7 Integrale di Riemann
Z b
f (x) dx = F(b) − F(a).
a
Dimostrazione. Poniamo G(x) = e` una primitiva di f , e pertanto
Rx a
f (t) dt. Il teorema precedente ci mostra che G
d (F(x) − G(x)) = f (x) − f (x) = 0. dx Quindi esiste un numero k reale tale che F(x) − G(x) = k per ogni x ∈ [a, b]. Scegliendo x = a, vediamo che F(a) − 0 = k, cio`e k = F(a). Quindi Z b
f (x) dx = G(b) = F(b) − k = F(b) − F(a).
a
La dimostrazione e` conclusa. t u Questo enunciato e` molto importante, e dipende in modo cruciale dalla continuit`a della funzione integranda f . Tuttavia questa ipotesi non serve. Il prezzo da pagare e` quello di una dimostrazione pi`u complicata.
Teorema 7.11. Sia f : [a, b] → R una funzione integrabile. Se F e` una primitiva di f , cio`e F e` derivabile in ogni punto e F 0 = f , allora Z b
f (x) dx = F(b) − F(a).
a
Dimostrazione. Sia ε > 0. Sappiamo che l’integrabilit`a di f implica l’esistenza di una partizione P = {x0 , . . . , xn } tale che U(P, f )−L(P, f ) < ε. Per ogni i = 1, . . . , n, il teorema di Lagrange applicato alla funzione F ci dice che esiste ti ∈ [xi−1 , xi ] tale che F(xi )−F(xi−1 ) = f (ti )∆ xi . Dal momento che ti ∈ [xi−1 , xi ], avremo mi ≤ f (ti ) ≤ Mi , e dunque Z b n f (x) dx − ∑ f (ti )∆ xi < ε. a i=1 Inoltre, F(b) − F(a) = [F(x1 ) − F(x0 )] + [F(x2 ) − F(x1 )] + · · · + [F(xn ) − F(xn−1 )] n
= ∑ F(xi ) − F(xi−1 ). i=1
Deduciamo che
7.3 Teorema fondamentale del calcolo
Z F(b) − F(a) −
a
b
165
n Z b f (x) dx f (x) dx = ∑ F(xi ) − F(xi−1 ) − i=1 a Z b n f (x) dx < ε. = ∑ f (ti )∆ xi − i=1 a
Questo conclude la dimostrazione. t u Osservazione 7.6. Ci sembra utile proporre il seguente argomento per la dimostrazione del teorema precedente. Fissata arbitrariamente una partizione P di [a, b], per ogni indice i esiste un punto ti ∈ [xi−1 , xi ] tale che F(xi ) − F(xi−1 ) = f (ti )∆ xi . Sommando rispetto a i, otteniamo n
n
F(b) − F(a) = ∑ F(xi ) − F(xi−1 ) = ∑ f (ti )∆ xi , i=1
(?)
i=1
e a destra dell’ultimo segno di uguaglianza riconosciamo una somma di Riemann per la funzione f . Invocando allora il Teorema 6.8, ci sembrerebbe lecito far tendere a zero l’ampiezza σ (P) della partizione P e di concludere che Z b
n
∑ f (ti )∆ xi = F(b) − F(a). σ (P)→0
f (x) dx = lim a
i=1
La dimostrazione e` cos`ı terminata. Ne siamo proprio sicuri? La risposta e` che questa non e` una dimostrazione corretta. Fare il limite delle somme di Riemann significa che per ogni ε > 0 esiste δ > 0 tale che, per ogni partizione P di ampiezza σ (P) < δ e per ogni scelta dei punti ti ∈ [xi−1 , xi ] si ha Z b n f (x) dx < ε. ∑ f (ti )∆ xi − i=1 a Invece, nel nostro ragionamento, i punti ti sono opportunamente scelti. Spostandoli anche solo di poco, la relazione (?) diventa in generale falsa! Si potrebbe dimostrare con poca fatica che le cose vanno a posto quando f e` continua, dal momento che piccoli spostamenti dei punti ti comportano piccoli spostamenti dei valori f (ti ). Ma il teorema fondamentale del calcolo per le funzioni continue ha una dimostrazione ancora pi`u elementare che abbiamo gi`a proposto. Ricapitolando, per calcolare un integrale definito basta procurarsi una primitiva e applicare il teorema di Torricelli. Un’estensione pressoch´e immediata al concetto di primitiva e` il seguente. Definizione 7.7. Sia (a, b) un intervallo, e sia f : (a, b) → R. Si dice che F : (a, b) → R e` una primitiva in senso esteso di f se F e` continua in ogni punto di (a, b), se F e` derivabile in (a, b) eccetto al pi`u un numero finito di punti x1 , . . . , xn , e se F 0 (x) = f (x) per ogni x ∈ (a, b) \ {x1 , . . . , xn }.
166
7 Integrale di Riemann
Invitiamo lo studente a dimostrare che se F e G sono due primitive in senso esteso di una certa f , allora F e G differiscono per una costante. Suggerimento: su ciascuno degli intervalli [x1 , x2 ], [x2 , x3 ], ecc. la funzione F − G ha derivata nulla. Quindi essa e` costante su ognuno di questi intervalli. Il punto e` che le varie costanti potrebbero essere diverse: F(x) − G(x) = C1 in [x1 , x2 ], F(x) − G(x) = C2 in [x2 , x3 ], e cos`ı via. La continuit`a di F e di G, assunta per ipotesi nella definizione precedente, obbliga tuttavia queste costanti a coincidere. La conclusione e` ormai a portata di mano.
7.4 Media integrale Se f : [a, b] → R e` integrabile, il numero 1 b−a
Z b
f (x) dx a
si chiama media integrale di f sull’intervallo [a, b]. Se P e` una qualunque partizione di [a, b], risulta (b − a) inf f (x) ≤ L(P, f ) ≤ U(P, f ) ≤ (b − a) sup f (x), x∈[a,b]
x∈[a,b]
e in particolare inf f (x) ≤ x∈[a,b]
1 b−a
Z b
f (x) dx ≤ sup f (x).
a
x∈[a,b]
Questo mostra che la media integrale di f e` un numero compreso fra l’estremo inferiore e l’estremo superiore di f . Se f e` anche continua, sappiamo dal Teorema 5.12 che tale numero deve essere assunto in qualche punto di [a, b]. Precisamente vale il seguente risultato. Teorema 7.12. Se f : [a, b] → R e` continua, allora esiste ξ ∈ [a, b] tale che f (ξ ) = 1 Rb b−a a f (x) dx.
7.5 Applicazioni al calcolo degli integrali definiti Ricordiamo che la formula di derivazione ( f g)0 = f 0 g + f g0 conduce alla regola di integrazione per parti (si veda anche il paragrafo successivo) Z
f (x)g0 (x) dx = f (x)g(x) −
Z
f 0 (x)g(x) dx.
7.6 Cenni sulla ricerca delle primitive
167
Il teorema fondamentale del calcolo integrale ci dice immediatamente che Z b
f (x)g0 (x) dx = f (b)g(b) − f (a)g(a) −
a
Z b
f 0 (x)g(x) dx.
a
Un po’ pi`u complicata e` la formula per calcolare correttamente gli integrali definiti per sostituzione. Se x = g(t), t ∈ [c, d], e` un cambiamento di variabile monotono crescente,6 allora Z g−1 (b)
Z b
f (x) dx =
g−1 (a)
a
f (g(t))g0 (t) dt.
(7.4)
Se invece x = g(t), t ∈ [c, d], e` un cambiamento di variabile monotono decrescente, dobbiamo usare la formula Z g−1 (a)
Z b
f (x) dx = a
g−1 (b)
f (g(t))g0 (t) dt.
(7.5)
Occorre fare molta attenzione alle formule (7.4) e (7.5). Queste ci dicono che integrando per sostituzione gli estremi di integrazione vanno cambiati. Vediamo un esempio: vogliamo calcolare Z 2 log x dx. x 1 Ponendo x = g(t) = et , la formula (7.4) afferma che Z 2 log x 1
x
dx =
Z log 2 t log 1
et
et dt =
Z log 2 0
1 t dt = (log 2)2 . 2
Invitiamo gil studenti a fare molto esercizio per memorizzare queste formule. Uno degli errori pi`u diffusi e` quello di dimenticarsi di cambiare gli estremi di integrazione. Osservazione 7.7. Dalla discussione appena fatta, discende che il calcolo di un integrale definito in cui sia necessario operare per sostituzione pu`o essere svolto in due modi: 1. lavorando sempre con l’integrale indefinito, e applicando il teorema fondamentale solo come ultimo passaggio; 2. lavorando direttamente sull’integrale definito, ricordando sempre di cambiare gli estremi di integrazione coerentemente con il cambiamento di variabile.
7.6 Cenni sulla ricerca delle primitive L’insegnamento del paragrafo precedente e` che occorre sviluppare una certa manualit`a nel calcolo delle primitive. Ricordiamo che 6
E` sottinteso in questa espressione che g sia derivabile.
168
7 Integrale di Riemann
Definizione 7.8. Una funzione F e` una primitiva di una funzione f sull’intervallo I se F e` derivabile in I e risulta F 0 (x) = f (x) per ogni x ∈ I.
Osservazione 7.8. Se calcolare la derivata di una funzione la cui formula si compone di funzioni elementari e` sempre possibile mediante le regole di calcolo dimostrate prima, il calcolo delle primitive delle funzioni elementari pu o` sconfinare dall’ambito delle funzioni elementari stesse. Per capirci, si pu`o dimostrare che la funzione 2 x 7→ ex non possiede primitive esprimibili mediante formule elementari. Ovviamente questa funzione possiede primitive in quanto si trata di una funzione continua. Il punto e` che non riusciremo mai a scriverle esplicitamente mediante il solo utilizzo di funzioni elementari. Innanzitutto, quante solo le primitive di una data funzione?
Proposizione 7.3. Dati un intervallo I ed una funzione f , due primitive di f differiscono per una costante additiva.
Dimostrazione. Siano F1 ed F2 due primitive di f su I. Poich´e (F1 − F2 )0 = F10 − F20 = f − f = 0
in I,
la funzione F1 − F2 e` costante in I. Quindi esiste C ∈ R tale che F1 (x) = F2 (x) +C per ogni x ∈ I. t u Quindi, se vogliamo trovare le primitive di una funzione su un intervallo, occorre e basta trovarne una: tutte le altre differiranno da essa per costanti additive. Con un certo abuso di notazione, sottintendiamo l’intervallo I e scriviamo Z
f (x) dx = {F | F e` una primitiva di f su I} .
(7.6)
Questo per`ıo non ci aiuta nel calcolo effettivo delle primitive. Inoltre, la definizione non e` operativa, a differenza di quella di derivata. Per affrontare questo problema, cominciamo ad osservare che ogni tabella di derivate e` automaticamente una tabella di primitive. Ad esempio, dalla regola d sin x = cos x dx deduciamo che una primitiva della funzione coseno e` la funzione seno. Inoltre, le regole algebriche per il calcolo differenziale diventano (parzialmente) ergole per il calcolo delle primitive. Infatti, se k e` una costante reale,
7.6 Cenni sulla ricerca delle primitive
169
Z
Z
( f (x) + g(x)) dx = Z
Z
f (x) dx +
k · f (x) dx = k ·
g(x) dx,
Z
f (x) dx.
Non e` ovviamente vero che la primitiva di un prodotto di funzioni sia il prodotto delle corrispondenti primitive! La formula di Leibniz per la derivazione dei prodotti d`a origine alla regola di integrazione per parti.
Proposizione 7.4 (Integrazione per parti). Se f 4 g sono due funzioni derivabili in un intervallo I, allora Z
f (x)g0 (x) dx = f (x)g(x) −
Z
f 0 (x)g(x) dx.
(7.7)
Dimostrazione. Dalla formula di Leibniz D( f g) = D f · g + f · Dg segue immediatamente che Z Z f (x)g(x) = f 0 (x)g(x) dx + f (x)g0 (x) dx, cio`e la formula della proposizione. t u Vediamo come si applica, in pratica, questa formula. Supponiamo di voler R calcolare xex dx. Come scegliere f e g? Abbiamo due possibilit a` : 1. f (x) = x e g0 (x) = ex 2. f (x) = ex e g0 (x) = x. Nel primo caso, la Proposizione precedente dice che Z
xex dx = xex −
Z
ex dx = xex − ex +C.
Nel secondo caso, Z
xex dx =
x2 x e − 2
Z
x2 x e dx. 2
E` evidente che la seconda alternativa ha complicato il calcolo dell’integrale indefinito, mentre la prima l’ha risolto. Come “vedere” la scelta giusta? Non ci sono ricette universali, ed e` soprattutto l’esperienza che permette di scegliere la strada migliore senza perdersi in calcoli inutili e complicati. Se fin qui abbiamo dato spazio alle regole algebriche, ci manca ancora un metodo generale per affrontare la ricerca delle primitive di funzioni ottenute mediante composizione.
170
7 Integrale di Riemann
Proposizione 7.5 (Integrazione per sostituzione). Siano f ed x due funzioni derivabili e tali che la composizione f ◦ x abbia significato in un certo intervallo. Allora Z
f 0 (x(t))x0 (t) dt = f (x(t)) +C.
(7.8)
Dimostrazione. Per la regola della catena, d f (x(t)) = f 0 (x(t))x0 (t), dt sicch´e f (x(t)) +C =
R 0 f (x(t))x0 (t) dt.
t u
Questa formula e` molto meno trasparente di quella di integrazione per parti. In pratica, il metodo sembra potersi applicare solo alle funzioni integrande di un tipo molto particolare, cio`e ( f ◦ x)xR0 . Vediamo ora S un esempio molto semplice di applicazione. Si voglia calcolare ex+2 dx. Se poniamo f 0 (x) = ex e t = x + 2, allora x = x(t) = t − 2 e` derivabile e l’integarle proposto si risolve con la formula di integrazione per sostituzione: Z
ex+2 dx =
Z
f 0 (x(t))x0 (t) dt = et +C = ex+2 +C.
Ecco un secondo esempio: calcolare x sin(x2 ) dx. Poniamo x2 = t, in modo che √ 1 x = x(t) = ± t. Quindi x0 (t) = ± 2√ e l’integrale diventa t R
Z
Z Z √ 1 1 1 sint dt = − cost +C. ± t sint ± √ dt = 2 2 2 t
Torniamo infine alla variabile x, e poich´e t = x2 possiamo scrivere Z
1 x sin(x2 ) dx = − cos(x2 ) +C. 2
Osservazione 7.9. Nell’ultimo esempio abbiamo cercato di proporre lo schema pratico dell’integrazione per sostituzione, che appare un po’ diverso dal contenuto della Proposizione 7.5. Per accertarsi di non aver commesso qualche ingenuo errore di calcolo, lo studente e` senz’altro invitato a verificare la correttezza della propria soluzione facendo la derivata della (presunta) primitiva. Se il risultato e` esattamente la funzione da integrare, allora l’esercizio e` corretto. Nel prossimo paragrafo lo studente pu`o trovare una motivazione un po’ formale del funzionamento del metodo di sostituzione. Osservazione 7.10. Capita spesso di leggere interi paragrafi di libri di testo dedicati ai cosiddetti “integrali quasi immediati”. Si tratta di quegli integrali che si presentano sotto la forma generale
7.7 Il differenziale
171
Z
g( f (x)) f 0 (x) dx,
dove f e g sono due funzioni assegnate. In realt`a, questi sono integrali banalmente calcolabili per sostituzione: infatti, ponendo t = t(x) = f (x), osserviamo che t 0 (x) = f 0 (x), sicch´e Z Z g( f (x)) f 0 (x) dx =
g(t) dt,
e basta allora procurarsi una primitiva G di g per concludere che Z
g( f (x)) f 0 (x) dx = G( f (x)) +C.
Il secondo esempio visto sopra era in realt`a di questo tipo: infatti Z
1 x sin(x ) dx = 2 2
Z
(2x) sin(x2 ) dx,
e riconosciamo un integrale “quasi immediato” nel quale f (x) = x2 e g(x) = sin x. Se queste sono le uniche regole generali di calcolo delle primitive, questo non significa che siamo capaci di calcolare tutti gli integrali indefiniti che possiamo concepire. Anche escludendo quei casi che non possiedono primitive esprimibili mediante funzioni elementari, il calcolo di una primitiva pu`o richieder l’uso ripetuto e/o sovrapposto delle regole studiate, oltre naturalmente ad “astuzie” di natura algebrica o analitica. Insomma, il calcolo integrale mette alla prova lo spirito di osservazione dello studente, e costituisce certamente il primo ostacolo che la sola applicazione di regole meccaniche non permettono di aggirare. Nel prossimo paragrafo ci occuperemo dell’integrazione indefinita di un’ampia classe di funzioni, e saremo costretti ad utilizzare alcuni “trucchi” per semplificare il nostro lavoro.
7.7 Il differenziale Definizione 7.9. Una funzione lineare L : R → R e` una funzione tale che per ogni x, y ∈ R ed ogni α, β reali risulti L(αx + β y) = αL(x) + β L(y). Osservazione 7.11. Non e` difficile rendersi conto che tutte e sole le funzioni lineari hanno la rappresentazione L(x) = kx per un valore opportuno di k ∈ R. In parole povere, le funzioni lineari di una variabile sono rappresentate da rette uscenti dall’origine degli assi cartesiani. Osservazione 7.12. In certi settori della matematica elementare, e` consuetudine chiamare lineari le funzioni il cui grafico e` rappresentato da una retta. Questa terminologia non e` compatibile con la definizione precedente, dato che una funzione
172
7 Integrale di Riemann
quale f (x) = x + 1 non soddisfa la condizione f (αx + β y) = α f (x) + β f (y) per ogni scelta di α, β , x ed y. Infatti, f (x + x) = (x + x) + 1 = 2x + 1 6= x + 1 + x + 1 = 2x + 2 = f (x) + f (x). Nella matematica pi`u avanzata, si impara a chiamare affini le funzioni rappresentate da una retta nel piano cartesiano. Nel seguito, ci atterremo scrupolosamente alla terminologia della nostra definizione. Definizione 7.10. Una funzione f : (a, b) → R e` differenziabile nel punto x0 ∈ (a, b) se esiste una funzione lineare L (dipendente ovviamente da x0 ) tale che lim
h→0
f (x0 + h) − f (x0 ) − L(h) = 0. h
(7.9)
Il differenziale di f in x0 , se esiste, viene indicato dal simbolo d f (x0 ). Osservazione 7.13. Dalla precedente osservazione, deriva che f e` differenzialbile in x0 se e solo se esiste un numero reale k tale che lim
h→0
f (x0 + h) − f (x0 ) − kh = 0, h
e dunque se e solo se esiste un numero reale k tale che k = lim
h→0
f (x0 + h) − f (x0 ) . h
Dunque la differenziabilit`a in x0 coincide con la derivabilit`a in x0 ! Di pi`u, d f (x0 ) altro non e` che la funzione lineare h 7→ f 0 (x0 )h. Perch´e abbiamo introdotto l’inutile concetto di differenziale se questo coincide (con leggero abuso di terminologia) con la derivata? Una risposta raffinata ma poco corretta e` che, per funzioni di due o pi`u variabili, la derivata deve essere definita mediante il differenziale per avere tutte le propriet`a buone che ci aspettiamo. Ma questa risposta non ci soddisfa, dato che per funzioni di una variabile reale abiamo visto che e` tutto tempo sprecato. Una risposta suggestiva e` che il differenziale permette di rendere pi u` intuitiva la formula di itnegrazione per sostituzione. Infatti, se x = x(t) e` la sostituzione che vogliamo effettuare nell’integrale, allora possiamo usare il concetto di differenziale per scrivere dx = x0 (t) dt, pensando che dt sia un piccolo incremento (quello che prima abbiamo denotato con h). Dunque, al posto di dx dobbiamo scrivere x0 (t) dt, e questo porta direttamente alla formula di integrazione per sostituzione. Osservazione 7.14. Capita spesso di leggere, sui testi pi`u tradizionali di calcolo differenziale, che i differenziali sono pi`u flessibili delle derivate perch e´ non richiedono che si specifichi da quali variabili dipendono le quantit`a in esame. Uno degli esempi classici e` la legge della fisica pV = nT , dove p e` la pressione, V il volume e T la
7.8 Integrazione delle funzioni razionali fratte
173
temperatura (espressa in gradi Kelvin), menter n e` una costante. A questo punto, si dice che “differenziando” questa uguaglianza, si ottiene p dV +V dp = n dT, qualunque siano le variabili indipendenti da cui dipendono p, V e T . Personalmente, non trovo questa conclusione cos`ı eccitante ed innovativa. Il punto e` che i matematici all’antica pensavano alle funzioni come a formule esplicite contenenti una o pi u` variabili indipendenti. Se non potevano scriverle, si sentivano molto a disagio. Per noi, ormai, e` chiaro che la derivata opera sulle funzioni, indipendentemente dal nome scelto per le variabili indipendenti che la descrivono. Nonostante ci`o, i fisici matematici continuano ad utilizzare un linguaggio pittoresco e simpaticamente vintage, e guai a mostrarsi indifferenti!
7.8 Integrazione delle funzioni razionali fratte Le seguenti formule sono tratte da [2]: per a 6= 0,
2 2ax + b p arctan p , b2 − 4ac < 0 2 2 4ac − b 4ac − b Z 2ax + b − pb2 − 4ac dx 1 = p p log , b2 − 4ac > 0 ax2 + bx + c 2 2 b − 4ac 2ax + b + b − 4ac − 2 , b2 = 4ac. 2ax + b
La forma analitica delle primitive dipende essenzialmente dal segno di ∆ = b2 − 4ac. I calcoli seguenti dovrebbero risvegliare qualche ricordo nella mente dello studente: per a 6= 0, ! b c b 2 c b2 2 2 ax + bx + c = a x + x + =a x+ + − 2 a a 2a a 4a ! 2 b 4ac − b2 =a x+ + 2a 4a2 ! b 2 ∆ =a x+ − 2 2a 4a
174
7 Integrale di Riemann
Vediamo che, per risolvere l’equazione algebrica di secondo grado ax2 + bx + c = 0 dobbiamo risolvere
! ∆ b 2 − 2 = 0, a x+ 2a 4a
e cio`e
∆ b 2 − 2 = 0. x+ 2a 4a
Ma questa equazione e` facile: r √ b ∆ ∆ x+ =± =± . 2 2a 4a 2a Lo studente non mancher`a di notare che abbiamo ricavato la celeberrima formula risolutiva per le equazioni (algebriche) di secondo grado: √ −b ± ∆ . x= 2a La presenza della radice quadrata di ∆ ci costringe a distinguere tre casi: 1. ∆ > 0 2. ∆ < 0 3. ∆ = 0. Cominciamo dall’ultimo caso. Il polinomio ax2 + bx + c possiede due radici reali coincidenti: b x1 = x2 = − . 2a Inoltre ax2 + bx + c = a(x − x1 )2 . Quindi Z
1 dx = ax2 + bx + c a
Z
dx 1 1 2 =− =− . (x − x1 )2 a x − x1 2ax + b
Il caso ∆ > 0 si tratta come nel seguito. Il nostro polinomio di secondo grado possiede le due radici reali distinte √ √ −b − ∆ −b + ∆ x1 = , x2 = . 2a 2a Perci`o ax2 + bx + c = a(x − x1 )(x − x2 ), e Z
dx 1 = 2 ax + bx + c a
Cerchiamo due numeri reali A e B tali che
Z
ddx . (x − x1 )(x − x2 )
7.8 Integrazione delle funzioni razionali fratte
175
1 B A + = (x − x1 )(x − x2 ) x − x1 x − x2 per ogni x ∈ / {x1 , x2 }. Mettendo a denominatore comune e operando qualche semplificazione, otteniamo 1 = (A + B)x − Ax2 − Bx1 per ogni x ∈ / {x1 , x2 }. Affich´e questo sia vero, il coefficiente della x a secondo membro deve essere uguale al coefficiente della x a primo membro (cio`e 0), e i termini noti devono coincidere. Pertanto occorre risolvere il sistema lineare in due equazioni ( A+B = 0 (7.10) Ax2 + Bx1 = −1. La soluzione si trova facilmente per sostituzione: ( A = 1/(x1 − x2 ) B = −1/(x1 − x2 ). Dunque 1 1 1 1 1 = − . (x − x1 )(x − x2 ) x1 − x2 x − x1 x1 − x2 x − x2 Infine, Z
dx 1 dx = 2 ax + bx + c a (x − x1 )(x − x2 ) 1 1 1 log |x − x1 | − log |x − x2 | = a x1 − x2 x1 − x2 x − x1 1 . = log a(x1 − x2 ) x − x2 Z
Sostituendo i valori di x1 e x2 e facendo qualche calcolo algebrico, si arriva alla formula scritta all’inizio di questo paragrafo. L’ultimo caso e` quello in cui ∆ < 0, ed e` noto che il nostro polinomio di secondo grado non possiede radici reali. Probabilmente alcuni studenti sanno che esso possiede invece due radici complesse coniugate. Non avendo discusso i numeri complessi, e visto che non ne trarremmo alcun vantaggio concreto, evitiamo di insistere su tale terminologia. Per integrare la funzione razionale ci basta osservare che b c ax2 + bx + c = a x2 + x + a a e che
b c b 2 c b2 + − 2. x + x+ = x+ a a 2a a 4a 2
176
7 Integrale di Riemann
Poich´e ∆ < 0, esiste k ∈ R tale che k2 =
c b2 − 2. a 4a
b La sostituzione t = x + 2a ci conduce all’integrale
1 a
Z
dt 1 = 2 t 2 + k2 ak
Z
dt . ( kt )2 + 1
L’ulteriore sostituzione u = t/k risolve l’ultimo integrale: 1 ak2
Z
1 dt = ( kt )2 + 1 ak2
Z
1 k 1 t du = arctan u +C = arctan +C. u2 + 1 ak ak k
b Ricordando che t = x + 2a ed esplicitando il valore di k, si arriva dopo qualche passaggio all’integrale voluto. Sconsigliamo allo studente di imparare a memoria i risultati: lo sforzo non e` banale, ed e` certo pi`u importante saper riprodurre i ragionamenti nel caso concreto.
Osservazione 7.15. Come sempre, non esiste necessariamente un unico modo di esprimere una primitiva. Si consideri l’esempio Z
dx . 1 − x2
Si tratta evidentemente di una integranda di tipo razionale fratto. Ovviamente 1 − x2 = (1 − x)(1 + x), e dunque 1 1 1 1 1 = − 2 1−x 2 1−x 2 1+x e l’integrale diventa immediato: Z
1 1 dx = log |1 − x| − log |1 + x| +C. 2 1−x 2 2
Molti software di calcolo simbolico propongono una primitiva molto diversa: Z
dx = arctanh x +C. 1 − x2
Ricordiamo che ex − e−x 2 ex + e−x cosh x = 2 sinh x tanh x = . cosh x sinh x =
7.9 Il polinomio di Taylor con resto integrale
177
Si verifica facilmente che7 (cosh x)2 − (sinh x)2 = 1, e dividendo per (cosh x)2 si arriva all’identit`a (cosh x)2 =
1 1 − (tanh x)2
Infine, d sinh x = cosh x dx d cosh x = sinh x dx d 1 tanh x = . dx (cosh x)2 La funzione arctanh e` definita come la funzione inversa di tanh. La sua derivata vale d arctanh y = dy
d dx
1 1 = (cosh x)2 = , 1 − y2 tanh x
dove y = tanh x. pertanto Z
dy = arctanh y +C. 1 − y2
Nelle figure 7.1, 7.2 e 7.3 appaiono i grafici qualitativi delle funzioni seno iperbolico, coseno iperbolico e tangente iperbolica.
7.9 Il polinomio di Taylor con resto integrale Ricordiamo che, per una funzione f : (a, b) → R derivabile n volte, vale la formula f (x) = Pn (x) + Rn (x), dove
n
1 k D f (x0 )(x − x0 )k k! k=1
Pn (x) = f (x0 ) + ∑
e` il polinomio di Taylor di ordine n e Rn (x) = f (x) − Pn (x) e` l’errore che si compie sostituendo Pn a f . Abbiamo gi`a imparato che 7 Si osservi la somiglianza con l’identit` a fondamentale della (tri)goniometria (sin α)2 + (cos α)2 = 1.
178
7 Integrale di Riemann
2,4
1,6
0,8
-4,8
-4
-3,2
-2,4
-1,6
-0,8
0
0,8
1,6
2,4
3,2
4
4,8
0,8
1,6
2,4
3,2
4
4,8
-0,8
-1,6
-2,4
Fig. 7.3 la funzione sinh
2,4
1,6
0,8
-4,8
-4
-3,2
-2,4
-1,6
-0,8
0
-0,8
-1,6
-2,4
Fig. 7.4 la funzione cosh
7.10 Integrali impropri
179
2,4
1,6
0,8
-4,8
-4
-3,2
-2,4
-1,6
-0,8
0
0,8
1,6
2,4
3,2
4
4,8
-0,8
-1,6
-2,4
Fig. 7.5 la funzione tanh
Rn (x) = 0, x→x0 (x − x0 )n lim
e che e` possibile esprimere tale resto mediante la derivata (n +1)– esima in un punto opportuno ξ : 1 Rn (x) = Dn+1 f (ξ )(x − x0 )n+1 . (n + 1)! Il seguente risultato illustra un’ulteriore espressione per il resto. Teorema 7.13 (Polinomio di Taylor con resto integrale). Sia f : (a, b) → R una funzione derivabile n+1 volte in (a, b), con derivata (n+1)–esima Dn+1 f continua. Allora Z 1 x (x − t)n Dn+1 f (t) dt. Rn (x) = n! x0 Non dimostriamo tale formula, che richiederebbe la tecnica dell’induzione matematica. L’espressione integrale del resto Rn ha un’utilit`a quasi esclusivamente teorica, dato che la funzione integrale coinvolta e` di difficile calcolo.
7.10 Integrali impropri Per quanto ci riguarda, solamente le funzioni limitate possono essere integrate su un intervallo limitato [a, b]. Da questa classe esulano le funzioni come x ∈ (0, 1) 7→
180
7 Integrale di Riemann
√ 1/ x e x ∈ (1, +∞) 7→ 1/x2 , per esempio. Osserviamo che si tratta di funzioni continue, ed anzi derivabili nel loro dominio. L’integrale di Lebesgue, la cui teoria e` ben pi`u complicata di quella vista finora, propone una teoria che supera queste restrizioni. Noi ci accontenteremo di introdurre i rudimenti dell’integrazione in senso generalizzato o improprio.
7.10.1 Funzioni illimitate Per semplicit`a consideriamo una funzione f che sia definita e continua in un intervallo [a, b). La funzione f potr`a non essere limitata. E` lecito allora per ogni c < b Rc considerare l’integrale a f (x) dx e viene spontanea la seguente
Definizione 7.11. Se nelle ipotesi dette esiste il limite Z c
lim
c→b− a
f (x) dx,
questo viene detto integrale (improprio) di f in (a, b) e lo si indica ancora con R la notazione ab f (x) dx. E` chiaro che possiamo estendere la definizione precedente al caso in cui f sia illimitata nell’estremo sinistro a dell’intervallo. Basta considerare il limite Z b
lim
c→a+ c
f (x) dx.
Quindi, tutto e` stato ricondotto all’esistenza di un limite. Non sempre, per`o e` possibile calcolare esplicitamente gli integrali, ed e` utile avere un teorema che garantisca l’integrabilit`a impropria di f . Teorema 7.14. Sia ϕ una funzione continua in [a, b), a valori positivi per cui esista l’integrale improprio in (a, b), e sia f una funzione continua in [a, b) tale che | f (x)| ≤ ϕ(x) per ogni x ∈ [a, b). Allora esiste l’integrale improprio fra a e b di f . Conviene pertanto costruire una scala di funzioni illimitate che ci permatta di decidere per confronto se una funzione ammetta integrale improprio o no. Consideriamo questa semplice famiglia di funzioni illimitate in ogni intorno del’estremo b: 1 , (α > 0). x ∈ [a, b) 7→ (b − x)α Ora, Z c a
dx = (b − x)α
( log(b − a) − log(b − c), α =1 1 1 1−α 1−α − 1−α (b − c) , α= 6 1. 1−α (b − a)
7.10 Integrali impropri
181
Perci`o nel caso α = 1 l’integrale improprio non esiste in quanto Z c
lim
c→b− a
dx = +∞. (b − x)α
Lo stesso accade per α > 1. Per α < 1 Z c
lim
c→b− a
dx 1 = (b − a)1−α α (b − x) 1−α
In conclusione, l’integrale improprio esiste se e solo se 0 < α < 1. Diamo un cenno a un caso un po’ pi`u generale. Supponiamo che la funzione f , definita in [a, b], sia continua con l’eventuale eccezione dei punti d1 , d2 , . . . ,dr . Allora si pu`o suddividere l’intervallo (a, b) in un numero finito di intervalli, in modo che in ciascuno di essi la funzione f sia discontinua solo in un estremo (destro o sinistro). A ciascuno di questi intervalli si possono applicare le considerazioni fatte prima; se, per ciascuno di essi, esiste l’integrale improprio, la somma di questi si definisce come integrale improprio della f esteso all’intervallo (a, b). In pratica, se nell’intervallo [a, b] ci sono due punti d1 e d2 dove la funzione f e` illimitata, scriveremo Z b
f (x) dx =
Z d1
a
f (x) dx +
a
Z d2
Z b
f (x) dx +
d1
f (x) dx. d2
Il primo e l’ultimo integrale ricadono nella definizione di integrale improprio. Il secondo e` pi`u delicato. Infatti f potrebbe essere illimitata in entrambi gli estremi. Possiamo per`o ricondurlo a un integrale improprio con questo “trucco”: scegliamo un punto c ∈ (d1 , d2 ) dove f sia continua, e scriviamo Z d2
Z c
f (x) dx =
d1
f (x) dx + d1
Vediamo, ad esempio, se esiste
Z d2
f (x) dx.
c
R +1 dx √ . −1 |x|
La funzione integranda e` illimitata per x → 0. Suddividiamo allora l’intervallo (−1, 1) nei due intervalli (−1, 0 e (0, 1). Si ha 8 Z −δ
lim
δ →0+ −1
e lim
p 1 √ dx = lim (−2 −δ + 2) = 2 δ →0+ −x √ √ dx = lim (2 − 2 σ ) = 2. σ →0+ x
Z 1 1
σ →0+ σ
Osservazione 7.16. Alcuni Autori definiscono integrabile in senso improprio una funzione f se esiste finito il limite 8
Lo studente noter`a che abbiamo esplicitato il valore assoluto nei due integrali.
182
7 Integrale di Riemann
Z c
lim
c→b− a
| f (x)| dx.
Poich´e l’integrale di una funzione positiva e` un numero positivo, questi Autori richiedono di verificare l’esistenza di un limite di una quantit`a positiva. Questa definizione non e` equivalente alla nostra: e` possibile costruire funzioni che, per noi, sono integrabili in senso generalizzato, ma che non lo sarebbero secondo quest’altra definizione con il valore assoluto.9
7.10.2 Funzioni definite su intervalli illimitati Consideriamo ora il secondo caso, quello di una funzione definita su un intervallo illimitato, ad esempio del tipo (a, +∞). Supporremo che f sia continua in [a, +∞), R e pertanto tutti gli integrali ac f (x) dx hanno senso per c > a.
Definizione 7.12. Se nelle ipotesi dette esiste il limite Z c
lim
c→+∞ a
f (x) dx
questo viene detto l’integrale improprio di f in (a, +∞).
Esempio: Z +∞ 0
dx = lim x2 + 1 c→+∞
Z c 0
dx π = lim arctan c = . x2 + 1 c→+∞ 2
Come nel caso dell’intervallo limitato, sussiste il seguente criterio del confronto per l’integrale improprio su intervalli illimitati. Teorema 7.15. Sia ϕ una funzione continua in [a, +∞), a valori positivi per cui esista l’integrale improprio in (a, +∞), e sia f una funzione continua in [a, b) tale che | f (x)| ≤ ϕ(x) per ogni x ∈ [a, +∞). Allora esiste l’integrale improprio fra a e +∞ di f . Costruiamo anche nel nostro caso una scala di funzioni che ci permetta, per mezzo del criterio del confronto, di decidere se un integrale improprio esiste. Consideriamo ( Z c 1 1−α + 1 , α 6= 1 dx 1−α c α−1 = α log c, α = 1. 1 x 9 Il classico esempio e ` f (x) = sin x/x in (0, +∞). Si verifica che f e` integrabile in senso improprio, ma | f | non lo e` . I dettagli della dimostrazione non sono comunque semplici.
7.11 Relazione fra serie ed integrazione
183
Se e` α > 1, il limite per c → +∞ e` 1/(α − 1), mentre, per α ≤ 1, e` +∞. Osservazione 7.17. L’applicazione del criterio di confronto per la convergenza degli integrali impropri richiede la costruzione di una funzione ϕ di confronto, e non esistono ricette universali per questo.
7.11 Relazione fra serie ed integrazione Consideriamo una funzione f : [0, +∞) → R monotona decrescente e positiva. Per ogni n ∈ N, definiamo an = f (n). Ci chiediamo se sussista qualche relazione fra la convergenza dellaRserie numerica a termini positivi ∑n an e la convergenza dell’integrale improprio 1∞ f (x) dx. Teorema 7.16. La serie ∑n an converge se, e solo se, l’integrale improprio esiste finito.
R∞ 1
f (x) dx
Dimostrazione. Infatti, se n ≤ x < n + 1, allora an+1 ≤ f (x) ≤ an per la monotonia di f . Quindi Z n+1 n
an+1 dx ≤
cio`e an+1 ≤ Se In =
Rn 1
Z n+1
f (x) dx ≤
Z n+1
n
Z n+1 n
n
an dx,
f (x) dx ≤ an .
f (x) dx, allora abbiamo a1 ≥ I1 ≥ a2 a2 ≥ I3 − I2 ≥ a3 ... an−1 ≥ In − In−1 ≥ an .
Sommando termine a termine queste disuguaglianze, troviamo sn − an ≥ In ≥ sn − a1 , avendo posto come al solito sn = a1 + . . . + an . Pertanto a1 ≥ sn − In ≥ an > 0. Di pi`u, sn+1 − In+1 − (sn − In ) = an+1 −
Z n+1
f (x) dx ≤ 0.
n
Deduciamo che la successione {sn − In }n e` decrescente, e quindi possiede limite finito, dal momento che i suoi termini sono compresi fra 0 e a1 . Quindi a1 ≥ lim sn − In ≥ 0, n→+∞
e questo dimostra la tesi.
184
7 Integrale di Riemann
Proponiamo ora un criterio di convergenza piuttosto insolito, che illustra bene l’uso del criterio di convergenza integrale. Riportiamo la dimostrazione classica contenuta in [8]. Si veda anche [27]. Proposizione 7.6 (Ermakoff). Sia f : [0, +∞) → R e` decrescente e positiva. La serie ∑n f (n) e` x
x
(e ) < 1, 1. convergente se lim supx→+∞ e ff(x) x
x
(e ) 2. divergente se lim infx→+∞ e ff(x) > 1. x
x
(e ) e 1. Dimostrazione. Nel caso 1, sia ρ un numero compreso fra lim supx→+∞ e ff(x)
Esiste allora ξ tale che ex f (ex ) ≤ ρ f (x) quando x > ξ . Pertanto ξX ex f (ex ) dx < R ρ ξX f (x) dx se X > ξ . Il cambiamento di variabile da x a ex a primo membro riduce questa disuguaglianza a R
Z eX
f (x) dx ≤ ρ
Z X
f (x) dx.
eξ
ξ
Quindi (1 − ρ)
Z eX
f (x) dx ≤ ρ
Z X
f (x) dx −
!
Z eX
f (x) dx ,
eξ
ξ
eξ
Z eX
Z eξ
Z eX
relazione equivalente a (1 − ρ)
f (x) dx ≤ ρ
eξ
f (x) dx −
! f (x) dx .
X
ξ
Poich´e eX > X, (1 − ρ)
Z eX
f (x) dx ≤ ρ
eξ
Z eξ
f (x) dx. ξ
Siccome ξ e` fisso e XR > ξ e` arbitrario, questa stima implica la convergenza dell’integrale improprio 1∞ f (x) dx. Quindi anche la serie ∑n f (n) e` convergente. Nel caso 2, esiste ξ > 0 tale che ex f (ex ) ≥ f (x) se x > ξ . Come prima, questo implica che Z ex
f (x) dx ≥
eξ
Z X
f (x) dx ξ
per ogni X > ξ . Quindi Z eX X
f (x) dx ≥
Z eξ
f (x) dx. ξ
Questa relazione ci dice che l’integrale improprio 1∞ f (x) dx e` divergente: infatti, per quanto X possa essere grande, esiste sempre un numero X 0 = eX tale che R
7.12 Una definizione integrale delle funzioni goniometriche elementari
185
R X0
a K > 0. Pertanto anche la serie X f (x) dx risulti maggiore di una certa quantit` ∑n f (n) e` divergente.
7.12 Una definizione integrale delle funzioni goniometriche elementari La maggior parte di noi ricorda bene la definizione delle funzioni seno e coseno. Ad esempio, il seno di un angolo α si definisce geometricamente cos`ı: costruito un triangolo rettangolo in cui uno dei due angoli non retti misura α radianti, il seno di α e` il quoziente fra la misura del cateto opposto ad α e la misura dell’ipotenusa. Similmente il coseno di α e` il rapporto fra la misura del cateto adiacente e la misura dell’ipotenusa. Da qui, con opportune considerazioni di geometria sintetica, si deducono tutte quelle formule che tanto ci hanno fatto penare nei corsi di trigonometria. Ora che conosciamo il calcolo differenziale ed integrale, vogliamo proporre una definizione puramente analitica (senza alcun riferimento a triangoli e a disegni di sorta) delle solite funzioni goniometriche (anche dette circolari). L’idea cruciale consiste nell’osservare che la formula di derivazione 1 d arctan x = 2 dx x +1 lega ua funzione trascendente come l’arcotangente ad una funzione razionale fratta. Poich´e le funzioni razionali fratte sono calcolabili con le sole quattro operazioni algebriche sui numeri reali, viene spontaneo partire da qui per costruire le funzioni circolari.10
Definizione 7.13. Il numero π e` definito come π =2
Z 1p
1 − x2 dx,
(7.11)
0
che rappresenta l’area del cerchio unitario. La funzione arcotangente e` definita dalla formula Z x dt arctan x = , per ogni x ∈ R. (7.12) 2 0 1+t
Proposizione 7.7. La funzione arcotangente gode delle seguenti propriet`a: (a) (b) 10
arctan e` una funzione dispari. arctan e` strettamente crescente, e dunque invertibile (sul suo codominio).
√ Si potrebbe partire anche dalla relazione D arcsin x = 1/ 1 − x2 .
186
(c)
7 Integrale di Riemann
limx→+∞ arctan x = π/2.
Dimostrazione. La disparit`a dell’arcotangente si dimostra con un cambiamento di variabili: Z −x
dt =− arctan(−x) = 1 + t2 0 = − arctan x.
Z 0
dt =− 1 + t2 −x
Z x 0
dt 1 + t2
Questo dimostra (a). Per il teorema fondamentale del calcolo integrale, d 1 arctan x = 2 > 0, dx x +1 e quindi l’arcotangente e` una funzione strettamente crescente in tutto R. Anche (b) risulta provato. Il punto (c) richiede qualche calcolo. Nella definizione dell’arcotangente, effettuiamo il cambiamento di variabile s , t=√ 1 − s2
s ∈ [0, 1).
Si ha dt = (1 − s2 )−3/2 ds e dunque, per x > 0, dt = 1 + t2
Z √x
1 − s2 + s2 √ ds = 1 − s2
Z p
Z x
arctan x = 0
1+x2
0
ds √ . 1 − s2
D’altra parte, Z
1 √ ds = 1 − s2
e Z
Z
p s2 √ ds = −s 1 − s2 + 1 − s2
1 − s2 ds +
Z p
Z
s2 √ ds 1 − s2
1 − s2 ds.
Concludiamo che Z
Z p p 1 √ ds = −s 1 − s2 + 2 1 − s2 ds. 1 − s2
Tornando all’arcotangente, per x > 0, si ha Z √x
1+x2
arctan x = 2
p
1 − s2 ds −
0
da cui lim arctan x = 2
x→+∞
Anche (c) e` dimostrato. t u
Z 1p 0
x , 1 + x2
1 − s2 ds =
π . 2
7.12 Una definizione integrale delle funzioni goniometriche elementari
187
Definizione 7.14. La funzione tangente e` definita su (−π/2, π/2) come la funzione inversa dell’arcotangente, ed estesa per periodicit`a a tutto R\{π/2+ kπ | k ∈ Z}.
Quindi la tangente e` periodica di periodo π, e dal teorema di derivazione della funzione inversa segue facilmente che d tan x = 1 + (tan x)2 . dx Essendo 1/(t 2 + 1) < 1 per ogni t 6= 0, si trova che arctan x ≤ x
per ogni x ≥ 0,
o equivalentemente tan x ≥ x
h π . per ogni x ∈ 0, 2
Definizione 7.15. Le funzioni seno e coseno sono definite dalla relazioni ( 0 se x = (2k + 1)π, k ∈ Z sin x = (7.13) 2 tan(x/2) altrimenti, 1+(tan(x/2))2 cos x =
( −1
se x = (2k + 1)π, k ∈ Z
1−(tan(x/2))2 1+(tan(x/2))2
altrimenti.
(7.14)
E` facile verificare, con le solite regole di calcolo differenziale, che d sin x = cos x, dx
d cos x = − sin x, dx
(sin x)2 + (cos x)2 = 1.
Tutte le altre formule della goniometria (formule di addizione, di prostaferesi, di Wallis, ecc.) possono essere dedotte da queste definizioni. In compenso, per definzione abbiamo gi`a stabilito la validit`a delle cosiddette formule razionali in t = tan(x/2). Il lettore pi`u coraggioso pu`o anche definire seno e coseno rispettivamente come le uniche soluzioni dei due problemi di Cauchy ( y00 + y = 0 y(0) = 0, y0 (0) = 1
188
e
7 Integrale di Riemann
( y00 + y = 0 y(0) = 1, y0 (0) = 0.
Osservazione 7.18. Buona parte di questo paragrafo segue da vicino la trattazione di [15]. Altre definizioni delle funzioni circolari sono altrettanto popolari in letteratura. Ad esempio, i testi leggermente pi`u avanzati propongono spesso la definizione di seno e coseno come serie di potenze. E` tuttavia indiscutibile che la conoscenza della teoria delle serie di funzioni non e` affatto indispensabile per poter introdurre rigorosamente queste funzioni elementari, come abbiamo visto.
Capitolo 8
Introduzione alle equazioni differenziali ordinarie
Risolvere un’equazione significa trovare i valori di una o pi`u incognite che rendono vera una certa uguaglianza. Lo studente sa risolvere le equazioni ax = b, ax2 + bx + c = 0, 2x = 4, e altre ancora. In questi esempi, l’incognita x e` un numero.1 E` possibile scrivere equazioni in cui l’incognita sia una funzione e non gi`a un singolo numero? Un attimo di riflessione ci lascia intendere che il senso dell’uguaglianza da verificare vada inteso come un’uguaglianza punto per punto. Per esempio, cercare una funzione f tale che f2 −1 = 0 pu`o essere interpretato come cercare una funzione f tale che f (x)2 − 1 = 0 per ogni x appartenente al dominio di f . Queste solo le cosiddette equazioni funzionali, e sono un argomento davvero complesso. In questo capitolo tratteremo un diverso tipo di equazioni, quelle in cui l’incognita e` una funzione ma l’uguaglianza da verificare coinvolge le derivate dell’incognita. Sar`a comodo indicare le derivate con apici: y0 invece di Dy, y00 invece di D2 y, y(n) invece di Dn y.
Definizione 8.1. Un’equazione nell’incognita y : (a, b) → R del tipo F(x, y(x), y0 (x), y00 (x), . . . , y(n) (x)) = 0,
x ∈ (a, b)
(8.1)
si chiama equazione differenziale ordinaria di ordine n. L’ordine n sta ad indicare l’ordine di derivazione pi`u alto della funzione incognita y che effettivamente compare.
1
Che intenderemo sempre reale. In matematica si studiano equazioni le cui inconite devono appartenere ad insiemi specificati, ad esempio Z o Q.
189
190
8 Equazioni differenziali ordinarie
Definizione 8.2. L’equazione (8.1) si dice lineare se e` della forma an (x)y(n) (x) + an−1 y(n−1) (x) + · · · + a0 (x)y(x) = f (x)
(8.2)
e lineare omogenea se f = 0.
Ora che sappiamo che cosa sia un’equazione differenziale2 vogliamo anche dire che cosa sia una sua soluzione.
Definizione 8.3. Una soluzione di (8.1) e` una funzione y : (a, b) → R, derivabile n volte in (a, b) e verificante (8.1) per ogni x ∈ (a, b). L’insieme di tutte le soluzioni di (8.1) in (a, b) si chiama integrale generale di (8.1) in (a, b).
E` importantissimo sottolineare che l’insieme di definizione della soluzione non e` un dato del problema, bens`ı parte dell’incognita. In particolare, non e` possibile pretendere che le soluzioni di una data equazione differenziale risultino definite su un insieme da noi specificato. In termini equivalenti, aggiungere il dominio della soluzione ai dati dell’equazione pu`o portare a un problema privo di soluzioni. Un’equazione differenziale ordinaria che sappiamo gi`a risolvere e` y0 = f (x), dove f e` una funzione continua assegnata. Il teorema fondamentale del calcolo ci dice che, trovata una primitiva F di f in un intervallo (a, b), la soluzione generale e` y(x) = F(x) +C, al variare di C ∈ R. Nei paragrafi seguenti proponiamo i metodi risolutivi per qualche altro tipo di equazioni differenziali del primo ordine. Non diremo quasi niente della teoria che sta alla base. Lo studente tenga bene a mente che non esistono metodi per risolvere una generica equazioni differenziale ordinaria mediante formule elementari.
8.1 Equazioni differenziali lineari del primo ordine In questa sezione, troviamo tutte le soluzioni di una equazione differenziale del primo ordine scritta nella forma y0 + a(x)y = f (x) 2
Sottintenderemo spesso l’aggettivo ordinaria.
(8.3)
8.1 Equazioni differenziali lineari del primo ordine
191
Quando si studiano le equazioni differenziali lineari, conviene sempre applicare il principio di sovrapposizione. Esso consiste nelle seguenti due osservazioni: 1. se y1 e y2 sono soluzioni della stessa equazioni differenziale lineare omogenea, allora c1 y1 + c2 y2 , al variare di c1 , c2 ∈ R, e` ancora una soluzione; 2. se y1 e y2 sono soluzioni della stessa equazioni differenziale lineare con termine noto f , allora y1 − y2 e` una soluzione della stessa equazione differenziale lineare con f = 0. Il senso pratico di questo principio e` che per trovare l’integrale generale di un’equazione differenziale lineare non omogenea, basta trovare l’integrale generale ella corrispondente equazione omogenea e sommargli una soluzione particolare dell’equazione non omogenea. Il vantaggio e` che la soluzione particolare pu`o essere individuata con ogni mezzo, anche casualmente.3 Per la nostra equazione (8.3), cominciamo a trovare l’integrale generale della corrispondente equazione omogenea y0 + a(x)y = 0.
(8.4)
Nel seguito, supporremo sempre che a sia una funzione continua. Dividendo per y, si ottiene formalmente 0=
d y0 + a(x) = log y(x) + a(x), y dx
cio`e log y(x) = −A(x) dove A e` una primitiva di
a.4
Il suggerimento che ne ricaviamo e` che la funzione Zx y0 (x) = exp − a(s) ds (8.5) α
dove α e` un numero arbitrariamente fissato, sia una soluzione di (8.4). Lo studente verifichi per (semplice) esercizio che y0 e` davvero una soluzione. L’integrale generale di (8.4) e` y(x) = cy0 (x), c ∈ R. Infatti,
y0 y0 − y00 y −ayy0 + ay0 y d y(x) = = = 0, dx y0 (x) y20 y20
e dunque y/y0 e` costante. Per trattare il caso non omogeneo, proponiamo un metodo alquanto potente e generale: quello della variazione delle costanti. Al di l`a della denominazione parados3
Questa e` soltanto una frase ad effetto. Nessuno individua le soluzioni particolari casualmente, ma sempre seguendo qualche tecnica ragionevole. 4 Ricordiamo che, per definizione di primitiva, A0 (x) = a(x).
192
8 Equazioni differenziali ordinarie
sale, e` un metodo che funziona sempre, anche se pu`o portare a calcoli problematici. Lo schema e` il seguente. Si risolve l’equazione omogenea e si determina y0 come sopra. A questo punto, cerchiamo una soluzione particolare della forma y f (x) = λ (x)y0 (x) Capiamo la ragione del nome: facciamo finta che la costante reale c che descrive l’integrale generale di (8.4) sia una funzione (derivabile), e cerchiamo di sceglierla cos`ı da avere una effettiva soluzione dell’equazione non omogenea. Inserendo y f nell’equazione (8.3), ci accorgiamo che y f e` una soluzione se e solo se λ 0 (x)y0 (x) + λ (x) y00 (x) + a(x)y0 (x) = f (x); basta quindi scegliere λ in modo che λ 0 (x) =
f (x) . y0 (x)
Questa e` un’equazione differenziale del tutto banale, dato che si risolve semplicemente scegliendo una primitiva della funzione a secondo membro. In conclusione, l’integrale generale dell’equazione (8.3) e` Z y(x) = y0 (x) c +
x
α
dove
f (s) ds , y0 (s)
(8.6)
Zx y0 (x) = exp − a(s) ds . α
Inoltre, ciascuna di queste soluzioni e` univocamente determinata dal valore assunto in α, c = y(α). Osservazione 8.1. Esiste un approccio pi`u diretto al casoR non omogeneo. Partiamo dall’equazione y0 + a(x)y = f (x) e poniamo v(x) = exp( a(x) dx)y(x). La derivata di v si calcola facilmente: R
v0 (x) = e
R
a(x) dx 0
y (x) + a(x)e R a(x) dx 0 =e y + a(x)y .
a(x) dx
y(x)
Quindi y risolve la nostra equazione differenziale non omogenea se, e solo se, v risolve l’equazione differenziale R
v0 = e
a(x) dx
f (x).
8.2 Equazioni del primo ordine a variabili separabili
R
R
Ma allora v(x) = e y:
a(x) dx f (x) dx + C,
y(x) = e
R
− a(x) dx
Z
R
e
193
e possiamo ricavare la soluzione generale5
a(x) dx
f (x) dx +C .
Qualche volta, la forma specifica di f a secondo membro pu`o suggerire una soluzione particolare. Per esempio, una soluzione di y0 + y = ex pu`o essere suggerita dal fatto ben noto che, per ogni λ , µ ∈ R, d (λ eµx ) = λ µeµx . dx Si verifica agevolmente che λ = 1/2 e µ = 1 fornisce la soluzione y f (x) = (1/2)ex . Considerazioni analoghe valgono per funzioni a secondo membro di tipo polinomiale e goniometrico.
8.2 Equazioni del primo ordine a variabili separabili Discutiamo ora alcuni esempi di equazioni differenziali del primo ordine non lineari y0 = f (x, y),
(8.7)
dove f e` una funzione di due variabili assegnata. Una soluzione di (8.7) e` una funzione y derivabile con continuit`a in un intervallo (a, b) e tale che y0 (x) = f (x, y(x)) per ogni x ∈ (a, b). Discuteremo inoltre la risolubilit`a del problema di Cauchy, ovvero del problema di trovare una soluzione di (8.7) soddisfacente la condizione y(x0 ) = y0 , (x0 , y0 ) essendo un punto del piano cartesiano (appartenente al dominio di f ). In altre parole, discuteremo la risolubilit`a del sistema 0 y (x) = f (x, y(x)) (8.8) y(x0 ) = y0 . Geometricamente il problema consiste, dopo aver assegnato in ogni punto del piano (x, y) un numero f (x, y), nel trovare una funzione y il cui grafico passa per (x0 , y0 ) in 5
Qualche studente potrebbe criticare l’uso un po’ leggero del simbolo di integrazione indefinita: in particolare, a che serve la costante C se l’integrale indefinito continene gi`a tutte le infinite primitive? La critica e` formalmente corretta, e possiamo dire che nella formula seguente gli integrali denotano una primitiva scelta liberamente fra le infinite a disposizione.
194
8 Equazioni differenziali ordinarie
ogni punto (x, y(x)) ha una pendenza assegnata f (x, y(x)). Purtroppo non possiamo dire quasi nulla di astratto: la comparsa di una funzione di due variabili porta tutta la discussione ad un livello di matematica pi`u avanzato rispetto al nostro. Questa consapevolezza dei nostri limiti non ci impedir`a tuttavia di imparare a risolvere alcuni tipi di equazioni differenziali di tipo speciale. I due esempi che seguono mostrano alcuni comportamenti inattesi, almeno a un primo sguardo. Non unicit`a. Per ogni a < 0 < b, le funzioni 1 2 − 4 (x − a) , x < a y(x) = 0, a≤x≤b 1 2 x>b 4 (x − b) , sono tutte funzioni derivabili con continuit`a in R. 6 Inoltre ognuna di esse risolve il problema di Cauchy p 0 y (x) = |y(x)| y(0) = 0. In contrasto con quel che capita con le equazioni lineari del primo ordine dove la soluzione dell’equzione e` univocamente determinata dal valore della stessa in un dato punto, questa equazione non lineare presenta infinite soluzioni diverse. Esplosione in tempo finito. La funzione y(x) = 1/(1 − x), definita per ogni x ∈ (−∞, 1), e` soluzione del problema 0 y (x) = y(x)2 y(0) = 1. In questo caso, pur essendo l’equazione definita per ogni possibile coppia (x, y) del piano cartesiano, la soluzione y e` definita solo su un intervallo limitato superiormente. Di pi`u, l’ampiezza dell’intervallo dipende dal valore iniziale. Ad esempio per λ > 0 la funzione yλ (x) = λ /(1 − λ x), x ∈ (−∞, 1/λ ), e` la soluzione del problema di Cauchy 0 y (x) = y(x)2 y(0) = λ . Osserviamo che. per x → 1/λ , yλ (x) → +∞. Per questa ragione, parliamo di esplosione della soluzione al “tempo” x = 1/λ . Per ragioni di tempo ed opportunit`a, ci limiteremo a considerare solo il caso delle equazioni a variabili separabili, cio`e equazioni differenziali del tipo y0 (x) = f (x)g(y(x)), 6
Lo studente verifichi attentamente questa affermazione.
8.2 Equazioni del primo ordine a variabili separabili
195
dove f : (a, b) → R e g : (c, d) → R sono funzioni di una sola variabile. Il seguente teorema ci tranquillizza rispetto all’esistenza e all’unicit`a della soluzione.
Teorema 8.1. Siano f : (a, b) → R e g : (c, d) → R due funzioni derivabili con continuit`a, dove i due intervalli di definizione possono essere eventualmente illimitati. Per ogni x0 ∈ (a, b), y0 ∈ (c, d) il problema di Cauchy 0 y (x) = f (x)g(y(x)) y(x0 ) = y0 possiede una ed una sola soluzione y : (α, β ) → R.
Dimostrazione. Seguiamo da vicino [11, Proposition 5.1, pag. 69]. Se g(y0 ) = 0, allora la funzione y(x) = y0 e` una soluzione del problema di Cauchy.R Supponiamo allora g(y0 ) 6= 0, e definiamo la funzione F : (a, b) → R come F(x) = xx0 f (t) dt. Sia poi U il pi`u grande intervallo contenuto in (c, d) tale che y0 ∈ U e g(ξ ) 6= 0 per ogni ξ ∈ U. Poich´e g e` una funzione continua, U e` un intervallo aperto. Per ogni y ∈ U, poniamo Z y dξ . G(y) = g(ξ ) y0 Allora G e` derivabile con continuit`a, G(y0 ) = 0 e G0 = 1/g. Poich´e g(y0 ) 6= 0, G0 ha segno costante in un intorno di y0 , e dunque esiste un intervallo aperto V tale che G(y0 ) = 0 ∈ V e H e` un’applicazione biunivoca fra U e V . Ne consegue che W = F −1 (V ) e` un intervallo aperto che contiene x0 . Denotiamo con (α, β ) il pi`u grande intervallo contenuto in W tale che x0 ∈ (α, β ). Possiamo integrare l’equazione y0 (x) = f (x)g(y(x)) ottenendo G(y(x)) = F(x), e per ogni x ∈ (α, β ) questo equivale a y(x) = G−1 (F(x)). Di conseguenza y : (α, β → R e` una funzione derivabile, e y(x0 ) = G−1 (F(x0 )) = x0 . Derivando rispetto ad x la relazione G(y(x)) = F(x), e ricordando che G0 = 1/g, otteniamo che y0 (x) = f (x)g(y(x)) per ogni x ∈ J. Quindi y = H −1 ◦ F : (α, β ) → R e` una soluzione del nostro problema di Cauchy. Supponiamo che y˜ sia un’altra soluzione, defini˜ β˜ ), tale che g(y(x)) ˜ β˜ ). Allora ta in qualche intervallo (α, ˜ 6= 0 per ogni x ∈ (α, −1 G(y(x)) ˜ = F(x) per ogni x siffatto, e quindi y(x) ˜ = H (F(x)) = y(x) per ogni ˜ β˜ ). Dalla definizione di (α, β ) deduciamo che (α, ˜ β˜ ) ⊂ (α, β ). x ∈ (α, β ) ∩ (α, Abbiamo cos`ı dimostrato che due soluzioni devono coincidere nell’intersezione dei loro domini di definizione, e la dimostrazione e` completa. Osserviamo che la dimostrazione contiene in pratica anche la tecnica per scrivere esplicitamente7 la soluzione di un’equazione a variabili separabili. Mostriamo 7
Avverbio da intendere in un senso piuttosto lato.
196
8 Equazioni differenziali ordinarie
questa procedura in un esempio tratto dalla biologia. Esempio 8.1. A volte in un processo di crescita intervengono fattori esterni. E` il caso di una popolazione (ad esempio di batteri) la cui crescita dipende dalla produzione di cibo. Se si mantiene costante il cibo disponibile, sufficiente diciamo per L elementi della popolazione, ci si pu`o aspettare che la rapidit`a di crescita tenda a zero quando il numero di individui y tende a L. Un modello semplice e` l’equazione differenziale y , y0 = ky 1 − L detta equazione logistica. Il parametro k e` una costante del problema, e cerchiamo le soluzioni del problema di Cauchy 0 y = ky 1 − Ly y(0) = λ . Il Teorema 8.1 d`a in particolare l/unicit`a della soluzione. Vediamo di “indovinare” una soluzione del nostro problema. Se λ = L, allora la soluzione costante y(x) = L per ogni x ∈ R e` soluzione. Se λ 6= L, riscriviamo formalmente l’equazione come dy = k dx y 1 − Ly che suggerisce per integrazione dei due membri y = kx +C, C ∈ R. log y−L Ricavando y, y(x) =
cL , c + e−kx
c ∈ R.
Imponendo che y(0) = L, ricaviamo la condizione cL =λ c−1 che identifica esattamente l’unica soluzione nel caso λ 6= L. Notiamo che non avremmo potuto ricavare la soluzione costante in questo modo. Cerchiamo adesso di adattare la tecnica dell’esempio all’equazione a variabili separabili generale. Notiamo che se g(y) ¯ = 0, la funzione y(x) = y¯ per ogni x e` una soluzione. Quindi, se y e` una soluzione allora o y e` costante oppure y(x) non annulla mai la g. In quest’ultimo caso, g(y(x)) 6= 0 per ogni x, e dividendo l’equazione per g(y(x)) si ottiene
8.2 Equazioni del primo ordine a variabili separabili
197
y0 (x) = f (x). g(y(x)) Se integriamo fra x0 e x, con la formula di integrazione per sostituzione arriviamo a Z y(x) 1 y0
g(y)
dy =
Z x 0 y (t) x0
g(y(t))
Z x
dt =
f (s) ds. x0
Chiamando F una primitiva di f e G una primitiva di 1/g, abbiamo ricavato la soluzione in forma implicita: G(y(x)) − G(y0 ) = F(x) − F(x0 ). Ora, e` possibile dimostrare che G e` strettamente monotona, dunque invertibile. Possiamo ricavare y(x) dalla relazione sopra: y(x) = G−1 (F(x) − F(x0 ) + G(y0 )) . In teoria, abbiamo trovato l’unica soluzione esplicitamente. In pratica, occorre una dose di sano realismo: il calcolo delle primitive F e G, e soprattutto il calcolo della fuzione inversa di G, sono spesso di difficolt`a insormontabile. Con questo non vogliamo incoraggiare lo studente a catalogare come impossibile la risoluzione delle equazioni differenziali: gli esercizi dei temi d’esame sono costruiti in modo che lo studente possa fare esplicitamente tutti i calcoli necessari ad arrivare alla formula della soluzione. Esempio: capitale ed interessi. Supponiamo di depositare in banca un certo capitale u0 ad un tasso di interesse p computato continuamente. Questo significa che in un intervallo di tempo infinitesimo dt il capitale aumenta di una somma du = pu(t) dt proporzionale alla durata dell’intervallo e al capitale stesso u(t). Dividendo8 per dt, otteniamo l’equazi one differenziale u0 (t) = pu(t). Essendo a variabili separabili, la soluzione si ottiene facilmente, ed e` espressa dalla formula u(t) = u0 e pt . Supponiamo ora di ritirare con regolarit`a una certa rendita (costante) b. In questo caso l’andamento del capitale risponder`a all’equazione u0 (t) = pu(t) − b. E` ancora a variabili separabili, e la sua soluzione si ricava risolvendo rispetto a u l’equazione 8
Questi ragionamenti sono formali, ed infatti i veri interessi vengono computati ad intervalli di tempo prefissati.
198
8 Equazioni differenziali ordinarie
1 log(pu − b) = t +C, p cio`e u(t) =
1 Ce pt + b . p
La costante C si ricava imponendo che u(0) = u0 , da cui u0 = pu0 − b. In conclusione u(t) =
C+b p ,
e dunque C =
1 (pu0 − b)e pt + b . p
Si danno tre casi. 1. b < pu0 . In questo caso il capitale aumenta con il tempo, anche se meno velocemente di quanto avveniva senza prelievo. In effetti, tutto avviene come se si fosse partiti da un capitale iniziale u0 − bp , remunerato all’interesse p, pi`u un capitale fisso b/p non remunerato. 2. b > pu0 . Se si preleva troppo, il capitale diminuisce, e si estingue in un tempo T che pu`o essere calcolato imponendo che u(T ) = 0. Esplicitamente, dobbiamo risolvere rispetto a T l’equazione (pu0 − b)e pT + b = 0. Ricavando T , troviamo T=
1 b log . p b − pu0
3. b = pu0 . In questo caso il capitale rimane costante, sempre uguale a u0 = b/p. Notiamo che il capitale u0 ed il prelievo b possono essere negativi: se b > pu0 stiamo parlando di un prestito che viene estinto con versamenti regolari. A volte pu`o essere interessante sapere quanto occorre versare per estinguere un prestito u0 in un certo numero T di anni. Si deve semplicemente porre u(T ) = 0 e ricavare b: b = pu0
e pT . e pT − 1
Se si vuole estinguere il prestito di 100 000 euro al 10% in 10 anni, si dovr`a pagare una rata di e b = 10000 ≈ 15800 e−1 euro all’anno, cio`e circa 1317 euro al mese.
8.3 La funzione esponenziale come soluzione di EDO
199
8.3 La funzione esponenziale come soluzione di EDO In questa sezione, mostriamo come si possa usare la teoria elementare delle equazioni differenziali ordinarie per dare una definizione rigorosa della funzione esponenziale. Consideriamo il problema di Cauchy ( y0 = y y(0) = 1.
(8.9)
Per il Teorema 8.1, questo problema possiede una ed una sola soluzione, che chiameremo U = U(x). Si dimostra che U e` globalmente definita, per ogni valore x ∈ R. La dimostrazione di questo fatto e` l’unico passaggio non del tutto elementare, e lo prendiamo per buono.
Definizione 8.4. La funzione esponenziale e` la funzione exp : R → R definita dalla formula exp x = U(x), U essendo l’unica soluzione di (8.9).
Raccogliamo nella seguente Proposizione le propriet`a caratterizzanti della funzione esponenziale. Proposizione 8.1. La funzione esponenziale gode delle seguenti propriet`a: exp e` una funzione derivabile infinite volte in ogni punto. exp e` ovunque strettamente positiva, monotona crescente in senso stretto, e dunque invertibile. (c) exp verifica la relazione: exp(x + h) = exp x · exp h per ogni x, h ∈ R. In particolare, exp(−x) = 1/ exp x. (d) Valgono le relazioni di limite limx→+∞ exp x = +∞, e limx→−∞ exp x = 0. (a) (b)
Dimostrazione. Iniziamo ad osservare che, dalla definizione stessa, exp e` una funzione derivabile. Derivando l’identit`a U 0 = U, troviamo che tutte le derivate successive di exp coincidono con exp stessa. Di conseguenza, exp possiede derivate di qualunque ordine, e sono tutte uguali ad exp. Questo dimostra il punto (a). Per dimostrare (b), cominciamo ad osservare che exp non pu`o mai annullarsi. Se infatti per assurdo exp x0 = 0, allora potremmo considerare il problema di Cauchy ( y0 = y y(x0 ) = 0 Questo problema di Cauchy avrebbe allora due soluzioni: la funzione exp e la funzione identicamente nulla. Sempre per il Teorema 8.1, la funzione esponenziale dovrebbe coincidere con la funzione nulla, e questo e` in apparente contraddizione con
200
8 Equazioni differenziali ordinarie
il fatto che exp 0 = 1 6= 0. Di conseguenza, la funzione esponenziale non pu`o cambiare segno: altrimenti, essendo una funzione continua, per il teorema degli zeri si deve annullare in qualche punto x0 , e abbiamo gi`a escluso questa eventualit`a. In conclusione, la funzione esponenziale non cambia mai segno, e poich´e in x = 0 e` positiva, tale rester`a in ogni altro punto. La monotonia stretta e` conseguenza della positivit`a: infatti, la derivata prima della funzione esponenziale coincide con la funzione stessa, e quindi e` sempre positiva. Sappiamo bene che ci`o implica che la monotonia stretta in direzione crescente. Infine, ogni funzione strettamente crescente e` necessariamente iniettiva, e dunque invertibile (sul proprio codominio). Anche il punto (b) e` completamente dimostrato. Veniamo al punto (c). Consideriamo la funzione y(x) = U(x + h). Allora y0 (x) = 0 U (x + h) = U(x + h) = y(x). Allora la funzione Y (x) =
y(x) U(h)
soddisfa Y 0 = Y e Y (0) = U(h)/U(h) = 1. Per l’unicit`a della soluzione del nostro problema di Cauchy, Y = U, cio`e U(x + h) = U(h)U(x) per ogni x e per ogni h. Se scegliamo h = −x, troviamo che exp(−x) = 1/ exp x. Il punto (d) si dimostra come segue: poich´e U 00 = U > 0, dal teorema di Taylor possiamo dedurre che esiste ξ tale che exp x = 1 + x +
ξ2 > 1 + x, 2
e quindi limx→+∞ exp x ≥ limx→+∞ 1 + x = +∞. L’altro limite deriva subito da questo, ricordando che exp(−x) = 1/ exp x, e dunque lim exp x = lim exp(−z) = lim
x→−∞
z→+∞
z→+∞
1 = 0. exp z
Questo completa la dimostrazione del punto (d) e del teorema. t u Osservazione 8.2. Osserviamo il ruolo fondamentale giocato dall’unicit`a della soluzione di (8.9). Se l’esistenza ci ha permesso di avere un candidato ad essere la funzione esponenziale, e` l’unicit`a che ci ha consentito di definirla in modo univoco, e di trovarne delle importanti propriet`a algebriche. Si noti infine che, con questa definizione, il calcolo del limite notevole ex − 1 =1 x→0 x lim
non e` pi`u misterioso: basta invocare il teorema di De l’Hospital! Non c’`e pi`u contraddizione logica, poich´e la funzione esponenziale e` ora derivabile per ipotesi. Con la definizione “ingenua” dell’esponenziale, al contrario, la derivata di exp va calcolata proprio con il limite notevole, e quindi cadiamo in un ragionamento circolare.
8.4 Equazioni lineari del secondo ordine
201
A partire da queste propriet`a della funzione esponenziale, e` facile dedurre le principali propriet`a della funzione logaritmica (in base e = exp 0). Didatticamente, segnaliamo che la maggior parte dei testi definiscono il logaritmo naturale come la funzione Z x dt , per ogni x > 0. log x = 1 t Da questa formula, con considerazioni essenzialmente elementari, si possono dedurre tutte le propriet`a fondamentali dei logaritmi. Apparentemente, e` pi`u elementare definire i logaritmi che gli esponenziali. Osservazione 8.3. Ma se tutto e` cos`ı chiaro e meraviglioso, perch´e affannarsi tanto con le definizioni “ingenue” delle funzioni elementari? La ragione e` che sarebbe devastante proporre un corso di calcolo differenziale senza poter scrivere esponenziali, logaritmi, seni, coseni, e tutte le altre funzioni elementari non algebriche. Ci`o che si pu`o fare in teoria non e` detto che sia conveniente in pratica. Inoltre, una volta che si e` data una definizione rigorosa dei numeri reali, e` immediato definire le potenze ad esponente reale, e in particolare l’esponenziale. Per le funzioni goniometriche, il discorso e` un po’ meno banale.
8.4 Equazioni lineari del secondo ordine a coefficienti costanti Come detto nell’introduzione al capitolo, le equazioni lineari possiedono caratteristiche particolari. In questo paragrafo vedremo come utilizzare la linearit`a dell’equazione per determinare le soluzioni. Per semplicit`a, ci limiteremo alle equazioni lineari del secondo ordine a coefficienti costanti: ay00 + by0 + cy = f ,
(8.10)
dove a, b e c sono numeri reali mentre f e` una funzione assegnata. Osservazione 8.4. Ogni equazione di ordine due pu`o essere ricondotta ad un sistema di equazioni di ordine uno. Consideriamo ad esempio la (8.10), e introduciamo l’incognita ausiliaria v = y0 . Allora la (8.10) equivale al sistema 0 av + bv + cy = f y0 = v. Da un punto di vista teorico, si tratta di un risultato di importanza fondamentale, poich´e permette di studiare solamente i sistemi di equazioni differenziali di primo ordine. Dal punto di vista pratico, spesso e` pi`u conveniente sfruttare tecniche particolari, e la riduzione ad un sistema non offre molto aiuto. Come per le equazioni lineari del primo ordine, consideriamo innanzitutto il caso omogeneo f = 0.
202
8 Equazioni differenziali ordinarie
L’equazione ay00 + by0 + cy = 0 suggerisce la ricerca di soluzioni y tali che y, e y00 siano multipli di una medesima funzione. Cerchiamo allora una soluzione y(x) = erx , per oppurtuni valori di r ∈ R. Sostituendo nell’equazione, troviamo in effetti erx ar2 + br + c = 0. y0
Questa identit`a pu`o essere soddisfatta soltanto se ar2 + br + c = 0
(8.11)
La teoria delle equazioni algebriche di secondo grado ci dice che le soluzioni reali di (8.11) sono due, una9 oppure nessuna a seconda che il discriminante ∆ = b2 − 4ac sia positi vo, nullo oppure negativo. Schematicamente, vediamo come trovare le soluzioni nei tre casi. (1) Due radici reali. L’equazione (8.11) possiede due radici reali distinte r1 e r2 , e dunque le due funzioni x 7→ er1 x , x 7→ er1 x sono soluzioni. Per il principio di sovrapposizione, l’integrale generale dell’equazione omogenea e` y(x) = c1 er1 x + c2 er2 x . (8.12) (2) Una radice reale. Se ∆ = 0, l’unica radice reale e` r=−
b . 2a
Dunque abbiamo trovato una soluzione b
x 7→ e− 2a x per l’equazione omogenea. Malauguratamente, questa non basta a descrivere l’integrale generale. Possiamo tuttavia provare a cercare una soluzione della forma b
x 7→ e− 2a x u(x). Sostituendo, otteniamo la condizione (r = −b/(2a)) b 0 = e− 2a x (ar2 + br + c)u + au00 + (2ar + b)u0 = au00 . Dunque u00 = 0, e integrando due volte u(x) = c1 + c2 x. L’integrale generale della nostra equazione omogenea e` pertanto 9 Gli insegnanti delle scuole superiori amano parlare di due radici coincidenti. Non e ` sbagliato, ed anzi in certi casi e` di grande aiuto usare tale espressione. Per i nostri scopi, sarebbe come dire che oggi indosso due paia di pantaloni coincidenti: logicamente ineccepibile ma francamente superfluo. Tutto si sitema introducendo la molteplicit`a delle radici di un polinomio, concetto comunque be al di l`a dei limiti del nostro corso.
8.4 Equazioni lineari del secondo ordine
203 b
y(x) = e− 2a x (c1 + c2 x) .
(8.13)
(3) Nessuna radice reale. Questo caso e` sempre il pi`u difficile da analizzare. Non avendo a disposizione l’algebra dei numeri complessi, e` piuttosto macchinoso costruire le soluzioni. Ci limitiamo pertanto a proporle “ex cathedra”. Definiamo √ 4ac − b2 b . α= , ω= 2a 2a L’integrale generale nel caso ∆ < 0 si scrive y(x) = Ae−αx cos(ωx + ϕ)
(8.14)
al variare delle costanti A ≥ 0 e ϕ ∈ [−π/2, π/2). In alternativa, le formule di addizione per la funzione coseno dicono che l’integrale generale pu`o essere scritto y(x) = e−αx (C1 sin(ωx) +C2 cos(ωx)) ,
(8.15)
al variare delle costanti reali C1 e C2 . Questa formula e` meno concisa della precedente, ma spesso preferibile per fare i calcoli. Il caso non omogeneo si discute usando il principio di sovrapposizione: si trova l’integrale generale dell’equazione omogenea e si somma ad una soluzione particolare dell’equazione non omogenea. Tutto sta nel calcolare quest’ultima. Vi sono essenzialmente tre modi, per le equazioni del secondo ordine a coefficienti costanti. 1. Procedere per tentativi. Ad esempio, se f e` un polinomio di grado n, si cerca una soluzione particolare che sia un polinomio di grado n + 2. Questa tecnica e` la pi`u semplice ma anche la pi`u rischiosa, dato che funziona solamente per classi molto ristrette di funzioni f . 2. Utilizzare il metodo della variazione delle costanti. Siano y1 e y2 due soluzioni dell’equazione omogenea. Si cerca una soluzione dell’equazione non omogenea del tipo y f (x) = c1 (x)y1 (x) + c2 (x)y2 (x), (8.16) dove c1 e c2 sono funzioni incognite. Oltre al fatto che y f risolva l’equazione, si impone la condizione ausiliaria10 c01 (x)y1 (x) + c02 (x)y2 (x) = 0. Per trovare le incognite c1 e c2 occorre perci`o risolvere il sistema 0 c1 (x)y1 (x) + c02 (x)y2 (x) = 0 (8.17) c01 (x)y01 (x) + c02 (x)y02 (x) = f (x). A dispetto delle apparenze, questo sistema non e` di difficile soluzione: basta ricavare algebricamente c01 e c02 , e integrare. 10
Se avessimo il tempo per la teoria generale delle equazioni differenziali lineari, potremmo far vedere che questa condizione e` tutt’altro che artificiosa. Si veda [13] per i dettagli.
204
8 Equazioni differenziali ordinarie
3. Utilizzare la formula di Duhamel.11 Se u e` la soluzione del problema di Cauchy 00 au + bu0 + c = 0 u(0) = 0 (8.18) 0 u (0) = 1, allora
Z x
y f (x) =
u(x − s) f (s) ds.
0
Si potrebbe dimostrare che questa espressione altro non e` che una conseguenza del metodo di variazione delle costanti. L’esperienza didattica insegna che questo metodo risolutivo non e` particolarmente gradito agli studenti. Esempio 8.2. Applichiamo tutti questi metodi all’equazione y00 − y = x2 .
(8.19)
La soluzione generale dell’equazione omogenea y00 = y = 0 e` y(x) = c1 ex + c2 e−x . Poich´e il secondo membro dell’equazione e` un polinomio di grado 2, cerchiamo un polinomio di grado 4 che sia una soluzione particolare. Il generico polinomio di quarto grado ha la forma a0 + a1 x + a2 x2 + a3 x3 + a4 x4 , e sar`a una soluzione di (8.19) se e solo se 12a4 x2 + 6a3 x − 2a2 − a0 − a1 x − a2 x2 − a3 x3 − a4 x4 = x2 per ogni x. Uguagliando i coefficienti delle stesse potenze di x, dobbiamo risolvere il sistema a4 = 0 a3 = 0 12a4 − a2 = 1 6a3 − a1 = 0 2a − a = 0. 2 0 Operando per sostituzione, troviamo molto facilmente l’unica soluzione a0 = −2, a1 = 0, a2 = −1, a3 = a4 = 0. Quindi una soluzione particolare e` la funzione polinomiale x 7→ −x2 − 2. Se usiamo invece il metodo della variazione delle costanti, dobbiamo risolvere il sistema ( ex c01 + e−x c02 = 0 ex c01 − e−x c02 = x2 , che ci porta immediatamente a
11
Questa formula e` spesso attribuita a Cauchy, che la utilizz`o in una forma equivalente ma diversa da quella che riportiamo. E` interessante osservare che la formula di Duhamel vale per tutte le equazioni differenziali lineari.
8.4 Equazioni lineari del secondo ordine
1 c01 = x2 e−x , 2
205
1 c02 = − x2 ex . 2
Integrando, c1 = (− 12 x2 − x − 1)e−x , c2 = (− 12 x2 + x − 1)ex , e quindi la soluzione particolare e` y f (x) = c1 ex + c2 e−x = −x2 − 2. Utilizzando infine la formula di Duhamel, si trova che Z x 1 x−2 1 s−x 2 y f (x) = e − e s ds 2 2 0 Z x Z x 1 1 s2 e−s ds − e−x s2 es ds. = ex 2 2 0 0 Lasciamo al lettore il calcolo di questi ultimi due integrali (suggerimento: integrare per parti due volte). Alla fine si giunge allo stesso risultato: y f (x) = −x2 − 2. In conclusione, la soluzione generale di (8.19) e` y(x) = c1 ex + c2 e−x − x2 − 2. Sembra evidente che, almeno per funzioni f di tipo molto particolare, conviene almeno tentare di indovinare una soluzione particolare y f con il primo metodo. Esempio 8.3. Vogliamo risolvere12 l’equazione y00 + 2y0 + y =
e−x . x
Osserviamo che il polinomio associato all’equazione e` λ 2 + 2λ + 1 = 0, che possiede la radice doppia λ = −1. Dunque la soluzione generale dell’equazione omogena sar`a y0 (x) = C1 e−x +C2 xe−x . Occorre determinare una soluzione particolare dell’equazione completa. Poich´e sembra improbabile indovinare ad occhio una soluzione, ricorriamo alla formula di Duhamel. La soluzione del problema 00 0 y + 2y + y = 0 y(0) = 0 0 y (0) = 1 e` la funzione y(x) ¯ = xe−x : basta imporre le condizioni y(0) = 0 e y0 (0) = 1 e determinare le giuste costanti C1 e C2 . Quindi la teoria ci dice che
12
Con questa espressione intenderemo sempre che vogliamo calcolare la soluzione generale.
206
8 Equazioni differenziali ordinarie
Z x
y f (x) =
Z1 x
y(x ¯ − s)
e−s ds = s
Z x
(x − s)e−(x−s)
1
e−s ds s
x x−s x − s −2−t+s = e ds = e−x ds s s 1 1 Z x x−s = e−x ds = e−x [x log |s| − s]s=x s=1 s 1 −x = e (x log x − x + 1) .
Z
Un’osservazione: abbiamo integrato fra 1 ed x invece che fra 0 ed x perch´e la funzione a secondo membro dell’equazione non e` definita in 0. Infine, la soluzione generale della nostra equazione e` y(x) = C1 e−x +C2 xe−x + x(log x − 1)e−x . Per inciso, si potrebbe far vedere che la formula di Duhamel e` solo un caso particolare del metodo della variazione delle costanti. La formula di Duhamel sembra il metodo pi`u invitante, sebbene sia in realt`a abbastanza insidiosa a causa degil integrali complicati a cui conduce. Quasi tutto quello che abbiamo esposto e` tratto da [15]. Numerosi esempi, modelli e tecniche risolutive per le equazioni differenziali ordinarie si trovano nei primi capitoli del libro [22]. Pur non presentando alcuna giustificazione teorica dei risultati, in questo agile libretto lo studente interessato pu`o facilmente impratichirsi con la risoluzione delle equazioni differenziali pi`u comuni. Si veda anche [12].
Capitolo 9
Metodi del calcolo approssimato
In quest’ultimo capitolo, affronteremo succintamente alcuni problemi dell’Analisi Numerica. Pur tenendoci a un livello di difficolt`a davvero basso, abbiamo l’ambizione di proporre alcuni metodi di calcolo approssimato. In particolare, proporremo il metodo di interpolazione di Lagrange per costruire un polinomio che unisca dei punti del piano cartesiano. Di seguito, vedremo tre modi per tovare approssimazioni numeriche degli integrali definiti. Trattandosi di argomenti complementari al corso, non ci soffermeremo su molti dettagli, n´e discuteremo la questione pi`u importante di tutta l’Analisi Numerica: quella della precisione dei metodi.
9.1 Interpolazione polinomiale Supponiamo che, durante un esperimento di laboratorio, le misurazioni ci forniscano delle coppie numeriche rappresentative di una quantit`a fisica o chimica in relazione a un’altra quantit`a variabile: (x1 , y1 ), (x2 , y2 ), . . . , (xn , yn ). La prima cosa che ci viene in mente di fare e` di segnare tali punti nel piano cartesiano, cenrcando di capire se esista una relazione fra i valori delle x e quelli delle y.1 Innanzitutto, la presenza di punti con uguale ascissa e diverse ordinate creerebbero problemi insormontabili, perch´e non ci sarebbe speranza di avere la y in funzione della x. Sbarazziamoci fin d’ora di tale caso, peraltro ridicolo da un punto di vi-
1
Chi scrive e` un matematico “puro”, e in queste situazioni e` convinto che dieci o cento punti nel piano non servano assolutamente a niente. Anche se fossero allineati lungo una retta orizzontale, la logica matematica non ci permetterebbe di trarre la conclusione che ogni scienziato “applicato” ne trarrebbe. Chi ci dice che, facendo anche solo una misurazione in pi`u, non troveremmo un punto completamente disallineato?
207
208
9 Metodi del calcolo approssimato
sta sperimentale. Infatti, se alla stessa x corrispondessero due valori sperimentali distinti della y, dovremmo concludere che non siamo capaci di fare l’esperimento. In seconda battuta, fin da bambini ci siamo divertiti a “unire i puntini” sulle riviste di enigmistica. Questo metodo funziona sempre, e produce una funzione continua il cui grafico e` la spezzata che congiunge i dati sperimentali. Quasi sicuramente, questa funzione non sar`a per`o derivabile nei punti di congiunzione. E soprattutto sarebbe presuntuoso ipotizzare che proprio quei pochi dati calcolati siano gli “spigoli” della vera funzione che lega le ordinate alle ascisse. Raramente i fenomeni macroscopici misurabili in laboratorio presentano comportamenti spigolosi. Ben consci di tutte queste difficolt`a, rivolgiamo allora lo sguardo verso una classe di funzioni che uniscono vari pregi: facilit`a di derivazione, di integrazione, di calcolo dei valori. Stiamo parlando dei polinomi. Ora, c’`e un evidente legame fra il numero di dati sperimentali e il grado del polinomio che vogliamo trovare. Se abbiamo due coppie di punti, possiamo unirli con una retta univocamente individuata2 , ma possiamo anche unirli con infiniti rami di parabole variamente disposte nel piano cartesiano. Per convincere di ci`o anche lo studente pi`u scettico, scegliamo i due punti (−1, 0) e (1, 0). La retta orizzontale y = 0 li congiunge, ma anche tutte le parabole y = a(x2 − 1) al variare di a ∈ R. Riassumendo, con due punti abbiamo un unico polinomio di grado 1 = 2 − 1, e infiniti polinomi di grado maggiore di 1. Per tre punti, la geometria analitica delle scuole superiori ci assicura che esiste una ed una sola parabola che li unisce, ma e` facile costruire infiniti polinomi di quarto grado che passano per tali punti. Ci sembra di vedere un legame fra il numero n + 1 di dati sperimentali e il grado n del polinomio univocamente determinato. Il seguente teorema non solo ci conforta in questa convinzione, ma ci fornisce una formula esplicita per scrivere tutti i coefficienti del polinomio di grado n voluto.
Teorema 9.1 (Polinomio interpolatore di Lagrange). Dati n + 1 punti distinti x0 , x1 , . . . , xn e n + 1 numeri reali y0 , y1 , . . . , yn non necessariamente distinti, esiste uno ed un solo polinomio P di grado (minore o uguale a) n tale che P(x j ) = y j per ogni j = 0, 1, 2, . . . , n. Questo polinomio e` dato da n
P(x) =
yk Ak (x) , k=0 Ak (xk )
∑
(9.1)
dove Ak (x) = ∏ (x − x j ). j6=k
Certo, il polinomio interpolatore ha un aspetto vagamente misterioso. Il simbolo di ∏ produttoria e` analogo a quello della sommatoria: serve a scrivere brevemente i 2
Il famoso assioma “per due punti passa una ed una sola retta”.
9.1 Interpolazione polinomiale
209
prodotti invece che le somme. Vediamo di spiegare brevemente perch´e il polinomio di Lagrange ha proprio questo aspetto. Partendo dal caso molto semplice di due punti x0 e x1 , consideriamo le due espressioni x − x0 e x − x1 . La prima si annulla per x = x0 , la seconda per x = x1 . Se poi le dividiamo opportunamente, troviamo le espressioni x − x1 x − x0 , . x1 − x0 x0 − x1 La prima vale 1 per x = x1 . mentre la seconda vale 1 per x = x0 . Pertanto l’espressione x − x0 x − x1 y0 + y1 x1 − x0 x0 − x1 vale y0 per x = x0 e y1 per x = x1 . Ovviamente, al variare di x ∈ R, questa espressione rappresenta un polinomio di primo grado. Confrontandolo con il Teorema precedente, abbiamo costruito esattamente il polinomio di Lagrange di primo grado. Non e` difficile convincersi che il generico polinomio di Lagrange di grado n si costruisce seguendo lo stesso principio: prima si trovano n polinomi A j , j = 0, 1, . . . , n, che hanno la propriet`a A j (xi ) = 0 per ogni i 6= j, e poi si divide per A j (x j ) in modo da ottenere un’espressione polinomiale che vale 1 per x = x j . Infine si moltiplica ognuna di queste espressioni per y j e si somma rispetto a j. Il risultato e` esattamente il polinomio interpolatore di Lagrange. Osservazione. Un approccio pi`u concreto e` il seguente. Vogliamo un polinomio di grado (al pi`u) n, e lo scriviamo nella forma n
P(x) =
∑ ak xk . k=0
Come troviamo i coefficienti incogniti a0 , a1 , ecc.? E` semplice: imponendo le condizioni P(x j ) = y j , j = 0, . . . , n. Ricaviamo un sistema di n+1 equazioni lineari nelle n+1 incognite a j , j = 0, . . . , n. Risolvendo questo banale3 sistema, ricaveremo il polinomio interpolatore. Salvo errori di calcolo, l’unicit`a di tale polinomio significa che ad esso possiamo arrivare in qualunque modo ci faccia comodo. Trovato il polinomio interpolatore, che ne facciamo? In primo luogo, lo possiamo usare proprio per interpolare, cio`e per “indovinare” i valori della funzione sperimentale nei punti compresi fra i nodi sperimentali usati per la costruzione del polinomio.4 Solo per fare un esempio di interesse storico e matematico, le celebri tavole dei logaritmi con cui nei secolo scorsi generazioni di ingegneri hanno fatto i 3
D’accordo, stiamo facendo dell’ironia fuori luogo. Si parla invece di estrapolazione quando si pretende di calcolare i valori esterni al pi`u piccolo e al pi`u grande nodo sperimentale. Questo e` un procedimento molto pericoloso. Se dati sperimentali
4
210
9 Metodi del calcolo approssimato
loro calcoli erano basate sull’interpolazione lineare. Pi`u correttamente, le tavole riportavano una grande quantit`a di “nodi” (i cui logaritmi erano calcolati con metodi che qui non possiamo approfondire). Se si voleva calcolare il logaritmo di un numero che non appariva sulle tavole, lo si localizzava fra i due nodi adiacenti, e si faceva l’interpolazione lineare fra di essi. Questo procedimento comportava un errore, tutto sommato trascurabile grazie alla densit`a dei nodi. Ci auguriamo vivamente che il nostro studente non si abbandoni a sorrisi di scherno verso i suoi “avi” scienziati. Se e` vero che i moderni calcolatori sanno operare con precisione molto alta, anch’essi forniscono risposte approssimate. Facendo qualche confronto fra i risultati del metodo delle tavole e quelli di una calcolatrice scientifica a dieci cifre decimali, ci si accorge che le tavole “sbagliano” mediamente dalla quinta cifra in poi. Un confronto decisamente lusinghiero, se si considera che le tavole erano preparate calcolando con carta e matita! Un altro uso possibile del polinomio interpolatore e` quello di usarlo per calcolare l’integrale della funzione sperimentale incognita. Infatti, questo integrale potrebbe avere un significato concreto, e sarebbe pressoch´e impossibile stimarne il valore in altro modo. Su questo problema ritorneremo nella prossima sezione. Pi`u delicato e addirittura sconsigliabile se non come ultimo tentativo e` l’uso del polinomio per calcolare la derivata della funzione sperimentale. La ragione di questo scetticismo dovrebbe essere chiaro. I grafici di due funzioni possono essere molto vicini nel piano cartesiano, ma avere pendenze molto diverse. Si pensi, intuitivamente, a una funzione costante e a una funzione che oscilla “furiosamente” fra due valori vicini alla costante. La prima ha pendenza identicamente nulla, la seconda ha pendenze molto brusche vicino alle oscillazioni. Poich´e il nostro polinomio interpolatore e` costruito solo ed esclusivamente per assumere gli stessi valori della funzione sperimentale nei nodi calcolati, e` difficile credere che serva ad approssimare accuratamente la derivata. Anche per gli esperti, la derivazione numerica e` un argomento tra i pi`u difficili, e naturalmente non ce ne occuperemo in questa sede. Osservazione 9.1. Esistono altri tipi di approssimazione polinomiale, anch’essi molto diffusi nei problemi delle scienze applicate. Un primo esempio e` quello di cercare un polinomio che passi per i nodi (x j , y j ) e che in tail punti abbia un assegnato valore della derivata prima. I polinomi che se ne ricavano5 prendono il nome di polinomi di Hermite. Pur senza soffermarci sulle loro propriet`a, e` evidente che a parit`a di nodi occorrono polinomi di grado pi`u alto che per la semplice int erpolazione di Lagrange. Pensiamo ai due punti: sappiamo che per essi passa esattamente un polinomio di grado uno, ma il valore della derivata nei due nodi e` fissato (e costante per i due punti). Volendo prescrivere anche i due valori della derivata nei due nodi, ci serev un polinomio di grado maggiore. Ne deduciamo che l’interpolazione di Hermite fornisce polinomi sensibilmente diversi da quelli di Lagrange.
molto fitti possono ragionevolmente indurre a un miglioramento dell’interpolazione, nulla ci rassicura sul fatto che il polinomio approssimi bene la funzione sperimentale a grande distanza dai valori calcolati in laboratorio. 5 Lo studente rifletta sul fatto che non e ` affatto banale che tali polinomi esistano.
9.2 Integrazione numerica
211
Un altro esempio e` quello della ricerca della retta che “meglio approssima” un insieme di punti del piano cartesiano. Abbiamo virgolettato la richiesta di approssimazione perch´e non vogliamo entrare nei dettagli di questo metodo. E` per`o evidente che non si pu o` parlare di interpolazione: se prendiamo tre punti non allineati nel piano cartesiano, non ci sar`a nessuna retta di interpolazione. Ha invece senso chiedersi quale sia (se esiste) la retta che passa pi`u vicino a tutti i punti segnati. Fra i metodi pi`u popolari per trattare questo problema e` quello dei minimi quadrati. Facciamo un esempio numerico: prendiamo i tre punti di coordinate (−1, 0), (0, 0) e (1, 0), osservano che appartengono alla parabola di equazione y = x2 . Si calcola abbastanza velocemente che la retta che passa pi`u vicino a questi punti ha equazione y = 1/2. Siamo ben lontani dal concetto di interpolazione.
9.2 Integrazione numerica Ci poniamo il problema di calcolare, con un’approssimazione prefissata, un integrale definito Z b
f (x) dx, a
dove f e` una funzione continua. Non e` sempre possibile conoscere esplicitamente una primitiva di f o, comunque, esprimere il valore dell’integrale mediante una formula in cui compaiono solo funzioni elementari; anzi si pu`o dire che queste situazioni favorevoli devono ritenersi eccezionali. Presenteremo tre metodi, tutti ispirati pi`u o meno direttamente alla definizione stessa di integrale di Riemann. 8.2.1 Il metodo dei rettangoli Fissato un intero n > 0, si ponga xk = a +
b−a k n
(k = 0, 1, . . . , n)
e si assuma come valore approssimato dell’integrale Sn =
b−a ( f (x0 ) + f (x1 ) + · · · + f (xn−1 )) . n
Il seguente risultato esprime la precisione con cui Sn approssima il vero valore dell’integrale. Teorema 9.2. Ammettendo che, per qualche costante M1 > 0 si abbia | f 0 (x)| ≤ M1 in [a, b] risulta Z b M1 (b − a)2 Sn − ≤ f (x) dx . 2 n a Quindi vediamo che limn→+∞ Sn = come 1/n.
Rb a
f (x) dx, e l’errore commesso tende a zero
212
9 Metodi del calcolo approssimato
8.2.2 Il metodo delle tangenti Il metodo precedente, come era da aspettarsi, e` piuttosto grossolano. L’intuizione ci dice che, quando f sia abbastanza regolare, una somma del tipo ∑k (xk − xk−1 ) f (zk ) fornisca una migliore approssimazione dell’integrale se per ogni intervallo il punto zk coincide con il punto medio, cio`e zk = (xk−1 + xk )/2. Sia dunque ancora b−a k (k = 0, 1, . . . , n) xk = a + n e sia xk−1 + xk zk = . 2 Poniamo b−a ( f (z1 ) + f (z2 ) + · · · + f (zn )) . Sn0 = n Teorema 9.3. Sia f una funzione dotata di derivate prima e seconda continue in [a, b] e si abbia | f 00 (x)| ≤ M2 . Allora M2 (b − a)3 0 Zb ≤ Sn − . f (x) dx 24 n2 a A parit`a di nodi, questo metodo fornisce effettivamente un’approssimazione migliore. Osservazione. Spesso si definisce uno stimatore della precisione numerica, chiamato ordine del metodo. Prendendo come funzioni–campione i soliti polinomi, un metodo numerico e` di ordine N se esso e` esatto (cio`e non si comemtte nessun errore) per tutti i polinomi di ordine (non superiore a) N. E` facile convincersi che sia il metodo dei retatngoli che quelo dei trapezi sono di ordine N = 1. Basta pensare alla costruzione delle approssimazion per rendersi conto che Sn e Sn0 coincidono con il valore dell’integrale di f ogni volta che f e` una funzione lineare. In questo senso, invitiamo lo studente ad usare con la dovuta cautela il concetto di precisione per i metodi numerici. Potendosi dimostrare l’ottimalit`a delle stime fornite dai teoremi precedenti, deduciamo che l’ordine e` uno stimatore che non si sovrappone alla velocit`a con cui l’errore tende a zero. D’altra parte, l’ordine non fa ricorso al numero di derivate disponibili per la funzione integranda, e questo lo rende sensato anche per le funzioni che siano solo continue. Avvertiamo che i tre metodi precedenti sono esposti anche in [16], dove per`o le formule relative agli errori sono decisamente migliorabili. Una rapida ispezione delle stime mostra che esse sono matematicamente rigorose, ma diverse da quelle dei nostri teoremi proprio in quanto e` richiesta meno regolarit`a alla funzione integranda. 8.2.3 Il metodo di Cavalieri–Simpson Il metodo delle tangenti consiste nel compiere l’integrazione dopo aver sostituito, in ciascun intervallo della suddivisione, il grafico della funzione con la tangente al grafico, in corrispondenza al punto di mezzo.
9.2 Integrazione numerica
213
Viene spontaneamente l’idea di introdurre una curva che meglio approssimi il grafico, almeno quando queto sia abbastanza “liscio”. Il metodo che esponiamo consiste nell’approssimare il grafico con un arco di parabola, che coincida con la curva in corrispondenza degli estremi di ciascun intervallo e del punto di mezzo. 6 Presa dunque la suddivisione {x0 , x1 , . . . , xn } dell’intervallo [a, b] in n intervalli di uguale ampiezza, e posto zk = (xk−1 + xk )/2, consideriamo un polinomio di secondo grado, che potr`a essere scritto nella forma pk (x) = α(x − zk )2 + β (x − zk ) + γ, e imponiamo le condizioni pk (xk−1 ) = f (xk−1 ),
pk (zk ) = f (zk ),
Ponendo xk − zk = zk − xk−1 = σ =
pk (xk ) = f (xk ). b−a , 2n
si avr`a γ = f (zk ) 2
ασ + β σ = f (xk ) − f (zk ) ασ 2 − β σ = f (xk−1 ) − f (zk ). Si ha poi7 xk 2 (x − zk )3 = ασ 3 + 2γσ . pk (x) dx = α + γ(x − zk ) 3 3 xk−1 xk−1
Z xk
Ricavando α e γ dal sistema, Z xk xk−1
f (xk ) + f (xk−1 ) + 4 f (zk ) σ 3 b − a f (xk ) + f (xk−1 ) + 4 f (zk ) = . n 6
pk (x) dx =
Sommando rispetto all’indice k, otteniamo la seguente espressione approssimata dell’integrale:
6
Ricordiamo infatti che servono tre punti distinti per determinare univocamente una parabola che li congiunga. 7 Il termine β (x − z )2 si semplifica perch´ e stiamo integrando su un intervallo simmetrico rispetto k 2 a zk .
214
Sn? =
9 Metodi del calcolo approssimato
b − a n f (xk ) + f (xk−1 ) + 4 f (zk ) ∑ n k=1 6 b−a = f (x0 ) + f (xn ) + 2 f (x1 ) + f (x2 ) + · · · + f (xn−1 ) 6n + 4 f (z1 ) + f (z2 ) + · · · + f (zn ) .
Teorema 9.4. Sia f una funzione continua con le sue derivate fino al quarto ordine in [a, b] e sia |D4 f (x)| ≤ M4 . Allora M4 (b − a)5 1 ? Zb ≤ Sn − . f (x) dx 2880 n4 a Dalla costruzione emerge chiaramente che il metodo di Cavalieri–Simpson e` esatto per i polinomi di secondo grado, e dunque e` un metodo di ordine N = 2. Osservazione 9.2. Avvertiamo lo studente che su molti testi vengono utilizzate notazioni diverse. Noi abbiamo introdotto, per ogni coppia di nodi xk e xk+1 un noto di comodo zk . Altri autori prendono invece tre nodi consecutivi xk−1 , xk e xk+1 della suddivisione, considerando ovviamente xk alla stregua del nostro zk . A questo punto per`o bisogna scegliere obbligatoriamente n pari, altrimenti non si riesce ad arrivare a b con l’ultimo passaggio. E` chiaro che l’idea resta sempre quella di approssimare f mediante archi di parabola. Concludiamo con un confronto: cerchiamo di approssimare log 2 =
Z 2 dx 1
x
.
Prendendo n = 4 nel metodo delle tangenti, i punti di mezzo saranno 9 11 13 15 , , , . 8 8 8 8 Troviamo dunque S40 =
1 4
8 8 8 8 + + + 9 11 13 15
= 0.6910
mentre log 2 = 0.6931... Con 4 suddivisioni, il valore e` corretto alla seconda cifra decimale. Usiamo invece il metodo di Cavalieri–Simpson con n = 2. facendo qualche calcolo si arriva a 1 1 4 4 4 S2? = 1+ + +4 + = 0.6932... 12 2 3 5 7
9.2 Integrazione numerica
215
Come si vede, l’approssimazione ottenuta e` sensibilmente migliore gi`a con la met`a di suddivisioni.8 Il contenuto di questo paragrafo e` preso dall’ultimo capitolo di [28]. Non trattandosi di un testo specializzato nel calcolo numerico, la trattazione ha un’impostazione molto geometrica ed intuitiva. In effetti, dubitiamo che lo studente abbia scorto il legame fra i tre metodi proposti e l’interpolazione polinomiale. Per il metodo dei rettangoli, tale legame semplicemente non c’`e, o comunque e` decisamente “degenere”. Infatti ci siamo limitati ad approssimare la funzione continua f con segmenti orizzontali, ottenendo un’approssimazione chiaramente discontinua. In realt`a, il metodo di Cavalieri–Simpson consiste evidentemente nell’integrazione di un polinomio interpolatore di secondo grado, come abbiamo evidenziato nella costruzione. Come utile esercizio, lo studente potr`a verificare che partendo dal polinomio interpolatore di Lagrange passante per i tre punti (xk , f (xk )), (zk , f (zk ), (xk+1 , f (xk+1 )) e integrandolo fra xk e xk+1 si perviene alla stessa formula. Non abbiamo seguito questa via solo perch´e conveniva sfruttare la simmetria rispetto al punto mediano zk per semplificare alcuni calcoli. Resta da capire se l’integrazione del polinomio interpolatore di primo grado conduca a una formula di integrazione approssimata efficiente. La risposta e` affermativa, e il metodo va sotto il nome di metodo dei trapezi. Fissata la solita suddivisione {x0 , x1 , . . . , xn } di [a, b], per ogni intervallino [xk−1 , xk ] possiamo introdurre il polinomio di interpolazione lineare p1 , che esplicitamente si scrive f (xk ) − f (xk−1 ) (x − xk−1 ) + f (xk−1 ). p1 (x) = xk − xk−1 Integrando, 9 Z xk xk−1
p1 (x) dx =
f (xk ) + f (xk−1 ) b − a f (xk ) + f (xk−1 ) (xk − xk−1 ) = . 2 n 2
Infine, sommando rispetto all’indice k, troviamo la formula di approssimazione per l’integrale esteso da a a b: Sntrap =
b − a n f (xk ) + f (xk−1 ) . ∑ n k=1 2
Per costruzione, questo e` un metodo di ordine N = 1, dato che i polinomi per i quali l’interpolazione lineare e` sempre esatta sono quelli di grado uno. E` altres`ı evidente che nulla ci impedisce di considerare polinomi interpolatori di grado pi`u alto di due. Potremmo infatti raggruppare i punti a tre a tre e cerca8
A questo riguardo, si leggano gli ultimi capoversi del capitolo. Lo studente si convinca che l’integrale di p1 altro non e` che l’area di un trapezio rettangolo di basi f (xk ) e f (xk−1 ) e altezza (b − a)/n. 9
216
9 Metodi del calcolo approssimato
re un polinomio di terzo grado che li unisca.10 Se questo pu`o sembrare un gioco appassionante con cui mettere alla prova la propria comprensione dell’argomento, ci si accorge in fretta che esagerare non serve a molto. Lo studente avr`a senz’altro notato che far passare un polinomio di decimo grado per undici nodi e` solo una complicazione tecnica: tanto vale “raffinare” la suddivisione dell’intervallo e usare un polinomio di grado inferiore. La formula di Cavalieri–Simpson e` una delle preferibili, dal momento che unisce accuratezza e semplicit`a. Nella letteratura specializzata (si veda [29]), molta importanza viene data ai metodi di Newton–Cotes, basati proprio sui polinomi di Lagrange. Infine, tutti i metodi di integrazione approssimata hanno la caratteristica di essere facilmente implementabili in un qualsiasi linguaggio di programmazione moderno, come il C, il Python, il Fortran o anche uno dei linguaggi di alto livello come Matlab, Mathematica o Maple. Per tutti si tratta solamente di ricevere in input una stringa di dati (i nodi sulle ascisse e i corrispondenti valori sulle ordinate) e di emettere in output un numero ottenuto mediante alcune semplici operazioni aritmetiche. Lo studente interessato potr`a trovare alcuni esempi, assolutamente elementari e primitivi, di implementazione nel linguaggio C dei metodi dei trapezi, delle tangenti e di Simpson sul sito dell’autore, nella sezione di didattica. La scelta del linguaggio C e` legata all’esistenza dei compilatore Open Source gcc, liberamente installabile su ogni sistema operativo moderno e gi`a presente nelle principali distribuzioni GNU/Linux. Naturalmente il codice e` cos`ı semplice da poter essere tradotto in tutti i linguaggi scientifici conosciuti. Solo per comodit`a, riportiamo di seguito il brevissimo listato del metodo dei trapezi in Python. La prima riga e` specifica per i sistemi Unix (GNU/Linux, *BSD, Apple Mac OS X, ecc.) #!/usr/bin/python def f(x) : t = 1./x return t n = 1000 i=0 x1 = 1. x2 = 1. + 1./n S = 0. while i