LA STRADA CHE PORTA ALLA REALTÀ

Roger Penrose

Lo scopo di questo libro è trasmettere al lettore la capacità di apprezzare uno dei più importanti ed eccitanti viaggi di scoperta che l’umanità abbia mai intrapreso: la ricerca dei principi fondamentali che reggono il comportamento del nostro universo. È un viaggio che dura da circa tre millenni e mezzo, e quindi non dobbiamo stupirci se alla fine sono stati raggiunti alcuni sostanziali progressi. Ma questo viaggio si è dimostrato estremamente difficile e, nella maggior parte dei casi, si è arrivati a una reale comprensione della Natura soltanto lentamente. Questa difficoltà intrinseca ci ha condotto verso molte direzioni sbagliate: dobbiamo quindi imparare a essere cauti. Il ventesimo secolo ci ha tuttavia offerto nuove e straordinarie intuizioni – alcune così imponenti da spingere molti scienziati a pensare che potremmo essere vicini a una comprensione fondamentale di tutti i principi di base della fisica. Nella mia esposizione delle attuali teorie fondamentali, cercherò di presentare un punto di vista più moderato. Non tutte le mie opinioni possono essere accettate dagli «ottimisti»; ciò nonostante sarei molto sorpreso se in futuro non ci fossero ulteriori cambiamenti di direzione che riuscissero a superare in grandezza quelli che ci ha offerto il secolo appena concluso.

Il lettore scoprirà che in questo libro non sono rifuggito dal presentare formule matematiche, nonostante i numerosi ammonimenti riguardo alla notevole riduzione del numero di lettori che ciò avrebbe implicato. Ho riflettuto seriamente su tale questione e sono arrivato alla conclusione che ciò che devo dire non può essere ragionevolmente comunicato senza un certo impiego di notazioni matematiche e senza esplorare autentici concetti matematici. La nostra comprensione dei principi che sono alla base del comportamento del mondo fisico dipende veramente da un certo apprezzamento della matematica. Alcuni potrebbero considerare ciò motivo di disperazione, poiché si sono convinti di non possedere alcuna capacità matematica, neppure la più elementare. Come potrebbero comprendere la ricerca in corso alla frontiera avanzata della fisica, se non possono neppure padroneggiare la manipolazione delle frazioni? Mi rendo conto di questa difficoltà.

Sono comunque ottimista riguardo alla trasmissione di comprensione. Forse sono un inguaribile ottimista, ma mi chiedo se questi potenziali lettori che non sono in grado di manipolare frazioni – o quelli che affermano di non sapere manipolare frazioni – non ingannino se stessi, almeno in parte, e se molti di loro non possiedano effettivamente una capacità potenziale che ignorano di avere. Vi sono senza dubbio alcuni che, messi di fronte a una riga di simboli matematici, per quanto possano essere semplici, riescono a vedere soltanto il volto severo di un genitore o di un insegnante che cercava d’instillare in loro un’apparente competenza pappagallesca – un dovere, soltanto un dovere –, senza che alcuna traccia della magia o della bellezza del soggetto potesse sopravvivere. Per alcuni, forse, è troppo tardi; ma, come ho già detto, sono un ottimista e credo che vi siano ancora molti, persino tra quelli che non potrebbero mai padroneggiare le frazioni, che hanno la capacità di afferrare qualche vaga percezione di un mondo meraviglioso che io reputo debba essere per loro veramente accessibile.

Quando era ancora una ragazza, una delle migliori amiche di mia madre non riusciva a comprendere le frazioni. Me lo disse lei stessa una volta, in tarda età, dopo essersi ritirata da una brillante carriera di ballerina classica. Ero giovane, non ancora completamente lanciato nell’attività di matematico, ma si sapeva che ero entusiasta di quell’argomento. Lei mi disse: «È stata tutta colpa delle semplificazioni. Non sono mai arrivata a comprendere il significato di semplificazione». Era una donna raffinata e molto intelligente, e non ho alcun dubbio che le qualità mentali necessarie per comprendere la sofisticata coreografia di un balletto non siano per niente inferiori a quelle impiegate per risolvere un problema matematico. Perciò, sopravvalutando grossolanamente le mie capacità d’esposizione, tentai, come avevano già fatto altre persone, di spiegarle la semplicità e la logica del procedimento di «semplificazione».

Anche i miei sforzi non portarono ad alcun risultato. (A proposito, suo padre era stato un eminente geologo e un membro della Royal Society, quindi lei probabilmente doveva possedere un bagaglio culturale necessario per la comprensione di questioni scientifiche. Forse in questo caso la «faccia severa» era stata determinante, non so.) Ma, dopo aver riflettuto, mi chiedo adesso se lei, e molti altri come lei, non avessero un’inibizione più razionale. Un’inibizione che io con tutta la mia facondia matematica non avevo neppure visto. Vi è davvero un serio problema in cui ci s’imbatte ripetutamente in matematica e in fisica matematica, e che s’incontra per la prima volta nell’apparentemente innocente operazione di semplificazione, in cui un fattore comune viene cancellato dal numeratore e dal denominatore di una comune frazione numerica.

Quelli per cui la semplificazione è diventata una seconda natura, per la familiarità con tale operazione, possono rivelarsi insensibili nei confronti di una difficoltà che effettivamente sorge dietro questo procedimento apparentemente semplice. Forse molti di quelli che trovano misteriosa la semplificazione vedono un serio problema più in profondità di chi prosegue in modo sprezzante, quasi ignorandolo. Qual è questo problema? Riguarda il modo stesso con cui i matematici sono in grado di fornire un’esistenza alle loro entità matematiche e il modo con cui tali entità possono essere collegate alla realtà fisica.

Mi ricordo che a scuola, quando avevo più o meno undici anni, fui preso alla sprovvista quando l’insegnante chiese alla classe che cosa fosse effettivamente una frazione (come, per esempio, 3/8)! La classe propose vari suggerimenti che riguardavano la divisione di torte in pezzi e cose simili, ma furono tutti respinti dall’insegnante per un giusto motivo: si riferivano soltanto a situazioni fisiche poco precise, cui doveva essere applicata la nozione matematica precisa di frazione. Non ci dicevano cosa fosse effettivamente quella chiara nozione matematica. Seguirono altri suggerimenti, tipo che 3/8 è «qualcosa con un tre in alto e un otto in basso e una linea in mezzo» e fui decisamente sorpreso scoprendo che l’insegnante sembrava prendere sul serio queste proposte! Non ricordo precisamente come fu risolta alla fine la questione, ma con il senno di poi, acquistato molto più tardi grazie ai miei studi universitari di matematica, posso supporre che l’insegnante stesse facendo un coraggioso tentativo di presentarci la definizione di frazione in termini dell’onnipresente nozione matematica di classe d’equivalenza.

Cos’è questa nozione? Come può essere applicata a una frazione e dirci che cosa è effettivamente una frazione? Partiamo dal suggerimento «qualcosa con un tre in alto e un otto in basso». Ciò ci propone fondamentalmente che una frazione è specificata da una coppia ordinata di numeri interi, in questo caso i numeri 3 e 8. Ma evidentemente non possiamo considerare che una frazione sia una simile coppia ordinata, perché la frazione 6/16, per esempio, è lo stesso numero della frazione 3/8, mentre la coppia (6, 16) non è certamente uguale alla coppia (3, 8). Questo è proprio il problema della semplificazione. Possiamo scrivere infatti 6/16 come 3 × 2/8 × 2 e poi cancellare il 2 da sopra e da sotto ottenendo 3/8. Perché possiamo fare ciò e in tal modo «eguagliare» in un certo senso la coppia (6, 16) alla coppia (3, 8)? La risposta del matematico – che può sembrare decisamente una «scappatoia» – è che la cancellazione è inclusa proprio nella definizione di frazione: una coppia di numeri interi (a × n, b × n) è destinata a rappresentare la stessa frazione della coppia (a, b) ogni volta che n è un numero intero diverso da zero (si tenga presente che anche b non può essere zero).

Ma persino questo non ci dice cos’è una frazione; ci dice soltanto qualcosa sul modo con cui rappresentiamo le frazioni. Che cosa è allora una frazione? In base alla nozione matematica di «classe d’equivalenza», la frazione 3/8, per esempio, è semplicemente la collezione infinita di tutte le coppie

(3, 8), (– 3, – 8), (6, 16), (– 6, – 16), (9, 24), (– 9, – 24), (12, 32), …,

dove ciascuna coppia può essere ottenuta da ciascuna delle altre coppie nella lista mediante una ripetuta applicazione della regola di cancellazione.¹ Abbiamo bisogno anche di definizioni che ci dicano come addizionare, sottrarre e moltiplicare tali collezioni infinite di coppie di numeri interi, in modo tale che valgano le ordinarie regole dell’algebra, e inoltre ci permettano d’identificare gli stessi numeri interi con casi particolari di frazioni.

Questa definizione realizza tutto ciò di cui abbiamo matematicamente bisogno per le frazioni (come il fatto che è un numero che aggiunto a se stesso dà il numero 1, eccetera) e la stessa operazione di cancellazione è, come abbiamo visto, inclusa nella definizione. Tuttavia, tutto ciò sembra molto formale e possiamo davvero chiederci se descriva efficacemente la nozione intuitiva di ciò che è una frazione. Anche se questo onnipresente procedimento di classe d’equivalenza, di cui l’applicazione di prima è soltanto un esempio particolare, è uno strumento molto potente nel campo della matematica pura per stabilire coerenza ed esistenza matematica, può fornirci entità dall’aspetto molto pesante. Per esempio, ci trasmette con difficoltà la nozione intuitiva di che cos’è 3/8! Non mi meraviglia che l’amica di mia madre fosse confusa.

Nelle mie descrizioni di nozioni matematiche cercherò di evitare, per quanto posso, il genere di pedanteria matematica che ci porta a definire una frazione come una «classe infinita di coppie», sebbene tali concetti siano importanti nel campo del rigore e della precisione matematica. In queste mie descrizioni cercherò soprattutto di trasmettere l’idea – e la bellezza e la magia – inerente a molte e importanti nozioni matematiche. L’idea di una frazione come 3/8 si basa semplicemente sul fatto che essa è una specie d’entità che ha la proprietà di dare 3, quando è sommata a se stessa 8 volte. La magia risiede nel fatto che l’idea di frazione funziona effettivamente, nonostante non abbiamo realmente esperienza diretta di cose che nel mondo fisico sono esattamente quantificate da frazioni – le fette di torta portano solo ad approssimazioni. (Ciò è molto diverso dal caso dei numeri naturali, come 1, 2, 3, che quantificano con precisione numerose entità appartenenti alla nostra esperienza diretta.) Un modo per comprendere che le frazioni hanno davvero un senso coerente è impiegare questa «definizione» in termini di collezioni infinite di coppie di numeri interi, come abbiamo indicato in precedenza. Ma ciò non significa che 3/8 sia effettivamente una collezione del genere. È meglio pensare che 3/8 sia un’entità con una sua esistenza (platonica) e che la collezione infinita di coppie sia soltanto un nostro modo di scendere a patti con la coerenza di questo tipo d’identità. Familiarizzando con essa, cominciamo a credere di potere facilmente comprendere una nozione come 3/8 come qualcosa che ha davvero una sua esistenza e che l’idea di «collezione infinita di coppie» sia soltanto un accorgimento pedante – un accorgimento che rapidamente scompare dalla nostra immaginazione una volta che l’abbiamo compreso. Gran parte della matematica è così fatta.

La matematica per un matematico (almeno per la maggior parte, per quanto ne so) non è soltanto un’attività culturale che noi stessi abbiamo creato, ma ha una sua vita e gran parte di essa si trova in stupefacente armonia con l’universo fisico. Non possiamo comprendere profondamente le leggi che reggono il mondo fisico senza entrare nel mondo della matematica. In particolare, la precedente nozione di classe d’equivalenza è pertinente non soltanto a molta matematica importante (ma ambigua), ma anche a molta fisica importante (e ambigua), come la teoria della relatività generale di Einstein e i principi delle «teorie di gauge» che descrivono le forze naturali secondo la moderna fisica delle particelle. Nel campo della fisica moderna non si può evitare di affrontare le sottigliezze di una grande quantità di matematica sofisticata. È per questo motivo che ho dedicato i primi 16 capitoli di questo libro a una descrizione di idee matematiche.

Quali consigli posso dare al lettore affinché possa cavarsela? Questo libro può essere letto a quattro livelli. Forse siete lettori che si preoccupano semplicemente ogni volta che compare una formula matematica (e alcuni di questi lettori possono avere difficoltà ad accettare le frazioni). Se è così, credo che possiate guadagnare molto da questo libro, semplicemente saltando tutte le formule e leggendo soltanto le parole. Quando ero adolescente, facevo anch’io la stessa cosa con le riviste di scacchi che erano disseminate in casa. Gli scacchi occupavano gran parte della vita dei miei fratelli e dei miei genitori, ma personalmente m’interessavano pochissimo, tranne per il fatto che mi piaceva leggere gli exploit di quegli eccezionali e spesso bizzarri personaggi che si dedicavano a questo gioco. Traevo qualche beneficio dalla lettura della brillantezza delle mosse che spesso facevano, anche se non le comprendevo e non m’impegnavo a seguirle sulla scacchiera. Tuttavia, la ritenevo un’attività divertente e illuminante che poteva attrarre la mia attenzione. Spero, allo stesso modo, che le descrizioni matematiche qui presentate possano interessare un po’ anche ai lettori che non amano per niente la matematica, se avranno il coraggio o la curiosità di seguirmi in questo viaggio d’investigazione delle idee matematiche e fisiche che sembrano stare alla base del nostro universo fisico. Non abbiate timore di tralasciare le equazioni (spesso lo faccio anch’io) e tralasciate anche, se lo desiderate, interi capitoli o parti di capitolo quando cominciano a essere un po’ troppo pesanti! Vi sono moltissime difficoltà e moltissimi tecnicismi nella materia, quindi passate ad altro che può essere più di vostro gradimento. Potete semplicemente scegliere di immergervi e dare un’occhiata. La mia speranza è che i numerosi riferimenti incrociati possano illuminare a sufficienza nozioni sconosciute, in modo che sia possibile rintracciare i concetti e le notazioni occorrenti, ritornando per chiarimenti a sezioni in precedenza tralasciate.

A un secondo livello, siete forse lettori pronti a esaminare formule matematiche, ogni volta che una di esse è presentata, ma non avete la tendenza (e forse neppure il tempo) a verificare per vostro conto le affermazioni che farò. Le conferme di molte di queste affermazioni costituiscono le soluzioni degli esercizi che ho disseminato nelle parti matematiche del libro.

Se, d’altra parte, siete lettori che desiderano veramente acquistare dimestichezza con queste varie (importanti) nozioni matematiche, ma non avete molta familiarità con le idee che descrivo, spero che l’elaborazione di questi esercizi vi possa fornire un significativo aiuto nel raggiungimento di queste capacità. Spesso in matematica la riflessione personale può offrire una comprensione più profonda sulle cose rispetto a quella offerta da una semplice lettura. (Se avete bisogno delle soluzioni degli esercizi, controllate il sito web www.roadsolutions.ox.ac.uk.)

Infine, forse siete già esperti, nel qual caso non dovreste avere alcuna difficoltà con la matematica (che vi sarà molto familiare) e può darsi che non desidererete perdere tempo con gli esercizi. Potrete tuttavia ottenere qualcosa dai miei punti di vista, che probabilmente sono diversi (e talvolta molto diversi) da quelli consueti su un certo numero di temi. Potreste essere interessati a conoscere le mie opinioni riguardo a un certo numero di teorie moderne (per esempio la supersimmetria, la cosmologia inflazionaria, la natura del Big Bang, i buchi neri, la teoria delle stringhe o M-teoria, le variabili di loop nella gravità quantistica, la teoria dei twistor, persino gli stessi fondamenti della teoria quantistica). In molti di questi temi, senza dubbio troverete diversi punti sui quali non sarete d’accordo con me. Ma le controversie hanno un ruolo importante nello sviluppo della scienza: non ho quindi alcun rammarico nel presentare, come farò, opinioni che possono essere ritenute parzialmente in disaccordo con alcune delle tendenze dominanti della moderna fisica teorica.

L’argomento principale di questo libro è davvero la relazione tra matematica e fisica e il modo con cui l’interazione tra queste due discipline influenza gli stimoli che stanno alla base delle nostre ricerche per una migliore teoria dell’universo. In molti sviluppi moderni, un ingrediente essenziale di questi stimoli è costituito dalla valutazione di bellezza, profondità e sofisticazione matematica. Tali influenze matematiche possono essere d’importanza vitale, come nel caso di alcuni dei più significativi successi della fisica del ventesimo secolo: l’equazione di Dirac per l’elettrone, lo schema generale della meccanica quantistica, la relatività generale di Einstein. Ma in tutti questi casi le considerazioni fisiche – in ultima analisi quelle osservazionali – hanno fornito i criteri predominanti per la loro accettazione. In molte delle idee moderne per un progresso fondamentale della nostra comprensione delle leggi dell’universo, adeguati criteri fisici – cioè dati sperimentali o persino la possibilità di investigazioni sperimentali – non sono disponibili e possiamo chiederci se i desiderata matematici disponibili sono sufficienti per riuscire a valutare le probabilità di successo per queste idee. È un problema molto delicato e cercherò di sollevare questioni che credo non siano mai state discusse a sufficienza altrove.

Anche se, in alcune sezioni, presenterò opinioni che possono essere considerate discutibili, mi sono preoccupato di mostrare al lettore quando mi prendo effettivamente questa libertà. Questo libro può quindi essere davvero impiegato come un’autentica guida alle idee basilari (e alle meraviglie) della fisica moderna. E considerando la comprensibilità del contenuto e il fatto che siamo ormai entrati nei primi anni del terzo millennio, il testo è appropriato per l’uso didattico come introduzione alla fisica moderna.

1. Questa è chiamata «classe d’equivalenza» perché è effettivamente una classe di entità (che in questo caso particolare sono coppie di numeri interi) ciascuna delle quali è ritenuta essere equivalente, in un senso ben specificato, a ognuna delle altre.

Am-tep era il principale artigiano del re, un artista di consumata abilità. Era notte e dormiva sul giaciglio del laboratorio, stanco dopo una lunga giornata di lavoro, ma il suo sonno era irrequieto – forse per un’impalpabile tensione che sembrava aleggiare nell’aria. Non era certo di essere del tutto addormentato quando la cosa avvenne. Era arrivato il giorno – all’improvviso – nonostante le sue ossa gli dicessero che sicuramente doveva essere ancora notte.

Si alzò repentinamente. Qualcosa era stranamente insolito. La luce dell’alba non poteva essere a nord; tuttavia la luce rossa proveniva in modo allarmante dall’apertura dell’ampia finestra che guardava verso nord attraverso il mare. Andò alla finestra e guardò fuori, incredulo e stupito. Il sole non era mai sorto a nord prima! Per il suo stato di sbalordimento, gli ci vollero alcuni istanti per comprendere che quello non poteva essere assolutamente il sole. Era un lontano fascio di luce, di un rosso acceso, emesso verticalmente dall’acqua verso il cielo.

Una nuvola più scura divenne visibile all’estremità superiore del fascio, dando all’intera struttura l’aspetto di un gigantesco parasole lontano, che splendeva malignamente, con una asta fumosa e fiammeggiante. La parte superiore del parasole cominciò ad allargarsi e a scurirsi, quasi un demone degli inferi. La notte era stata limpida, ma le stelle scomparvero a una a una, inghiottite da questa mostruosa creatura infernale che avanzava.

Am-tep non si mosse, nonostante la terribile situazione. Rimase paralizzato per parecchi minuti dalla perfetta simmetria e dalla terrificante bellezza della scena. Ma poi la terribile nuvola cominciò a inclinarsi leggermente verso est, coinvolta dai venti prevalenti. Forse ciò confortò un po’ Am-tep e l’incantesimo fu momentaneamente interrotto. Ma il timore gli tornò immediatamente, quando gli sembrò di sentire nel sottosuolo una strana agitazione, accompagnata da brontolii di sinistro augurio, la cui natura era a lui completamente sconosciuta. Cominciò a chiedersi cosa avrebbe potuto causare quella furia. Non era mai stato prima testimone di un’ira di Dio di quella grandezza.

La sua prima reazione fu d’incolpare se stesso per il disegno che aveva appena completato sulla coppa sacrificale. La sua raffigurazione del Dio-Toro non era stata abbastanza terrificante? Quel Dio n’era rimasto offeso? Ma l’assurdità di questo pensiero lo colpì subito. La furia di cui era appena stato testimone non sarebbe mai potuta essere il risultato di un’azione così banale come la sua, e certamente non era indirizzata a lui in particolare. Ma sapeva che vi sarebbero stati guai nel Grande Palazzo. Il Re-Sacerdote non avrebbe perso tempo per tentare di rabbonire questo Dio-Demone. Ci sarebbero voluti dei sacrifici. Le tradizionali offerte di frutti o di animali non sarebbero state sufficienti a placare un’ira di questa grandezza. I sacrifici avrebbero dovuto essere umani.

Del tutto all’improvviso e con sua gran sorpresa, fu spinto indietro attraverso la stanza da un’improvvisa folata d’aria, seguita da un forte vento. Il rumore fu così forte da renderlo momentaneamente sordo. Molti dei suoi vasi magnificamente adornati furono strappati dalle mensole e ridotti in pezzi contro la parete posteriore. Mentre stava disteso sul pavimento in un angolo lontano della stanza dove era stato gettato dalla folata d’aria, cominciò a recuperare i sensi e vide che la stanza era in subbuglio. Fu atterrito nel vedere una delle sue urne preferite ridotta in mille pezzi: i magnifici disegni che aveva così accuratamente realizzato non esistevano più.

Am-tep si sollevò barcollando dal pavimento e dopo un po’ si avvicinò di nuovo alla finestra, questa volta con trepidazione, per esaminare nuovamente la terribile scena nel mare lontano. Pensò che lo sconvolgimento, illuminato da quella lontana fornace, stesse arrivando verso di lui. Sembrava che nell’acqua ci fosse un vasto avvallamento, in rapido movimento verso la costa, seguito da un’onda alta come una scogliera. Ancora una volta rimase bloccato dal terrore, guardando l’onda che avvicinandosi cominciava ad assumere proporzioni gigantesche. Infine lo sconvolgimento raggiunse la costa e il mare immediatamente davanti a lui si ritirò, lasciando molte imbarcazioni arenate sulla spiaggia appena formata. Poi l’onda entrò nelle zone lasciate libere e colpì con incredibile violenza. Senza alcuna eccezione le imbarcazioni furono ridotte a pezzi e molte case vicine alla riva furono immediatamente distrutte. E nonostante l’acqua si alzò a grande altezza davanti a lui, la sua casa fu risparmiata, perché era posta in un luogo elevato, a una buona distanza dal mare.

Anche il Grande Palazzo fu in gran parte risparmiato dal mare. Ma Am-tep temeva che il peggio dovesse ancora arrivare, e aveva ragione – anche se non sapeva quanto avesse ragione. Sapeva tuttavia che l’ordinario sacrificio di una schiava sarebbe stato, questa volta, insufficiente. Ci sarebbe stato bisogno di qualcosa di più per calmare l’ira funesta di questo terribile Dio. Il suo pensiero corse ai figli e al nipote appena nato. Persino loro potevano non essere al sicuro.

Am-tep aveva avuto ragione a temere nuovi sacrifici umani. Una giovane fanciulla e un giovane di buona famiglia erano stati subito arrestati e portati in un tempio vicino, posto in alto sulle pendici di una montagna. E mentre il rituale era in corso si verificò un’altra catastrofe. Il terreno sussultò con violenza devastante, il tetto del tempio crollò, uccidendo immediatamente tutti i sacerdoti e le loro vittime sacrificali. Quando ciò avvenne, il rituale era a metà – per essere seppelliti per più di tre millenni e mezzo.

La devastazione fu spaventosa, ma non definitiva. Molti abitanti dell’isola su cui viveva Am-tep sopravvissero al terribile terremoto, anche se il Grande Palazzo fu distrutto quasi completamente. Nel corso degli anni venne messa in atto l’opera di ricostruzione. Anche il Palazzo, costruito sulle rovine del vecchio, recuperò gran parte del suo originale splendore. Am-tep tuttavia aveva giurato di lasciare l’isola. Il suo mondo era irrimediabilmente cambiato.

Nel mondo che conosceva vi erano stati mille anni di pace, prosperità e cultura, dove aveva regnato la Dea Terra. Erano fiorite arti meravigliose. Vi era molto commercio con i paesi vicini. Il maestoso Grande Palazzo era un enorme e lussuoso labirinto, una città virtuale per conto proprio, adornato da superbi affreschi di animali e fiori. Vi era acqua corrente, un eccellente drenaggio e fogne pulite. La guerra era quasi sconosciuta e le difese non erano necessarie. Ma Am-tep comprese che la Dea Terra era stata detronizzata da un Essere con valori completamente diversi.

Passarono alcuni anni prima che Am-tep abbandonasse davvero l’isola, accompagnato dai familiari superstiti, su un’imbarcazione costruita dal figlio più giovane, un esperto carpentiere e marinaio. Il nipotino di Am-tep era un bambino sveglio che s’interessava a ogni cosa. Il viaggio richiese alcuni giorni, ma le condizioni metereologiche furono dalla loro parte. In una notte chiara Am-tep stava spiegando al nipotino le disposizioni delle stelle, quando uno strano pensiero lo colse di sorpresa. Le disposizioni delle stelle non erano state assolutamente modificate, neppure per uno iota, rispetto alla loro posizione prima della Catastrofe apparizione del terribile Demone.

Am-tep conosceva bene queste disposizioni, perché aveva l’occhio acuto dell’artista. Egli pensò che quei minuscoli punti luminosi nel cielo avrebbero sicuramente dovuto spostarsi almeno un po’ dalle loro posizioni a causa della violenza di quella notte, proprio come i suoi vasi erano stati ridotti in pezzi e la sua grande urna frantumata. Anche la Luna aveva mantenuto la sua Faccia, proprio come prima, e il suo percorso nel cielo colmo di stelle non era cambiato neanche un po’, per quanto Am-tep poteva comprendere. Per molte notti dopo la Catastrofe, il cielo era davvero apparso diverso. Vi era stata oscurità e nuvole strane, la Luna e il Sole erano a volte di un colore insolito. Ma ora sembrava che le loro traiettorie non fossero assolutamente diverse rispetto a prima. E le minuscole stelle, allo stesso modo, non avevano cambiato posizione.

Se i cieli avevano mostrato così scarso interesse alla Catastrofe, possedendo una statura notevolmente maggiore di quella del terribile Demone – così ragionò Am-tep – perché le forze che controllavano lo stesso Demone avrebbero dovuto mostrare interesse a quello che il piccolo popolo dell’isola stava facendo, a quegli sciocchi rituali e a quei sacrifici umani? Provò anche imbarazzo ripensando ai suoi sciocchi pensieri di allora, che il Demone si fosse potuto adirare solo per i disegni sui suoi vasi.

Tuttavia Am-tep era ancora turbato dalla domanda “Perché?”. Quali grandi forze controllano il comportamento del mondo e perché esse a volte si manifestano in violenti e in modi apparentemente incomprensibili? Condivise le sue domande col nipote, ma non vi furono risposte.

…

Passò un secolo, poi un millennio, senza che vi fosse alcuna risposta.

…

Amphos l’artigiano aveva passato tutta la vita nella stessa piccola città dove avevano vissuto suo padre e tutti i suoi antenati. Si guadagnava da vivere realizzando braccialetti d’oro finemente decorati, orecchini, coppe da cerimonia e altri prodotti della sua abilità artistica. La sua famiglia aveva svolto questo per quaranta generazioni – una serie ininterrotta da quando Am-tep si era stabilito là, millecento anni prima.

Ma da generazione a generazione non si era tramandata solo l’abilità artistica. Le domande di Am-tep turbavano Amphos allo stesso modo in cui avevano turbato lo stesso Am-tep in un’epoca molto lontana. La grande storia della Catastrofe, che aveva distrutto un’antica e pacifica civiltà, era stata tramandata da padre a figlio. Anche l’intuizione di Am-tep della Catastrofe era sopravvissuta presso i suoi discendenti. Anche Amphos comprendeva che i cieli avevano una grandezza e una dimensione così grandi da non essere del tutto toccati da quel terribile evento. Nonostante ciò, l’evento aveva avuto un effetto catastrofico sulle poche persone con le loro città e i loro sacrifici umani e gli insignificanti rituali religiosi. Perciò, in confronto, l’evento stesso doveva essere stato il risultato di forze enormi, completamente indifferenti a quelle banali azioni degli esseri umani. Ma la natura di quelle forze era tanto sconosciuta all’epoca di Amphos quanto lo era stata a quella di Am-tep.

Amphos aveva studiato la struttura delle piante, degli insetti, di altri piccoli animali e delle rocce cristalline. Il suo occhio attento gli era stato utile anche nei disegni decorativi. S’interessava di agricoltura ed era affascinato dalla crescita del grano e di altre piante dal seme. Ma niente di ciò gli spiegava il ‘perché’ e così si sentiva insoddisfatto. Credeva che vi fosse veramente una ragione alla base degli schemi della Natura, ma non aveva assolutamente gli strumenti per svelare quelle ragioni.

In una notte limpida, Amphos guardò il cielo e tentò di capire dalla disposizione delle stelle le figure di quegli eroi e di quelle eroine che formavano le costellazioni nel cielo. Ai suoi occhi di umile artista quelle figure erano ben poco rassomiglianti. Egli stesso avrebbe saputo disporre le stelle in modo molto più convincente. Sconcertato si chiese: perché gli Dei non hanno disposto le stelle in modo più appropriato? Le disposizioni, così com’erano, sembravano più semi sparsi, gettati a caso da un contadino, che il deliberato disegno di un Dio. Allora fu pervaso da un pensiero bizzarro: Non tentare di trovare ragioni nelle specifiche disposizioni delle stelle o di altre sistemazioni sparpagliate di oggetti; tenta, invece, di trovare un ordine universale più profondo nel modo in cui le cose si comportano.

Amphos rifletté che, dopo tutto, noi troviamo l’ordine non nelle figure che i semi sparsi formano quando cadono sul terreno, ma nel modo miracoloso con cui ciascuno di quei semi può svilupparsi in una pianta vivente con una superba struttura, simile in gran dettaglio a ogni altra. Noi non cercheremmo di trovare un significato nell’esatta disposizione dei semi sparsi sul suolo; un senso deve esserci, tuttavia, nel segreto mistero delle forze interne che controllano la crescita di ciascun singolo seme, in modo che ciascuno segua sostanzialmente il medesimo corso meraviglioso. Le leggi della Natura devono davvero possedere una precisione superbamente organizzata, affinché questo sia possibile.

Amphos si convinse che, senza precisione nelle leggi fondamentali, non vi sarebbe alcun ordine nel mondo, mentre si percepisce molto ordine nel modo con cui le cose si comportano. Inoltre, vi deve essere precisione nel nostro modo di ragionare su tali questioni, se non dobbiamo essere seriamente fuorviati.

Accadde che Amphos venne a sapere di un saggio che viveva in un’altra parte del paese, le cui convinzioni sembravano essere in accordo con la propria. Secondo questo saggio, non si poteva fare affidamento sugli insegnamenti e le tradizioni del passato. Per essere certi delle proprie convinzioni, era necessario ricavare conclusioni precise con l’impiego di ragionamenti incontestabili. La natura di questa precisione doveva essere matematica – sostanzialmente dipendente dalla nozione di numero e dalla sua applicazione a forme geometriche. Devono quindi essere numero e geometria, non mito e superstizione, a governare il comportamento del mondo.

Amphos s’imbarcò, come aveva fatto Am-tep millecento anni prima di lui. Trovò la strada fino alla città di Crotone, dove il saggio e la sua comunità di 571 uomini saggi e di 28 donne sagge studiavano in cerca di verità. Dopo qualche tempo Amphos fu accettato nella comunità. Il nome di quel saggio era Pitagora.

1.1 La ricerca delle forze che modellano il mondo

Quali sono le leggi che governano il nostro universo? Con quali mezzi possiamo conoscerle? In quale modo una simile conoscenza ci aiuta a comprendere e forse a influenzare il mondo?

Sin dall’alba dell’umanità gli esseri umani sono stati profondamente interessati a domande come queste. Dapprima avevano cercato di comprendere le influenze che controllano il mondo rifacendosi a quelle cognizioni che la loro epoca metteva loro a disposizione. Avevano immaginato che qualunque cosa o chiunque controllasse il loro ambiente l’avrebbe fatto nello stesso modo con cui essi stessi si sarebbero sforzati di controllare le cose: inizialmente pensarono dunque che il loro destino fosse sotto l’influenza di Esseri che agivano in perfetto accordo con i loro propri impulsi umani. Impulsi quali l’orgoglio, l’amore, l’ambizione, la rabbia, la paura, la vendetta, la passione, il castigo, la lealtà, la capacità artistica. Di conseguenza, il corso degli eventi naturali – come la luce del sole, la pioggia, la tempesta, la carestia, la malattia o la pestilenza – avrebbe seguito i capricci di Dei o Dee spinti a loro volta da pulsioni umane. E la sola azione capace di esercitare un’influenza su questi eventi era l’appagamento degli Dei.

Gradualmente però schemi di differente natura cominciarono a dimostrarsi attendibili. L’esattezza del movimento del Sole nel cielo e l’evidente correlazione con l’alternarsi di giorno e notte offrirono l’esempio più ovvio; ma si vide anche che la posizione del Sole rispetto alla sfera celeste delle stelle era strettamente associata alla inarrestabile e regolare variazione delle stagioni, con una conseguente chiara influenza sul clima e sul comportamento della vegetazione e degli animali. Anche il movimento della Luna sembrava essere rigorosamente controllato, con le sue fasi determinate dalla sua relazione geometrica con il Sole. In quelle regioni del pianeta dove i mari aperti incontravano la terra, si notò che le maree avevano una regolarità strettamente governata dalla posizione (e fase) della Luna. Infine anche i moti apparenti dei pianeti, molto più complicati, cominciarono a svelare i loro segreti, rivelando un’estrema precisione e regolarità alla loro base. Se i Cieli erano davvero controllati dai capricci degli Dei, allora sembrava che gli stessi Dei agissero sotto l’incantesimo di precise leggi matematiche.

Allo stesso modo, le leggi che controllano alcuni fenomeni terrestri e che sembravano influenzate dai Cieli – come le variazioni giornaliere e annuali di temperatura, il flusso e riflusso degli oceani, la crescita delle piante – condividevano la regolarità matematica che sembrava guidare gli Dei. Ma questa relazione tra corpi celesti e comportamento terreno potrebbe apparire a volte esagerata o mal compresa e di conseguenza assumere un’importanza eccessiva, portando così agli aspetti occulti e mistici dell’astrologia. Furono necessari molti secoli prima che il rigore del sapere scientifico permettesse di districare le vere influenze dei Cieli da quelle puramente ipotetiche e mistiche. Fu tuttavia evidente fin dai primissimi tempi che simili influenze esistevano davvero e che, di conseguenza, le leggi matematiche dei Cieli devono avere importanza anche sulla Terra.

In modo apparentemente indipendente da ciò, si percepì che vi erano altre regolarità nel comportamento degli oggetti terrestri. Una di queste era la tendenza di tutte le cose in una stessa zona a muoversi nella medesima direzione verso il basso, conformemente all’influenza che adesso chiamiamo gravità. Si osservò che qualche volta la materia si trasformava da una forma in un’altra, come nel caso della fusione del ghiaccio o dello scioglimento del sale, ma sembrava che la quantità totale di quella materia non cambiasse mai; questa è la legge che adesso chiamiamo conservazione della massa. Si notò inoltre che vi erano molti corpi materiali che avevano l’importante proprietà di mantenere la loro forma, fenomeno che fece sorgere l’idea di moto spaziale rigido. Divenne così possibile comprendere le relazioni spaziali in termini di una precisa e ben definita geometria – la geometria tridimensionale che adesso chiamiamo euclidea. Per di più, risultò che la nozione di «linea retta» in questa geometria era la medesima che era offerta dai raggi luminosi (o linee di mira). Queste idee possedevano una notevole precisione e bellezza ed ebbero grande fascino per gli antichi, proprio come per noi adesso.

Tuttavia, riguardo alla vita di ogni giorno, le implicazioni di questa precisione matematica per le azioni del mondo spesso apparivano banali e limitate, nonostante la matematica di per sé sembrasse rappresentare una profonda verità. Di conseguenza nei tempi antichi molte persone, affascinate dall’argomento, si fecero trasportare dall’immaginazione. In astrologia, per esempio, le figure geometriche spesso assunsero connotazioni mistiche e occulte, come i presunti poteri magici di pentagrammi ed eptagrammi. Si tentò persino di mettere in relazione, in modo del tutto ipotetico, i solidi platonici e gli stati elementari fondamentali della materia (vedi fig. 1.1). Così per molti secoli non si poté arrivare alle profonde conoscenze che ora abbiamo riguardo alle vere relazioni tra massa, gravità, geometria, moto planetario e comportamento della luce.

Fig. 1.1 - Un’associazione puramente di fantasia fatta dai Greci antichi tra i cinque solidi platonici e i quattro «elementi» (fuoco, aria, acqua e terra),assieme al firmamento celeste rappresentato dal dodecaedro.

Fig. 1.1 - Un’associazione puramente di fantasia fatta dai Greci antichi tra i cinque solidi platonici e i quattro «elementi» (fuoco, aria, acqua e terra),assieme al firmamento celeste rappresentato dal dodecaedro.

1.2 Verità matematica

I primi passi verso la comprensione delle vere influenze che controllano la Natura richiedevano di districare il vero dal puramente ipotetico. Ma gli antichi dovevano raggiungere altri risultati, prima di essere in grado di comprendere la Natura: quello che dovevano fare era innanzitutto scoprire il modo di districare il vero dall’ipotetico in matematica. Era necessario un procedimento per dire se una data affermazione matematica può essere ritenuta vera o meno. E finché tale questione preliminare non fosse stata determinata in modo ragionevole, vi sarebbe stata ben poca speranza di dedicarsi seriamente ai problemi più difficili, riguardanti le forze che controllano l’effettivo comportamento del mondo e le loro diverse relazioni con la verità matematica. La chiave per comprendere la Natura si trovava infatti in una matematica irrefutabile: la percezione di questo fatto fu forse la prima grande conquista della scienza.

Sebbene verità matematiche di vario genere fossero state congetturate sin dai tempi degli antichi Egizi e dei Babilonesi, la prima solida pietra angolare della comprensione matematica – e quindi della scienza stessa – fu posta soltanto quando i grandi filosofi greci Talete di Mileto (c. 625-c. 547 a. C.) e Pitagora¹ di Samo (c. 572-497 a. C.) introdussero la nozione di dimostrazione matematica. Sembra che Talete sia stato il primo a parlare della nozione di dimostrazione, ma che fu Pitagora il primo a utilizzarla per dimostrare cose che altrimenti non sarebbero state ovvie. Sembra anche che Pitagora abbia avuto la grande intuizione dell’importanza del numero e dei concetti aritmetici per il controllo delle azioni del mondo fisico. Si dice che giunse alla sua intuizione osservando la relazione tra le più belle armonie prodotte da lire e flauti e i semplici rapporti tra le lunghezze di corde vibranti o di tubi. Si dice anche che a lui si debba l’introduzione della «scala pitagorica», i cui rapporti numerici costituiscono le frequenze che determinano gli intervalli principali su cui è basata sostanzialmente la musica occidentale.² Il famoso teorema di Pitagora, che afferma che il quadrato costruito sull’ipotenusa di un triangolo rettangolo è uguale alla somma dei quadrati costruiti sugli altri due lati, mostra, forse più di qualunque altra cosa, che vi è davvero una precisa relazione tra l’aritmetica dei numeri e la geometria dello spazio fisico (vedi capitolo 2).

Pitagora ebbe una numerosa comunità di seguaci – i Pitagorici – nella città di Crotone, ma la loro influenza sul mondo esterno fu ostacolata dal fatto che tutti i membri avevano giurato di mantenere il segreto. Di conseguenza, molte delle loro dettagliate conclusioni sono andate perse: solo alcune di queste erano trapelate ugualmente, con disastrose conseguenze per le «talpe», in almeno un’occasione uccise per annegamento!

Nel lungo periodo, l’influenza dei Pitagorici sul progresso del pensiero umano è stata enorme. Per la prima volta, con la dimostrazione matematica, era possibile fare affermazioni significative di natura inconfutabile, così che esse sarebbero tanto vere oggi quanto lo erano al momento della loro formulazione, a prescindere da come la nostra conoscenza del mondo sia progredita da allora. La vera natura eterna della matematica stava cominciando a rivelarsi.

Ma che cos’è una dimostrazione? Una dimostrazione, in matematica, è un argomento ineccepibile che, impiegando soltanto i metodi del puro ragionamento logico, permette di dedurre la validità di una data asserzione matematica dalla validità, già stabilita, di altre asserzioni matematiche e da certe affermazioni primitive – gli assiomi – la cui validità è ritenuta evidente. Una volta che una simile asserzione matematica è stata stabilita in questo modo, è chiamata teorema.

Molti dei teoremi cui i Pitagorici erano interessati erano di natura geometrica. Altri erano semplicemente asserzioni sui numeri. Quelli che riguardavano soltanto numeri hanno una validità inequivocabile anche oggi, proprio come l’avevano al tempo di Pitagora. Cosa dire dei teoremi geometrici che i Pitagorici avevano ottenuto usando i loro procedimenti di dimostrazione matematica? Anch’essi hanno una chiara validità oggigiorno, eppure c’è un problema a complicare le cose. È una questione la cui natura è più comprensibile a noi, dal nostro moderno osservatorio privilegiato, rispetto a quanto lo fosse al tempo di Pitagora. Gli antichi conoscevano solo un tipo di geometria, in altre parole quella che ora chiamiamo geometria euclidea, ma adesso noi ne conosciamo molti altri tipi. Così, nel prendere in considerazione i teoremi geometrici dell’antica Grecia, diventa importante specificare che la nozione di geometria cui ci si riferisce è proprio la geometria di Euclide. (Nel § 2.4, dove sarà dato un esempio importante di geometria non euclidea, sarò più esplicito su tali questioni.)

La geometria euclidea è una specifica struttura matematica, con propri specifici assiomi (che includono alcune asserzioni meno sicure, chiamate postulati), che offriva un’eccellente approssimazione di un particolare aspetto del mondo fisico. Questo era l’aspetto di realtà, ben familiare agli antichi greci, che faceva riferimento alle leggi che reggono la geometria di oggetti rigidi e le loro relazioni con altri oggetti rigidi, quando sono mossi nello spazio tridimensionale. Alcune di queste proprietà erano così familiari e coerenti che tendevano a essere ritenute verità matematiche «ovvie» ed erano prese come assiomi (o postulati). Come vedremo nei capitoli 17-19 e nei §§27.8 e 27.11, la relatività generale di Einstein – e anche la geometria di Minkowsky della relatività speciale – forniscono geometrie per l’universo fisico che sono diverse, ma tuttavia più precise della pur straordinariamente precisa geometria di Euclide. Dobbiamo quindi valutare bene, quando prendiamo in considerazione asserzioni geometriche, se sia possibile credere che gli «assiomi» siano, in qualsiasi senso, effettivamente veri.

Ma che cosa significa «vero» in questo contesto? Questa difficile questione fu apprezzata dal grande filosofo greco Platone che visse ad Atene circa dal 429 a. C. al 347 a. C., più o meno un secolo dopo Pitagora. Platone chiarì che le asserzioni matematiche – le cose che potevano essere ritenute incontestabilmente vere – si riferivano non a effettivi oggetti fisici (come gli approssimativi quadrati, triangoli, cerchi, sfere e cubi che potevano essere disegnati sulla sabbia, o costruiti con legno o pietra) ma a certe entità idealizzate, o idee. Egli immaginò che queste entità ideali abitassero un altro mondo, distinto dal mondo fisico. Oggigiorno possiamo fare riferimento a questo mondo come al mondo platonico delle forme matematiche. Le strutture fisiche, come i quadrati, i cerchi o i triangoli ritagliati dal papiro o tracciati su una superficie piatta, o forse i cubi, i tetraedri o le sfere scolpiti nel marmo, potrebbero essere rigorosamente conformi a questi ideali, ma soltanto in modo approssimato. I reali quadrati, cubi, cerchi, sfere, triangoli matematici non farebbero parte del mondo fisico, ma risiederebbero nel mondo matematico delle forme idealizzate di Platone.

1.3 Il mondo matematico di Platone è «reale»?

Questa fu un’idea straordinaria per quell’epoca, e si è rivelata molto potente. Ma il mondo matematico platonico esiste effettivamente, in qualsiasi senso? Molti tra filosofi e persone comuni potrebbero ritenere un simile «mondo» una perfetta finzione, un esclusivo prodotto della nostra sfrenata immaginazione. Tuttavia il punto di vista platonico ha davvero un immenso valore. Ci dice di prestare attenzione a distinguere le esatte entità matematiche dalle approssimazioni che vediamo intorno a noi nel mondo delle cose fisiche. Inoltre ci fornisce lo schema in base al quale la scienza moderna ha proceduto da allora. Gli scienziati suggeriscono modelli del mondo – o piuttosto di certi aspetti del mondo – e questi modelli possono essere testati contro osservazioni precedenti e contro i risultati di esperimenti accuratamente progettati. I modelli sono ritenuti appropriati se superano questi rigorosi esami e se, oltre a ciò, sono strutture internamente coerenti. Per la nostra attuale discussione, il punto importante riguardo questi modelli è che essi sono fondamentalmente modelli matematici puramente astratti. La questione stessa della coerenza interna di un modello scientifico, in particolare, richiede che il modello sia esattamente specificato. Questa precisione esige che il modello sia matematico, perché altrimenti non si può essere sicuri che tali questioni abbiano risposte ben definite.

Se al modello in sé viene assegnato qualsiasi genere di «esistenza», allora questa esistenza è collocata nel mondo platonico delle forme matematiche. Naturalmente, si potrebbe assumere un punto di vista opposto: e precisamente che il modello in sé esista soltanto nelle nostre menti, invece di ritenere che il mondo di Platone sia in un qualsiasi senso assoluto e «reale». Tuttavia si possono raggiungere significativi risultati postulando che le strutture matematiche abbiano una propria realtà. Le nostre menti individuali, infatti, sono notoriamente imprecise, inaffidabili e incoerenti nei loro giudizi. La precisione, l’affidabilità e la coerenza, che le nostre teorie scientifiche richiedono, esigono qualcosa che vada oltre ciascuna delle nostre labili menti individuali. Nella matematica troviamo una consistenza decisamente maggiore rispetto a quella che può trovarsi in una qualunque mente particolare. Tutto ciò non si rivolge a qualcosa al di fuori di noi e a una realtà che si trova al di là di ciò che ciascun individuo può raggiungere?

Nonostante ciò, si potrebbe ancora assumere il punto di vista alternativo che il mondo matematico non abbia alcuna esistenza indipendente e consista soltanto di certe idee, distillate dalle nostre menti, talmente degne di fiducia che hanno conquistato il consenso di tutti. Ma anche questo punto di vista è manchevole sotto molti riguardi. Il «consenso di tutti», per esempio, significa veramente questo o significa il «consenso di quelli che sono saggi» o il «consenso di tutti quelli che hanno un dottorato in matematica» (non di grande utilità al tempo di Platone) e che hanno il diritto di azzardare un’opinione «autorevole»? Sembra che qui vi sia un pericolo di circolarità; infatti, per giudicare se qualcuno è o non è «saggio» occorre basarsi su qualche criterio esterno. E lo stesso avviene per il significato di «autorevole», a meno che non si adotti qualche criterio di natura non scientifica, come «l’opinione della maggioranza» (e si dovrebbe chiarire che l’opinione della maggioranza, per quanto possa essere importante per un governo democratico, non dovrebbe assolutamente essere impiegata come il criterio di accettabilità scientifica). Sembra proprio che la matematica abbia una forza che va ben al di là di ciò che qualsiasi singolo matematico è capace di percepire. Quelli che lavorano in questo campo, siano essi attivamente impegnati nella ricerca matematica o usino solo risultati ottenuti da altri, hanno di solito la sensazione di essere soltanto esploratori in un mondo che giace oltre loro stessi, un mondo che possiede un’obiettività che trascende la semplice opinione, sia che tale opinione sia loro o la congettura di altri, non importa quanto esperti.

Può essere d’aiuto sistemare in una maniera differente le argomentazioni a favore dell’esistenza del mondo platonico. Ciò che intendo con il termine «esistenza» è realmente solo l’obiettività della verità matematica. L’esistenza platonica, a mio modo di vedere, fa riferimento all’esistenza di un oggettivo modello esterno che non dipende dalle nostre opinioni individuali e neppure dalla nostra particolare cultura. Una simile «esistenza» potrebbe anche riferirsi a oggetti diversi dalla matematica, come la morale o l’estetica (cfr. §1.5), ma qui m’interesso solo all’obiettività matematica, che sembra essere una questione molto più chiara.

Lasciatemi illustrare tale questione prendendo in considerazione un famoso esempio di verità matematica, e lasciatemi collegarlo alla questione dell’obiettività. Nel 1637 Pierre de Fermat fece la sua famosa asserzione ora nota come «Ultimo Teorema di Fermat» (nessuna potenza ennesima positiva³ può essere la somma di due altre potenze ennesime positive, se n è un numero intero più grande di 2), che poi trascrisse sul margine della sua copia di Arithmetica, un libro scritto nel terzo secolo dal matematico greco Diofanto. Su questo margine Fermat scrisse anche: «Ho trovato una dimostrazione veramente notevole che questo margine non può contenere». L’asserzione matematica di Fermat rimase non confermata per più di 350 anni, nonostante i grandi sforzi di molti eccellenti matematici. Solo nel 1995 Andrew Wiles ha trovato una dimostrazione (che dipende da precedenti lavori di altri matematici) che è stata accettata come un valido argomento dalla comunità scientifica.

Ora dobbiamo considerare che l’asserzione di Fermat sia sempre stata vera, ancora prima della reale formulazione dello stesso Fermat, oppure che la sua validità sia una questione puramente culturale, dipendente dagli standard soggettivi della comunità dei matematici? Tentiamo di supporre che la validità dell’affermazione di Fermat sia, in effetti, una questione soggettiva. Non sarebbe stata allora un’assurdità per un matematico X presentarsi con un effettivo e specifico controesempio all’asserzione di Fermat, purché X avesse fatto questo prima del 1995.⁴ In tali circostanze la comunità matematica avrebbe dovuto accettare la correttezza del controesempio di X. Da allora in avanti qualsiasi sforzo da parte di Wiles di dimostrare l’asserzione di Fermat sarebbe stato infruttuoso, per il motivo che X è arrivato per primo e, a causa di ciò, l’asserzione di Fermat sarebbe ora falsa! Inoltre potremmo chiederci ulteriormente se, in conseguenza della correttezza dell’imminente controesempio di X, lo stesso Fermat avrebbe dovuto necessariamente essere in errore nel credere alla fondatezza della sua «veramente notevole dimostrazione», quando scrisse la sua nota a margine. Dal punto di vista soggettivo della verità matematica, probabilmente Fermat aveva una valida dimostrazione (che sarebbe stata allora accettata dai suoi pari, se l’avesse rivelata) e fu la sua riservatezza a consentire che X ottenesse più tardi un controesempio! Io penso che virtualmente tutti i matematici, a prescindere dagli atteggiamenti professati rispetto al «platonismo», considererebbero simili possibilità palesemente assurde.

Potrebbe anche darsi, naturalmente, che l’argomento di Wiles contenga in realtà un errore e che l’asserzione di Fermat sia davvero falsa. O vi potrebbe essere un errore fondamentale nell’argomento di Wiles, ma nonostante ciò l’asserzione di Fermat sarebbe vera. O potrebbe essere che l’argomento di Wiles sia essenzialmente corretto pur contenendo «passaggi non rigorosi» che non sarebbero all’altezza dello standard di qualche futura regola d’accettabilità matematica. Tali questioni non si applicano però al punto che qui sto trattando. Il problema è l’obiettività dell’asserzione di Fermat in sé e per sé, non se la particolare dimostrazione di essa (o della sua negazione) da parte di qualcuno possa risultare convincente alla comunità matematica di qualunque particolare epoca.

Si dovrebbe forse precisare che, dal punto di vista della logica matematica, l’asserzione di Fermat è effettivamente un’affermazione matematica di tipo particolarmente semplice,⁵ la cui oggettività è piuttosto evidente. Soltanto una piccolissima minoranza⁶ di matematici riterrebbe che la verità di simili affermazioni sia in qualunque modo «soggettiva» – anche se vi potrebbe essere un po’ di soggettività sul genere d’argomento che sarebbe ritenuto convincente. A ogni modo, vi sono altri tipi d’affermazione matematica la cui verità potrebbe plausibilmente essere ritenuta una «questione d’opinione». L’affermazione di questo tipo meglio conosciuta è forse l’assioma di scelta. Al momento non è importante per noi sapere che cosa sia l’assioma di scelta. Qui è citato solo come esempio. La maggior parte dei matematici considererebbe probabilmente l’assioma di scelta come «ovviamente vero», mentre altri lo possono ritenere un’asserzione alquanto discutibile, che potrebbe persino essere falsa (io personalmente sono orientato, in una certa misura, verso questo secondo punto di vista). Altri ancora la riterrebbero un’asserzione la cui «verità» è una pura questione d’opinione o, piuttosto, qualcosa che può essere trattato differentemente, in base a quale sia il sistema d’assiomi e di regole di procedura (un «sistema formale»; vedi §16.6) a cui si sceglie di aderire. I matematici che sostengono quest’ultimo punto di vista (ma che accettano l’oggettività della verità d’affermazioni matematiche particolarmente evidenti, come l’asserzione di Fermat appena discussa) sarebbero dei platonici relativamente deboli. Quelli che aderiscono all’oggettività, per quanto riguarda la verità dell’assioma di scelta, sarebbero più fortemente platonici.

Ritornerò sull’assioma di scelta nel §16.3, poiché è una questione che ha alcune relazioni con la matematica alla base del comportamento del mondo fisico, nonostante non sia molto trattata nella teoria fisica. Per il momento, sarà appropriato non preoccuparsi troppo di tale questione. Se l’assioma di scelta può essere definito in un modo o nell’altro da qualche forma appropriata d’inoppugnabile ragionamento matematico,⁷ allora la sua verità è davvero una questione interamente oggettiva, ed essa, o la sua negazione, appartiene al mondo platonico, nel senso in cui io interpreto il termine «mondo platonico». Se l’assioma di scelta è, d’altra parte, una pura questione d’opinione o di decisione arbitraria, allora il mondo platonico delle forme matematiche assolute non contiene né l’assioma di scelta né la sua negazione (anche se potrebbe contenere asserzioni nella forma «una certa cosa consegue dall’assioma di scelta» o «l’assioma di scelta è un teorema secondo le regole di un certo sistema matematico»).

Le asserzioni matematiche che possono appartenere al mondo platonico sono quelle oggettivamente vere. In verità, io riterrei che l’oggettività matematica sia il reale argomento del platonismo matematico. Dire che un’asserzione matematica ha un’esistenza platonica significa soltanto affermare che è vera in senso oggettivo. Una discussione simile si applica a nozioni matematiche – come il concetto del numero 7, per esempio, o la regola di moltiplicazione dei numeri interi o l’idea di un insieme contenente un numero infinito d’elementi – che hanno tutte un’esistenza platonica perché sono nozioni oggettive. L’esistenza platonica, secondo il mio modo di pensare, è semplicemente una questione di oggettività e, di conseguenza, non dovrebbe essere ritenuta qualcosa di «mistico» o «non scientifico», nonostante alcune persone la pensino in questo modo.

Tuttavia, come nel caso dell’assioma di scelta, la questione se qualche particolare proposta di un’entità matematica debba o non debba essere considerata come dotata di un’esistenza oggettiva può essere delicata e qualche volta tecnica. Nonostante ciò, non è certamente necessario essere matematici per apprezzare la generale robustezza di molti concetti matematici. Nella fig. 1.2 ho rappresentato alcune piccole porzioni di quella famosa entità matematica nota come insieme di Mandelbrot. Questo insieme ha una struttura straordinariamente elaborata, ma non dovuta ad alcun disegno umano. Il fatto notevole è che questa struttura è definita da una regola matematica di particolare semplicità. Ritorneremo esplicitamente su questo punto nel §4.5, perché il tentativo di presentare questa regola in dettaglio adesso ci distrarrebbe dai nostri attuali scopi.

Il punto che desidero mostrare è che nessuno, neppure lo stesso Benoit Mandelbrot quando per primo prese visione delle incredibili complicazioni nei dettagli più fini dell’insieme, aveva alcuna vera idea preconcetta della sua straordinaria ricchezza. L’insieme di Mandelbrot non è stato certamente un’invenzione di qualche mente umana. L’insieme esiste oggettivamente soltanto nella matematica stessa. Se ha senso assegnare una reale esistenza all’insieme di Mandelbrot, questa esistenza non è nelle nostre menti, perché nessuno può afferrare completamente l’infinita varietà e l’illimitata complicazione di questo insieme. La sua esistenza non può neppure trovarsi nella moltitudine di tabulati sfornati dai computer che cominciano a catturare parte della sua incredibile sofisticazione e della ricchezza di dettagli, poiché questi tabulati possono al più catturare un’ombra di un’approssimazione all’insieme. Esso, tuttavia, ha una forza al di là d’ogni dubbio; la stessa struttura, infatti, si rivela – in tutti i suoi dettagli percepibili, con sempre maggiore finezza quanto più è esaminato da vicino – qualunque sia il matematico o il computer che lo esamina. La sua esistenza può trovarsi solo nel mondo platonico delle forme matematiche.

Mi rendo conto che vi sono ancora molti lettori che hanno difficoltà ad assegnare alle strutture matematiche qualche genere di reale esistenza; a questi chiedo solo di allargare la loro nozione di ciò che intendono per «esistenza». Le forme matematiche del mondo platonico non hanno evidentemente lo stesso tipo di esistenza dei comuni oggetti fisici, come tavoli o sedie. Non hanno una posizione spaziale e non esistono nel tempo. Si deve pensare che le nozioni matematiche oggettive siano entità atemporali, che non devono essere considerate come esistenti soltanto nel momento in cui sono percepite dagli esseri umani per la prima volta. Le particolari volute dell’insieme di Mandelbrot, che sono raffigurate in fig. 1.2c o in fig. 1.2d, non hanno raggiunto l’esistenza allorché sono state viste per la prima volta sullo schermo di un computer o su un tabulato; questo non si è verificato neppure quando per la prima volta è stata avanzata l’idea generale alla base dell’insieme di Mandelbrot – in realtà il primo non fu Mandelbrot, ma R. Brooks e J. P. Matelski, nel 1981, o forse ancora prima. Infatti, certamente né Brooks né Matelski, né all’inizio neppure Mandelbrot, avevano alcuna reale idea degli elaborati disegni che vediamo in fig. 1.2c e in fig. 1.2d. Quei disegni «esistevano» già dall’inizio dei tempi in senso potenziale e atemporale, e si sarebbero poi rivelati esattamente nella forma in cui li percepiamo oggigiorno, non importa in quale istante e in quale luogo un essere senziente avrebbe scelto di esaminarli.

Fig. 1.2 - (a) L’insieme di Mandelbrot. (b), (c) e (d) Alcuni dettagli, che illustrano le esplosioni di quelle regioni contrassegnate nello stesso modoin fig. 1.2a, ingranditi per i rispettivi fattori lineari 11.6, 168.9 e 1042.

Fig. 1.2 - (a) L’insieme di Mandelbrot. (b), (c) e (d) Alcuni dettagli, che illustrano le esplosioni di quelle regioni contrassegnate nello stesso modoin fig. 1.2a, ingranditi per i rispettivi fattori lineari 11.6, 168.9 e 1042.

1.4 Tre mondi e tre profondi misteri

Quindi, l’esistenza matematica è diversa non solo dall’esistenza fisica ma anche da un’esistenza assegnata dalle nostre percezioni mentali. Vi è tuttavia una profonda e misteriosa connessione con ciascuna delle altre due forme d’esistenza: quella fisica e quella mentale. In fig. 1.3 ho schematicamente indicato tutte e tre queste forme d’esistenza – quella fisica, quella mentale e quella matematica platonica – come entità appartenenti a tre «mondi» separati, qui rappresentati da sfere. Sono anche indicate le misteriose connessioni tra questi mondi, e devo dire che nel tracciare questo diagramma ho imposto al lettore alcune delle mie credenze, o dei miei pregiudizi, riguardo a questi misteri.

Fig. 1.3 - I tre «mondi» – quello matematico platonico, quello fisico e quello mentale – e i tre profondi misteri nelle connessioni tra di loro.

Fig. 1.3 - I tre «mondi» – quello matematico platonico, quello fisico e quello mentale – e i tre profondi misteri nelle connessioni tra di loro.

Si può osservare, riguardo al primo di questi misteri – che collega il mondo matematico platonico con quello fisico –, che io accetto che soltanto una piccola parte del mondo matematico sia importante per il funzionamento del mondo fisico. È certo che oggigiorno la maggior parte delle attività dei matematici puri non abbia alcuna ovvia connessione con la fisica, e neppure con qualsiasi altra scienza (vedi §34.9), sebbene spesso possiamo essere sorpresi da inaspettate e importanti applicazioni. Analogamente, a proposito del secondo mistero, per mezzo del quale le facoltà mentali vengono in associazione con certe strutture fisiche (più specificamente, con cervelli umani sani e vigili), non insisto sul fatto che la maggior parte di tali strutture fisiche necessiti di persuadere l’intelligenza. Mentre il cervello di un gatto può davvero evocare qualità mentali, non richiedo che la stessa cosa valga per una roccia. Per il terzo mistero, infine, considero evidente che solo una piccola frazione della nostra attività mentale riguardi necessariamente verità matematiche assolute! (Più probabilmente ci occupiamo dei molteplici piaceri, irritazioni, preoccupazioni, eccitazioni e cose simili che riempiono le nostre vite quotidiane.) Questi tre fatti sono rappresentati dalle scarse dimensioni della base della connessione di ciascun mondo con il successivo, quando i mondi nel diagramma sono presi in senso orario. È, tuttavia, nell’inclusione della totalità di ciascun mondo nell’ambito della sua connessione con il mondo precedente che rivelo i miei pregiudizi.

In questo modo, secondo la fig. 1.3, l’intero mondo fisico sembra essere come governato da leggi matematiche. Vedremo nei capitoli successivi come vi siano forti, sia pure incomplete, prove a supporto di questa tesi. Secondo questo punto di vista, tutte le cose nell’universo fisico sono davvero governate, in modo dettagliato e preciso, da principi matematici – forse da equazioni, come quelle di cui verremo a conoscenza nei capitoli successivi, o forse da alcune future nozioni matematiche fondamentalmente diverse da quelle che oggi etichettiamo con il termine «equazioni». Se questo è vero, allora perfino le nostre azioni fisiche sarebbero interamente soggette a un tale controllo matematico finale, dove questo «controllo» potrebbe ancora consentire un certo comportamento casuale governato da rigorosi principi probabilistici.

Molti si sentono a disagio con asserzioni di questo genere, e devo confessare che io stesso provo questa sensazione. Tuttavia sono pregiudizialmente favorevole a questa natura generale, poiché non si vede come possa essere tracciato un confine che separi le azioni fisiche sotto controllo matematico da quelle che potrebbero esserne al di fuori. A mio parere, il disagio mio e di molti lettori su tale questione deriva in parte da una nozione molto ristretta di ciò che il «controllo matematico» potrebbe comportare. Questo libro si propone tra l’altro di accennare e rivelare al lettore qualcosa della straordinaria ricchezza, potenza e bellezza che può scaturire una volta che sono state scoperte le giuste nozioni matematiche.

Nell’insieme di Mandelbrot, com’è illustrato in fig. 1.2, possiamo iniziare ad avere un’idea della portata e della bellezza di tali scoperte. Anche queste strutture, però, occupano solo un ambito molto ristretto della matematica, in cui il comportamento è governato da uno stretto controllo computazionale. Al di là di quest’ambito vi è un’incredibile ricchezza potenziale. Che cosa penso realmente della possibilità che tutte le mie azioni, e quelle dei miei amici, siano in definitiva governate da principi matematici di questo genere? Ci posso convivere. In verità, preferirei che queste azioni siano controllate da qualcosa che risiede in questo favoloso mondo matematico platonico, piuttosto che soggette al genere di semplicistici motivi, come la ricerca del piacere, l’avidità personale o la violenza aggressiva, che molti potrebbero sostenere essere le implicazioni di un punto di vista rigorosamente scientifico. Immagino tuttavia che moltissimi lettori potrebbero ancora avere difficoltà ad accettare che tutte le azioni nell’universo siano interamente soggette a leggi matematiche. Molti, analogamente, potrebbero muovere obiezioni a due altri miei pregiudizi che sono impliciti in fig. 1.3. Potrebbero pensare, per esempio, che stia assumendo un atteggiamento scientifico troppo duro tracciando il mio diagramma in un modo che implica che tutte le facoltà mentali abbiano le loro radici nella fisicità. Questo è proprio un pregiudizio perché non possiamo esserne completamente sicuri, ma d’altro canto è vero che non abbiamo alcuna ragionevole prova scientifica dell’esistenza di «menti» senza alcuna base fisica. Inoltre molte persone con credenze religiose sosterrebbero fortemente la possibilità di menti fisicamente indipendenti e potrebbero appellarsi a ciò che ritengono essere una potente testimonianza di genere diverso da quella rivelata dalla comune scienza.

Un altro mio pregiudizio si riflette nel fatto che in fig. 1.3 ho rappresentato l’intero mondo platonico come inserito nell’ambito delle facoltà mentali. Voglio così indicare che – almeno in linea di principio – non vi sono verità matematiche che siano oltre la portata della ragione. Naturalmente vi sono affermazioni matematiche (perfino semplici somme aritmetiche) che sono così complicate che nessuno avrebbe la forza d’animo per portare a termine il ragionamento necessario. Tali cose, tuttavia, sarebbero potenzialmente alla portata della mente umana e sarebbero coerenti con il significato della fig. 1.3, come mi sono proposto di rappresentarlo. Nondimeno si deve considerare che vi potrebbero essere altre affermazioni matematiche al di fuori del potenziale ambito della ragione, e queste violerebbero il proposito della fig. 1.3. (Tale questione sarà considerata in maggior dettaglio in §16.6, dove sarà discussa la sua relazione con il famoso teorema d’incompletezza di Gödel.)⁸

Nella fig. 1.4, come concessione a quelli che non condividono tutti i miei personali pregiudizi su tali questioni, ho ridisegnato le connessioni tra i tre mondi per consentire tutte e tre le possibili violazioni dei miei pregiudizi. Di conseguenza si tiene conto ora anche della possibilità di azioni fisiche al di fuori dell’ambito del controllo matematico. Il diagramma consente anche di credere che potrebbero esistere facoltà mentali non radicate in strutture fisiche. Infine, permette l’esistenza di asserzioni matematiche vere, la cui verità sia in linea di principio inaccessibile alla ragione e al discernimento.

Questo disegno presenta ulteriori misteri che superano addirittura quelli che ho ammesso nel mio disegno preferito del mondo, come è stato rappresentato in fig. 1.3. A mio parere, il punto di vista scientifico più rigorosamente organizzato della fig. 1.3 possiede già abbastanza misteri. Questi misteri non sono rimossi dal passaggio allo schema meno rigido della fig. 1.4, in quanto restano un profondo enigma le ragioni per cui al mondo dovrebbero applicarsi leggi matematiche con tale fenomenale precisione. (Potremo intravedere qualcosa della straordinaria accuratezza delle teorie fisiche fondamentali in §19.8, §26.7 e §27.13.) Inoltre, non sono soltanto la precisione ma anche la sottile sofisticazione e la bellezza matematica di queste riuscite teorie a essere profondamente misteriose. Un altro profondo mistero è anche il modo in cui materiale fisico adeguatamente organizzato – e qui faccio specifico riferimento a cervelli umani (o animali) viventi – possa in qualche modo fare apparire come per magia la facoltà mentale della consapevolezza cosciente. Infine, vi è anche un mistero riguardo il modo in cui percepiamo la verità matematica. Non è solo il fatto che i nostri cervelli siano programmati per «calcolare» in modi affidabili; vi è qualcosa di molto più profondo di questo nelle intuizioni che persino il più modesto tra noi possiede quando apprezza, per esempio, il reale significato dei termini «zero», «uno», «due», «tre», «quattro», eccetera.⁹

Fig. 1.4 - La fig. 1.3 ridisegnata in modo che siano consentite violazioni di tre dei pregiudizi dell’autore.

Fig. 1.4 - La fig. 1.3 ridisegnata in modo che siano consentite violazioni di tre dei pregiudizi dell’autore.

Di alcuni dei problemi che riguardano questo terzo mistero ci occuperemo nel prossimo capitolo (e più esplicitamente in §§16.5,6) in relazione alla nozione di dimostrazione matematica. La spinta principale di questo libro ha a che fare però con il primo di questi misteri: la notevole relazione tra la matematica e il reale comportamento del mondo fisico. Non si può apprezzare adeguatamente lo straordinario potere della scienza moderna senza qualche conoscenza di queste idee matematiche. Molti lettori, senza dubbio, si scoraggeranno alla prospettiva di dover venire a patti con la matematica per apprezzare la scienza; tuttavia, sono ottimista sul fatto che non troveranno il diavolo così brutto come temono. Spero inoltre di poter persuadere il lettore che, a dispetto delle sue precedenti esperienze, la matematica può essere divertente!

Non mi occuperò specificamente qui del secondo dei misteri raffigurati nelle figg. 1.3 e 1.4, vale a dire il problema di come le facoltà mentali – più in particolare la consapevolezza cosciente – siano connesse ad appropriate strutture fisiche (anche se sfiorerò questo profondo problema in §34.7). L’esplorazione dell’universo fisico e delle leggi matematiche a esso associate ci terrà già abbastanza occupati; per di più, i problemi riguardanti le facoltà mentali sono profondamente controversi e ci distrarrebbero dallo scopo di questo libro. Forse però un commento non sarebbe fuori luogo. A mio parere, esiste una scarsa probabilità di arrivare a una profonda comprensione della natura della mente senza ampliare prima la conoscenza delle basi stesse della realtà fisica. Come risulterà chiaro dalle discussioni che saranno presentate nei capitoli successivi, io credo che siano necessarie grandi rivoluzioni nelle nostre conoscenze fisiche. Finché queste rivoluzioni non avverranno è soltanto molto ottimistico, secondo me, aspettarsi che molti reali progressi possano essere fatti nella comprensione della reale natura dei processi mentali.¹⁰

1.5 Il Buono, il Vero e il Bello

Riguardo ciò, vi è un ulteriore insieme di questioni sollevate dalle figg. 1.3 e 1.4. Ho considerato la nozione platonica di «mondo di forme ideali» solo nel senso ristretto di forme matematiche. La matematica si occupa fondamentalmente di un particolare ideale, la Verità. Platone avrebbe sostenuto che vi sono altri due fondamentali ideali assoluti, ossia quello del Bello e quello del Buono. Non sono affatto contrario ad ammettere l’esistenza di tali ideali e a considerare che il mondo platonico sia abbastanza esteso per contenere assoluti di questa natura.

In seguito incontreremo i nessi tra verità e bellezza che illuminano e confondono i problemi della scoperta e dell’accettazione di teorie fisiche (vedi, in particolare, §§34.2,3,9; vedi anche fig. 34.1). Inoltre, a parte l’indubbio (anche se spesso ambiguo) ruolo della bellezza per la matematica alla base del funzionamento del mondo fisico, i criteri estetici sono fondamentali per lo sviluppo di idee matematiche in sé e per sé, fornendo sia lo stimolo verso la scoperta sia una potente guida verso la verità. Supporrei addirittura che un importante elemento nella comune convinzione del matematico che un mondo platonico esterno abbia un’esistenza realmente indipendente da noi provenga dalla straordinariamente inaspettata bellezza nascosta che le idee stesse così spesso rivelano.

Di rilevanza meno ovvia qui – ma di evidente importanza nel contesto più ampio – è la questione di un ideale assoluto di moralità: che cosa è buono e che cosa è cattivo, e come le nostre menti percepiscono questi valori? La moralità ha una profonda connessione con il mondo mentale, poiché è così intimamente collegata ai valori assegnati da esseri coscienti e, in modo più importante, alla presenza della coscienza stessa. È difficile capire quale potrebbe essere il significato della moralità in assenza d’esseri senzienti. Quando la scienza e la tecnologia progrediscono, una comprensione delle circostanze fisiche in cui le facoltà mentali si manifestano diventa sempre più importante. Credo che sia più rilevante che mai, nell’attuale cultura tecnologica, che le questioni scientifiche non siano separate dalle loro implicazioni morali. Tuttavia tali questioni ci porterebbero troppo lontano dall’ambito di questo libro. Abbiamo bisogno di trattare la questione della distinzione del vero dal falso prima di poter tentare di applicare una tale comprensione alla distinzione del buono dal cattivo.

Vi è, infine, un ulteriore mistero riguardante la fig. 1.3 che ho lasciato per ultimo. Ho disegnato questa figura in modo da illustrare un paradosso. Come è possibile che, secondo i miei pregiudizi, ciascun mondo sembri includere tutto il mondo successivo? Non reputo che questo problema sia un motivo per abbandonare i miei pregiudizi, ma soltanto per dimostrare la presenza di un mistero, perfino più profondo, che trascende quelli che ho mostrato prima. Vi può essere un senso in cui i tre mondi non siano affatto separati, ma riflettano soltanto, individualmente, aspetti di una verità più profonda del mondo nella sua totalità, verità di cui attualmente abbiamo scarse cognizioni. Dobbiamo percorrere un lungo cammino prima che tali questioni siano adeguatamente chiarite.

Mi sono permesso di deviare un po’ dalle questioni che ci riguardano; lo scopo principale di questo capitolo è di sottolineare l’importanza fondamentale che la matematica ha nella scienza, sia antica sia moderna. Diamo ora un’occhiata al mondo platonico, o almeno a una parte relativamente piccola ma importante di questo mondo, di particolare rilevanza per la natura della realtà fisica.

Note

1. Sfortunatamente non si conosce quasi nulla di attendibile su Pitagora, la sua vita, i suoi seguaci e le loro opere. A Pitagora viene però riconosciuto di aver creato i rapporti semplici nell’armonia musicale. Vedi Burkert (1972). Ai pitagorici sono comunque attribuite molte cose importanti; impiegherò quindi il termine «pitagorico» semplicemente come un’etichetta, senza alcuna pretesa di esattezza storica.

2. Questa è la pura «scala diatonica» in cui le frequenze (in proporzione inversa alle lunghezze degli elementi vibranti) sono in rapporto 24:27:30:36:40:45:48, producendo molti casi di rapporti semplici, piacevoli all’orecchio. Le «note bianche» di un pianoforte moderno sono accordate (in base a un compromesso tra purezza pitagorica di armonia e facilità di variazioni di chiave) come approssimazioni a questi rapporti pitagorici, secondo la scala di temperamento equabile con frequenze relative 1 : α² : α⁴ : α⁵ : α⁷ : α⁹ : α¹¹ : α¹², dove (Nota: a⁵ significa la quinta potenza di α, cioè α × α × α × α × α. La quantità è la radice dodicesima di 2, quel numero che elevato alla dodicesima potenza è 2, cioè 2^1/12, così che α¹² = 2. Vedi note 1.3 e §5.2.)

3. Si ricordi dalla nota 2 che la potenza ennesima di un numero è quel numero moltiplicato n volte per se stesso. Così, la terza potenza di 5 è 125, scritta 5³ = 125; la quarta potenza di 3 è 81, scritta 3⁴ = 81, eccetera.

4. In effetti, mentre Wiles tentava di «riparare una falla», scoperta dopo la sua presentazione a Cambridge nel giugno del 1993, nella sua dimostrazione dell’ultimo teorema di Fermat, tra la comunità matematica si sparse la voce che Noam Elkies avesse trovato un controesempio all’asserzione di Fermat. Nel 1988, Elkies aveva scoperto un controesempio alla congettura di Eulero – cioè che non vi sono soluzioni positive dell’equazione x⁴ + y⁴ + z⁴ = w⁴ – dimostrandone così la falsità. Pertanto, non era impossibile che egli avesse dimostrato anche la falsità dell’asserzione di Fermat. Tuttavia, l’e-mail che aveva dato inizio a quelle voci era datata 1° aprile e il tutto si rivelò essere una burla perpetrata da Henry Darmon; vedi Singh (1997) pag. 293.

5. Tecnicamente è un Π ₁ – enunciato; vedi §16.6.

6. Mi rendo conto che facendo una tale asserzione cado nella mia stessa trappola, in un certo senso. Il problema non è se i matematici che assumono un’opinione soggettiva così estrema costituiscano una piccolissima minoranza o meno (e sicuramente io non ho fatto un’inchiesta accurata su questo punto): il problema è se una posizione così estrema possa essere realmente presa sul serio. Lascio che a giudicare sia il lettore.

7. Alcuni lettori potrebbero essere a conoscenza della dimostrazione di Gödel-Cohen secondo cui l’assioma di scelta è indipendente dagli assiomi standard della teoria degli insiemi (il sistema di assiomi di Zermelo-Fraenkel). Bisognerebbe chiarire che l’argomento di Gödel-Cohen non stabilisce di per sé se l’assioma di scelta sarà mai sistemato in un modo o nell’altro. Questo punto è messo in rilievo, per esempio, nella sezione finale del libro di Paul Cohen (1966), capitolo IV, §13, nonostante Cohen sia più esplicitamente interessato all’ipotesi del continuo che all’assioma di scelta; vedi §16.5.

8. Qui vi è forse qualcosa d’ironico per il fatto che un convinto antiplatonico, che crede che la matematica sia «tutta nella mente», debba anche credere – così sembra – che non vi siano affermazioni matematiche che, in linea di principio, siano al di là della ragione. Se l’ultimo teorema di Fermat, per esempio, fosse stato inaccessibile (in linea di principio) alla ragione, questo punto di vista antiplatonico non accorderebbe alcuna validità né alla sua verità né alla sua falsità, poiché una validità tale deriva solo dall’atto mentale di percepire una dimostrazione o una confutazione.

9. Vedi per esempio Penrose (1997).

10. Le mie personali opinioni riguardo al tipo di cambiamento necessario nel nostro punto di vista fisico, affinché le facoltà mentali coscienti vi possano essere incluse, sono espresse in Penrose (1989, 1994, 1997).

2.1 Il teorema di Pitagora

Consideriamo il problema della geometria. Che cosa sono davvero i diversi «tipi di geometria» cui abbiamo alluso nel capitolo precedente? Per prepararci a risolvere questo problema, ritorneremo al nostro incontro con Pitagora e prenderemo in considerazione il famoso teorema che porta il suo nome:¹ per qualsiasi triangolo rettangolo, il quadrato della lunghezza dell’ipotenusa (il lato opposto all’angolo retto) è uguale alla somma dei quadrati delle lunghezze degli altri due lati (fig. 2.1). Quali ragioni abbiamo per credere che questa asserzione sia vera? Come «dimostriamo» in realtà il teorema di Pitagora? Molti ragionamenti sono noti; io desidero prenderne in considerazione due, scelti per la loro particolare chiarezza, ciascuno dei quali ha una diversa enfasi.

Fig. 2.1 - Il teorema di Pitagora: per qualsiasi triangolo rettangolo, il quadrato della lunghezza dell’ipotenusa c è la somma dei quadrati delle lunghezze degli altri due lati a e b.

Fig. 2.1 - Il teorema di Pitagora: per qualsiasi triangolo rettangolo, il quadrato della lunghezza dell’ipotenusa c è la somma dei quadrati delle lunghezze degli altri due lati a e b.

Per il primo, esaminiamo la struttura illustrata nella fig. 2.2. Essa è interamente composta da quadrati di due diverse dimensioni. Si può ritenere «ovvio» che questa struttura possa essere indefinitamente continuata, e che quindi l’intero piano sia coperto, senza vuoti o sovrapposizioni, da quadrati di queste due dimensioni regolarmente ripetentisi. La natura ripetitiva di questa struttura è resa manifesta dal fatto che, se segniamo i centri dei quadrati più piccoli, essi formano i vertici di un altro sistema di quadrati, molto più grandi di entrambi i quadrati iniziali, ma inclinati rispetto a essi (fig. 2.3) e in grado di coprire da soli l’intero piano. Ciascuno di questi quadrati inclinati è contrassegnato esattamente nello stesso modo, cosicché i segni su questi quadrati si accordino per formare la struttura originaria a due quadrati. La stessa cosa avverrebbe se, invece di prendere i centri dei quadrati più piccoli, scegliessimo qualunque altro punto, insieme a tutti i suoi omologhi in tutta la struttura. La nuova struttura di quadrati inclinati è proprio la stessa di prima ma spostata senza rotazione, cioè per mezzo di un movimento chiamato traslazione. Per semplicità, possiamo ora scegliere come punto di partenza uno degli angoli della struttura originaria (vedi fig. 2.4).

Fig. 2.2 - Una tassellatura del piano con quadrati di due diverse dimensioni.

Fig. 2.2 - Una tassellatura del piano con quadrati di due diverse dimensioni.

Fig. 2.3 - I centri dei quadrati più grandi formano i vertici di un reticolo di quadrati ancora più grandi, inclinati di un certo angolo.

Fig. 2.3 - I centri dei quadrati più grandi formano i vertici di un reticolo di quadrati ancora più grandi, inclinati di un certo angolo.

Dovrebbe essere chiaro che l’area del quadrato inclinato deve essere uguale alla somma delle aree dei due quadrati più piccoli, vale a dire i pezzi in cui i contrassegni che suddividerebbero questo quadrato più grande possono, per qualunque punto di partenza per i quadrati inclinati, essere spostati, senza rotazione, finché si accordano a formare i due quadrati più piccoli (fig. 2.5). È inoltre evidente dalla fig. 2.4 che la lunghezza dello spigolo del quadrato inclinato è l’ipotenusa di un triangolo rettangolo i cui due altri lati hanno lunghezze uguali ai lati dei due quadrati più piccoli. Abbiamo così dimostrato il teorema di Pitagora: il quadrato sull’ipotenusa è uguale alla somma dei quadrati sugli altri due lati.

Tale ragionamento contiene davvero gli elementi essenziali per una semplice dimostrazione di questo teorema e ci offre inoltre qualche «motivo» per credere che il teorema debba essere vero, il che potrebbe non essere così ovvio con argomentazioni più formali, date da una successione di passi logici senza una chiara motivazione. Dovrebbe essere rilevato, a ogni modo, che sono state introdotte parecchie ipotesi implicite in questo ragionamento. La minore di queste ipotesi non è certamente quella che l’apparentemente ovvia struttura di quadrati che si ripetono, mostrata nella fig. 2.2 o persino nella fig. 2.6, sia effettivamente possibile dal punto di vista geometrico – o persino, in modo più critico, che un quadrato sia un qualcosa geometricamente possibile! Dopo tutto, che cosa intendiamo con il termine «quadrato»? Normalmente pensiamo che un quadrato sia una figura piana con lati tutti uguali e con angoli tutti retti. Che cos’è un angolo retto? Ebbene possiamo immaginare due rette che s’intersecano in un punto formando quattro angoli tutti uguali. Ciascuno di questi angoli uguali è allora un angolo retto.

Fig. 2.4 - Il reticolo di quadrati inclinati può essere spostato per mezzo di una traslazione, in questo caso in modo che i vertici del reticolo inclinato giacciano su vertici dell’originario reticolo dei due diversi quadrati, mostrando che la lunghezza del lato di un quadrato inclinato è l’ipotenusa di un triangolo rettangolo i cui due altri lati sono i lati dei due quadrati iniziali.

Fig. 2.4 - Il reticolo di quadrati inclinati può essere spostato per mezzo di una traslazione, in questo caso in modo che i vertici del reticolo inclinato giacciano su vertici dell’originario reticolo dei due diversi quadrati, mostrando che la lunghezza del lato di un quadrato inclinato è l’ipotenusa di un triangolo rettangolo i cui due altri lati sono i lati dei due quadrati iniziali.

Fig. 2.5 - Per qualsiasi particolare punto di partenza per il quadrato inclinato, come quello raffigurato, questi è diviso in pezzi che costituiscono i due quadrati più piccoli.

Fig. 2.5 - Per qualsiasi particolare punto di partenza per il quadrato inclinato, come quello raffigurato, questi è diviso in pezzi che costituiscono i due quadrati più piccoli.

Fig. 2.6 - Il familiare reticolo di quadrati eguali. Come sappiamo che esiste?

Fig. 2.6 - Il familiare reticolo di quadrati eguali. Come sappiamo che esiste?

Tentiamo ora di costruire un quadrato. Prendiamo tre segmenti di retta uguali AB, BC e CD, dove gli angoli ABC e BCD sono retti, D e A trovandosi dallo stesso lato della retta BC, come nella fig. 2.7.

Fig. 2.7 - Tentate di costruire un quadrato. Assumete che ABC e BCD siano angoli retti, con AB = BC = CD. Ne consegue che anche DA sia eguale a queste lunghezze e che anche DAB e CDA siano angoli retti?

Fig. 2.7 - Tentate di costruire un quadrato. Assumete che ABC e BCD siano angoli retti, con AB = BC = CD. Ne consegue che anche DA sia eguale a queste lunghezze e che anche DAB e CDA siano angoli retti?

Nasce la domanda: il segmento AD ha la stessa lunghezza degli altri tre segmenti? Inoltre, anche gli angoli DAB e CDA sono retti? Questi angoli dovrebbero essere uguali l’uno all’altro per ragioni di simmetria tra destra e sinistra nella figura, ma sono effettivamente angoli retti? Il fatto che lo siano ci sembra ovvio soltanto per la nostra familiarità con i quadrati, o forse perché possiamo ricordarci dai nostri studi scolastici qualche affermazione di Euclide che può essere impiegata per assicurarci che i lati BA e CD dovrebbero essere «paralleli» l’uno all’altro, e qualche affermazione che qualsiasi «trasversale» a un paio di parallele deve avere angoli corrispondenti uguali, là dove essa incontra le due parallele. Da ciò segue che l’angolo DAB dovrebbe essere uguale all’angolo complementare di ADC (cioè all’angolo EDC, nella fig. 2.7, essendo retto l’angolo ADE) oltre a essere, come sopra notato, uguale all’angolo ADC. Un angolo (ADC) può essere uguale al suo angolo complementare (EDC) soltanto se è un angolo retto. Dobbiamo anche dimostrare che il lato AD ha la stessa lunghezza di BC, ma anche questo è subito ottenuto, per esempio dalle proprietà delle trasversali alle rette parallele BA e CD. Così, con questo genere d’argomento euclideo, possiamo davvero provare l’effettiva esistenza di quadrati costituiti da angoli retti. Ma qui si cela un profondo problema.

2.2 I postulati di Euclide

Nel costruire la sua nozione di geometria, Euclide prestò particolare attenzione a quali fossero le ipotesi da cui dipendevano le sue dimostrazioni.² Si concentrò soprattutto nella distinzione di certe asserzioni chiamate assiomi – che ovviamente erano ritenute vere e che fondamentalmente erano definizioni di ciò che egli intendeva per punti, linee, eccetera – dai cinque postulati che erano invece assunzioni la cui validità sembrava meno certa, ma che apparivano essere veri per la geometria del nostro mondo. L’ultima di queste assunzioni, nota come quinto postulato di Euclide, era considerata meno ovvia delle altre e per molti secoli si pensò possibile trovare un modo di dedurla dagli altri postulati più evidenti. Il quinto postulato di Euclide è il cosiddetto postulato della parallela.

Prima di discutere il postulato della parallela, vale la pena di fare notare la natura degli altri quattro postulati di Euclide. Questi postulati riguardano la geometria del piano (euclideo), anche se Euclide, nelle sue opere successive, si occupò anche dello spazio tridimensionale. Gli elementi fondamentali della sua geometria piana sono punti, linee rette e cerchi. In questo libro riterrò la «linea retta» (o semplicemente la retta) indefinitamente estesa in entrambe le direzioni; altrimenti parlerò di «segmenti». Il primo postulato di Euclide asserisce effettivamente che vi è un (unico) segmento di retta che unisce due punti qualsiasi. Il suo secondo postulato asserisce l’illimitata estendibilità di qualunque segmento di retta. Il suo terzo postulato asserisce l’esistenza di un cerchio con centro qualsiasi e qualunque raggio. Infine, il suo quarto postulato asserisce l’uguaglianza di tutti gli angoli retti.³

Da un punto di vista moderno, alcuni di questi postulati appaiono un po’ strani; in particolare il quarto, ma dobbiamo tenere in considerazione l’origine delle idee alla base della geometria d’Euclide. Egli era interessato fondamentalmente al movimento di corpi rigidi ideali e alla nozione di congruenza che segnalava quando uno di questi corpi rigidi ideali era mosso in coincidenza con un altro. L’uguaglianza tra un angolo retto appartenente a un corpo e quello appartenente a un altro aveva a che fare con la possibilità di muoverne uno in modo che le rette costituenti il suo angolo retto andassero a coincidere con le rette costituenti l’angolo retto dell’altro. Il quarto postulato, in effetti, asserisce l’isotropia e l’omogeneità dello spazio, così che una figura in un posto possa avere la «stessa» (cioè congruente) forma geometrica di una figura in qualche altro posto. Il secondo e terzo postulato esprimono l’idea che lo spazio è indefinitamente estendibile e senza «interruzioni», mentre il primo esprime la natura fondamentale di un segmento di retta. Anche se la maniera di Euclide di esaminare la geometria era piuttosto differente dalla nostra attuale, i suoi primi quattro postulati racchiudono fondamentalmente l’odierna nozione di spazio metrico (bidimensionale) con completa omogeneità e isotropia, e di estensione infinita. In effetti, un tale quadro sembra essere in stretto accordo con la natura spaziale su scala molto grande del reale universo, secondo la moderna cosmologia, come vedremo in §27.11 e in §28.10.

Quale è allora la natura del quinto postulato di Euclide, il postulato della parallela? Esso asserisce, nella formulazione essenzialmente dovuta a Euclide, che se due segmenti di retta a e b in un piano intersecano entrambi un’altra retta c (cosicché c è detta una trasversale di a e b) in modo che la somma degli angoli interni dalla stessa parte di c sia minore di due angoli retti, allora a e b, se prolungati a sufficienza da quella parte di c, s’intersecheranno in qualche punto (vedi fig. 2.8a). Una forma equivalente di questo postulato (chiamato talvolta assioma di Playfair) asserisce che, per qualunque retta e per qualunque punto esterno a essa, vi è un’unica retta passante per quel punto e parallela alla prima retta (vedi fig. 2.8b). Rette «parallele» sono qui due rette nello stesso piano che non s’intersecano (si ricordi che le mie «rette» sono entità indefinitamente estese e non i «segmenti di retta» di Euclide).^[2.1]

Fig. 2.8 - (a) Il postulato della parallela d’Euclide. Le rette a e b sono trasversali a una terza retta c, in modo che la somma degli angoli interni nei punti d’intersezione sia minore di due angoli retti. Allora a e b (supposte abbastanza estese) si intersecheranno. (b) L’equivalente assioma di Playfair: se a è una retta in un piano e P un punto non giacente su di essa, allora vi è soltanto una retta parallela ad a passante per P.

Una volta che abbiamo il postulato della parallela, possiamo procedere a provare la proprietà richiesta per l’esistenza di un quadrato. Se una trasversale a una coppia di rette le incontra in modo che la somma degli angoli interni da un lato della trasversale sia due angoli retti, allora si può dimostrare che le rette di quella coppia sono davvero parallele. Inoltre, ne consegue immediatamente che qualsiasi altra trasversale della coppia gode della stessa proprietà angolare. Questo è fondamentalmente ciò che ci occorreva per l’argomento sopra enunciato per la costruzione del nostro quadrato. Vediamo infatti che è proprio il postulato della parallela che dobbiamo impiegare per dimostrare che la nostra costruzione fornisce effettivamente un quadrato, con tutti gli angoli che sono angoli retti e tutti i lati uguali tra loro. Senza il postulato della parallela, non possiamo provare che esistano realmente quadrati (intesi comunemente con tutti gli angoli retti).

Preoccuparsi di quali precise assunzioni siano necessarie per fornire una «dimostrazione rigorosa» dell’esistenza di una cosa così ovvia come un quadrato può sembrare soltanto una questione di pedanteria matematica. Dovremmo realmente interessarci di queste pedanti questioni, quando un «quadrato» è proprio quella figura familiare di cui conosciamo tutto? Ebbene, tra poco vedremo che Euclide mostrò effettivamente una straordinaria perspicacia a tale proposito. La pedanteria di Euclide è collegata a un profondo problema che ha moltissimo da dire sull’effettiva geometria dell’universo, e in più di un modo. In particolare, non è assolutamente una questione ovvia quella che si interroga sull’esistenza di «quadrati» fisici su scala cosmologica nell’universo reale. Questa è materia per l’osservazione, ma al momento le prove sono in conflitto (vedi §2.7 e §28.10).

2.3 Dimostrazione del teorema di Pitagora per mezzo della similitudine di aree

Nella prossima sezione ritornerò sul significato matematico di non presumere il postulato della parallela. Le pertinenti questioni fisiche saranno riprese in esame in §18.4, §27.11, §28.10 e §34.4. Ma prima di discutere questi problemi, è necessario passare all’altra dimostrazione del teorema di Pitagora che ho promesso in precedenza.

Considerare la configurazione di un triangolo rettangolo suddiviso in due triangoli più piccoli, per mezzo della perpendicolare all’ipotenusa dal vertice dell’angolo retto (fig. 2.9), è uno dei modi più semplici per verificare la validità dell’asserzione di Pitagora nella geometria euclidea. Vi sono ora tre triangoli: quello originario e i due in cui è stato adesso suddiviso. Evidentemente l’area del triangolo originario è la somma delle aree dei due triangoli più piccoli.

Fig. 2.9 - Dimostrazione del teorema di Pitagora con l’impiego di triangoli simili. Prendiamo un triangolo rettangolo e tracciamo la perpendicolare all’ipotenusa passante per il vertice dell’angolo retto. I due triangoli, in cui ora il triangolo originario è suddiviso, hanno aree la cui somma è quella del triangolo iniziale. Tutti e tre i triangoli sono simili, cosicché le loro aree sono proporzionali ai quadrati delle rispettive ipotenuse. Da qui segue il teorema di Pitagora.

È ora semplice vedere che questi tre triangoli sono tutti simili tra loro. Ciò significa che hanno tutti la stessa forma (anche se dimensioni diverse), cioè sono ottenuti l’uno dall’altro mediante un’uniforme espansione o contrazione, assieme a un movimento rigido. Ciò deriva dal fatto che ciascuno dei tre triangoli ha esattamente gli stessi angoli anche se in un ordine diverso. Ciascuno dei due triangoli più piccoli ha un angolo in comune con quello più grande e uno degli angoli di ciascun triangolo è un angolo retto. Anche il terzo angolo deve quindi essere uguale, perché la somma degli angoli di qualsiasi triangolo è sempre la stessa. Ora, una proprietà generale delle figure piane simili è che le loro aree sono in proporzione ai quadrati delle loro corrispondenti dimensioni lineari. In questo caso, possiamo assumere che questa dimensione lineare sia il lato maggiore del triangolo, cioè l’ipotenusa. Notiamo che l’ipotenusa di ciascuno dei triangoli più piccoli coincide con uno dei lati (non l’ipotenusa) del triangolo originario. Ne consegue quindi subito (dal fatto che l’area del triangolo originario è la somma delle aree degli altri due) che il quadrato costruito sull’ipotenusa del triangolo originario è davvero la somma dei quadrati costruiti sugli altri due lati: il teorema di Pitagora!

Vi sono ancora in questa dimostrazione alcune assunzioni particolari che dovremo esaminare. Un ingrediente importante del ragionamento è che gli angoli di un triangolo hanno sempre la stessa somma. (Il valore di questa somma è naturalmente 180°, ma Euclide avrebbe detto «due angoli retti». La più «naturale» descrizione matematica moderna è quella di affermare che gli angoli di un triangolo, nella geometria d’Euclide, hanno per somma π. Ciò significa usare i radianti per la misura assoluta degli angoli, dove il segno di grado «°» vale come π/180, così che possiamo scrivere 180° = π.) La comune dimostrazione è raffigurata nella fig. 2.10. Estendiamo CA a E e tracciamo una retta AD per A, che sia parallela a CB. Allora (come segue dal postulato della parallela) gli angoli EAD e ACB sono uguali, come pure gli angoli DAB e CBA. Poiché gli angoli EAD, DAB e BAC hanno per somma π (o 180°, o due angoli retti), la stessa cosa deve avvenire per i tre angoli ACB, CBA e BAC del triangolo – come si doveva dimostrare. Si noti però che qui è impiegato il postulato della parallela.

Questa dimostrazione del teorema di Pitagora si basa anche sul fatto che le aree di figure simili sono in proporzione ai quadrati di qualsiasi misura lineare delle loro grandezze. (In questo caso, per rappresentare questa misura lineare scegliamo l’ipotenusa di ciascun triangolo.) Questo fatto non dipende solo dall’esistenza stessa di figure simili con diverse grandezze – che, per i triangoli della fig. 2.9, abbiamo stabilito con l’impiego del postulato della parallela – ma anche da alcune questioni più complicate che si riferiscono a come effettivamente definire un’«area» per forme non rettangolari. Questi problemi generali sono affrontati in termini di procedimenti di limite e perciò in questo momento non desidero entrare in questo genere di discussione, che ci avvicinerebbe ad alcune questioni più profonde relative al tipo di numeri che sono impiegati in geometria. Ritorneremo sull’argomento nei §§3.1-3.

Fig. 2.10 - Dimostrazione che la somma degli angoli di un triangolo ABC è uguale a π (=180° = due angoli retti). Estendiamo CA fino a E; tracciamo la parallela AD a CB. Dal postulato della parallela segue che gli angoli EAD e ACB sono eguali, così come sono eguali gli angoli DAB e CBA. Poiché la somma degli angoli EAD, DAB e BAC è π, la stessa cosa avviene per gli angoli ACB, CBA e BAC.

Fig. 2.10 - Dimostrazione che la somma degli angoli di un triangolo ABC è uguale a π (=180° = due angoli retti). Estendiamo CA fino a E; tracciamo la parallela AD a CB. Dal postulato della parallela segue che gli angoli EAD e ACB sono eguali, così come sono eguali gli angoli DAB e CBA. Poiché la somma degli angoli EAD, DAB e BAC è π, la stessa cosa avviene per gli angoli ACB, CBA e BAC.

Un risultato importante delle discussioni affrontate nelle sezioni precedenti è che il teorema di Pitagora sembra dipendere dal postulato della parallela. È realmente così? Supponiamo che il postulato della parallela sia falso? Ciò significa che il teorema di Pitagora è esso stesso effettivamente falso? Una simile possibilità ha qualche senso? Tentiamo di affrontare ciò che avverrebbe se il postulato della parallela potesse davvero essere ritenuto falso. Sembrerebbe di entrare in un presunto mondo misterioso, dove la geometria che abbiamo imparato a scuola è tutta messa sottosopra. Tuttavia, troveremo che in questo ambito vi è anche un’intenzione più profonda.

2.4 Geometria iperbolica: quadro conforme

Date un’occhiata al quadro nella fig. 2.11. È una riproduzione di una delle xilografie di M. C. Escher, chiamata Cerchio limite I. Essa ci offre effettivamente una rappresentazione molto accurata di un genere di geometria – la cosiddetta geometria iperbolica (o anche geometria di Lobacevskij) – in cui il postulato della parallela è falso, il teorema di Pitagora non vale e la somma degli angoli di un triangolo non è π. Inoltre, per una forma di una data dimensione non esiste, in generale, una forma simile di dimensione maggiore.

Nella fig. 2.11 Escher ha usato una particolare rappresentazione di geometria iperbolica in cui l’intero «universo» del piano iperbolico è «compresso» nell’interno di un cerchio in un comune piano euclideo. La circonferenza di questo cerchio rappresenta l’infinito per questo universo iperbolico. Possiamo vedere che nel quadro di Escher i pesci sembrano accalcarsi quando si avvicinano a questa circonferenza. Ma dobbiamo pensare che questa è un’illusione. Immaginate di essere uno dei pesci. Allora sia che siate situati vicini al bordo dell’immagine di Escher o vicini al suo centro, l’intero universo (iperbolico) vi apparirà il medesimo. La nozione di «distanza» in questa geometria non si accorda con quella del piano euclideo su cui questo universo è stato rappresentato. Quando osserviamo il quadro di Escher dalla nostra prospettiva euclidea, i pesci vicini alla circonferenza ci sembrano diventare minuscoli. Ma dal punto di vista «iperbolico», essi pensano di avere la stessa forma e grandezza di quelli vicini al centro. Inoltre, anche se dalla nostra prospettiva euclidea sembra che essi si avvicinino sempre di più alla circonferenza limitante, dal loro punto di vista iperbolico quella frontiera rimane sempre infinitamente distante. Né la circonferenza limitante né qualunque parte dello spazio «euclideo» all’esterno di essa esiste per loro. Il loro intero universo consiste in ciò che a noi sembra trovarsi all’interno del cerchio.

Fig. 2.11 - La xilografia Cerchio Limite I di M. C. Escher, che illustra la rappresentazione conforme del piano iperbolico.

Fig. 2.11 - La xilografia Cerchio Limite I di M. C. Escher, che illustra la rappresentazione conforme del piano iperbolico.

Com’è costruito, in termini più matematici, questo quadro della geometria iperbolica? Pensiamo a un cerchio qualsiasi in un piano euclideo. L’insieme di punti giacenti all’interno del cerchio deve rappresentare l’insieme di punti dell’intero piano iperbolico. Le linee rette, secondo la geometria iperbolica, devono essere rappresentate come segmenti di circonferenze euclidee che incontrano la circonferenza limitante ortogonalmente – che significa ad angolo retto. Avviene, adesso, che la nozione iperbolica di un angolo tra due curve qualsiasi, nel loro punto d’intersezione, è esattamente la stessa della misura euclidea d’angolo tra due curve al punto d’intersezione. Una rappresentazione di questo tipo è chiamata conforme. Per questo motivo, la particolare rappresentazione della geometria iperbolica usata da Escher è chiamata talvolta il modello conforme del piano iperbolico. (Spesso viene anche chiamata il disco di Poincaré. La dubbiosa giustificazione storica di questa terminologia sarà discussa in §2.6.)

Fig. 2.12 - Il medesimo quadro di Escher, dove vengono però rappresentate linee rette iperboliche (circonferenze euclidee o linee che incontrano ortogonalmente il cerchio limitante) così come un triangolo iperbolico. Gli angoli iperbolici sono eguali a quelli euclidei. Il postulato della parallela è chiaramente violato e la somma degli angoli di un triangolo iperbolico è minore di π.

Fig. 2.12 - Il medesimo quadro di Escher, dove vengono però rappresentate linee rette iperboliche (circonferenze euclidee o linee che incontrano ortogonalmente il cerchio limitante) così come un triangolo iperbolico. Gli angoli iperbolici sono eguali a quelli euclidei. Il postulato della parallela è chiaramente violato e la somma degli angoli di un triangolo iperbolico è minore di π.

Siamo ora in grado di vedere se gli angoli di un triangolo, nella geometria iperbolica, hanno per somma π oppure no. Un rapido sguardo alla fig. 2.12 ci spinge verso la seconda ipotesi, cioè che la loro somma sia più piccola. In effetti, la somma degli angoli di un triangolo nella geometria iperbolica è sempre inferiore a π. Potremmo ritenere che questa sia una spiacevole caratteristica della geometria iperbolica, poiché non otteniamo una risposta «netta» per la somma degli angoli di un triangolo. Tuttavia vi è davvero qualcosa di particolarmente elegante e notevole in ciò che avviene quando sommiamo gli angoli di un triangolo iperbolico: il valore che si ottiene sottraendo tale somma a π è sempre proporzionale all’area del triangolo. Più esplicitamente, se i tre angoli del triangolo sono α, β e γ, allora abbiamo la formula (dovuta a Johann Heinrich Lambert, 1728-1777

π – (α + β + γ) = CΔ

dove Δ è l’area del triangolo e C è una costante. Questa costante dipende dalle «unità» che sono scelte per misurare lunghezze e aree. Possiamo sempre aggiustare proporzionalmente i valori in modo che C = 1. È davvero un fatto notevole che l’area di un triangolo, nella geometria iperbolica, possa essere espressa in modo così semplice. Nella geometria euclidea, non vi è alcun modo di esprimere l’area di un triangolo semplicemente in termini dei suoi angoli, e l’espressione dell’area di un triangolo in termini delle lunghezze dei suoi lati è notevolmente più complicata.

In effetti, non ho ancora del tutto terminato la mia descrizione della geometria iperbolica in termini di questa rappresentazione conforme, poiché non ho ancora descritto come debba essere definita la distanza iperbolica tra due punti (e sembrerebbe appropriato sapere che cosa sia la «distanza» prima di potere realmente parlare di area). Lasciate che vi dia un’espressione per la distanza iperbolica tra due punti A e B all’interno del cerchio. Questa è in cui P e Q sono i punti dove la circonferenza euclidea (cioè la retta iperbolica) per A e B ortogonale alla circonferenza limitante incontra questa circonferenza e in cui «QA», «PB», eccetera, sono le distanze euclidee (vedi fig. 2.13). Se desiderate includere la C della formula di Lambert dell’area (con C ≠ 1), moltiplicate l’espressione di prima per C^–1/2 (il reciproco della radice quadrata di C).⁴ ^[2.2] Per motivi che spero diventeranno più chiari in seguito chiamerò la quantità C^–1/2 lo pseudoraggio della geometria.

Se espressioni matematiche come la formula «log» di prima sembrano scoraggianti, non preoccupatevi. Le fornisco solo per quelli che amano vedere esplicitamente le cose. In qualsiasi caso, non spiegherò perché questa espressione funziona (in altre parole, perché la minima distanza iperbolica tra due punti, definita in questo modo, è effettivamente misurata lungo una retta iperbolica, o perché le distanze lungo una retta iperbolica «si addizionano» in modo appropriato).^[2.3] Chiedo anche scusa per il «log» (logaritmo), ma questo è il modo in cui stanno le cose. In effetti, questo è un logaritmo naturale («logaritmo in base e») e ne dovrò parlare a lungo nei §§5.2,3. Scopriremo che i logaritmi sono realmente entità magnifiche e misteriose (così come il numero e), oltre a essere importanti in molte situazioni differenti.

Fig. 2.13 - La distanza iperbolica tra A e B è, nella rappresentazione conforme, log {QA · PB/QB · PA} dove QA, eccetera sono distanze euclidee e P e Q sono le intersezioni della circonferenza euclidea, passante per A e B e ortogonale alla circonferenza limite, con questa circonferenza.

Fig. 2.13 - La distanza iperbolica tra A e B è, nella rappresentazione conforme, log {QA · PB/QB · PA} dove QA, eccetera sono distanze euclidee e P e Q sono le intersezioni della circonferenza euclidea, passante per A e B e ortogonale alla circonferenza limite, con questa circonferenza.

Risulta pertanto che la geometria iperbolica, con questa definizione di distanza, possiede tutte le proprietà della geometria euclidea tranne quelle che richiedono il postulato della parallela. Possiamo costruire triangoli, e altre figure piane, di differenti forme e grandezze, e possiamo spostarle «rigidamente» (mantenendo le loro forme e grandezze iperboliche) con la stessa libertà con cui possiamo farlo nella geometria euclidea. In questo modo nasce una nozione naturale di forme «congruenti», proprio come nella geometria euclidea (dove «congruente» significa «che una forma può essere spostata rigidamente fino a coincidere con l’altra»). Tutti i pesci bianchi nella xilografia di Escher sono davvero congruenti tra loro, secondo questa geometria iperbolica, e la stessa cosa è vera per tutti i pesci neri.

2.5 Altre rappresentazioni della geometria iperbolica

Naturalmente non tutti i pesci bianchi sembrano avere la stessa forma e grandezza, ma questo è dovuto al fatto che li osserviamo da un punto di vista euclideo e non da uno iperbolico. Il quadro di Escher fa semplicemente uso di una particolare rappresentazione euclidea della geometria iperbolica. La geometria iperbolica in sé e per sé è un qualcosa di più astratto che non dipende da qualunque rappresentazione euclidea. Queste rappresentazioni ci sono però molto utili, perché offrono un modo di visualizzare la geometria iperbolica riportandola a qualcosa che ci è più familiare e apparentemente più «concreto», e precisamente la geometria euclidea. Simili rappresentazioni, inoltre, rendono manifesto che la geometria iperbolica è una struttura coerente e che, di conseguenza, il postulato della parallela non può essere derivato dalle altre leggi della geometria euclidea.

Vi sono certamente altre rappresentazioni della geometria iperbolica espresse in termini di geometria euclidea che sono diverse da quella conforme impiegata da Escher. Una di queste è quella nota come il modello proiettivo. In questo modello l’intero piano iperbolico è ancora raffigurato come l’interno di un cerchio in un piano euclideo, ma le rette iperboliche sono ora rappresentate da rette euclidee (invece che da archi di circonferenza). Tuttavia si deve pagare un prezzo per quest’apparente semplificazione, perché gli angoli iperbolici non sono ora uguali agli angoli euclidei: molte persone riterrebbero questo prezzo troppo alto. Per i lettori interessati, la distanza iperbolica tra due punti A e B, in questa rappresentazione, è data dall’espressione (vedi fig. 2.14) (prendendo C = 1, questa è quasi la stessa espressione che avevamo prima, nel caso della rappresentazione conforme) dove R e S sono le intersezioni della retta AB con la circonferenza limitante. Questa rappresentazione della geometria iperbolica può essere ottenuta da quella conforme per mezzo di un’espansione radiale dal centro di un ammontare dato da

Fig. 2.14 - Nella rappresentazione proiettiva la formula per la distanza iperbolica è dove R e S sono le intersezioni della retta euclidea (cioè iperbolica) AB con la circonferenza limitante.

Fig. 2.14 - Nella rappresentazione proiettiva la formula per la distanza iperbolica è dove R e S sono le intersezioni della retta euclidea (cioè iperbolica) AB con la circonferenza limitante.

dove R è il raggio del cerchio limitante e r_c è la distanza euclidea dal centro del cerchio limitante di un punto nella rappresentazione conforme (vedi fig. 2.15).^[2.4] Nella figura 2.16 ho trasformato il quadro di Escher della fig. 2.11 dalla rappresentazione conforme a quella proiettiva usando questa formula. (Nonostante la perdita di dettagli, l’abilità artistica di Escher appare ancora evidente.) Sebbene si presenti meno attraente in questo modo, la figura offre un nuovo punto di vista!

Fig. 2.15 - Per passare dalla rappresentazione conforme a quella proiettiva, espandete dal centro per un fattore dove R è il raggio del cerchio limitante e rc è la distanza euclidea dal centro del punto nella rappresentazione conforme.

Fig. 2.15 - Per passare dalla rappresentazione conforme a quella proiettiva, espandete dal centro per un fattore , dove R è il raggio del cerchio limitante e rc è la distanza euclidea dal centro del punto nella rappresentazione conforme.

Vi è un modo più direttamente geometrico di collegare la rappresentazione, conforme e quella proiettiva, per mezzo di un’altra ingegnosa rappresentazione di questa stessa geometria. Tutte e tre queste rappresentazioni sono dovute al geniale geometra italiano Eugenio Beltrami (1835-1900). Consideriamo una sfera S, il cui equatore coincide con la circonferenza limitante dell’una o dell’altra delle due rappresentazioni della geometria iperbolica date in precedenza. Troveremo ora una rappresentazione della geometria iperbolica sulla semisfera nord S⁺ di S, che chiamerò la rappresentazione semisferica (vedi fig. 2.17). Per passare dalla rappresentazione proiettiva nel piano (considerato orizzontale) alla nuova sulla sfera, proiettiamo semplicemente in verticale verso l’alto (fig. 2.17a). Le rette nel piano, che rappresentano rette iperboliche, sono rappresentate su S⁺ da semicirconferenze che incontrano l’equatore ortogonalmente. Per ottenere ora dalla rappresentazione su S⁺ la rappresentazione conforme sul piano, proiettiamo dal polo sud (vedi fig. 2.17b). Ciò prende il nome di proiezione stereografica e svolgerà un ruolo importante nelle pagine successive di questo libro (vedi §8.3, §18.4, §22.9, §33.6). La proiezione stereografica, come vedremo in §8.3, possiede due importanti proprietà: è conforme, quindi preserva gli angoli, e invia cerchi sulla sfera su cerchi (o, eccezionalmente, su rette) sul piano.^[2.5] ^[2.6]

Fig. 2.16 - Il quadro di Escher di fig.2.11 trasformato dalla rappresentazione conforme a quella proiettiva.

Fig. 2.16 - Il quadro di Escher di fig.2.11 trasformato dalla rappresentazione conforme a quella proiettiva.

L’esistenza di differenti modelli, espressi in termini di spazio euclideo, della geometria iperbolica serve a enfatizzare che questi sono proprio soltanto «modelli euclidei» della geometria iperbolica e non si deve ritenere che ci dicano che cosa sia effettivamente la geometria iperbolica. La geometria iperbolica ha la sua «esistenza platonica», proprio come la geometria euclidea (vedi §1.3 e la Prefazione). Nessun modello deve essere ritenuto la «corretta» raffigurazione della geometria iperbolica, a spese degli altri. Le sue rappresentazioni, da me prese in considerazione, sono molto utili per aiutarci a comprendere, ma solo perché il modello euclideo è quello cui siamo più abituati. Per qualcuno educato a un’esperienza diretta con la geometria iperbolica, invece che con quella euclidea, un modello di geometria euclidea in termini di quella iperbolica potrebbe sembrare molto più naturale! In §18.4 incontreremo di nuovo un altro modello della geometria iperbolica, questa volta in termini della geometria di Minkowski della relatività speciale.

Fig. 2.17 - La geometria di Beltrami che collega tre delle sue rappresentazioni della geometria iperbolica. (a) La rappresentazione semisferica (conforme sulla semisfera nord S+) si proietta verticalmente nella rappresentazione proiettiva sul disco equatoriale. (b) La rappresentazione semisferica si proietta stereograficamente dal polo sud nella rappresentazione conforme sul disco equatoriale.

Fig. 2.17 - La geometria di Beltrami che collega tre delle sue rappresentazioni della geometria iperbolica. (a) La rappresentazione semisferica (conforme sulla semisfera nord S⁺) si proietta verticalmente nella rappresentazione proiettiva sul disco equatoriale. (b) La rappresentazione semisferica si proietta stereograficamente dal polo sud nella rappresentazione conforme sul disco equatoriale.

Per terminare questa sezione, ritorniamo al problema dell’esistenza di quadrati nella geometria iperbolica. Anche se quadrati i cui angoli siano retti non esistono nella geometria iperbolica, vi sono «quadrati» di tipo più generale, i cui angoli sono minori di un angolo retto. La maniera più facile di costruire un quadrato di questo genere è di tracciare due rette che si intersecano ad angoli retti in un punto O. Il nostro «quadrato» è ora il quadrilatero i cui quattro vertici sono le intersezioni A, B, C, D (prese in ordine ciclico) di queste due rette con qualche circonferenza di centro O. (Vedi fig. 2.18.) A causa della simmetria della figura, i quattro lati del quadrilatero risultante ABCD sono tutti uguali e anche i suoi quattro angoli devono essere uguali. Ma questi angoli sono angoli retti? Non nella geometria iperbolica. In effetti, possono essere qualunque angolo (positivo), a nostro piacere, minore di un angolo retto, ma non un angolo retto. Più è grande il quadrato iperbolico (vale a dire, più è grande la circonferenza di prima), più piccoli saranno i suoi angoli. Nella fig. 2.19a ho tracciato un reticolo di quadrati iperbolici, usando il modello conforme, dove vi sono cinque quadrati a ciascun vertice (invece dei quattro della geometria euclidea), cosicché l’angolo è , o 72°. Nella fig. 2.19b ho tracciato il medesimo reticolo usando il modello proiettivo. Si vedrà che questo non permette le modifiche che sarebbero necessarie per il reticolo a due quadrati della fig. 2.2.^[2.7]

Fig. 2.18 - Un «quadrato» iperbolico è un quadrilatero iperbolico i cui vertici sono le intersezioni A, B, C, D (prese in ordine ciclico) di due rette iperboliche perpendicolari per un qualche punto O con un qualche cerchio con centro in O. A causa della simmetria, i quattro lati di ABCD sono eguali, così come i quattro angoli. Questi angoli non sono retti, ma possono essere eguali a qualunque dato angolo positivo minore di π.

Fig. 2.19 - Un reticolo di quadrati, nello spazio iperbolico, in cui cinque quadrati s’incontrano in ciascun vertice, così che gli angoli del quadrato sono, o 72o. (a) Rappresentazione conforme. (b) Rappresentazione proiettiva.

Fig. 2.19 - Un reticolo di quadrati, nello spazio iperbolico, in cui cinque quadrati s’incontrano in ciascun vertice, così che gli angoli del quadrato sono , o 72^o. (a) Rappresentazione conforme. (b) Rappresentazione proiettiva.

2.6 Aspetti storici della geometria iperbolica

Sono ora opportuni alcuni commenti storici sulla scoperta della geometria iperbolica. Per secoli, dopo la pubblicazione degli elementi di Euclide, verso il 300 a.C., diversi matematici tentarono di derivare il quinto postulato dagli assiomi e dagli altri postulati. Questi sforzi raggiunsero il culmine con l’eroico lavoro del gesuita Girolamo Saccheri nel 1733. Pare che Saccheri stesso avesse ritenuto fallimentare il suo lavoro di una vita: non era infatti riuscito a dimostrare il postulato della parallela, poiché l’ipotesi che la somma degli angoli di un qualsiasi triangolo sia minore di due angoli retti conduceva a una contraddizione. Incapace di farlo logicamente dopo numerosi e vani tentativi, concluse piuttosto debolmente in questo modo:

L’ipotesi d’angolo acuto è assolutamente falsa; essa ripugna alla natura della linea retta.⁵

L’ipotesi di «angolo acuto» asserisce che le rette a e b di fig. 2.8 qualche volta non si incontrano. Questo è di fatto possibile e produce la geometria iperbolica!

In quale modo Saccheri ha effettivamente scoperto qualcosa che stava tentando di mostrare impossibile? La proposta di Saccheri per dimostrare il quinto postulato di Euclide fu di formulare l’ipotesi che il quinto postulato fosse falso e poi derivare una contraddizione da questa ipotesi. Propose quindi di impiegare uno dei principi più utili e consacrati dal tempo che sia mai stato avanzato in matematica – molto probabilmente introdotto per la prima volta dai pitagorici – chiamato dimostrazione per assurdo (o reductio ad absurdum, in latino). Secondo questo procedimento, per dimostrare che qualche asserzione è vera si suppone dapprima che questa asserzione sia falsa e poi si fa vedere che da ciò consegue qualche contraddizione. E quindi, trovando una simile contraddizione, si deduce che, dopo tutto, l’asserzione deve essere vera.⁶ La dimostrazione per assurdo fornisce un metodo di ragionamento molto efficace in matematica ed è frequentemente applicato oggigiorno. A questo punto è appropriata una citazione dall’illustre matematico G. H. Hardy:

La reductio ad absurdum che Euclide amava così tanto è una delle migliori armi di un matematico. È una mossa decisamente migliore di qualunque mossa scacchistica: un giocatore di scacchi può offrire il sacrificio di un pedone o persino di un pezzo, ma un matematico offre il gioco.⁷

Vedremo più avanti (§3.1e §§16.4,6) altre applicazioni di questo importante principio.

Tuttavia Saccheri fallì nel suo tentativo di trovare una contraddizione e non fu quindi in grado di ottenere una dimostrazione del quinto postulato. Ma trovò in effetti qualcosa di più grande: una nuova geometria, differente da quella di Euclide, ossia la geometria discussa nei §§2.4,5, che ora chiamiamo geometria iperbolica. Dall’ipotesi che il quinto postulato fosse falso, egli ottenne, invece di una vera contraddizione, una grande quantità di strani, appena credibili, ma interessanti teoremi. Per quanto strani apparissero questi risultati, nessuno di essi era però effettivamente una contraddizione. Come ora sappiamo, non vi era alcuna possibilità che Saccheri trovasse, in questo modo, un’autentica contraddizione nel senso matematico di una simile struttura coerente, in quanto la geometria iperbolica esiste realmente. Nella terminologia di §1.3 la geometria iperbolica risiede nel mondo platonico delle forme matematiche. (La questione della realtà fisica della geometria iperbolica sarà trattata in §2.7 e §28.10.)

Poco dopo Saccheri, anche Johann Heinrich Lambert (1728-1777), matematico dotato di grande intuito, derivò numerosi e affascinanti risultati geometrici dall’ipotesi che il quinto postulato di Euclide fosse falso, ivi incluso il magnifico risultato menzionato in §2.4 che dà l’area di un triangolo iperbolico in termini della somma dei suoi angoli. Probabilmente Lambert si convinse, almeno in qualche fase della sua vita, che si potesse ottenere una geometria coerente dalla negazione del quinto postulato di Euclide. Sembra che alla base della sua esitazione vi sia stata la possibilità teorica della geometria su una «sfera di raggio immaginario», cioè per la quale il «quadrato del raggio» della sfera è negativo. La formula di Lambert π – (α + β + γ) = CΔ dà l’area, Δ, di un triangolo iperbolico, dove α, β e γ sono gli angoli del triangolo e dove C è una costante positiva (– C è ciò che ora chiameremmo la «curvatura gaussiana» del piano iperbolico). Questa formula appare fondamentalmente eguale a una già precedentemente nota, dovuta a Thomas Hariot (1560-1621), Δ = R²(α + β + γ – π), che dà l’area Δ di un triangolo sferico, formato da archi di cerchio massimo⁸ su una sfera di raggio R (vedi fig. 2.20).^[2.8] Per ritrovare la formula di Lambert dobbiamo porre

Ma per avere il valore positivo di C, che è richiesto dalla geometria iperbolica, occorre che il raggio della sfera sia «immaginario» (sia cioè la radice quadrata di un numero negativo). Si noti che il raggio R è dato dalla quantità immaginaria (– C)^–1/2. Questo spiega il termine «pseudoraggio», introdotto in §2.4, per la quantità reale C^–1/2. In effetti, il procedimento di Lambert è perfettamente giustificato secondo i nostri punti di vista più moderni (vedi capitolo 4 e §18.4) e il fatto che egli lo abbia previsto è un segno del suo grande intuito.

La formula di Hariot per l’area di un triangolo sferico con angoli

Fig. 2.20 - La formula di Hariot per l’area di un triangolo sferico, con angoli α, β, γ, è Δ = R²(α + β + γ - π). La formula di Lambert per un triangolo iperbolico ha C = 1/R².

Tuttavia, è opinione comune (ma alquanto ingiusta a mio parere) quella di negare a Lambert l’onore di essere stato il primo a costruire una geometria non euclidea e di ritenere che (circa mezzo secolo dopo) la prima persona ad arrivare a un’assoluta accettazione dell’esistenza di una geometria completamente coerente – ma distinta da quella di Euclide, in cui il postulato della parallela è falso – sia stato il grande matematico Carl Friedrich Gauss. Il quale, essendo un uomo eccezionalmente cauto e timoroso delle controversie che una simile rivelazione avrebbe potuto causare, non pubblicò le sue scoperte e le tenne per sé.⁹ Circa trent’anni dopo che Gauss aveva iniziato a lavorarci, la geometria iperbolica fu riscoperta indipendentemente da alcuni altri studiosi, tra cui l’ungherese János Bolyai (dal 1829), ma in particolare il russo Nikolai Ivanovich Lobachevsky attorno al 1826 (per questo motivo la geometria iperbolica viene spesso indicata come geometria di Lobachevsky).

Le specifiche realizzazioni, proiettiva e conforme, della geometria iperbolica che ho descritto in precedenza furono entrambe trovate da Eugenio Beltrami, che le pubblicò nel 1868 insieme ad altre eleganti rappresentazioni, tra cui quella emisferica menzionata in §2.5. La rappresentazione conforme è, tuttavia, comunemente chiamata «modello di Poincaré», poiché la riscoperta da parte di Poincaré di questa rappresentazione, nel 1882, è meglio conosciuta del lavoro originario di Beltrami (in gran parte per l’importante uso che Poincaré fece di questo modello).¹⁰ Allo stesso modo, la rappresentazione proiettiva del povero vecchio Beltrami è qualche volta chiamata «rappresentazione di Klein». Non è insolito che in matematica il nome normalmente collegato a un concetto matematico non sia quello dell’iniziale scopritore. Ma in questo caso Poincaré riscoprì perlomeno la rappresentazione conforme (come fece Klein per quella proiettiva nel 1871). Vi sono altri esempi, in matematica, dove il matematico il cui nome è collegato a un certo risultato non conosceva neppure il risultato in questione!¹¹

Fig. 2.21 - (a) Una pseudosfera. Questa è ottenuta ruotando una trattrice attorno al suo asintoto. (b) Per costruire una trattrice, immaginiamo che su un piano orizzontale sia trascinata una barra leggera, dritta e rigida. Un’estremità della barra è un peso puntiforme P e l’altra estremità si muove lungo l’asintoto (una retta).

Fig. 2.21 - (a) Una pseudosfera. Questa è ottenuta ruotando una trattrice attorno al suo asintoto. (b) Per costruire una trattrice, immaginiamo che su un piano orizzontale sia trascinata una barra leggera, dritta e rigida. Un’estremità della barra è un peso puntiforme P e l’altra estremità si muove lungo l’asintoto (una retta).

La rappresentazione della geometria iperbolica per cui Beltrami è maggiormente noto è ancora un’altra, che lui trovò sempre nel 1868. Questa rappresenta la geometria su una certa superficie nota come pseudosfera (vedi fig. 2.21). Tale superficie è ottenuta dalla rotazione di una curva conosciuta come trattrice, investigata per la prima volta da Isaac Newton nel 1676, attorno al suo «asintoto». L’asintoto è una linea retta a cui la curva si avvicina, diventando asintoticamente tangente a essa quando la curva si allontana all’infinito. Qui dobbiamo immaginare che l’asintoto sia tracciato su un piano orizzontale scabro. Immaginiamo adesso una barra leggera, dritta e rigida, alla cui estremità P è attaccato un peso puntiforme, mentre l’altra sua estremità R si muove lungo l’asintoto. Il punto P traccia allora una trattrice. Ferdinand Minding scoprì nel 1839 che la pseudosfera ha una geometria intrinseca a costante negativa e Beltrami impiegò questa scoperta per costruire il primo modello di geometria iperbolica. Sembra che sia stato il modello della pseudosfera di Beltrami ad aver convinto i matematici della coerenza della geometria iperbolica piana, poiché la misura della distanza iperbolica coincide con la distanza euclidea lungo quella superficie. Questo è, tuttavia, un modello poco maneggevole, perché rappresenta la geometria iperbolica solo localmente, invece di presentare simultaneamente l’intera geometria, come fanno gli altri modelli di Beltrami.

2.7 Relazione con lo spazio fisico

La geometria iperbolica funziona perfettamente anche in spazi con un numero più alto di dimensioni. Inoltre vi sono versioni a un numero maggiore di dimensioni di entrambi i modelli, conforme e proiettivo. Nel caso della geometria iperbolica tridimensionale, invece di una circonferenza limitante, abbiamo una sfera limitante. L’intera infinita geometria iperbolica tridimensionale è rappresentata dall’interno di questa sfera euclidea finita. Il resto è fondamentalmente come prima. Nel modello conforme, le linee rette in questa geometria iperbolica tridimensionale sono rappresentate da cerchi euclidei che incontrano ortogonalmente la sfera limitante; gli angoli sono dati dalle misure euclidee e le distanze sono date dalla stessa formula del caso bidimensionale. Nel modello proiettivo, le linee rette iperboliche sono rette euclidee e le distanze sono ancora date dalla stessa formula del caso bidimensionale.

Che cosa si può dire del nostro reale universo su scale cosmologiche? Ci aspettiamo che la sua geometria spaziale sia euclidea, o potrebbe essere che si accordi più rigorosamente con qualche altra geometria, come la notevole geometria iperbolica (ma in tre dimensioni) che abbiamo esaminato in §§2.4-6? Questo è davvero un quesito interessante. Sappiamo dalla relatività generale di Einstein (di cui tratteremo in §17.9 e in §19.6) che la geometria euclidea è soltanto un’approssimazione (straordinariamente accurata) alla reale geometria dello spazio fisico. Questa geometria non è neppure esattamente uniforme, avendo piccole increspature a causa della presenza della materia. Tuttavia, secondo i migliori dati osservazionali oggi disponibili ai cosmologi, sembra che queste increspature si medino, in modo notevolmente preciso, su scale cosmologiche (vedi §27.13 e §§28.4-10), e che la geometria spaziale dell’universo reale si accordi, in modo molto stretto, con una geometria uniforme (omogenea e isotropa). Sembrerebbe che almeno i primi quattro postulati d’Euclide abbiano resistito notevolmente alla prova del tempo.

A questo punto è necessario un commento chiarificatore. Vi sono, fondamentalmente, tre tipi di geometria che soddisferebbero le condizioni di omogeneità e isotropia: la geometria euclidea, quella iperbolica e quella ellittica. La geometria euclidea ci è familiare (e lo è stata per circa ventitré secoli). La geometria iperbolica è stata al centro di questo capitolo. E la geometria ellittica? Di cosa si tratta? Sostanzialmente la geometria ellittica piana è quella soddisfatta dalle figure tracciate sulla superficie di una sfera ed è comparsa nella discussione dell’approccio di Lambert alla geometria iperbolica, in §2.6. Si vedano le figure 2.22a, b, c in cui per la rappresentazione di Escher dei casi ellittico, euclideo e iperbolico rispettivamente, è stata usata un’analoga tassellatura di angeli e diavoli in tutti e tre i casi; il terzo fornisce un’interessante alternativa alla fig. 2.11. (Vi è anche una versione tridimensionale della geometria ellittica e vi sono anche versioni in cui punti diametralmente opposti sulla sfera sono considerati rappresentare il medesimo punto. Tali questioni saranno discusse un po’ più dettagliatamente in §27.11.) Si potrebbe tuttavia affermare che il caso ellittico violi il secondo e il terzo postulato d’Euclide (come pure il primo). Infatti, è una geometria che ha una misura finita (e nella quale una coppia di punti è congiunta da più di un segmento di retta).

Qual è, allora, lo stato delle osservazioni sulla geometria spaziale, su grande scala, dell’universo? È giusto soltanto affermare che non la conosciamo ancora, sebbene recentemente sia stato affermato, e notevolmente pubblicizzato, che Euclide aveva completamente ragione e che anche il suo quinto postulato è vero, così che la geometria spaziale mediata è proprio quella che chiamiamo «euclidea».¹² D’altra parte, vi sono anche prove (alcune provenienti dagli stessi esperimenti) che sembrano indicare fermamente una geometria globale iperbolica per l’universo spaziale.¹³ Inoltre, alcuni teorici hanno sostenuto a lungo il caso ellittico e questo non è certamente escluso dalle stesse prove che si ritiene siano di supporto al caso euclideo (vedi alla fine di §34.4). Come il lettore avrà occasione di vedere, la questione è ancora piena di controversie e, come ci si potrebbe aspettare, oggetto di accese discussioni. In alcuni capitoli di questo libro cercherò di presentare molte delle considerazioni che sono state avanzate su ciò (e non cercherò di nascondere il mio pregiudizio a favore del caso iperbolico, pur tentando di essere il più possibile equilibrato nei riguardi degli altri).

Fig. 2.22 - Le tre specie fondamentali di geometria piana uniforme, come vengono illustrate da Escher con l’impiego di tassellature con angeli e diavoli. (a) Il caso ellittico (curvatura positiva), (b) il caso euclideo (curvatura nulla) e (c) il caso iperbolico (curvatura negativa) – nella rappresentazione conforme (Cerchio limite IV di Escher, da paragonare con fig. 2.17).

Fig. 2.22 - Le tre specie fondamentali di geometria piana uniforme, come vengono illustrate da Escher con l’impiego di tassellature con angeli e diavoli. (a) Il caso ellittico (curvatura positiva), (b) il caso euclideo (curvatura nulla) e (c) il caso iperbolico (curvatura negativa) – nella rappresentazione conforme (Cerchio limite IV di Escher, da paragonare con fig. 2.17).

Fortunatamente per quelli che come me sono attratti dalla bellezza della geometria iperbolica e anche dalla maestosità della fisica moderna, vi è un altro ruolo per questa superba geometria che è indiscutibilmente fondamentale per la nostra attuale comprensione dell’universo fisico. Infatti secondo la moderna teoria della relatività, lo spazio delle velocità è certamente una geometria iperbolica tridimensionale (vedi §18.4), piuttosto che quella euclidea che varrebbe nella più antica teoria newtoniana. Ciò ci aiuta a comprendere alcuni degli enigmi della relatività. Immaginiamo, per esempio, un proiettile scagliato in avanti, con una velocità prossima a quella della luce, da un veicolo che si muove anch’esso in avanti con velocità comparabile dietro un edificio. Tuttavia, relativamente a quell’edificio, il proiettile non può mai superare la velocità della luce. Ciò sembra impossibile, ma vedremo in §18.4 che questo fatto trova una diretta spiegazione in termini di geometria iperbolica. Ma queste affascinanti questioni devono attendere i prossimi capitoli.

Che cosa dire del teorema di Pitagora, che come abbiamo visto non vale nella geometria iperbolica? Dobbiamo abbandonare il più grande dei doni di Pitagora alla posterità? Niente affatto. La geometria iperbolica – e anche tutte le geometrie «riemanniane» che generalizzano la geometria iperbolica nel caso di spazi a curvatura irregolare (formando lo schema essenziale per la teoria della relatività generale di Einstein; vedi §13.8, §14.7, §18.1, §19.6) – dipende in modo fondamentale dal fatto che il teorema di Pitagora vale nel limite di piccole distanze. Inoltre, la sua enorme influenza permea altre vaste aree della matematica e della fisica (per esempio, la struttura metrica «unitaria» della meccanica quantistica, vedi §22.3). Nonostante questo teorema sia stato in un certo senso messo da parte per le «grandi» distanze, rimane importante per la struttura della geometria su piccola scala, trovando un campo di applicazione che supera di gran lunga quello per cui era stato originariamente proposto.

Note

1. Non è molto chiaro dal punto di vista storico chi sia stato davvero il primo a dimostrare quello che ora chiamiamo «teorema di Pitagora», vedi nota 1.1. Sembra però che gli antichi Egizi e i Babilonesi avessero già applicato questo teorema. Il ruolo svolto da Pitagora e dai suoi seguaci è quindi in larga misura supposto.

2. Tuttavia, persino con tutta questa attenzione, diverse assunzioni nascoste rimasero nel lavoro di Euclide. Esse hanno soprattutto a che vedere con problemi che ora definiremmo «topologici», ma che a Euclide e ai suoi contemporanei sarebbero sembrati «intuitivamente ovvi». Queste tacite assunzioni sono state evidenziate solo molto tempo dopo, in particolare da Hilbert alla fine del diciannovesimo secolo. In seguito le ignorerò.

3. Vedi, per esempio, Thomas (1939).

4. La notazione «esponenziale», come C^–1/2, sarà frequentemente impiegata in questo libro. Come già detto nella nota 1.1, a⁵ significa a × a × a × a × a; analogamente, per qualsiasi intero positivo n, il prodotto di n fattori a è rappresentato da aⁿ. Questa notazione viene estesa anche a esponenti negativi, così che a^–1 è il reciproco 1/a di a e a^–n è il reciproco 1/aⁿ di aⁿ che si può anche scrivere (a^–1)ⁿ. In accordo con la discussione più generale di §5.2, a , per un numero positivo a, è la «radice ennesima di a», che è il numero (positivo) soddisfacente la relazione (a^1/n)ⁿ = a (vedi nota 1.1). Inoltre, a^m/n è l’emmesima potenza di a .

5. Saccheri (1773). Prop. XXXIII.

6. Vi è un punto di vista noto come intuizionismo che è sostenuto da una minoranza (abbastanza ridotta) di matematici, in cui il principio della «dimostrazione per assurdo» non è accettato. L’obiezione è che questo principio può essere non costruttivo, poiché può condurre all’affermazione dell’esistenza di qualche entità matematica senza fornire un metodo di costruzione per essa. Questo avrà importanza per gli argomenti discussi in §16.6. Vedi Heyting (1956).

7. Hardy (1940).

8. Gli archi di cerchio massimo sono le curve «più brevi» (geodetiche) sulla superficie di una sfera; esse giacciono su piani che passano per il centro della sfera.

9. È argomento di discussione il fatto che Gauss, che professionalmente si occupava di questioni di geodesia, possa davvero aver tentato di accertare se vi siano deviazioni misurabili dalla geometria euclidea nello spazio fisico. A causa della sua ben nota reticenza in materia di geometria non euclidea, è improbabile che lo avrebbe reso noto, anche se avesse veramente tentato di farlo, soprattutto perché sarebbe stato destinato al fallimento per la piccolezza dell’effetto, secondo la teoria moderna. Attualmente si ritiene che Gauss facesse «soltanto geodesia», occupandosi della curvatura della Terra e non di quella dello spazio. Il fatto curioso è che le sue misurazioni degli angoli di un triangolo non sarebbero comunque state influenzate dalla curvatura della Terra. Trovo però abbastanza difficile credere che egli non sarebbe stato anche in guardia per qualunque discrepanza significativa con la geometria euclidea; vedi Fauvel e Gray (1987).

10. La cosiddetta rappresentazione del «semipiano di Poincaré» è anch’essa originariamente dovuta a Beltrami; vedi Beltrami (1868).

11. Sembra che ciò si applichi anche allo stesso grande Gauss (che, d’altra parte, ha spesso anticipato il lavoro di altri matematici). Vi è un importante teorema matematico di topologia, noto come «teorema di Gauss-Bonnet», che può essere elegantemente dimostrato con l’uso della cosiddetta «applicazione di Gauss». Sembra però che questo teorema sia effettivamente dovuto a Blaschke e che la sua elegante dimostrazione sia stata scoperta da Olinde Rodrigues. Appare che né il risultato né il procedimento di dimostrazione fossero conosciuti da Gauss o da Bonnet. Vi è un teorema di «Gauss-Bonnet» più elementare, correttamente citato in testi precedenti, vedi Willmore (1959), anche Rindler (2001).

12. La principale prova sperimentale per la struttura globale dell’universo deriva da una dettagliata analisi della cosmic microwave background radiation (CMB) che sarà discussa in §§27.7, 10, 11, 13, §§28.5, 10 e §30.14. Un riferimento fondamentale è de Bernardis et al. (2000); per dati più accurati e più recenti, vedi Netterfield et al. (2001) (riguardo a BOOMERanG). Vedi anche Hannay et al. (2000) (riguardo a MAXIMA) e Halverson et al. (2001) (riguardo a DASI).

13. Vedi Gurzadyan e Torres (1997) e Gurzadyan e Kocharian (1994) per le basi teoriche, e Gurzadyan e Kocharian (1992) (per i dati COBE) e Gurzadyan et al. (2002, 2003) (per i dati BOOMERanG e (2004) per i dati WMAP) per la corrispondente analisi dei dati CMB.

[2.1] Dimostra che se vale la forma d’Euclide del postulato della parallela, allora la conclusione di Playfair dell’unicità delle parallele ne deve essere una conseguenza.

[2.2] Ne comprendi il motivo?

[2.3] Prova a dimostrare che, secondo questa formula, se A, B e C sono tre punti successivi su una retta iperbolica, allora le distanze iperboliche «AB», eccetera soddisfano la relazione «AB» + «BC» = «AC». Puoi assumere la proprietà generale dei logaritmi, log (ab) = log a + log b, che sarà descritta in §5.2 e §5.3.

[2.4] Dimostralo. (Suggerimento: puoi usare, se vuoi, la geometria di Beltrami illustrata in fig. 2.17.)

[2.5] Assumendo queste esposte proprietà della proiezione stereografica e della rappresentazione conforme della geometria iperbolica, dimostra che la rappresentazione semisferica di Beltrami ha le proprietà enunciate nel testo.

[2.6] Sapresti dimostrare queste proprietà? (Suggerimento: dimostra, nel caso di circonferenze, che il cono di proiezione è intersecato da due piani d’inclinazione esattamente opposta.)

[2.7] Vedi se sei capace di fare qualcosa di simile, ma con pentagoni regolari e quadrati iperbolici.

[2.8] Tenta di dimostrare questa formula, impiegando fondamentalmente solo argomenti di simmetria e il fatto che l’area di una sfera è 4πR². Suggerimento: comincia col trovare l’area di una porzione sferica limitata da due cerchi massimi che connettono una coppia di punti agli antipodi sulla sfera; poi taglia e incolla e impiega argomenti di simmetria. Tieni a mente la fig. 2.20.

3.1 Una catastrofe pitagorica?

Ritorniamo ora al problema della dimostrazione per assurdo, quel principio che Saccheri cercò disperatamente di impiegare nel suo tentativo di dimostrare il quinto postulato di Euclide. Nella matematica classica vi sono molti casi in cui questo principio è stato applicato con successo. Uno dei più famosi risale ai pitagorici e regolò un problema matematico in un modo che li turbò molto. Il problema era il seguente: si può trovare un numero razionale (vale a dire una frazione) il cui quadrato sia esattamente il numero 2? La risposta fu «no» e l’asserzione matematica che dimostrerò tra poco riguarda proprio il fatto che un simile numero razionale non esiste.

Perché i pitagorici furono così turbati da questa scoperta? Si ricordi che una frazione è qualcosa che può essere espresso come il rapporto a/b di due interi a e b (dove «intero» significa «numero intero»), in cui b è diverso da zero. (Vedi la Prefazione per la definizione di «frazione».) Inizialmente i pitagorici avevano sperato che tutta la loro geometria potesse essere espressa in termini di lunghezze misurabili attraverso numeri razionali. I numeri razionali sono quantità abbastanza semplici, essendo descrivibili e comprensibili in semplici termini finiti; possono tuttavia essere impiegati per specificare distanze, grandi o piccole quanto vogliamo. Se tutta la geometria potesse essere fatta con i numeri razionali, ciò renderebbe le cose relativamente semplici e facilmente comprensibili. La nozione di numero «irrazionale», d’altra parte, richiede procedimenti infiniti, e ciò aveva presentato considerevoli difficoltà per gli antichi (per motivi più che validi). Perché vi è una difficoltà nel fatto che non esista nessun numero razionale il cui quadrato sia 2? Questa difficoltà deriva proprio dal teorema di Pitagora. Se, nella geometria euclidea, abbiamo un quadrato il cui lato ha lunghezza 1, allora la lunghezza della sua diagonale è un numero il cui quadrato è 1² + 1² = 2 (vedi fig. 3.1). Per una geometria sarebbe veramente una catastrofe se non vi fosse nessun numero effettivo che potesse descrivere la lunghezza della diagonale di un quadrato. I pitagorici tentarono dapprima di cavarsela con una nozione di «numero effettivo» che potesse essere descritta semplicemente in termini di rapporti di numeri interi. Vediamo perché questo non funziona.

Fig. 3.1 Un quadrato di lato unitario ha diagonale per il teorema di Pitagora.

Fig. 3.1 Un quadrato di lato unitario ha diagonale ,per il teorema di Pitagora.

Il problema è di vedere perché l’equazione

non ha nessuna soluzione con a e b interi, quando supponiamo che questi interi siano positivi. Useremo la «dimostrazione per assurdo» per verificare che numeri simili non esistono effettivamente. Cerchiamo quindi di supporre che invece esistano un tale a e un tale b. Moltiplicando entrambi i membri dell’equazione precedente per b², troviamo che essa diventa

a² = 2b²

e concludiamo¹ che evidentemente a² > b² > 0. Il membro di destra di quest’equazione, 2b², è pari, perciò a deve essere pari (non dispari, poiché il quadrato di qualunque numero dispari è dispari). Quindi a = 2c, per qualche intero positivo c. Sostituendo 2c ad a nell’equazione precedente ed elevando al quadrato, otteniamo

4c² = 2b²

cioè (dividendo entrambi i membri per 2)

b² = 2c²

e concludiamo che b² > c² > 0. Questa è esattamente l’equazione di prima, solo che b rimpiazza a e c rimpiazza b. Si noti che i corrispondenti interi sono più piccoli di quelli di prima. Possiamo ora ripetere il procedimento molte volte, ottenendo una successione senza fine di equazioni

a² = 2b², b² = 2c², c² = 2d², d²= 2e², …,

dove

a² > b² > c² > d² > e² > …,

tutti questi interi essendo positivi. Qualsiasi successione decrescente di interi positivi deve però finire, in contraddizione con il fatto che questa successione è senza fine. Ciò ci fornisce una contraddizione con quello che era stato supposto, e precisamente che vi è un numero razionale il cui quadrato è 2. Ne segue che un simile numero razionale non esiste, come si voleva dimostrare.²

Si prendano ora in considerazione alcuni punti di questo ragionamento. In primo luogo, secondo le normali procedure di dimostrazione matematica, in questo ragionamento si è fatto ricorso a certe proprietà dei numeri che sono state ritenute o «ovvie» o dimostrate in precedenza. Per esempio, abbiamo utilizzato il fatto che il quadrato di un numero dispari è sempre dispari e inoltre che se un intero non è dispari, allora è pari. Altro fatto fondamentale al quale abbiamo fatto ricorso è quello per cui ogni successione rigorosamente decrescente di interi positivi deve terminare.

Uno dei motivi per cui può essere importante identificare con precisione le assunzioni che entrano in una dimostrazione – anche se alcune di queste assunzioni potrebbero essere perfettamente «ovvie» – è che i matematici sono spesso interessati a tipi di entità diversi da quelli di cui si occupava la dimostrazione originaria. Se tali entità soddisfano le medesime assunzioni, allora la dimostrazione andrà ancora bene e si vedrà che l’asserzione dimostrata ha una generalità maggiore di quella inizialmente supposta, in quanto si applica anche a queste altre entità. D’altra parte, se alcune delle assunzioni necessarie non valgono per queste entità alternative, allora può succedere che l’asserzione sia falsa per queste entità. (Per esempio, è importante rendersi conto che, nelle dimostrazioni del teorema di Pitagora mostrate in §2.2, è stato usato il postulato della parallela; infatti, il teorema risulta falso per la geometria iperbolica.)

Nel ragionamento spiegato precedentemente, le entità iniziali sono intere e ci occupiamo di quei numeri – i numeri razionali – che sono costruiti come quozienti di interi. È proprio vero che nessuno di simili numeri ha per quadrato 2. Ma vi sono altri tipi di numero, oltre a quelli interi e razionali. In realtà, la necessità di avere la radice quadrata di 2 spinse gli antichi greci, assolutamente contro la loro volontà, ad andare oltre i confini dei numeri interi e razionali, i soli tipi di numero che fino ad allora erano stati preparati ad accettare. Il tipo di numero cui furono condotti fu quello che noi ora chiamiamo «numero reale»: un numero che esprimiamo in termini di uno sviluppo decimale senza fine (anche se un simile sviluppo era ancora ignoto agli antichi greci). In effetti, 2 ha proprio una radice quadrata che è un numero reale, e precisamente (come lo scriveremmo noi adesso)

= 1.414 213 562 373 095 048 801 688 72…

Prenderemo in considerazione lo stato fisico di questi numeri «reali» più da vicino nella prossima sezione.

A titolo di curiosità, possiamo chiederci perché la precedente dimostrazione della non esistenza di una radice quadrata di 2 fallisce per i numeri reali (o per i rapporti di numeri reali, che è la stessa cosa). Che cosa succede se in tutto il ragionamento rimpiazziamo «intero» con «numero reale»? La differenza fondamentale è che non è vero che qualsiasi successione strettamente decrescente di numeri reali positivi (o persino di frazioni) debba terminare, e il ragionamento quindi fallisce a questo punto.³ (Consideriamo, per esempio, la successione infinita ) Ci si potrebbe preoccupare del significato di numero reale «pari» o «dispari» in questo contesto; ma, in effetti, il ragionamento non incontra alcuna difficoltà a quel punto perché tutti i numeri reali dovrebbero essere ritenuti «pari», poiché per qualsiasi reale a vi è sempre un reale c tale che a = 2c, essendo la divisione per 2 sempre possibile per i numeri reali.

3.2 Il sistema dei numeri reali

In questo modo i greci furono costretti a capire che i numeri razionali non erano sufficienti, se le idee della geometria (di Euclide) dovevano essere opportunamente sviluppate. Oggigiorno non ci preoccupiamo eccessivamente se una certa quantità geometrica non può essere misurata soltanto in termini dei soli numeri razionali. Ciò accade perché la nozione di «numero reale» ci è molto familiare. Anche se i nostri calcolatori tascabili esprimono i numeri solo in termini di un numero finito di cifre, possiamo facilmente accettare che questa è un’approssimazione impostaci dal fatto che il calcolatore è un oggetto finito. Siamo pronti ad ammettere che il numero matematico ideale (platonico) potrebbe certamente richiedere che lo sviluppo decimale continui indefinitamente. Questo si applica anche, naturalmente, alla rappresentazione decimale della maggior parte delle frazioni, come

Lo sviluppo decimale, per una frazione, è sempre alla fine periodico, il che vuol dire che dopo un certo punto la successione infinita di cifre è formata da una sequenza finita che si ripete indefinitamente. Negli esempi precedenti le sequenze ripetute sono rispettivamente 3, 6, 285714 e 135.

Questi sviluppi decimali erano ignoti agli antichi greci, che avevano però propri modi di trattare i numeri irrazionali. Quello che adottarono fu, in effetti, un sistema di rappresentazione dei numeri in termini di quelle che ora sono chiamate frazioni continue. Non vi è alcun bisogno di addentrarsi nei dettagli, ma alcuni brevi commenti sono opportuni. Una frazione continua⁴ è un’espressione limitata o illimitata del tipo a + (b + (c + (d + …)^–1)^–1)^–1, dove a, b, c, d, … sono numeri interi positivi:

Qualsiasi numero razionale più grande di 1 può essere scritto come un’espressione limitata di questo tipo (dove, per evitare ambiguità, normalmente richiediamo che l’intero finale sia maggiore di 1), per esempio 52/9 = 5 + (1 + (3 + (2)^–1)^–1)^–1:

mentre, per rappresentare un razionale positivo minore di 1, permettiamo che il primo intero dell’espressione sia zero. Per esprimere un numero reale, che non sia razionale, permettiamo semplicemente^[3.1] che la frazione continua prosegua per sempre, come per esempio⁵

Nei primi due di questi esempi illimitati, le sequenze di numeri naturali che appaiono – vale a dire 1, 2, 2, 2, 2, … nel primo caso e 5, 3, 1, 2, 1, 2, 1, 2, … nel secondo – hanno la proprietà di essere infine periodiche (col 2 che si ripete indefinitamente nel primo caso, mentre nel secondo si ripete indefinitamente la sequenza 1, 2).^[3.2] Ricordate che, come già fatto notare prima, nella familiare notazione decimale sono i numeri razionali ad avere espressioni (finite o) infine periodiche. Possiamo ritenere che sia un punto di forza della rappresentazione greca in termini di «frazioni continue» il fatto che i numeri razionali abbiano sempre, in questo caso, una descrizione limitata. Chiediamoci adesso: quali numeri hanno una rappresentazione infine periodica in termini di frazioni continue? Un notevole teorema, dimostrato per la prima volta, per quanto ne sappiamo, dal grande matematico del diciottesimo secolo Joseph C. Lagrange (incontreremo successivamente, in particolare nel capitolo 20, le sue idee più importanti), afferma che i numeri la cui rappresentazione in frazioni continue diventa infine periodica sono quelli chiamati irrazionali quadratici.⁶

Che cos’ è un irrazionale quadratico e quale è la sua importanza per la geometria degli antichi greci? È un numero che può essere scritto nella forma

dove a e b sono frazioni e b non è un quadrato perfetto. Tali numeri sono importanti nella geometria euclidea perché sono i numeri irrazionali più immediati che si incontrano nelle costruzioni con riga e compasso. (Ricordate il teorema di Pitagora che in §3.1 ci ha portato a considerare il problema di , mentre altre semplici costruzioni euclidee ci portano direttamente ad altri numeri di questa forma.)

Esempi particolari di irrazionali quadratici sono quelli in cui a = 0 e b è un numero naturale (che non è un quadrato o un numero razionale maggiore di 1):

La rappresentazione in frazione continua di un simile numero è particolarmente notevole. La sequenza di numeri naturali che compare nella sua espressione come frazione continua ha una curiosa proprietà caratteristica. Inizia con un qualche numero A, poi è seguita da una sequenza «palindroma» (in altre parole una che è eguale letta nei due sensi), B, C, D, …, D, C, B, seguita da 2A, dopo di che la sequenza B, C, D, …, D, C, B, 2A si ripete indefinitamente. Il numero ne è un buon esempio; per esso la sequenza è

3, 1, 2, 1, 6, 1, 2, 1, 6, 1, 2, 1, 6, 1, 2, 1, 6, ….

In questo caso A = 3 e la sequenza palindroma B, C, D, …, D, C, B è la sequenza dei tre termini 1, 2, 1.

Quanto di tutto ciò era noto agli antichi greci? Sembra che ne sapessero molto – molto probabilmente tutto quello che ho descritto prima (teorema di Lagrange incluso), nonostante non avessero dimostrazioni rigorose per ogni cosa. Sembra che il contemporaneo di Platone, Teeteto, abbia dimostrato molto di tutto questo e sembra persino che vi sia qualche prova di questa conoscenza (incluse le sequenze palindrome che si ripetono di cui si è detto prima) rivelata nella dialettica di Platone.⁷

Anche se l’inclusione degli irrazionali quadratici ci fa procedere verso numeri adeguati per la geometria euclidea, non ci fornisce però tutto quello che è necessario. Nel decimo libro (il più difficile) di Euclide sono considerati numeri come (dove a e b sono razionali positivi). Questi non sono in generale irrazionali quadratici, ma ciononostante compaiono in costruzioni con riga e compasso. I numeri sufficienti per tali costruzioni geometriche sarebbero quelli che possono essere costruiti dai numeri naturali con l’uso ripetuto delle operazioni di addizione, sottrazione, moltiplicazione, divisione ed estrazione di radice quadrata. Ma diventa veramente complicato operare esclusivamente con tali numeri, che inoltre sono ancora insufficienti per considerazioni di geometria euclidea che vadano al di là di costruzioni con riga e compasso. È molto più soddisfacente fare il passo audace – e quanto sia realmente audace lo si vedrà in §§16.3-5 – di permettere espressioni in frazioni continue infinite che siano del tutto generali. Questo fornì agli antichi greci un modo di descrivere numeri che si rivelò completamente adeguato per la geometria euclidea.

Questi numeri sono in realtà, con terminologia moderna, i cosiddetti «numeri reali». Anche se si ritiene che una definizione completamente soddisfacente di questi numeri non sia stata trovata fino al diciannovesimo secolo (con il lavoro di Dedekind, Cantor e altri), i grandi matematici della Grecia antica e l’astronomo Eudosso, che era stato uno dei discepoli di Platone, avevano ottenuto le idee essenziali già nel quarto secolo a. C. È qui opportuno dire qualcosa sulle idee di Eudosso.

Notiamo, per prima cosa, che i numeri nella geometria euclidea possono essere espressi in termini di rapporti di lunghezze, invece che direttamente in termini di lunghezze. In questo modo non era necessaria nessuna specifica unità di lunghezza (come il «cm» o il «pollice»). Inoltre, con rapporti di lunghezze, non vi sarebbe stata nessuna restrizione per il numero di tali rapporti moltiplicabili tra loro (evitando l’evidente bisogno di «ipervolumi» quando più di tre lunghezze erano moltiplicate insieme). Il primo passo nella teoria di Eudosso era quello di fornire un criterio per stabilire quando un rapporto di lunghezze a : b sarebbe stato maggiore di un altro rapporto c : d. Questo criterio era l’esistenza di interi positivi M e N tali che la lunghezza a addizionata a se stessa M volte superasse b addizionato a se stesso N volte, mentre anche d addizionato a se stesso N volte superava c addizionato a se stesso M volte.^[3.3] Un criterio simile esprimeva la condizione che il rapporto a : b fosse minore del rapporto c : d. Se nessuno di questi due criteri valeva, allora i due rapporti sarebbero stati eguali. Con questa ingegnosa nozione di «eguaglianza» Eudosso aveva, in effetti, un concetto astratto di «numero reale» in termini di rapporto di lunghezze. Egli fornì anche regole per la somma e il prodotto di questi numeri reali.^[3.4]

Vi era tuttavia una differenza fondamentale di punto di vista tra la nozione greca di numero reale e quella moderna, perché i greci ritenevano che il sistema numerico ci fosse fondamentalmente «dato» in termini della nozione di distanza nello spazio fisico, così che il problema era di tentare di accertare come queste misure di «distanza» si comportassero effettivamente. Infatti, sembrava che lo «spazio» fosse esso stesso un assoluto platonico, anche se i reali oggetti fisici esistenti in questo spazio non sarebbero stati inevitabilmente all’altezza dell’ideale platonico.⁸ (Tuttavia, vedremo in §17.9 e in §§19.6,8 come la teoria della relatività generale di Einstein abbia trasformato, in modo fondamentale, questo punto di vista su spazio e materia.)

Un oggetto fisico, come un quadrato tracciato sulla sabbia o un cubo scavato dal marmo, potrebbe essere stato considerato dagli antichi greci una ragionevole o alcune volte un’eccellente approssimazione all’ideale geometrico platonico. Tuttavia qualunque oggetto simile fornirebbe solo un’approssimazione. Dietro tali approssimazioni – così sarebbe apparso – vi sarebbe lo spazio stesso: un’entità di una tal esistenza astratta o immaginaria che potrebbe essere considerata una realizzazione diretta di una realtà platonica. La misura della distanza in questa geometria ideale sarebbe qualcosa da accertare; di conseguenza, sarebbe appropriato cercare di estrarre questa nozione ideale di numero reale da una geometria dello spazio euclideo che era ritenuta data. Fu, in effetti, questo che Eudosso riuscì a fare.

Entro i secoli diciannovesimo e ventesimo, tuttavia, nacque l’opinione che la nozione matematica di numero dovesse essere separata dalla natura dello spazio fisico. Poiché era stato dimostrato che esistevano geometrie matematicamente coerenti diverse da quella di Euclide, sembrava ingiustificato continuare a insistere che la nozione matematica di «geometria» fosse necessariamente estratta dalla supposta natura del «reale» spazio fisico. Inoltre, potrebbe essere molto difficile, se non impossibile, accertare la natura dettagliata di questa supposta e fondamentale «geometria fisica platonica» in termini del comportamento di oggetti fisici imperfetti. Per esempio, per conoscere la natura dei numeri secondo cui deve essere definita la «distanza geometrica», sarebbe necessario sapere quello che avviene sia a distanze infinitamente piccole sia a distanze infinitamente grandi. Persino oggigiorno, tali questioni non sono chiaramente risolte (e le affronterò ancora in capitoli successivi). Era, dunque, decisamente più opportuno sviluppare la natura di numero senza riferirsi direttamente a misure fisiche; di conseguenza, Richard Dedekind e Georg Cantor svilupparono le loro idee su ciò che «sono» i numeri reali, con l’uso di nozioni che non si riferiscono direttamente alla geometria.

La definizione di Dedekind di numero reale è in termini di insiemi infiniti di numeri razionali. Sostanzialmente pensiamo che i numeri razionali, sia positivi sia negativi (e anche lo zero), siano disposti in ordine di grandezza. Possiamo immaginare che questo ordinamento avvenga da sinistra a destra, pensando che i razionali negativi si estendano indefinitamente a sinistra, con 0 nel mezzo, e che i razionali positivi si estendano indefinitamente a destra. (Questo solo a scopo di visualizzazione; in effetti, la procedura di Dedekind è completamente astratta.) Dedekind immagina un «taglio» che separi nettamente questa disposizione in due, poiché tutti i numeri alla sinistra del taglio sono più piccoli di tutti quelli alla destra. Quando la «lama del coltello» non «colpisce» effettivamente un numero razionale ma cade tra essi, allora affermiamo che definisce un numero reale irrazionale. Più esattamente, ciò avviene quando quelli alla sinistra non hanno alcun elemento massimo e quelli alla destra nessun elemento minimo. Quando il sistema di «irrazionali», come definiti da questi tagli, è aggiunto al sistema di numeri razionali che già abbiamo, allora si ottiene la famiglia completa di numeri reali.

Il procedimento di Dedekind conduce direttamente, per mezzo di definizioni semplici, alle leggi di addizione, sottrazione, moltiplicazione e divisione dei numeri reali. Inoltre, ci consente di andare oltre e definire limiti, mediante i quali alla frazione continua infinita

1 + (2 + (2 + (2 + (2 + …)^{– 1})^{– 1})^{– 1})^{– 1}

o alla somma infinita

può essere assegnato un certo numero reale. In effetti, la prima ci dà il numero irrazionale , e la seconda L’operazione di passaggio al limite è fondamentale per molte nozioni matematiche, ed è questo che conferisce ai numeri reali la loro particolare forza.⁹ (Il lettore ricordi che la necessità di «procedimenti di limite» era una richiesta per la definizione generale di area, com’è stato indicato in §2.3.)

3.3 Numeri reali nel mondo fisico

Quello che è qui accennato è un problema profondo. Nello sviluppo delle idee matematiche, un importante stimolo iniziale è sempre stato quello di trovare strutture matematiche che rispecchino effettivamente il comportamento del mondo fisico; di solito però non è possibile esaminare il mondo fisico con un’accuratezza tale da poter astrarre direttamente da esso nozioni matematiche adeguatamente chiare. Si progredisce, invece, perché le nozioni matematiche tendono ad avere un «impulso» per loro conto che sembra scaturire quasi interamente dal loro stesso interno. Le idee matematiche si sviluppano, e sembra che i diversi problemi sorgano naturalmente. Alcuni di questi (come il caso del problema di trovare la lunghezza della diagonale di un quadrato) possono condurre a un’essenziale estensione degli stessi concetti matematici, in termini dei quali il problema era stato originariamente formulato. Sembra che tali estensioni ci siano imposte, o che possano nascere in modi che appaiono essere questioni di convenienza, coerenza o eleganza matematica. Di conseguenza, può sembrare che lo sviluppo della matematica si allontani da ciò che si era stabilito di ottenere, e precisamente di riflettere semplicemente il comportamento fisico. Tuttavia, in molti casi, questa stessa spinta alla coerenza ed eleganza matematica ci porta a strutture e concetti matematici che rispecchiano il mondo fisico in un modo più profondo e più ampio di quelli con cui eravamo partiti. È come se la stessa Natura fosse guidata dal medesimo tipo di criteri di coerenza ed eleganza che guidano il pensiero matematico umano.

Un esempio è il sistema stesso dei numeri reali. Non abbiamo alcuna prova diretta dalla Natura che vi sia una nozione fisica di «distanza» che si estenda a scale arbitrariamente grandi; ancora meno vi sono prove che una simile nozione possa essere applicata all’indefinitamente piccolo. In verità, non vi è alcuna prova che esistano effettivamente «punti nello spazio» in accordo con una geometria che fa esattamente uso di distanze espresse da numeri reali. All’epoca di Euclide vi erano scarse prove persino per appoggiare l’opinione che simili distanze «euclidee» si estendessero al di là di circa, diciamo, 10¹² metri,¹⁰ o al di sotto di 10^–5 metri. Tuttavia, essendo stati guidati matematicamente dalla coerenza ed eleganza del sistema dei numeri reali, fino a oggi tutte le nostre teorie fisiche di ampia portata e successo hanno mantenuto senza eccezione questa antica nozione di «numero reale». Pare che la nostra fede nel sistema dei numeri reali sia stata ricompensata, sebbene l’evidenza disponibile all’epoca di Euclide sembrerebbe non giustificarla molto. Infatti, le nostre apprezzate teorie cosmologiche moderne ci consentono di estendere l’ambito delle distanze espresse da numeri reali fino a circa 10²⁶ metri o più, mentre l’accuratezza delle teorie della fisica delle particelle estende questo ambito in basso fino a 10^–17 metri o meno. (La sola scala per cui è seriamente ipotizzabile un cambiamento è circa diciotto ordini di grandezza più piccola, e precisamente 10^–35 metri. Si tratta della «scala di Planck» della gravità quantistica che sarà spesso presente in alcune delle nostre successive discussioni; vedi §§31.1,6-12,14 e §32.7.) Si può ritenere una notevole giustificazione del nostro uso di idealizzazioni matematiche il fatto che l’intervallo di validità del sistema dei numeri reali si sia esteso, dal più piccolo al più grande, da un totale di circa 10¹⁷, che sembrava appropriato all’epoca di Euclide, fino a quel valore di almeno 10⁴³, che le nostre teorie usano oggigiorno. Questo è un incremento per un fattore di circa 10²⁶.

Ma vi è ancora molto più di questo per la validità fisica del sistema dei numeri reali. In primo luogo dobbiamo considerare che anche le aree e i volumi sono quantità per cui le misure in numeri reali sono appropriate. Una misura di volume è il cubo di una misura di distanza (e un’area è il quadrato di una distanza). Di conseguenza, nel caso dei volumi, dobbiamo considerare significativo il cubo dell’intervallo di sopra. Per l’epoca d’Euclide, questo ci darebbe un intervallo di circa (10¹⁷)³ = 10⁵¹; per le attuali teorie, almeno (10⁴³)³ = 10¹²⁹. Vi sono inoltre altre misure fisiche che, secondo le nostre attuali teorie di successo, richiedono descrizioni in termini di numeri reali. La più importante di queste è il tempo. Secondo la teoria della relatività, questo deve essere aggiunto allo spazio per fornirci lo spazio-tempo (che sarà il soggetto delle nostre discussioni nel capitolo 17). I volumi di spazio-tempo sono a quattro dimensioni; si potrebbe quindi ritenere che l’intervallo temporale (che è ancora di circa 10⁴³ o più, nelle nostre ben verificate teorie) debba essere incluso nelle nostre considerazioni, dando un totale di almeno 10¹⁷². Vedremo che alcuni numeri reali notevolmente più grandi persino di questo compariranno nelle nostre ulteriori considerazioni (vedi §27.13, §28.7), anche se non appare veramente chiaro, in alcuni casi, come l’uso di numeri reali (invece che, per esempio, d’interi) sia essenziale.

Più importante per la teoria fisica, a partire da Archimede, passando per Galilei e Newton, fino ad arrivare a Maxwell, Einstein, Schrödinger, Dirac e tutti gli altri, è stato il ruolo cruciale che il sistema dei numeri reali ha avuto nel fornire la struttura necessaria alla formulazione standard del calcolo infinitesimale (vedi capitolo 6). Tutte le affermate teorie dinamiche hanno infatti richiesto nozioni del calcolo infinitesimale per la loro formulazione. Ora, l’approccio convenzionale al calcolo infinitesimale richiede che la natura infinitesimale dei reali sia definita. Cioè, all’estremità piccola della scala, è l’intero intervallo dei numeri reali a essere adoperato in linea di principio. L’impiego delle idee del calcolo infinitesimale è ciò che sta alla base di altre nozioni fisiche, come la velocità, la quantità di moto e l’energia. Di conseguenza, il sistema dei numeri reali entra in modo fondamentale nelle nostre affermate teorie fisiche anche per la descrizione di tutte queste quantità. Qui, come menzionato in precedenza in relazione alle aree, in §2.3 e §3.2, si fa ricorso al limite infinitesimale della struttura su piccola scala del sistema dei numeri reali.

Malgrado ciò, possiamo ancora chiederci se il sistema dei numeri reali sia realmente «corretto» per la descrizione della realtà fisica ai suoi livelli più profondi. All’inizio del ventesimo secolo, quando le idee quantistiche cominciavano a essere introdotte, vi era la sensazione che forse stavamo iniziando a vedere una natura discreta o granulare nel mondo fisico, sulle sue scale più ridotte.¹¹ Sembrava che l’energia potesse esistere solo in quantità discrete – o «quanti» – e che le quantità fisiche di «azione» e «spin» si presentassero solo in multipli interi di un’unità fondamentale (vedi §§20.1,5 per il concetto classico di azione e §26.6 per la sua controparte quantistica; vedi §§22.8,12 per lo spin). Di conseguenza, vari fisici tentarono di costruire un quadro alternativo del mondo, in cui processi discreti governavano tutte le azioni ai più piccoli livelli.

Tuttavia questa teoria, per come adesso comprendiamo la meccanica quantistica, non ci costringe (e neppure ci porta) all’opinione che vi sia, ai suoi più piccoli livelli, una natura discreta o granulare per lo spazio, il tempo o l’energia (vedi capitoli 21 e 22, in particolare l’ultima frase di §22.13). Ci è rimasta comunque l’idea che vi possa essere davvero, alla radice della Natura, una simile fondamentale discretezza, nonostante la meccanica quantistica, nella sua formulazione standard, certamente non implichi ciò. Il grande fisico quantistico Erwin Schrödinger, per esempio, fu tra i primi a proporre l’effettiva necessità di passare a qualche forma di granulosità spaziale:¹²

L’idea di una gamma continua, così familiare ai matematici di oggi, è qualcosa del tutto eccessiva, un’enorme estrapolazione di quello che ci è accessibile.

Egli collegò questa proposta ad alcune riflessioni dei primi greci sulla discretezza della Natura. Lo stesso Einstein, nei suoi ultimi scritti, suggerì che una teoria «algebrica» basata su una granulosità potesse essere la via per la fisica futura:¹³

Si possono dare buoni motivi per pensare che la realtà non possa essere rappresentata come un campo continuo… Fenomeni quantistici… devono condurre a un tentativo di trovare una teoria puramente algebrica per la descrizione della realtà. Ma nessuno sa come ottenere i fondamenti di una simile teoria.¹⁴

Anche altri¹⁵ seguirono, successivamente, idee di questo genere (vedi §33.1). Io stesso, alla fine degli anni Cinquanta, tentai qualcosa del genere, proponendo uno schema che chiamai teoria delle «reti di spin», in cui la natura discreta dello spin quantistico è considerata la pietra fondamentale per un approccio combinatorio (in altre parole discreto, invece che basato sui numeri reali) alla fisica. (Questo schema sarà descritto brevemente in §32.6.) Anche se le mie idee in questa particolare direzione non diedero luogo a una teoria completa (ma, in qualche misura, furono trasformate più tardi, come per magia, nella «teoria dei twistor», vedi §33.2), la teoria delle reti di spin è stata ora introdotta da altri in uno dei maggiori programmi per attaccare il problema fondamentale della gravità quantistica.¹⁶ Darò brevi descrizioni di queste idee nel capitolo 32. Ciononostante, visto l’attuale stato della teoria fisica – com’è avvenuto per i passati ventiquattro secoli – i numeri reali costituiscono ancora un ingrediente fondamentale della nostra comprensione del mondo fisico.

3.4 I numeri naturali hanno bisogno del mondo fisico?

Nella descrizione, in §3.2, dell’approccio di Dedekind al sistema dei numeri reali, ho presupposto che i numeri razionali fossero già conosciuti. In effetti, il passaggio dai numeri interi a quelli razionali non è difficile; i numeri razionali sono soltanto rapporti di interi (vedi la Prefazione). Cosa dire, allora, degli stessi numeri interi? Affondano le loro radici in idee fisiche? Gli approcci discreti alla fisica, cui abbiamo fatto riferimento nei due precedenti paragrafi, dipendono certamente dalla nostra nozione di numero naturale (cioè, il numero che serve per contare) e dalla sua estensione, con l’inclusione dei numeri negativi, agli interi. I greci non ritenevano che i numeri negativi fossero veri «numeri»: continuiamo quindi le nostre riflessioni interrogandoci, dapprima, sullo stato fisico degli stessi numeri naturali.

I numeri naturali sono le quantità che adesso indichiamo con 0, 1, 2, 3, 4, eccetera. Sono cioè i numeri interi non negativi. (La tendenza moderna è di includere 0 in questa lista, il che è una cosa opportuna da fare dal punto di vista matematico, anche se sembra che gli antichi greci non attribuissero allo zero lo status di vero «numero». Per questo si dovettero aspettare i matematici indiani, a partire da Brahmagupta nel settimo secolo per proseguire con Mahavira e Bhaskara nel nono e dodicesimo secolo rispettivamente.) Il ruolo dei numeri naturali è chiaro e non ambiguo: essi sono proprio i più elementari «numeri per contare», quelli che hanno un ruolo fondamentale quali che siano le leggi della geometria o della fisica. I numeri naturali sono soggetti a certe operazioni molto note, in particolare alle operazioni di addizione (come 37 + 79 = 116) e di moltiplicazione (per esempio, 37 × 79 = 2923), che permettono che coppie di numeri naturali siano combinate per formare nuovi numeri naturali. Queste operazioni sono indipendenti dal tipo di geometria del mondo.

Possiamo tuttavia chiederci se i numeri naturali hanno in sé e per sé un significato o un’esistenza, indipendentemente dalla reale natura del mondo fisico. Forse la nostra nozione dei numeri naturali dipende dal fatto che vi sono, nel nostro universo, oggetti discreti ragionevolmente ben definiti che durano nel tempo. Dopo tutto, i numeri naturali nascono all’inizio quando desideriamo «contare» le cose, ma ciò sembra dipendere dal fatto che vi siano effettivamente nell’universo «cose» durature e distinguibili, che sono disponibili per essere «contate». Supponiamo, d’altra parte, che il nostro universo sia fatto in modo che i numeri degli oggetti abbiano tendenza a cambiare continuamente. I numeri naturali sarebbero realmente concetti «naturali» in un simile universo? Inoltre, forse l’universo contiene effettivamente soltanto un numero finito di «cose», e nel qual caso i numeri «naturali», a un certo punto, potrebbero terminare! Possiamo persino concepire un universo che sia formato solo da sostanza amorfa indistinta, per cui la nozione stessa di quantificazione numerica potrebbe sembrare intrinsecamente non appropriata. La nozione di «numero naturale» sarebbe del tutto rilevante per la descrizione di universi di questo genere?

Sebbene gli abitanti di un simile universo troverebbero difficile imbattersi nella nostra attuale concezione matematica di «numero naturale», è difficile non immaginare un ruolo importante per entità così fondamentali. Vi sono vari modi con cui i numeri naturali possono essere introdotti nella matematica pura, e sembra che questi non dipendano per niente dall’effettiva natura dell’universo fisico. Fondamentalmente, quello che occorre far entrare in gioco è la nozione astratta di «insieme», poiché questa è una nozione astratta che non sembra preoccuparsi, in qualunque modo essenziale, della specifica struttura dell’universo fisico. In effetti, vi sono certe sottigliezze che riguardano tale questione, su cui ritornerò in seguito (in §16.5). Per il momento, sarà opportuno ignorare tali sottigliezze.

Consideriamo un modo (anticipato da Cantor e promosso dall’eminente matematico John von Neumann) in cui i numeri naturali possono essere introdotti, usando soltanto la nozione astratta di insieme. Questo procedimento ci consente di definire quelli che vengono chiamati «numeri ordinali». Il più semplice di tutti gli insiemi è chiamato «insieme nullo» o «insieme vuoto», ed è caratterizzato dal fatto che non contiene alcun membro di qualunque genere! L’insieme vuoto è di solito indicato dal simbolo ∅ e possiamo scrivere questa definizione come

∅ = { },

dove le parentesi graffe descrivono un insieme, il particolare insieme in esame avendo come membri le quantità indicate entro parentesi. In questo caso non vi è niente entro le parentesi, così che l’insieme descritto è proprio l’insieme vuoto. Associamo ∅ al numero naturale 0. Possiamo ora procedere oltre e definire l’insieme il cui solo elemento è ∅, vale a dire l’insieme {∅}. È importante comprendere che {∅} non è uguale all’insieme vuoto ∅. L’insieme {∅} ha un elemento (e precisamente ∅) mentre ∅ non ne ha nessuno. Associamo {∅} al numero naturale 1. Definiamo poi l’insieme i cui due elementi sono i due insiemi che abbiamo appena incontrato, e precisamente ∅ e {∅}, così questo nuovo insieme è {∅, {∅}}, che deve essere associato al numero naturale 2. Associamo poi a 3 la collezione di tutte e tre le entità che abbiamo incontrato fino a questo punto, e precisamente l’insieme {∅, {∅}, {∅, {∅}}}, e a 4 l’insieme {∅, {∅}, {∅, {∅}}, {∅, {∅}, {∅, {∅}}}}, i cui elementi sono ancora quelli prima incontrati, e così via. Questo può non essere il modo con cui di solito pensiamo ai numeri naturali, per quanto riguarda la loro definizione, ma è uno dei modi con cui i matematici possono arrivare al loro concetto (confronta tutto ciò con la discussione nella Prefazione). Inoltre ci fa vedere per lo meno che cose come i numeri naturali¹⁷ possono essere fatte letteralmente apparire dal nulla, impiegando soltanto la nozione astratta di «insieme». Otteniamo una successione infinita di entità matematiche astratte (platoniche) – insiemi contenenti, rispettivamente, zero elementi, un elemento, due elementi, tre elementi, eccetera, un insieme per ciascuno dei numeri naturali – del tutto indipendentemente dall’effettiva natura fisica dell’universo. Nella fig. 1.3 abbiamo visualizzato una specie di «esistenza» indipendente per le nozioni matematiche platoniche – in questo caso, i numeri naturali – tuttavia questa «esistenza» può, a quanto sembra, essere evocata (e certamente vi si può accedere tramite esso) dal semplice esercizio delle nostre facoltà mentali, senza alcun riferimento ai dettagli della natura dell’universo fisico. La costruzione di Dedekind inoltre mostra come questo genere «puramente mentale» di procedimento può essere proseguito, permettendoci di «edificare» l’intero sistema dei numeri reali,¹⁸ ancora senza alcun riferimento all’effettiva natura fisica del mondo. Sembra tuttavia, come sopra indicato, che i «numeri reali» abbiano davvero una connessione diretta con la reale struttura del mondo – illustrando la natura molto misteriosa del «primo mistero» rappresentato nella fig. 1.3.

3.5 I numeri discreti nel mondo fisico

Ma sto andando troppo avanti. Ricordiamoci che la costruzione di Dedekind ha fatto realmente uso di insiemi di numeri razionali, non direttamente di numeri naturali. Come è già stato detto in precedenza, non è difficile «definire» ciò che intendiamo per numero razionale una volta che abbiamo la nozione di numero naturale; ma, come passo intermedio, è opportuno definire la nozione di intero, ossia un numero naturale o il negativo di un numero naturale (il numero zero essendo il negativo di se stesso). In un senso formale, non vi è nessuna difficoltà nel dare una definizione matematica di «negativo»; in termini grossolani attacchiamo un «segno», scritto come «–», a ciascun numero naturale (tranne 0) e definiamo tutte le regole matematiche di addizione, sottrazione, moltiplicazione e divisione (tranne la divisione per zero) in modo coerente. Ciò, tuttavia, non risponde alla domanda che riguarda il «significato fisico» di un numero negativo. Che cosa vuol dire, per esempio, che vi sono meno tre vacche in un campo?

Penso sia chiaro che, a differenza dei numeri naturali, non vi è alcun evidente contenuto fisico per la nozione di un numero negativo di oggetti fisici. Gli interi negativi hanno certamente un ruolo organizzativo molto importante, come nei bilanci bancari e in altre transazioni finanziarie. Ma hanno una connessione diretta con il mondo fisico? Quando qui dico «connessione diretta», non mi riferisco a circostanze in cui sembrerebbe che siano numeri reali negativi quelli che sono rilevanti, come quando una distanza misurata in una direzione è contata come positiva, mentre quella misurata nella direzione opposta sarebbe contata come negativa (o la stessa cosa riguardo al tempo, in cui quello che precede un certo istante potrebbe essere contato come negativo). Mi riferisco invece a numeri che sono quantità scalari, nel senso che non vi è in loro alcun aspetto direzionale (o temporale). In queste circostanze sembra che quello che ha una diretta connessione fisica sia il sistema degli interi, sia positivi sia negativi.

È un fatto notevole che solo negli ultimi cento anni sia diventato chiaro che il sistema degli interi sembri avere una simile connessione fisica diretta. Il primo esempio di una quantità fisica che sembra essere appropriatamente quantificata con interi è la carica elettrica.¹⁹ Per quanto se ne sa (anche se non vi è ancora una giustificazione teorica completa di questo fatto), la carica elettrica di qualsiasi particella è davvero quantificata in termini di multipli interi, positivi, negativi, o zero, di un valore particolare, e precisamente la carica del protone (o dell’elettrone, la cui carica è il negativo di quella del protone).²⁰ Adesso si crede che i protoni siano oggetti composti, costituiti in un certo senso da entità più piccole, chiamate «quark» (ed entità addizionali senza carica, chiamate «gluoni»). In ogni protone vi sono tre quark, che hanno cariche elettriche con valori di rispettivamente. La somma di queste tre cariche dà il va

lore totale 1 alla carica del protone. Se i quark sono le entità fondamentali, allora la carica fondamentale è un terzo di quella finora ritenuta tale, ma ciononostante è ancora vero che la carica elettrica è misurata in termini di interi, solo che adesso sono multipli interi di un terzo della carica di un protone. (Il ruolo dei quark e dei gluoni nella moderna fisica delle particelle sarà discusso in §§25.3-7.)

La carica elettrica è solo un esempio di ciò che è chiamato numero quantico additivo. I numeri quantici sono quantità che servono a caratterizzare le particelle della Natura. Un numero quantico, che io qui riterrò essere un numero reale di un qualche genere, è «additivo» se, per ottenere il suo valore per un’entità composta, addizioniamo semplicemente i singoli valori per le particelle costituenti – tenendo naturalmente nel dovuto conto i segni, come nel caso del protone e dei quark che lo costituiscono, come sopra indicato. È un fatto molto sorprendente che, in base allo stato attuale della nostra conoscenza fisica, tutti i numeri quantici additivi noti²¹ siano proprio quantificati in termini del sistema degli interi, non dei più generali numeri reali, e non semplicemente dei numeri naturali – cosicché si trovano veramente valori negativi.

In effetti, secondo la fisica del ventesimo secolo, in un certo modo è sensato parlare di un numero negativo di entità fisiche. Il grande fisico Paul Dirac avanzò, nel 1929-31, la sua teoria delle antiparticelle, secondo la quale (come si comprese più tardi) per ogni tipo di particella vi è anche la relativa antiparticella, per la quale ciascun numero quantico additivo ha esattamente un valore che è il negativo di quello della particella originaria; vedi §§24.2,8. In questo modo sembra davvero che il sistema degli interi (numeri negativi compresi) abbia una chiara importanza per l’universo fisico – un’importanza fisica che è diventata evidente soltanto nel ventesimo secolo, nonostante i molti secoli in cui gli interi sono stati utilissimi in matematica, nel commercio e in molte altre attività umane.

A questo punto tuttavia si dovrebbe fare un’importante precisazione. Anche se è vero che, in un certo senso, un antiprotone è un protone negativo, non è però realmente un «protone meno». Il motivo è che l’inversione di segno si riferisce soltanto ai numeri quantici additivi, mentre la nozione di massa non è additiva nella teoria fisica moderna. Tale questione sarà spiegata, con maggiori dettagli, in §18.7. Un «protone meno» dovrebbe essere un antiprotone la cui massa è il negativo del valore della massa di un comune protone, ma la massa di una particella fisica reale non può essere negativa. Un antiprotone ha la stessa massa del comune protone, e questa è una massa positiva. Vedremo in seguito che, secondo le idee della teoria quantistica dei campi, vi sono elementi chiamati particelle «virtuali» per i quali la massa (o più esattamente l’energia) può essere negativa. Un «protone meno» sarebbe realmente un antiprotone virtuale; ma una particella virtuale non ha un’esistenza indipendente come una «vera particella».

Poniamoci ora la stessa domanda per i numeri razionali. Questo sistema di numeri ha qualche importanza diretta per l’universo fisico? Per quanto se ne sa, non sembra che questo sia il caso, almeno riguardo alla teoria convenzionale. Vi sono alcune curiosità fisiche²² in cui la famiglia dei numeri razionali ha una parte, ma sarebbe difficile sostenere che queste rivelino qualche ruolo fisico fondamentale per i numeri razionali. D’altra parte, può essere che vi sia un ruolo particolare per i razionali in certe fondamentali probabilità quantistiche (una probabilità razionale che potrebbe rappresentare una scelta tra diverse alternative, ciascuna delle quali implica solo un numero finito di possibilità). Questo genere di cose gioca un ruolo nella teoria delle reti di spin, come sarà brevemente descritto in §32.6. Il reale stato di queste idee non è per ora chiaro.

Tuttavia vi sono altri tipi di numeri che, secondo teorie accettate, sembrano davvero giocare un ruolo fondamentale nel funzionamento dell’universo. I più importanti e sorprendenti tra questi sono i numeri complessi, in cui la quantità apparentemente mistica di solito indicata con «i», è stata aggiunta al sistema dei numeri reali. L’utilità matematica di questi numeri complessi, incontrati per la prima volta nel sedicesimo secolo, ma trattati con diffidenza per centinaia d’anni, cominciò gradualmente a impressionare la comunità matematica, finché i numeri complessi divennero un ingrediente indispensabile, perfino magico, del nostro pensiero matematico. Adesso scopriamo che sono fondamentali non solo in campo matematico; questi strani numeri svolgono anche un ruolo straordinario e fondamentale nel funzionamento dell’universo fisico sulle scale più ridotte. Ciò può meravigliare, ed è un esempio della convergenza tra idee matematiche e le più profonde operazioni dell’universo fisico perfino più sorprendente rispetto al sistema dei numeri reali che abbiamo considerato in questa sezione. Di questi notevoli numeri parleremo in seguito.

Note

1. Le notazioni >, <, ≥, ≤, frequentemente usate in questo libro, stanno al posto, rispettivamente, di «è maggiore di», «è minore di», «è maggiore o eguale di», «è minore o eguale di».

2. Alcuni lettori potrebbero conoscere un ragionamento apparentemente più breve che parte con la richiesta che a/b sia «ridotto ai minimi termini» (cioè che a e b non abbiano fattori comuni). Questo, tuttavia, assume che la riduzione ai minimi termini esista sempre, il che, nonostante sia vero, deve essere dimostrato. Il trovare questa espressione ai minimi termini per una data frazione A/B (implicitamente o esplicitamente – usando, per esempio, il procedimento noto come algoritmo di Euclide; vedi Hardy e Wright (1945); Davenport (1952); Littlewood (1949) capitolo 4; Penrose (1989) capitolo 2) implica un ragionamento simile a quello riportato nel testo, ma più complicato.

3. Si potrebbe obiettare che usare numeri reali nella dimostrazione precedente è qualcosa di curioso, poiché i «razionali reali» (cioè quozienti di reali) sarebbero ancora semplicemente numeri reali. Questo, tuttavia, non invalida ciò che è stato appena detto. Si può osservare che, nel ragionamento originario, anche a e b erano stati presi come interi e non come numeri razionali. Infatti, se a e b fossero razionali, il ragionamento fallirebbe nella parte «successione decrescente», anche se il risultato in sé e per sé sarebbe ancora vero.

4. A prima vista, espressioni come a + (b + (c + (d + …)^{– 1})^{– 1})^{– 1} possono sembrare abbastanza strane. Tuttavia, sono molto naturali nel contesto del pensiero greco antico (anche se gli antichi greci non usarono questa particolare notazione). Al procedimento dell’algoritmo di Euclide è stato fatto riferimento nella nota 2, nel contesto della riduzione ai minimi termini di una frazione. L’algoritmo di Euclide (quando sbrogliato) conduce precisamente a un’espressione in frazione continua. Gli antichi greci applicherebbero questo stesso procedimento al rapporto di due lunghezze geometriche. Nel caso più generale il risultato sarebbe una frazione continua illimitata, del tipo qui considerato.

5. Per maggiori informazioni (con dimostrazioni) sulle frazioni continue, vedi l’elegante resoconto di Davenport (1952) riportato nel capitolo 4. Si può notare che, sotto certi aspetti, la rappresentazione dei numeri reali in termini di frazioni continue è più profonda e interessante di quella espressa in decimali, trovando applicazioni in molte aree della matematica moderna, compresa la geometria iperbolica discussa in §§2.24,25. D’altra parte, le frazioni continue non si prestano molto per la maggior parte dei calcoli numerici, in cui gli sviluppi decimali sono molto più facili da usare.

6. Gli irrazionali quadratici sono così chiamati perché compaiono nella soluzione di una generale equazione quadratica, dove A è diverso da zero; queste soluzioni sono

dove, per rimanere nel campo dei numeri reali, dobbiamo avere B² maggiore di 4AC. Quando A, B e C sono interi o numeri razionali e non vi è alcuna soluzione razionale dell’equazione, le soluzioni sono proprio irrazionali quadratici.

7. Vedi Negropontis (2000).

8. Vedi Sorabji (1983, 1988) per un resoconto del pensiero degli antichi greci a proposito della natura dello spazio.

9. Vedi Hardy (1914); Conway (1976); Burkill (1962).

10. La notazione scientifica «10¹²» per un «milione di milioni» fa uso degli esponenti, come descritto nelle note 1 del capitolo 1 e 1 del capitolo 2. In questo libro cercherò di evitare termini verbali come «milione» e specialmente «bilione», in favore di questa notazione scientifica molto più chiara. La parola «bilione» è particolarmente disorientante, poiché nell’uso americano significa 10⁹, mentre nella maggior parte delle lingue europee significa 10¹². In questo libro sono anche impiegati esponenti negativi, come 10^{– 6} (che significa «un milionesimo»), in accordo con la normale notazione scientifica. La distanza 10¹² metri è circa sette volte la distanza tra Luna e Terra. Questa è, grossolanamente, la distanza di Giove, anche se non era nota all’epoca di Euclide e sarebbe stata supposta più piccola.

11. Vedi, per esempio, Russell (1927), capitolo 4.

12. Schrödinger (1952).

13. Vedi Stachel (1993).

14. Einstein (1955).

15. Vedi, per esempio, Snyder (1947), Schild (1949) e Ahmavaara (1965).

16. Vedi Ashtekar (1986); Ashtekar e Lewandowski (2004); Smolin (1998, 2001); Rovelli (1998, 2003).

17. La nozione di «numero ordinale», qui fornita nel caso finito, si estende anche ai numeri ordinali infiniti, tra cui il più piccolo è «ω» di Cantor, che è l’insieme di tutti gli ordinali finiti.

18. Questa nozione di «costruzione» non deve essere considerata in senso troppo forte. In §16.6 vedremo che vi sono certi numeri reali (in realtà, la maggior parte di essi) che sono inaccessibili con qualunque procedimento computazionale.

19. Il fisico irlandese Gorge Johnstone Stoney fu il primo, nel 1874, a dare una (grossolana) stima della carica elettrica fondamentale e, nel 1891, coniò il termine «elettrone» per questa unità fondamentale. Nel 1909, il fisico americano Robert Andrews Millikan progettò il suo famoso esperimento delle «gocce d’olio», che mostrò con precisione che la carica su corpi elettricamente carichi (le gocce d’olio nel suo esperimento) era un multiplo intero di un valore ben definito: la carica dell’elettrone.

20. Nel 1959, R. A. Lyttleton e H. Bondi hanno proposto che una piccola differenza nelle cariche del protone e dell’elettrone (in valore assoluto), dell’ordine di una parte su 10¹⁸, potrebbe tener conto dell’espansione dell’universo (vedi §§27.11,13, e capitolo 28). Vedi Lyttleton e Bondi (1959). Sfortunatamente per questa teoria, una simile discrepanza fu confutata da parecchi esperimenti. Ciononostante, questa idea ha fornito un eccellente esempio di pensiero creativo.

21. Qui distinguo i numeri quantici «additivi» dai numeri che i fisici chiamano «moltiplicativi», che tratteremo in §5.5.

22. Nell’«effetto Hall quantistico frazionale» svolgono un ruolo fondamentale i numeri razionali; vedi, per esempio, Fröhlich e Pedrini (2000).

[3.1] Tentate di ottenere col vostro calcolatore tascabile (supponendo che abbiate i tasti «√–» e «x–1») queste espressioni fino all’accuratezza disponibile. Prendete p = 3.141592653589793... (Suggerimento: prendete nota della parte intera di ciascun numero, sottraetela e poi formate il reciproco del resto.)

[3.2] Assumendo questa periodicità finale di queste due espressioni di frazioni continue, dimostrate che i numeri che esse rappresentano devono essere le quantità a sinistra. (Suggerimento: trovate un’equazione quadratica che deve essere soddisfatta da questa quantità e fate riferimento alla nota 6.)

[3.3] Siete in grado di capire perché questo metodo funziona?

[3.4] Riuscite a capire come formulare queste regole?

4.1 Il magico numero «i»

Com’è possibile che –1 possa avere una radice quadrata? Il quadrato di un numero positivo è sempre positivo e il quadrato di un numero negativo è ancora positivo (mentre il quadrato di 0 è ancora 0, ma qui non ci è utile). Sembra impossibile poter trovare un numero il cui quadrato sia realmente negativo. Tuttavia, questo è il genere di situazione che abbiamo visto in precedenza, quando abbiamo accertato che 2 non ha una radice quadrata nel sistema dei numeri razionali. In quel caso abbiamo risolto la situazione estendendo il nostro sistema di numeri dai razionali a un sistema più ampio, quello dei numeri reali. Forse lo stesso espediente funzionerà ancora.

E così sarà. In effetti, quello che dobbiamo fare è più facile e di gran lunga meno drastico del passaggio dai razionali ai reali. (Raffaele Bombelli introdusse questa procedura nel 1572 nella sua opera L’algebra, dopo i primi casuali incontri di Gerolamo Cardano con i numeri complessi nella sua Ars Magna del 1545.) Tutto ciò che occorre fare è introdurre una singola quantità «i», il cui quadrato è – 1, e aggiungerla al sistema dei reali, permettendo combinazioni di i con i numeri reali per formare espressioni della forma

a + ib

dove a e b sono numeri reali arbitrari. Una qualsiasi di queste combinazioni è chiamata numero complesso. È facile capire come sommare due numeri complessi:

(a + ib) + (c + id) = (a + c) + i(b + d)

che è della stessa forma di prima (con i numeri reali a + c e b + d che prendono il posto degli a e b dell’espressione originaria). E per la moltiplicazione? Questa è quasi altrettanto facile. Troviamo il prodotto di a + ib per c + id. Moltiplichiamo semplicemente questi fattori, sviluppando l’espressione con le consuete regole dell’algebra:¹

(a + ib) (c + id) = ac + ibc + aid + ibid = ac + i(bc + ad) + i²bd.

Ma i² = – 1, così possiamo scrivere che

(a + ib) (c + id) = (ac – bd) + i(bc + ad),

che è ancora della forma a + ib, ma con ac – bd al posto di a e bc + ad al posto di b.

La sottrazione di due numeri complessi è abbastanza facile, ma la loro divisione? Si ricordi che nell’aritmetica ordinaria si può dividere per qualsiasi numero reale diverso da zero. Cerchiamo ora di dividere il numero complesso a + ib per il numero complesso c + id. Quest’ultimo numero non deve essere zero, il che significa che i numeri reali c e d non possono essere entrambi zero. Per tale ragione c² + d² > 0, quindi c² + d² ≠ 0, cosicché possiamo dividere per c² + d². È un semplice esercizio^[4.1] verificare che (moltiplicando ambedue i lati dell’espressione qui sotto per c + id)

Questa ha la stessa forma generale di prima, quindi è ancora un numero complesso.

Quando avremo acquisito l’abitudine di giocare con questi numeri complessi, cesseremo di pensare ad a + ib come a una coppia di elementi, cioè come ai due numeri reali a e b, ma lo penseremo come un’unica cosa e potremo usare una singola lettera, per esempio z, per indicare un numero complesso z = a + ib. Si può verificare che tutte le consuete regole dell’algebra sono soddisfatte dai numeri complessi ^[4.2] In effetti, tutto questo è molto più semplice delle verifiche per i numeri reali. (Per quelle verifiche, immaginiamo di esserci già convinti che le regole dell’algebra sono soddisfatte per le frazioni e poi dobbiamo usare i «tagli» di Dedekind per far vedere che queste regole funzionano ancora per i numeri reali.) Da questo punto di vista, sembra piuttosto straordinario che i numeri complessi siano stati considerati con sospetto per così tanto tempo, mentre le estensioni molto più complicate dai razionali ai reali siano state, dopo l’epoca degli antichi greci, generalmente accettate senza problemi.

Probabilmente questo sospetto nacque perché le persone non riuscivano a «vedere» l’immediata derivazione dei numeri complessi dal mondo fisico. Nel caso dei numeri reali, era sembrato che le distanze, gli intervalli di tempo e altre quantità fisiche fornissero la realtà che tali numeri richiedevano; era sembrato invece che i numeri complessi fossero soltanto entità inventate, evocate dall’immaginazione di matematici che desideravano numeri con un campo d’azione più grande di quelli che già conoscevano. Ma si dovrebbe ricordare, da §3.3, che la connessione che i numeri reali matematici hanno effettivamente con i concetti fisici di lunghezza o tempo non è così chiara come avevamo immaginato. Non possiamo vedere direttamente i minimi dettagli di un taglio di Dedekind e non è neppure così evidente che in natura esistano effettivamente tempi o lunghezze arbitrariamente grandi o piccole. Si potrebbe dire che i cosiddetti «numeri reali» sono un prodotto dell’immaginazione dei matematici tanto quanto i numeri complessi. Scopriremo tuttavia che i numeri complessi, come i reali, e forse persino di più, trovano un’unità con la natura che è veramente rimarchevole. È come se la stessa Natura fosse tanto impressionata quanto lo siamo noi dal campo d’azione e dalla coerenza del sistema dei numeri complessi e avesse affidato a questi numeri il preciso funzionamento, sulle più piccole scale, del suo mondo. Nei capitoli 21-23 vedremo in dettaglio come questo funziona.

Inoltre, l’accennare soltanto al campo d’azione e alla coerenza dei numeri complessi non rende giustizia a questo sistema. Secondo me, vi è qualcosa di più che può soltanto essere definito «magico». Nel resto di questo capitolo e nei prossimi due, mi sforzerò di trasmettere al lettore qualcosa della fragranza di questa magia. In seguito, nei capitoli 7, 8 e 9, saremo ancora testimoni di questa magia dei numeri complessi, in alcune delle sue più sorprendenti e inattese manifestazioni.

Nel corso dei quattro secoli trascorsi dalla scoperta dei numeri complessi, moltissime delle loro qualità magiche sono state gradualmente rivelate. Tuttavia questa è stata una magia che si trovava all’interno della matematica e che ha davvero offerto un’utilità e una profondità d’intuizione matematica, che non sarebbero state ottenute con l’uso dei soli numeri reali. Non vi era stato però alcun motivo di aspettarsi che il mondo fisico se ne dovesse interessare. Infatti, per circa trecentocinquant’anni dal momento della loro introduzione per mezzo delle opere di Cardano e Bombelli, la magia del sistema dei numeri complessi fu percepita soltanto attraverso il loro ruolo matematico. Sarebbe stata senza dubbio una gran sorpresa per tutti quelli che avevano espresso i loro sospetti sui numeri complessi scoprire che, secondo la fisica degli ultimi tre quarti del ventesimo secolo, le leggi che governano il comportamento del mondo, sulle sue scale più ridotte, sono fondamentalmente rette dal sistema dei numeri complessi.

Tali questioni saranno fondamentali, come ho detto, nei capitoli 21-23. Concentriamoci, per il momento, su alcune delle magie matematiche dei numeri complessi; della loro magia fisica ci interesseremo successivamente. Si rammenti che tutto quello che abbiamo fatto è stato porre come condizione che –1 abbia una radice quadrata, insieme alla condizione di mantenere le normali regole dell’aritmetica. Abbiamo accertato, in maniera piuttosto semplice, che queste condizioni possono essere coerentemente soddisfatte. Ma ora passiamo alla magia!

4.2 La risoluzione di equazioni con l’impiego dei numeri complessi

Di seguito, ho trovato necessario introdurre maggiori notazioni matematiche che in precedenza. Me ne scuso. Tuttavia è impossibile trasmettere alcune serie idee matematiche senza l’uso di una certa quantità di notazioni. Mi rendo conto che vi saranno molti lettori che si troveranno a disagio con queste cose. Il mio consiglio a questi lettori è di leggere soltanto le parole e di non affannarsi troppo nel tentativo di comprendere le equazioni. Date, per lo meno, solo una rapida occhiata alle varie formule e proseguite. Vi saranno davvero parecchie espressioni matematiche impegnative in questo libro, in particolare in alcuni dei capitoli successivi. La mia congettura è che certi aspetti della comprensione potranno essere assimilati persino se non avrete quasi tentato di comprendere in dettaglio il significato di tutte le espressioni. Spero che sia così, perché la magia dei numeri complessi, in particolare, è un miracolo degno di essere apprezzato. Se potete effettivamente cavarvela con la notazione matematica, allora tanto meglio.

Per prima cosa, possiamo chiederci se altri numeri hanno una radice quadrata. Che cosa succede, per esempio, per – 2? Questo è facile. Il numero complesso ha certamente come quadrato – 2, ed è la stessa cosa per . Inoltre, per qualsiasi numero reale positivo a, il numero complesso ha come quadrato – a e la stessa cosa avviene per . Qui non c’è alcuna vera magia. Ma per quanto riguarda il più generale numero complesso a + ib (dove a e b sono numeri reali)? Troviamo che il numero complesso

ha come quadrato a + ib (e la stessa cosa avviene per il suo negativo).^[4.3] In questo modo, vediamo che, anche se abbiamo soltanto aggiunto una radice quadrata per una singola quantità (cioè per – 1), troviamo che ogni numero ha ora, nel sistema risultante, automaticamente una radice quadrata. Ciò è del tutto diverso da quello che avveniva nel passaggio dai razionali ai reali; in quel caso, la sola introduzione della quantità nel sistema dei razionali non ci avrebbe condotto da nessuna parte!

Ma questo è soltanto l’inizio. Possiamo chiedere le radici cubiche, le radici quinte, le radici novecentonovantanovesime, le radici π o perfino le radici i! Troviamo, miracolosamente, che qualunque sia la radice complessa che scegliamo e qualunque sia il numero complesso a cui l’applichiamo (lo zero escluso), vi è sempre un numero complesso che è la soluzione di questo problema. (In verità, ci sarà di solito un certo numero di differenti soluzioni per questo problema, come vedremo tra poco. Abbiamo fatto notare prima che per le radici quadrate otteniamo due soluzioni, poiché anche il negativo della radice quadrata di un numero complesso z è una radice quadrata di z. Per le radici di ordine maggiore vi sono più soluzioni; vedi §5.4.)

Stiamo ancora scalfendo appena la superficie della magia dei numeri complessi. Ciò che ho appena asserito è realmente molto semplice da dimostrare (una volta che avremo la nozione di logaritmo di un numero complesso, come vedremo tra breve, nel capitolo 5). Alquanto più notevole è il cosiddetto «teorema fondamentale dell’algebra» che, in effetti, asserisce che qualsiasi equazione polinomiale, come

1 – z + z⁴ = 0

deve avere soluzioni complesse. Più esplicitamente, vi sarà sempre una soluzione (di solito, parecchie soluzioni differenti) per qualsiasi equazione della forma

a₀ + a₁z + a₂z² + a₃z³ + ... + a_nzⁿ = 0,

dove tutti i dati numeri complessi a₁, a₂, a₃, …, a_n non sono zero.² (Qui n può essere qualsiasi intero positivo, di una grandezza a piacere.) Per raffronto, possiamo ricordare che i è stato introdotto, in effetti, solo per fornire una soluzione a una singola equazione particolare

1 + z² = 0.

Tutto il resto lo otteniamo gratis!

Prima di andare avanti, vale la pena menzionare il problema a cui era interessato Cardano, circa nell’anno 1539, quando per primo s’imbatté nei numeri complessi e afferrò un accenno di un altro aspetto delle loro proprietà magiche. Il problema era trovare un’espressione per la soluzione generale di un’equazione (reale) cubica (in altre parole, n = 3), che aveva ridotto alla forma

x³ = 3px + 2q

con una semplice trasformazione. Qui p e q devono essere numeri reali, e sono ritornato nell’equazione all’uso di x invece di z, per indicare che ora ci interessiamo alle soluzioni reali invece che a quelle complesse. Sembra che la soluzione completa di Cardano (come pubblicata nel suo libro Ars Magna) sia stata sviluppata da una precedente soluzione parziale che aveva appreso da Niccolò Fontana («Tartaglia»), anche se questa soluzione parziale (e forse perfino la soluzione completa) era stata trovata in precedenza (prima del 1526) da Scipione del Ferro.³ La soluzione (del Ferro–)Cardano fu essenzialmente la seguente (scritta nella notazione attuale):

dove

Ora questa equazione non presenta nessun problema fondamentale entro il sistema dei numeri reali se

q² ≥ p³.

In questo caso vi è solo una soluzione reale x per l’equazione; e questa è proprio quella data dalla formula di (del Ferro–)Cardano, come è stata enunciata sopra. Ma se

q² < p³,

il cosiddetto caso irriducibile, allora, anche se vi sono adesso tre soluzioni reali, la formula implica la radice quadrata del numero negativo q² – p³ e quindi non può essere usata senza l’introduzione dei numeri complessi. In effetti, come Bombelli ha più tardi mostrato (nel capitolo 2 della sua Algebra), se ci permettiamo di ammettere i numeri complessi, allora tutte e tre le soluzioni reali sono proprio correttamente espresse dalla formula.⁴ (Ciò è sensato perché l’espressione ci fornisce la somma di due numeri complessi, in cui le parti che includono i si cancellano nella somma, dando un numero reale.)⁵ Ciò che è misterioso in tutto questo è che anche se sembrerebbe che il problema non abbia nulla a che fare con i numeri complessi – poiché l’equazione ha coefficienti reali e tutte le sue soluzioni sono reali (in questo «caso irriducibile») – abbiamo comunque bisogno di fare un’escursione nel territorio apparentemente alieno del mondo dei numeri complessi prima di arrivare alle nostre soluzioni puramente reali. Se ci fossimo limitati allo stretto e diretto cammino «reale», saremmo ritornati a mani vuote. (Ironicamente, soluzioni complesse dell’equazione iniziale possono comparire solo in quei casi in cui la formula non implica necessariamente questo viaggio nel complesso.)

4.3 La convergenza di serie di potenze

Nonostante questi fatti notevoli, non siamo ancora penetrati molto a fondo nella magia dei numeri complessi. Vi è ancora molto di più da dire! Per esempio, un’area dove i numeri complessi sono davvero inestimabili è quella di fornire una comprensione del comportamento di quelle che sono chiamate serie di potenze. Una serie di potenze è una somma infinita della forma

a₀ + a₁x + a₂x² +a₃x³ + ... .

Poiché questa somma implica un numero infinito di termini, può succedere che la serie diverga, cioè che non si stabilizzi su un particolare valore finito quando sommiamo un numero sempre maggiore di suoi termini. Consideriamo, per esempio, la serie

1 + x² + x⁴ + x⁶ + x⁸ + ...

(dove ho preso a₀ = 1, a₁ = 0, a₂ = 1, a₃ = 0, a₄ = 1, a₅ = 0, a₆ = 1 …). Se poniamo x = 1, sommando i termini successivamente, otteniamo

1,1 + 1 = 2,1 + 1 + 1 = 3,

1 + 1 + 1 + 1 = 4,1 + 1 + 1 + 1 + 1 = 5,eccetera.

e ci rendiamo conto che non c’è alcuna speranza che la serie si stabilizzi su un particolare valore finito, cioè è divergente. Le cose sono persino peggiori se poniamo x = 2, per esempio, poiché ora i singoli termini divengono più grandi e, sommando i termini successivamente, otteniamo

1, 1 + 4 = 5, 1 + 4 + 16 = 21, 1 + 4 + 16 + 64 = 85, eccetera, che evidentemente diverge. D’altra parte, se poniamo , otteniamo e questi si avvicinano sempre di più al valore limite cosicché la serie è ora convergente.

Nel caso di questa serie, non è difficile apprezzare, in un certo senso, un motivo fondamentale per cui la serie non possa fare a meno di divergere per x = 1 e x = 2, mentre converge per al valore , Infatti, possiamo scrivere esplicitamente il risultato della somma di tutta la serie, trovando ^[4.4]

1 + x² + x⁴ + x⁶ + x⁸ + ... = (1 – x²)^–1.

Quando sostituiamo x = 1, troviamo che questo risultato è (1 – 1²)^{– 1} = 0^{– 1} che è «infinito»;⁶ questo ci fa comprendere perché la serie debba divergere per quel valore di x. Quando poniamo il risultato è la serie converge quindi a questo particolare valore, come sopra affermato.

Tutto ciò sembra molto ragionevole, ma cosa dire per x = 2? Vi è ora un risultato dato dalla formula esplicita, e precisamente anche se non sembra che possiamo ottenere questo valore addizionando i termini della serie. Non potremmo ottenere questo risultato perché sommiamo quantità che sono tutte positive, mentre è negativo. Il motivo per cui la serie diverge è che per x = 2 ciascun termine è più grande del termine corrispondente per x = 1, cosicché la divergenza per x = 2 consegue, logicamente, dalla divergenza per x = 1. Nel caso di x = 2, il «risultato» non è realmente infinito, ma non possiamo ottenerlo tentando di sommare direttamente la serie. In fig. 4.1, ho plottato le somme parziali della serie (in altre parole, le somme fino a un numero finito di termini) fino a otto termini, assieme al «risultato» (1 – x²)^{– 1} e possiamo vedere che, purché x sia rigorosamente⁷ compresa tra i valori – 1 e + 1, le curve che raffigurano queste somme parziali convergono davvero al risultato (1 – x²)^{– 1}, come ci aspettavamo. Ma al di fuori di questo intervallo, la serie diverge e non raggiunge affatto un qualche valore finito.

Fig. 4.1 - Sono tracciate le rispettive somme parziali 1, 1 + x, 1 + x2 + x4, 1 + x2 + x4 + x6, 1 +x2 + x4 + x6 + x8, della serie per (1 – x2)– 1, che illustrano la convergenza della serie a (1 – x2)– 1 per |x|< 1 e la divergenza per |x|> 1.

Fig. 4.1 - Sono tracciate le rispettive somme parziali 1, 1 + x², 1 + x² + x⁴, 1 + x² + x⁴ + x⁶, 1 +x² + x⁴ + x⁶ + x⁸, della serie per (1 – x²)^{– 1}, che illustrano la convergenza della serie a (1 – x²)^{– 1} per |x|< 1 e la divergenza per |x|> 1.

A titolo di breve digressione, è qui utile prendere in esame una questione che sarà importante per noi in seguito. Poniamoci la seguente domanda: l’equazione che otteniamo ponendo x = 2 nell’espressione precedente, e precisamente

ha effettivamente qualche senso? Il grande matematico del diciottesimo secolo, Leonhard Euler, scriveva spesso equazioni come questa ed era diventato quasi una moda punzecchiarlo gentilmente per il suo sostegno a tali assurdità, mentre lo si potrebbe scusare per il fatto che in quell’epoca non si conosceva praticamente nulla delle questioni di «convergenza» e di cose simili. In effetti, è vero che il trattamento matematicamente rigoroso delle serie non arrivò prima degli ultimi anni del diciottesimo secolo e dei primi del diciannovesimo, attraverso il lavoro di Augustin Cauchy e di altri. Inoltre, secondo questo trattamento rigoroso, l’equazione di sopra sarebbe ufficialmente classificata come una sciocchezza. Tuttavia io penso che sia importante rendersi conto che, nel senso appropriato, Euler sapeva veramente quello che faceva quando scriveva apparenti assurdità di questa natura, e che esistono sensi in cui l’equazione di sopra deve essere considerata «corretta».

In matematica è infatti imperativo essere assolutamente chiari nel richiedere che le equazioni abbiano un significato esatto e accurato. È egualmente importante anche non essere indifferenti alle «cose che avvengono dietro le scene» che, in definitiva, possono condurre a intuizioni più profonde. È facile perdere di vista tali cose aderendo con troppo rigore a ciò che appare essere strettamente logico, come il fatto che la somma dei termini positivi 1 + 4 + 16 + 64 + 256 + … non può verosimilmente essere . Come esempio pertinente, ricordiamo l’assurdità logica di trovare una soluzione reale per l’equazione x² + 1 = 0. Non vi è alcuna soluzione; tuttavia, se la lasciamo lì, perdiamo tutte le profonde comprensioni offerte dall’introduzione dei numeri complessi. La stessa osservazione può essere applicata all’assurdità di una soluzione razionale all’equazione x² = 2. In effetti, è perfettamente possibile dare un senso matematico al risultato «» per la serie infinita di sopra, ma si deve fare attenzione alle regole che ci dicono quello che è permesso e quello che non è permesso. Non ho qui intenzione di discutere simili questioni in dettaglio,⁸ ma si può porre in rilievo che nella fisica moderna, in particolare nella teoria quantistica dei campi, si incontrano spesso serie divergenti di questo genere (vedi in particolare §§26.7,9 e §§31.2,13). È un problema molto delicato decidere se i «risultati» ottenuti in questo modo abbiano effettivamente significato e siano effettivamente corretti.

Alcune volte, risultati estremamente accurati sono davvero ottenuti con la manipolazione di simili espressioni divergenti e, in qualche occasione, sono sorprendentemente confermati dal confronto con reali esperimenti fisici. D’altra parte, non si è sempre così fortunati. Questi delicati problemi recitano ruoli importanti nelle attuali teorie fisiche e sono molto pertinenti per i nostri tentativi di valutarle. Il punto di immediata attinenza a noi, qui, è che il «senso» che si può essere in grado di attribuire a simili espressioni apparentemente senza significato dipende, in modo essenziale, dalle proprietà dei numeri complessi.

Ritorniamo ora al problema della convergenza delle serie, cercando di vedere come i numeri complessi si inseriscono in questo quadro. Consideriamo, per questo scopo, una funzione solo leggermente differente da (1 – x²)^{– 1}, e precisamente (1 + x²)^{– 1}, e tentiamo di vedere se questa ha uno sviluppo ragionevole in serie di potenze. Sembrerebbe che, in questo caso, vi sia una maggiore probabilità di completa convergenza, perché (1 + x²)^{– 1} rimane liscia e finita in tutto il campo dei numeri reali. Vi è, infatti, per (1 + x²)^{– 1} una serie dall’aspetto semplice, soltanto leggermente diversa da quella di prima, e precisamente

1 – x² + x⁴ – x⁶ + x⁸ – ... = (1 + x²) ^{– 1},

Fig. 4.2 - Sono analogamente tracciate le rispettive somme parziali 1, 1 – x2, 1 – x2 + x4, 1 – x2 + x4 – x6, 1 – x2 + x4 – x6 + x8, della serie per (1 + x2)–1, e vi è ancora convergenza per|x|< 1 e divergenza per|x|> 1, nonostante la funzione non abbia nessuna singolarità nei punti x = ± 1.

Fig. 4.2 - Sono analogamente tracciate le rispettive somme parziali 1, 1 – x², 1 – x² + x⁴, 1 – x² + x⁴ – x⁶, 1 – x² + x⁴ – x⁶ + x⁸, della serie per (1 + x²)^–1, e vi è ancora convergenza per|x|< 1 e divergenza per|x|> 1, nonostante la funzione non abbia nessuna singolarità nei punti x = ± 1.

essendo la differenza soltanto un cambiamento di segno a termini alternati.^[4.5] Nella fig. 4.2, ho plottato le somme parziali della serie in successione fino a cinque termini, proprio come prima, assieme al risultato (1+ x²)^–1. Ciò che appare sorprendente è che le somme parziali convergono ancora al risultato soltanto nell’intervallo da – 1 a + 1. Sembra che, all’esterno di questo intervallo, si abbia divergenza, anche se il risultato non va affatto all’infinito, a differenza del caso precedente. Questa cosa può essere verificata esplicitamente, usando i medesimi tre valori di prima, e troviamo che come prima si ha convergenza solo nel caso dove il risultato concorda esattamente con il valore limite della somma di tutta la serie:

Notiamo che la «divergenza» nel primo caso è semplicemente un’incapacità delle somme parziali di stabilizzarsi, anche se non divergono effettivamente all’infinito.

Così, in termini dei soli numeri reali, vi è una sconcertante discrepanza tra la somma della serie e il «risultato» che si suppone che la serie rappresenti. Le somme parziali semplicemente «decollano» (o, piuttosto, sbatacchiano selvaggiamente in su e in giù) proprio negli stessi punti (e precisamente x = ± 1) dove nascevano guai nel caso precedente, anche se adesso il presunto risultato della somma infinita, e precisamente (1 + x²)^{– 1}, non mostra affatto nessuna strana caratteristica in questi punti. La risoluzione di questo mistero può essere trovata se esaminiamo i valori complessi di questa funzione invece di limitarci alla considerazione dei soli valori reali.

4.4 Il piano complesso di Caspar Wessel

Per capire ciò che avviene in questo caso, sarà importante usare la rappresentazione geometrica standard dei numeri complessi sul piano euclideo. Caspar Wessel nel 1797, Jean Robert Argand nel 1806, John Warren nel 1828 e Carl Friedrich Gauss, sicuramente prima del 1831, arrivarono tutti indipendentemente all’idea di piano complesso (vedi fig. 4.3), in cui diedero una chiara interpretazione geometrica delle operazioni di addizione e moltiplicazione dei numeri complessi. In fig. 4.3 ho impiegato assi cartesiani standard, con l’asse x orizzontale e diretto verso destra e l’asse y verticale e diretto verso l’alto. Il numero complesso

z = x + iy

è rappresentato dal punto del piano con coordinate cartesiane (x, y).

Adesso dobbiamo pensare a un numero reale x come a un caso particolare del numero complesso z = x + iy, in cui y = 0. In questo modo, pensiamo che l’asse x del diagramma rappresenti la retta reale (in altre parole, la totalità dei numeri reali, linearmente ordinati lungo una retta). Il piano complesso, quindi, ci dà una rappresentazione grafica diretta di come il sistema dei numeri reali venga esteso per diventare l’intero sistema dei numeri complessi. Questa retta reale è spesso chiamata «l’asse reale» nel piano complesso. L’asse y è invece chiamato «l’asse immaginario»; esso è costituito da tutti i multipli reali di i.

Ritorniamo ora alle due funzioni che abbiamo tentato di rappresentare in termini di serie di potenze. Le avevamo considerate come funzioni della variabile reale x, e precisamente (1 – x²)^{– 1} e (1 + x²)^{– 1}, ma ora le estendiamo in modo che si applichino a una variabile complessa z. Non vi è nessun problema per fare ciò: scriviamo semplicemente queste funzioni estese come (1– z²)^{– 1} e (1 + z²)^{– 1}, rispettivamente. Nel caso della prima funzione reale (1 – x²)^{– 1}, eravamo stati in grado di riconoscere dove iniziavano i guai dovuti alla divergenza, perché questa funzione è singolare (nel senso che diventa infinita) nei due punti x = – 1 e x = + 1; ma, nel caso di (1 + x²)^{– 1}, non vediamo alcuna singolarità in questi punti e non vediamo affatto singolarità reali in nessun luogo. Tuttavia, in termini della variabile complessa z, vediamo che queste due funzioni sono molto di più alla pari tra di loro. Abbiamo notato le singolarità di (1 – z²)^{– 1} nei due punti z = ± 1, a distanza unitaria dall’origine lungo l’asse reale; ma adesso vediamo che anche (1 + z²)^{– 1} ha delle singolarità, e precisamente nei due punti z = ± i (poiché per questi valori 1 + z² = 0), che sono a distanza unitaria dall’origine lungo l’asse immaginario.

Fig. 4.3 - Il piano complesso di z = x + iy. In coordinate cartesiane (x, y), l’asse orizzontale x orientato verso destra è l’asse reale, mentre l’asse verticale y orientato verso l’alto è l’asse immaginario.

Fig. 4.3 - Il piano complesso di z = x + iy. In coordinate cartesiane (x, y), l’asse orizzontale x orientato verso destra è l’asse reale, mentre l’asse verticale y orientato verso l’alto è l’asse immaginario.

Ma che cosa hanno a che fare queste singolarità complesse con il problema della convergenza o della divergenza della corrispondente serie di potenze? Per questa domanda vi è una risposta sorprendente. Noi adesso pensiamo alle nostre serie di potenze come a funzioni della variabile complessa z, invece che della variabile reale x, e possiamo chiederci quali sono i punti di z nel piano complesso in cui la serie converge e quali quelli in cui diverge. La notevole risposta generale,⁹ per qualunque serie di potenze di qualsiasi genere

a₀ + a₁z + a₂z² + a₃z³ + ...,

è che nel piano complesso vi è un cerchio, con centro nel punto 0, chiamato cerchio di convergenza, con la proprietà per cui se il numero complesso z giace all’interno di questo cerchio, allora la serie converge per quel valore di z, mentre se z giace all’esterno di questo cerchio, allora la serie diverge per quel valore di z. (La questione della convergenza o no della serie per un valore di z che giaccia esattamente sulla circonferenza di questo cerchio è un problema piuttosto delicato di cui non ci occuperemo qui, anche se ha qualche importanza per le questioni che tratteremo in §§9.6,7.) In questa affermazione includo anche due situazioni estreme: quella in cui la serie diverge per tutti i valori di z diversi da zero, quando il cerchio di convergenza ha raggio zero, e quella in cui la serie converge per tutti i valori di z, quando cioè il raggio del cerchio diventa infinito. Per trovare quale sia realmente il raggio del cerchio di convergenza, per qualche particolare funzione data, dobbiamo vedere dove sono collocate nel piano complesso le singolarità di questa funzione e tracciare il più grande cerchio, con centro nell’origine, che non contenga al suo interno nessuna di queste singolarità (lo tracciamo cioè facendolo passare per la singolarità più vicina all’origine).

Nei casi particolari (1 – z²)^{– 1} e (1 + z²)^{– 1} che abbiamo appena preso in esame, le singolarità sono di un tipo semplice chiamato polo (che nasce quando un polinomio, che compare in forma reciproca, si annulla). Qui tutti i poli si trovano a distanza unitaria dall’origine, quindi il cerchio di convergenza è, in entrambi i casi, proprio il cerchio unitario intorno all’origine. I punti dove questo cerchio incontra l’asse reale sono gli stessi in ciascun caso, vale a dire i due punti z = ± 1. (Vedi fig. 4.4.) Ciò spiega perché le due funzioni convergono e divergono nelle medesime regioni – un fatto che non è evidente dalle loro proprietà come semplici funzioni di variabili reali. In questo modo, i numeri complessi ci offrono intuizioni più profonde sul comportamento delle serie di potenze; intuizioni che non sono disponibili dalla semplice considerazione della loro struttura in termini di variabili reali.

Fig. 4.4 - Le funzioni (1 – z2)–1 e (1 + z2)–1, nel piano complesso, hanno il medesimo cerchio di convergenza, essendoci poli per la prima nei punti z = ± 1 e per la seconda nei punti z = ± i, tutti a distanza unitaria dall’origine.

Fig. 4.4 - Le funzioni (1 – z²)^–1 e (1 + z²)^–1, nel piano complesso, hanno il medesimo cerchio di convergenza, essendoci poli per la prima nei punti z = ± 1 e per la seconda nei punti z = ± i, tutti a distanza unitaria dall’origine.

4.5 Come costruire l’insieme di Mandelbrot

Per finire questo capitolo, esaminiamo un altro problema di convergenza e divergenza. È quello che si trova alla base della costruzione di quella straordinaria configurazione, a cui si è accennato in §1.3 e che è riprodotta in fig. 1.2, nota come l’insieme di Mandelbrot. In verità, questo non è altro che un sottoinsieme del piano complesso di Wessel che può essere definito in maniera sorprendentemente semplice, se si tiene conto dell’estrema complicazione di questo insieme. Tutto quello che dobbiamo fare è esaminare le ripetute applicazioni della sostituzione

z → z² + c,

dove c è un numero complesso fissato. Pensiamo a c come a un punto nel piano complesso e cominciamo con z = 0. Iteriamo poi questa trasformazione (in altre parole, applichiamola ripetutamente) e vediamo come si comporta il punto z nel piano. Se si allontana verso l’infinito, allora al punto c deve venire assegnato il colore bianco; se z si aggira in una regione ristretta senza mai allontanarsi all’infinito, allora a c deve essere assegnato il colore nero. La regione nera ci dà l’insieme di Mandelbrot.

Descriviamo questo procedimento con un po’ più di dettaglio. Come procede l’iterazione? Per prima cosa, fissiamo c. Prendiamo poi un punto z e applichiamo la trasformazione, cosicché z diventa z² + c. Applichiamola poi ancora, cosicché ora sostituiamo lo «z» in z² + c con z² + c, ottenendo (z² + c)² + c. Poi rimpiazziamo lo «z» in z² + c con (z² + c)² + c, cosicché la nostra espressione diventa ((z² + c)² + c)² + c. Proseguiamo poi rimpiazzando lo «z» in z² + c con ((z² + c)² + c)² + c e otteniamo (((z² + c)² + c)² + c)² + c, e così via.

Vediamo ora quello che accade se partiamo da z = 0 e poi iteriamo in questo modo. (Basta mettere z = 0 nelle espressioni di sopra.) Si ottiene così la successione

0, c, c² + c, (c² + c)² + c, ((c² + c)² + c)²+ c, … .

Questo ci dà una successione di punti sul piano complesso. (Su un computer, si elaborerebbero queste cose in modo puramente numerico, per ogni singola scelta del numero complesso c, invece di adoperare le espressioni algebriche di sopra. Computazionalmente è molto «più economico» ripetere l’aritmetica ogni volta.) Per ogni dato valore di c, possono ora avvenire due cose: (i) i punti della successione si allontanano sempre di più dall’origine, in altre parole la successione non è limitata; (ii) ognuno dei punti si trova a una distanza dall’origine inferiore a una certa distanza fissata (cioè, entro un certo cerchio intorno all’origine), quindi la successione è limitata. Le regioni bianche della fig. 1-2a sono formate dai punti c che danno luogo a una successione illimitata (i), mentre le regioni nere sono formate da quei punti c dove a valere è il caso limitato (ii); l’insieme di Mandelbrot è formato da tutte le regioni nere.

La complicazione dell’insieme di Mandelbrot nasce dal fatto che vi sono molti modi, diversi e spesso molto complicati, in cui la successione iterata può rimanere limitata. Vi possono essere elaborate combinazioni di cicli e «quasi» cicli di vario tipo, che punteggiano il piano in vari modi intricati – ma tentare di comprendere in ogni dettaglio come avviene la straordinaria complicazione di questo insieme, in cui sono implicati sottili questioni di analisi complessa e teoria dei numeri, ci porterebbe troppo lontano. Il lettore interessato può consultare Peitgen e Reichter (1986) e Peitgen e Saupe (1988) per ulteriori informazioni e illustrazioni (vedi anche Douady e Hubbard 1985).

Note

1. Vedi esercizio [4.2] per queste regole.

2. Questa è una diretta conseguenza^[4.6] del fatto che qualunque polinomio complesso nella sola variabile z può essere fattorizzato in fattori lineari: a₀ + a₁z¹ + a₂z² + … a_nzⁿ = a_n(z – b₁)(z – b₂)…(z – b_n), ed è questa l’affermazione che viene normalmente chiamata «teorema fondamentale dell’algebra».

3. Tartaglia aveva rivelato la sua soluzione parziale a Cardano solo dopo che questi aveva giurato di mantenere il segreto. Di conseguenza, Cardano non avrebbe potuto pubblicare la sua soluzione più generale senza infrangere il giuramento; tuttavia, in un viaggio successivo a Bologna, nel 1543, Cardano esaminò i lavori postumi di del Ferro e si convinse della reale priorità di quest’ultimo. Pensò quindi di essere libero di pubblicare tutti i risultati (con i dovuti riconoscimenti e a Tartaglia e a del Ferro) nell’Ars Magna nel 1545. Tartaglia non fu d’accordo e la disputa ebbe conseguenze molto amare (vedi Wykes 1969).

4. Per maggiori informazioni vedi van der Waerden (1985).

5. Il motivo è che addizioniamo due numeri che sono complessi coniugati l’uno dell’altro (vedi §10.1) e una simile somma è sempre un numero reale.

6. Ricordate dalla nota 2.4 che 0^–1 dovrebbe significare 1/0, cioè «uno diviso per zero». Una conveniente «abbreviazione» per esprimere il «risultato» di questa operazione illegale è «0^{– 1} = ∞».

7. La parola «rigorosamente» significa, in questo caso, che le estremità dell’intervallo non sono incluse.

8. Per ulteriori informazioni vedi, per esempio, Hardy (1940).

9. Vedi, per esempio, Priestly (2003) e Needham (2002).

5.1 La geometria dell’algebra complessa

Gli aspetti della magia dei numeri complessi discussi alla fine del capitolo precedente implicano molte sottigliezze; torniamo quindi un po’ indietro ed esaminiamo alcuni elementi di magia più elementari, anche se egualmente enigmatici e importanti. Per prima cosa, vediamo come le regole per l’addizione e la moltiplicazione, che abbiamo incontrato in §4.1, sono rappresentate in modo geometrico nel piano complesso. Possiamo presentarle rispettivamente come la legge del parallelogramma e la legge dei triangoli simili; queste leggi sono illustrate in fig. 5.1a, b. In modo specifico, per due numeri complessi generici w e z, i punti che rappresentano w + z e wz sono determinati dalle rispettive asserzioni:

i punti 0, w, w + z, z sono i vertici di un parallelogramma

i triangoli con vertici 0, 1, w e 0, z, wz sono simili.

Fig. 5.1 - La descrizione geometrica delle leggi fondamentali dell’algebra dei numeri complessi. (a) La legge del parallelogramma per l’addizione: 0, w, w + z, z sono i vertici di un parallelogramma. (b) La legge dei triangoli simili per la moltiplicazione: i triangoli con vertici 0, 1, w e 0, z, wz sono simili.

Fig. 5.1 - La descrizione geometrica delle leggi fondamentali dell’algebra dei numeri complessi. (a) La legge del parallelogramma per l’addizione: 0, w, w + z, z sono i vertici di un parallelogramma. (b) La legge dei triangoli simili per la moltiplicazione: i triangoli con vertici 0, 1, w e 0, z, wz sono simili.

(Sono qui adottate le normali convenzioni per gli ordinamenti e le orientazioni; con ciò intendo che percorriamo il parallelogramma ciclicamente, così che il segmento da w a w + z è parallelo a quello da 0 a z, eccetera; inoltre, non vi deve essere alcuna «riflessione» implicata nella relazione di similitudine tra i due triangoli. Vi sono anche casi speciali in cui i triangoli o il parallelogramma degenerano in vari modi.)^[5.1] Il lettore interessato può controllare queste regole con la trigonometria e il computo diretto;^[5.2]tuttavia vi è un altro modo di guardare queste cose che evita calcoli dettagliati e consente una maggiore comprensione.

Consideriamo l’addizione e la moltiplicazione in termini di differenti applicazioni (o «trasformazioni») che mandano l’intero piano complesso in se stesso. Qualsiasi dato numero complesso w definisce una «applicazione additiva» e una «applicazione moltiplicativa», essendo queste le operazioni che, quando applicate a un arbitrario numero complesso z, sommeranno w a z e prenderanno il prodotto di w con z, rispettivamente, cioè

z → w + z e z → wz.

È facile vedere che l’applicazione additiva fa semplicemente scorrere il piano complesso, senza rotazione o cambiamento di forma o di grandezza – un esempio di traslazione (vedi §2.1) – spostando l’origine 0 nel punto w; vedi fig. 5.2a. La legge del parallelogramma è semplicemente una diversa formulazione di ciò. Ma cosa dire dell’applicazione moltiplicativa? Questa fornisce una trasformazione che lascia l’origine fissa e preserva le forme, mandando 1 nel punto w. Nel caso generale combina una rotazione (senza riflessione) con un’espansione (o contrazione) uniforme; vedi fig. 5.2b.^[5.3] La legge dei triangoli simili mette effettivamente in evidenza questo. Tale applicazione avrà un significato particolare per noi in §8.2.

Nel caso particolare w = i, l’applicazione moltiplicativa è semplicemente una rotazione destrorsa (in altre parole antioraria) di un angolo retto . Se applichiamo due volte questa operazione, otteniamo una rotazione di π, che è semplicemente una riflessione rispetto all’origine; in altre parole, questa è l’applicazione moltiplicativa che manda ciascun numero complesso z nel suo negativo. Ciò ci fornisce una realizzazione grafica della «misteriosa» equazione i² = – 1 (Fig. 5.3). L’operazione «moltiplicazione per i» è realizzata dalla trasformazione geometrica «rotazione di un angolo retto». Quando è visto in questo modo, non sembra più così misterioso che il «quadrato» di questa operazione (cioè, il ripeterla due volte) produca lo stesso effetto dell’operazione di «prendere il negativo». Ciò, naturalmente, non rimuove la magia e il mistero del perché l’algebra complessa funzioni così bene. Non ci comunica neppure un chiaro ruolo fisico per questi numeri. Ci si può chiedere, per esempio: perché ruotare solo in un piano; cosa dire di rotazioni in uno spazio a tre dimensioni? Tratterò differenti aspetti di tali questioni più avanti, in particolare in §§11.2,3, §18.5, §§21.6,9, §§22.2,3,8-10, §33.2 e §34.8.

Fig. 5.2 - (a) L’applicazione additiva «+ w» fornisce una traslazione del piano complesso che manda 0 in w. (b) L’applicazione moltiplicativa «× w» fornisce una rotazione ed espansione (o contrazione) del piano complesso intorno a 0 che manda 1 in w.

Fig. 5.2 - (a) L’applicazione additiva «+ w» fornisce una traslazione del piano complesso che manda 0 in w. (b) L’applicazione moltiplicativa «x w» fornisce una rotazione ed espansione (o contrazione) del piano complesso intorno a 0 che manda 1 in w.

Fig. 5.3 - La particolare operazione «moltiplicazione per i» è realizzata nel piano complesso come la trasformazione geometrica «rotazione di un angolo retto». La «misteriosa» equazione i2 = – 1 è resa visiva.

Fig. 5.3 - La particolare operazione «moltiplicazione per i» è realizzata nel piano complesso come la trasformazione geometrica «rotazione di un angolo retto». La «misteriosa» equazione i² = – 1 è resa visiva.

Fig. 5.4 - (a) Passando da coordinate cartesiane (x, y) a coordinate polari [r, θ], abbiamo z = x + iy = re^iθ, dove il modulo r = |z| è la distanza dall’origine e l’argomento θ è l’angolo che la retta dall’origine a z stabilisce con l’asse reale, in senso antiorario. (b) Se non richiediamo che – π > θ ≤ π, possiamo permettere a z di arrotolarsi attorno all’origine molte volte, aggiungendo qualsiasi multiplo intero di 2π a θ.

Nella nostra descrizione di un numero complesso nel piano abbiamo impiegato le coordinate cartesiane standard (x, y) per un punto in questo piano, ma, in alternativa, potremmo usare le coordinate polari [r, θ]. In questo caso, il numero reale positivo r misura la distanza dall’origine e l’angolo θ misura l’angolo che la retta dall’origine al punto z stabilisce con l’asse reale in senso antiorario; vedi fig. 5.4a. Il numero r è chiamato modulo del numero complesso z, che qualche volta scriviamo come

r = |z|,

e θ è detto il suo argomento (o la sua fase, nella meccanica quantistica). Nel caso z = 0, non abbiamo bisogno di preoccuparci di θ, ma possiamo ancora definire r come la distanza dall’origine che, in questo caso, dà semplicemente r = 0.

Potremmo, per amore di precisione, insistere che θ si trovi in un particolare intervallo, come – π > θ ≤ π (che è una convenzione standard). In alternativa, possiamo pensare che l’argomento abbia una certa ambiguità, nel senso che possiamo addizionargli un qualsiasi multiplo intero di 2π senza alcuna conseguenza. È soltanto una questione di concederci di girare intorno all’origine tante volte quante vogliamo, in entrambe le direzioni, quando misuriamo l’angolo (vedi fig. 5.4b). (Questo secondo punto di vista è effettivamente quello più profondo e avrà implicazioni per noi fra breve.) Vediamo dalla fig. 5.5 e da considerazioni di trigonometria che

x = r cos θ e y = r sin θ,

e, viceversa, che

dove θ = tan^–1 (y/x) significa qualche valore specifico della funzione a molti valori tan^–1. (Per quei lettori che hanno dimenticato del tutto la trigonometria, le prime due formule ridanno solo le definizioni del seno e del coseno di un angolo in termini di un triangolo rettangolo: «il coseno di un angolo è il rapporto tra il lato adiacente e l’ipotenusa» e «il seno di un angolo è il rapporto tra il lato opposto e l’ipotenusa», essendo r l’ipotenusa del triangolo. Le seconde esprimono il teorema di Pitagora e, in forma inversa, «la tangente di un angolo è il rapporto tra il lato opposto e quello adiacente». Si deve anche far notare che «tan^–1» è la funzione inversa della tangente, cosicché l’equazione θ = tan^–1 (y/x) sta al posto di «tan θ = y/x». Infine, vi è l’ambiguità in «tan^–1», per cui a θ può essere aggiunto qualunque multiplo intero di 2π, mantenendo inalterata la validità della relazione.)¹

Fig. 5.5 - La relazione tra le forme cartesiana e polare di un numero complesso: x = rcosθ e y = rsinθ, mentre e θ = tan– 1 (y/x).

Fig. 5.5 - La relazione tra le forme cartesiana e polare di un numero complesso: x = rcosθ e y = rsinθ, mentre e θ = tan^–1 (y/x).

5.2 L’idea di logaritmo complesso

Adesso la «legge dei triangoli simili» della moltiplicazione di due numeri complessi, come illustrata in fig. 5.1b, può essere espressa nuovamente affermando che, quando moltiplichiamo due numeri complessi, addizioniamo i loro argomenti e moltiplichiamo i loro moduli.^[5.4] Si noti il fatto notevole che, per quanto riguarda questa regola per gli argomenti, abbiamo convertito la moltiplicazione in addizione. Ciò è la base dell’uso dei logaritmi (il logaritmo del prodotto di due numeri è uguale alla somma dei loro logaritmi: log ab = log a + log b), com’è mostrato dal regolo calcolatore (fig. 5.6), e questa proprietà aveva un’importanza fondamentale per il computo in epoche precedenti.² Ora impieghiamo calcolatori elettronici per fare le nostre moltiplicazioni. Anche se questo è molto più veloce e più accurato dell’uso di un regolo calcolatore o delle tavole dei logaritmi, perdiamo una parte significativa della nostra comprensione se non acquistiamo nessuna esperienza diretta dell’affascinante e importantissima operazione logaritmica. Vedremo che i logaritmi giocheranno un ruolo decisivo riguardo ai numeri complessi. In effetti, l’argomento di un numero complesso è realmente un logaritmo, in un certo senso. Tenteremo di capire come questo avviene.

Fig. 5.6 - I regoli calcolatori mostrano i numeri su una scala logaritmica, permettendo così alla moltiplicazione di essere espressa dall’addizione di distanze, secondo la formula logb(p × q) = logbp + logbq. (È illustrata la moltiplicazione per 2.)

Fig. 5.6 - I regoli calcolatori mostrano i numeri su una scala logaritmica, permettendo così alla moltiplicazione di essere espressa dall’addizione di distanze, secondo la formula log_b(p × q) = log_bp + log_bq. (È illustrata la moltiplicazione per 2.)

Si rammenti anche l’asserzione in §4.2: l’estrazione di radice per i numeri complessi si basa fondamentalmente sulla comprensione dei logaritmi complessi. Troveremo che vi sono sorprendenti relazioni tra logaritmi complessi e trigonometria. Tentiamo di vedere come tutte queste cose procedono di pari passo.

Ricordiamo, innanzitutto, alcuni concetti a proposito dei comuni logaritmi. Un logaritmo è l’inverso dell’operazione di «innalzare un numero a una certa potenza», o della esponenziazione. «L’innalzamento a potenza» è un’operazione che converte l’addizione in moltiplicazione. Perché? Prendiamo un qualsiasi numero b (diverso da zero). Facciamo poi notare la formula (che converte l’addizione in moltiplicazione)

b^{m + n} = b^m × bⁿ

che è ovvia se m e n sono interi positivi, poiché ciascun lato rappresenta la moltiplicazione di m + n esemplari di b, moltiplicati tra loro. Quello che dobbiamo fare è trovare una generalizzazione, affinché m e n non debbano essere numeri positivi, ma possano essere numeri complessi qualunque. Dobbiamo quindi trovare la giusta definizione di «b innalzato alla potenza z», per z complesso, e vogliamo che valga la stessa formula di prima, e precisamente b^{w + z} = b^w × b^z, anche quando gli esponenti w e z sono complessi.

In effetti, tale procedimento rispecchia in qualche misura la storia della generalizzazione in matematica, che si è mossa, passo per passo, dagli interi positivi fino ai numeri complessi, partendo da Pitagora, attraverso il lavoro di Eudosso e Brahmagupta, fino all’epoca di Cardano e Bombelli (e altri), come è stato indicato in §4.1. Per prima cosa, si intende inizialmente la nozione di «b^z», quando z è un intero positivo semplicemente come il prodotto di z volte b, b × b × …× b; in particolare b¹ = b. Ammettiamo poi (seguendo la guida di Brahmagupta) che z sia pari a zero, rendendoci conto che per preservare b^{w + z} = b^w × b^z dobbiamo definire b⁰ = 1. In seguito, ammettiamo che z sia negativo, rendendoci conto che, per la medesima ragione, nel caso z = – 1 dobbiamo definire b^–1 come il reciproco di b (in altre parole 1/b) e che b^–n, per un numero naturale n, deve essere la potenza ennesima di b^–1. Cerchiamo poi di generalizzare alle situazioni in cui z è una frazione, partendo con il caso z = 1/n, dove n è un intero positivo. Ripetute applicazioni di b^w × b^z = b^w ⁺ ^z ci portano a concludere che (b^z)ⁿ = b^zn; in questo modo, ponendo z = 1/n otteniamo che b^1/n è una radice ennesima di b.

Possiamo fare tutto ciò nel dominio dei numeri reali, purché il numero b sia preso positivo. Possiamo poi ritenere che b^1/n sia l’unica radice ennesima positiva di b (quando n è un intero positivo) e possiamo continuare col definire b^z, in modo unico, per qualsiasi numero razionale z = m/n come la potenza emmesima della radice ennesima di b e poi (usando un procedimento di passaggio al limite) per qualsiasi numero reale z. Ma se b può essere negativo, allora incontriamo un ostacolo per , poichè richiede l’introduzione di i e ci troviamo sul piano inclinato e scivoloso che porta ai numeri complessi. Alla fine della discesa troveremo il nostro magico mondo complesso, così prepariamoci e lasciamoci andare fino in fondo.

Richiediamo una definizione tale che per tutti i numeri complessi p, q e b (con b ≠ 0) abbiamo:

b^p+q = b^p × b^q

Potremmo poi sperare di definire il logaritmo in base b (l’operazione indicata da «log_b») come l’inverso della funzione definita da f(z) = b^z, cioè

z = log_bwsew = b^z.

Ci aspetteremmo poi che

log_b (p × q) = log_bp + log_bq,

in modo che questa nozione di logaritmo convertirebbe davvero la moltiplicazione in addizione.

5.3 Molteplicità di valori, logaritmi naturali

Anche se il procedimento illustrato sopra è fondamentalmente corretto, vi sono certe difficoltà tecniche (che vedremo come trattare tra breve) nel realizzarlo. In primo luogo, è «a molti valori»; vale a dire che vi sono molte risposte differenti, in generale, al significato di b^z. Vi è anche un’addizionale molteplicità di valori per log_b w. Abbiamo già visto la molteplicità di valori di b^z per valori frazionari di z. Per esempio, se , allora «b^z» dovrebbe significare «qualche grandezza t il cui quadrato è b», poiché richiediamo che

Se qualche numero t soddisfa questa proprietà, allora anche –t la soddisfa (poiché (– t) × (– t) = t² = b). Assumendo che b ≠ 0, abbiamo due risposte distinte per b^1/2 (scritte, di solito, come). Più in generale, abbiamo n distinte risposte complesse per b^1/n, quando n è un intero positivo: 1, 2, 3, 4, 5,… . In effetti, abbiamo un certo numero finito di risposte ogni volta che n è un numero razionale (diverso da zero). Se n è irrazionale, allora abbiamo un numero infinito di risposte, come vedremo tra breve.

Tentiamo di vedere come possiamo tenere testa a queste ambiguità. Partiamo facendo una scelta particolare per il b di sopra, scegliendo cioè il numero fondamentale «e», chiamato la base dei logaritmi naturali. Questo ridurrà il problema dell’ambiguità. Una delle definizioni di e potrebbe essere:

dove i punti esclamativi indicano fattoriali, cioè

n! = 1 × 2 × 3 × 4 × … × n,

così che 1! = 1, 2! = 2, 3! = 6, eccetera. La funzione definita da f(z) = e^z è chiamata funzione esponenziale e qualche volta è scritta «exp»; può essere pensata come «e innalzato alla potenza z» quando si lavora su z e questa «potenza» è definita dalla seguente semplice modificazione della serie di sopra per e:

Questa importante serie di potenze converge per tutti i valori di z (ha così un cerchio di convergenza infinito; cfr. §4.4). La somma infinita realizza una scelta particolare per l’ambiguità in «b^z» quando b = e. Se ,per esempio, la serie ci dà la particolare grandezza positiva invece di . Il fatto che , dia effettivamente una grandezza «e^1/2» il cui quadrato è e segue dal fatto che e^Z, come viene definito da questa serie,^[5.5] ha davvero la richiesta proprietà di convertire «addizioni in moltiplicazioni»

e^a+b = e^a e^b,

così che

Tentiamo di usare questa definizione di e^z per darci un logaritmo senza ambiguità, definito come l’inverso della funzione esponenziale:

z = log wse w = e^z.

Questo è chiamato il logaritmo naturale (e io scriverò questa funzione semplicemente come «log» senza un simbolo di base).³ Dalla proprietà esposta sopra di «addizioni in moltiplicazioni», anticipiamo una regola di «moltiplicazioni in addizioni»:

log ab = log a + log b.

Non è immediatamente ovvio che una simile funzione inversa di e^z esista necessariamente. Tuttavia, in effetti avviene che per qualsiasi numero complesso w, eccetto 0, esiste sempre un numero complesso z tale che w = e^z, così che possiamo definire log w = z. Ma qui vi è un intoppo: vi è più di una risposta.

Come esprimiamo queste risposte? Se [r, θ] è la rappresentazione polare di w, allora possiamo scrivere il suo logaritmo nell’ordinaria forma cartesiana (z = x + iy) come

z = log r + iθ,

dove log r è l’ordinario logaritmo naturale di un numero reale positivo, l’inverso dell’esponenziale reale. Perché? È intuitivamente chiaro dalla fig. 5.7 che un simile logaritmo reale esiste. Nella fig. 5.7a abbiamo il grafico di r = e^x. Basta girare gli assi per ottenere il grafico della funzione inversa x = log r, come nella fig. 5.7b. Non è così sorprendente che la parte reale di z = log w sia proprio un ordinario logaritmo reale; ciò che è alquanto più notevole⁴ è che la parte immaginaria di z sia proprio l’angolo θ che è l’argomento del numero complesso w. Questo fatto chiarisce il mio precedente commento secondo cui l’argomento di un numero complesso è proprio una forma di logaritmo.

Si ricordi che vi è un’ambiguità nella definizione dell’argomento di un numero complesso; possiamo aggiungere a θ qualsiasi multiplo intero di 2π, e questo valore andrà altrettanto bene (ricordate la fig. 5.4b). Di conseguenza, vi sono molte soluzioni differenti z, per una data scelta di w nella relazione w = e^z. Se prendiamo uno di questi z, allora z + 2πin è un’altra possibile soluzione, dove n è un intero arbitrario a nostra scelta. Così, il logaritmo di w è ambiguo a causa dell’addizione di qualunque multiplo intero di 2πi. Dobbiamo tenere a mente questo con espressioni come log ab = log a + log b, assicurandoci che siano state fatte le scelte opportunamente corrispondenti dei logaritmi.

Fig. 5.7 - Per ottenere il logaritmo di un numero reale positivo r, consideriamo il grafico (a) di r = ex. Si ottengono tutti i valori positivi di r, così che spostando la figura otteniamo il grafico (b) della funzione inversa x = log r per r positivo.

Fig. 5.7 - Per ottenere il logaritmo di un numero reale positivo r, consideriamo il grafico (a) di r = e^x. Si ottengono tutti i valori positivi di r, così che spostando la figura otteniamo il grafico (b) della funzione inversa x = log r per r positivo.

A questo stadio sembra che tale caratteristica del logaritmo complesso sia soltanto una seccatura imbarazzante; tuttavia, vedremo in §7.2 che è assolutamente centrale per alcune delle più potenti, utili e magiche proprietà dei numeri complessi. L’analisi complessa dipende da essa in modo cruciale. Per il momento, tentiamo solamente di apprezzare la natura di questa ambiguità.

Un altro modo di comprendere tale ambiguità in log w è notare questa sorprendente formula

e^2πi = 1,

da cui segue e^{z + 2πi} = e^z = w, eccetera, mostrando che z + 2πi è un logaritmo di w valido quanto z (e il procedimento può essere ripetuto quante volte vogliamo). La formula precedente è strettamente collegata alla famosa formula di Eulero

e^πi + 1 = 0

(che collega i cinque numeri fondamentali 0, 1, i, π, e in un’espressione quasi mistica).^[5.6]

Possiamo capire meglio queste proprietà se prendiamo l’esponenziale dell’espressione z = log r + iθ per ottenere

w = e^z = e^{logr + iθ} = e^logre^iθ = re^iθ.

Ciò mostra che la forma polare di qualsiasi numero complesso w, che in precedenza avevo denotato con [r, θ], può essere scritta, in modo più rivelatore, come

w = re^iθ.

In questa forma, è evidente che, se moltiplichiamo due numeri complessi, prendiamo il prodotto dei loro moduli e la somma dei loro argomenti (re^iθse^iφ = rse^{i(θ + φ)}, cosicché r e s sono moltiplicati, mentre θ e φ sono sommati – tenendo a mente che sottrarre 2π da θ + φ non produrrebbe alcuna differenza), com’è implicito nella legge dei «triangoli simili» di fig. 5.1b. Abbandonerò quindi la notazione [r, θ] e userò invece l’espressione sopra mostrata. Si noti che, se r = 1, θ = π, otteniamo – 1 e ritroviamo la famosa formula di Eulero e^πi + 1 = 0 che abbiamo visto sopra, usando la geometria di fig. 5.4a; se r = 1 e θ = 2π, otteniamo +1 e ritroviamo e^2πi = 1.

La circonferenza con r = 1 è detta la circonferenza unitaria nel piano complesso (vedi fig. 5.8); questa è data da w = e^iθ per θ reale, in accordo con l’espressione precedente. Confrontando questa espressione con le precedenti x = r cos θ e y = r sin θ date in precedenza, per la parte reale e immaginaria di quella che è ora la grandezza w = x + iy, otteniamo la prolifica «formula di (Cotes-)Euler»⁵

e^iθ = cos θ + i sin θ,

che fondamentalmente include gli elementi essenziali della trigonometria nelle proprietà molto più semplici delle funzioni esponenziali complesse.

Vediamo come la cosa funziona in alcuni casi elementari. In particolare, la relazione fondamentale e^a + b = e^ae^b, quando è sviluppata in termini di parti reali e immaginarie, dà immediatamente^[5.7] le espressioni dall’aspetto molto più complicato (senza alcun dubbio famigeratamente familiari ad alcuni lettori):

cos (a + b) = cos a cos b – sin a sin b,

sin (a + b) = sin a cos b + cos a sin b.

Analogamente, sviluppando e^3iθ = (e^iθ)³, per esempio, si ottiene^[5.8]6

cos 3θ = cos³ θ – 3 cos θ sin² θ,

sin 3θ = 3 sin θ cos² θ – sin³ θ.

C’è davvero qualcosa di magico nel modo diretto con cui queste formule alquanto complicate saltano fuori da semplici espressioni in termini di numeri complessi.

Fig. 5.8 - La circonferenza unitaria, formata dai numeri complessi di modulo 1. La formula di Cotes-Euler li dà come eiθ = cosθ + isinθ per θ reale.

Fig. 5.8 - La circonferenza unitaria, formata dai numeri complessi di modulo 1. La formula di Cotes-Euler li dà come e^iθ = cosθ + isinθ per θ reale.

5.4 Potenze complesse

Ritorniamo ora alla definizione di w^z (o b^z, come scritto prima). Possiamo ottenerla scrivendo

w^z = e^zlogw

(poiché e^zlogw = (e^logw)^z ed e^logw = w). Ma notiamo che, a causa dell’ambiguità in log w, possiamo addizionare qualsiasi multiplo intero di 2πi a log w per ottenere un’altra possibile risposta. Ciò significa che possiamo moltiplicare o dividere qualunque scelta particolare di w^z per e^{z. 2πi} quante volte vogliamo ottenendo ancora un possibile «w^z». È divertente vedere la configurazione di punti nel piano complesso che si ottiene nel caso generale. Questa è illustrata in fig. 5.9. I punti si trovano alle intersezioni di due spirali equiangole. (Una spirale equiangola – o logaritmica – è una curva piana che forma un angolo costante con le rette che escono da un punto del piano.)^[5.9]

Questa ambiguità ci conduce verso svariati problemi, se non facciamo attenzione.^[5.10] Sembra che il modo migliore di evitare questi problemi sia adottare la regola per cui la notazione w^z sia impiegata soltanto quando è stata specificata una scelta particolare di log w. (Nel caso speciale di e^z, la tacita convenzione è sempre quella di prendere la scelta particolare log e = 1. Allora la notazione standard e^z è coerente con il nostro più generale w^z.) Una volta che è fatta questa scelta di log w, allora w^z è definito senza ambiguità per tutti i valori di z.

Si può far notare, a questo punto, che abbiamo anche bisogno di una specificazione per log b, se dobbiamo definire il «logaritmo in base b» a cui abbiamo accennato in precedenza in questa sezione (la funzione indicata da «log b»), perché ci occorre un w = b^z non ambiguo per definire z = log_bw. Anche così, log_bw avrà naturalmente molti valori (come era il caso con log_bw), dove possiamo addizionare a log_bw qualsiasi multiplo intero di 2πi/log b.^[5.11]

Una curiosità che ha notevolmente affascinato nel passato molti matematici è la grandezza iⁱ. Questa poteva sembrare «la cosa più immaginaria che si potesse ottenere»; troviamo tuttavia la risposta reale

Fig. 5.9 - I diversi valori di wz (= ez log w). Qualsiasi multiplo intero di 2πi può essere addizionato a logz, il che moltiplica o divide wz per ez2πi un numero intero di volte. Nel caso generale, questi sono rappresentati nel piano complesso come le intersezioni di due spirali equiangole (ciascuna delle quali forma un angolo costante con rette passanti per l’origine).

Fig. 5.9 - I diversi valori di w^z (= e^z log w). Qualsiasi multiplo intero di 2πi può essere addizionato a logz, il che moltiplica o divide w^z per e^z2πi un numero intero di volte. Nel caso generale, questi sono rappresentati nel piano complesso come le intersezioni di due spirali equiangole (ciascuna delle quali forma un angolo costante con rette passanti per l’origine).

specificando log .^[5.12] Vi sono anche molte altre risposte, date dalle altre specificazioni di log i. Si ricavano moltiplicando la grandezza sopra ottenuta per e^2πn, dove n è un intero qualsiasi (o, in modo equivalente, innalzando la grandezza di sopra a qualunque potenza della forma 4n + 1, dove n è un intero – positivo o negativo).^[5.13] È sorprendente che tutti i valori di iⁱ siano in effetti reali!

Vediamo ora come la notazione w^z funzioni per . Ci aspettiamo di essere in grado di rappresentare, in un certo senso, le due grandezze come «w^1/2». Otteniamo, in effetti, queste due grandezze semplicemente specificando per la prima un valore per log w e per la seconda specificando il valore ottenuto sommando 2πi al primo valore. Questo dà come risultato un cambiamento di segno in w^1/2 (per la formula di Euler e^πi = – 1). In modo analogo, possiamo generare tutte le n soluzioni di zⁿ = w, quando n è 3, 4, 5, …, come la grandezza w^1/n, specificando successivamente differenti valori di log w.^[5.14] Più in generale, possiamo ritornare alla questione delle radici di ordine z di un numero complesso w diverso da zero, a cui si è accennato in §4.2. Possiamo esprimere una simile radice di ordine z come w^1/z, ottenendo in generale un numero infinito di valori alternativi, che dipendono dalla scelta fatta per log w. Con la giusta scelta specificata per log (w^1/z), e precisamente quella data da (log w)/z, otteniamo proprio (w^1/z)^z = w. Facciamo notare che, più in generale

(w^a)^b = w^ab,

dove, una volta che abbiamo fatto una specificazione di log w (per il lato di destra), dobbiamo specificare che (per il lato di sinistra) log (w^a) è a(log w).^[5.15]

Quando z è un intero positivo n, le cose sono molto più semplici e si ottengono proprio n radici. In questo caso, una situazione di particolare interesse si riscontra quando w = 1. Allora, specificando successivamente i possibili valori di (log 1), e precisamente 0, 2πi, 4πi, 6πi, …, otteniamo 1 = e⁰, e^2πi/n, e^4πi/n, e^6πi/n, … per i possibili valori di 1^1/n. Possiamo scriverli come 1, Ɛ, Ɛ², Ɛ³, …, con Ɛ = e^2πi/n. Nel piano complesso questi sono n punti egualmente spaziati sulla circonferenza unitaria, chiamati radici ennesime dell’unità; essi costituiscono i vertici di un poligono regolare di n lati (vedi fig. 5.10). (Si noti che le scelte – 2πi, – 4πi, – 6πi, eccetera, per log 1 darebbero le stesse radici ennesime in ordine inverso.)

Fig. 5.10 - Le radici ennesime dell’unità e2πri/n (r = 1, 2, …, n), egualmente spaziate lungo la circonferenza unitaria, forniscono i vertici di un ennagono regolare. Qui n = 5.

Fig. 5.10 - Le radici ennesime dell’unità e^2πri/n (r = 1, 2, …, n), egualmente spaziate lungo la circonferenza unitaria, forniscono i vertici di un ennagono regolare. Qui n = 5.

È abbastanza interessante osservare che, per un dato n, le radici ennesime dell’unità costituiscono quello che è chiamato un gruppo moltiplicativo finito, più in particolare il gruppo ciclico Z_n (vedi §13.1). Abbiamo n grandezze con la proprietà che moltiplicando tra loro due qualsiasi di esse otteniamo un’altra di queste grandezze. Possiamo anche dividerle tra loro ottenendo lo stesso risultato. A titolo d’esempio, consideriamo il caso n = 3; otteniamo ora tre elementi 1, ω, ω², dove ω = e^2πi/3 (così ω³ = 1 e ω^–1 = ω²). Abbiamo per questi numeri le seguenti semplici tabelle di moltiplicazione e divisione:

Questi particolari numeri sono rappresentati nel piano complesso dai vertici di un triangolo equilatero. La moltiplicazione per ω fa ruotare il triangolo di (vale a dire 120°) in senso antiorario e quella per ω² causa la stessa rotazione, ma in senso orario; nel caso della divisione, la rotazione è nella direzione opposta (vedi fig. 5.11).

Fig. 5.11 - Il triangolo equilatero delle radici cubiche 1, ω, ω2 dell’unità. La moltiplicazione per ω fa ruotare di 120° in senso antiorario, quella per ω2 di 120° in senso orario.

Fig. 5.11 - Il triangolo equilatero delle radici cubiche 1, ω, ω² dell’unità. La moltiplicazione per ω fa ruotare di 120° in senso antiorario, quella per ω² di 120° in senso orario.

5.5 Alcune relazioni con la moderna fisica delle particelle

Numeri come questi sono interessanti per la moderna fisica delle particelle, poiché forniscono i casi possibili di un numero quantico moltiplicativo. In §3.5, ho commentato il fatto che i numeri quantici additivi (scalari) della fisica delle particelle sono invariabilmente quantificati, per quanto se ne sa, da interi. Vi sono anche alcuni esempi di numeri quantici moltiplicativi, e questi sembrano essere quantificati in termini delle radici ennesime dell’unità. Conosco solo pochi esempi di simili grandezze nella convenzionale fisica delle particelle, e nella maggior parte di questi la situazione è il caso relativamente poco interessante di n = 2. Vi è un unico chiaro caso dove n = 3 e forse un caso per cui n = 4. Sfortunatamente, nella maggior parte dei casi il numero quantico non è universale; in altre parole non può essere applicato coerentemente a tutte le particelle. In tali situazioni, dirò che il numero quantico è solo approssimato.

La grandezza chiamata parità è un numero quantico moltiplicativo (approssimato) con n = 2. (Vi sono anche altre grandezze approssimate, con n = 2, simili sotto molti aspetti alla parità, come la G-parità. Non le discuterò qui.) La nozione di parità per un sistema composto è costruita (moltiplicativamente) dalle parità delle particelle costituenti. Per ciascuna di queste particelle costituenti, la parità può essere pari, nel qual caso la riflessione speculare della particella è la particella stessa; in alternativa, la sua parità può essere dispari, nel qual caso la sua riflessione speculare è quella che è chiamata la sua antiparticella (vedi §3.5, §§24.1-3,8 e §26.4). Poiché la nozione di riflessione speculare, o di antiparticella, è un qualcosa il cui «quadrato è l’unità», (cioè la sua ripetizione ci riporta al punto di partenza), il numero quantico – indichiamolo con ε – deve avere la proprietà Ɛ² = 1, così che deve essere una «radice ennesima dell’unità» per n = 2 (cioè Ɛ = + 1 o Ɛ = – 1). Questa nozione è solo approssimata perché la parità non è conservata rispetto a quelle che sono chiamate «interazioni deboli»; non vi può quindi essere, a causa di ciò, una parità ben definita per certe particelle (vedi §§25.3,4).

La nozione di parità inoltre si applica, nelle normali descrizioni, solo alla famiglia di particelle note come bosoni. Le altre particelle appartengono a un’altra famiglia e sono note come fermioni. La distinzione tra bosoni e fermioni è molto importante, ma piuttosto sofisticata, e la riprenderemo più avanti, in §§23.7,8. (In una manifestazione, essa ha a che fare con quello che avviene quando ruotiamo con continuità lo stato di una particella di 2π, cioè di 360°. Soltanto i bosoni ritornano del tutto ai loro stati iniziali dopo una simile rotazione; per i fermioni una simile rotazione deve essere fatta due volte! Vedi §11.3 e §22.8.) In un certo senso «due fermioni fanno un bosone», mentre «anche due bosoni fanno un bosone» e «un bosone e un fermione fanno un fermione». In questo modo, possiamo assegnare il numero quantico moltiplicativo – 1 a un fermione e + 1 a un bosone per descrivere la sua natura rispetto alla parità, ottenendo così un altro numero quantico moltiplicativo con n = 2. Per quanto è finora noto, questa grandezza è un numero quantico moltiplicativo esatto.

Sembra che vi sia anche una nozione di parità che può essere applicata ai fermioni, anche se non sembra che sia una terminologia convenzionale. Questa deve essere combinata con il numero quantico fermione/bosone per dare un numero quantico moltiplicativo con n = 4. Il valore di parità, per un fermione, dovrebbe essere + i o – i, e una sua doppia riflessione speculare equivarrebbe a una rotazione di 2π; per un bosone, il valore di parità sarebbe ± 1, come prima.

Il numero quantico moltiplicativo con n = 3 a cui ho accennato è quello che chiamerò quarkiness. (Questa non è una terminologia standard e non è neppure consueto riferirsi a questo concetto come a un numero quantico, ma esso racchiude un aspetto importante della nostra attuale comprensione della fisica delle particelle.) In §3.5, ho accennato al punto di vista moderno secondo cui le particelle «interagenti fortemente» note come adroni (protoni, neutroni, mesoni π, eccetera) siano composte da quark (vedi §25.6). Questi quark hanno cariche elettriche i cui valori non sono multipli interi della carica elettrica dell’elettrone, ma sono invece multipli interi di un terzo di questa carica. I quark, tuttavia, non possono esistere come singole particelle separate e i loro composti possono esistere, come singole individualità, soltanto se la somma delle cariche dei singoli costituenti è un multiplo intero della carica dell’elettrone. Sia q il valore della carica elettrica misurata nelle unità negative dell’elettrone (così che per l’elettrone abbiamo q = – 1, poiché, convenzionalmente, la carica dell’elettrone è presa come negativa). Per i quark, abbiamo ; per gli anti-quark, In questo modo, se prendiamo per la quarkiness il numero quantico moltiplicativo e^{– 2qπi}, troviamo che esso assume i valori 1, ω, ω². Per un quark, la quarkiness è ω e, per un antiquark, è ω². Una particella può esistere da sola, per proprio conto, solo se la sua quarkiness è 1. In accordo con §5.4, i valori di quarkiness costituiscono il gruppo ciclico Z₃. (In §16.1, vedremo come, con un elemento aggiuntivo «0» e una notazione additiva, questo gruppo può essere esteso al campo finito F₄.)

In questa sezione e in quella precedente, ho mostrato alcuni degli aspetti matematici della magia dei numeri complessi e ho accennato a un numero ristrettissimo delle loro applicazioni. Ma non ho ancora menzionato gli aspetti dei numeri complessi (che saranno evidenziati nel capitolo 7) che io stesso ho trovato i più magici di tutti quando li ho appresi da studente universitario di matematica. Negli anni successivi, mi sono imbattuto in aspetti ancora più sorprendenti di questa magia, e uno di questi (descritto alla fine del capitolo 9) è stranamente complementare a quello che più mi aveva colpito come studente universitario. Tuttavia, queste cose dipendono da certe nozioni fondamentali di calcolo infinitesimale. Quindi, per trasmettere parte di tale magia al lettore, sarà dapprima necessario fare alcuni accenni riguardo a queste nozioni fondamentali. Ma vi è naturalmente anche un’altra ragione: il calcolo infinitesimale è assolutamente essenziale per un’adeguata comprensione della fisica!

Note

1. Si dovrebbe anche tener conto delle funzioni trigonometriche cot θ = cos θ / sin θ = (tan θ)^–1, sec θ = (cos θ)^–1 e cosec θ = (sin θ)^–1, così come delle versioni «iperboliche» delle funzioni trigonometriche, sin ht = (e^t – e^–t), cos ht = (e^t + e^–t), tan ht = sin ht/cos ht, eccetera. Si noti anche che l’inverso di queste operazioni sono denotate da cot^–1, sin h^–1, eccetera, come con la «tan^–1 (y/x)» di §5.1.

2. I logaritmi sono stati introdotti nel 1614 da John Napier e resi pratici da Henry Briggs nel 1624.

3. Il logaritmo naturale è comunemente indicato anche con «ln».

4. Da quello che è stato finora dimostrato, non possiamo inferire che «iθ» nella formula z = log r + iθ non dovrebbe essere un multiplo reale di iθ. Questo richiede il calcolo.

5. Cotes (1714) possedeva la formula equivalente log (cos θ + i sin θ) = iθ. Sembra che la formula di Euler e^iθ = cos θ + i sin θ sia comparsa per la prima volta trent’anni più tardi (vedi Euler 1748).

6. Sto qui impiegando la notazione comoda (ma alquanto illogica) cos³ θ per (cos θ)³, eccetera. Dovrebbe essere notata l’incoerenza di questa notazione con (la più logica) cos^–1θ, questa ultima essendo anche comunemente indicata con arc cos θ. La formula sin nθ + i cos nθ = (sin θ + i cos θ)ⁿ è nota anche come «teorema di De Moivre». Sembra che Abraham De Moivre, un contemporaneo di Roger Cotes (vedi la nota precedente), abbia scoperto anche lui la formula e^iθ = sin θ + i cos θ.

[5.1] Esaminate le varie possibilità.

[5.2] Fatelo.

[5.3] Cercate di dimostrarlo senza calcoli dettagliati e senza trigonometria. (Suggerimento: questo è una conseguenza della «legge distributiva» w(z₁ + z₂) = wz₁ + wz₂, che mostra che la struttura «lineare» del piano complesso è preservata, e di w(iz) = i(wz), che mostra che la rotazione per un angolo retto è preservata; gli angoli retti, in altre parole, sono preservati.)

[5.4] Formulatelo esplicitamente.

[5.5] Controllate questo direttamente dalla serie. (Suggerimento: il «teorema binomiale» per esponenti interi afferma che il coefficiente di ap bq in (a + b)n è n!/p!q!.)

[5.6] Deducete da questo che z + πi pi è un logaritmo di – w.

[5.7] Verificatelo.

[5.8] Fatelo.

[5.9] Dimostratelo. In quanti modi? Trovate anche tutti i casi speciali.

[5.10] Risolvete il seguente paradosso:

[5.11] Dimostratelo.

[5.12] Perché questa è una specificazione ammissibile?

[5.13] Mostrate perché questo funziona.

[5.14] Enunciatelo esplicitamente.

[5.15] Dimostratelo.

6.1 Che cosa fa una funzione perbene?

Il calcolo infinitesimale – o, per dargli un nome più sofisticato, l’analisi matematica – è costituito da due ingredienti fondamentali: la derivazione e l’integrazione. La derivazione si occupa di velocità e accelerazioni, di coefficienti angolari e curvature di curve e superfici e cose simili, ossia tassi di cambiamento e grandezze definite localmente, in termini della struttura o del comportamento dei più piccoli intorni di singoli punti. L’integrazione si occupa invece di aree e volumi, di centri di gravità e di molte altre cose di questo genere che implicano misure di globalità, in una forma o in un’altra, e non sono definite semplicemente da ciò che avviene nell’intorno locale o infinitesimale di singoli punti. Il fatto notevole, chiamato teorema fondamentale del calcolo infinitesimale, è che ciascuno di questi due ingredienti è sostanzialmente l’inverso dell’altro. È in gran parte dovuto a ciò il fatto che questi due importanti campi di studio matematico si combinino insieme per fornire un potente corpo di comprensione e di tecniche computazionali.

Questo campo dell’analisi matematica, sorto nel diciassettesimo secolo grazie a Fermat, Newton e Leibniz e che si riallaccia alle idee di Archimede sviluppate nel terzo secolo a. C., viene chiamato «calcolo infinitesimale» perché fornisce proprio un corpo di tecniche di calcolo grazie alle quali problemi che altrimenti sarebbero concettualmente difficili da trattare possono spesso essere risolti «automaticamente», seguendo semplicemente poche regole elementari applicabili senza bisogno di esercitare un grande sforzo mentale. Tuttavia in questo calcolo infinitesimale esiste uno stridente contrasto tra le operazioni di derivazione e integrazione riguardo a quale sia quella «facile» e quale quella «difficile». Quando si tratta di applicare le operazioni a formule esplicite implicanti funzioni note, quella «facile» è la derivazione e quella «difficile» è l’integrazione, che in molti casi non può affatto essere eseguita in modo esplicito. D’altra parte, quando le funzioni non sono date in termini di formule, ma in termini di liste tabulate di dati numerici, l’operazione «facile» è l’integrazione mentre quella «difficile» risulta la derivazione, che, rigorosamente parlando, non può essere affatto possibile nel modo normale. Le tecniche numeriche si occupano di solito di approssimazioni, ma anche nella teoria esatta vi è un elemento analogo a questo aspetto; inoltre l’integrazione può essere eseguita anche in circostanze in cui la derivazione non può esserlo. Cerchiamo di capirne qualcosa. Questi problemi hanno in effetti a che fare con quello che realmente si intende con la parola «funzione».

Per Euler e gli altri matematici del diciassettesimo e diciottesimo secolo, una «funzione» avrebbe rappresentato qualcosa da poter scrivere esplicitamente, come x² o sinx o log(3 – x + e^x), o forse definita da qualche formula implicante un’integrazione o da una serie di potenze data esplicitamente. Oggi preferiamo pensare in termini di «applicazioni», dove un insieme A di numeri (o di entità più generali) chiamato dominio della funzione è «applicato» su qualche altro insieme B, chiamato target della funzione (vedi fig. 6.1). Il punto essenziale di tutto ciò è che la funzione assegna un membro del target B a ciascun membro del dominio A. (Si pensi alla funzione come a qualcosa «che esamina» un numero appartenente ad A e poi, in base solo al numero che trova, produce un numero definito appartenente a B.) Questo genere di funzione può essere solo una «tabella da consultare»; non vi sarebbe alcuna richiesta per una formula «dall’aspetto ragionevole» per esprimere l’azione della funzione in modo chiaramente esplicito.

Fig. 6.1 - Una funzione come una «applicazione», con cui il suo dominio (un insieme A di numeri o di altri enti) è «applicato» sul suo target (un altro insieme B). A ogni elemento di A è assegnato un particolare elemento di B, anche se a differenti elementi di A può essere assegnato lo stesso elemento di B e alcuni elementi di B non corrispondono a nessun elemento di A

Fig. 6.1 - Una funzione come una «applicazione», con cui il suo dominio (un insieme A di numeri o di altri enti) è «applicato» sul suo target (un altro insieme B). A ogni elemento di A è assegnato un particolare elemento di B, anche se a differenti elementi di A può essere assegnato lo stesso elemento di B e alcuni elementi di B non corrispondono a nessun elemento di A.

Esaminiamo alcuni esempi. Nella fig. 6.2, ho tracciato i grafici di tre semplici funzioni, precisamente quelle date da x², |x| e θ(x).¹ In ciascun caso, il dominio e il target sono entrambi l’insieme di tutti i numeri reali, di solito indicato con R. La funzione che denoto con «x²» eleva semplicemente al quadrato il numero reale che sta esaminando. La funzione denotata da |x| (chiamata valore assoluto) produce esattamente x, se x non è negativo, ma dà – x se x è negativo; così |x| non è mai negativo. La funzione θ(x) è 0 se x è negativo ed è 1 se x è positivo; di solito si adotta la definizione θ(0) = . (Questa funzione è chiamata la funzione a gradino di Heaviside; vedi §21.1 per un’altra importante influenza matematica di Oliver Heaviside, che è forse più conosciuto per avere postulato per primo l’esistenza dello «strato di Heaviside» dell’atmosfera terrestre, così vitale per le trasmissioni radio.) Ciascuna di queste è una funzione perfettamente accettabile nel senso moderno del termine, ma Euler² avrebbe avuto difficoltà ad accettare |x| e q(x) come vere funzioni nel suo significato del termine.

Fig. 6.2 - I grafici di (a) |x|, (b) x2 e (c) θ(x); in tutti e tre i casi il dominio e il target sono il sistema di numeri reali.

Fig. 6.2 - I grafici di (a) |x|, (b) x² e (c) θ(x); in tutti e tre i casi il dominio e il target sono il sistema di numeri reali.

Perché potrebbe avvenire ciò? Si potrebbe pensare che il problema con |x| e θ(x) è che vi è una sovrabbondanza di espressioni del genere: «Se x è una certa cosa fai la tale cosa, mentre se x è…», ma non vi è alcuna «bella formula» per la funzione. Tutto ciò è però alquanto vago, e in qualsiasi caso potremmo chiederci cosa ci sia di realmente errato nel ritenere che |x| sia una «formula». Inoltre, una volta che abbiamo accettato |x|, potremmo scrivere ^[6.1] una formula per θ(x):

(anche se potremmo chiederci in quale senso questa formula ci fornisca il giusto valore per θ(0), poiché essa ci dà 0/0). Più pertinente è che il problema con |x| non è tanto che la sua espressione esplicita non sia «bella», quanto che questa funzione non sia «liscia». Lo vediamo «nell’angolo» nel mezzo della fig. 6.2a. La presenza di quest’angolo è ciò che impedisce a |x| di avere una pendenza ben definita nel punto x = 0. Cerchiamo di scendere a patti con questa nozione.

6.2 Pendenze di funzioni

Come è stato fatto notare in precedenza, il calcolo differenziale ha a che fare anche con il calcolo di «pendenze». Vediamo chiaramente dal grafico di |x|, mostrato nella fig. 6.2a, che non vi è un’unica pendenza all’origine, là dove si trova il nostro scomodo angolo. In qualunque altro punto la pendenza è ben definita, ma non all’origine. È a causa di questo problema all’origine che diciamo che |x| non è derivabile all’origine o, in altri termini, che qui non è liscia. La funzione x², invece, ha dovunque una pendenza perfettamente ben definita, come illustrato nella fig. 6.2b. In effetti, la funzione x² è derivabile ovunque.

La situazione con θ(x), come è illustrata nella fig. 6.2c, è persino peggiore di quella di |x|. Si noti che θ(x) fa uno spiacevole «salto» all’origine (x = 0). Diciamo che θ(x) è discontinua all’origine; mentre entrambe le funzioni x² e |x| sono ovunque continue. L’impaccio di |x| all’origine non è dovuto a un difetto di continuità, ma a una mancanza di derivabilità. (Anche se la mancanza di continuità e di liscezza sono cose diverse, esse sono però concetti realmente collegati tra loro, come vedremo tra breve.) Nessuna di queste due manchevolezze sarebbe presumibilmente piaciuta a Euler ed entrambe sembrano fornire evidenti motivi per ritenere che |x| e θ(x) non siano funzioni «decorose». Ma prendiamo ora in esame le due funzioni illustrate nella fig. 6.3. La prima, x³, sarebbe accettabile secondo ogni criterio; ma cosa dire della seconda, che può essere definita dall’espressione x|x| e che illustra la funzione che è x², quando x non è negativo, e – x² quando x è negativo? I due grafici, a guardarli, sembrano abbastanza simili l’uno all’altro e certamente «lisci». In effetti, hanno entrambi un valore perfettamente definito per la «pendenza» all’origine, e precisamente «zero» (che significa che qui le curve hanno una tangente orizzontale) e sono derivabili ovunque, nel significato più diretto della parola. Tuttavia, certamente non sembra che x|x| sia quella «bella» specie di funzione che sarebbe piaciuta a Euler.

Una cosa «sbagliata» in x|x| è che non ha una curvatura ben definita all’origine, essendo la nozione di curvatura certamente qualcosa di cui il calcolo differenziale si occupa. In effetti, la «curvatura» è qualcosa che implica quelle che sono chiamate «derivate seconde», il che significa eseguire due volte la derivazione. In questo caso, diciamo che la funzione x|x| non è derivabile due volte all’origine. Tratteremo le derivate seconde e quelle di ordine più elevato in §6.3.

Fig. 6.3 - I grafici di (a) x3 e di (b) x|x| (cioè, x2 se x ≥ 0 e – x2 se x < 0).

Fig. 6.3 - I grafici di (a) x³ e di (b) x|x| (cioè, x² se x ≥ 0 e – x² se x < 0).

Per cominciare a capire questi concetti, dovremo vedere che cosa fa realmente l’operazione di derivazione; a questo scopo, abbiamo bisogno di sapere come si misura una pendenza. Ciò è illustrato nella fig. 6.4, in cui è illustrata una funzione puttosto rappresentativa che chiamerò f(x). La curva nella fig. 6.4a rappresenta la relazione y = f(x), dove il valore della coordinata y misura l’altezza, mentre x misura lo spostamento orizzontale, come avviene di solito in una descrizione cartesiana. Ho indicato la pendenza della curva a un particolare punto p come l’incremento della coordinata y diviso per l’incremento della coordinata x quando ci muoviamo lungo la retta tangente alla curva, che la tocca al punto p. (La definizione tecnica di «retta tangente» dipende dagli opportuni procedimenti di passaggio al limite, ma qui il mio scopo non è di fornire questi dettagli tecnici. Spero che il lettore troverà le mie descrizioni intuitive adeguate per i nostri scopi immediati.)³ La notazione standard per il valore di questa pendenza è dy/dx (si dice “dy su dx”). Possiamo pensare che «dy» sia un incremento mol to piccolo del valore di y lungo la curva e che «dx» sia il corrispondente piccolissimo aumento del valore di x. (Qui l’esattezza tecnica ci richiederebbe di passare al «limite», quando ciascuno di questi minuscoli incrementi si riduce a zero.)

Possiamo ora prendere in esame un’altra curva che riporta (rispetto a x) questa pendenza per ciascun punto p, per le varie possibili scelte della coordinata x; vedi fig. 6.4b. Sto ancora impiegando una descrizione cartesiana, ma questa volta sull’asse verticale viene riportato il valore di dy/dx, invece di quello di y. Lo spostamento orizzontale è ancora misurato da x. La funzione che viene qua plottata è comunemente chiamata f′(x) e possiamo scrivere dy/dx = f′(x). Chiamiamo dy/dx la derivata di y rispetto a x, e diciamo che la funzione f′(x) è la derivata di f(x).⁴

Fig. 6.4 - I grafici cartesiani di (a) y = f(x), (b) la derivata u = f’(x) (= dy/dx),

Fig. 6.4 - I grafici cartesiani di (a) y = f(x), (b) la derivata u = f’(x) (= dy/dx), e (c) la derivata seconda f’’(x) = d²y/dx². (Si noti che f(x) ha tangente orizzontale dove f’(x) incontra l’asse delle x e ha un punto di flesso dove f’’(x) incontra questo asse.)

6.3 Derivate di ordine superiore – Funzioni di classe C^∞

Vediamo ora quello che succede quando deriviamo una seconda volta. Ciò significa che ora osserviamo la funzione pendenza per la nuova curva della fig. 6.4b, che riporta u = f′(x), dove u sta al posto di dy/dx. Nella fig. 6.4c ho riportato questa funzione pendenza del «secondo ordine», che è il grafico di du/dx rispetto a x, così come ho fatto sopra per dy/dx, cosicché il valore di du/dx ci dà la pendenza della seconda curva u = f′(x). Otteniamo così quella che viene chiamata la derivata seconda della funzione originaria f(x); questa è comunemente indicata con f''(x). Quando in du/dx sostituiamo u con dy/dx, otteniamo la derivata seconda di y rispetto a x, che (in modo leggermente illogico) viene scritta d²y/dx² (e pronunciata «di due y su dx al quadrato»).

Si noti che i valori di x dove la funzione originaria ha tangente orizzontale sono proprio quelli in cui f′(x) incontra l’asse x (cioè dove dy/dx si annulla); questi sono anche i punti dove f(x) assume un massimo o un minimo (locali). Questa è una cosa importante quando siamo interessati a trovare i valori massimi e minimi (locali) di una funzione. Cosa dire dei punti dove la derivata seconda f''(x) incontra l’asse x? Questi si trovano dove si annulla la curvatura di f(x). Questi punti si trovano, in generale, dove la direzione in cui la curva «piega» cambia da un lato della curva all’altro; questi punti si chiamano punti d’inflessione. In effetti, non sarebbe esatto dire che f''(x) «misura» realmente la curvatura della curva definita da y = f(x), in generale; la curvatura effettiva è data da un’espressione⁵ più complicata di f''(x), ma che implica f''(x) e che si annulla quando f''(x) si annulla.

Consideriamo adesso le due funzioni dall’aspetto (superficialmente) simile x³ e x|x|, prima esaminate. In fig. 6.5a, b, c ho plottato x³ e le sue derivate, prima e seconda, come ho fatto con la funzione f(x) nella fig. 6.4, e in fig. 6.5d, e, f ho fatto la stessa cosa con x|x|. Nel caso di x³, vediamo che non vi sono problemi di continuità o di liscezza per entrambe le derivate, prima o seconda. In effetti, la derivata prima è 3x² e quella seconda è 6x; nessuna delle due avrebbe dato a Euler la minima preoccupazione. (Vedremo tra poco come ottenere queste espressioni esplicite.) Nel caso di x|x|, tuttavia, troviamo qualcosa di molto simile «all’angolo» della fig. 6.2a per la derivata prima e un comportamento da «funzione a gradino» per la derivata seconda, molto simile a fig. 6.2c. Abbiamo un difetto di liscezza per la derivata prima e un difetto di continuità per quella seconda. A Euler questa cosa non avrebbe per nulla fatto piacere. La derivata prima è, in effetti, 2|x| e quella seconda – 2 + 4θ(x). (I miei lettori più pignoli potrebbero lamentarsi perché non avrei dovuto con tanta disinvoltura scrivere una «derivata» per 2|x|, che non è realmente derivabile all’origine. Questo è vero, ma è soltanto un cavillo: una giustificazione completa in proposito può essere ottenuta usando le nozioni che saranno introdotte alla fine del capitolo 9.)

Fig. 6.5 - (a), (b), (c) I grafici di x3, della sua derivata prima 3x2 e della sua derivata seconda 6x, rispettivamente. (d), (e), (f) I grafici di x|x|, della sua derivata prima 2|x| e della sua derivata seconda – 2 + 4θ(x), rispettivamente.

Fig. 6.5 - (a), (b), (c) I grafici di x³, della sua derivata prima 3x² e della sua derivata seconda 6x, rispettivamente. (d), (e), (f) I grafici di x|x|, della sua derivata prima 2|x| e della sua derivata seconda – 2 + 4θ(x), rispettivamente.

Possiamo facilmente immaginare che possano essere costruite funzioni per cui simili difetti di liscezza o di continuità non si mostrano fino a che non sia stato fatto un grande numero di derivazioni. In effetti, funzioni della forma xⁿ|x|, dove n è un numero intero positivo, grande a piacere, vanno bene per questo scopo. La terminologia matematica in questi casi asserisce che la funzione f(x) è di classe Cⁿ, se può essere derivata n volte (in ciascun punto del suo dominio) e l’ennesima derivata è continua.⁶ La funzione xⁿ|x| è effettivamente di classe Cⁿ, ma non di classe C^{n + 1} all’origine.

Quanto dovrebbe essere grande n per soddisfare Euler? Sembra chiaro che il matematico non si sarebbe accontentato di qualsiasi particolare valore di n; qualsiasi funzione per bene che riscuoterebbe l’approvazione di Euler dovrebbe poter essere differenziata tante volte quante vogliamo. A questo fine, i matematici dicono che una funzione è di classe C^∞ se è di classe Cⁿ per ogni intero positivo n. Per dirlo in un’altra maniera, una funzione di classe C^∞ deve essere differenziabile tante volte quante vogliamo.

Presumiamo che la nozione di Euler di una funzione avrebbe richiesto qualcosa di analogo a una funzione di classe C^∞. Ci possiamo immaginare che si sarebbe per lo meno aspettato che le sue funzioni fossero di classe C^∞ nella maggior parte dei punti del loro dominio. Ma cosa possiamo dire della funzione 1/x? (Vedi fig. 6.6.) Questa non è certamente di classe C^∞ all’origine; non è neppure definita all’origine, nel senso moderno di funzione. Il nostro Euler, tuttavia, l’avrebbe certamente accettata come «funzione» decente, nonostante questo problema. Dopo tutto, vi è per essa una semplice formula dall’aspetto naturale. Ci si può immaginare che Euler non si sarebbe preoccupato più di tanto se le sue funzioni non fossero state di classe C^∞ in ogni punto del loro dominio (supponendo che si sarebbe preoccupato per il «dominio»). Forse non avrebbe importanza se le cose andassero male in un punto strano; ma |x| e θ(x) vanno male allo stesso «punto strano» di 1/x. Sembra che, a dispetto di tutti i nostri sforzi, non abbiamo ancora afferrato la nozione «euleriana» di funzione per cui ci siamo impegnati.

Fig. 6.6 - Il grafico di

Fig. 6.6 - Il grafico di

Prendiamo in esame un altro esempio. Consideriamo la funzione h(x), definita dalle regole

Il grafico di questa funzione è raffigurato nella fig. 6.7. Questa ha certamente l’aspetto di una funzione liscia. In effetti, è molto liscia; è di classe C^∞ nell’intero dominio dei numeri reali. (La dimostrazione di questo fatto si esegue nei primi corsi universitari di matematica. Io stesso ricordo di aver dovuto affrontare questa prova. ^[6.2]) Si può certamente immaginare che, a dispetto di questa estrema liscezza, Euler avrebbe storto il naso dinanzi a una funzione definita in questo modo. Chiaramente non è proprio una «unica funzione», nel senso euleriano; sono «due funzioni incollate assieme», non importa quanto lavoro sia stato fatto per rendere liscio il punto d’intoppo all’origine. Per Euler, invece, la funzione è proprio una funzione unica, nonostante il fatto che sia separata in due pezzi da un orribile «spuntone» all’origine, dove non è neppure continua, per non parlare di liscezza (fig. 6.6). La funzione h(x), per il nostro Euler, non sarebbe veramente migliore di |x| o di θ(x); in quei casi, avevamo chiaramente «due funzioni incollate assieme», anche se con un lavoro d’incollatura molto più scadente (e, nel caso di θ(x), sembra addirittura che i pezzi incollati si siano del tutto separati).

Fig. 6.7 - Il grafico di y = h(x) (= 0 se x ≤ 0 e = e– 1/x se x > 0), che è di classe C∞.

Fig. 6.7 - Il grafico di y = h(x) (= 0 se x ≤ 0 e = e– ^1/x se x > 0), che è di classe C^∞.

6.4 La nozione «euleriana» di funzione?

Come dobbiamo scendere a patti con questa concezione «euleriana» di avere proprio una singola funzione invece di un collage di funzioni separate? Come l’esempio di h(x) mostra chiaramente, l’appartenenza alla classe C^∞ non è abbastanza. Vi sono effettivamente due approcci completamente differenti per risolvere questo problema. Uno di questi usa i numeri complessi ed è ingannevolmente semplice da formulare, anche se molto importante per le sue implicazioni. Chiediamo semplicemente che la nostra funzione f(x) sia estensibile a una funzione f(x) della variabile complessa z, così che f(x) è liscia nel senso che si richiede soltanto che sia differenziabile una volta rispetto alla variabile complessa z. (Così f(x) è in senso complesso una specie di funzione di classe C¹.) Il fatto che sia necessario assumere solo questo è una straordinaria manifestazione di autentica magia. Se f(x) può essere derivata una volta rispetto al parametro complesso z, allora può essere differenziata tante volte quante vogliamo!

Ritornerò sulla questione del calcolo complesso nel capitolo successivo. Ma vi è un altro approccio alla soluzione di questa «nozione euleriana di funzione» che usa solo i numeri reali e che implica il concetto di serie di potenze da noi incontrato in §2.5. (Una delle cose in cui Euler era veramente un maestro era la manipolazione di serie di potenze.) Sarà utile considerare, in questa sezione, la questione delle serie di potenze, prima di ritornare al problema della differenziabilità complessa. Il fatto che, localmente, la differenziabilità complessa si riveli essere equivalente alla validità degli sviluppi in serie di potenze è una delle cose veramente grandi della magia dei numeri complessi.

Tratterò tutti questi argomenti al momento debito, ma per ora rimaniamo con le funzioni di numeri reali. Supponiamo che qualche funzione f(x) abbia effettivamente una rappresentazione in serie di potenze:

Vi sono dei metodi per trovare, da f(x), i coefficienti a₀, a₁, a₂, a₃, a₄, … Affinché un simile sviluppo esista, è necessario (anche se non sufficiente, come vedremo tra breve) che f(x) sia una funzione di classe C^∞, così che avremo nuove funzioni f′(x), f''(x), f'''(x), f''''(x), … ecc., che sono la prima, seconda, terza, quarta, eccetera derivata di f(x), rispettivamente. In realtà, saremo interessati ai valori di queste funzioni soltanto all’origine (x = 0) e avremo quindi bisogno che f(x) sia di classe C^∞ soltanto in quel punto. Il risultato (qualche volta chiamato serie di Maclaurin)⁷ è che, se f(x) ha un simile sviluppo in serie di potenze, allora ^[6.3]

(Si rammenti da §5.3 che n! = 1 × 2 × … × n.) Ma cosa possiamo dire del procedimento inverso? Se i coefficienti a sono dati in questo modo, ne consegue che la somma ci dia effettivamente f(x) (in qualche intervallo racchiudente l’origine)?

Ritorniamo alla nostra h(x) apparentemente senza giunture. Possiamo forse individuare un difetto al punto di giunzione (x = 0) usando questa idea. Tentiamo di vedere se h(x) ha uno sviluppo in serie di potenze. Prendendo, nella formula considerata sopra, f(x) = h(x), esaminiamo i vari coefficienti a₀, a₁, a₂, a₃, a₄, …, notando che si devono tutti annullare, perché la serie deve accordarsi con il valore h(x) = 0 tutte le volte che x è alla sinistra dell’origine. In realtà, troviamo che si annullano tutti anche per e^{– 1/x}, che è fondamentalmente il motivo per cui h(x) è di classe C^∞ all’origine, dovendosi raccordare l’una all’altra tutte le derivate dai due lati. Ma questo ci dice anche che la serie di potenze non può assolutamente funzionare, perché tutti i termini sono zero (vedi esercizio 6.1) e non possono quindi dare come somma e^{– 1/x}. Vi è così un difetto al punto di giunzione x = 0: la funzione h(x) non può essere espressa come una serie di potenze. Diciamo che h(x) non è analitica nel punto x = 0.

Nella discussione precedente, mi sono realmente riferito a quello che sarebbe chiamato uno sviluppo in serie di potenze attorno all’origine. Un analogo discorso vale per qualsiasi altro punto del dominio reale della funzione; ma allora dobbiamo «traslare l’origine» in qualche altro punto particolare, definito dal numero reale p in questo dominio, il che significa rimpiazzare x con x – p nello sviluppo in serie di potenze, ottenendo:

dove adesso

Questo è noto come sviluppo in serie di potenze intorno a p. La funzione f(x) è detta analitica in p, se può essere espressa come una simile serie di potenze in qualche intervallo racchiudente il punto x = p. Se f(x) è analitica in tutti i punti del suo dominio, diciamo che è una funzione analitica o, in modo equivalente, che è una funzione di classe C^ω. Le funzioni analitiche sono persino «più lisce» delle funzioni di classe C^∞. Inoltre, possiedono anche la proprietà per cui non è possibile «cavarsela» incollando assieme due funzioni analitiche «differenti», come negli esempi θ(x), |x|, x|x|, xⁿ|x|, o h(x) dati sopra. Euler sarebbe stato soddisfatto delle funzioni analitiche. Sono davvero funzioni «perbene»!

Tutte queste serie di potenze sono, però, elementi poco maneggevoli da trattare, persino con la sola immaginazione. Il modo «complesso» di osservare le cose si rivela enormemente più economico; fornisce, inoltre, una maggiore profondità di comprensione. La fun-zione, per esempio, non è analitica nel punto x = 0; tuttavia, è ancora una «funzione unica».^[6.4] La «filosofia delle serie di potenze» non ci dice direttamente questo; ma, dal punto di vista dei numeri complessi, è chiaramente una funzione unica, come vedremo.

6.5 Le regole di derivazione

Prima di discutere questi problemi, sarà utile dire qualcosa delle meravigliose regole che il calcolo differenziale ci offre: regole che ci permettono di derivare funzioni quasi senza pensarci, ma solo dopo mesi di pratica, naturalmente! Queste regole ci offrono la possibilità di vedere come scrivere direttamente la derivata di molte funzioni, in particolare quando sono rappresentate in termini di serie di potenze.

Si rammenti che prima ho fatto notare di sfuggita che la derivata di x³ è 3x². Questo è un caso particolare di una formula semplice, ma importante: la derivata di xⁿ è nx^{n – 1}, che possiamo scrivere

(La spiegazione della validità di questa formula ci distrarrebbe troppo; non è realmente difficile da dimostrare e il lettore interessato può trovare tutto il necessario in qualsiasi testo elementare di calcolo infinitesimale.⁸ Per inciso, non occorre che n sia un intero.) Possiamo anche esprimere⁹ questa equazione (“moltiplicandola per dx”) nella conveniente formula:

d(xⁿ) = nx^{n – 1} dx.

Non abbiamo bisogno di conoscere molto di più per quanto riguarda la differenziazione delle serie di potenze. Vi sono fondamentalmente altre due regole. La prima è che la derivata di una somma di funzioni è la somma delle derivate delle funzioni:

d[f(x) + g(x)] = df(x) + dg(x).

Questo è poi esteso a una somma di qualunque numero finito di funzioni.¹⁰ La seconda è che la derivata di una costante moltiplicata per una funzione è quella costante moltiplicata per la derivata di quella funzione:

d{a f(x)} = a df(x).

Con il termine «costante» intendo un numero che non varia al variare di x. I coefficienti a₀, a₁, a₂, a₃, … nella serie di potenze sono costanti. Con queste regole possiamo differenziare direttamente qualunque serie di potenze.^[6.5]

Un altro modo di indicare che a è una costante è scrivere

da = 0.

Tenendo in mente tutto ciò, troviamo che la regola appena data sopra è realmente un caso speciale (con g(x) = a) della «legge di Leibniz»:

d{f(x) g(x)} = f(x) dg(x) + g(x) df(x)

(il fatto che d(xⁿ)/dx = nx^{n – 1}, per qualsiasi numero naturale n, può anche essere ottenuto dalla legge di Leibniz^[6.6]). Un’altra regola utile è la seguente:

d{f(g(x))} = f′(g(x)) g'(x) dx.

Dalle ultime due e dalla prima formula, ponendo f(x)[g(x)]^{– 1} nella legge di Leibniz, possiamo dedurre^[6.7]che

Armati di queste poche regole (e con anni e anni di pratica), si può diventare «esperti in differenziazione» senza bisogno di avere una vera comprensione del perché queste regole funzionino! Questo è il potere di un buon sistema di calcolo.^[6.8] Inoltre, con la conoscenza delle derivate di poche funzioni speciali,^[6.9] si può persino diventare qualcosa più di un esperto. Affinché il lettore non addetto ai lavori possa immediatamente diventare un «membro» del club degli esperti differenziatori, lasciatemi elencare i principali esempi:^[6.10] ¹¹

Ciò illustra quanto è stato detto all’inizio di questa sezione: quando si hanno formule esplicite, l’operazione di derivazione è «facile». Naturalmente non voglio dire che lo possiate fare dormendo. In verità, in esempi particolari, può succedere che le espressioni diventino davvero molto complicate. Quando dico «facile», voglio dire che esiste un procedimento computazionale esplicito per eseguire derivazioni. Se sappiamo come derivare ciascuno degli ingredienti in un’espressione, allora i procedimenti di calcolo dati sopra ci consentono di differenziare l’intera espressione. «Facile», in questo caso, significa realmente qualcosa che può essere programmato per un computer senza problemi. Le cose sono molto differenti, invece, se tentiamo di andare nella direzione opposta.

6.6 L’integrazione

L’integrazione, come è stato spiegato all’inizio di questo capitolo, è l’operazione inversa a quella di derivazione. Essa consiste nel tentare di trovare una funzione g(x) per la quale valga la relazione g'(x) = f(x), cioè nel cercare di trovare una soluzione y = g(x) per l’equazione dy/dx = f(x). Un altro modo di esprimere questo concetto è quello di affermare che, invece di muoverci verso il fondo del disegno, in fig. 6.4 (o fig. 6.5), tentiamo di farci strada verso l’alto. La bellezza del «teorema fondamentale del calcolo infinitesimale» è che questo procedimento ci dice come calcolare le aree sotto ciascuna delle successive curve. Date un’occhiata a fig. 6.8. Ricordate che la curva in basso u = f(x) può essere ottenuta dalla curva in alto y = g(x), perché plotta le pendenze di quella curva, essendo f(x) la derivata di g(x).

Fig. 6.8 - Il teorema fondamentale del calcolo infinitesimale: interpretate di nuovo fig. 6.4a, b, procedendo verso l’alto invece che verso il basso. La curva in alto (a) plotta le aree sotto la curva in basso (b), dove l’area limitata da due rette verticali x = a e x = b, dall’asse x e la curva in basso è la differenza, g(b) – g(a), delle altezze della curva in alto a quei due valori di x (tenendo conto dei segni).

È lo stesso di prima; ma ora partiamo con la curva in basso. Troviamo che la curva in alto semplicemente mappa le aree sotto la curva in fondo. Un po’ più esplicitamente: se nel disegno in fondo prendiamo due rette verticali, date da x = a e x = b rispettivamente, allora l’area limitata da queste due rette, dall’asse x e dalla curva stessa, sarà la differenza tra le altezze della curva in cima per questi due valori di x. In questioni come questa, naturalmente, si deve stare attenti ai “segni”. Nelle regioni in cui la curva in basso si trova sotto l’asse x, le aree vanno conteggiate come negative. Inoltre, nell’illustrazione ho preso a < b e la «differenza tra le altezze» della curva in cima come g(b) – g(a). Se fosse a > b, i segni andrebbero invertiti.

Fig. 6.9 - Considerate b > a per un valore molto piccolo. Nella figura in basso, l’area di una striscia molto sottile tra le rette x = a, x = b è essenzialmente il prodotto della larghezza della striscia b – a per la sua altezza (dall’asse x alla curva). Questa altezza è la pendenza della curva in alto, per cui l’area della striscia è tale pendenza per la larghezza della striscia, che è la quantità di cui la curva in cima sale nel passaggio da a a b, cioè g(b) – g(a). Sommando molte strisce sottili, troviamo che l’area di una striscia larga sotto la curva in basso è il corrispondente ammontare della salita della curva in cima.

Nella fig. 6.9 ho tentato di rendere credibile, in modo intuitivo, il perché vi sia questa relazione inversa tra pendenze e aree. Immaginiamo che b sia di pochissimo più grande di a; allora l’area da considerare, nel disegno in basso, è quella della striscia molto sottile limitata dalle rette x = a e x = b, molto vicine tra loro. La misura di quest’area è sostanzialmente il prodotto della minuscola ampiezza della striscia (vale a dire, b – a) per la sua altezza (dall’asse x fino alla curva). Ma si suppone che l’altezza della striscia misuri la pendenza della curva in alto in quel punto. Quindi, l’area della striscia è questa pendenza moltiplicata per la larghezza della striscia; ma la pendenza della curva in alto moltiplicata per la larghezza della striscia è la quantità di cui cresce la curva in alto passando da a a b, è cioè la differenza g(b) – g(a). In questo modo, per strisce molto strette, l’area è davvero misurata da questa differenza. Le strisce più ampie sono formate dall’unione di grandi numeri di strisce strette; otteniamo quindi la loro area misurando l’innalzamento della curva in alto in tutto l’intervallo.

Vi è un punto significativo che qui dovrei mettere in evidenza. Nel passaggio dalla curva in basso a quella in alto, non vi è unicità su quanto in alto debba essere posta la curva superiore. Ci interessiamo soltanto alle differenze tra le altezze della curva in alto, cosicché la traslazione dell’intera curva in su o in giù non fa nessuna differenza. Ciò risulta chiaramente anche dall’interpretazione in termini di «pendenza», poiché la pendenza in punti diversi della curva in alto sarà proprio la stessa di prima, sia nel caso di traslazione verso l’alto che in quello di traslazione verso il basso. Dal punto di vista del calcolo differenziale, ciò significa che se aggiungiamo una costante C a g(x) la funzione risultante ha ancora come derivata f(x):

d(g(x) + C) = dg(x) + dC = f(x) dx + 0 = f(x) dx.

La funzione g(x), o allo stesso modo g(x) + C, dove C è una costante arbitraria, è chiamata un integrale indefinito di f(x), e possiamo scrivere

Questo è soltanto un altro modo di esprimere la relazione d[g(x) + cost] = f(x)dx, cosicché possiamo pensare che il segno «∫» sia proprio l’inverso del simbolo «d». Se vogliamo calcolare l’area compresa tra x = a e x = b, allora vogliamo quello che è chiamato l’integrale definito, che possiamo scrivere come

Se conosciamo la funzione f(x) e desideriamo ottenere il suo integrale g(x), non abbiamo quasi nessuna regola diretta per ottenerlo, diversamente da quanto avviene per la differenziazione. Si conosce una gran quantità di trucchi, molti dei quali possono essere trovati in comuni manuali o in programmi per computer, ma non sono sufficienti per trattare tutti i casi. In effetti, spesso la famiglia delle funzioni esplicite standard, precedentemente in uso, deve essere ampliata e devono essere «inventate» nuove funzioni per esprimere i risultati dell’integrazione. In realtà abbiamo già visto questo negli esempi speciali mostrati precedentemente. Supponiamo di conoscere soltanto le funzioni costituite da combinazioni di potenze di x. Data una generica potenza xⁿ, possiamo integrarla ottenendo x^{n + 1}/(n + 1). (Ciò significa impiegare la formula di sopra, in §6.5, con n + 1 al posto di n: d(x^{n + 1})/dx = (n + 1)xⁿ.) Tutto funziona a meraviglia finché non abbiamo a che fare con n = – 1; in questo caso, infatti, il presunto risultato x^{n + 1}/(n + 1) ha zero al denominatore e quindi non può funzionare. Come possiamo integrare x^{– 1}? Ebbene, con nostra grandissima fortuna, possiamo notare che nella nostra lista in §6.5 c’è la formula d(log x) = x^{– 1}dx. Così la risposta è log x + cost.

Questa volta siamo stati fortunati! Già in precedenza la funzione logaritmica era stata studiata per un motivo diverso, scoprendo così alcune delle sue proprietà. Ma in altre occasioni, potrebbe accadere che non vi sia alcuna funzione già nota con cui poter esprimere il risultato di un’integrazione. In effetti, gli integrali offrono spesso un modo appropriato per definire nuove funzioni. È in questo senso che l’integrazione esplicita risulta «difficile».

D’altra parte, se non siamo così interessati a espressioni esplicite, ma ci preoccupiamo di questioni di esistenza di funzioni che siano le derivate o gli integrali di date funzioni, allora le cose sono del tutto diverse. In questo caso l’integrazione è l’operazione che funziona senza complicazioni, mentre è la differenziazione a causare problemi. La stessa cosa avviene quando si eseguono queste operazioni partendo da dati numerici. Il problema fondamentale con la differenziazione è che dipende molto criticamente dai minuti dettagli della funzione che deve essere differenziata. Ciò può rappresentare un problema se non abbiamo un’espressione esplicita per questa funzione. L’integrazione invece è relativamente insensibile a tali questioni, poiché riguarda soprattutto la natura globale della funzione da integrare. In effetti, qualunque funzione continua (una funzione di classe C⁰) il cui dominio è un intervallo «chiuso» a ≤ x ≤ b può essere integrata,¹² essendo il risultato una funzione di classe C¹. Questa può ancora essere integrata, essendo il risultato una funzione di classe C², che a sua volta può essere di nuovo integrata dando una funzione di classe C³, e così via. L’integrazione rende le funzioni sempre più lisce e ci consente di proseguire indefinitamente. La differenziazione, d’altra parte, peggiora le cose e si può arrivare a un punto in cui la funzione risultante non è più «differenziabile».

Vi sono, tuttavia, approcci a tali questioni che permettono anche al processo di differenziazione di essere proseguito indefinitamente. Ho già fatto alcuni accenni quando mi sono permesso di differenziare la funzione |x| per ottenere θ(x), anche se |x| non è «differenziabile». Potremmo tentare di proseguire e di differenziare anche θ(x), nonostante possieda una pendenza infinita all’origine. Il risultato coincide con la cosiddetta funzione delta di Dirac,¹³ un’entità di notevole importanza nella matematica della meccanica quantistica. In realtà la funzione delta non è affatto una funzione, nel senso attuale di «funzione» che applica domini in spazi target. La funzione delta non ha alcun «valore» all’origine (questo potrebbe essere infatti soltanto infinito). Eppure, la funzione delta acquista una precisa definizione matematica entro diverse e più ampie classi di entità matematiche, tra le quali le distribuzioni sono le più conosciute.

A questo scopo, dobbiamo estendere la nostra nozione di funzioni di classe Cⁿ a casi in cui n sia un intero negativo. Allora la funzione θ(x) è di classe C^{– 1} e la funzione delta è di classe C^{– 2}. Ogni volta che differenziamo, dobbiamo diminuire la classe di differenziabilità di un’unità (in altre parole, la classe diventa più negativa per un’unità). Apparentemente in questo modo ci allontaniamo sempre di più dalla nozione di «funzione perbene» di Euler, che in effetti non ha niente a che vedere con cose simili, se non per un fatto di utilità. Tuttavia, a tempo debito scopriremo che è proprio qui che i numeri complessi ci sbalordiscono con ironia, un’ironia che si esprime in una delle loro più grandi azioni magiche! Dovremo aspettare sino alla fine del capitolo 9 per scoprire di cosa si tratta, perché non è qualcosa che posso descrivere adeguatamente in questo momento. Il lettore deve avere pazienza ancora per un po’, perché prima dovrò preparare il terreno, lastricandolo con altri ingredienti superbamente magici.

Note

1. Sto qui compiendo un piccolo «abuso di notazione», poiché tecnicamente x², per esempio, denota il valore della funzione più che la funzione stessa. Questa applica x in x² e potrebbe essere denotata da x ↦ x², o da λx [x²] secondo il calcolo lambda di Alonzo Church; vedi capitolo 2 di Penrose (1989).

2. In questa sezione, accennerò spesso a quelle che sarebbero state le convinzioni di Euler riguardo alla nozione di funzione. Devo tuttavia chiarire che lo «Euler» a cui mi riferisco è, in realtà, una persona ipotetica o idealizzata. Non ho alcuna informazione diretta delle opinioni del vero Leonhard Euler, ma le opinioni che attribuisco al «mio» Euler potrebbero non essere in disaccordo con quelle del vero Euler. Per maggiori informazioni su di lui, vedi Boyer (1968); Thiele (1982); Dunham (1999).

3. Per i dettagli, vedi Burkill (1962).

4. In termini rigorosi, è la funzione f′ che è la derivata della funzione f, non il valore f′(x) di f(x); non possiamo ottenere il valore di f′ in x semplicemente dal valore di f in x.

5. Cioè, f″(x)/[1 + f′(x)²]^3/2.

6. In realtà, ciò implica che tutte le derivate fino all’ennesima inclusa devono essere continue, perché la definizione tecnica di derivabilità richiede la continuità.

7. Lo sviluppo in serie di potenze intorno all’origine è tradizionalmente noto (con scarsa giustificazione storica) come serie di Maclaurin; lo sviluppo più generale intorno al punto p (vedi più avanti nella sezione) è attribuito a Brook Taylor (1685-1731).

8. Vedi Edwards e Penney (2002).

9. Per il momento, trattate le espressioni seguenti formalmente, o se la cosa vi rende più felici «dividete di nuovo per dx» mentalmente. La notazione che sto qui impiegando è coerente con quella delle forme differenziali, che saranno trattate in §§12.3-6.

10. Vi è, tuttavia, una sottigliezza tecnica circa l’applicazione di questa legge alla somma del numero infinito di termini di cui abbiamo bisogno per una serie di potenze. Questa sottigliezza può essere ignorata per valori di x rigorosamente all’interno del cerchio di convergenza; vedi §2.5. Vedi Priestly (2003).

11. Si ricordi da §5.1 che sin^{– 1}, cos^{– 1}, e tan^{– 1} sono le funzioni inverse di sin, cos e tan, rispettivamente. Quindi, sin(sin^{– 1}x ) = x, eccetera. Dobbiamo tuttavia tenere a mente che queste funzioni inverse sono «funzioni a molti valori» e solitamente si selezionano i valori per cui – π/2 ≤ sin^{– 1} x ≤ π/2, 0 ≤ cos^{– 1} x ≤ π e – π/2 ≤ tan^{– 1} x < π/2.

12. La richiesta significativa per il dominio è che sia compatto; vedi §12.6. Gli intervalli finiti della retta reale che includono le loro estremità sono compatti.

13. A quanto pare, anche Oliver Heaviside aveva concepito la «funzione delta» molti anni prima di Dirac.

[6.1] Dimostratelo (ignorando x = 0).

[6.2] Se avete la necessaria preparazione, cercate di dimostrare questo concetto.

[6.3] Dimostratelo, usando le regole date verso la fine della sezione.

[6.4] Considerate la “funzione unica” ^{e– 1/x2}. Dimostrate che è di classe C^∞, ma non è analitica all’origine.

[6.5] Usando la serie di potenze per e^x data in §5.3, dimostrate che de^x = e^xdx.

[6.6] Dimostratelo.

[6.7] Deducetelo.

[6.8] Calcolate dy/dx per y = (1 – x²)⁴, y = (1 + x)/(1 – x).

[6.9] Con a costante, calcolate d(log_ax), d(log_xa), d(x^x).

[6.10] Per il primo, vedete l’esercizio [6.5]; deducete il secondo da d(e^log x); il terzo e il quarto da de^ix, assumendo che le grandezze complesse funzionino come quelle reali; deducete il resto dagli esempi precedenti, usando d(sin (sin^{– 1}x)), eccetera, e notate che cos²x + sin²x =1

Calcolo infinitesimale con numeri complessi

sabato 8 gennaio 2022

LA STRADA CHE PORTA ALLA REALTÀ Roger Penrose

Prefazione

Prologo

Le radici della scienza

1.1 La ricerca delle forze che modellano il mondo

1.2 Verità matematica

1.3 Il mondo matematico di Platone è «reale»?

1.4 Tre mondi e tre profondi misteri

1.5 Il Buono, il Vero e il Bello

Note

Un antico teorema e una questione moderna

2.1 Il teorema di Pitagora

2.2 I postulati di Euclide

2.3 Dimostrazione del teorema di Pitagora per mezzo della similitudine di aree

2.4 Geometria iperbolica: quadro conforme

2.5 Altre rappresentazioni della geometria iperbolica

2.6 Aspetti storici della geometria iperbolica

2.7 Relazione con lo spazio fisico

Note

Tipi di numero nel mondo fisico

3.1 Una catastrofe pitagorica?

3.2 Il sistema dei numeri reali

3.3 Numeri reali nel mondo fisico

3.4 I numeri naturali hanno bisogno del mondo fisico?

3.5 I numeri discreti nel mondo fisico

Note

I magici numeri complessi

4.1 Il magico numero «i»

4.2 La risoluzione di equazioni con l’impiego dei numeri complessi

4.3 La convergenza di serie di potenze

4.4 Il piano complesso di Caspar Wessel

4.5 Come costruire l’insieme di Mandelbrot

Note

La geometria di logaritmi, potenze e radici

5.1 La geometria dell’algebra complessa

5.2 L’idea di logaritmo complesso

5.3 Molteplicità di valori, logaritmi naturali

5.4 Potenze complesse

5.5 Alcune relazioni con la moderna fisica delle particelle

Note

Il calcolo infinitesimale nel campo reale

6.1 Che cosa fa una funzione perbene?

6.2 Pendenze di funzioni

6.3 Derivate di ordine superiore – Funzioni di classe C∞

6.4 La nozione «euleriana» di funzione?

6.5 Le regole di derivazione

6.6 L’integrazione

Note

Calcolo infinitesimale con numeri complessi

Archivio blog

Informazioni personali

6.3 Derivate di ordine superiore – Funzioni di classe C^∞