La deflessione della luce in un campo gravitazionale

Page 1

La deflessione della luce in un campo gravitazionale La questione che la luce possa essere influenzata dalla gravitá circolava nella mente dello stesso Isaac Newton nel momento della formulazione della sua teoria universale. Henry Cavendish fu il primo a dare una stima quantitativa dell’eventuale deflessione di un raggio luminoso in presenza del campo gravitazionale di un astro, ma non pubblicó mai i suoi calcoli. Fu Joahnn von Soldner a pubblicare il calcolo dell’angolo di deviazione, agli inizi del XIX secolo. Egli consideró la luce secondo la teoria corpuscolare di Newton, calcolando l’orbita intorno al Sole di un corpo avente velocitá pari a quella della luce c ≈ 3×108 m/s e dunque energia cinetica K = 1/2 mc2 tanto elevata da sfuggire all’attrazione gravitazionale disegnando un’iperbole. Egli non ebbe bisogno di conoscere la massa della luce, poiché una delle accidentali implicazioni della teoria newtoniana risiede nell’equivalenza tra massa gravitazionale e massa inerziale, facendo sí che l’accelerazione di un corpo impressa dalla gravitá sia indipendente dalla sua massa. Soldner trovó, utilizzando i dati astronomici della sua epoca, il seguente risultato per l’angolo di deviazione (in secondi d’arco) ∆ϕ = 0.8400 che utilizzando i dati odierni corrisponde a ∆ϕ = 0.87500 . Fu poi Albert Einstein a ripetere il calcolo nel 1911, pubblicando il risultato sugli Annalen der Physik. Egli dimostró che la velocitá della luce in presenza di un campo gravitazionale doveva essere funzione della sua distanza dal centro di gravitá. Applicó quindi il principio di Huygens al fronte d’onda della radiazione luminosa e consideró l’effetto della dilatazione temporale gravitazionale ottenendo infine, nel caso del Sole, lo stesso risultato di Soldner. Il calcolo di Einstein si basava peró su supposizioni diametralmente opposte a quelle di Soldner: conscio che i fotoni di luce non hanno massa, consideró la possibilitá di una loro deviazione partendo unicamente dal principio di equivalenza. Se consideriamo un ascensore in caduta libera all’interno di un campo gravitazionale uniforme e statico, l’equivalenza tra massa inerziale e massa gravitazionale permette che tutti i corpi all’interno dell’ascensore cadano con la sua stessa accelerazione, dando a questi la sensazione di fluttuare nel vuoto: l’interno dell’ascensore risulta dunque un sistema di riferimento inerziale S in cui valgono le leggi della relativitá ristretta. Secondo queste leggi, un raggio di luce emesso da una sorgente posta in una parete dell’ascensore ad un’altezza h dal pavimento, si propagherá in linea retta dal momento che per questo sistema di riferimento si ha a = 0. Considerando peró un sistema di riferimento inerziale esterno S ’, questi misurerá l’accelerazione dell’ascensore: se la cabina é in caduta libera vicino alla superficie terrestre si avrá a’ = −g ˆ e la trasformazione non galileiana tra i sistemi di coordinate é la seguente (facendo in modo che all’istante t = 0 le origini dei due sistemi coincidano) x0 = x 1 y 0 = y − gt2 2 Ora, essendo x = ct e y = h in S, nel sistema di laboratorio S ’ avremo x0 = ct e y 0 = h − 1/2gt2 . Eliminando il tempo t otteniamo che la traiettoria della luce ha ora una forma parabolica data dall’equazione y(x) = h −

1

1 g x2 2 c2


la situazione é illustrata in figura 1

Per S ’ la luce ha subíto una deflessione di un angolo pari a circa α = arctan

gd GM d = arctan 2 2 2 c R c

se R é il raggio terrestre, M la massa della terra, G la costante di gravitazione universale, d la larghezza dell’ascensore. Partendo da questo esperimento concettuale Einstein arrivó a pensare che la luce possa essere deflessa anche da un campo gravitazionale.

L’effetto poteva essere misurabile ed infatti nell’articolo del 1911 Einstein fece un appello agli astronomi per una verifica sperimentale. La deviazione della luce 2


di quelle stelle che rispetto alla visuale della Terra sono molto vicine al Sole si tradurrebbe in un dislocamento della loro posizione rispetto alle altre stelle piú lontane, e ció si potrebbe misurare confrontando due lastre fotografiche dello stesso gruppo di stelle in presenza o meno del Sole. In figura 2 questo fenomeno é osservato da due prospettive diverse. Tuttavia l’elevata luminositá del Sole rendeva improponibile questa misurazione, fu per questo che giá Soldner poté concludere che l’effetto della deviazione potesse essere totalmente trascurabile ai fini delle osservazioni astronomiche. Einstein invece propose agli astronomi di osservare l’effetto durante un’eclissi solare, ma proprio mentre iniziavano a mobilitarsi gli osservatori astronomici, a causa dello scoppio della Grande Guerra nel 1914 l’esperimento fu messo da parte. Si noti che al momento della formulazione del principio di equivalenza per calcolare la deviazione della luce, Einstein non era ancora in possesso di una precisa teoria della gravitazione. Una tale teoria doveva tenersi in accordo con le predizioni della relativitá ristretta, da egli stesso formulata nel 1905. Ad esempio secondo la teoria newtoniana l’interazione gravitazionale tra due masse sarebbe dovuta essere istantanea, mentre la velocitá massima delle interazioni fisiche, secondo la relativitá ristretta, é quella della luce. Inoltre, vari tentativi da parte di alcuni fisici mostrarono che non era possibile costruire una teoria gravitazionale priva di falle concettuali se basata su di uno spazio piatto come quello della relativitá ristretta (lo spazio M di Minkowski). Restava inoltre irrisolta la questione dell’equivalenza tra massa gravitazionale e massa inerziale, ed il principio di equivalenza poteva essere applicato solo localmente, in quanto i campi gravitazionali variano con la distanza. Fu cosí che Einstein fu portato a introdurre nella relativitá generale il concetto di spazio curvo, al fine di ottenere una teoria soddisfacente per la gravitazione. Quando la relativitá generale fu completata nel 1916, Einstein ricalcoló la deviazione luminosa, ottenendo stavolta un risultato esattamente doppio rispetto a quello perseguito nel 1911. A differenza di quest’ultimo, che si basava esclusivamente sulla questione della curvatura temporale, nel 1916 egli aggiunse nei calcoli anche la curvatura dello spazio, ovvero la "metá mancante" del contributo, ottenendo ∆ϕ = 2 × 0.87500 = 1.7500 . Ci proponiamo di trattare il problema della deflessione introducendo i concetti basilari della relativitá generale, senza pretesa alcuna di rigorositá, ma solo per illustrarne i passaggi concettualmente importanti. Consideriamo due punti infinitesimamente vicini A e B e congiungiamoli con un vettore d~x = ~e1 dx1 + ~e2 dx2 + ~e3 dx3 ≡ ~ei dxi dove nell’ultimo passaggio abbiamo utilizzato la convenzione di Einstein: due indici alti e bassi ripetuti si intendono sommati (in questo caso la somma va da i = 1 a i = 3 e i é detto "indice libero"). Il vettore é stato espresso utilizzando i vettori base ~ei il che é una scelta ovviamente arbitraria. Lo stesso vettore puó essere espresso utilizzando per le sue componenti le basi j-esime ~ej tale che d~x = ~ej dxj . Sará quindi possibile determinare la distanza (o intervallo) tra i due punti A e B calcolando il prodotto scalare di d~x con se stesso ds2 = d~x · d~x = (~ei · ~ej )dxi dxj ≡ nij dxi dxj

(1)

dove nij é uno scalare che rappresenta le componenti del tensore metrico ~~n il quale dipende dalle relazioni (~ei · ~ej ) tra le basi vettoriali con cui tale spazio é 3


stato espresso. Il tensore metrico in questo senso "aritmetizza" lo spazio. La (1) non é altro che una generalizzazione multidimensionale del concetto di distanza, e ds2 preserva il proprio valore indipendentemente dalle coordinate scelte (in quanto scalare). Infatti per uno spazio euclideo e in presenza di componenti cartesiane (x1 ≡ x, x2 ≡ y, x3 ≡ z) espresse con i versori ~ei = ~ej = ˆı + ˆ + kˆ é facile vedere che la (1) si riduce alla distanza euclidea ds2 = dx2 + dy 2 + dz 2 Nello spazio M, che é lo spazio tetradimensionale della relativitá ristretta espresso con coordinate xu = (x0 , x1 , x2 , x3 ) ≡ (ct, x, y, z) il tensore metrico ha componenti nij = diag(+1, −1, −1, −1) e quindi M é pseudoeuclideo, ossia piatto. Lo spazio della relativitá generale, che indichiamo con U, é invece curvo. Qui la distanza sará data da ds2 = gij (x)dxi dxj (2) Si noti che ora le componenti del tensore metrico dipendono dalla posizione x e dunque U non puó essere piatto. Fare delle operazioni su di uno spazio noneuclideo comporta la revisione del concetto stesso di operazione vettoriale. Se ~eB ~ sará necessario in coordinate cartesiane si vogliono sommare due vettori A traslare uno dei due vettori parallelamente alla propria direzione fino a far toccare la sua coda con la punta dell’altro vettore. In questo processo rimangono invariati modulo e direzione dei due vettori. Ció é dovuto al fatto che i vettori ~eB ~ (che sono in questo caso i versori cartesiani) rimangono invariati base di A nel processo: hanno lo stesso valore in ogni luogo dello spazio. In uno spazio curvo le basi vettoriali sono invece funzione della localitá, dunque cambia anche la definizione di derivata di un vettore (poiché ora a variare non saranno piú solo le sue componenti, ma anche le basi vettoriali con cui sono espresse). In uno spazio curvo come in U i concetti di somma e derivata si uniscono, perché il trasporto parallelo di un vettore comporta una sua variazione rispetto alle coordinate. Si immaginino infatti la superficie di uno sferoide e una serie di piani tangenti in ogni punto della sua superficie. Si collochi un vettore su uno di questi piani facendo in modo che anche il vettore, in quel punto, sia tangente alla superficie. Si effettui ora un trasporto parallelo del vettore lungo la direzione, ad esempio, della sua punta, senza variarne il modulo: si noterá che questi non é piú tangente alla superficie dello sferoide. Un metodo per relazionare nuovamente il vettore traslato e i piani tangenti alla superficie é quello di calcolarne la proiezione sulla nuova n-esima porzione di piano tangente. Ci proponiamo di calcolare tale proiezione servendoci del calcolo differenziale assoluto. ~ = ~e1 A1 + ~e2 A2 + ~e3 A3 espresso con basi covarianti Consideriamo un vettore A e componenti controvarianti (denotate le une con indici bassi, le altre con indici alti) e permettiamo a tali basi di variare anch’esse rispetto alle coordinate xj ~ rispetto alla j-esima coordinata sará data dalla regola esime. La derivata di A della derivata di un prodotto ~ ∂(~e1 A1 + ~e2 A2 + ~e3 A3 ) ∂(~ei Ai ) ∂Ai ∂~ei ∂A = ≡ = ~ei + Ai j j j j ∂x ∂x ∂x ∂xj ∂x

(3)

Resta ora da definire l’ultimo termine dell’equazione. La derivata di una base vettoriale ~ei rispetto ad una coordinata xj é in generale un altro vettore definito da k componenti. Una notazione compatta che permette di riassumere queste 4


componenti, specificando rispetto a quale coordinata sono state differenziate e in che direzione, fa uso dei simboli di Christoffel ∂~ei = Γkij ~ek ∂xj

(4)

Si noti che é stata utilizzata la convenzione di Einstein per l’indice libero k. Il simbolo Γkij si traduce come segue: una variazione del vettore ~ei rispetto a una variazione della coordinata j-esima, ha una componente Γkij nella direzione ~ek . Ad esempio 1 Γθrθ = r indica che una variazione del vettore ~er rispetto a una variazione dell’angolo θ, ha una componente 1/r nella direzione di ~eθ . A priori il calcolo di questi simboli non é scontato. Un buon metodo consiste nell’utilizzare le componenti del tensore metrico dello specifico sistema di coordinate che si sta utilizzando. É necessario dunque ricavare una relazione tra i simboli di Christoffel e il tensore metrico. Dimostreremo che ció é possibile attraverso un calcolo piuttosto euristico. Si consideri una particolare base vettoriale controvariante ~e l tale che, per definizione ( 1 l=k l l ~ek · ~e ≡ δk = 0 l 6= k Dove δkl é la delta di Kronecker. Consideriamo l’equazione (4) e calcoliamo il prodotto scalare con ~e l ∂~ei Γkij ~ek · ~e l = ~e l · ∂xj ossia ∂~ei Γkij δkl = ~e l · ∂xj La funzione delta, essendo data dal prodotto scalare di due basi vettoriali, si comporta come le componenti di un tensore metrico. Assumiamo di avere delle componenti Ai di un vettore, moltiplichiamole per il tensore metrico gki e otteniamo Ai gki = Ak la metrica agisce sugli indici ripetuti e li abbassa o li alza a seconda dei casi. Quindi se nel nostro calcolo abbiamo Γkij δkl otteniamo Γkij δkl = Γlij dunque ∂~ei ∂xj Ora, a partire dalla definizione d~x = ~ei dxi = ~ej dxj é possibile dire che Γlij = ~e l ·

∂~ei ∂~ej = j ∂x ∂xi ed operare un artificio scrivendo ∂~ei 1 ∂~ei 1 ∂~ej = + ∂xj 2 ∂xj 2 ∂xi 5


pertanto 1 1 ∂~ei ∂~ej + ~e l · Γlij = ~e l · 2 ∂xj 2 ∂xi

(5)

A questo punto prendiamo le componenti controvarianti del tensore metrico g kl e la base vettoriale ~ek costruendola in modo che ~ej dxj = ~ek dxk e dunque ∂~ej ∂~ek = k ∂x ∂xj formiamo il prodotto scalare con ~ei e aggiungiamo e sottraiamo i termini 1 1 kl ∂~ek ∂~ej · ~ei − g kl k · ~ei g j 2 ∂x 2 ∂x all’equazione (5) in modo da lasciarla inalterata (tale espressione dá infatti zero). Si faccia la stessa cosa tra ~ek e ~ei , si formi il prodotto scalare con ~ej e si aggiungano e sottraggano i termini 1 kl ∂~ek 1 ∂~ei g · ~ej − g kl k · ~ej i 2 ∂x 2 ∂x Ne risulterá Γlij

1 kl ∂~ek 1 kl ∂~ej 1 kl ∂~ek 1 kl ∂~ei 1 l ∂~ei 1 l ∂~ej · ~ei − g · ~ei + ~e · i + g · ~ej − g · ~ej = ~e · j + g 2 ∂x 2 ∂xj 2 ∂xk 2 ∂x 2 ∂xi 2 ∂xk

Per convenienza, si noti che usando le componenti g kl del tensore metrico, é possibile pensare ~e l come ~ek g kl rendendo possibile il raccoglimento del termine 1/2g kl 1 kl ∂~ei ∂~ek ∂~ej ∂~ej ∂~ek ∂~ei l Γij = g ~ek · + · ~ei − · ~ei + ~ek · + · ~ej − · ~ej 2 ∂xj ∂xj ∂xk ∂xi ∂xi ∂xk raccogliamo i segni in modo da ottenere 3 somme di due termini ∂~ei ∂~ek ∂~ej ∂~ek ∂~ej ∂~ei 1 + · ~ e + ~ e · + · ~ e − · ~ e + · ~ e Γlij = g kl ~ek · i j i j k 2 ∂xj ∂xj ∂xi ∂xi ∂xk ∂xk Riconosciamo all’interno delle parentesi tonde le derivate dei prodotti (~ei · ~ek ) , (~ej · ~ek ) , (~ej · ~ei ) 1 ∂ (~ei · ~ek ) ∂ (~ej · ~ek ) ∂ (~ej · ~ei ) Γlij = g kl + − 2 ∂xj ∂xi ∂xk Tali prodotti definiscono le varie componenti della metrica dello spazio U ~ei · ~ek = gik ~ej · ~ek = gjk ~ei · ~ej = gij Siamo dunque giunti all’importante relazione tra i simboli di Christoffel e la metrica dello spazio 1 kl ∂gik ∂gjk ∂gij l Γij = g + − (6) 2 ∂xj ∂xi ∂xk 6


Ora che siamo legittimati all’uso di questi simboli (avendogli dato un significato geometrico con la metrica) possiamo completare la derivata del vettore nell’equazione (3) ~ ∂Ai ei ∂Ai ∂A i ∂~ = ~ e + A = ~ei + Ai Γkij ~ek i ∂xj ∂xj ∂xj ∂xj Dal momento che i e k sono due indici liberi appartenenti allo stesso prodotto, essi hanno lo stesso significato indipendentemente da dove sono collocati e sono quindi interscambiabili ~ ∂Ai ∂A = ~ei + Ak Γikj ~ei j ∂x ∂xj In questo caso ció é conveniente poiché ci permette di raccogliere il vettore ~ei ~ ∂A = ∂xj

∂Ai k i + A Γkj ~ei ∂xj

~ rispetto alla la quantitá tra parentesi é detta derivata covariante del vettore A xj esima coordinata. La indicheremo con D(Ai )j =

∂Ai + Ak Γikj ∂xj

(7)

La derivata covariante ci permette di calcolare la proiezione del vettore sull’ennesima porzione di piano tangente ad una qualsiasi superficie curva descritta dalla metrica contenuta nei simboli di Christoffel. La (7) descrive la derivata covariante di un vettore espresso nelle sue componenti controvarianti. Se ci proponessimo di ottenere un’espressione valida anche per i covettori non potremmo seguire lo stesso procedimento. Possiamo peró partire dal seguente presupposto: considerato uno scalare φ la sua derivata covariante sará ovviamente identica alla sua derivata naturale rispetto ad una coordinata xb D(φ)b =

∂φ ≡ ∂b φ ∂xb

dove per necessitá logistiche ∂/∂xb ≡ ∂b . É possibile esprimere il generico vet~ é nella sue versioni a componenti covarianti A ~ = ~e k Ai o controvarianti tore dA ~ = ~ek Ai e formando il prodotto scalare con se stesso siamo sicuri che il prodotto A Ai Ai é anch’esso uno scalare ~·A ~ = (~ek · ~e k )Ai Ai = δkk Ai Ai = Ai Ai A Abbiamo assunto che per una quantitá scalare valga la seguente identitá D(Ai Ai )j = ∂j (Ai Ai ) ≡ Ai (∂j Ai ) + Ai (∂j Ai )

(8)

dove abbiamo permesso a Ai e Aj di essere funzioni della coordinata xj esima. In virtú di ció richiediamo che anche la derivata covariante obbedisca alla regola della derivata di un prodotto, ovvero che sia D(Ai Ai )j ≡ Ai [D(Ai )j ] + Ai [D(Ai )j ] 7


che sostituita nella (8) ci conduce alla seguente equazione Ai [D(Ai )j ] + Ai [D(Ai )j ] = Ai (∂j Ai ) + Ai (∂j Ai ) Sará quindi possibile calcolare la derivata covariante per le componenti cova~ risolvendo questa equazione per il termine D(Ai )j . D’altra rianti del vettore A parte il termine noto é D(Ai )j che é dato dalla (7) e che dunque sostituiamo Ai [D(Ai )j ] + Ai (∂j Ai + Ak Γikj ) = Ai (∂j Ai ) + Ai (∂j Ai ) semplificando si giunge a Ai [D(Ai )j ] + Ai Ak Γikj = Ai (∂j Ai ) Notiamo che i e k sono due indici liberi ripetuti nello stesso prodotto, dunque li scambiamo per convenienza e otteniamo Ai [D(Ai )j ] + Ak Ai Γkij = Ai (∂j Ai ) quindi Ai [D(Ai )j ] = Ai [(∂j Ai ) − Ak Γkij ] che semplificando per Ai ci conduce alla derivata covariante per un covettore D(Ai )j =

∂Ai − Ak Γkij ∂xj

(9)

per la quale valgono le stesse considerazioni della (7) circa il suo utilizzo. Le implicazioni geometriche dello spazio curvo in relativitá generale sono esemplificabili con un semplice esempio. Si consideri un vettore posto sulla tangente alla superficie terrestre in corrispondenza dell’equatore, con la punta rivolta verso nord. A partire da questa posizione effettueremo un trasporto parallelo del vettore in direzioni diverse, con punto di arrivo comune. In uno spazio piatto qualsiasi tipo di trasporto parallelo del vettore in un altra localitá fa sí che ivi il vettore conservi la stessa direzione e lo stesso modulo rispetto al punto di partenza, inoltre un tale percorso puó compiersi in infiniti modi purché non si alteri l’orientazione del vettore. Partendo dall’equatore, se effettuiamo un trasporto parallelo del vettore nella direzione nord (seguendo un meridiano) fino a un punto diametralmente opposto del globo, noteremo che ivi il vettore ha ora direzione verso sud. Effettuando invece il trasporto fino allo stesso punto, seguendo stavolta un parallelo, otteniamo che il vettore é ancora orientato verso nord. Ne concludiamo che in uno spazio curvo due tipi diversi di trasporto parallelo danno risultati diversi e che in alcuni casi questo trasporto altera la direzione stessa del vettore. Avendo introdotto un metodo per calcolare la proiezione del vettore sui piani tangenti alla superficie lungo il suo spostamento, ne conveniamo che se in uno spazio piatto l’ordine con cui si esegue la derivata covariante é irrilevante tale che eseguendo l’operazione in un verso e poi nel verso opposto il risultato é lo stesso e dunque la loro differenza é pari a zero, allora in uno spazio curvo qualsiasi risultato non nullo sarebbe invece imputabile alla curvatura stessa dello spazio. A tale proposito eseguiremo la derivata covariante consecutivamente rispetto a due coordinate: xβ ed in seguito xγ , per poi ripartire da capo e calcolarla iniziando stavolta con la coordinata xγ per arrivare a xβ . 8


~ e calcoliamone la Prendiamo le componenti covarianti Cα di un vettore C derivata covariante rispetto ad una variazione della coordinata xβ D(Cα )β =

∂Cα − Cσ Γσαβ ∂xβ

ora, questo risultato si comporta anch’esso come un tensore (in questo caso di rango 2) dunque é considerabile come un tensore a se stante: chiamiamolo Cαβ e calcoliamone la derivata covariante per una variazione lungo la coordinata xγ D(Cαβ )γ =

∂Cαβ − Cτ β Γταγ − Cαη Γηβγ ∂xγ

sostituendovi l’espressione per Cαβ ≡ D(Cα )β ∂Γσαβ ∂Cσ ∂ 2 Cα − Cσ − Γσαβ γ γ β γ ∂x ∂x ∂x ∂x ∂Cτ ∂Cα η τ σ σ −Γαγ − Γτ β Cσ − Γβγ − Γαη Cσ ∂xβ ∂xη D(Cαβ )γ =

In senso stretto abbiamo calcolato anzitutto la variazione nelle componenti Cα muovendoci lungo la xβ coordinata, che ci ha dato la quantitá tensoriale Cαβ , poi abbiamo calcolato la variazione di questa quantitá lungo la coordinata xγ . Eseguiremo ora il percorso inverso, partendo sempre da Cα . La derivata covariante rispetto ad una variazione lungo la coordinata xγ é D(Cα )γ =

∂Cα − Cσ Γσαγ ∂xγ

chiamiamo questo risultato Cαγ e calcoliamone la derivata covariante, stavolta rispetto a xβ ∂Cαγ D(Cαγ )β = − Cτ γ Γταβ − Cαη Γηγβ ∂xβ ed inserendo il valore per Cαγ ≡ D(Cα )γ ∂Γσαγ ∂ 2 Cα ∂Cσ − Cσ − Γσαγ β β γ ∂x ∂x ∂xβ ∂x ∂Cτ ∂Cα η σ σ −Γταβ − Γ C − Γ − Γ C τγ σ αη σ γβ ∂xγ ∂xη D(Cαγ )β =

Come abbiamo detto, in uno spazio piatto l’ordine di differenziazione covariante non dovrebbe fare alcuna differenza, per cui D(Cαβ )γ − D(Cαγ )β = 0 in caso contrario staremmo parlando di spazio curvo. Sostituendo le espressioni trovate ∂Γσαβ ∂ 2 Cα ∂Cσ D(Cαβ )γ − D(Cαγ )β = − Cσ − Γσαβ γ ∂xγ ∂xβ ∂xγ ∂x ∂Cτ ∂Cα −Γταγ − Γστβ Cσ − Γηβγ − Γσαη Cσ ∂xβ ∂xη 9


∂Γσαγ ∂Cσ ∂ 2 Cα Cσ + Γσαγ β − β γ + ∂x ∂x ∂xβ ∂x ∂Cτ ∂Cα η τ σ σ +Γαβ − Γτ γ Cσ + Γγβ − Γαη Cσ ∂xγ ∂xη e ricordando che l’ordine di differenziazione per le derivate parziali non conta, che i simboli usati per gli indici liberi agli apici sono irrilevanti (ad esempio Γσαβ = Γταβ ) e che i simboli di Christoffel sono simmetrici nei loro pedici (ad esempio Γηβγ = Γηγβ ) giungiamo ai termini rimanenti ∂Γσαβ ∂Γσαγ C + Cσ + Γταγ Γστβ Cσ − Γταβ Γστγ Cσ σ ∂xγ ∂xβ ∂Γσαβ τ σ τ σ − + Γ Γ − Γ Γ αγ τ β αβ τ γ Cσ ∂xγ

D(Cαβ )γ − D(Cαγ )β = − =

∂Γσαγ ∂xβ

Ne conveniamo che i termini all’interno della parentesi determineranno la curvatura dello spazio: costoro costituiscono il tensore di curvatura di Riemann σ Rαβγ ≡

∂Γσαβ ∂Γσαγ − + Γταγ Γστβ − Γταβ Γστγ ∂xβ ∂xγ

(10)

quindi la condizione necessaria e sufficiente per uno spazio piatto é σ Rαβγ =0

Contraendo il tensore di Riemann ponendo ad esempio σ = β si trova il tensore di Ricci Rαγ σ 0 1 2 3 Rαγ ≡ Rασγ = Rα1γ + Rα1γ + Rα2γ + Rα3γ se invece contraiamo il tensore di Ricci utilizzando la metrica per alzare i due indici γ e α otteniamo lo scalare di Ricci R ≡ g αγ Rαγ = R00 + R11 + R22 + R33 In uno spazio curvo, come in un qualsiasi altro spazio, i corpi seguono delle traiettorie naturali che si discostano di poco dalla traiettoria ideale (che in genere é quella estremale). Detta Z

B

S=

ds A

la congiungente tra due punti della traiettoria ideale, i corpi seguiranno una traiettoria Sk che sip discosta cosí poco da quella ideale che δS = S − Sk ≈ 0. Sappiamo che ds = guv dxu dxv dunque Z

B

δ

Z

B

ds = δ A

p guv dxu dxv = 0

A

ep agli estremi vale la condizione δxA = δxB = 0. Sviluppiamo il differenziale δ guv dxu dxv Z

B

= A

δ(guv dxu dxv ) = 2 ds

Z

B

A

1 1 (δguv dxu dxv + guv dxv dδxu + guv dxu dδxv ) 2 ds 10


e dal momento che dxv dδxu = dxu dδxv Z B 1 1 = (δguv dxu dxv + 2guv dxu dδxv ) A 2 ds Z

B

= A

1 dxu v dxu δguv dx + guv dδxv 2 ds ds ∂guv σ δx ∂xσ

raccogliamo ds e poniamo che δguv ≡ B

Z

A

Z

B

= A

1 dxu dxv dxu dδxv δguv + guv 2 ds ds ds ds

ds

1 dxu dxv ∂guv σ dxu dδxv δx + g uv 2 ds ds ∂xσ ds ds

ds

Integriamo l’ultimo termine per parti Z

B

guv A

dxu dxu dδxv ds = guv ds ds ds = guσ

Z

B

A

dδxv ds − ds

Z

B

dxu B [δxσ ]A − ds

Z

A

d ds

B

A

guσ

d ds

dxu ds

Z dxu dδxv guv ds ds ds ds

δxσ ds

Ora, come abbiamo detto δxA = δxB = 0 dunque il primo termine si annulla e rimane Z B Z B d dxu dxu dδxv =− guσ δxσ ds guv ds ds ds ds A A inserendo questo risultato nell’espressione giungiamo alla condizione Z B 1 dxu dxv ∂guv σ d dxu σ δx − guσ δx ds = 0 2 ds ds ∂xσ ds ds A la quale implica che l’integrando sia uguale a zero. Semplificando per δxσ 1 dxu dxv ∂guv d dxu − g =0 uσ 2 ds ds ∂xσ ds ds Sviluppiamo il differenziale 1 dxu dxv ∂guv d2 xu dxu dguσ − g − =0 uσ 2 ds ds ∂xσ ds2 ds ds Notiamo che possiamo scrivere l’ultimo termine come segue dxu dguσ dxu dxv dguσ dxu dxv ∂guσ = = ds ds ds dxv ds ds ds ∂xv Per la proprietá di abbassamento degli indici da parte della metrica vale la relazione guσ dxu = gvσ dxv per cui possiamo porre ∂gvσ ∂guσ ∂guσ + =2 v ∂xv ∂xu ∂x 11


e quindi dxu dxv ∂guσ 1 dxu dxv ∂guσ 1 dxu dxv = 2 v = v ds ds ∂x 2 ds ds ∂x 2 ds ds

∂gvσ ∂guσ + ∂xv ∂xu

Sostituiamo quanto ottenuto nell’equazione principale 1 dxu dxv ∂guv d2 xu 1 dxu dxv ∂guσ ∂gvσ − g − + =0 uσ 2 ds ds ∂xσ ds2 2 ds ds ∂xv ∂xu riarrangiando i termini d2 xu 1 dxu dxv guσ 2 + ds 2 ds ds

∂gvσ ∂guv ∂guσ + − ∂xv ∂xu ∂xσ

=0

Il secondo termine ricorda l’espressione per i simboli di Christoffel eccetto per un termine moltiplicativo g pσ che esplicita le componenti controvarianti della metrica, dunque moltiplichiamo tutto per esso (ottenendo g pσ guσ = gup e dunque gup (xu ) = xp ) d2 xp 1 pσ ∂guσ ∂gvσ ∂guv dxu dxv + g + − =0 ds2 2 ∂xv ∂xu ∂xσ ds ds a questo punto possiamo sostituirvi la (6) e otteniamo v u d2 xp p dx dx + Γ =0 uv ds2 ds ds

(11)

che descrive le speciali traiettorie dei corpi nello spazio della relativitá generale: esse sono dette geodetiche, dunque la (11) é l’equazione delle geodetiche. Naturalmente anche un fascio di luce seguirá questo tipo di cammino. Il problema della deflessione della luce si risolve calcolando l’orbita di un fascio di fotoni di massa m = 0 che passa vicino alla superficie solare (con punto di massima vicinanza pari al raggio del Sole) risolvendo nella xp coordinata l’equazione (11). L’unica cosa che resta da determinare sono le componenti metriche dello spazio, le quali dipendono dalle specifiche distribuzioni di energia che lo caratterizzano. Ció puó essere fatto risolvendo le equazioni di campo di Einstein 1 8πG Ruv − guv R = 4 Tuv 2 c

(12)

dove Ruv e R sono il tensore e lo scalare di Ricci, Tuv é il tensore momentoenergia di Einstein. Come si usa dire comunemente circa il significato di questa equazione: la massa dice allo spazio come curvarsi, e lo spazio dice alla massa come muoversi. Ad ogni modo é piú corretto dire che qualsiasi distribuzione di energia contenuta nel tensore Tuv é in grado di curvare lo spazio, non solo la massa. Per una distribuzione a simmetria sferica di energia generata da un campo gravitazionale (che rappresenta il caso dell’orbita intorno al Sole) é possibile risolvere esattamente le (12) per ottenere la soluzione di Schwarzschild, che utilizza le coordinate sferiche xu = (x0 , x1 , x2 , x3 ) ≡ (ct, r, θ, ϕ) collocandone l’origine al centro del Sole e indicando con r la congiungente con il corpo orbitante.

12


Secondo questa soluzione il tensore metrico ha espressione   B(r) 0 0 0  0  −A(r) 0 0 ~  ~guv =  2  0  0 −r 0 2 2 0 0 0 −r sin θ con B(r) = 1 − A(r) =

(13)

2GM c2 r

2GM 1− 2 c r

−1

Dove M é nel nostro caso la massa del Sole. La metrica é al solito data da 2

u

v

ds = guv dx dx ≡

XX v

=

3 X

u

v

guv dx dx =

u

3 3 X X u=0

! u

guv dx dx

v

v=0

gu0 dxu dx0 + gu1 dxu dx1 + gu2 dxu dx2 + gu3 dxu dx3

u=0 3 X

=

gu0 dxu dx0 +

u=0 2

3 X

gu1 dxu dx1 +

u=0 0

0

3 X

gu2 dxu dx2 +

u=0 1

0

2

3 X

gu3 dxu dx3

u=0 0

3

ds = g00 dx dx + g10 dx dx + g20 dx dx + g30 dx dx0 + g01 dx0 dx1 +g11 dx1 dx1 + g21 dx2 dx1 + g31 dx3 dx1 + g02 dx0 dx2 + g12 dx1 dx2 + g22 dx2 dx2 +g32 dx3 dx2 + g03 dx0 dx3 + g13 dx1 dx3 + g23 dx2 dx3 + g33 dx3 dx3 come si vede dalla (13) le uniche componenti non nulle sono g00 , g11 , g22 , g33 perció la metrica di Schwarzschild sará ds2 =

1−

2GM c2 r

−1 2GM (dx0 )2 − 1 − 2 (dx1 )2 − r2 (dx2 )2 − r2 sin2 θ(dx3 )2 c r 13


2GM 1− 2 c r

1 dr2 − r2 dθ2 − r2 sin2 θdϕ2 2GM 1− 2 c r A questo punto é facile calcolare anche l’inversa della (13) che corrisponde alla versione controvariante g αβ del tensore metrico gαβ   1/B(r) 0 0 0  0  −1/A(r) 0 0 ~  (14) ~g uv =   0  0 −1/r2 0 2 2 0 0 0 −1/r cosec θ =

c2 dt2 −

Secondo la relativitá generale i fotoni non saranno attratti gravitazionalmente dalla massa solare nel senso classico del termine, bensí é la presenza della massa solare che curva lo spazio intorno alla stella a distorcere la traiettoria luminale facendole descrivere una geodetica curva. Il significato della gravitá risiede completamente nella deformazione geo-metrica dello spazio, ed é pertanto risolto nel tensore metrico (13). Disponendo di una metrica per lo spazio siamo in grado di calcolare i corrispondenti simboli di Christoffel e di conseguenza calcolare l’orbita dei fotoni utilizzando le (11). Calcolare tutti i simboli é un compito laborioso, che tuttavia puó essere semplificato notevolmente ricordando che questi sono simmetrici nei loro indici inferiori (quindi calcoleremo solamente Γkαβ al posto di calcolare anche Γkβα ). Distinguiamo i simboli da determinare a paritá dei loro indici alti Serie 0 : Γ000 + Γ011 + Γ022 + Γ033 + Γ010 + Γ021 + Γ032 + Γ031 Serie 1 : Γ100 + Γ111 + Γ122 + Γ133 + Γ110 + Γ121 + Γ132 + Γ131 Serie 2 : Γ200 + Γ211 + Γ222 + Γ233 + Γ210 + Γ221 + Γ232 + Γ231 Serie 3 : Γ300 + Γ311 + Γ322 + Γ333 + Γ310 + Γ321 + Γ332 + Γ331 Inoltre dalla (14) notiamo che sono non nulle solo le componenti g 00 , g 11 , g 22 , g 33 dunque ∂gτ v ∂gτ σ ∂gvσ 1 + − Γτvσ = g uτ 2 ∂xσ ∂xv ∂xu si esemplifica come

Γτvσ

 1 τ τ ∂gτ v ∂gτ σ ∂gvσ   + − 2g ∂xσ ∂xv ∂xτ =    0

u=τ u 6= τ

facendo diversamente avremmo dovuto calcolare ogni membro della somma sull’indice libero u, allungando i calcoli. Iniziamo con il calcolo della serie 0. ∂g00 ∂g00 ∂g00 1 1 ∂B(r) 1 ∂B(r) 1 ∂B(r) 1 1 + − = + − = (0) = 0 Γ000 = g 00 2 ∂x0 ∂x0 ∂x0 2B c ∂t c ∂t c ∂t 2B 1 ∂0 ∂0 1 ∂(−A(r)) 1 1 00 ∂g01 ∂g01 ∂g11 0 = + − = (0) = 0 Γ11 = g + − 1 1 0 2 ∂x ∂x ∂x 2B ∂r ∂r c ∂t 2B

14


1 = g 00 2

∂g02 ∂g22 ∂g02 + − ∂x2 ∂x2 ∂x0

1 = 2B

∂0 ∂0 1 ∂(−r2 ) + − ∂θ ∂θ c ∂t

1 (0) = 0 2B ∂g03 ∂g33 1 1 00 ∂g03 ∂0 ∂0 1 ∂(−r2 sin2 θ) 1 0 + − = Γ33 = g + − = (0) = 0 2 ∂x3 ∂x3 ∂x0 2B ∂ϕ ∂ϕ c ∂t 2B ∂g00 ∂g10 1 1 ∂g01 1 ∂0 ∂B(r) 1 ∂0 B0 + − = Γ010 = g 00 + − = 0 1 0 2 ∂x ∂x ∂x 2B c ∂t ∂r c ∂t 2B ∂g01 ∂g21 1 ∂g02 ∂0 ∂0 1 ∂0 1 1 + − = + − = (0) = 0 Γ021 = g 00 1 2 0 2 ∂x ∂x ∂x 2B ∂r ∂θ c ∂t 2B ∂g02 ∂g32 ∂0 1 00 ∂g03 ∂0 1 ∂0 1 0 Γ32 = g + − = + − = (0) = 0 2 ∂x2 ∂x3 ∂x0 ∂θ ∂ϕ c ∂t 2B ∂g01 ∂g31 1 1 00 ∂g03 ∂0 ∂0 1 ∂0 1 0 + − = Γ31 = g + − = (0) = 0 2 ∂x1 ∂x3 ∂x0 2B ∂r ∂ϕ c ∂t 2B

Γ022

=

Calcoliamo ora la serie 1 ∂g10 ∂g01 ∂g00 1 1 ∂0 1 ∂0 ∂B(r) 1 B0 + − = − + − = − (−B 0 ) = 0 0 1 ∂x ∂x ∂x 2A c ∂t c ∂t ∂r 2A 2A 1 ∂g11 ∂g11 ∂g11 A0 1 ∂(−A(r)) 1 0 Γ111 = g 11 + − (−A ) = = − = − 2 ∂x1 ∂x1 ∂x1 2A ∂r 2A 2A 2 ∂g12 ∂g12 ∂g22 ∂0 ∂0 ∂(−r ) 1 r 1 1 + − + − = − (2r) = − Γ122 = g 11 =− 2 2 1 2 ∂x ∂x ∂x 2A ∂θ ∂θ ∂r 2A A 2 2 1 ∂g13 ∂g13 ∂g33 ∂0 ∂0 ∂(−r sin θ) 1 r sin2 θ 1 2 Γ133 = g 11 + − + − = − (2r sin θ) = − = − 2 ∂x3 ∂x3 ∂x1 2A ∂ϕ ∂ϕ ∂r 2A A ∂g11 ∂g10 ∂g10 1 1 ∂(−A(r)) 1 1 + − =− = − (0) = 0 Γ110 = g 11 2 ∂x0 ∂x1 ∂x1 2A c ∂t 2A 1 ∂g12 ∂g11 ∂g21 1 ∂0 ∂(−A(r)) ∂0 1 Γ121 = g 11 + − = − + − = (0) = 0 2 ∂x1 ∂x2 ∂x1 2A ∂r ∂θ ∂r 2A 1 11 ∂g13 ∂g12 ∂g32 ∂0 ∂0 ∂0 1 1 1 + − =− + − = − (0) = 0 Γ32 = g 2 3 1 2 ∂x ∂x ∂x 2A ∂θ ∂ϕ ∂r 2A 1 ∂g13 ∂g11 ∂g31 1 ∂0 ∂(−A(r)) ∂0 1 Γ131 = g 11 + − =− + − = − (0) = 0 2 ∂x1 ∂x3 ∂x1 2A ∂r ∂ϕ ∂r 2A Γ100 =

1 11 g 2

Ora la serie 2 ∂g02 ∂g00 1 2 ∂0 ∂B(r) 1 1 22 ∂g02 2 + − =− 2 − = − 2 (0) = 0 Γ00 = g 2 ∂x0 ∂x0 ∂x2 2r c ∂t ∂θ 2r 1 ∂g21 ∂g21 ∂g11 1 ∂0 ∂0 ∂(−A(r)) 1 Γ211 = g 22 + − = − + − = − 2 (0) = 0 2 ∂x1 ∂x1 ∂x2 2r2 ∂r ∂r ∂θ 2r ∂g22 1 ∂(−r2 ) 1 1 ∂g22 ∂g22 = − = − 2 (0) = 0 Γ222 = g 22 + − 2 2 2 2 2 ∂x ∂x ∂x 2r ∂θ 2r

15


Γ233

1 = g 22 2

∂g23 ∂g33 ∂g23 + − 3 3 ∂x ∂x ∂x2

1 =− 2 2r

∂0 ∂0 ∂(−r2 sin2 θ) + − ∂ϕ ∂ϕ ∂θ

1 (2r2 sin θ cos θ) = − sin θ cos θ 2r2 ∂g20 ∂g10 1 1 ∂0 ∂0 ∂0 1 ∂g21 1 + − = − Γ210 = g 22 + − = 2 (0) = 0 2 ∂x0 ∂x1 ∂x2 2r2 c ∂t ∂r ∂θ 2r 1 ∂g21 ∂g21 1 ∂(−r2 ) ∂0 ∂0 1 ∂g22 1 Γ221 = g 22 + − = − + − = − 2 (−2r) = 1 2 2 2 2 ∂x ∂x ∂x 2r ∂r ∂θ ∂θ 2r r 2 ∂g22 ∂g32 1 ∂(−r ) 1 ∂g32 1 + − =− 2 Γ232 = g 22 = − 2 (0) = 0 2 3 2 2 ∂x ∂x ∂x 2r ∂ϕ 2r ∂g12 ∂g31 1 ∂0 1 ∂g32 ∂0 ∂0 1 + − =− 2 Γ231 = g 22 + − = − 2 (0) = 0 2 ∂x1 ∂x3 ∂x2 2r ∂r ∂ϕ ∂θ 2r =−

Terminiamo con la serie 3 1 ∂g03 ∂g03 Γ300 = g 33 + − 2 ∂x0 ∂x0 1 ∂g13 ∂g13 + − Γ311 = g 33 1 2 ∂x ∂x1 ∂g23 1 33 ∂g23 3 Γ22 = g + − 2 2 ∂x ∂x2 ∂g33 1 33 ∂g33 3 + − Γ33 = g 3 2 ∂x ∂x3 1 33 ∂g31 ∂g30 3 Γ10 = g + − 2 ∂x0 ∂x1 ∂g32 ∂g31 1 + − Γ321 = g 33 2 ∂x1 ∂x2 ∂g33 1 ∂g32 + − Γ332 = g 33 2 2 ∂x ∂x3 1 ∂g33 ∂g31 Γ331 = g 33 + − 1 2 ∂x ∂x3

∂g00 ∂x3

=−

1 cosec2 θ 2r2

2 ∂0 ∂B(r) − c ∂t ∂ϕ

=−

1 cosec2 θ(0) = 0 r2

∂0 ∂(−A(r)) 1 1 2 cosec θ 2 = − 2 cosec2 θ(0) = 0 − 2 2r ∂r ∂ϕ r 2 1 ∂g22 1 ∂0 ∂(−r ) − = − 2 cosec2 θ(0) = 0 = − 2 cosec2 θ 2 3 ∂x 2r ∂θ ∂ϕ r 2 2 ∂g33 ∂(−r sin θ) 1 1 = − 2 cosec2 θ = − 2 cosec2 θ(0) = 0 3 ∂x 2r ∂ϕ r ∂0 ∂g10 1 1 ∂0 ∂0 1 + − = − 2 cosec2 θ = − 2 cosec2 θ(0) = 0 ∂x3 2r c ∂t ∂r ∂ϕ r ∂g21 ∂0 ∂0 ∂0 1 1 2 cosec θ + − = − 2 cosec2 θ(0) = 0 = − ∂x3 2r2 ∂r ∂θ ∂ϕ r ∂(−r2 sin2 θ) ∂g32 1 (−2r2 sin θ cos θ) 2 cosec θ =− = − = cotgθ 3 2 ∂x 2r ∂θ 2r2 sin2 θ ∂g31 1 ∂(−r2 sin2 θ) (−2r sin2 θ) 1 2 = − cosec θ = − = 2 3 2 2 ∂x 2r ∂r r 2r sin θ ∂g11 ∂x3

=−

Riassumendo, abbiamo trovato i seguenti simboli Γ010 = Γ133 = −

B0 2B

r sin2 θ A

Γ100 = Γ221 =

B0 2A

1 r

Γ111 =

A0 2A

Γ332 = cotgθ

Γ122 = −

r A

Γ233 = − sin θ cos θ

1 r Non resta che inserire questi valori all’interno delle p-esime equazioni geodetiche (11). Anche quí ci troviamo in presenza di un indice libero p e degli indici ripetuti u e v sui quali va calcolata la doppia somma secondo la convenzione Γ331 =

16


di Einstein. Quindi classifichiamo nuovamente le equazioni a paritá di indice p distinguendo in u v d2 x0 0 dx dx Serie 0 : + Γ =0 uv ds2 ds ds u v d2 x1 1 dx dx + Γ =0 Serie 1 : uv ds2 ds ds u v d2 x2 2 dx dx + Γ Serie 2 : =0 uv ds2 ds ds u v d2 x3 3 dx dx + Γ Serie 3 : =0 uv ds2 ds ds Per la serie 0 ! 3 3 u v d2 x0 d2 x0 X X 0 dxu dxv 0 dx dx + Γuv + = Γuv ds2 ds ds ds2 ds ds u=0 v=0 =

3 0 u 1 u 2 u 3 u d2 x0 X 0 dx dx 0 dx dx 0 dx dx 0 dx dx + + Γ + Γ + Γ Γ u1 u2 u3 u0 ds2 ds ds ds ds ds ds ds ds u=0

per evitare calcoli inutilmente laboriosi, notiamo che é non nullo solo il simbolo Γ010 = Γ001 pertanto la doppia somma si riduce a d2 x0 d2 x0 dx1 dx0 dx0 dx1 dx1 dx0 + Γ010 + Γ001 = + 2Γ010 =0 2 2 ds ds ds ds ds ds ds ds Del pari per la serie 1 3 u 0 u 1 u 2 u 3 d2 x1 X 1 dx dx 1 dx dx 1 dx dx 1 dx dx + Γ + Γ + Γ + Γ u0 u1 u2 u3 ds2 ds ds ds ds ds ds ds ds u=0 Anche qui sono non nulli solo Γ100 ,Γ111 ,Γ122 ,Γ133 quindi d2 x1 dx0 dx0 dx1 dx1 dx2 dx2 dx3 dx3 + Γ100 + Γ111 + Γ122 + Γ133 2 ds ds ds ds ds ds ds ds ds 2 2 2 2 d2 x1 dx0 dx1 dx2 dx3 1 1 1 1 = + Γ00 + Γ11 + Γ22 + Γ33 =0 ds2 ds ds ds ds E quindi la serie 2 3 u 0 u 1 u 2 u 3 d2 x2 X 2 dx dx 2 dx dx 2 dx dx 2 dx dx + Γ + Γ + Γ + Γ u0 u1 u2 u3 ds2 ds ds ds ds ds ds ds ds u=0 per la quale abbiamo i due simboli Γ221 = Γ212 e Γ233 dunque 2 1 1 2 3 3 2 1 d2 x2 d2 x2 2 dx dx 2 dx dx 2 dx dx 2 dx dx +Γ +Γ +Γ = +2Γ +Γ233 21 12 33 21 ds2 ds ds ds ds ds ds ds2 ds ds

Ed infine la serie 3 3 u 0 u 1 u 2 u 3 d2 x3 X 3 dx dx 3 dx dx 3 dx dx 3 dx dx + Γu0 + Γu1 + Γu2 + Γu3 ds2 ds ds ds ds ds ds ds ds u=0 17

dx3 ds

2 =0


per la quale abbiamo trovato Γ332 = Γ323 e Γ331 = Γ313 dx3 dx2 dx2 dx3 dx3 dx1 dx1 dx3 d2 x3 + Γ332 + Γ323 + Γ331 + Γ313 2 ds ds ds ds ds ds ds ds ds =

3 2 3 1 d2 x3 3 dx dx 3 dx dx + 2Γ + 2Γ =0 32 31 ds2 ds ds ds ds

Sostituendo in queste espressioni le coordinate (x0 , x1 , x2 , x3 ) ≡ (ct, r, θ, ϕ) e i valori dei simboli di Christoffel giungiamo alla famiglia di equazioni B 0 dr dt d2 t + =0 ds2 B ds ds

d2 r c2 B 0 + ds2 2A

dt ds

2

dθ ds

2

d2 θ 2 dθ dr + − sin θ cos θ ds2 r ds ds

+

A0 2A

dr ds

2 −

r A

(15)

− dϕ ds

r sin2 θ A

dϕ ds

2 =0

(16)

2 =0

d2 ϕ dϕ dθ 2 dϕ dr + 2cotgθ + =0 ds2 ds ds r ds ds

(17)

(18)

Se ora facciamo in modo che il moto si compia esclusivamente sul piano x,y della figura 3 dovremo porre θ = π/2 e dunque tutte le derivate di θ si annullano. Il fine é quello di seguire l’orbita del fotone di luce attraverso il raggio vettore r per calcolarne la deflessione in funzione dell’angolo ϕ secondo la figura 4

18


Sotto questa condizione la (18) diviene d2 ϕ 2 dϕ dr + =0 ds2 r ds ds e moltiplicandola per r2 notiamo che é riscrivibile come d2 ϕ 2 dϕ dr d dϕ 2 r + 2r = r =0 ds2 ds ds ds ds Allo stesso modo moltiplicando la (15) per B d2 t dt 0 dr d dt B+ B = B =0 ds2 ds ds ds ds dal momento che

dB dB dr dr = = B0 ds dr ds ds Le ultime due equazioni implicano dunque che r2

dϕ = costante = C ds

(19)

dt = costante = W (20) ds La (19) ricorda la classica legge di conservazione del momento angolare L nei campi di forza centrali, dunque dobbiamo imporre che nel limite non relativistico (vale a dire ds ≈ cdt) si abbia B

r2

L dϕ ≈ ds m

e dunque troviamo il valore per C 1 2 dϕ L r = =C c dt mc tale che

L dϕ = ds mc Se ora identifichiamo la (20) con la legge di conservazione dell’energia dobbiamo imporre che per ds ≈ cdt e B(r) ≈ 1 (limite non relativistico e campo gravitazionale debole) si riconduca all’energia a riposo del corpo orbitante E = mc2 ossia dt 1 dt 1 B ≈ = =W ds c dt c e dunque 1 E = ZW = Z ≈ mc2 c ottenendo per la costante Z Z = mc3 r2

pertanto B

dt E E =W = = ds Z mc3 19


Consideriamo ora la (16) nel piano x,y d2 r c2 B 0 + ds2 2A

dt ds

2

A0 + 2A

dr ds

2

r − A

dϕ ds

2 =0

Il suo integrale é dato dalla metrica di Schwarzschild (con θ = π/2) ds2 = Bc2 dt2 − Adr2 − r2 dϕ2 divisa per ds2 1 = Bc

2

dt ds

2

−A

dr ds

dr ds

2 +

L2 m2 r2 c2

−r

2

dϕ ds

2

dϕ dt e ottenendo ds ds

In questa equazione inseriamo i valori per A

2

1 E2 +1=0 B m2 c4

Ora sostituiamo le espressioni per A(r) e B(r) 2 dr 1 L2 E2 ds +1=0 + 2 2 2− 2GM 2GM m2 c4 m r c 1− 2 1− 2 c r c r

pertanto

dr ds

2 +

L2 m2 r2 c2

1−

2GM c2 r

E2 2GM + 1 − =0 m2 c4 c2 r

Facciamo in modo di eliminare il parametro ds tale da ottenere una traiettoria che sia funzione esclusivamente delle coordinate (r, ϕ). A tal fine ricordiamo che essendo r2 dϕ/ds = L/mc avremo ds =

r2 mc dϕ L

e pertanto l’equazione diventa

L dr mcr2 dϕ

2 +

L2 2 m r 2 c2

1−

2GM c2 r

E2 2GM + 1 − =0 m2 c4 c2 r

Effettuando le dovute semplificazioni giungiamo a 2 dr 2GM r4 E 2 2GM m2 c2 r4 2 +r 1− 2 − 2 2 + 1− 2 =0 dϕ c r c L c r L2 che é l’equazione dell’orbita di un grave in relativitá generale. Per un fotone di massa m = 0 questa si riduce a 2 dr 2GM r4 E 2 2 +r 1− 2 − 2 2 =0 dϕ c r c L 20


Ora, facendo riferimento alla figura 4, notiamo che all’inizio dell’interazione Sole-fotone, quest’ultimo ha un momento angolare L = pb dove b é la distanza verticale tra il fotone e il centro del Sole (detto parametro di impatto) mentre p é la sua quantitá di moto. D’altra parte l’energia di un fotone é nota essere E = pc A questo punto é facile vedere che E c = L b e sostituendolo nell’equazione

dr dϕ

2 +r

2

2GM 1− 2 c r

r4 =0 b2

Effettuiamo ora un’importante sostituzione: ponendo r = 1/u i differenziali si 1 scrivono come dr = − 2 du e pertanto u 2 1 du 1 2GM u 1 − 2 + 2 1− − 4 2 =0 2 u dϕ u c u b moltiplicando per u4

du dϕ

2

2

+u

2GM u 1− c2

1 =0 b2

Deriviamo ora questa espressione rispetto alla coordinata ϕ d dϕ

du dϕ

2

d 2GM u3 d 1 d 2 u − − =0 dϕ dϕ c2 dϕ b2

+

Il parametro di impatto é una costante, dunque rimane solo 2 du d u du GM du 2 2 + 2u −6 2 u =0 dϕ dϕ2 dϕ c dϕ du giungiamo all’equazione differenziale da cui dϕ ricaveremo l’angolo di deflessione semplificando il termine 2

d2 u 3GM 2 +u= u dϕ2 c2

(21)

L’equazione omogenea associata é d2 uo + uo = 0 dϕ2 che ponendo come ipotetica soluzione uo = epϕ e semplificando per epϕ 6= 0 una volta sostituita, ci conduce a p2 + 1 = 0 21


permettendoci di ottenere due soluzioni che sovrapponiamo uo = c1 eiϕ +c2 e−iϕ . Con la notazione di Eulero abbiamo eiϕ = cos ϕ + i sin ϕ e−iϕ = cos ϕ − i sin ϕ assorbiamo allora le costanti in A = c1 + c2 e B = i(c1 − c2 ) per ottenere uo = A cos ϕ + B sin ϕ Osservando la figura 4, possiamo dedurre alcune condizioni: la prima é che per ϕ = 0 il raggio vettore tende ad infinito e quindi il suo inverso tende a zero; la seconda é che per ϕ = π/2 il raggio corrisponda al parametro di impatto b. Ponendo queste condizioni troviamo A = 0 e B = 1/b dunque otteniamo come soluzione dell’equazione omogenea uo =

1 sin ϕ b

Possiamo ora porre (data la piccolezza di u2 ) come prima approssimazione u ≈ uo e sostituirlo al secondo membro della (21) d2 u 3GM + u = 2 2 sin2 ϕ = a sin2 ϕ 2 dϕ c b

(22)

dove abbiamo posto 3GM c 2 b2 Una soluzione della (22) sará data dalla sovrapposizione della soluzione omogenea uh (che abbiamo giá calcolato) con una soluzione particolare up a≡

u(ϕ) = uh + up = A cos ϕ + B sin ϕ + up Notiamo che utilizzando le formule trigonometriche sin2 ϕ =

1 (1 − cos 2ϕ) 2

é possibile trasformare la (21) d2 u a a + u = − cos 2ϕ dϕ2 2 2 Come di consueto, una soluzione é da cercarsi nella forma up = Z cos 2ϕ + N sin 2ϕ + S che sostituita nella (21) porta a −4Z cos 2ϕ − 4N sin 2ϕ + Z cos 2ϕ + N sin 2ϕ + S = −3Z cos 2ϕ − 3N sin 2ϕ + S =

22

a a − cos 2ϕ 2 2

a a − cos 2ϕ 2 2


e dunque comparando i termini deduciamo che devono essere a Z= 6 N =0 a S= 2 Pertanto a a up = cos 2ϕ + 6 2 e la soluzione completa é data da a a u(ϕ) = cos 2ϕ + + A cos ϕ + B sin ϕ 6 2 Risolviamo nuovamente il problema di Cauchy ponendo le condizioni   lim u(ϕ) = 0   ϕ→0   1  u(π/2) = b trovando

a 2 =− a 6 2 3 a a 1 1 1 B= − + = − a 6 2 b b 3 In definitiva la funzione che descrive la traiettoria del fascio di luce intorno al sole é data da 1 a a a 2 u(ϕ) = cos 2ϕ + + − sin ϕ − a cos ϕ (23) 6 2 b 3 3 A=−

a

+

23


Se non vi fosse deflessione, il fascio di luce proseguirebbe indisturbato allontanandosi infinitamente dal Sole, facendo descrivere al raggio vettore un angolo pari a ϕ=π prima di lasciare l’orbita solare.

Matematicamente avremmo dovuto avere 4 lim u(ϕ) = 0 mentre é chiaro dalla (23) che u(π) = a. Dunque, prima di ϕ→π 3 allontanarsi del tutto (e quindi prima che u(ϕ) tenda a zero) dobbiamo supporre che l’orbita luminale descriverá con il raggio vettore un ulteriore angolo α. Poniamo dunque la seguente condizione lim

u(ϕ) = 0

ϕ→(π+α)

che inserita nella (23) ci porta all’utilizzo delle somme di archi

u(π + α) =

a a cos(2π + 2α) + + 6 2

1 a − b 3

sin(π + α) −

2a cos(π + α) = 0 3

eseguendo i calcoli giungiamo a a 1 a 2a a cos 2α + − sin α + sin α + cos α = 0 6 2 b 3 3 Supponiamo ragionevolmente che α sia molto piccolo, pertanto arrestiamo al prim’ordine lo sviluppo dei termini goniometrici ottenendo cos 2α ≈ 1 sin α ≈ α cos α ≈ 1 L’equazione si riduce a a a 1 a 2a + − α+ α+ =0 6 2 b 3 3 Moltiplichiamo tutto per b ed introduciamo la costante K = ab =

3GM 3GM b= 2 2 2 c b c b

K K K 2 + −α+ α+ K =0 6 2 3 3 Non ci resta che risolvere l’equazione rispetto a α per ottenere 4 K 3 α= K 1− 3 Dal momento che K é molto piccolo, é possibile sviluppare il denominatore utilizzando l’approssimazione (1 − x)n ≈ 1 − nx e pertanto −1 K K 1− ≈1+ 3 3 24


ottenendo α=

4 K 4 4 K 1+ = K + K2 3 3 3 9

trascurando K 2 che é piccolissimo, giungiamo finalmente a α=

4 4 3GM 4GM K= = 2 2 3 3 c b c b

L’effetto della deflessione é piuttosto esile, tale che risulta totalmente trascurabile per la luce stellare che passa anche relativamente vicina alla superficie solare. In altri contesti la deflessione é invece cosí evidente da fornire agli astronomi spettacolari "lenti" gravitazionali: il campo gravitazionale di un vasto agglomerato di masse focalizza i raggi luminosi dei corpi che rispetto alla Terra stanno dietro al gruppo massivo e che senza questo effetto non sarebbero altrimenti visibili. Nel caso del Sole, é ragionevole ritenere che la deflessione sia apprezzabile solo per quei raggi che ne sfiorano la superficie: porremo dunque b = R come parametro di impatto, dove R = 6.95508 · 108 m é il raggio del Sole. La massa del Sole é M = 1.989 · 1030 kg dunque α=

4GM = 8.492 · 10−6 rad c2 R

Convertiamo il risultato in gradi moltiplicando per 180/π e moltiplichiamo per 3600 al fine di ottenere l’espressione in secondi d’arco. Otteniamo α = 1.751600 Come predetto, questo risultato é esattamente il doppio di quello ottenuto utilizzando l’approccio newtoniano di Soldner o il principio di equivalenza del 1911. Una verifica sperimentale arrivó con la spedizione di Arthur Eddington nel 1919 in occasione di un’eclissi di Sole. La sua equipe misuró, entro l’errore sperimentale, una deflessione di 1.98 ± 0.1800 non senza polemiche: Eddington ebbe cura di scartare le misure effettuate con le lenti astrografiche, le quali attestavano una deviazione pari a 0.9300 assai vicina a quella newtoniana. Una verifica piú precisa arrivó nel 1973 da parte dell’universitá del Texas con il valore di 1.66 ± 0.1800 confermando ulteriormente la teoria della relativitá generale.

Matteo Parriciatu

25


Turn static files into dynamic content formats.

Create a flipbook
Issuu converts static files into: digital portfolios, online yearbooks, online catalogs, digital photo albums and more. Sign up and create your flipbook.