mercoledì 19 dicembre 2018

Tempo Proprio (e paradosso dei gemelli)

Nel post "La Dilatazione relativa del Tempo" abbiamo mostrato la relazione che lega l'intervallo di tempo ∆t' misurato da un osservatore in moto (con velocità v costante) e lo stesso intervallo ∆t misurato dall'osservatore in quiete cioè solidale con il suo orologio:
∆t=∆t'(1-v2/c2)1/2.
Questa relazione è valida per tutti i sistemi di riferimento inerziali.
Nota: ciò è vero nell'ipotesi della costanza della velocità della luce e dell'invarianza delle leggi della fisica nei sistemi inerziali.

Supponiamo quindi di avere un osservatore in moto che si sposta lungo l'asse X con velocità v che misura il tempo ∆t' di un orologio in quiete solidale con il suo osservatore (che invece misura un tempo ∆t).

Ora ∆t si definisce tempo proprio poiché è quello che viene misurato dall'osservatore in quiete rispetto al fenomeno osservato: nel nostro caso il fenomeno osservato è proprio il tempo t dell'orologio in quiete (posto in un punto x del suo riferimento).

È noto che in fisica classica due eventi qualsiasi che accadono nello spazio e nel tempo (x1, t1) e (x2, t2) definiscono un intervallo spaziale ∆x=x2-x1 e uno temporale ∆t=t2-t1: questi intervalli di spazio e di tempo sono ritenuti invarianti per qualsiasi osservatore, in quiete o in moto.
Nota: nel nostro caso gli eventi segnano il passaggio dell'osservatore in moto da un punto di coordinate (x1, t1) ad un altro punto (x2, t2).

In fisica relativistica si definisce invece un altro tipo di intervallo ∆s che è invariante per tutti gli osservatori inerziali*, ed è una sorta di unione degli intervalli di spazio e di tempo dei due eventi:
∆s2=c2∆t'2-∆x'2
dove ∆x' e ∆t' non sono più assoluti ma dipendono dal moto relativo degli osservatori (secondo le trasformazioni di Lorentz).
Nota: le coordinate (x', t') con l'apice sono quelle dell'osservatore in moto, mentre per quello in quiete col suo orologio risulta ∆x=0 (vedi oltre).

Il fatto interessante è che nel nostro caso l'intervallo ∆s, detto separazione spazio-temporale tra due eventi, si può esprimere nel sistema in quiete (quello dell'osservatore con l'orologio) semplicemente ponendo ∆x=0 (poiché l'orologio si trova in quiete in questo sistema di riferimento):
∆s2=c2∆t2
dove ∆t rappresenta il tempo proprio dell'osservatore in quiete.
Perciò eguagliando le due ultime relazioni risulta:
c2∆t2=c2∆t'2-∆x'2   =>   ∆t2=∆t'2-∆x'2/c2=∆t'2(1-∆x'2/∆t'2c2).

Se quindi ∆x' rappresenta lo spostamento dell'orologio lungo X' e ∆t' il tempo impiegato a spostarsi, avremo che v=∆x'/∆t' indica la velocità relativa tra i due osservatori; perciò si ottiene:
∆t2=∆t'2(1-v2/c2).
Questa è la stessa equazione già ricavata nel post sopra citato da cui risulta ∆t'>∆t: cioè il tempo t' misurato dal sistema in moto appare dilatato.
Nota: si ha ∆t'=∆t solo quando v=0 cioè se entrambi gli osservatori sono in quiete uno rispetto all'altro.

Si noti che la relazione ottenuta vale solo per moti inerziali rappresentati da rette nello spazio-tempo (di pendenza v); tuttavia se riduciamo l'intervallo ∆s ad un infinitesimo ds allora si ottiene (in modo del tutto equivalente):
dt=dt'(1-v2/c2)1/2
dove dt e dt' sono i relativi intervalli infinitesimi.

Questo risultato non è banale poiché una traiettoria curva di un moto qualsiasi, quindi in generale non inerziale, possiamo suddividerla in infiniti tempi dt' e spostamenti dx' e perciò in infiniti intervalli ds.

Da ciò segue che l'integrale su tutti i tempi infinitesimi dt restituisce il tempo proprio complessivo dell'osservatore solidale con l'orologio:
t=∫dt=∫dt'(1-v(t')2/c2)1/2
da cui si ottiene di nuovo ∆t2=∆t'2(1-v2/c2) se v(t')=costante.
Nota: in pratica è come se suddividessimo la curva del moto in infiniti riferimenti inerziali con velocità istantanea v(t') e intervallo ds.

Dall'integrale sopra si deduce di nuovo che t'>t (essendo (1-v(t')2/c2)<1), cioè il tempo t' misurato da un osservatore in moto qualsiasi è sempre maggiore di quello t di un osservatore in quiete**.

L'asimmetria tra i due sistemi risulta evidente solo quando l'osservatore in moto ritorna nel punto di partenza e confronta il suo orologio con quello rimasto in quiete, verificando che t'>t (vedi il paradosso dei gemelli).
Nota: fatto verificato sperimentalmente ponendo un orologio in moto su un aereo e confrontandolo al rientro con la sua copia rimasta a terra.

Ovviamente se il moto fosse inerziale la situazione sarebbe del tutto simmetrica: le stesse considerazioni si potrebbero applicare all'osservatore in moto che può ritenersi in quiete a tutti gli effetti, supponendo invece in moto l'altro osservatore (per il Principio di Relatività).
Nota: si noti però che non è possibile il confronto diretto tra due orologi, sincronizzati nello stesso punto, e poi divisi dal moto relativo inerziale.

Se però volessimo studiare il fenomeno dal punto di vista dell'osservatore in moto non inerziale, avremmo bisogno della teoria della Relatività Generale; si otterranno coerentemente gli stessi risultati sulla dilatazione temporale prima derivati con la sola applicazione della relatività ristretta (come ben mostrato in questo articolo (pdf) di G.C. D'Amico)***.

(*) Inserendo nel ∆s2 i valori di x' e t' delle trasformazioni di Lorentz si può dimostrare che questo intervallo è un invariante relativistico.
(**) Si può mostrare che l'accelerazione non è fondamentale nella dilatazione del tempo considerando tre osservatori inerziali posti sullo stesso asse: un osservatore in quiete, un secondo in moto inerziale che si allontana e un terzo che si avvicina incrociando quello in allontanamento.
Quando il terzo osservatore incrocia il secondo, sincronizza il suo orologio in volo (senza variare la sua velocità): ebbene anche in questo caso vale la relazione t'>t senza che ci siano accelerazioni degli osservatori in moto.
(L'asimmetria è dovuta al fatto che il tempo viene per così dire "spostato" da un riferimento inerziale all'altro a differenza di quello rimasto in quiete - vedi anche Wikipedia inglese).
(***) In questo caso la situazione non è più simmetrica, poiché l'osservatore è in moto non inerziale e può considerarsi in quiete (locale) solo a patto di introdurre un campo gravitazionale fittizio!
(Vedi il post "Il Principio di Equivalenza: ma=mg")

lunedì 1 ottobre 2018

Il Principio di minima Azione!

Introduciamo questo post dicendo subito che (vedi Wikipedia):
"In fisica il principio di minima azione è un principio variazionale che stabilisce che nei fenomeni della natura l'azione viene sempre minimizzata. A partire da questo principio si determina l'equazione del moto di un sistema dinamico".

Come mostreremo il principio variazionale di minima azione si definisce grazie al calcolo delle variazioni che è "un campo dell'analisi matematica che si occupa della ricerca dei punti estremali (massimi e minimi) dei cosiddetti funzionali, ovvero funzioni il cui dominio è a sua volta un insieme di funzioni" (vedi Wikipedia).

Consideriamo ad esempio il moto di una particella con legge oraria q(t) e velocità q'(t)=dq(t)/dt); come vedremo possiamo definire una ipotetica funzione L(q,q') detta lagrangiana* del sistema, che è appunto funzione della coordinata q(t) e della velocità q'(t).
Notaconsideriamo per semplicità il caso con una solo coordinata dove q indica una coordinata generale, non necessariamente cartesiana.

Ora per definire l'equazione del moto, introduciamo un'altra funzione S(q(t)) chiamata Azione in cui compare la stessa L(q,q') (in realtà S è un funzionale essendo una funzione di funzione), ed è così definita:
S(q(t))=∫t1t2L(q,q')dt.

Come si vede S(q(t)) dipende dal percorso q(t) compiuto dalla particella (una volta fissati il punto iniziale q(t1) e finale q(t2)); in effetti esistono infiniti percorsi tra q(t1) e q(t2) su cui calcolare S(q(t)) che perciò può variare con continuità, in funzione del percorso.
Nota: questa osservazione ci permette di trattare S(q(t)) come se fosse una funzione (differenziabile) anche se è una funzione di funzione (funzionale).

Facciamo quindi l'ipotesi fondamentale, che la natura sembra sempre rispettare, secondo cui l'equazione del moto della particella si può ricavare ponendo la seguente condizione su S(q):
δS(q)=0.

Tale condizione è del tutto analoga a porre nullo il differenziale dF(x) di una funzione F(x) (a un solo valore) per trovare i punti estremali (massimo, minimo o sella): si cerca cioè quale sia, tra tutti quelli possibili, il percorso q che rende minimo l'integrale S(q) fissati i punti iniziale e finale.
Nota: si parla di Principio di minima azione poiché, nel caso del moto meccanico, la condizione δS=0 individua un minimo per l'azione S.

Questa condizione si traduce quindi nella seguente equazione:
δS(q)=δt1t2L(q,q')dt=t1t2δL(q,q')dt=0
dove
δL(q,q')=(∂L/∂q)δq+(∂L/∂q')δq'
è l'analogo del differenziale di una funzione F(x,y) a due variabili (si ricordi infatti che dF(x,y)=(∂F/∂x)dx+(∂F/∂y)dy); inoltre si è posto δq'=dδq/dt.

Prima di sviluppare l'integrale è utile fare la derivata, rispetto al tempo, del termine (∂L/∂q')δq:
d(∂L/∂q')δq/dt=δqd(∂L/∂q')/dt+(∂L/∂q')δq'
da cui si ricava facilmente il termine (∂L/∂q')δq' che useremo di seguito:
(∂L/∂q')δq'=d(∂L/∂q')δq/dt-δqd(∂L/∂q')/dt.

Possiamo quindi inserire nell'integrale di δS(q) il valore di δL(q,q') prima definito (sostituendo poi il termine (∂L/∂q')δq' appena ricavato); si ottiene:
δS(q)=∫t1t2δL(q,q')dt=t1t2[(∂L/∂q)δq+(∂L/∂q')δq']dt=
=∫t1t2(∂L/∂q)δqdt+t1t2[d(∂L/∂q')δq/dt]dt-t1t2[δqd(∂L/∂q')/dt]dt.

Si osservi che il secondo termine a destra dell'equazione è nullo risultando:
t1t2[d(∂L/∂q')δq/dt]dt=[(∂L/∂q')δq]t1t2=0
avendo posto come condizione al contorno δq(t1)=δq(t2)=0 (poiché i punti iniziale e finale del percorso non variano).

Perciò se vogliamo che il δS sia nullo dovremo porre (raccogliendo δqdt dal primo e terzo termine dell'equazione di δS(q)):
δS(q)=t1t2[(∂L/∂q)-d(∂L/∂q')/dt]δqdt=0
ciò significa che il termine sotto integrale deve essere nullo (essendo δq≠0):
∂L/∂q-d(∂L/∂q')/dt=0.
Questa è proprio l'equazione, detta di Eulero-Lagrange, che L(q,q') deve soddisfare per il Principio di minima azione** e che rappresenta l'equazione del moto del sistema (l'analogo per la meccanica di F=mq'').

Ma a questo punto resta una domanda fondamentale, come è fatta la lagrangiana L(q,q') di un sistema dinamico qualsiasi?

Ebbene si ipotizza che ogni sistema fisico abbia la propria lagrangiana***. Ad esempio nel caso di sistemi meccanici si pone (e se ne può verificare per via sperimentale la validità):
L(q,q')=T(q')-V(q)
dove T(q') è l'energia cinetica del sistema (che dipende dalla velocità q') e V(q) è l'energia potenziale (funzione della posizione q).
In particolare ricordiamo che per una particella di massa m risulta:
T(q')=mq'2/2   e   -∂V(q)/∂q=F(q) 
dove F(q) è la forza a cui è sottoposta la particella lungo il percorso.
Nota: anche nel caso non conservativo dove non è definibile un potenziale (ad esempio per il campo magnetico), possiamo introdurre una funzione L(q,q') che soddisfi il principio di minima azione.

Si noti che tale equazione è equivalente a quella del moto di Newton: F=mq'' (dove q'' è l'accelerazione impressa alla particella dalla forza F); per mostrarlo basta inserire L=T(q')-V(q) nell'equazione di Eulero-Lagrange e poi derivare (ricordando che T dipende solo da q' mentre V dipende da q):
∂L/∂q-d(∂L/∂q')/dt=-∂V/∂q-d(∂T/∂q')/dt=F-mq''=0.
(Per approfondimenti vedi il seminario sul Principio di minima azione di Arrigo Amadori).

(*) L'introduzione della funzione L(q,q') è dovuta a Lagrange ed è apparsa nel suo libro "Méchanique Analitique" nel 1788 scritto proprio con lo scopo di ridurre la teoria meccanica ad operazioni algebriche, senza ragionamenti geometrici o meccanici (in effetti il libro non contiene figure).
(**) Il Principio di minima azione è un principio locale (essendo espresso da una equazione differenziale) e quindi la scelta del percorso viene definita puntualmente, istante per istante, senza nessun tipo di finalismo.
(***) Sembra che tutte le leggi fondamentali della fisica possano essere scritte nei termini di una lagrangiana. Ad esempio L=(g)1/2(R-(1/2)FµvFµv-ψ*Dψ) descrive un sistema dinamico di particelle come elettroni e quark, soggette a gravità, campi elettromagnetici e forze nucleari.

mercoledì 23 maggio 2018

Trasformazioni di basi, vettori e... co-vettori!

Come avevamo già osservato nel post "Cos'è il Vettore di Posizione?" la definizione di vettore non dipende dal sistema di coordinate prescelto e quindi, se vogliamo trasformare le coordinate rispetto alle quali quel vettore è definito, saranno le sue componenti a variare* in modo che il vettore resti invariato in modulo e direzione.

È noto che un qualsiasi vettore V può essere descritto come la combinazione lineare delle sue componenti vi moltiplicate per le rispettive basi vettoriali ei (cioè l'insieme dei vettori che generano lo spazio vettoriale); ad esempio nel caso più semplice di uno spazio bidimensionale avremo:
V=e1v1+e2v2.
Nota: vedremo più avanti il significato fisico degli indici in apice e pedice, diciamo che per ora indicano le due diverse basi (vettori) e rispettive componenti (qui gli apici non indicano mai elevamenti di potenza!)

Nel caso perciò di una trasformazione di coordinate si avrà un cambio delle basi ei (indicate dal trattino sotto) a cui corrisponde un cambio delle rispettive componenti vi (anch'esse indicate dal trattino sotto) in modo che il vettore V resti invariato, cioè:
V=e1v1+e2v2.

Se usiamo il formalismo matriciale, possiamo indicare le componenti di V come una matrice colonna, mentre le basi sono rappresentate da una matrice riga; moltiplicandole tra loro si ottiene (per l'invarianza di V):
Nota: ricordiamo che il prodotto tra due matrici tipo (m,n)x(n,p) produce una matrice (m,p) sviluppando il prodotto righe per colonne.

Supponiamo ora che le basi di V si trasformino secondo una generica matrice di trasformazione A (matrice quadrata 2x2 e invertibile in A-1):
allora affinché si ottengano di nuovo le equazioni di V sopra espresse, dovrà risultare per la trasformazione delle componenti:
infatti moltiplicando tra loro (membro a membro) le due ultime equazioni, si ottiene di nuovo l'identità V=V (essendo AxA-1=I la matrice identità).
Nota: abbiamo implicitamente supposto, con l'introduzione della matrice di trasformazione A, una relazione lineare tra le componenti (come vedremo ciò è sempre vero per le coordinate in forma differenziale).

Dato il ruolo diretto della matrice A si dice che le basi vettoriali di V si trasformano in modo covariante, mentre le sue componenti, che viceversa dipendono dalla sua inversa A-1, si trasformano in modo controvariante.
Nota: per convenzione le basi vettoriali (e1,e2) che si trasformano in modo covariante si indicano con il pedice mentre le componenti controvarianti del vettore (v1,v2) si indicano con l'apice.

Quando la matrice A di trasformazione è ortogonale (come nel caso di una rotazione di assi cartesiani ortogonali)** allora per definizione vale la relazione A-1=AT (dove AT è la matrice trasposta) da cui segue, facendo la trasposta di tutta la precedente equazione:
Nota: ricordiamo che la trasposta di un vettore colonna è un vettore riga (e viceversa); inoltre risulta per la trasposta AT: (AT)T =A.

Si noti però che questa ultima espressione è formalmente identica alla trasformazione covariante delle basi e quindi (in questo caso) la distinzione tra trasformazione covariante e controvariante decade; inoltre quando la trasformazione è ortogonale si conserva il prodotto scalare tra vettori.
Nota: è per tale motivo che nella fisica classica non si parla quasi mai dei due tipi di trasformazione, è sufficiente quella covariante.

Tuttavia nel caso più generale di una trasfomazione di coordinate qualunque (non ortogonale) ci chiediamo: come si trasformano le componenti di un vettore affinché questo resti invariato e quindi il prodotto scalare si conservi? Per quanto visto sopra ciò equivale a chiedersi com'è fatta in generale la matrice di trasformazione A e la sua inversa A-1.
Nota: se il modulo di un vettore è invariato allora anche il prodotto scalare resta invariato (dato che il modulo è la radice del vettore per se stesso).

Consideriamo ad esempio il caso classico di un lavoro infinitesimo dL (dovuto ad una forza F impressa ad un corpo che si sposta di un tratto infinitesimo ds), che è così definito nel caso bidimensionale:
dL=Fds=F1dx1+F2dx2.
Vogliamo che questo prodotto scalare tra vettori si conservi rispetto ad un sistema di coordinate qualunque, come in effetti accade nella realtà fisica.
Nota: invece delle classiche coordinate (x,y) abbiamo posto x=xe y=x2 (vedremo più avanti il significato degli indici messi in apice o pedice).

Consideriamo quindi una trasformazione di coordinate qualsiasi: trasformiamo ad esempio le coordinate (x1,x2) in quelle di un nuovo sistema (x1,x2) (dove le nuove coordinate sono note in funzione delle prime):
x1=x1(x1,x2)   ;   x2=x2(x1,x2)
ed inoltre esse devono ammettere la trasformazione inversa (affinché si possa passare da un sistema all'altro):
x1=x1(x1,x2)   ;   x2=x2(x1,x2).
Nota: per ipotesi tali funzioni sono differenziabili (funzioni lisce).

Per le note formule del calcolo differenziale di una funzione si ha:
dx1=(∂x1/∂x1)dx1+(∂x1/∂x2)dx2   e   dx2=(∂x2/∂x1)dx1+(∂x2/∂x2)dx2
possiamo quindi riscrivere il dL=F1dx1+F2dx2 sostituendo dx1 e dx2:
dL=F1(∂x1/∂x1)dx1+F1(∂x1/∂x2)dx2+F2(∂x2/∂x1)dx1+F2(∂x2/∂x2)dx2.

Se ora raccogliamo rispetto a dx1 e dx2 risulta:
dL=[F1(∂x1/∂x1)+F2(∂x2/∂x1)]dx1+[F1(∂x1/∂x2)+F2(∂x2/∂x2)]dx2
e il dL può essere riscritto nel nuovo sistema di coordinate:
dL=Fds=F1dx1+F2dx2
avendo posto
F1=F1(∂x1/∂x1)+F2(∂x2/∂x1)
F2=F1(∂x1/∂x2)+F2(∂x2/∂x2)
ed essendo per le solite formule differenziali
dx1=(∂x1/∂x1)dx1+(∂x1/∂x2)dx2 
dx2=(∂x2/∂x1)dx1+(∂x2/∂x2)dx2.
Nota: come richiesto, con queste trasformazioni il lavoro infinitesimo dL resta invariato nel cambio di coordinate.

Le derivate parziali (∂xi/∂xj) e (xj/∂xi) rappresentano perciò gli elementi, rispettivamente, della matrice di trasformazione A ed A-1 per F e per ds (dove A-1 è detta matrice jacobiana di solito indicata con J).
Nota: quindi (F1,F2) si trasforma in modo covariante mentre (dx1,dx2) in modo controvariante, come accade per basi e componenti di un vettore.

In definitiva possiamo scrivere per le componenti di F e ds (si sottintende il simbolo di sommatoria con la notazione di Einstein sugli indici ripetuti):
Fj=Fi(∂xi/∂xj)   e   dxj=dxi(xj/∂xi)
(con i, j=1, 2) grazie alle quali il prodotto scalare resta invariato e quindi, come già notato, anche il modulo di un vettore resta invariato (poiché è la radice del vettore moltiplicato per se stesso).

Perciò la legge generale di trasformazione delle componenti Ai di un vettore, che chiameremo covariante (o covettore) e quelle Bi del rispettivo vettore controvariante, tale per cui il prodotto scalare C=AiBi=AjBj si conservi, è la seguente (come mostrato sopra per Fj e dxj):
Aj=Ai(∂xi/∂xj)   e   Bj=Bi(xj/∂xi)
con la solita regola di sommatoria sugli indici ripetuti con i, j=1, 2, ... n (dove per convenzione gli apici indicano le componenti di un vettore mentre i pedici quelle di un covettore).
Note: in questo modo qualsiasi prodotto scalare tra un vettore A e il relativo covettore B è un invariante per trasformazioni di coordinate.

Ora nel contesto matriciale di un prodotto scalare, le componenti Ai di un vettore riga definiscono un covettore (o vettore covariante) che, applicato a un vettore colonna (o vettore controvariante) di componenti Bi, produce C=AiBi cioè un elemento scalare (del campo K) dallo spazio vettoriale V: l'insieme dei covettori (o funzionali f:V->K) definisce lo spazio duale***.
Nota: ricordiamo che il prodotto scalare tra A e B viene spesso indicato come <A,B> e che vettori e covettori sono legati dal tensore metrico gij=<ei,ej> (dove <ei,ej> è il prodotto scalare tra le basi) da cui Ai=gijAj.
[Infatti risulta
gijAj=<ei,ej>Aj=<ei,ejAj>=<ei,A>=Ai ma anche gijAi=Aj]

(*) Non sempre coordinate e componenti coincidono, nel caso ad esempio di coordinate curvilinee angolari queste non corrispondono alle componenti di un vettore, essendo quest'ultime delle lunghezze.
(**) Una trasformazione ortogonale viene espressa rispetto ad una base ortonormale (come ad esempio quella canonica degli assi cartesiani), tramite una matrice ortogonale e quindi invertibile.
(***) Data ad esempio la base canonica e1=(1,0)T, e2=(0,1)T (vettori colonna) possiamo definire una base canonica duale come e1=(1,0), e2=(0,1) (vettori riga) che rispetta la condizione generale di dualità <ei,ej>=δij (con δij delta di Kronecker); per un qualsiasi vettore V risulta perciò: V=eivi=ejvj.
[Si pone <ei,ej>=δij affinché risulti correttamente: <A,B>=(eiAi)(ejBj)=AiBi]

(Per chiarimenti su questa derivazione vedi la lezione di Arrigo Amadori "Definizione di tensore").