mercoledì 19 dicembre 2018

Tempo Proprio (e paradosso dei gemelli)

Nel post "La Dilatazione relativa del Tempo" abbiamo mostrato la relazione che lega l'intervallo di tempo ∆t' di un orologio in moto (con velocità v costante) misurato da un osservatore in quiete e lo stesso intervallo ∆t misurato dall'osservatore che si sta muovendo solidale con l'orologio:
∆t=∆t'(1-v2/c2)1/2
questa relazione è valida per tutti i sistemi di riferimento inerziale.
Nota: ciò è vero nell'ipotesi della costanza della velocità della luce e dell'invarianza delle leggi della fisica nei sistemi inerziali.

Supponiamo quindi di avere un osservatore in moto, solidale con il suo orologio, ed un osservatore in quiete che misura il moto e lo scorrere del tempo di questo orologio che si sposta con velocità v.

Come avevamo visto ∆t si definisce tempo proprio poiché è quello che viene misurato dall'osservatore in quiete rispetto al fenomeno osservato (nel nostro caso il fenomeno osservato è proprio il tempo dell'orologio); quindi è il tempo proprio dell'osservatore che si muove con il suo orologio.

È noto che in fisica classica due eventi qualsiasi (x1, t1) e (x2, t2) (per semplicità consideriamo solo due coordintate (x,t)) definiscono un intervallo spaziale ∆x=x2-x1 e uno temporale ∆t=t2-t1; questi intervalli di spazio e di tempo sono ritenuti invarianti per qualsiasi osservatore, in quiete o in moto.
Nota: nel nostro caso gli eventi segnano il passaggio dell'orologio in moto da un punto (x1, t1) all'altro punto (x2, t2).

In fisica relativistica si ipotizza invece un altro tipo di intervallo ∆s che è invariante per tutti gli osservatori inerziali*, ed è una sorta di unione degli intervalli di spazio e di tempo dei due eventi:
∆s2=c2∆t'2-∆x'2
dove ∆x' e ∆t' non sono più assoluti ma dipendono dal moto relativo degli osservatori (secondo le trasformazioni di Lorentz).
Nota: abbiamo scelto di indicare (x', t') con l'apice perché, nel nostro caso, sono le coordinate dell'osservatore in moto rispetto a quello in quiete; in ogni caso l'intervallo ∆s resta invariato.

Il fatto interessante è che nel nostro caso l'intervallo ∆s, detto separazione spazio-temporale tra due eventi, si può esprimere nel sistema in moto (quello dell'osservatore con l'orologio) semplicemente ponendo ∆x=0 (poiché l'orologio si trova in quiete in questo sistema di riferimento):
∆s2=c2∆t2
dove ∆t rappresenta il tempo proprio dell'osservatore in moto.
Perciò eguagliando le due ultime relazioni risulta:
c2∆t2=c2∆t'2-∆x'2   =>   ∆t2=∆t'2-∆x'2/c2=∆t'2(1-∆x'2/∆t'2c2).

Se quindi ∆x' rappresenta lo spostamento dell'osservatore in moto e ∆t' il tempo impiegato a spostarsi, avremo che v=∆x'/∆t' indica la velocità di spostamento rispetto all'osservatore in quiete; perciò si ottiene:
∆t2=∆t'2(1-v2/c2).
Questa è la stessa equazione già ricavata nel post sopra citato, dove ∆t rappresenta come detto il tempo proprio dell'osservatore in moto, da cui risulta ∆t'>∆t: cioè il tempo t' del sistema in moto appare dilatato.
Nota: si ha ∆t'=∆t solo quando v=0 cioè se entrambi gli osservatori sono in quiete uno rispetto all'altro.

Si noti che la relazione ottenuta vale solo per moti inerziali rappresentati da rette nello spazio-tempo (di pendenza v); tuttavia se riduciamo l'intervallo ∆s ad un infinitesimo ds allora si ottiene (in modo del tutto equivalente):
dt=dt'(1-v2/c2)1/2
dove dt e dt' sono i relativi intervalli infinitesimi.

Questo risultato non è banale poiché una traiettoria curva di un moto qualsiasi, quindi in generale non inerziale, possiamo suddividerla in infiniti tempi dt' e spostamenti dx' e perciò in infiniti intervalli ds; da ciò segue che l'integrale su tutti i tempi infinitesimi dt restituisce il tempo proprio complessivo dell'osservatore in moto:
t=∫dt=∫dt'(1-v(t')2/c2)1/2.
Nota: in pratica è come se suddividessimo la curva del moto in infiniti riferimenti inerziali con velocità istantanea v(t') e intervallo ds.

Dall'integrale sopra si deduce che t'>t (essendo (1-v(t')2/c2)<1) cioè il tempo t' misurato da un osservatore in quiete è sempre maggiore di quello t di un osservatore in moto qualsiasi; l'asimmetria tra i due sistemi risulta evidente quando l'osservatore in moto ritorna nel punto di partenza e confronta l'orologio con quello rimasto in quiete, verificando che t'>t (come accade nel noto paradosso dei gemelli!).
Nota: fatto verificato sperimentalmente ponendo un orologio in moto su un aereo e confrontandolo al rientro con la sua copia rimasta a terra.

Ovviamente se il moto è inerziale la situazione è del tutto simmetrica: le stesse considerazioni si possono applicare all'osservatore in moto che può ritenersi in quiete a tutti gli effetti, supponendo invece in moto l'altro osservatore (per il Principio di Relatività).
Nota: si noti che non è possibile il confronto diretto tra due orologi sincronizzati nello stesso punto e poi divisi dal moto relativo inerziale.

Se però volessimo studiare il fenomeno dal punto di vista dell'osservatore in moto non inerziale, avremmo bisogno della teoria della Relatività Generale; si otterranno coerentemente gli stessi risultati sulla dilatazione temporale prima derivati con la sola applicazione della relatività ristretta (come ben mostrato in questa lezione (pdf) di G.C. D'Amico)**.

(*) Inserendo nel ∆s2 i valori di x' e t' delle trasformazioni di Lorentz si può dimostrare che questo intervallo è un invariante relativistico.
(**) In questo caso la situazione non è più simmetrica, poiché l'osservatore è in moto non inerziale e può considerarsi in quiete (locale) solo a patto di introdurre un campo gravitazionale fittizio!
(Vedi il post "Il Principio di Equivalenza: ma=mg")

lunedì 1 ottobre 2018

Il Principio di minima Azione!

Introduciamo questo post dicendo subito che (vedi Wikipedia):
"In fisica il principio di minima azione è un principio variazionale che stabilisce che nei fenomeni della natura l'azione viene sempre minimizzata. A partire da questo principio si determina l'equazione del moto di un sistema dinamico".

Come vedremo il principio variazionale di minima azione si definisce grazie al calcolo delle variazioni che è "un campo dell'analisi matematica che si occupa della ricerca dei punti estremali (massimi e minimi) dei cosiddetti funzionali, ovvero funzioni il cui dominio è a sua volta un insieme di funzioni" (vedi Wikipedia).

Consideriamo ad esempio il moto di una particella con legge oraria q(t) e velocità q'(t)=dq(t)/dt), come vedremo possiamo definire una ipotetica funzione L(q,q') (detta lagrangiana* del sistema), che sia appunto funzione della coordinata q e della velocità q'.
Notaconsideriamo per semplicità il caso con una solo coordinata; inoltre q indica una coordinata generale, non necessariamente cartesiana.

Ora per definire l'equazione del moto, introduciamo un'altra funzione S(q(t)) chiamata Azione in cui compare la stessa L(q,q') (in realtà S è un funzionale essendo una funzione di funzione), ed è così definita:
S(q(t))=∫t1t2L(q,q')dt.

Come si vede S(q(t)) dipende dal percorso q(t) compiuto dalla particella (una volta fissati il punto iniziale q(t1) e finale q(t2)); in effetti esistono infiniti percorsi tra q(t1) e q(t2) su cui calcolare S(q(t)) che perciò può variare con continuità, in funzione del percorso.
Nota: questa osservazione ci permette di trattare S(q) come se fosse una funzione (differenziabile) anche se è una funzione di funzione (funzionale).

Facciamo quindi l'ipotesi fondamentale, secondo cui l'equazione del moto della particella si può ricavare ponendo la seguente condizione su S(q):
δS(q)=0.

Tale condizione è del tutto analoga a porre nullo il differenziale dF(x) di una funzione F(x) (a un solo valore) per trovare i punti estremali (massimo, minimo o sella): si cerca cioè quale sia, tra tutti quelli possibili, il percorso q che rende minimo l'integrale S(q) fissati i punti iniziale e finale.
Nota: si parla di Principio di minima azione poiché, nel caso del moto meccanico, la condizione δS=0 individua un minimo per l'azione S.

Questa condizione si traduce quindi nella seguente equazione:
δS(q)=δt1t2L(q,q')dt=t1t2δL(q,q')dt=0
dove
δL(q,q')=(∂L/∂q)δq+(∂L/∂q')δq'
è l'analogo del differenziale di una funzione F(x,y) a due variabili (si ricordi infatti che dF(x,y)=(∂F/∂x)dx+(∂F/∂y)dy); inoltre si è posto δq'=dδq/dt.

Prima di sviluppare l'integrale è utile fare la derivata, rispetto al tempo, del termine (∂L/∂q')δq:
d(∂L/∂q')δq/dt=δqd(∂L/∂q')/dt+(∂L/∂q')δq'
da cui si ricava facilmente il termine (∂L/∂q')δq' che useremo di seguito:
(∂L/∂q')δq'=d(∂L/∂q')δq/dt-δqd(∂L/∂q')/dt.

Possiamo quindi inserire nell'integrale del δS il valore del δL prima introdotto (sostituendo poi il termine (∂L/∂q')δq' appena ricavato); si ottiene perciò:
δS(q)=∫t1t2δL(q,q')dt=t1t2[(∂L/∂q)δq+(∂L/∂q')δq']dt=
=∫t1t2(∂L/∂q)δqdt+t1t2[d(∂L/∂q')δq/dt]dt-t1t2[δqd(∂L/∂q')/dt]dt.

Si osservi che il secondo termine a destra dell'equazione è nullo risultando:
t1t2[d(∂L/∂q')δq/dt]dt=[(∂L/∂q')δq]t1t2=0
avendo posto come condizione al contorno δq(t1)=δq(t2)=0 dato che i punti iniziale e finale del percorso non variano.

Perciò se vogliamo che il δS sia nullo dovremo porre (raccogliendo δqdt dal primo e terzo termine dell'equazione):
δS(q)=t1t2[(∂L/∂q)-d(∂L/∂q')/dt]δqdt=0
ciò significa che il termine sotto integrale deve essere nullo (essendo δq≠0):
∂L/∂q-d(∂L/∂q')/dt=0.
Questa è proprio l'equazione, detta di Eulero-Lagrange, che L(q,q') deve soddisfare per il Principio di minima azione** e che rappresenta l'equazione del moto del sistema.

Ma a questo punto resta una domanda fondamentale, come è fatta la lagrangiana L(q,q') di un sistema dinamico qualsiasi?
Nota: anche nel caso non conservativo in cui non è definibile un potenziale (ad es. nel campo magnetico), possiamo introdurre una funzione L(q,q').

Ebbene si ipotizza che ogni sistema fisico abbia la propria lagrangiana***; ad esempio nel caso di sistemi meccanici si pone (e si può verificare per via sperimentale):
L(q,q')=T(q')-V(q)
dove T(q') è l'energia cinetica del sistema (che dipende dalla velocità q') e V(q) è l'energia potenziale (funzione della posizione q).
In particolare ricordiamo che per una particella di massa m risulta:
T(q')=mq'2/2   e   -∂V(q)/∂q=F(q) 
dove F(q) è la forza a cui è sottoposta la particella lungo il percorso.

Si noti che tale equazione è equivalente a quella del moto di Newton F=mq'' (dove q'' è l'accelerazione impressa alla particella dalla forza F); per mostrarlo basta inserire L=T(q')-V(q) nell'equazione di Eulero-Lagrange e poi derivare (ricordando che T dipende solo da q' mentre V dipende da q):
∂L/∂q-d(∂L/∂q')/dt=-∂V/∂q-d(∂T/∂q')/dt=F-mq''=0.
(Per approfondimenti vedi il seminario sul Principio di minima azione di Arrigo Amadori).

(*) L'introduzione della funzione L(q,q') è dovuta a Lagrange ed è apparsa nel suo libro "Méchanique Analitique" nel 1788 scritto proprio con lo scopo di ridurre la teoria meccanica ad operazioni algebriche, senza ragionamenti geometrici o meccanici (in effetti il libro non contiene figure).
(**) Il Principio di minima azione è un principio locale (essendo espresso da una equazione differenziale) e quindi la scelta del percorso viene definita puntualmente, istante per istante, senza nessun tipo di finalismo.
(***) Tutte le leggi fondamentali della fisica possono essere scritte nei termini di una lagrangiana. In particolare L=(g)1/2(R-(1/2)FµvFµv-ψ*Dψ) descrive un sistema dinamico di particelle come elettroni e quark, soggette a gravità, campi elettromagnetici e forze nucleari.

mercoledì 23 maggio 2018

Trasformazioni di basi, vettori e... co-vettori!

Come avevamo già osservato nel post "Cos'è il Vettore di Posizione?" la definizione di vettore non dipende dal sistema di coordinate prescelto e quindi, se vogliamo trasformare le coordinate rispetto alle quali quel vettore è definito, saranno le sue componenti a variare* in modo che il vettore resti invariato in modulo e direzione.
Attenzione: in questo post gli apici non indicano mai elevamenti di potenza!

È noto che un qualsiasi vettore V può essere descritto come la combinazione lineare delle sue componenti vi moltiplicate per le rispettive basi vettoriali ei (cioè l'insieme dei vettori che generano lo spazio vettoriale); ad esempio nel caso più semplice di uno spazio bidimensionale avremo:
V=e1v1+e2v2.
Nota: vedremo più avanti il significato fisico degli indici in apice e pedice, per ora indicano le due diverse basi e rispettive componenti.

Nel caso perciò di una trasformazione di coordinate si avrà un cambio di basi ei (indicate dal trattino sotto) a cui corrisponde un cambio delle rispettive componenti vi (anch'esse indicate dal trattino sotto) in modo che il vettore V resti invariato, cioè:
V=e1v1+e2v2.

Se usiamo il formalismo matriciale, possiamo indicare le componenti di V come una matrice colonna, mentre le basi sono rappresentate da una matrice riga; moltiplicandole tra loro si ottiene (per l'invarianza di V):
Nota: ricordiamo che il prodotto tra due matrici tipo (m,n)x(n,p) produce una matrice (m,p) sviluppando il prodotto righe per colonne.

Supponiamo ora che le basi di V si trasformino secondo una generica matrice di trasformazione A (matrice quadrata 2x2 e invertibile in A-1):
allora affinché si ottengano di nuovo le equazioni di V sopra espresse, dovrà risultare per la trasformazione delle componenti:
infatti moltiplicando tra loro (membro a membro) le due ultime equazioni, si ottiene di nuovo l'identità V=V (essendo AxA-1=I la matrice identità).
Nota: abbiamo implicitamente supposto, con l'introduzione della matrice di trasformazione A, una relazione lineare tra le componenti (come vedremo ciò è sempre vero per le coordinate in forma differenziale).

Dato il ruolo diretto della matrice A si dice che le basi vettoriali di V si trasformano in modo covariante, mentre le sue componenti, che viceversa dipendono dalla sua inversa A-1, si trasformano in modo controvariante.

Tuttavia se la matrice A di trasformazione è ortogonale (come nel caso di una rotazione di assi cartesiani ortogonali)** allora per definizione vale la relazione A-1=At (dove At è la matrice trasposta) da cui segue, facendo la trasposta di tutta la precedente equazione:
Nota: ricordiamo che la trasposta di un vettore colonna è un vettore riga (e viceversa); inoltre risulta per la trasposta di At: (At)t =A.

Si noti però che questa ultima espressione è formalmente identica alla trasformazione covariante delle basi e quindi (in questo caso) la distinzione tra trasformazione covariante e controvariante decade; inoltre quando la trasformazione è ortogonale si conserva il prodotto scalare tra vettori.
Nota: è per tale motivo che nella fisica classica non si parla quasi mai dei due tipi di trasformazione, è sufficiente quella covariante.

Tuttavia nel caso più generale di una trasfomazione di coordinate qualunque (non ortogonale) ci chiediamo: come si trasformano le componenti di un vettore affinché questo resti invariato e il prodotto scalare si conservi?
Nota: per quanto visto sopra ciò equivale a chiedersi com'è fatta in generale la matrice di trasformazione A e la sua inversa A-1.

Consideriamo ad esempio il caso classico di un lavoro infinitesimo dL (dovuto ad una forza F impressa ad un corpo che si sposta di un tratto infinitesimo ds), così definito nel caso bidimensionale:
dL=Fds=F1dx1+F2dx2.
Vogliamo che questo prodotto scalare tra vettori si conservi rispetto ad un sistema di coordinate qualunque, come in effetti accade nella realtà fisica.
Nota: invece delle classiche coordinate (x,y) abbiamo posto x=xe y=x2, vedremo più avanti il significato degli indici messi in apice o pedice.

Consideriamo quindi una trasformazione di coordinate qualsiasi: trasformiamo ad esempio le coordinate (x1,x2) in quelle di un nuovo sistema (x1,x2) (dove le nuove coordinate sono note in funzione delle prime):
x1=x1(x1,x2)   ;   x2=x2(x1,x2)
ed inoltre esse devono ammettere la trasformazione inversa (affinché si possa passare da un sistema all'altro):
x1=x1(x1,x2)   ;   x2=x2(x1,x2).
Nota: per ipotesi tali funzioni a più variabili sono entrambe differenziabili.

Per le note formule del calcolo differenziale di una funzione si ha:
dx1=(∂x1/∂x1)dx1+(∂x1/∂x2)dx2   e   dx2=(∂x2/∂x1)dx1+(∂x2/∂x2)dx2
possiamo quindi riscrivere il dL=F1dx1+F2dx2 sostituendo dx1 e dx2:
dL=F1(∂x1/∂x1)dx1+F1(∂x1/∂x2)dx2+F2(∂x2/∂x1)dx1+F2(∂x2/∂x2)dx2.

Se ora raccogliamo rispetto a dx1 e dx2 risulta:
dL=[F1(∂x1/∂x1)+F2(∂x2/∂x1)]dx1+[F1(∂x1/∂x2)+F2(∂x2/∂x2)]dx2
e il dL può essere riscritto nel nuovo sistema di coordinate:
dL=Fds=F1dx1+F2dx2
avendo posto
F1=F1(∂x1/∂x1)+F2(∂x2/∂x1)
F2=F1(∂x1/∂x2)+F2(∂x2/∂x2)
ed essendo per le solite formule differenziali
dx1=(∂x1/∂x1)dx1+(∂x1/∂x2)dx2 
dx2=(∂x2/∂x1)dx1+(∂x2/∂x2)dx2.

Le derivate parziali (∂xi/∂xj) e (xj/∂xi) rappresentano perciò gli elementi, rispettivamente, della matrice di trasformazione A ed A-1 per F e ds (A è detta matrice jacobiana di solito indicata con J).
Nota: quindi (F1,F2) si trasforma in modo covariante mentre (dx1,dx2) in modo controvariante, come accade per basi e componenti di un vettore.

In definitiva possiamo scrivere per le componenti di F e ds (si sottintende il simbolo di sommatoria con la notazione di Einstein sugli indici ripetuti):
Fj=Fi(∂xi/∂xj)   e   dxj=dxi(xj/∂xi)
(con i, j=1, 2) grazie alle quali il prodotto scalare resta invariato.
(Per chiarimenti su questa derivazione vedi la lezione di Arrigo Amadori "Definizione di tensore").

Perciò la legge generale di trasformazione delle componenti Ai di un vettore, che chiameremo covariante (o covettore) e quelle Bi del rispettivo vettore controvariante, tale per cui il prodotto scalare C=AiBi=AjBj si conservi, è la seguente (come mostrato per Fj e dxj):
Aj=Ai(∂xi/∂xj)   e   Bj=Bi(xj/∂xi)
con la solita regola di sommatoria sugli indici ripetuti (con i, j=1, 2, ... n); inoltre per convenzione gli apici indicano le componenti di un vettore mentre i pedici quelle di un covettore.

Ora nel contesto matriciale di un prodotto scalare, le componenti Ai di un vettore riga definiscono un covettore (o vettore covariante) che, applicato a un vettore colonna (o vettore controvariante) di componenti Bi, produce C=AiBi cioè un elemento scalare (del campo K) dallo spazio vettoriale V: l'insieme dei covettori (o funzionali f:V->K) definisce lo spazio duale***.
Nota: ricordiamo che il prodotto scalare tra due vettori A e B viene spesso indicato come <A,B>.

(*) Non sempre coordinate e componenti coincidono, nel caso ad esempio di coordinate curvilinee angolari queste non corrispondono alle componenti di un vettore, essendo quest'ultime delle lunghezze.
(**) Una trasformazione ortogonale viene espressa rispetto ad una base ortonormale (come ad esempio quella canonica degli assi cartesiani), tramite una matrice ortogonale e quindi invertibile.
(***) Data ad esempio la base canonica e1=(1,0)t, e2=(0,1)t (vettori colonna) possiamo definire una base canonica duale come e1=(1,0), e2=(0,1) (vettori riga) che rispetta la condizione generale di dualità <ei,ej>=δij (dove δij è la delta di Kronecker); per un qualsiasi vettore V risulta perciò: V=eivi=ejvj.
(Si pone <ei,ej>=δij affinché risulti correttamente: <A,B>=(eiAi)(ejBj)=AiBi)