mercoledì 23 gennaio 2019

Minkowski e lo Spazio-Tempo geometrico

Nel 1908 il matematico Hermann Minkowski dichiarava:
"Le concezioni di spazio e di tempo che desidero esporvi sono sorte dal terreno della fisica sperimentale, e in ciò sta la loro forza. Esse sono fondamentali. D'ora in poi lo spazio di per sé stesso o il tempo di per sé stesso sono condannati a svanire in pure ombre, e solo una specie di unione tra i due concetti conserverà una realtà indipendente" (vedi Wikipedia).

Prima di passare alla descrizione dei diagrammi spazio-tempo di Minkowski, che permettono una rappresentazione geometrica delle leggi della Relatività ristretta, dobbiamo dare alcune definizioni:

- Evento: indica un fenomeno fisico localizzato in uno specifico punto dello spazio quadrimensionale in un sistema di riferimento fissato (X, Y, Z, T).

- Punto evento: sono le coordinate istantanee (x, y, z, t) di un evento, cioè un punto preciso dello spazio, nell'istante in cui si verifica un fenomeno fisico.

- Linea di universo: questa linea rappresenta il percorso compiuto dagli oggetti, essa unisce i punti evento corrispondenti alle coordinate istantanee.

In realtà lo spazio-tempo di Minkowski appare come un usuale spazio euclideo, su cui è però definita una distanza differente da quella euclidea (già introdotta nel post "Tempo Proprio (e paradosso dei gemelli)"):
∆s2=c2∆t2-∆x2
dove ∆x e ∆t indicano rispettivamente gli intervalli di spazio e di tempo tra due eventi in un dato sistema di riferimento inerziale, mentre ∆s è detto separazione spazio-temporale tra gli eventi.
Nota: per semplicità consideriamo solo le coordinate (x, t) dato che le altre due coordinate (y, z) non cambiano passando da un riferimento all'altro.

Inoltre, in modo analogo alla classica distanza dello spazio euclideo, anche l'intervallo ∆s è un invariante per tutti gli osservatori inerziali!
Nota: i diagrammi di Minkowski si applicano solo nell'ambito della Relatività ristretta, cioè in condizioni di spazio piatto (assenza di gravità).

A questo punto possiamo fare dei semplici esempi di linee di universo nello spazio-tempo di Minkowski:

a) Il primo diagramma, descritto dagli assi ortogonali (X, cT), indica la linea di universo di un corpo che si muove tra due punti evento: A (partenza) e B (arrivo) con velocità v minore della luce, come descritto in figura:


In generale si osservi che l'asse cT indica la linea di universo di un osservatore O che non si sposta nello spazio (cioè x=0) ma solo nel tempo; mentre l'asse X indica la linea del suo presente (cioè tutti i punti con t=0).
Nota: se il passato non esiste più e il futuro deve ancora realizzarsi, allora il presente comprende tutti gli eventi che definiscono la realtà di O.

Si osservi che nel grafico c∆t indica la distanza che percorre la luce nel tempo ∆t (che separa i due eventi A e B); mentre la linea tratteggiata di riferimento indica la linea di universo di un raggio di luce (essendo x=ct).

Nel nostro caso risulta c∆t>∆x quindi i due eventi A e B possono essere connessi casualmente: cioè la distanza ∆x tra i due eventi può essere coperta da un oggetto con velocità v minore di quella della luce: ∆x=v∆t.
Nota: sulla connessione causale tra due eventi vedi anche il post "Prima la causa e poi... l'effetto?".

La separazione spazio-temporale tra i due eventi è quindi:
∆s2=c2∆t2-∆x2>0
e ciò caratterizza, come già detto prima, tutti gli osservatori inerziali per i quali l'intervallo ∆s resta invariato (fissati i due eventi A e B); inoltre in generale risulta ∆s>0 per tutti gli eventi contenuti nel futuro di O.
Nota: il futuro di O è formato da tutte le posizioni dello spazio-tempo che può occupare O (cioè i punti compresi tra le due rette x=±ct con t>0).

b) In questo secondo diagramma consideriamo invece la linea di universo di un osservatore O' che si muove con velocità v rispetto all'ossevatore in quiete O del diagramma precedente:


Si può facilmente mostrare* che gli assi T' e X' di O' sono inclinati con la stessa pendenza θ come indicato in figura; inoltre per ottenere le coordinate di un qualsiasi evento P (rispetto a O') basta tracciare le parallele agli assi T' e X' (come si è fatto in modo analogo per il sistema in quiete O)**.

c) Infine in questo terzo diagramma rappresentiamo due osservatori O e O', rispettivamente in quiete e in moto lungo l'asse X, che valutano in modo diverso lo stesso evento fisico P:


Infatti l'osservatore O' si trova sulla linea del presente di O (t=0), mentre l'evento P si trova nel presente di O' (t'=0) ma allo stesso tempo si trova nel futuro di O, quindi il futuro di O (ad esempio l'evento P) si è già realizzato(!)
Nota: in sintesi se O' è reale per O e P è reale per O' allora P è reale per O (se si accetta la proprietà transitiva di realtà tra gli eventi).

È probabile che considerazioni come questa fecero scrivere ad Albert Einstein: "Le persone come noi, che credono nella fisica, sanno che la distinzione tra passato, presente e futuro non è che un'illusione, per quanto tenace"***.
Nota: non esistendo in Relatività un tempo assoluto, il ragionamento precedente si può estendere a qualsiasi punto dello spazio-tempo.

(*) Le trasformazioni di Lorentz per x' e t' sono come è noto: x'=γ(x-vt) e t'=γ(t-vx/c2) quindi posto x'=0 (per ottenere l'asse T') e t'=0 (per ricavare l'asse X') si ha rispettivamente: t=x/v e x=t/v perciò la reciproca pendenza θ dei due assi T' e X' è la stessa (come indicato in figura).
(**) Tuttavia il tempo e lo spazio dei due osservatori O e O' non sono direttamente confrontabili sul grafico, in effetti dobbiamo considerare l'iperbole di calibrazione ∆s2=±1 per confrontare le misure.
(***) Il testo è contenuto in una lettera che Albert Einstein mandò alla moglie del suo caro amico Michele Besso, in occasione della sua morte.

mercoledì 19 dicembre 2018

Tempo Proprio (e paradosso dei gemelli)

Nel post "La Dilatazione relativa del Tempo" abbiamo mostrato la relazione che lega l'intervallo di tempo ∆t' di un orologio in moto (con velocità v costante) misurato da un osservatore in quiete e lo stesso intervallo ∆t misurato dall'osservatore che si sta muovendo solidale con l'orologio:
∆t=∆t'(1-v2/c2)1/2
questa relazione è valida per tutti i sistemi di riferimento inerziale.
Nota: ciò è vero nell'ipotesi della costanza della velocità della luce e dell'invarianza delle leggi della fisica nei sistemi inerziali.

Supponiamo quindi di avere un osservatore in moto, solidale con il suo orologio, ed un osservatore in quiete che misura il moto e lo scorrere del tempo di questo orologio che si sposta con velocità v.

Come avevamo visto ∆t si definisce tempo proprio poiché è quello che viene misurato dall'osservatore in quiete rispetto al fenomeno osservato (nel nostro caso il fenomeno osservato è proprio il tempo dell'orologio); quindi è il tempo proprio dell'osservatore che si muove con il suo orologio.

È noto che in fisica classica due eventi qualsiasi (x1, t1) e (x2, t2) (per semplicità consideriamo solo due coordintate (x,t)) definiscono un intervallo spaziale ∆x=x2-x1 e uno temporale ∆t=t2-t1; questi intervalli di spazio e di tempo sono ritenuti invarianti per qualsiasi osservatore, in quiete o in moto.
Nota: nel nostro caso gli eventi segnano il passaggio dell'orologio in moto da un punto (x1, t1) all'altro punto (x2, t2).

In fisica relativistica si ipotizza invece un altro tipo di intervallo ∆s che è invariante per tutti gli osservatori inerziali*, ed è una sorta di unione degli intervalli di spazio e di tempo dei due eventi:
∆s2=c2∆t'2-∆x'2
dove ∆x' e ∆t' non sono più assoluti ma dipendono dal moto relativo degli osservatori (secondo le trasformazioni di Lorentz).
Nota: abbiamo scelto di indicare (x', t') con l'apice perché, nel nostro caso, sono le coordinate dell'osservatore in moto rispetto a quello in quiete; in ogni caso l'intervallo ∆s resta invariato.

Il fatto interessante è che nel nostro caso l'intervallo ∆s, detto separazione spazio-temporale tra due eventi, si può esprimere nel sistema in moto (quello dell'osservatore con l'orologio) semplicemente ponendo ∆x=0 (poiché l'orologio si trova in quiete in questo sistema di riferimento):
∆s2=c2∆t2
dove ∆t rappresenta il tempo proprio dell'osservatore in moto.
Perciò eguagliando le due ultime relazioni risulta:
c2∆t2=c2∆t'2-∆x'2   =>   ∆t2=∆t'2-∆x'2/c2=∆t'2(1-∆x'2/∆t'2c2).

Se quindi ∆x' rappresenta lo spostamento dell'osservatore in moto e ∆t' il tempo impiegato a spostarsi, avremo che v=∆x'/∆t' indica la velocità di spostamento rispetto all'osservatore in quiete; perciò si ottiene:
∆t2=∆t'2(1-v2/c2).
Questa è la stessa equazione già ricavata nel post sopra citato, dove ∆t rappresenta come detto il tempo proprio dell'osservatore in moto, da cui risulta ∆t'>∆t: cioè il tempo t' del sistema in moto appare dilatato.
Nota: si ha ∆t'=∆t solo quando v=0 cioè se entrambi gli osservatori sono in quiete uno rispetto all'altro.

Si noti che la relazione ottenuta vale solo per moti inerziali rappresentati da rette nello spazio-tempo (di pendenza v); tuttavia se riduciamo l'intervallo ∆s ad un infinitesimo ds allora si ottiene (in modo del tutto equivalente):
dt=dt'(1-v2/c2)1/2
dove dt e dt' sono i relativi intervalli infinitesimi.

Questo risultato non è banale poiché una traiettoria curva di un moto qualsiasi, quindi in generale non inerziale, possiamo suddividerla in infiniti tempi dt' e spostamenti dx' e perciò in infiniti intervalli ds; da ciò segue che l'integrale su tutti i tempi infinitesimi dt restituisce il tempo proprio complessivo dell'osservatore in moto:
t=∫dt=∫dt'(1-v(t')2/c2)1/2.
Nota: in pratica è come se suddividessimo la curva del moto in infiniti riferimenti inerziali con velocità istantanea v(t') e intervallo ds.

Dall'integrale sopra si deduce che t'>t (essendo (1-v(t')2/c2)<1) cioè il tempo t' misurato da un osservatore in quiete è sempre maggiore di quello t di un osservatore in moto qualsiasi; l'asimmetria tra i due sistemi risulta evidente quando l'osservatore in moto ritorna nel punto di partenza e confronta l'orologio con quello rimasto in quiete, verificando che t'>t (come accade nel noto paradosso dei gemelli!).
Nota: fatto verificato sperimentalmente ponendo un orologio in moto su un aereo e confrontandolo al rientro con la sua copia rimasta a terra.

Ovviamente se il moto è inerziale la situazione è del tutto simmetrica: le stesse considerazioni si possono applicare all'osservatore in moto che può ritenersi in quiete a tutti gli effetti, supponendo invece in moto l'altro osservatore (per il Principio di Relatività).
Nota: si noti che non è possibile il confronto diretto tra due orologi sincronizzati nello stesso punto e poi divisi dal moto relativo inerziale.

Se però volessimo studiare il fenomeno dal punto di vista dell'osservatore in moto non inerziale, avremmo bisogno della teoria della Relatività Generale; si otterranno coerentemente gli stessi risultati sulla dilatazione temporale prima derivati con la sola applicazione della relatività ristretta (come ben mostrato in questa lezione (pdf) di G.C. D'Amico)**.

(*) Inserendo nel ∆s2 i valori di x' e t' delle trasformazioni di Lorentz si può dimostrare che questo intervallo è un invariante relativistico.
(**) In questo caso la situazione non è più simmetrica, poiché l'osservatore è in moto non inerziale e può considerarsi in quiete (locale) solo a patto di introdurre un campo gravitazionale fittizio!
(Vedi il post "Il Principio di Equivalenza: ma=mg")

lunedì 1 ottobre 2018

Il Principio di minima Azione!

Introduciamo questo post dicendo subito che (vedi Wikipedia):
"In fisica il principio di minima azione è un principio variazionale che stabilisce che nei fenomeni della natura l'azione viene sempre minimizzata. A partire da questo principio si determina l'equazione del moto di un sistema dinamico".

Come vedremo il principio variazionale di minima azione si definisce grazie al calcolo delle variazioni che è "un campo dell'analisi matematica che si occupa della ricerca dei punti estremali (massimi e minimi) dei cosiddetti funzionali, ovvero funzioni il cui dominio è a sua volta un insieme di funzioni" (vedi Wikipedia).

Consideriamo ad esempio il moto di una particella con legge oraria q(t) e velocità q'(t)=dq(t)/dt), come vedremo possiamo definire una ipotetica funzione L(q,q') (detta lagrangiana* del sistema), che sia appunto funzione della coordinata q e della velocità q'.
Notaconsideriamo per semplicità il caso con una solo coordinata; inoltre q indica una coordinata generale, non necessariamente cartesiana.

Ora per definire l'equazione del moto, introduciamo un'altra funzione S(q(t)) chiamata Azione in cui compare la stessa L(q,q') (in realtà S è un funzionale essendo una funzione di funzione), ed è così definita:
S(q(t))=∫t1t2L(q,q')dt.

Come si vede S(q(t)) dipende dal percorso q(t) compiuto dalla particella (una volta fissati il punto iniziale q(t1) e finale q(t2)); in effetti esistono infiniti percorsi tra q(t1) e q(t2) su cui calcolare S(q(t)) che perciò può variare con continuità, in funzione del percorso.
Nota: questa osservazione ci permette di trattare S(q) come se fosse una funzione (differenziabile) anche se è una funzione di funzione (funzionale).

Facciamo quindi l'ipotesi fondamentale, secondo cui l'equazione del moto della particella si può ricavare ponendo la seguente condizione su S(q):
δS(q)=0.

Tale condizione è del tutto analoga a porre nullo il differenziale dF(x) di una funzione F(x) (a un solo valore) per trovare i punti estremali (massimo, minimo o sella): si cerca cioè quale sia, tra tutti quelli possibili, il percorso q che rende minimo l'integrale S(q) fissati i punti iniziale e finale.
Nota: si parla di Principio di minima azione poiché, nel caso del moto meccanico, la condizione δS=0 individua un minimo per l'azione S.

Questa condizione si traduce quindi nella seguente equazione:
δS(q)=δt1t2L(q,q')dt=t1t2δL(q,q')dt=0
dove
δL(q,q')=(∂L/∂q)δq+(∂L/∂q')δq'
è l'analogo del differenziale di una funzione F(x,y) a due variabili (si ricordi infatti che dF(x,y)=(∂F/∂x)dx+(∂F/∂y)dy); inoltre si è posto δq'=dδq/dt.

Prima di sviluppare l'integrale è utile fare la derivata, rispetto al tempo, del termine (∂L/∂q')δq:
d(∂L/∂q')δq/dt=δqd(∂L/∂q')/dt+(∂L/∂q')δq'
da cui si ricava facilmente il termine (∂L/∂q')δq' che useremo di seguito:
(∂L/∂q')δq'=d(∂L/∂q')δq/dt-δqd(∂L/∂q')/dt.

Possiamo quindi inserire nell'integrale del δS il valore del δL prima introdotto (sostituendo poi il termine (∂L/∂q')δq' appena ricavato); si ottiene perciò:
δS(q)=∫t1t2δL(q,q')dt=t1t2[(∂L/∂q)δq+(∂L/∂q')δq']dt=
=∫t1t2(∂L/∂q)δqdt+t1t2[d(∂L/∂q')δq/dt]dt-t1t2[δqd(∂L/∂q')/dt]dt.

Si osservi che il secondo termine a destra dell'equazione è nullo risultando:
t1t2[d(∂L/∂q')δq/dt]dt=[(∂L/∂q')δq]t1t2=0
avendo posto come condizione al contorno δq(t1)=δq(t2)=0 dato che i punti iniziale e finale del percorso non variano.

Perciò se vogliamo che il δS sia nullo dovremo porre (raccogliendo δqdt dal primo e terzo termine dell'equazione):
δS(q)=t1t2[(∂L/∂q)-d(∂L/∂q')/dt]δqdt=0
ciò significa che il termine sotto integrale deve essere nullo (essendo δq≠0):
∂L/∂q-d(∂L/∂q')/dt=0.
Questa è proprio l'equazione, detta di Eulero-Lagrange, che L(q,q') deve soddisfare per il Principio di minima azione**.

Ma a questo punto resta una domanda fondamentale, come è fatta la lagrangiana L(q,q') di un sistema dinamico qualsiasi?

Ebbene si ipotizza che ogni sistema fisico abbia la propria lagrangiana***; ad esempio nel caso di sistemi meccanici si pone (e si può verificare sperimentalmente):
L(q,q')=T(q')-V(q)
dove T(q') è l'energia cinetica del sistema (che dipende dalla velocità q') e V(q) è l'energia potenziale (funzione della posizione q).
In particolare ricordiamo che per una particella di massa m risulta:
T(q')=mq'2/2   e   -∂V(q)/∂q=F(q) 
dove F(q) è la forza a cui è sottoposta la particella lungo il percorso.

Infatti tale equazione è equivalente a quella del moto di Newton F=mq'' (dove q'' è l'accelerazione impressa alla particella dalla forza F); per mostrarlo basta inserire L=T(q')-V(q) nell'equazione di Eulero-Lagrange e poi derivare (si ricordi che T dipende solo da q' mentre V dipende da q):
∂L/∂q-d(∂L/∂q')/dt=-∂V/∂q-d(∂T/∂q')/dt=F-mq''=0.
(Per approfondimenti vedi il seminario sul Principio di minima azione di Arrigo Amadori).

(*) L'introduzione della funzione L(q,q') è dovuta a Lagrange ed è apparsa nel suo libro "Méchanique Analitique" nel 1788 scritto proprio con lo scopo di ridurre la teoria meccanica ad operazioni algebriche, senza ragionamenti geometrici o meccanici (in effetti il libro non contiene figure).
(**) Il Principio di minima azione è un principio locale (essendo espresso da una equazione differenziale) e quindi la scelta del percorso viene definita puntualmente, istante per istante, senza nessun tipo di finalismo.
(***) Tutte le leggi fondamentali della fisica possono essere scritte nei termini di una lagrangiana. In particolare L=(g)1/2(R-(1/2)FµvFµv-ψ*Dψ) descrive un sistema dinamico di particelle come elettroni e quark, soggette a gravità, campi elettromagnetici e forze nucleari.

mercoledì 23 maggio 2018

Trasformazioni di basi, vettori e... co-vettori!

Come avevamo già osservato nel post "Cos'è il Vettore di Posizione?" la definizione di vettore non dipende dal sistema di coordinate prescelto e quindi, se vogliamo trasformare le coordinate rispetto alle quali quel vettore è definito, saranno le sue componenti a variare* in modo che il vettore resti invariato in modulo e direzione.
Attenzione: in questo post gli apici non indicano mai elevamenti di potenza!

È noto che un qualsiasi vettore V può essere descritto come la combinazione lineare delle sue componenti vi moltiplicate per le rispettive basi vettoriali ei (cioè l'insieme dei vettori che generano lo spazio vettoriale); ad esempio nel caso più semplice di uno spazio bidimensionale avremo:
V=e1v1+e2v2.
Nota: vedremo più avanti il significato fisico degli indici in apice e pedice, per ora indicano le due diverse basi e rispettive componenti.

Nel caso perciò di una trasformazione di coordinate si avrà un cambio di basi ei (indicate dal trattino sotto) a cui corrisponde un cambio delle rispettive componenti vi (anch'esse indicate dal trattino sotto) in modo che il vettore V resti invariato, cioè:
V=e1v1+e2v2.

Se usiamo il formalismo matriciale, possiamo indicare le componenti di V come una matrice colonna, mentre le basi sono rappresentate da una matrice riga; moltiplicandole tra loro si ottiene (per l'invarianza di V):
Nota: ricordiamo che il prodotto tra due matrici tipo (m,n)x(n,p) produce una matrice (m,p) sviluppando il prodotto righe per colonne.

Supponiamo ora che le basi di V si trasformino secondo una generica matrice di trasformazione A (matrice quadrata 2x2 e invertibile in A-1):
allora affinché si ottengano di nuovo le equazioni di V sopra espresse, dovrà risultare per la trasformazione delle componenti:
infatti moltiplicando tra loro (membro a membro) le due ultime equazioni, si ottiene di nuovo l'identità V=V (essendo AxA-1=I la matrice identità).
Nota: abbiamo implicitamente supposto, con l'introduzione della matrice di trasformazione A, una relazione lineare tra le componenti (come vedremo ciò è sempre vero per le coordinate in forma differenziale).

Dato il ruolo diretto della matrice A si dice che le basi vettoriali di V si trasformano in modo covariante, mentre le sue componenti, che viceversa dipendono dalla sua inversa A-1, si trasformano in modo controvariante.

Tuttavia se la matrice A di trasformazione è ortogonale (come nel caso di una rotazione di assi cartesiani ortogonali)** allora per definizione vale la relazione A-1=At (dove At è la matrice trasposta) da cui segue, facendo la trasposta di tutta la precedente equazione:
Nota: ricordiamo che la trasposta di un vettore colonna è un vettore riga (e viceversa); inoltre risulta per la trasposta di At: (At)t =A.

Si noti però che questa ultima espressione è formalmente identica alla trasformazione covariante delle basi e quindi (in questo caso) la distinzione tra trasformazione covariante e controvariante decade; inoltre quando la trasformazione è ortogonale si conserva il prodotto scalare tra vettori.
Nota: è per tale motivo che nella fisica classica non si parla quasi mai dei due tipi di trasformazione, è sufficiente quella covariante.

Tuttavia nel caso più generale di una trasfomazione di coordinate qualunque (non ortogonale) ci chiediamo: come si trasformano le componenti di un vettore affinché questo resti invariato e il prodotto scalare si conservi?
Nota: per quanto visto sopra ciò equivale a chiedersi com'è fatta in generale la matrice di trasformazione A e la sua inversa A-1.

Consideriamo ad esempio il caso classico di un lavoro infinitesimo dL (dovuto ad una forza F impressa ad un corpo che si sposta di un tratto infinitesimo ds), così definito nel caso bidimensionale:
dL=Fds=F1dx1+F2dx2.
Vogliamo che questo prodotto scalare tra vettori si conservi rispetto ad un sistema di coordinate qualunque (come in effetti accade nella realtà fisica).
Nota: invece delle classiche coordinate (x,y) abbiamo posto x=xe y=x2, vedremo più avanti il significato degli indici messi in apice e pedice.

Consideriamo quindi una trasformazione di coordinate qualsiasi: trasformiamo ad esempio le coordinate (x1,x2) in quelle di un nuovo sistema (x1,x2) (dove le nuove coordinate sono note in funzione delle prime):
x1=x1(x1,x2)   ;   x2=x2(x1,x2)
ed inoltre esse devono ammettere la trasformazione inversa (affinché si possa passare da un sistema all'altro):
x1=x1(x1,x2)   ;   x2=x2(x1,x2).
Nota: per ipotesi tali funzioni a più variabili sono entrambe differenziabili.

Per le note formule del calcolo differenziale di una funzione si ha:
dx1=(∂x1/∂x1)dx1+(∂x1/∂x2)dx2   e   dx2=(∂x2/∂x1)dx1+(∂x2/∂x2)dx2
possiamo quindi riscrivere il dL=F1dx1+F2dx2 (sostituendo dx1 e dx2):
dL=F1(∂x1/∂x1)dx1+F1(∂x1/∂x2)dx2+F2(∂x2/∂x1)dx1+F2(∂x2/∂x2)dx2.

Se ora raccogliamo rispetto a dx1 e dx2 risulta:
dL=[F1(∂x1/∂x1)+F2(∂x2/∂x1)]dx1+[F1(∂x1/∂x2)+F2(∂x2/∂x2)]dx2
e il dL può essere riscritto nel nuovo sistema di coordinate:
dL=Fds=F1dx1+F2dx2
avendo posto
F1=F1(∂x1/∂x1)+F2(∂x2/∂x1)
F2=F1(∂x1/∂x2)+F2(∂x2/∂x2)
ed essendo per le solite formule differenziali
dx1=(∂x1/∂x1)dx1+(∂x1/∂x2)dx2 
dx2=(∂x2/∂x1)dx1+(∂x2/∂x2)dx2.

Le derivate parziali (∂xi/∂xj) e (xj/∂xi) rappresentano perciò gli elementi, rispettivamente, della matrice di trasformazione A ed A-1 per F e ds (cioè A è la matrice jacobiana di solito indicata con J).
Nota: quindi (F1,F2) si trasforma in modo covariante mentre (dx1,dx2) in modo controvariante come accade per basi e componenti di un vettore.

In definitiva possiamo scrivere per le componenti di F e ds (si sottintende il simbolo di sommatoria con la notazione di Einstein sugli indici ripetuti):
Fj=Fi(∂xi/∂xj)   e   dxj=dxi(xj/∂xi)
(con i, j=1, 2) grazie alle quali il prodotto scalare resta invariato.
(Per chiarimenti su questa derivazione vedi la lezione di Arrigo Amadori "Definizione di tensore").

Perciò la legge generale di trasformazione delle componenti Ai di un vettore, che chiameremo covariante (o covettore) e quelle Bi del rispettivo vettore controvariante, tale per cui il prodotto scalare C=AiBi=AjBj si conservi, è la seguente (come mostrato per Fj e dxj):
Aj=Ai(∂xi/∂xj)   e   Bj=Bi(xj/∂xi)
con la solita regola di sommatoria sugli indici ripetuti (con i, j=1, 2, ... n); per convenzione gli apici indicano le componenti di un vettore mentre i pedici quelle di un covettore.

Ora nel contesto matriciale di un prodotto scalare, le componenti Ai di un vettore riga definiscono un covettore (o vettore covariante) che, applicato a un vettore colonna (o vettore controvariante) di componenti Bi, produce C=AiBi cioè un elemento scalare (del campo K) dallo spazio vettoriale V: l'insieme dei covettori (o funzionali f:V->K) definisce lo spazio duale***.
Nota: ricordiamo che il prodotto scalare tra due vettori A e B viene spesso indicato come <A,B>.

(*) Non sempre coordinate e componenti coincidono, nel caso ad esempio di coordinate curvilinee angolari queste non corrispondono alle componenti di un vettore, essendo quest'ultime delle lunghezze.
(**) Una trasformazione ortogonale viene espressa rispetto ad una base ortonormale (come ad esempio quella canonica degli assi cartesiani), tramite una matrice ortogonale e quindi invertibile.
(***) Data ad esempio la base canonica e1=(1,0)t, e2=(0,1)t (vettori colonna) possiamo definire una base canonica duale come e1=(1,0), e2=(0,1) (vettori riga) che rispetta la condizione generale di dualità <ei,ej>=δij (dove δij è la delta di Kronecker); per un qualsiasi vettore V risulta perciò: V=eivi=ejvj.
(Si pone <ei,ej>=δij affinché risulti correttamente: <A,B>=(eiAi)(ejBj)=AiBi)

giovedì 5 ottobre 2017

Clausius e Carnot: cicli, principî e motori!

Come è noto esistono due formulazioni principali ed equivalenti del Secondo principio della termodinamica (vedi Wikipedia):

I) Clausius (1822-1888): non è possibile che il calore fluisca spontaneamente da temperature più basse a temperature più alte.
Nota: è possibile che il calore fluisca da un corpo freddo ad uno caldo (come in un frigo) ma ciò non può accadere spontaneamente.

II) Kelvin (1824-1907): non è possibile realizzare una macchina termica ciclica che trasformi il calore integralmente in lavoro.
Nota: il calore può trasformarsi integralmente in lavoro (ad esempio in una trasformazione isoterma) ma mai in una trasformazione ciclica.

Ricordiamo che con macchina termica si intende un dispositivo che opera tra due temperature e converte calore in lavoro in modo ciclico, producendo ogni volta una certa quantità di lavoro (vedi Wikipedia).

Inoltre esiste una terza importante formulazione equivalente del secondo principio della termodinamica (che abbiamo già descritto nel post "Entropia: una grandezza anomala!") che afferma:
III) Clausius: in un sistema isolato e per una trasformazione irreversibile l'entropia tende sempre ad aumentare.

In particolare si ricordi che l'entropia S è una funzione che dipende dallo stato termodinamico in cui si trova il sistema; se ad esempio un sistema passa dallo stato A a quello B avremo per la sua variazione di entropia ∆S:
∆S=SB-SA=ABdS
dove dS=δQrev/T è per definizione l'entropia infinitesima e dove Qrev è la quantità di calore assorbito o ceduto in maniera reversibile e isoterma dal sistema a temperatura T.
Nota: per chiarimenti sulla definizione di entropia vedi il post "Entropia: una grandezza anomala!".

Poiché S è una funzione di stato possiamo prendere oltre ad essa, come seconda variabile, la temperatura T del sistema per descrivere una qualsiasi trasformazione reversibile di un gas ideale; utilizzeremo quindi il piano cartesiano T-S di Gibbs (diagramma entropico) invece del noto piano di Clapeyron p-V per tracciare il grafico della trasformazione.
Nota: poiché l'equazione dei gas ideali è pV=nRT fissato il numero di moli n possiamo in generale descrivere il sistema con due sole variabili di stato.

Si noti subito che sul diagramma T-S una trasformazione isoterma (cioè T=costante) è descritta da una linea orizzontale, mentre una adiabatica (cioè Q=0) è rappresentata da una linea verticale (essendo S=costante).

Se ad esempio consideriamo un ciclo formato da due trasformazioni isoterme e due adiabatiche (alternate in sequenza) avremo un motore termico reversibile che trasforma calore in lavoro, meglio noto come ciclo di Carnot, descritto nel piano entropico T-S da una linea rettangolare:


È immediato calcolare il calore assorbito o ceduto reversibilmente nelle due trasformazioni isoterme (posto T2>T1 e S2>S1); avremo rispettivamente seguendo il diagramma (e ricordando che δQrev=TdS):
Qf=S1S2TdS=T2(S2-S1)   e   -Qc=S2S1TdS=T1(S1-S2)
dove per definizione Qf è il calore fornito al sistema mentre -Qc è quello ceduto all'ambiente dal sistema.

Inoltre poiché la variazione di energia interna ∆U è nulla alla fine del ciclo (essendo U una funzione di stato), il lavoro svolto dalla macchina sull'ambiente durante la trasformazione ciclica è -L=Q (essendo per il Primo principio della termodinamica ∆U=L+Q) e quindi si ha:
-L=Qf-Qc=T2(S2-S1)+T1(S1-S2)=(T2-T1)(S2-S1)
essendo per definizione -L il lavoro fatto dal sistema e Q=Qf-Qc il calore totale fornito al sistema.
Nota: si osservi che l'area del rettangolo (T2-T1)(S2-S1) rappresenta proprio il calore Q scambiato durante la trasformazione.

Se ricordiamo che il rendimento di una macchina termica reversibile (o meglio l'efficienza di conversione calore/lavoro) è in generale così definito:
ηrev=-L/Qf=(Qf-Qc)/Qf=1-Qc/Qf
allora inserendo i valori di -Qc e Qf prima ricavati si ha:
1-Qc/Qf=1+T1(S1-S2)/T2(S2-S1)=1-T1/T2
da cui segue un risultato fondamentale del ciclo reversibile di Carnot:
Qf/T2-Qc/T1=0.
Nota: si noti che se T1=T2 segue ηrev=0 cioè senza una differenza di temperatura ∆T non si può ottenere lavoro da una macchina termica.

Al fine di generalizzare questo risultato per qualsiasi ciclo termodinamico, dividiamo in due cicli di Carnot quello precedente, come mostrato in figura:


Nota: nella zona di sovrapposizione delle adiabatiche (nel punto (S1+S2)/2) i contributi di lavoro si elidono, quindi il processo è equivalente a quello visto sopra di una sola macchina di Carnot che lavori tra T1 e T2.

Per estensione se consideriamo un qualsiasi ciclo termodinamico, la curva del diagramma T-S potrà essere approssimata quanto si vuole da un insieme infinito di cicli di Carnot (rappresentati da rettangolini di larghezza infinitesima dS), compresi tra le rispettive temperature dell'estremità superiore Tmax e inferiore Tmin come mostrato in figura:


Perciò, come visto sopra, per ogni rettangolo di larghezza infinitesima dS e altezza compresa tra Tmax e Tmin possiamo scrivere per gli incrementi infinitesimi di calore:
δQf/Tmax-δQc/Tmin=0 
e sommando su tutti gli infiniti rettangoli:
cicloδQrev/T=0
tale relazione è valida per qualsiasi ciclo termodinamico reversibile.
Nota: lo stesso risultato si può ottenere su un diagramma p-V dove però i cicli di Carnot non sono rappresentati da un semplice rettangolo.

Infine per estendere questo risultato notevole anche ai cicli irreversibili, enunciamo un precedente risultato* ottenuto da Carnot** (vedi Wikipedia):
IV) Carnot (1796-1832): il rendimento di una macchina termica irreversibile che lavora tra due temperature, è sempre minore del rendimento ηrev di una macchina equivalente ma reversibile: ηirr<ηrev.
Nota: si dimostra che il rendimento di tutte le macchine reversibili è uguale.

Quindi essendo ηrev=1-Qc/Qf allora a parità di condizioni il calore ceduto -Qc in un ciclo irreversibile, sarà maggiore (in valore assoluto) del caso reversibile (poiché deve risultare ηirr<ηrev).
Ciò significa che per ogni rettangolo infinitesimo del diagramma prima definito, ma per un ciclo irreversibile, si ha:
δQf/Tmax-δQc/Tmin<0 
e perciò in generale per un qualsiasi ciclo irreversibile:
cicloδQirr/T<0.
che è la famosa diseguaglianza di Clausius***.
Nota: per approfondire questa relazione vedi il post "Entropia: una grandezza anomala!".

(*) Questo risultato è stato ottenuto da Carnot nel 1824 cioè prima (per motivi anagrafici) che Clausius e Kelvin enunciassero il secondo principio (da cui però viene solitamente derivato questo teorema!).
(**) Anche questo IV enunciato può essere considerato una formulazione equivalente del secondo principio della termodinamica.
(***) Si può derivare la diseguaglianza di Clausius partendo in modo indifferente da uno qualsiasi degli enunciati I-IV sopra esposti (dato che se ne può dimostrare l'equivalenza).

lunedì 12 giugno 2017

Coriolis e le coordinate Polari!

La definizione di coordinate polari è semplice (vedi Wikipedia):
“In matematica, il sistema di coordinate polari è un sistema di coordinate bidimensionale nel quale ogni punto del piano è identificato da un angolo θ e da una distanza r da un punto fisso O detto polo"; il polo può ad esempio coincidere con il centro di un sistema cartesiano (vedi figura).

Inoltre è importante osservare che "un sistema di coordinate polari (r,θ) è in corrispondenza biunivoca con un sistema di coordinate cartesiane (X,Y), ossia ad un vettore di coordinate cartesiane ne corrisponde uno e uno solo in coordinate polari"; la corrispondenza tra le coordinate dei due sistemi nel primo quadrante (cioè per x>0 e y≥0), è la seguente:
x=rcosθ   e   y=rsinθ
dove r=(x2+y2)1/2 e θ=arctan(y/x) (essendo y/x=tanθ).
Nota: per gli altri valori di x e y si deve correggere la definizione di θ data sopra con il termine  (vedi Wikipedia).

Se le coordinate cartesiane sono ideali per descrivere i moti traslazionali quelle polari si adattano meglio ai moti rotazionali dato che esprimono il moto di un punto nella componente lungo r (che definisce l'allontanamento o l'avvicinamento dall'origine) e nella componente tangente a θ (che invece rappresenta la rotazione attorno all'origine).

Consideriamo ora un sistema cartesiano (X,Y) e facciamo coincidere il punto di origine O con il polo di un sistema di coordinate polari (r,θ) rispetto al quale viene descritto il moto di un punto P, come descritto in figura:


Supponiamo che il punto P sia in moto rispetto al sistema di riferimento polare; indichiamo P con i vettori di posizione P(t) o Pw(t) a seconda che il sistema sia, rispettivamente, in quiete (cioè w=0) oppure in rotazione (w indica appunto la velocità di rotazione angolare del sistema polare).
Nota: per la definizione del vettore di posizione vedi il post "Cos'è il Vettore di Posizione?".

Iniziamo col ricavare le relazioni della velocità e della accelerazione di P in coordinate polari quando w=0; in questo caso possiamo definire il vettore di posizione P(t) come:
P(t)=r(t)er(t)
dove er indica il versore radiale (cioè un vettore unitario con origine in O e direzione lungo r come mostrato in figura); questa relazione, che lega la posizione di P ad ogni istante t, è chiamata legge oraria del moto.
Nota: ricordiamo invece che in coordinate cartesiane (bidimensionali) si ha: P(t)=i(t)x(t)+j(t)y(t) dove i(t) e j(t) sono i relativi versori.

Se quindi vogliamo trovare la velocità v(t) basta derivare P(t) rispetto al tempo e si ottiene:
v(t)=dP(t)/dt=r'er+re'r=r'er+rθ'eθ
poiché si può facilmente mostrare* che e'r=θ'eθ dove eθ indica il versore tangente a θ (e quindi perpendicolare a er)** diretto in verso antiorario.

Si osservi come la velocità v(t) del punto P sia composta in ogni istante da una componente radiale vr=r'er e una angolare vθ=rθ'eθ ad essa perpendicolare (abbiamo omesso per semplicità la variabile t).

Inoltre l'accelerazione a(t) si ottiene a sua volta per derivazione di v(t):
a(t)=dv(t)/dt=r''er+r'e'r+r'eθ+rθ''eθ+rθ'e'θ 
ed essendo e'θ=-θ'er (vedi la nota*) segue raccogliendo i termini:
a(t)=(r''-rθ'2)er+(rθ''+2r'θ')eθ.

Come per la velocità, anche l'accelerazione è composta da una componente radiale ar=(r''-rθ'2)er (dove compare l'accelerazione centripeta -rθ'2er diretta verso l'interno) e una angolare aθ=(rθ''+2r'θ')eθ (con il termine 2r'θ'eθ detto accelerazione di Coriolis, nel caso in cui w=0).

Supponiamo adesso che il sistema di coordinate polari (r,θ) ruoti intorno all'asse Z con velocità angolare w(t) (sempre in riferimento alla figura precedente); indichiamo quindi con (r,θ) il sistema in rotazione con i relativi versori er ed eθ (si noti che r è invariato nei due riferimenti).

In questo caso per derivare il moto di P introduciamo, rispetto al sistema polare in rotazione (r,θ), il vettore di posizione Pw(t) come:
Pw(t)=r(t)er(t).
Oltre alla velocità angolare θ' di Pw(t) dovremo considerare anche la velocità di rotazione w del sistema di riferimento; basterà quindi fare la seguente sostituzione nelle equazioni sopra di v(t) e a(t), per ottenere la velocità vw(t) e l'accelerazione aw(t) rispetto al sistema in rotazione:
θ'=(θ'+w)
risultando θ'=θ' quando w=0 (cioè in assenza di rotazione) e θ'=w quando Pw ruota solidale con la piattaforma (quindi θ'=0).
Nota: la somma dei due vettori θ' e w definisce un terzo vettore posto anch'esso lungo l'asse Z di modulo (θ'+w).

Sostituendo perciò a θ' il valore di (θ'+w) e indicando con er ed eθ i versori del sistema in rotazione, si ottengono direttamente le seguenti relazioni.
Per la velocità:
v(t)=r'er+r(θ'+w)eθ=vw+wreθ
dove vw=dPw/dt=r'er+rθ'eθ è la velocità rispetto al riferimento rotante (essendo Pw=rer), mentre il termine wreθ è chiaramente dovuto alla rotazione angolare w del sistema in moto.
Nota: possiamo anche scrivere, sotto forma di prodotto vettoriale: wreθ=wxPw poiché il vettore wreθ è perpendicolare sia a w che a Pw.

E quindi anche per l'accelerazione avremo per sostituzione:
a(t)=[r''-r(θ'+w)2]er+[r(θ'+w)'+2r'(θ'+w)]eθ
e sviluppando i vari termini nelle parentesi si ha
a(t)=aw+2w(r'eθ-rθ'er)-rw2er+rw'eθ
dove aw=dvw/dt=(r''-rθ'2)er+(rθ''+2r'θ')eθ è l'accelerazione rispetto al riferimento rotante (essendo vw=r'er+rθ'eθ) mentre risulta rw'eθ=0 se la rotazione w del sistema è costante.

Si osservi che essendo vw=r'er+rθ'eθ la velocità rispetto al riferimento rotante, allora il termine (r'eθ-rθ'er) rappresenta un vettore perpendicolare a vw (poiché (r'er+rθ'eθ)x(r'eθ-rθ'er)=0); perciò possiamo anche scrivere: 2w(r'eθ-rθ'er)=2wxvw che è un vettore perpendicolare a w e vw.
Nota: inoltre il vettore (r'eθ-rθ'er), a causa della componente lungo eθ, ha la stessa direzione della rotazione w.

Determiniamo ora quali sono le forze a cui è sottoposta una massa m rispetto al riferimento in rotazione con velocità costante w; avremo, secondo la legge di Newton applicata (in modo improprio) ad un sistema non inerziale (perché così introduciamo delle forze che non sono reali):
Fw=maw=ma-2mw(r'eθ-rθ'er)+mrw2er
dove il secondo termine rappresenta la cosiddetta forza di Coriolis (il meno indica la direzione contraria alla rotazione w, vedi la nota sopra) mentre il terzo termine è la forza centrifuga (positiva perché diretta verso l'esterno).

Entrambe queste forze sono dette apparenti, cioè non generate dalla reale interazione con altri corpi, perché dovute esclusivamente alla rotazione w del sistema di riferimento (infatti esse si annullano per w=0), mentre solo F=ma è la forza reale applicata a P (in entrambi i riferimenti)***.
Nota: per chiarimenti sulle forze apparenti vedi il post "Una forza del tutto... apparente!".
(Qui puoi vedere un video del MIT che mostra in pratica l'effetto Coriolis!)

(*) Consideriamo la variazione infinitesima er=er(t+t)-er(t)=ereθ (risulta ereθ poiché er unisce le punte dei due vettori differenza ed è diretto come eθ, vedi la nota**) da cui e'r=limer/∆t=lim(∆er/∆t)eθ=θ'eθ. Analogamente si ricava che e'θ=limeθ/∆t=lim(-∆eθ/∆t)er=-θ'er (il meno è dovuto alla rotazione antioraria di θ(t) e indica il verso opposto a er).
(**) In generale per un versore u si ha uxu=1 (prodotto scalare) e quindi derivando d(uxu)/dt=u'xu+uxu'=2u'xu=0 ciò implica che u' è sempre perpendicolare a u (e ciò vale anche per er e eθ).
(***) Se P ruota solidale con la piattaforma allora r'=0 e θ'=0 (e quindi w=θ') perciò si ha Fw=ma+mrw2er=0 essendo a=-rθ'2er l'accelerazione centipreta (vedi sopra): quindi nel sistema in rotazione dove P è in quiete, la forza centripeta viene bilanciata dalla forza apparente centrifuga.
(Vedi anche il post "Un forza del tutto... apparente!")