lunedì 1 ottobre 2018

Il Principio di minima Azione!

Introduciamo questo post dicendo subito che (vedi Wikipedia):
"In fisica il principio di minima azione è un principio variazionale che stabilisce che nei fenomeni della natura l'azione viene sempre minimizzata. A partire da questo principio si determina l'equazione del moto di un sistema dinamico".

In particolare il principio variazionale di minima azione si definisce con il calcolo delle variazioni: "un campo dell'analisi matematica che si occupa della ricerca dei punti estremali (massimi e minimi) dei cosiddetti funzionali, ovvero funzioni il cui dominio è a sua volta un insieme di funzioni" (vedi Wikipedia).

Consideriamo ad esempio il moto di una particella con legge oraria q(t) (e quindi velocità q'(t)=dq(t)/dt) e definiamo una ipotetica funzione L(q,q') che sia funzione della coordinata q e della velocità q' (consideriamo per semplicità il caso monodimensionale con una solo coordinata).
Nota: q sta a indicare una coordinata generale, non necessariamente cartesiana.

Per definire l'equazione del moto (in cui compare L(q,q') detta lagrangiana* del sistema) introduciamo ora un'altra funzione S(q(t)) chiamata Azione (in realtà è un funzionale essendo una funzione di funzione):
S(q(t))=∫t1t2L(q,q')dt
che perciò dipende dal percorso q(t) compiuto dalla particella, una volta fissati il punto iniziale q(t1) e finale q(t2).
Nota: esistono infiniti percorsi tra q(t1) e q(t2) su cui calcolare S(q(t)) che perciò varia con continuità in funzione del percorso.

Facciamo quindi l'ipotesi fondamentale, secondo cui l'equazione del moto della particella si può ottenere ponendo la seguente condizione su S:
δS(q)=0
condizione del tutto analoga a porre nullo il differenziale dF di una funzione F (a un solo valore) per trovare i punti estremali (massimo, minimo o sella): si cerca cioè quale sia, tra tutti quelli possibili, il percorso che rende minimo l'integrale S(q) fissati i punti iniziale e finale.
Nota: si parla di Principio di minima azione poiché nel caso del moto meccanico la condizione δS=0 individua proprio un minimo per l'azione S.

Tale condizione si traduce quindi nella seguente equazione:
δS(q)=δt1t2L(q,q')dt=t1t2δL(q,q')dt=0
dove
δL(q,q')=(∂L/∂q)δq+(∂L/∂q')δq'
è l'analogo del differenziale di una funzione F(x,y) a due variabili (si ricordi infatti che dF(x,y)=(∂F/∂x)dx+(∂F/∂y)dy); inoltre δq'=dδq/dt.

Prima di sviluppare l'integrale è utile derivare, rispetto al tempo, il termine (∂L/∂q')δq:
d(∂L/∂q')δq/dt=δqd(∂L/∂q')/dt+(∂L/∂q')δq'
da cui si può ricavare facilmente (∂L/∂q')δq' (che compare nel δL):
(∂L/∂q')δq'=d(∂L/∂q')δq/dt-δqd(∂L/∂q')/dt.

Possiamo ora inserire nell'integrale del δS il valore del δL (con il (∂L/∂q')δq' appena ricavato); si ottiene perciò:
δS(q)=∫t1t2δL(q,q')dt=t1t2[(∂L/∂q)δq+(∂L/∂q')δq']dt=
=∫t1t2(∂L/∂q)δqdt+t1t2[d(∂L/∂q')δq/dt]dt-t1t2[δqd(∂L/∂q')/dt]dt.

Si osservi che il secondo termine a destra dell'equazione è nullo risultando:
t1t2[d(∂L/∂q')δq/dt]dt=[(∂L/∂q')δq]t1t2=0
avendo posto come condizione al contorno: δq(t1)=δq(t2)=0 (dato che i punti iniziale e finale del percorso non variano).

Perciò se vogliamo che il δS sia nullo dovremo porre (raccogliendo δqdt dal primo e terzo termine):
δS(q)=t1t2[(∂L/∂q)-d(∂L/∂q')/dt]δqdt=0
ciò significa che il termine sotto integrale deve essere nullo (essendo δq≠0):
∂L/∂q-d(∂L/∂q')/dt=0
e questa è proprio l'equazione (detta di Eulero-Lagrange) che L(q,q') deve soddisfare per il Principio di minima azione**.

Ma a questo punto resta una domanda fondamentale, come è fatta la lagrangiana L(q,q') di un sistema dinamico qualsiasi?

Ebbene ogni sistema fisico ha la sua lagrangiana***, ad esempio nel caso di sistemi meccanici si pone (come ipotesi da verificare sperimentalmente):
L(q,q')=T(q')-V(q)
dove T(q') è l'energia cinetica del sistema (che dipende dalla velocità q') e V(q) è l'energia potenziale (che dipende dalla posizione q).
In particolare si ricordi che per una particella di massa m risulta:
T(q')=mq'2/2   e   -∂V(q)/∂q=F(q) 
dove F(q) è la forza a cui è sottoposta la particella lungo il percorso.

È facile mostrare che tale equazione è equivalente a quella del moto di Newton F=mq''. Basta infatti inserire L=T-V nell'equazione di Eulero-Lagrange (si ricordi che T dipende solo da q' mentre V dipende da q):
∂L/∂q-d(∂L/∂q')/dt=-∂V/∂q-d(∂T/∂q')/dt=F-mq''=0.
dove q'' è l'accelerazione impressa alla particella dalla forza F (cvd).
(Per approfondimenti vedi il seminario sul Principio di minima azione di Arrigo Amadori)

(*) L'introduzione della funzione L(q,q') è dovuta a Lagrange ed è apparsa nel suo libro "Méchanique Analitique" nel 1788 scritto proprio con lo scopo di ridurre la teoria meccanica ad operazioni algebriche, senza ragionamenti geometrici o meccanici (in effetti il libro non contiene figure).
(**) Il Principio di minima azione è un principio locale (essendo espresso da una equazione differenziale) e quindi la scelta del percorso viene definita puntualmente, istante per istante, senza nessun tipo di finalismo.
(***) Tutte le leggi fondamentali della fisica possono essere scritte nei termini di una lagrangiana. In particolare L=(g)1/2(R-(1/2)FµvFµv-ψ*Dψ) descrive un sistema dinamico di particelle come elettroni e quark, soggette a gravità, campi elettromagnetici e forze nucleari.

mercoledì 23 maggio 2018

Trasformazioni di basi, vettori e... co-vettori!

Come avevamo già osservato nel post "Cos'è il Vettore di Posizione?" la definizione di vettore non dipende dal sistema di coordinate prescelto e quindi, se vogliamo trasformare le coordinate rispetto alle quali quel vettore è definito, saranno le sue componenti a variare* in modo che il vettore resti invariato (in modulo e direzione).

È noto che un qualsiasi vettore V può essere descritto come la combinazione lineare delle sue componenti vi moltiplicate per le rispettive basi vettoriali ei (cioè l'insieme dei vettori che generano lo spazio vettoriale); ad esempio nel caso più semplice di uno spazio bidimensionale avremo:
V=v1e1+v2e2.
Nota: vedremo più avanti il significato fisico degli indici in apice e pedice, per ora indicano le due diverse basi e rispettive componenti (attenzione: gli apici non indicano elevamenti di potenza!).

Nel caso perciò di una trasformazione di coordinate si avrà un cambio di basi ei (indicate dal trattino sotto) a cui corrisponde una variazione delle rispettive componenti vi (anch'esse indicate dal trattino) cioè:
V=v1e1+v2e2.

Se usiamo il formalismo matriciale, possiamo indicare le componenti di V come una matrice colonna, mentre le basi sono rappresentate da una matrice riga; moltiplicandole tra loro si ottiene (per l'invarianza di V):
Nota: ricordiamo che il prodotto tra due matrici tipo (m,n)x(n,p) produce una matrice (m,p) sviluppando il prodotto righe per colonne.

Supponiamo ora che le basi di V si trasformino secondo una generica matrice di trasformazione A (matrice quadrata (2x2) e invertibile in A-1):
allora affinché si ottengano di nuovo le equazioni di V sopra espresse, dovrà risultare per la trasformazione delle componenti:
Infatti moltiplicando tra loro (membro a membro) le due ultime equazioni, si ottiene di nuovo l'identità V=V (essendo AxA-1=I dove I è la matrice identità).
Nota: abbiamo implicitamente supposto, con l'introduzione della matrice di trasformazione A, una relazione lineare tra le basi.

Dato il ruolo diretto della matrice A si dice che le basi vettoriali di V si trasformano in modo covariante, mentre le sue componenti, che viceversa dipendono dalla sua inversa A-1, si trasformano in modo controvariante.

Tuttavia se la matrice A di trasformazione è ortogonale (come nel caso di una rotazione di assi cartesiani ortogonali)** allora per definizione vale la relazione A-1=At (dove At è la matrice trasposta) da cui segue, facendo la trasposta di tutta la precedente equazione:
Nota: ricordiamo che la trasposta di un vettore colonna è un vettore riga (e viceversa); inoltre risulta (At)t =A.

Ciò significa che questa ultima espressione è formalmente identica alla trasformazione covariante delle basi, e quindi (in questo caso) la distinzione tra trasformazione covariante e controvariante decade; inoltre se la trasformazione è ortogonale si conserva il prodotto scalare tra vettori.
Nota: è per tale motivo che nella fisica classica non si parla quasi mai dei due tipi di trasformazione, è sufficiente quella covariante.

Tuttavia nel caso più generale di una trasfomazione di coordinate qualunque (non ortogonale) ci chiediamo: come si trasformano le componenti di un vettore affinché questo resti invariato e il prodotto scalare si conservi?
Nota: per quanto visto sopra ciò equivale a chiedersi com'è fatta in generale la matrice di trasformazione A e la sua inversa A-1.

Consideriamo ad esempio il caso classico di un lavoro infinitesimo dL (dovuto ad una forza F impressa ad un corpo che si sposta di un tratto infinitesimo ds), così definito nel caso bidimensionale:
dL=Fds=F1dx1+F2dx2.
Vogliamo che questo prodotto scalare tra vettori si conservi rispetto ad un sistema di coordinate qualunque (come in effetti accade nella realtà fisica).
Nota: invece delle classiche coordinate (x,y) abbiamo posto x=xe y=x2, vedremo più avanti il significato degli indici messi in apice o pedice.

Consideriamo quindi una trasformazione di coordinate qualsiasi: trasformiamo ad esempio le coordinate (x1,x2) in quelle di un nuovo sistema (x1,x2) (dove le nuove coordinate sono note in funzione delle prime):
x1=x1(x1,x2)   ;   x2=x2(x1,x2)
ed inoltre esse devono ammettere la trasformazione inversa (affinché si possa passare da un sistema all'altro):
x1=x1(x1,x2)   ;   x2=x2(x1,x2).
Nota: per ipotesi tali funzioni a più variabili sono entrambe differenziabili.

Per le note formule del calcolo differenziale di una funzione si ha:
dx1=(∂x1/∂x1)dx1+(∂x1/∂x2)dx2   e   dx2=(∂x2/∂x1)dx1+(∂x2/∂x2)dx2
possiamo quindi riscrivere il dL=F1dx1+F2dx2 (sostituendo dx1 e dx2):
dL=F1(∂x1/∂x1)dx1+F1(∂x1/∂x2)dx2+F2(∂x2/∂x1)dx1+F2(∂x2/∂x2)dx2.

Se ora raccogliamo rispetto a dx1 e dx2 risulta:
dL=[F1(∂x1/∂x1)+F2(∂x2/∂x1)]dx1+[F1(∂x1/∂x2)+F2(∂x2/∂x2)]dx2
e il dL può essere riscritto nel nuovo sistema di coordinate:
dL=Fds=F1dx1+F2dx2
avendo posto
F1=F1(∂x1/∂x1)+F2(∂x2/∂x1)
F2=F1(∂x1/∂x2)+F2(∂x2/∂x2)
ed essendo per le solite formule differenziali
dx1=(∂x1/∂x1)dx1+(∂x1/∂x2)dx2 
dx2=(∂x2/∂x1)dx1+(∂x2/∂x2)dx2.
Le derivate parziali (∂xi/∂xj) e (xj/∂xi) rappresentano perciò gli elementi, rispettivamente, della matrice di trasformazione A ed A-1 per F e ds.
Nota: quindi (F1,F2) si trasforma in modo covariante mentre (dx1,dx2) in modo controvariante e lo stesso vale per basi e componenti di un vettore.

In definitiva possiamo scrivere per le componenti di F e ds (con la notazione di Einstein sugli indici ripetuti che sottintende il simbolo di sommatoria):
Fj=Fi(∂xi/∂xj)   e   dxj=dxi(xj/∂xi)
(con i, j=1, 2) grazie alle quali il prodotto scalare resta invariato.
Nota: per chiarimenti su questa derivazione vedi anche la lezione di Arrigo Amadori "Definizione di tensore".

Perciò la legge generale di trasformazione delle componenti Ai di un vettore, che chiameremo covariante (o covettore) e quelle Bi del rispettivo vettore controvariante, tale per cui il prodotto scalare C=AiBi=AjBj si conservi, è la seguente (come mostrato per Fj e dxj):
Aj=Ai(∂xi/∂xj)   e   Bj=Bi(xj/∂xi)
con la solita regola di sommatoria sugli indici ripetuti (con i, j=1, 2, ... n).
Nota: per convenzione gli apici indicano le componenti di un vettore mentre i pedici quelle di un covettore.

Ora nel contesto matriciale di un prodotto scalare, le componenti Ai di un vettore riga definiscono un covettore (o vettore covariante) che, applicato a un vettore colonna (o vettore controvariante) di componenti Bi, produce C=AiBi cioè un elemento scalare (del campo K) dallo spazio vettoriale V: l'insieme dei covettori (o funzionali f:V->K) definisce lo spazio duale***.
Nota: ricordiamo che il prodotto scalare tra due vettori A e B viene spesso indicato come <A,B>.

(*) Non sempre coordinate e componenti coincidono, nel caso ad esempio di coordinate curvilinee angolari queste non corrispondono alle componenti di un vettore, essendo quest'ultime delle lunghezze.
(**) Una trasformazione ortogonale viene espressa rispetto ad una base ortonormale (come ad esempio quella canonica degli assi cartesiani), tramite una matrice ortogonale e quindi invertibile.
(***) Data ad esempio la base canonica e1=(1,0)t, e2=(0,1)t (vettori colonna) possiamo definire una base canonica duale come e1=(1,0), e2=(0,1) (vettori riga) che rispetta la condizione generale di dualità <ei,ej>=δij (dove δij è la delta di Kronecker); per un qualsiasi vettore V risulta perciò: V=eivi=ejvj.
(Si pone <ei,ej>=δij affinché risulti correttamente: <A,B>=(eiAi)(ejBj)=AiBi)