martedì 8 luglio 2025

E adesso... musica (con il circolo delle quinte)!

È noto che secondo il temperamento equabile una ottava musicale (cioè un intervallo di frequenza con rapporto 2:1) è suddivisa in 12 intervalli uguali (semitoni), dove ogni singola nota si ottiene a partire da una frequenza stabilita, moltiplicata per un coefficiente pari a 21/12 che definisce appunto un semitono (cioè l'intervallo di frequenza più piccolo tra due note).

Se ad esempio prendiamo la frequenza f1=261,6 Hz (come quella assegnata al Do centrale del pianoforte) e la moltiplichiamo dodici volte per 21/12, otterremo in sequenza la frequenza di tutte le note di quella ottava:
Do, Do#, Re, Re#, Mi, Fa, Fa#, Sol, Sol#, La, La#, Si, Do2
e in particolare la frequenza f2 del secondo Do2 sarà pari a
f2=(21/12)12f1=2f1 
cioè esattamante il doppio della frequenza fissata f1 come richiesto.

Ricordiamo che l'alterazione # (diesis) o b (bemolle) indica rispettivamente l'aumento o la diminuzione della nota di un semitono e che ad esempio le seguenti notazioni indicano la stessa identica nota (frequenza):
Do#=Reb - Re#=Mib - Fa#=Solb - Sol#=Lab - La#=Sib
Nota: questa è una caratteristica particolare del temperamento equabile.

È altresì noto che una scala maggiore viene costruita, a partire da una nota di riferimento, con questo schema canonico:
T-T-S-T-T-T-S
dove T indica l'intervallo di un tono (cioè 2 semitoni) mentre S indica un semitono. Ad esempio se vogliamo costruire la scala di Do avremo:
Do-Re-Mi-Fa-Sol-La-Si-Do
ricordando che tra Mi e Fa c'è un semitono come pure tra Si e Do perciò lo schema è rispettato (gli altri intervalli sono di un tono).

Con questo schema possiamo costruire tutte le scale maggiori (utilizzando le 7 note canoniche con le relative alterazioni*) dove però sostituiremo quelle con eventuali doppi diesis con le scale equivalenti** in bemolle:
1) Scala di DoDo-Re-Mi-Fa-Sol-La-Si-Do
2) Scala di Do#: Do#-Re#-Mi#-Fa#-Sol#-La#-Si#-Do#
3) Scala di Re: Re-Mi-Fa#-Sol-La-Si-Do#-Re
4) Scala di Mib: Mib-Fa-Sol-Lab-Sib-Do-Re-Mib
(Scartiamo la scala di Re#: Re#-Mi#-Fa##-Sol#-La#-Si#-Do##-Re#)
5) Scala di Mi: Mi-Fa#-Sol#-La-Si-Do#-Re#-Mi
6) Scala di Fa: Fa-Sol-La-Sib-Do-Re-Mi-Fa
7) Scala di Fa#: Fa#-Sol#-La#-Si-Do#-Re#-Mi#-Fa#
8) Scala di Sol: Sol-La-Si-Do-Re-Mi-Fa#-Sol
9) Scala di Lab: Lab-Sib-Do-Reb-Mib-Fa-Sol-Lab
(Scartiamo la scala di Sol#: Sol#-La#-Si##-Do#-Re#-Mi#-Fa##-Sol#)
10) Scala di La: La-Si-Do#-Re-Mi-Fa#-Sol#-La
11) Scala di Sib: Sib-Do-Re-Mib-Fa-Sol-La-Sib
(Scartiamo la scala di La#: La#-Si#-Do##-Re#-Mi#-Fa#-Sol##-La#) 
12) Scala di Si: Si-Do#-Re#-Mi-Fa#-Sol#-La#-Si
Nota
: le scale di Mib/Re#, Lab/Sol# e Sib/La# indicano gli stessi suoni (frequenze), ma quelle in bemolle non hanno doppi # come richiesto.

Si osservi inoltre che le scale di Do#, Fa# e Si nel temperamento equabile hanno gli stessi suoni (frequenze) delle seguenti scale, rispettivamente:
Scala di Reb: Reb-Mib-Fa-Solb-Lab-Sib-Do-Reb (alias scala di Do#)
Scala di Solb: Solb-Lab-Sib-Dob-Reb-Mib-Fa-Solb (alias scala di Fa#)
Scala di Dob: Dob-Reb-Mib-Fab-Solb-Lab-Sib-Dob (alias scala di Si)
Nota: questa osservazione sarà utile per completare il nostro schema di simmetria tra le scale maggiori, come vedremo.

Prima di concludere ricordiamo che con intervallo di quinta si intende un intervallo tra una nota e l'altra pari a 7 semitoni, ad esempio tra Do e Sol o tra Sol e Re c'è un intervallo di quinta giusta (in pratica basta contare 5 note in sequenza come ad esempio Do-Re-Mi-Fa-Sol).
Nota: solo quando tra la prima e la quinta nota ci sono 7 semitoni la quinta è giusta: ad es. l'intervallo Si-Fa ha solo 6 semitoni e la quinta è diminuita.

Ora riepiloghiamo le scale con il numero delle loro alterazioni riportando solo la nota che dà il nome alla scala maggiore con il numero di alterazioni tra parentesi, ad esempio avremo Re(2#) per la scala di Re maggiore.

Raccogliamo quindi nella prima riga le scale con i diesis e poi sotto quelle con i bemolle, sempre in ordine crescente:
Do - Sol(1#) - Re(2#) - La(3#) - Mi(4#) - Si(5#) - Fa#(6#) - Do#(7#)
Do - Fa(1b) - Sib(2b) - Mib(3b) - Lab(4b) - Reb(5b) - Solb(6b) - Dob(7b)

È immediato osservare che la prima riga indica le scale ascendenti per quinte passando da Do a Sol, da Sol a Re etc. mentre la seconda riga indica le scale discendenti per quinte passando da Dob a Solb, da Solb a Reb etc. Ebbene questo schema viene indicato come Circolo delle quinte ed è bene illustrato nella seguente figura***:



Ma in breve a cosa serve il circolo delle quinte?
Scopo didattico: è un ottimo strumento mnemonico per ricordare le alterazioni in chiave e visualizzare le relazioni armoniche tra le scale.
Modulazioni armoniche: è una mappa naturale dei cambi di tonalità, infatti modulazioni verso tonalità adiacenti suonano più naturali.
Relazioni tra tonalità: dalla tonica di un accordo si può ad esempio passare alla dominante (quinta sopra) o alla sottodominante (quinta sotto).

Ma soprattutto mette ben in evidenza una perfetta simmetria tra le scale insita nel temperamento equabile, cosa che ad esempio nel temperamento pitagorico o mesotonico era invece imperfetta e asimmetrica, rendendo inoltre anche visivamente l'importanza degli intervalli di quinta.

(*) In ogni scala devono sempre comparire tutte le 7 note canoniche Do, Re, Mi, Fa, Sol, La, Si con le eventuali alterazioni (diesis o bemolle).
(**) Due scale maggiori si dicono equivalenti quando contengono la stessa successione di note (frequenze) anche se la notazione è differente, ad esempio le note: Re#=Mib#, Mi#=Fa, etc. nelle scale Re#/Mib.
(***) In figura compaiono anche le scale minori, che si ottengono dalla sesta nota della corrispondente scala maggiore: ad esempio dal La (sesta nota delle scala di Do maggiore) si ottiene la scala di La minore: La-Si-Do-Re-Mi-Fa-Sol-La. Ciò accade perché se prendiamo lo schema ripetuto della scala maggiore: T-T-S-T-T-T-S  T-T-S-T-T-T-S si ottiene, a partire dal sesto intervallo, lo schema canonico della scala minore: T-S-T-T-S-T-T.

martedì 27 maggio 2025

Come si dimostra (in generale) la relazione E=mc^2

Nel 1905 Albert Einstein pubblicò un articolo fondamentale dal titolo "L'inerzia di un corpo dipende dal suo contenuto di energia?", in cui per la prima volta introdusse esplicitamente la relazione:
E=m0c2.
Questa equazione afferma che la massa inerziale m0 di un corpo a riposo è equivalente ad un'energia E ad esso associata, con la costante c (velocità della luce nel vuoto) che agisce come fattore di conversione.
Nota: si veda anche il post "Una 'deduzione elementare': E=mc^2" per una derivazione alternativa proposta in seguito da Einstein.

Nell'articolo Einstein fa riferimento ad una formula, derivata nel suo primo articolo sulla relatività, che definisce l'energia L′ di un raggio luminoso in un sistema in moto S', rispetto all’energia L nel sistema in quiete S:
L′=L(1−vcos⁡θ/c)/(1−v2/c2)1/2
dove v è la velocità relativa tra i due riferimenti*, mentre θ è l’angolo tra la direzione del raggio di luce e la direzione del moto di S'.
Nota: nel suo articolo sulla relatività Einstein osserva che l'energia L si trasforma come la frequenza f dell'onda, quindi L÷hf dove h è un costante (relazione già ipotizzata da Einstein con h costante di Planck).

Osserviamo subito che per piccole velocità v risulta:
L′≈L(1−vcos⁡θ/c)(1+v2/2c2)
essendo con buona approssimazione 1/(1−v2/c2)1/2(1+v2/2c2) per v<<c.

Consideriamo quindi l'esperimento mentale che fece Einstein nel suo articolo. Supponiamo che un corpo in quiete emetta simultaneamente due raggi luminosi in direzioni opposte di energia L/2, e poi valutiamo il punto di vista di un osservatore in moto con velocità v.
Nota: per semplicità sia i raggi di luce che l'osservatore si muovono lungo X quindi risulterà per i raggi θ=0° e θ=180° rispettivamente, cioè cos⁡θ=±1.

Sistema in quiete S
Secondo il sistema in quiete S il corpo ha energia E0 prima dell'emissione.
Invece dopo l'emissione dei raggi di luce entrambi di energia L/2 il corpo avrà energia E1=E0-L poiché avrà perso una energia pari a L=L/2+L/2.

Sistema in moto S'
Secondo il sistema in moto S' il corpo ha energia H0 prima dell'emissione (che sarà diversa da E0 poiché il corpo ora si trova in moto).
Mentre dopo l'emissione dei raggi di luce di energia totale ∆L'=L'+/2+L'-/2 (dove i pedici + e - indicano le due direzioni opposte lungo l'asse X) il corpo avrà una energia pari a H1=H0-L'.

Calcoliamo quindi quanto vale l'energia L' emessa dal corpo in moto (nell'approssimazione delle basse velocità come visto sopra)**:
∆L'(L/2)(1−v/c)(1+v2/2c2)+(L/2)(1+v/c)(1+v2/2c2)=L(1+v2/2c2).

Se ora scriviamo l'energia cinetica del corpo quando è in moto rispetto a S':
a) prima dell'emissione dei raggi: K0=H0-E0
b) dopo dell'emissione dei raggi: K1=H1-E1
la variazione di energia cinetica ∆K dovuta alla emissione dei raggi di luce è:
∆K=K1-K0=(H1-E1)-(H0-E0)
e quindi ricordando che H1-H0=-L' e che -E1+E0=L si ha (per v<<c):
∆K=L-L'L-L(1+v2/2c2)=-(1/2)L(v2/c2).
Nota: è implicito che in tutti questi passaggi si è fatto uso del principio di conservazione dell'energia.
 
Poiché è noto che l'energia cinetica di un corpo in movimento in generale è pari a (1/2)m0v2 (per basse velocità) risulta:
∆K(1/2)m0v2-(1/2)L(v2/c2)
e quindi l'energia L emessa dal corpo implica una perdita di massa -∆m0 e (per v che tende a 0) risulta esattamente:
-∆m0=L/c2
in modo che la conservazione dell'energia venga rispettata.

A questo punto Einstein fa la seguente definitiva osservazione:
"Da questa equazione segue che: se un corpo emette energia L sotto forma di radiazione, allora la sua massa diminuisce di L/c2. Il fatto che l'energia estratta dal corpo divenga energia di radiazione non cambia evidentemente le cose, ragion per cui siamo condotti alla conclusione più generale secondo cui: la massa di un corpo è una misura del suo contenuto di energia."

Tuttavia, in seguito si è osservato che questa dimostrazione non è del tutto generale, poiché è stata dedotta da un caso particolare, quello di un corpo isolato che emette una radiazione elettromagnetica simmetrica.
Essa non tiene conto di sistemi fisici più complessi, con energia interna, campi, tensioni o distribuzioni non simmetriche: perciò la relazione E=m0c2 viene inferita da un caso particolare, e non è derivata dai principi generali della relatività ristretta, come invece mostreremo in breve.

In effetti solo usando il formalismo della relatività speciale si può introdurre il quadrivettore energia-impulso Pµ:
Pµ=(E/c,p)
dove E/c è l’energia totale divisa per c (componente temporale), mentre p è il vettore quantità di moto totale del sistema (componente spaziale).

Se ora calcoliamo il quadrato invariante di Pµ cioè PµPµ si può introdurre la massa invariante m0 del sistema ponendo PµPµ=m02c2 e quindi:
PµPµ=(E/c)2-p2=m02c2
da cui nel riferimento del centro di massa (dove p=0), si ottiene
E=m0c2
che rappresenta la forma generale, covariante e valida per ogni sistema dell’equivalenza massa-energia: questa relazione è perciò una conseguenza necessaria della struttura formale della relatività speciale***.
Nota: si veda anche il post "Derivare la Massa Relativistica" dove è stata ottenuta la relazione E2-p2c2=m02c4 a partire da principi relativistici.

(*) Si osservi che questo effetto viene definito effetto Doppler relativistico mentre nel caso classico l'effetto Doppler è riferito solo alla frequenza f dell'onda dove risulta: f′=f(1−vcos⁡θ/c). Tuttavia se supponiamo la relazione L=hfL'=hf' (dove h è la costante di Planck) si ha L′=L(1−vcos⁡θ/c).
(**) Secondo l'effetto Doppler classico non ci sarebbero variazioni per l'osservatore in moto risultando: ∆L'=(L/2)(1−v/c)+(L/2)(1+v/c)=L. Solo nel caso relativistico risulta: ∆L'L(1+v2/2c2) (punto chiave dell'articolo).
(***) Una dimostrazione ancora più generale fa uso del tensore energia-impulso che è definibile anche in relatività generale.

sabato 23 novembre 2024

Il gatto di Schrödinger è... vivo e morto?!

Il paradosso del gatto di Schrödinger è ben descritto su Wikipedia e lo riassumeremo di seguito, ma quello che ci interessa mostrare qui è che non è corretto affermare che il gatto si trova in una sovrapposizione di stati (vivo e morto) come spesso si sente affermare da alcuni divulgatori.

In breve, il sistema è composto da un gatto chiuso in una scatola insieme a un atomo radioattivo: l'atomo può essere integro o decaduto e quindi il gatto può essere vivo o morto con una probabilità del 50% (posto un intervallo pari al tempo di dimezzamento dell'atomo*); fino a quando non viene eseguita una misurazione, lo stato del sistema rimane indeterminato.
Nota: si suppone che quando l'atomo decade mandi in frantumi una provetta piena di gas velenoso che sia letale per il povero gatto.

Ora per descrivere lo stato del sistema così definito:
|gatto vivo, atomo integro>   oppure   |gatto morto, atomo decaduto>
possiamo introdurre per semplicità la simbologia già utilizzata per descrivere formalmente un sistema composto da due elettroni con spin uguali ed opposti (vedi il post "Stati misti, intrecciati e... il gatto!").

Perciò, nel nostro caso, porremo questi due stati (u è up e d è down):
lo stato |ud> indica: |gatto vivo, atomo integro>
mentre lo stato |du> indica: |gatto morto, atomo decaduto>
quindi lo stato del sistema completo in sovrapposizione quantistica è così definito:
Ψ=(1/2)1/2|ud>+(1/2)1/2|du>
dove il fattore (1/2)1/2 elevato al quadrato definisce la probabilità del 50% che si misuri uno dei due stati |ud> oppure |du>.

Si osservi quindi che la sovrapposizione tra lo stato |ud> e quello |du> riguarda l'intero sistema e non esclusivamente il gatto oppure l'atomo radioattivo presi sigolarmente; ciò in particolare significa che questo stato:
ΨG=(1/2)1/2|u>+(1/2)1/2|d>
relativo al gatto vivo e morto (oppure all'atomo integro e decaduto) non è previsto dal formalismo e, come vedremo di seguito, fa una bella differenza.

Analizziamo quindi lo stato completo del sistema introducendo la matrice di densità ρ (per i dettagli vedi il post "Stati misti, intrecciati e... il gatto!"):
ρ=|Ψ><Ψ|=(1/2)(|ud>+|du>)(<ud|+<du|)
 per cui svolgendo il prodotto si ottiene:
ρ=(1/2)(|ud><ud|+|ud><du|+|du><ud|+|du><du|)
e quindi posto |u>=(1,0)T e |d>=(0,1)T (dove T indica la riga trasposta) e svolgendo i prodotti sopra definiti, si ottiene la matrice [4x4]:

Ora si osservi che risultando ρ=ρ2 lo stato gatto-atomo definisce un stato puro che è quello definito da Ψ=(1/2)1/2|ud>+(1/2)1/2|du> (invece quando lo stato è misto significa che c'è incertezza statistica tra diversi stati puri).
Nota: per chiarimenti vedi il post "Stati misti, intrecciati e... il gatto!".

Tuttavia la matrice densità ρ rappresenta il sistema completo, mentre noi vogliamo misurare lo stato del sottositema gatto (o quello dell'atomo); inoltre si osservi che la misura dello stato di uno determina subito lo stato dell'altro facendo collassare lo stato del gatto-atomo in sovrapposizione.
Nota: lo stato gatto-atomo è detto entanglement proprio perché esiste questa correlazione quantisitica istantanea tra i due sottositemi.

Quindi per determinare lo stato del sottositema gatto (come già spiegato in un precedente post), dobbiamo calcolare la matrice ridotta ρG (partendo dalla matrice densità ρ), che nel caso dello stato del gatto risulta:
ρG=1/2(|u><u|+|d><d|)=1/2(1,0)T(1,0)+1/2(0,1)T(0,1)=(1/2)I2
dove con I2 abbiamo indicato la matrice identità [2x2].
Nota: si osservi che i termini fuori diagonale di ρG, responsabili delle interferenze quantistiche, sono nulli.

Poiché risulta ρGρG2 (essendo I=I2) siamo in presenza di uno stato misto e ciò significa che gli stati possibili del gatto non sono in sovrapposizione quantistica, l'incertezza è in realtà dovuta alla incompleta conoscenza dello stato del sistema gatto-atomo (poiché in effetti ρG considera solo il sottositema gatto) e la probabilità statistica classica che il sottositema gatto sia up (cioè vivo) oppure down (morto) è pari a 1/2.

In definitiva il gatto non è mai in sovrapposizione con se stesso ma è in correlazione quantistica col resto del sistema (entanglement); inoltre la probabilità del 50% di trovarlo vivo o morto è di tipo statistico classico**.

In realtà il vero paradosso è che
a differenza della meccanica classica, nel caso quantistico non si può stabilire (nemmeno in linea di principio) quale sia esattamente lo stato del sottosistema gatto (o del sottosistema atomo) prima che venga effettuata la misura***.
Nota: in realtà il gatto è un sistema macroscopico classico che qui si comporta come un apparato di misura, quindi il suo stato cambia anche senza aprire la scatola e misurare il suo stato (ma non sappiamo quale sia).

(*) Il decadimento di N atomi radioattivi segue la legge dN(t)/dt=-kN(t) da cui N(t)=N0e-kt dove N0 è il numero di atomi iniziale. Quando N(td)=N0/2 dove td è il tempo di dimezzamento, si ha N0/2=N0e-ktd da cui td=ln2/k che è l'intervallo in cui un atomo può decadere con probabilità del 50%.
(**) In generale possiamo interpretare questo sistema come quello costituito da un apparato di misura classico (il gatto) e l'oggetto quantistico misurato (l'atomo radioattivo); le conclusioni rimangono le stesse: il sistema apparato-oggetto è in entaglement e la misura ha un esito probabilistico classico tra gli stati possibili (e può essere ovviamente diverso dal 50%).
(***) Le teorie a variabili nascoste affermano invece che la conoscenza quantistica del sistema composto non è completa poiché lo stato dei singoli sottositemi non è noto con certezza, perciò si hanno esiti probabilistici.

giovedì 11 maggio 2023

Base locale e derivata covariante (seconda parte)

Nel precedente post abbiamo visto come si può costruire una base curvilinea locale a partire da una base cartesiana e viceversa, in particolare abbiamo ottenuto le seguenti relazioni tra le basi dei due riferimenti:
ei=(∂xj/∂xi)ej   ,   ei=(∂xj/∂xi)ej
dove ei sono le basi del riferimento cartesiano (x1,..., xn) mentre ej sono le basi del riferimento curvilineo (x1,..., xn) in uno spazio Rn (con i,j=1,..., n).
Nota: come sempre le coordinate curvilinee sono definite in funzione di quelle cartesiane e viceversa, inoltre sono funzioni differenziabili.

Per inciso è interessante osservare che possiamo riscrivere le relazioni sopra (raccogliendo il prodotto ∂xjej oppure xjej) come:
ei=(∂xjej)/∂xi=r/∂xi   ,   ei=(∂xjej)/∂xi=∂r/∂xi
dove si è posto r=∂xjej=xjej e quindi il differenziale dr del raggio vettore r si può scrivere, nei due riferimenti, come basi ej per componenti dxj:
dr=(∂r/∂xj)dxj =ejdxj   ,   dr=(∂r/∂xj)dxj=ejdxj.
Nota: dr è un vettore e quindi deve restare invariato nei due riferimenti.

Ricordiamo che in generale un vettore T si può definire in funzione delle sue basi ei e delle sue componenti Ti:
T=T1e1+...+Tnen=Tiei
dove abbiamo applicato la notazione di Einstein sugli indici i=1,..., n.

Abbiamo visto sopra che se cambiamo riferimento le basi cambiano come ej=(∂xi/∂xj)ei quindi se vogliamo che il vettore T=Tjej resti invariato anche le sue componenti Tj dovranno trasformarsi (in modo inverso):
Tj=(∂xj/∂xi)Ti
in modo cioè che nel nuovo riferimento il vettore T resti invariato:
T=Tjej=(∂xj/∂xi)Ti(∂xi/∂xj)ei=Tiei=T
essendo (∂xj/∂xi)(xi/xj)=1.
Nota: dal differenziale dxj=(∂xj/∂xi)dxi segue dxj/dxj=(∂xj/∂xi)(xi/xj)=1.

Calcoliamo ora la derivata del vettore T=Tiei lungo una coordinata xj qualsiasi, questa sarà definita (come derivata di una funzione prodotto):
∂T/∂xj=∂(Tiei )/∂xj=(∂Ti/∂xj)ei+Ti(∂ei/∂xj)
dove il termine ∂ei/∂xj tiene conto della possibile variazione delle basi ei rispetto alle coordinate xj: questa derivata è detta derivata covariante e in pratica estende il concetto usuale di derivata direzionale.
Nota: si dice derivata covariante perché preserva il carattere di invarianza rispetto alla trasformazione di coordinate (vedi il relativo post).

Si osservi che se le coordinate sono cartesiane, allora le basi non variano in funzione delle coordinate (cioè mantengono sempre stesso modulo e direzione in ogni punto e quindi ∂ei/∂xj=0); in tal caso la derivata si riduce alla classica derivata direzionale (calcolata cioè lungo l'asse coordinato xj):
∂T/∂xj=(∂Ti/∂xj)ei
dove ricordiamo T è un vettore n-dimensionale (con i,j=1,..., n).

Tuttavia nel caso più generale di coordinate curvilinee il modulo e la direzione delle basi può variare da punto a punto e quindi il termine ∂ei/∂xj è generalmente diverso da zero*.

Vediamo quindi un esempio riprendendo le coordinate curve polari (r,θ) introdotte nel precedente post e le relative basi (er,eθ) ottenute in funzione delle coordinate cartesiane (ex,ey):
er=cosθex+sinθey
eθ=-rsinθex+rcosθey.
ricordando che il vettore T si esprime come (con i=r,θ):
T=Tiei=Trer+Tθeθ.

In questo caso particolare i valori dei termini ∂ei/∂xj espressi in funzione di ereθ sono (con i,j=r,θ):
er/∂r=∂(cosθex+sinθey)/∂r=0
er/∂θ=-sinθex+cosθey=(1/r)eθ
eθ/∂r=-sinθex+cosθey=(1/r)eθ
eθ/∂θ=-rcosθex-rsinθey=-rer
dove notiamo che er/∂θ=eθ/∂r e infatti in generale risulta:
∂ei/∂xj=∂ej/∂xi.
Nota: ciò accade in generale quando le derivate seconde incrociate sono uguali**, per le funzioni lisce questa condizione è sempre soddisfatta.

Perciò le derivate rispetto ad r e θ del vettore T sono (con i=r,θ):
∂T/∂r=∂(Tiei )/∂r=(∂Ti/∂r)ei+Tr(∂er/∂r)+Tθ(∂eθ/∂r)
∂T/∂θ=∂(Tiei )/∂θ=(∂Ti/∂θ)ei+Tr(∂er/∂θ)+Tθ(∂eθ/∂θ)
e quindi sostituendo i valori delle derivate delle basi ottenuti sopra:
∂T/∂r=(∂Ti/∂r)ei+(1/r)Tθeθ
∂T/∂θ=(∂Ti/∂θ)ei+(1/r)Treθ-rTθer.

Si osservi in particolare che se supponiamo che le componenti di T lungo r e θ non variano (cioè se ∂Ti/∂r=0 e ∂Ti/∂θ=0) si ottiene:
∂T/∂r=(1/r)Tθeθ
∂T/∂θ=(1/r)Treθ-rTθer
in questo caso si ha cioè il contributo dovuto alla sola variazione delle basi.
Nota: è evidente che il punto r=0 deve essere escluso, infatti qui le coordinate non sono invertibili come richiesto***.

Se infine vogliamo che T venga trasportato parallelamente rispetto alla superficie curva, dovremo annullare la derivata covariante ponendo:
∂T/∂r=0   e   ∂T/∂θ=0
cioè dovremo annullare i valori delle componenti delle derivate parziali ottenuti sopra, rispettivamente lungo er ed eθ.
Nota: si osservi che per avere trasporto paralleo le componenti di T devono variare affinché ∂T/∂r∂T/∂θ si possano annullare (altrimenti si dovrebbe porre Tr=0 e Tθ=0, vedi sopra il caso con T costante).
 
(*) Solitamente nella derivata covariante per indicare i termini (∂ei/∂xj) si usano i simboli di Christoffel del secondo tipo così definiti: Γkij=(∂ei/∂xj)ek. Perciò ∂T/∂xj=(∂Ti/∂xj)ei+TiΓkijek=(∂Ti/∂xj+TkΓikj)ei (scambiando k con i).
(**) Dalle seguenti relazioni tra basi (vedi il precedente post):
er=(∂x/r)ex+(y/r)ey e eθ=(∂x/θ)ex+(y/θ)ey si ottiene derivando
er/θ=(∂x/rθ)ex+(y/rθ)ey e eθ/r=(∂x/θr)ex+(y/θr)ey
da cui si ha: er/θ=eθ/r se ∂x/rθ=∂x/θr e y/rθ=y/θr (cvd).
(***) Condizione generale affinché le coordinate siano invertibili è che il determinante della matrice Jacobiana non si annulli.

[Una ottima esposizione di questi concetti si trova nella Playlist Video di Dermot Green - Queen's University Belfast]

Base locale e derivata covariante (prima parte)

Come è noto un sistema di riferimento cartesiano è formato da n rette ortogonali che si intersecano in un punto O detto origine, ognuna delle rette è orientata e riporta una unità di misura: in questo modo è possibile identificare qualsiasi punto dello spazio euclideo Rn con una n-upla di numeri reali (x1, x2,..., xn) in modo univoco (vedi Wikipedia).

Generalizzando è possibile costruire geometricamente, a partire da un sistema di riferimento cartesiano, un altro riferimento qualsiasi detto curvilineo, che avrà lo stesso numero di coordinate ma nel quale le linee coordinate sono generalmente delle curve (vedi Wikipedia).

Ad esempio, come avevamo già visto nel post "Trasformazioni di basi, vettori e... co-vettori!", consideriamo un sistema di coordinate cartesiano bidimensionale (x1,x2) e un nuovo sistema di coordinate curvilinee (x1,x2) che sono note in funzione delle prime*:
x1=x1(x1,x2)   ,   x2=x2(x1,x2)
e dove vale anche la trasformazione inversa:
x1=x1(x1,x2)   ,   x2=x2(x1,x2)
ed inoltre tali funzioni sono per definizione differenziabili (funzioni lisce).
Nota: le coordinate devono essere indipendenti e quindi ∂xi/∂xj=δij cioè ∂xi/∂xj=0 se i≠j e ∂xi/∂xj=1 solo se i=j (δij è la delta di Kronecker). 

Consideriamo ad esempio il riferimento cartesiano rappresentato in figura dove è indicata la retta x1 e il relativo vettore di base unitario e1 con origine nel punto O da cui parte una linea curva coordinata x1 con vettore di base unitario e1 ad essa tangente come illustrato in figura:


Ora si osservi che tra il tratto infinitesimo dx1 della retta x1 e il tratto infinitesimo dx1 tangente alla linea curva x1 (che quindi approssima la linea in quel punto) esiste la seguente relazione trigonometrica:
dx1=dx1cosα
e quindi la proiezione del vettore di base e1 sulla retta x1 è pari a
|e1|cosα=|e1|(dx1/dx1)
dove |e1|=1 è il modulo unitario di e1 mentre α è l'angolo tra dx1 e dx1.
In modo equivalente la proiezione del vettore di base e1 sulla retta x2 è:
|e1|sinα=|e1|(dx2/dx1)
valendo di nuovo la relazione trigonometrica:
dx2=dx1sinα.

Perciò la nuova base locale e1 espressa in funzione delle basi cartesiane e1 ed e2 (che ricordiamo sono per semplicità tutti vettori di modulo 1) è:
e1=(|e1|cosα)e1+(|e1|sinα)e2
e quindi utilizzando le relazioni ricavate sopra
e1=(∂x1/x1)e1+(x2/x1)e2
avendo posto |e1|=|e2|=1 e ∂x1/∂x1=cosα , ∂x2/∂x1=sinα.
Nota: abbiamo indicato le derivate parziali dato che le coordinate sono funzioni di più variabili.

Si osservi però che dal rapporto trigonometrico di due infinitesimi come dx1/dx1dx2/dx1 siamo passati alle derivate parziali ∂x1/x1x2/x1 supponendo (correttamente) che la variazione di x1 rispetto a x1 e quella di x2 sempre rispetto a x1 siano rispettivamente pari a cosαsinα.
Nota: ciò è vero poiché x1 approssima (nell'origine) la coordinata di un riferimento ruotato di un angolo α rispetto a quello cartesiano (x1, x2)**.

In modo analogo per la base e2 si ha (anche se non è mostrato in figura):
e2=(∂x1/x2)e1+(x2/x2)e2
dove ricordiamo che le basi sono state tutte normalizzate:
|e1|=|e2|=1   e   |e1|=|e2|=1.
Nota: per costruzione geometrica le basi (e1,e2) sono tangenti alle linee coordinate (x1,x2) e ciò vale in generale per più coordinate.

Se viceversa volessimo derivare le basi cartesiane e1 e e2 a partire da quelle curvilinee e1 e e2 un ragionamento analogo ci porterebbe ad ottenere:
e1=(∂x1/x1)e1+(x2/x1)e2
e2=(∂x1/x2)e1+(x2/x2)e2.
che rappresentano le relazioni inverse di quelle prima ottenute.

Quindi riscrivendo quanto abbiamo ottenuto sopra in forma più generale (applicando la notazione di Einstein sugli indici ripetuti) si ha:
ei=(∂xj/∂xi)ej   ,   ei=(∂xj/∂xi)ej
dove gli indici i,j=1,..., n indicano il numero di coordinate e le relative basi.
Nota: si osservi che gli elementi (∂xj/∂xi) e (∂xj/∂xi) definiscono rispettivamente la matrice jacobiana e la sua inversa.

Ma facciamo subito un esempio introducendo le coordinate curvilinee (r,θ) (ponendo cioè x1=r e x2) dove r≥0 è la distanza dall'origine (polo) mentre 0≤θ≤2π è l'angolo tra r e l'asse X (coordinate polari).

Per calcolare le nuove basi e1=er e e2=eθ è utile definire le coordinate cartesiane (x,y) in funzione delle nuove coordinate (r,θ):
x(r,θ)=rcosθ  ,   y(r,θ)=rsinθ.

Possiamo quindi ottenere le nuove basi er e eθ utilizzando le equazioni alle derivate parziali ottenute sopra (dove x1=r e x2):
er=(∂x/r)ex+(y/r)ey
eθ=(∂x/θ)ex+(y/θ)ey.
Perciò le basi del nuovo riferimento curvilineo di coordinate (r,θ) espresse in funzione delle basi cartesiane note ex ed ey sono:
er=cosθex+sinθey
eθ=-rsinθex+rcosθey
ed inoltre essendo perpendicolari il loro prodotto scalare è nullo:
<er,eθ>=-rcosθsinθ+rsinθcosθ=0.
Nota: la base eθ non è unitaria poiché risulta |eθ|=r tuttavia possiamo porre come base unitaria θ=-sinθex+cosθey e quindi eθ=rθ.

È importante osservare che le basi er e eθ dipendono dalle coordinate (r,θ) come in effetti capita generalmente per le basi curvilinee: viceversa le basi cartesiane ex ed ey sono sempre le stesse in ogni punto dello spazio.

Come vedremo nel prossimo post le relazioni ricavate sopra saranno utili per definire la trasformazione di un vettore affinché resti invariato quando passa da un riferimento ad un altro e definiremo la sua derivata covariante.

(*) Ricordiamo che gli apici indicano entità che si trasformano in modo controvariante (come le componenti di un vettore) mentre i pedici indicano entità che si trasformano in modo covariante (come ad esempio le relative basi) come descritto in "Trasformazioni di basi, vettori e... co-vettori!".
(**) In due dimensioni la trasformazione delle coordinate per una rotazione degli assi è: x1=x1cosα-x2sinαx2=x1sinα+x2cosα da cui segue subito ∂x1/∂x1=cosα , ∂x2/∂x1=sinα come già derivato sopra.

[Una ottima esposizione di questi concetti si trova nella Playlist Video di Dermot Green - Queen's University Belfast]

mercoledì 8 marzo 2023

La Sfera di Bloch

È noto che lo stato quantistico di un qubit (quantum bit) è così definito:
|Ψ>=α|0>+β|1>
dove α e β sono numeri complessi che devono soddisfare la condizione:
|α|2+|β|2=1
per la normalizzazione a 1 della probabilità complessiva P=|α|2+|β|2.
Nota: i coefficienti |α|2 e |β|2 rappresentano rispettivamente la probabilità che si verifichi lo stato |0> oppure |1>.

Ricordiamo però che valendo la formula di Eulero e=cosø+isinø, in generale per un numero complesso x+iy si può scrivere:
x+iy=r(cosø+isinø)=re
dove r=(x2+y2)1/2 è il modulo e ø=arctan(y/x) è l'angolo tra r e la sua proiezione sull'asse X (pari a rcosø).
Inoltre ricordiamo che:
|x+iy|2=|re|2=r2(ee-iø)=r2
poiché |e|2=(ee-iø)=1 essendo e-iø il complesso coniugato di e.
Nota: è noto che il modulo al quadrato di un numero complesso è dato dal prodotto di quel numero per il suo coniugato.

Quindi possiamo porre nel nostro caso per i coefficienti complessi α e β:
α=r1e1   e   β=r2eiø2
dove ø1 e ø2 sono due angoli qualsiasi compresi tra 0 e .
Se inoltre poniamo r1=rcosθ e r2=rsinθ con r=1 si ha come richiesto:
|α|2+|β|2=|r1e1|2+|r2e2|2=cosθ2+sinθ2=1
poiché |e1|2=|e2|2=1 come visto sopra.

Quindi per lo stato di un qubit vale la seguente relazione:
|Ψ>=α|0>+β|1>=cosθ(e1)|0>+sinθ(e2)|1>
definita in funzione degli angoli θ, ø1 e ø2 di cui daremo di seguito una rappresentazione geometrica.

Si osservi però che moltiplicando lo stato |Ψ> per e-iø1 si ottiene un nuovo stato |Ψ'>=e-iø1|Ψ>:
|Ψ'>=e-iø1|Ψ>=e-iø1(α|0>+β|1>)=cosθ|0>+sinθ(e)|1>
dove ø=ø2-ø1.
Tuttavia la probabilità degli stati |0> e |1> resta invariata infatti:
|e-iø1α|2=(e-iø1α)(e-iø1α)*=(e-iø1e1)(αα*)=|α|2
e lo stesso vale per |e-iø1β|2=|β|2.
Nota: qui il simbolo (*) indica il valore coniugato del numero complesso.

Perciò possiamo omettere il termine e-iø1 dallo stato |Ψ'> poiché non ha effetti osservabili sperimentalmente e possiamo riscrivere:
|Ψ'> => |Ψ>=cosθ|0>+sinθ(e)|1>.

Infine per evidenziare una rappresentazione geometrica definiamo lo stato |Ψ> in funzione delle variabili x, iy e z ponendo:
cosθ=z
sinθ(e)=sinθcosø+isinθsinø=x+iy
o in modo equivalente
x=sinθcosø
y=sinθsinø
z=cosθ.

Ciò significa che se x, y e z vengono interpretate come coordinate, esse rappresentano le coordinate polari di una sfera di raggio unitario* |Ψ|=1:


Perciò lo stato |Ψ> in funzione delle coordinate x, iy e z diventa:
|Ψ>=cosθ|0>+sinθ(e)|1>=z|0>+(x+iy)|1>
quindi le coordinate di |Ψ> al quadrato, cioè z2 e |(x+iy)|2, rappresentano rispettivamente la probabilità che si verifichi lo stato |0> oppure |1>.
Nota: si ricordi che in generale |(x+iy)|2=(x+iy)(x-iy)=x2+y2.

Si noti però che quando θ=0 risulta |Ψ>=|0> mentre se θ=π/2 si ha** |Ψ>=|1> quindi per una descrizione completa della sfera possiamo porre:
|Ψ>=cos(θ/2)|0>+sin(θ/2)(e)|1>
dove 0≤θ≤π e 0≤ø<2π.
Questa rappresentazione geometrica*** dello spazio degli stati puri di un sistema quantistico a 2 stati è detta sfera di Bloch (vedi Wikipedia).

(*) Risulta |Ψ|2=<Ψ|Ψ>=(<0|α*+<1|β*)|(α|0>+β|1>)=α*α+β*β=1 essendo <0|0>=1, <0|1>=0, <1|0>=0 e <1|1>=1 per l'ortogonalità di |0> e |1>.
(**) Se poniamo θ=π/2 allora |Ψ>=e|1> che è equivalente a |Ψ>=|1> essendo |e|2 =1 (cioè la probabilità dello stato |1> non cambia).
(***)  Correttamente risulta per le probabilità dei due stati:
|cos(θ/2)|2+|sin(θ/2)(e)|2=cos2(θ/2)+sin2(θ/2)=1 essendo |e|2 =1.  

martedì 23 marzo 2021

È possibile un modello esteso dell'elettrone?

È noto che nel Modello Standard le particelle elementari vengono considerate a tutti gli effetti come puntiformi, tuttavia ciò porta a valori infiniti per alcune quantità che le caratterizzano, legate alle mutue interazioni tra particelle e campi.
Nota: con l'aggettivo puntiforme si intende una particella elementare priva di qualsiasi struttura interna.

Vediamo infatti come si definisce l'energia di una particella carica di massa a riposo m nella teoria classica (relativistica), considerando l'energia del campo elettrostatico da essa generato oltre alla sua energia di massa (vedi Wikipedia):
mc2=m0c2+(1/2) ε0E2dV     (1.1)
dove m0 è la massa nuda della particella priva di campo elettrico* mentre E=F/e=e/4πε0R2 è il campo elettrico a distanza R dalla particella, F è la forza di Coulomb ed ε0 è la permittività elettrica del vuoto.
Nota: in tutti i post useremo, anche se non dichiarate, le unità di misura del sistema metrico internazionale SI.

Se, ad esempio, integriamo tra il raggio r ipotetico di un elettrone e il volume V=(4/3)πR3 che lo circonda all'infinito si ha:
(1/2) ε0E24πR2dR=(1/2) (e2/4πε0R2)dR     (1.2)
posto dV=4πR2dR ed essendo E=e/4πε0R2.
Quindi calcolando l'integrale tra il raggio r ed infinito si ottiene:
-(e2/8πε0R)|r=e2/8πε0r     (1.3)
per cui l'energia complessiva dell'elettrone con il suo campo è (secondo la eq.1.1):
mc2=m0c2+e2/8πε0r     (1.4)
ciò significa che se l'elettrone è puntiforme (cioè r -> 0) allora la sua energia mc2 tende come anticipato ad infinito!

Nelle teorie di campo quantistiche l'approccio è più complesso di quanto esposto qui, tuttavia si devono comunque usare procedure matematiche di rinormalizzazione per eliminare le divergenze che insorgono nei calcoli, come ad esempio quello che determina l'anomalia magnetica dell'elettrone.

In un blog dedicato mostreremo come sia possibile definire, secondo una proposta dell'autore, un modello esteso dell'elettrone dove tutte le quantità che lo definiscono sono finite.
 
Dovremo però tenere conto, nello sviluppo del modello e.m. esteso,  che le attuali misure sperimentali indicano una dimensione della carica elettrica non superiore a circa 10-19 metri, che è la migliore risoluzione degli odierni acceleratori di particelle (tale risoluzione è dell'ordine della lunghezza d'onda λ delle particelle-sonda)**. 
Nota: come vedremo in un Blog dedicato la carica elettrica del modello esteso è assunta come puntiforme mentre è la massa ad essere distribuita in modo esteso sulla superficie del modello.

(*) La massa nuda m0 è un parametro libero della teoria che non è possibile misurare direttamente: non possiamo in effetti separare una particella carica dal campo elettrico che essa stessa genera.
(**) Dato che le particelle circolano negli acceleratori a velocità v prossime a c si ha E=hc2/λv≈hc/λ da cui λhc/E e per E=14 TeV (energia massima oggi raggiungibile) si ha λ10-19 m (si ricordi che 1 eV1,6x10-19 Joule).
[Ricordiamo che per una particella di massa m si ha E=mc2 e p=mv da cui p=Ev/c2 ed essendo p=h/λ segue E=hc2/λv]

ATTENZIONE
Per il seguito di questo post vedi il Blog: Electron Extended Model dove verrà proposto dall'autore un modello dell'elettrone non puntiforme.

INDICE DEI POST