Significato fisico

martedì 8 luglio 2025

E adesso... musica (con il circolo delle quinte)!

È noto che secondo il temperamento equabile una ottava musicale (cioè un intervallo di frequenza con rapporto 2:1) è suddivisa in 12 intervalli uguali (semitoni), dove ogni singola nota si ottiene a partire da una frequenza stabilita, moltiplicata per un coefficiente pari a 2^1/12 che definisce appunto un semitono (cioè l'intervallo di frequenza più piccolo tra due note).

Se ad esempio prendiamo la frequenza f₁=261,6 Hz (cioè quella assegnata al Do centrale del pianoforte) e la moltiplichiamo dodici volte per 2^1/12, otterremo in sequenza la frequenza di tutte le note di quella ottava:

Do, Do#, Re, Re#, Mi, Fa, Fa#, Sol, Sol#, La, La#, Si, Do₂

e in particolare la frequenza f₂del secondo Do₂ sarà pari a

f₂=(2^1/12)¹²f₁=2f₁

cioè esattamante il doppio della frequenza fissata f₁ come richiesto.
Nota: per le proprietà delle potenze, dato un numero reale non negativo a e un numero intero positivo n vale la relazione (a^1/n)ⁿ=a^n/n=a.

Ricordiamo che l'alterazione # (diesis) o b (bemolle) indica rispettivamente l'aumento o la diminuzione della nota di un semitono e che ad esempio le seguenti notazioni indicano la stessa identica nota (frequenza):

Do#=Reb - Re#=Mib - Fa#=Solb - Sol#=Lab - La#=Sib

Nota: questa è una caratteristica particolare del temperamento equabile.

È altresì noto che una scala maggiore viene costruita, a partire da una nota di riferimento, con questo schema canonico:

T-T-S-T-T-T-S

dove T indica l'intervallo di un tono (cioè 2 semitoni) mentre S indica un semitono. Ad esempio se vogliamo costruire la scala di Do avremo:

Do-Re-Mi-Fa-Sol-La-Si-Do

dove tra Mi e Fa c'è un semitono come pure tra Si e Do e quindi lo schema è rispettato (gli altri intervalli sono di un tono).

Con questo schema possiamo costruire tutte le scale maggiori (utilizzando le 7 note canoniche con le relative alterazioni*) dove però sostituiremo quelle contenenti eventuali doppi diesis con le scale equivalenti** in bemolle:

1) Scala di Do: Do-Re-Mi-Fa-Sol-La-Si-Do

2) Scala di Do#: Do#-Re#-Mi#-Fa#-Sol#-La#-Si#-Do#

3) Scala di Re: Re-Mi-Fa#-Sol-La-Si-Do#-Re

4) Scala di Mib: Mib-Fa-Sol-Lab-Sib-Do-Re-Mib
(Scartiamo la scala di Re#: Re#-Mi#-Fa##-Sol#-La#-Si#-Do##-Re#)

5) Scala di Mi: Mi-Fa#-Sol#-La-Si-Do#-Re#-Mi
6) Scala di Fa: Fa-Sol-La-Sib-Do-Re-Mi-Fa
7) Scala di Fa#: Fa#-Sol#-La#-Si-Do#-Re#-Mi#-Fa#
8) Scala di Sol: Sol-La-Si-Do-Re-Mi-Fa#-Sol
9) Scala di Lab: Lab-Sib-Do-Reb-Mib-Fa-Sol-Lab

(Scartiamo la scala di Sol#: Sol#-La#-Si##-Do#-Re#-Mi#-Fa##-Sol#)
10) Scala di La: La-Si-Do#-Re-Mi-Fa#-Sol#-La
11) Scala di Sib: Sib-Do-Re-Mib-Fa-Sol-La-Sib

(Scartiamo la scala di La#: La#-Si#-Do##-Re#-Mi#-Fa#-Sol##-La#)
12) Scala di Si: Si-Do#-Re#-Mi-Fa#-Sol#-La#-Si
Nota: le scale di Mib/Re#, Lab/Sol# e Sib/La# indicano gli stessi suoni (frequenze), ma quelle in bemolle non hanno doppi # come richiesto.

Si osservi inoltre che le scale di Do#, Fa# e Si nel temperamento equabile hanno gli stessi suoni (frequenze) delle seguenti scale, rispettivamente:
Scala di Reb: Reb-Mib-Fa-Solb-Lab-Sib-Do-Reb (alias scala di Do#)
Scala di Solb: Solb-Lab-Sib-Dob-Reb-Mib-Fa-Solb (alias scala di Fa#)

Scala di Dob: Dob-Reb-Mib-Fab-Solb-Lab-Sib-Dob (alias scala di Si)
Nota: questa osservazione sarà utile per completare il nostro schema di simmetria tra le scale maggiori, come vedremo.

Prima di concludere ricordiamo che con intervallo di quinta si intende un intervallo tra una nota e l'altra pari a 7 semitoni, ad esempio tra Do e Sol o tra Sol e Re c'è un intervallo di quinta giusta (in pratica basta contare 5 note in sequenza come ad esempio Do-Re-Mi-Fa-Sol).
Nota: solo quando tra la prima e la quinta nota ci sono 7 semitoni la quinta è giusta: ad es. l'intervallo Si-Fa ha solo 6 semitoni e la quinta è diminuita.

Ora riepiloghiamo le scale con il numero delle loro alterazioni riportando solo la nota che dà il nome alla scala maggiore con il numero di alterazioni tra parentesi, ad esempio avremo Re(2#) per la scala di Re maggiore.

Raccogliamo quindi nella prima riga le scale con i diesis e poi sotto quelle con i bemolle, sempre in ordine crescente:
Do - Sol(1#) - Re(2#) - La(3#) - Mi(4#) - Si(5#) - Fa#(6#) - Do#(7#)
Do - Fa(1b) - Sib(2b) - Mib(3b) - Lab(4b) - Reb(5b) - Solb(6b) - Dob(7b)

È immediato osservare che la prima riga indica le scale ascendenti per quinte passando da Do a Sol, da Sol a Re etc. mentre la seconda riga indica le scale discendenti per quinte passando da Dob a Solb, da Solb a Reb etc. Ebbene questo schema viene indicato come Circolo delle quinte ed è bene illustrato nella seguente figura***:

Ma in breve a cosa serve il circolo delle quinte?
Scopo didattico: è un ottimo strumento mnemonico per ricordare le alterazioni in chiave e visualizzare le relazioni armoniche tra le scale.
Modulazioni armoniche: è una mappa naturale dei cambi di tonalità, infatti modulazioni verso tonalità adiacenti suonano più naturali.
Relazioni tra tonalità: dalla tonica di un accordo si può ad esempio passare alla dominante (quinta sopra) o alla sottodominante (quinta sotto).

Ma soprattutto mette ben in evidenza una perfetta simmetria tra le scale insita nel temperamento equabile, cosa che ad esempio nel temperamento pitagorico o mesotonico era invece imperfetta e asimmetrica, rendendo inoltre anche visivamente l'importanza degli intervalli di quinta.

(*) In ogni scala devono sempre comparire tutte le 7 note canoniche Do, Re, Mi, Fa, Sol, La, Si con le eventuali alterazioni (diesis o bemolle).
(**) Due scale maggiori si dicono equivalenti quando contengono la stessa successione di note (frequenze) anche se la notazione è differente, ad esempio le note: Re#=Mib#, Mi#=Fa, etc. nelle scale Re#/Mib.
(***) In figura compaiono anche le scale minori, che si ottengono dalla sesta nota della corrispondente scala maggiore: ad esempio dal La (sesta nota delle scala di Do maggiore) si ottiene la scala di La minore: La-Si-Do-Re-Mi-Fa-Sol-La. Ciò accade perché se prendiamo lo schema ripetuto della scala maggiore: T-T-S-T-T-T-S T-T-S-T-T-T-S si ottiene, a partire dal sesto intervallo, lo schema canonico della scala minore: T-S-T-T-S-T-T.

martedì 27 maggio 2025

Come si dimostra (in generale) la relazione E=mc^2

Nel 1905 Albert Einstein pubblicò un articolo fondamentale dal titolo "L'inerzia di un corpo dipende dal suo contenuto di energia?", in cui per la prima volta introdusse esplicitamente la relazione:

E=m₀c².

Questa equazione afferma che la massa inerziale m₀ di un corpo a riposo è equivalente ad un'energia E ad esso associata, con la costante c (velocità della luce nel vuoto) che agisce come fattore di conversione.
Nota: si veda anche il post "Una 'deduzione elementare': E=mc^2" per una derivazione alternativa proposta in seguito da Einstein.

Nell'articolo Einstein fa riferimento ad una formula, derivata nel suo primo articolo sulla relatività, che definisce l'energia L′ di un raggio luminoso in un sistema in moto S', rispetto all’energia L nel sistema in quiete S:

L′=L(1−vcos⁡θ/c)/(1−v²/c²)^1/2

dove v è la velocità relativa tra i due riferimenti*, mentre θ è l’angolo tra la direzione del raggio di luce e la direzione del moto di S'.
Nota: nel suo articolo sulla relatività Einstein osserva che l'energia L si trasforma come la frequenza f dell'onda, quindi L÷hf dove h è un costante (relazione già ipotizzata da Einstein con h costante di Planck).

Osserviamo subito che per piccole velocità v risulta:

L′≈L(1−vcos⁡θ/c)(1+v²/2c²)

essendo con buona approssimazione 1/(1−v²/c²)^1/2≈(1+v²/2c²) per v<<c.

Consideriamo quindi l'esperimento mentale che fece Einstein nel suo articolo. Supponiamo che un corpo in quiete emetta simultaneamente due raggi luminosi in direzioni opposte di energia L/2, e poi valutiamo il punto di vista di un osservatore in moto con velocità v.
Nota: per semplicità sia i raggi di luce che l'osservatore si muovono lungo X quindi risulterà per i raggi θ=0° e θ=180° rispettivamente, cioè cos⁡θ=±1.

Sistema in quiete S
Secondo il sistema in quiete S il corpo ha energia E₀ prima dell'emissione.
Invece dopo l'emissione dei raggi di luce entrambi di energia L/2 il corpo avrà energia E₁=E₀-L poiché avrà perso una energia pari a L=L/2+L/2.

Sistema in moto S'
Secondo il sistema in moto S' il corpo ha energia H₀ prima dell'emissione (che sarà diversa da E₀ poiché il corpo ora si trova in moto).
Mentre dopo l'emissione dei raggi di luce di energia totale ∆L'=L'₊/2+L'_-/2 (dove i pedici + e - indicano le due direzioni opposte lungo l'asse X) il corpo avrà una energia pari a H₁=H₀-∆L'.

Calcoliamo quindi quanto vale l'energia ∆L' emessa dal corpo in moto (nell'approssimazione delle basse velocità come visto sopra)**:

∆L'≈(L/2)(1−v/c)(1+v²/2c²)+(L/2)(1+v/c)(1+v²/2c²)=L(1+v²/2c²).

Se ora scriviamo l'energia cinetica del corpo quando è in moto rispetto a S':
a) prima dell'emissione dei raggi: K₀=H₀-E₀
b) dopo dell'emissione dei raggi: K₁=H₁-E₁
la variazione di energia cinetica ∆K dovuta alla emissione dei raggi di luce è:

∆K=K₁-K₀=(H₁-E₁)-(H₀-E₀)

e quindi ricordando che H₁-H₀=-∆L' e che -E₁+E₀=L si ha (per v<<c):

∆K=L-∆L'≈L-L(1+v²/2c²)=-(1/2)L(v²/c²).

Nota: è implicito che in tutti questi passaggi si è fatto uso del principio di conservazione dell'energia.

Poiché è noto che l'energia cinetica di un corpo in movimento in generale è pari a (1/2)m₀v² (per basse velocità) risulta:

∆K≈(1/2)∆m₀v²≈-(1/2)L(v²/c²)

e quindi l'energia L emessa dal corpo implica una perdita di massa -∆m₀ e (per v che tende a 0) risulta esattamente:

-∆m₀=L/c²

in modo che la conservazione dell'energia venga rispettata.

A questo punto Einstein fa la seguente definitiva osservazione:
"Da questa equazione segue che: se un corpo emette energia L sotto forma di radiazione, allora la sua massa diminuisce di L/c². Il fatto che l'energia estratta dal corpo divenga energia di radiazione non cambia evidentemente le cose, ragion per cui siamo condotti alla conclusione più generale secondo cui: la massa di un corpo è una misura del suo contenuto di energia."

Tuttavia in seguito si è osservato che questa dimostrazione non è del tutto generale, poiché è stata dedotta da un caso particolare, quello di un corpo isolato che emette una radiazione elettromagnetica simmetrica.
Essa non tiene conto di sistemi fisici più complessi, con energia interna, campi, tensioni o distribuzioni non simmetriche: perciò la relazione E=m₀c² viene inferita da un caso particolare, e non è derivata dai principi generali della relatività ristretta, come invece mostreremo in breve.

In effetti solo usando il formalismo della relatività speciale si può introdurre il quadrivettore energia-impulso P^µ:

P^µ=(E/c,p)

dove E/c è l’energia totale divisa per c (componente temporale), mentre p è il vettore quantità di moto totale del sistema (componente spaziale).

Se ora calcoliamo il quadrato invariante di P^µ cioè P^µP_µ si può introdurre la massa invariante m₀ del sistema ponendo P^µP_µ=m₀²c² e quindi:

P^µP_µ=(E/c)²-p²=m₀²c²

da cui nel riferimento del centro di massa (dove p=0), si ottiene

E=m₀c²

che rappresenta la forma generale, covariante e valida per ogni sistema dell’equivalenza massa-energia: questa relazione è perciò una conseguenza necessaria della struttura formale della relatività speciale***.
Nota: si veda anche il post "Derivare la Massa Relativistica" dove è stata ottenuta la relazione E²-p²c²=m₀²c⁴ a partire da principi relativistici.

(*) Si osservi che questo effetto viene definito effetto Doppler relativistico mentre nel caso classico l'effetto Doppler è riferito solo alla frequenza f dell'onda dove risulta: f′=f(1−vcos⁡θ/c). Tuttavia se supponiamo la relazione L=hf e L'=hf' (dove h è la costante di Planck) si ha L′=L(1−vcos⁡θ/c).
(**) Secondo l'effetto Doppler classico non ci sarebbero variazioni per l'osservatore in moto risultando: ∆L'=(L/2)(1−v/c)+(L/2)(1+v/c)=L. Solo nel caso relativistico risulta: ∆L'≈L(1+v²/2c²) (punto chiave dell'articolo).
(***) Una dimostrazione ancora più generale fa uso del tensore energia-impulso che è definibile anche in relatività generale.

sabato 23 novembre 2024

Il gatto di Schrödinger è... vivo e morto?!

Il paradosso del gatto di Schrödinger è ben descritto su Wikipedia e lo riassumeremo di seguito, ma quello che ci interessa mostrare qui è che non è corretto affermare che il gatto si trova in una sovrapposizione di stati (vivo e morto) come spesso si sente affermare da alcuni divulgatori.

In breve, il sistema è composto da un gatto chiuso in una scatola insieme a un atomo radioattivo: l'atomo può essere integro o decaduto e quindi il gatto può essere vivo o morto con una probabilità del 50% (posto un intervallo pari al tempo di dimezzamento dell'atomo*); fino a quando non viene eseguita una misurazione, lo stato del sistema rimane indeterminato.
Nota: si suppone che quando l'atomo decade mandi in frantumi una provetta piena di gas velenoso che sia letale per il povero gatto.

Ora per descrivere lo stato del sistema così definito:

|gatto vivo, atomo integro> oppure |gatto morto, atomo decaduto>

possiamo introdurre per semplicità la simbologia già utilizzata per descrivere formalmente un sistema composto da due elettroni con spin uguali ed opposti (vedi il post "Stati misti, intrecciati e... il gatto!").

Perciò, nel nostro caso, porremo questi due stati (u è up e d è down):

lo stato |ud> indica: |gatto vivo, atomo integro>
mentre lo stato |du> indica: |gatto morto, atomo decaduto>

quindi lo stato del sistema completo in sovrapposizione quantistica è così definito:

Ψ=(1/2)^1/2|ud>+(1/2)^1/2|du>

dove il fattore (1/2)^1/2 elevato al quadrato definisce la probabilità del 50% che si misuri uno dei due stati |ud> oppure |du>.

Si osservi quindi che la sovrapposizione tra lo stato |ud> e quello |du> riguarda l'intero sistema e non esclusivamente il gatto oppure l'atomo presi sigolarmente; ciò in particolare significa che questo stato:

Ψ_G=(1/2)^1/2|u>+(1/2)^1/2|d>

relativo al gatto vivo e morto (oppure all'atomo integro e decaduto) non è previsto dal formalismo e, come vedremo di seguito, fa una bella differenza.

Analizziamo quindi lo stato completo del sistema introducendo la matrice di densità ρ (per i dettagli vedi il post "Stati misti, intrecciati e... il gatto!"):

ρ=|Ψ><Ψ|=(1/2)(|ud>+|du>)(<ud|+<du|)

per cui svolgendo il prodotto si ottiene:

ρ=(1/2)(|ud><ud|+|ud><du|+|du><ud|+|du><du|)

e quindi posto |u>=(1,0)^T e |d>=(0,1)^T (dove T indica la riga trasposta) e svolgendo i prodotti sopra definiti, si ottiene la matrice [4x4]:

Ora si osservi che risultando ρ=ρ² lo stato gatto-atomo definisce un stato puro che è quello definito da Ψ=(1/2)^1/2|ud>+(1/2)^1/2|du> (solo quando lo stato è misto c'è incertezza statistica tra diversi stati puri).
Nota: per chiarimenti vedi il post "Stati misti, intrecciati e... il gatto!".

Tuttavia la matrice densità ρ rappresenta il sistema completo, mentre noi vogliamo misurare lo stato del sottositema gatto (o quello dell'atomo); inoltre si osservi che la misura dello stato di uno determina subito lo stato dell'altro facendo collassare lo stato del gatto-atomo in sovrapposizione.
Nota: lo stato gatto-atomo è detto entanglement proprio perché esiste questa correlazione quantisitica istantanea tra i due sottositemi.

Quindi per determinare lo stato del sottositema gatto (come già spiegato in un precedente post), dobbiamo calcolare la matrice ridotta ρ_G(partendo dalla matrice densità ρ), che nel caso dello stato del gatto risulta:

ρ_G=1/2(|u><u|+|d><d|)=1/2(1,0)^T(1,0)+1/2(0,1)^T(0,1)=(1/2)I₂

dove con I₂ abbiamo indicato la matrice identità [2x2].
Nota: si osservi che i termini fuori diagonale di ρ_G, responsabili delle interferenze quantistiche, sono nulli.

Poiché risulta ρ_G≠ρ_G² (essendo I=I²) siamo in presenza di uno stato misto e ciò significa che gli stati possibili del gatto non sono in sovrapposizione quantistica, l'incertezza è in realtà dovuta alla incompleta conoscenza dello stato del sistema gatto-atomo (poiché in effetti ρ_G considera solo il sottositema gatto) e la probabilità statistica classica che il sottositema gatto sia up (cioè vivo) oppure down (morto) è pari a 1/2.

In definitiva il gatto non è mai in sovrapposizione con se stesso ma è in correlazione quantistica col resto del sistema (entanglement); inoltre la probabilità del 50% di trovarlo vivo o morto è di tipo statistico classico**.

In realtà il vero paradosso è che a differenza della meccanica classica, nel caso quantistico non si può stabilire (nemmeno in linea di principio) quale sia esattamente lo stato del sottosistema gatto (o del sottosistema atomo) prima che venga effettuata la misura***.

Tuttavia dobbiamo ricordare che il gatto è un sistema macroscopico classico che si comporta come se fosse un apparato di misura, quindi il suo stato è classicamente definito anche senza aprire la scatola per misurarlo.
Nota: la distinzione fisica fra stato quantistico e stato classico è formalmente studiata dalla teoria della decoerenza.

(*) Il decadimento di N atomi radioattivi segue la legge dN(t)/dt=-kN(t) da cui N(t)=N₀e^-kt dove N₀ è il numero di atomi iniziale. Quando N(t_d)=N₀/2 dove t_d è il tempo di dimezzamento, si ha N₀/2=N₀e^-k^t_d da cui t_d=ln2/k che è l'intervallo in cui un atomo può decadere con probabilità del 50%.
(**) In generale possiamo interpretare questo sistema come quello costituito da un apparato di misura classico (il gatto) e l'oggetto quantistico misurato (l'atomo radioattivo); le conclusioni rimangono le stesse: il sistema apparato-oggetto è in entaglement e la misura ha un esito probabilistico classico tra gli stati possibili (e può essere ovviamente diverso dal 50%).
(***) Le teorie a variabili nascoste affermano invece che la conoscenza quantistica del sistema composto non è completa poiché lo stato dei singoli sottositemi non è noto con certezza, perciò si hanno esiti probabilistici.

giovedì 11 maggio 2023

Base locale e derivata covariante (seconda parte)

Nel precedente post abbiamo visto come si può costruire una base curvilinea locale a partire da una base cartesiana e viceversa, in particolare abbiamo ottenuto le seguenti relazioni tra le basi dei due riferimenti:

e_i=(∂x^j/∂xⁱ)e_j , e_i=(∂x^j/∂xⁱ)e_j

dove e_i sono le basi del riferimento cartesiano (x¹,..., xⁿ) mentre e_j sono le basi del riferimento curvilineo (x¹,..., xⁿ) in uno spazio Rⁿ (con i,j=1,..., n).

Nota: come sempre le coordinate curvilinee sono definite in funzione di quelle cartesiane e viceversa, inoltre sono funzioni differenziabili.

Per inciso è interessante osservare che possiamo riscrivere le relazioni sopra (raccogliendo il prodotto ∂x^je_j oppure ∂x^je_j) come:

e_i=(∂x^je_j)/∂xⁱ=∂r/∂xⁱ , e_i=(∂x^je_j)/∂xⁱ=∂r/∂xⁱ

dove si è posto ∂r=∂x^je_j=∂x^je_j e quindi il differenziale dr del raggio vettore r si può scrivere, nei due riferimenti, come basi e_jper componenti dx^j:

dr=(∂r/∂x^j)dx^j =e_jdx^j , dr=(∂r/∂x^j)dx^j=e_jdx^j.

Nota: dr è un vettore e quindi deve restare invariato nei due riferimenti.

Ricordiamo che in generale un vettore T si può definire in funzione delle sue basi e_i e delle sue componenti Tⁱ:

T=T¹e₁+...+Tⁿe_n=Tⁱe_i

dove abbiamo applicato la notazione di Einstein sugli indici i=1,..., n.

Abbiamo visto sopra che se cambiamo riferimento le basi cambiano come e_j=(∂xⁱ/∂x^j)e_i quindi se vogliamo che il vettore T=T^je_j resti invariato anche le sue componenti T^j dovranno trasformarsi (in modo inverso):

T^j=(∂x^j/∂xⁱ)Tⁱ

in modo cioè che nel nuovo riferimento il vettore T resti invariato:

T=T^je_j=(∂x^j/∂xⁱ)Tⁱ(∂xⁱ/∂x^j)e_i=Tⁱe_i=T

essendo (∂x^j/∂xⁱ)(∂xⁱ/∂x^j)=1.

Nota: dal differenziale dx^j=(∂x^j/∂xⁱ)dxⁱ segue dx^j/dx^j=(∂x^j/∂xⁱ)(∂xⁱ/∂x^j)=1.

Calcoliamo ora la derivata del vettore T=Tⁱe_i lungo una coordinata x^j qualsiasi, questa sarà definita (come derivata di una funzione prodotto):

∂T/∂x^j=∂(Tⁱe_i )/∂x^j=(∂Tⁱ/∂x^j)e_i+Tⁱ(∂e_i/∂x^j)

dove il termine ∂e_i/∂x^j tiene conto della possibile variazione delle basi e_i rispetto alle coordinate x^j: questa derivata è detta derivata covariante e in pratica estende il concetto usuale di derivata direzionale.
Nota: si dice derivata covariante perché preserva il carattere di invarianza rispetto alla trasformazione di coordinate (vedi il relativo post).

Si osservi che se le coordinate sono cartesiane, allora le basi non variano in funzione delle coordinate (cioè mantengono sempre stesso modulo e direzione in ogni punto e quindi ∂e_i/∂x^j=0); in tal caso la derivata si riduce alla classica derivata direzionale (calcolata cioè lungo l'asse coordinato x^j):

∂T/∂x^j=(∂Tⁱ/∂x^j)e_i

dove ricordiamo T è un vettore n-dimensionale (con i,j=1,..., n).

Tuttavia nel caso più generale di coordinate curvilinee il modulo e la direzione delle basi può variare da punto a punto e quindi il termine ∂e_i/∂x^j è generalmente diverso da zero*.

Vediamo quindi un esempio riprendendo le coordinate curve polari (r,θ) introdotte nel precedente post e le relative basi (e_r,e_θ) ottenute in funzione delle coordinate cartesiane (e_x,e_y):

e_r=cosθe_x+sinθe_y

e_θ=-rsinθe_x+rcosθe_y.

ricordando che il vettore T si esprime come (con i=r,θ):

T=Tⁱe_i=T^re_r+T^θe_θ.

In questo caso particolare i valori dei termini ∂e_i/∂x^j espressi in funzione di e_r e e_θ sono (con i,j=r,θ):

∂e_r/∂r=∂(cosθe_x+sinθe_y)/∂r=0
∂e_r/∂θ=-sinθe_x+cosθe_y=(1/r)e_θ
∂e_θ/∂r=-sinθe_x+cosθe_y=(1/r)e_θ
∂e_θ/∂θ=-rcosθe_x-rsinθe_y=-re_r

dove notiamo che ∂e_r/∂θ=∂e_θ/∂r e infatti in generale risulta:

∂e_i/∂x^j=∂e_j/∂xⁱ.

Nota: ciò accade in generale quando le derivate seconde incrociate sono uguali**, per le funzioni lisce questa condizione è sempre soddisfatta.

Perciò le derivate rispetto ad r e θ del vettore T sono (con i=r,θ):

∂T/∂r=∂(Tⁱe_i )/∂r=(∂Tⁱ/∂r)e_i+T^r(∂e_r/∂r)+T^θ(∂e_θ/∂r)
∂T/∂θ=∂(Tⁱe_i )/∂θ=(∂Tⁱ/∂θ)e_i+T^r(∂e_r/∂θ)+T^θ(∂e_θ/∂θ)

e quindi sostituendo i valori delle derivate delle basi ottenuti sopra:

∂T/∂r=(∂Tⁱ/∂r)e_i+(1/r)T^θe_θ
∂T/∂θ=(∂Tⁱ/∂θ)e_i+(1/r)T^re_θ-rT^θe_r.

Si osservi in particolare che se supponiamo che le componenti di T lungo r e θ non variano (cioè se ∂Tⁱ/∂r=0 e ∂Tⁱ/∂θ=0) si ottiene:

∂T/∂r=(1/r)T^θe_θ
∂T/∂θ=(1/r)T^re_θ-rT^θe_r

in questo caso si ha cioè il contributo dovuto alla sola variazione delle basi.
Nota: è evidente che il punto r=0 deve essere escluso, infatti qui le coordinate non sono invertibili come richiesto***.

Se infine vogliamo che T venga trasportato parallelamente rispetto alla superficie curva, dovremo annullare la derivata covariante ponendo:

∂T/∂r=0 e ∂T/∂θ=0

cioè dovremo annullare i valori delle componenti delle derivate parziali ottenuti sopra, rispettivamente lungo e_r ed e_θ.
Nota: si osservi che per avere trasporto paralleo le componenti di T devono variare affinché ∂T/∂r e ∂T/∂θ si possano annullare (altrimenti si dovrebbe porre T^r=0 e T^θ=0, vedi sopra il caso con T costante).

(*) Solitamente nella derivata covariante per indicare i termini (∂e_i/∂x^j) si usano i simboli di Christoffel del secondo tipo così definiti: Γ^k_i_j=(∂e_i/∂x^j)e_k. Perciò ∂T/∂x^j=(∂Tⁱ/∂x^j)e_i+TⁱΓ^k_i_je_k=(∂Tⁱ/∂x^j+T^kΓⁱ_k_j)e_i (scambiando k con i).
(**) Dalle seguenti relazioni tra basi (vedi il precedente post):
e_r=(∂x/∂r)e_x+(∂y/∂r)e_y e e_θ=(∂x/∂θ)e_x+(∂y/∂θ)e_y si ottiene derivando

∂e_r/∂θ=(∂x/∂r∂θ)e_x+(∂y/∂r∂θ)e_y e e_θ/∂r=(∂x/∂θ∂r)e_x+(∂y/∂θ∂r)e_y
da cui si ha: ∂e_r/∂θ=e_θ/∂r se ∂x/∂r∂θ=∂x/∂θ∂r e ∂y/∂r∂θ=∂y/∂θ∂r (cvd).

(***) Condizione generale affinché le coordinate siano invertibili è che il determinante della matrice Jacobiana non si annulli.

[Una ottima esposizione di questi concetti si trova nella Playlist Video di Dermot Green - Queen's University Belfast]

Base locale e derivata covariante (prima parte)

Come è noto un sistema di riferimento cartesiano è formato da n rette ortogonali che si intersecano in un punto O detto origine, ognuna delle rette è orientata e riporta una unità di misura: in questo modo è possibile identificare qualsiasi punto dello spazio euclideo Rⁿ con una n-upla di numeri reali (x¹, x²,..., xⁿ) in modo univoco (vedi Wikipedia).

Generalizzando è possibile costruire geometricamente, a partire da un sistema di riferimento cartesiano, un altro riferimento qualsiasi detto curvilineo, che avrà lo stesso numero di coordinate ma nel quale le linee coordinate sono generalmente delle curve (vedi Wikipedia).

Ad esempio, come avevamo già visto nel post "Trasformazioni di basi, vettori e... co-vettori!", consideriamo un sistema di coordinate cartesiano bidimensionale (x¹,x²) e un nuovo sistema di coordinate curvilinee (x¹,x²) che sono note in funzione delle prime*:

x¹=x¹(x¹,x²) , x²=x²(x¹,x²)

e dove vale anche la trasformazione inversa:

x¹=x¹(x¹,x²) , x²=x²(x¹,x²)

ed inoltre tali funzioni sono per definizione differenziabili (funzioni lisce).
Nota: le coordinate devono essere indipendenti e quindi ∂xⁱ/∂x^j=δ_ij cioè ∂xⁱ/∂x^j=0 se i≠j e ∂xⁱ/∂x^j=1 solo se i=j (δ_ij è la delta di Kronecker).

Consideriamo ad esempio il riferimento cartesiano rappresentato in figura dove è indicata la retta x¹ e il relativo vettore di base unitario e₁ con origine nel punto O da cui parte una linea curva coordinata x¹ con vettore di base unitario e₁ ad essa tangente come illustrato in figura:

Ora si osservi che tra il tratto infinitesimo dx¹ della retta x¹ e il tratto infinitesimo dx¹ tangente alla linea curva x¹ (che quindi approssima la linea in quel punto) esiste la seguente relazione trigonometrica:

dx¹=dx¹cosα

e quindi la proiezione del vettore di base e₁ sulla retta x¹ è pari a

|e₁|cosα=|e₁|(dx¹/dx¹)

dove |e₁|=1 è il modulo unitario di e₁ mentre α è l'angolo tra dx¹ e dx¹.
In modo equivalente la proiezione del vettore di base e₁ sulla retta x² è:

|e₁|sinα=|e₁|(dx²/dx¹)

valendo di nuovo la relazione trigonometrica:

dx²=dx¹sinα.

Perciò la nuova base locale e₁ espressa in funzione delle basi cartesiane e₁ ed e₂ (che ricordiamo sono per semplicità tutti vettori di modulo 1) è:

e₁=(|e₁|cosα)e₁+(|e₁|sinα)e₂

e quindi utilizzando le relazioni ricavate sopra

e₁=(∂x¹/∂x¹)e₁+(∂x²/∂x¹)e₂

avendo posto |e₁|=|e₂|=1 e ∂x¹/∂x¹=cosα , ∂x²/∂x¹=sinα.
Nota: abbiamo indicato le derivate parziali dato che le coordinate sono funzioni di più variabili.

Si osservi però che dal rapporto trigonometrico di due infinitesimi come dx¹/dx¹ e dx²/dx¹ siamo passati alle derivate parziali ∂x¹/∂x¹ e ∂x²/∂x¹ supponendo (correttamente) che la variazione di x¹ rispetto a x¹ e quella di x² sempre rispetto a x¹ siano rispettivamente pari a cosα e sinα.
Nota: ciò è vero poiché x¹ approssima (nell'origine) la coordinata di un riferimento ruotato di un angolo α rispetto a quello cartesiano (x¹, x²)**.

In modo analogo per la base e₂ si ha (anche se non è mostrato in figura):

e₂=(∂x¹/∂x²)e₁+(∂x²/∂x²)e₂

dove ricordiamo che le basi sono state tutte normalizzate:

|e₁|=|e₂|=1 e |e₁|=|e₂|=1.

Nota: per costruzione geometrica le basi (e₁,e₂) sono tangenti alle linee coordinate (x¹,x²) e ciò vale in generale per più coordinate.

Se viceversa volessimo derivare le basi cartesiane e₁ e e₂ a partire da quelle curvilinee e₁ e e₂ un ragionamento analogo ci porterebbe ad ottenere:

e₁=(∂x¹/∂x¹)e₁+(∂x²/∂x¹)e₂

e₂=(∂x¹/∂x²)e₁+(∂x²/∂x²)e₂.

che rappresentano le relazioni inverse di quelle prima ottenute.

Quindi riscrivendo quanto abbiamo ottenuto sopra in forma più generale (applicando la notazione di Einstein sugli indici ripetuti) si ha:

e_i=(∂x^j/∂xⁱ)e_j , e_i=(∂x^j/∂xⁱ)e_j

dove gli indici i,j=1,..., n indicano il numero di coordinate e le relative basi.
Nota: si osservi che gli elementi (∂x^j/∂xⁱ) e (∂x^j/∂xⁱ) definiscono rispettivamente la matrice jacobiana e la sua inversa.

Ma facciamo subito un esempio introducendo le coordinate curvilinee (r,θ) (ponendo cioè x¹=r e x²=θ) dove r≥0 è la distanza dall'origine (polo) mentre 0≤θ≤2π è l'angolo tra r e l'asse X (coordinate polari).

Per calcolare le nuove basi e₁=e_r e e₂=e_θ è utile definire le coordinate cartesiane (x,y) in funzione delle nuove coordinate (r,θ):

x(r,θ)=rcosθ , y(r,θ)=rsinθ.

Possiamo quindi ottenere le nuove basi e_r e e_θ utilizzando le equazioni alle derivate parziali ottenute sopra (dove x¹=r e x²=θ):

e_r=(∂x/∂r)e_x+(∂y/∂r)e_y

e_θ=(∂x/∂θ)e_x+(∂y/∂θ)e_y.

Perciò le basi del nuovo riferimento curvilineo di coordinate (r,θ) espresse in funzione delle basi cartesiane note e_x ed e_y sono:

e_r=cosθe_x+sinθe_y

e_θ=-rsinθe_x+rcosθe_y

ed inoltre essendo perpendicolari il loro prodotto scalare è nullo:

<e_r,e_θ>=-rcosθsinθ+rsinθcosθ=0.

Nota: la base e_θ non è unitaria poiché risulta |e_θ|=r tuttavia possiamo porre come base unitaria θ=-sinθe_x+cosθe_y e quindi e_θ=rθ.

È importante osservare che le basi e_r e e_θ dipendono dalle coordinate (r,θ) come in effetti capita generalmente per le basi curvilinee: viceversa le basi cartesiane e_x ed e_y sono sempre le stesse in ogni punto dello spazio.

Come vedremo nel prossimo post le relazioni ricavate sopra saranno utili per definire la trasformazione di un vettore affinché resti invariato quando passa da un riferimento ad un altro e definiremo la sua derivata covariante.

(*) Ricordiamo che gli apici indicano entità che si trasformano in modo controvariante (come le componenti di un vettore) mentre i pedici indicano entità che si trasformano in modo covariante (come ad esempio le relative basi) come descritto in "Trasformazioni di basi, vettori e... co-vettori!".
(**) In due dimensioni la trasformazione delle coordinate per una rotazione degli assi è: x¹=x¹cosα-x²sinα , x²=x¹sinα+x²cosα da cui segue subito ∂x¹/∂x¹=cosα , ∂x²/∂x¹=sinα come già derivato sopra.

[Una ottima esposizione di questi concetti si trova nella Playlist Video di Dermot Green - Queen's University Belfast]

mercoledì 8 marzo 2023

La Sfera di Bloch

È noto che lo stato quantistico di un qubit (quantum bit) è così definito:

|Ψ>=α|0>+β|1>

dove α e β sono numeri complessi che devono soddisfare la condizione:

|α|²+|β|²=1

per la normalizzazione a 1 della probabilità complessiva P=|α|²+|β|².
Nota: i coefficienti |α|² e |β|² rappresentano rispettivamente la probabilità che si verifichi lo stato |0> oppure |1>.

Ricordiamo che valendo la formula di Eulero e^iø=cosø+isinø, in generale per un numero complesso x+iy si può scrivere:

x+iy=r(cosø+isinø)=re^iø

dove r=(x²+y²)^1/2 è il modulo e ø=arctan(y/x) è l'angolo tra r e la sua proiezione sull'asse X (pari a rcosø). Inoltre ricordiamo che vale la relazione:

|x+iy|²=|re^iø|²=r²(e^iøe^-iø)=r²

poiché |e^iø|²=(e^iøe^-iø)=1 essendo e^-iø il complesso coniugato di e^iø.
Nota: è noto che il modulo al quadrato di un numero complesso è dato dal prodotto di quel numero per il suo coniugato.

Quindi possiamo porre per i coefficienti complessi α e β:

α=r₁e^iø₁ e β=r₂e^iø2

dove ø₁ e ø₂ sono due angoli qualsiasi compresi tra 0 e 2π.
Se inoltre poniamo r₁=rcosθ e r₂=rsinθ con r=1 si ha come richiesto:

|α|²+|β|²=|r₁e^iø₁|²+|r₂e^iø₂|²=cosθ²+sinθ²=1

poiché |e^iø₁|²=|e^iø₂|²=1 come visto sopra.

Quindi per lo stato di un qubit vale la seguente relazione:

|Ψ>=α|0>+β|1>=cosθ(e^iø₁)|0>+sinθ(e^iø₂)|1>

definita in funzione degli angoli θ, ø₁ e ø₂ (di cui daremo di seguito una rappresentazione geometrica).

Si osservi però che moltiplicando lo stato |Ψ> per e^-iø₁ si ottiene un nuovo stato |Ψ'>=e^-iø₁|Ψ>:

|Ψ'>=e^-iø₁|Ψ>=e^-iø₁(α|0>+β|1>)=cosθ|0>+sinθ(e^iø)|1>

dove ø=ø₂-ø₁. Tuttavia la probabilità degli stati |0> e |1> resta invariata infatti:

|e^-iø₁α|²=(e^-iø₁α)(e^-iø₁α)*=(e^-iø₁e^iø₁)(αα*)=|α|²

e lo stesso vale per |e^-iø₁β|²=|β|².
Nota: qui il simbolo (*) indica il valore coniugato del numero complesso.

Perciò possiamo omettere il termine e^-iø₁ dallo stato |Ψ'> poiché non ha effetti osservabili sperimentalmente e possiamo riscrivere:

|Ψ'> => |Ψ>=cosθ|0>+sinθ(e^iø)|1>.

Infine per ottenere una rappresentazione geometrica riscriviamo |Ψ> in funzione delle variabili x, iy e z ponendo:

cosθ=z

sinθ(e^iø)=sinθcosø+isinθsinø=x+iy

o in modo equivalente

x=sinθcosø
y=sinθsinø
z=cosθ.

Ciò significa che se x, y e z vengono interpretate come coordinate, esse rappresentano le coordinate polari di una sfera di raggio unitario* |Ψ|=1:

Perciò lo stato |Ψ> in funzione delle coordinate x, iy e z diventa:

|Ψ>=cosθ|0>+sinθ(e^iø)|1>=z|0>+(x+iy)|1>

|Ψ>=cos(θ/2)|0>+sin(θ/2)(e^iø)|1>

in modo che possiamo far variare 0≤θ≤π e 0≤ø<2π.

Questa rappresentazione geometrica*** dello spazio degli stati puri di un sistema quantistico a 2 stati è detta sfera di Bloch (vedi Wikipedia).

(*) Risulta |Ψ|²=<Ψ|Ψ>=(<0|α*+<1|β*)|(α|0>+β|1>)=α*α+β*β=1 essendo <0|0>=1, <0|1>=0, <1|0>=0 e <1|1>=1 per l'ortogonalità di |0> e |1>.
(**) Se poniamo θ=π/2 allora |Ψ>=e^iø|1> che è equivalente a |Ψ>=|1> essendo |e^iø|² =1 (cioè la probabilità dello stato |1> non cambia).
(***) Correttamente risulta per le probabilità dei due stati:
|cos(θ/2)|²+|sin(θ/2)(e^iø)|²=cos²(θ/2)+sin²(θ/2)=1 essendo |e^iø|² =1.

martedì 23 marzo 2021

È possibile un modello esteso dell'elettrone?

È noto che nel Modello Standard le particelle elementari vengono considerate a tutti gli effetti come puntiformi, tuttavia ciò porta a valori infiniti per alcune quantità che le caratterizzano, legate alle mutue interazioni tra particelle e campi.
Nota: con l'aggettivo puntiforme si intende una particella elementare priva di qualsiasi struttura interna.

Vediamo infatti come si definisce l'energia di una particella carica di massa a riposo m nella teoria classica (relativistica), considerando l'energia del campo elettrostatico da essa generato oltre alla sua energia di massa (vedi Wikipedia):

mc²=m₀c²+(1/2)∫ ε₀E²dV (1.1)

dove m₀ è la massa nuda della particella priva di campo elettrico* mentre E=F/e=e/4πε₀R² è il campo elettrico a distanza R dalla particella, F è la forza di Coulomb ed ε₀ è la permittività elettrica del vuoto.
Nota: in tutti i post useremo, anche se non dichiarate, le unità di misura del sistema metrico internazionale SI.

Se, ad esempio, integriamo tra il raggio r ipotetico di un elettrone e il volume V=(4/3)πR³ che lo circonda all'infinito si ha:

(1/2)∫ ε₀E²4πR²dR=(1/2)∫ (e²/4πε₀R²)dR (1.2)

posto dV=4πR²dR ed essendo E=e/4πε₀R².
Quindi calcolando l'integrale tra il raggio r ed infinito si ottiene:

-(e²/8πε₀R)|_r^∞=e²/8πε₀r (1.3)

per cui l'energia complessiva dell'elettrone con il suo campo è (secondo la eq.1.1):

mc²=m₀c²+e²/8πε₀r (1.4)

ciò significa che se l'elettrone è puntiforme (cioè r -> 0) allora la sua energia mc² tende come anticipato ad infinito!

Nelle teorie di campo quantistiche l'approccio è più complesso di quanto esposto qui, tuttavia si devono comunque usare procedure matematiche di rinormalizzazione per eliminare le divergenze che insorgono nei calcoli, come ad esempio quello che determina l'anomalia magnetica dell'elettrone.

In un blog dedicato mostreremo come sia possibile definire, secondo una proposta dell'autore, un modello esteso dell'elettrone dove tutte le quantità che lo definiscono sono finite.

Dovremo però tenere conto, nello sviluppo del modello e.m. esteso, che le attuali misure sperimentali indicano una dimensione della carica elettrica non superiore a circa 10^-19 metri, che è la migliore risoluzione degli odierni acceleratori di particelle (tale risoluzione è dell'ordine della lunghezza d'onda λ delle particelle-sonda)**.

Nota: come vedremo in un Blog dedicato la carica elettrica del modello esteso è assunta come puntiforme mentre è la massa ad essere distribuita in modo esteso sulla superficie del modello.

(*) La massa nuda m₀ è un parametro libero della teoria che non è possibile misurare direttamente: non possiamo in effetti separare una particella carica dal campo elettrico che essa stessa genera.

(**) Dato che le particelle circolano negli acceleratori a velocità v prossime a c si ha E=hc²/λv≈hc/λ da cui λ≈hc/E e per E=14 TeV (energia massima oggi raggiungibile) si ha λ≈10^-19 m (si ricordi che 1 eV≈1,6x10^-19 Joule).
[Ricordiamo che per una particella di massa m si ha E=mc² e p=mv da cui p=Ev/c² ed essendo p=h/λ segue E=hc²/λv]

ATTENZIONE
Per il seguito di questo post vedi il Blog: Electron Extended Model dove verrà proposto dall'autore un modello dell'elettrone non puntiforme.

INDICE DEI POST