Equazione di Dirac
L’equazione di Dirac nella forma originariamente proposta da Dirac è:
( β m c 2 + c ∑ n = 1 3 α n p n ) ψ ( x , t ) = i ℏ ∂ ψ ( x , t ) ∂ t {displaystyle \left(\beta mc^{2}+c\sum _{n\mathop {=} 1}^{3}alpha _{n}p_{n}\destra)\psi (x,t)=i\hbar {\frac {\parziale \psi (x,t)}}
dove ψ = ψ(x, t) è la funzione d’onda per l’elettrone di massa a riposo m con coordinate spaziali x, t. Le p1, p2, p3 sono le componenti della quantità di moto, intesa come operatore di quantità di moto nell’equazione di Schrödinger. Inoltre, c è la velocità della luce e ħ è la costante di Planck ridotta. Queste costanti fisiche fondamentali riflettono rispettivamente la relatività speciale e la meccanica quantistica.
Lo scopo di Dirac nel gettare questa equazione era quello di spiegare il comportamento dell’elettrone in movimento relativistico, e quindi di permettere all’atomo di essere trattato in modo coerente con la relatività. La sua speranza piuttosto modesta era che le correzioni introdotte in questo modo potessero avere un’influenza sul problema degli spettri atomici.
Fino a quel momento, i tentativi di rendere la vecchia teoria quantistica dell’atomo compatibile con la teoria della relatività, tentativi basati sulla discretizzazione del momento angolare immagazzinato nell’orbita possibilmente non circolare dell’elettrone nel nucleo atomico, erano falliti – e la nuova meccanica quantistica di Heisenberg, Pauli, Jordan, Schrödinger e Dirac stesso non si era sviluppata abbastanza per trattare questo problema. Anche se le intenzioni originali di Dirac furono soddisfatte, la sua equazione aveva implicazioni molto più profonde per la struttura della materia e introdusse nuove classi matematiche di oggetti che ora sono elementi essenziali della fisica fondamentale.
I nuovi elementi in questa equazione sono le quattro matrici 4 × 4 α1, α2 , α3 e β, e la funzione d’onda a quattro componenti ψ. Ci sono quattro componenti in ψ perché la valutazione di esso in qualsiasi punto dello spazio di configurazione è un bispessore. Essa è interpretata come una sovrapposizione di un elettrone di spin-up, un elettrone di spin-down, un positrone di spin-up, e un positrone di spin-down (vedi sotto per ulteriori discussioni).
Le matrici 4 × 4 αk e β sono tutte ermitiane e sono involutive:
α i 2 = β 2 = I 4 {\displaystyle \alpha _{i}^{2}=\beta ^{2}=I_{4}}
e sono tutti reciprocamente anticommutati:
α i α j + α j α i = 0 ( i ≠ j ) {\displaystyle \alpha _{i}+alpha _{j}+alpha _{j}=0\quadro (i\neq j)}
α i β + β α i = 0 {\displaystyle \alpha _{i}\beta +\beta \alpha _{i}=0}
Queste matrici e la forma della funzione d’onda hanno un profondo significato matematico. La struttura algebrica rappresentata dalle matrici gamma era stata creata circa 50 anni prima dal matematico inglese W. K. Clifford. A sua volta, le idee di Clifford erano emerse dal lavoro della metà del 19° secolo del matematico tedesco Hermann Grassmann nella sua Lineale Ausdehnungslehre (Teoria delle estensioni lineari). Quest’ultima era stata considerata quasi incomprensibile dalla maggior parte dei suoi contemporanei. L’apparizione di qualcosa di così apparentemente astratto, in una data così tarda, e in un modo fisico così diretto, è uno dei capitoli più notevoli nella storia della fisica.
La singola equazione simbolica si dipana così in quattro equazioni differenziali parziali del primo ordine lineari accoppiate per le quattro quantità che compongono la funzione d’onda. L’equazione può essere scritta più esplicitamente in unità Planck come:
i ∂ t = i ∂ x + ∂ y + i ∂ z + m {displaystyle i ∂parziale _{t}{begin{bmatrix}{psi _{1}{psi _{2}{psi _{3}{psi _{4}end{bmatrix}}= i ∂parziale _{x}{begin{batrix}-\psi _{4}-\psi _{3}-\psi _{2}-\psi _{1}fine{bmatrice}}+parziale _{y}{begin{bmatrix}-\psi _{4}+psi _{3}\psi _{2}+psi _{1}fine{bmatrice}}+iparziale _{z}{begin{bmatrix}- \psi _{3}+psi _{4}-\psi _{1}+psi _{2}end{bmatrix}}+m{begin{bmatrix}+psi _{1}+psi _{2}-\psi _{3}-\psi _{4}end{bmatrix}}
che rende più chiaro che si tratta di un insieme di quattro equazioni differenziali parziali con quattro funzioni sconosciute.
Rendere l’equazione di Schrödinger relativisticaModifica
L’equazione di Dirac è superficialmente simile all’equazione di Schrödinger per una particella libera massiva:
– ℏ 2 2 m ∇ 2 ϕ = i ℏ ∂ ∂ t ϕ .
Il lato sinistro rappresenta il quadrato dell’operatore di quantità di moto diviso per il doppio della massa, che è l’energia cinetica non relativistica. Poiché la relatività tratta lo spazio e il tempo come un tutt’uno, una generalizzazione relativistica di questa equazione richiede che le derivate dello spazio e del tempo entrino simmetricamente come fanno nelle equazioni di Maxwell che governano il comportamento della luce – le equazioni devono essere differentemente dello stesso ordine nello spazio e nel tempo. Nella relatività, la quantità di moto e le energie sono le parti spazio e tempo di un vettore spazio-tempo, il quadrimomento, e sono correlate dalla relazione relativisticamente invariante
E 2 = m 2 c 4 + p 2 c 2 {displaystyle E^{2}=m^{2}c^{4}+p^{2}c^{2}}
che dice che la lunghezza di questo quadrivettore è proporzionale alla massa a riposo m. Sostituendo gli operatori equivalenti dell’energia e della quantità di moto dalla teoria di Schrödinger, otteniamo l’equazione di Klein-Gordon che descrive la propagazione delle onde, costruita da oggetti relativisticamente invarianti,
( – 1 c 2 ∂ 2 ∂ t 2 + ∇ 2 ) ϕ = m 2 c 2 ℏ 2 ϕ {\displaystyle \left(-{frac {1}{c^{2}}}{frac {\frac ^{2}}parziale t^{2}}+nabla ^{2}}}right)\phi ={frac {m^{2}c^{2}}{{hbar ^{2}}}}}phi
con funzione d’onda ϕ uno scalare relativistico: un numero complesso che ha lo stesso valore numerico in tutti i quadri di riferimento. Le derivate dello spazio e del tempo entrano entrambe al secondo ordine. Questo ha una conseguenza significativa per l’interpretazione dell’equazione. Poiché l’equazione è del secondo ordine nella derivata del tempo, si devono specificare i valori iniziali sia della funzione d’onda stessa che della sua prima derivata del tempo per risolvere problemi definiti. Poiché entrambi possono essere specificati più o meno arbitrariamente, la funzione d’onda non può mantenere il suo precedente ruolo di determinare la densità di probabilità di trovare l’elettrone in un dato stato di moto. Nella teoria di Schrödinger, la densità di probabilità è data dall’espressione definita positiva
ρ = ϕ ∗ ϕ {\displaystyle \rho =\phi ^{*}\phi }
e questa densità è convogliata secondo il vettore corrente di probabilità
J = – i ℏ 2 m ( ϕ ∗ ∇ ϕ – ϕ ∇ ϕ ∗ ) {\displaystyle J=-{\frac {i\hbar }{2m}}(\phi ^{*}\nabla \phi -\phi \nabla \phi ^{*})}
con la conservazione della corrente di probabilità e della densità che segue dall’equazione di continuità:
∇ ⋅ J + ∂ ρ ∂ t = 0 . {J + ∇ ∂ ∂ ∂ ∂ ∂ t}=0~.}
Il fatto che la densità sia definita positivamente e convogliata secondo questa equazione di continuità implica che possiamo integrare la densità su un certo dominio e fissare il totale a 1, e questa condizione sarà mantenuta dalla legge di conservazione. Una corretta teoria relativistica con una corrente di densità probabilistica deve anche condividere questa caratteristica. Ora, se vogliamo mantenere la nozione di densità convessa, allora dobbiamo generalizzare l’espressione di Schrödinger della densità e della corrente in modo che le derivate dello spazio e del tempo entrino nuovamente in modo simmetrico rispetto alla funzione d’onda scalare. Possiamo mantenere l’espressione di Schrödinger per la corrente, ma dobbiamo sostituire la densità di probabilità con l’espressione simmetrica
ρ = i ℏ 2 m c 2 ( ψ ∗ ∂ t ψ – ψ ∂ t ψ ∗ ) . {\displaystyle \rho ={frac {i\hbar }{2mc^{2}}(\psi ^{*}\parziale _{t}\psi -\psi \parziale _{t}\psi ^{*})~.}
che ora diventa la quarta componente di un vettore spaziale, e l’intera densità di probabilità 4-corrente ha l’espressione relativisticamente covariante
J μ = i ℏ 2 m ( ψ ∗ ∂ μ ψ – ψ ∂ μ ψ ∗ ) . {displaystyle J^{{mu }={frac {i\hbar }{2m}}(\psi ^{*}parziale ^{mu }psi – \psi ^{mu ^{*})~.}
L’equazione di continuità è come prima. Ora tutto è compatibile con la relatività, ma vediamo subito che l’espressione per la densità non è più definita positivamente – i valori iniziali sia di ψ che di ∂tψ possono essere scelti liberamente, e la densità può quindi diventare negativa, cosa impossibile per una densità di probabilità legittima. Così, non possiamo ottenere una semplice generalizzazione dell’equazione di Schrödinger sotto l’assunzione ingenua che la funzione d’onda sia uno scalare relativistico, e l’equazione che soddisfa, di secondo ordine nel tempo.
Anche se non è una generalizzazione relativistica di successo dell’equazione di Schrödinger, questa equazione è risorta nel contesto della teoria quantistica dei campi, dove è nota come equazione di Klein-Gordon, e descrive un campo di particelle senza spin (ad esempio il mesone pi o il bosone di Higgs). Storicamente, Schrödinger stesso arrivò a questa equazione prima di quella che porta il suo nome, ma presto la scartò. Nel contesto della teoria quantistica dei campi, la densità indefinita è intesa come corrispondente alla densità di carica, che può essere positiva o negativa, e non alla densità di probabilità.
Il colpo di DiracEdit
Dirac pensò così di tentare un’equazione che fosse del primo ordine sia nello spazio che nel tempo. Si potrebbe, per esempio, formalmente (cioè abusando della notazione) prendere l’espressione relativistica per l’energia
E = c p 2 + m 2 c 2 , {displaystyle E=c{sqrt {p^{2}+m^{2}c^{2}}~,}
sostituire p con il suo equivalente operatore, espandere la radice quadrata in una serie infinita di operatori derivati, impostare un problema di autovalori, quindi risolvere l’equazione formalmente per iterazioni. La maggior parte dei fisici aveva poca fiducia in un tale processo, anche se era tecnicamente possibile.
Secondo la storia, Dirac stava fissando il camino a Cambridge, riflettendo su questo problema, quando gli venne l’idea di prendere la radice quadrata dell’operatore d’onda così:
∇ 2 – 1 c 2 ∂ 2 ∂ t 2 = ( A ∂ x + B ∂ y + C ∂ z + i c D ∂ t ) ( A ∂ x + B ∂ y + C ∂ z + i c D ∂ t ) . {\displaystyle \nabla ^{2}-{\frac {1}{c^{2}}}{frac {\frac {\parziale ^{2}}}{{parziale t^{2}}}==sinistra(A\parziale _{x}+B\parziale _{y}+C\parziale _{z}+{\frac {i}{c}} D\partial _{t}}destra)\left(A\partial _{x}+B\partial _{y}+C\partial _{z}+{frac {i}{c}}D\partial _{t}destra)~.}
Moltiplicando il lato destro vediamo che, per far svanire tutti i termini incrociati come ∂x∂y, dobbiamo assumere
A B + B A = 0 , … {\displaystyle AB+BA=0,~\ldots ~}
con
A 2 = B 2 = … = 1 . {A ^{2}=B ^{2}==1~.}
Dirac, che proprio allora era stato intensamente coinvolto nell’elaborazione dei fondamenti della meccanica delle matrici di Heisenberg, capì immediatamente che queste condizioni potevano essere soddisfatte se A, B, C e D sono matrici, con l’implicazione che la funzione d’onda ha componenti multiple. Questo spiegava immediatamente la comparsa di funzioni d’onda a due componenti nella teoria fenomenologica di Pauli dello spin, qualcosa che fino ad allora era stato considerato misterioso, anche per Pauli stesso. Tuttavia, si ha bisogno di almeno 4 × 4 matrici per impostare un sistema con le proprietà richieste – così la funzione d’onda aveva quattro componenti, non due, come nella teoria di Pauli, o una, come nella nuda teoria di Schrödinger. La funzione d’onda a quattro componenti rappresenta una nuova classe di oggetti matematici nelle teorie fisiche che fa qui la sua prima apparizione.
Data la fattorizzazione in termini di queste matrici, si può ora scrivere immediatamente un’equazione
( A ∂ x + B ∂ y + C ∂ z + i c D ∂ t ) ψ = κ ψ {\displaystyle \sinistra(A{parziale _{x}+B{y}+C{parziale _{z}+{frac {i}{c}}D{parziale _{t}}destra)\psi = \kappa \psi }
con κ {displaystyle \kappa }
da determinare. Applicando nuovamente l’operatore di matrice su entrambi i lati si ottiene ( ∇ 2 – 1 c 2 ∂ t 2 ) ψ = κ 2 ψ . {\displaystyle \left(\nabla ^{2}-{frac {1}{c^{2}}}parziale _{t}^{2}}right)\psi =\kappa ^{2}\psi ~.}
Prendendo κ = m c ℏ {displaystyle \kappa ={tfrac {mc}{hbar }}
troviamo che tutte le componenti della funzione d’onda soddisfano individualmente la relazione energia-momento relativistica. Così l’equazione cercata che è di primo ordine sia nello spazio che nel tempo è ( A ∂ x + B ∂ y + C ∂ z + i c D ∂ t – m c ℏ ) ψ = 0 . {displaystyle \left(A{parziale _{x}+B{y}+C{parziale _{z}+{frac {i}{c}}D{parziale _{t}-{frac {mc}{hbar}{right)\psi =0~.}
Impostazione
A = i β α 1 , B = i β α 2 , C = i β α 3 , D = β , {\displaystyle A=i\beta \alpha _{1},,\,B=i\beta \alfa _{2},\,C=i\beta \alfa _{3},\,D=\beta ~,}
e poiché D 2 = β 2 = I 4 , {\displaystyle D^{2}=\beta ^{2}=I_{4}~,
otteniamo l’equazione di Dirac come scritto sopra.
Forma covariante e invarianza relativisticaModifica
Per dimostrare l’invarianza relativistica dell’equazione, è vantaggioso metterla in una forma in cui le derivate dello spazio e del tempo appaiono su un piano di parità. Si introducono nuove matrici come segue:
D = γ 0 , {displaystyle D=\gamma ^{0}~,}
A = i γ 1 , B = i γ 2 , C = i γ 3 ,
e l’equazione assume la forma (ricordando la definizione delle componenti covarianti del 4-e soprattutto che ∂0 = 1/c∂t )
i ℏ γ μ ∂ μ ψ – m c ψ = 0 {\displaystyle i\hbar \gamma ^{\mu }parziale _{\mu }psi -mc\psi =0}
dove c’è una sommatoria implicita sui valori dell’indice ripetuto due volte μ = 0, 1, 2, 3, e ∂μ è il gradiente 4. In pratica si scrivono spesso le matrici gamma in termini di sottomatrici 2 × 2 prese dalle matrici di Pauli e dalla matrice 2 × 2 identità. Esplicitamente la rappresentazione standard è
γ 0 = ( I 2 0 0 – I 2 ) , γ 1 = ( 0 σ x – σ x 0 ) , γ 2 = ( 0 σ y – σ y 0 ) , γ 3 = ( 0 σ z – σ z 0 ) . {\displaystyle \gamma ^{0}={\begin{pmatrix}I_{2}&0\\0&-I_{2}\end{pmatrix}}~,\gamma ^{1}=\left({\begin{array}{cccc}0&\sigma _{x}\\-\sigma _{x}&0\end{array}}\right)~,\gamma ^{2}=\left({\begin{array}{cccc}0&\sigma _{y}\\-\sigma _{y}&0\end{array}}\right)~,\gamma ^{3}=\left({\begin{array}{cccc}0&\sigma _{z}\\-\sigma _{z}&0\end{array}}\right)~.}
Il sistema completo è riassunto usando la metrica di Minkowski sullo spaziotempo nella forma
{ γ μ , γ ν } = 2 η μ ν I 4 {displaystyle \gamma ^{\mu },\gamma ^{\nu }}=2\eta ^{\mu \nu }I_{4}
dove l’espressione parentetica
{ a , b } = a b + b a {displaystyle \{a,b}=ab+ba}
dichiara l’anticommutatore. Queste sono le relazioni di definizione di un’algebra di Clifford su uno spazio pseudo-ortogonale di 4 dimensioni con firma metrica (+ – – -). L’algebra di Clifford specifica impiegata nell’equazione di Dirac è nota oggi come algebra di Dirac. Anche se non riconosciuta come tale da Dirac al momento della formulazione dell’equazione, col senno di poi l’introduzione di questa algebra geometrica rappresenta un enorme passo avanti nello sviluppo della teoria quantistica.
L’equazione di Dirac può ora essere interpretata come un’equazione di autovalore, dove la massa a riposo è proporzionale a un autovalore dell’operatore 4-momento, la costante di proporzionalità essendo la velocità della luce:
P o p ψ = m c ψ . {P_{mathrm {op} =mc\psi ~.}
( ∂ / {\displaystyle \parziale \mu!\big /}}}
si pronuncia “d-slash”), secondo la notazione Feynman slash, l’equazione di Dirac diventa: i ℏ ∂ / ψ – m c ψ = 0. {Se si tratta di un’equazione di Dirac, il risultato è: i ∇ ∇ ∇ ∇ ∇ ∇ ∇ ∇ ∇ ∇ ∇ ∇ ∇ ∇ ψ – m c ψ =0.} L’equazione prende quindi la forma semplice
( i ∂ / – m ) ψ = 0 {\displaystyle (i{parziale \\\2202↩ /}}-m)\psi =0}
Un teorema fondamentale afferma che se sono dati due insiemi distinti di matrici che soddisfano entrambi le relazioni di Clifford, allora essi sono collegati tra loro da una trasformazione di similarità:
γ μ ′ = S – 1 γ μ S . {S = S^{-1} γ μ = S – 1 γ μ.
Se inoltre le matrici sono tutte unitarie, come l’insieme di Dirac, allora S stesso è unitario;
γ μ ′ = U † γ μ U .
La trasformazione U è unica fino ad un fattore moltiplicativo di valore assoluto 1. Immaginiamo ora che sia stata eseguita una trasformazione di Lorentz sulle coordinate di spazio e di tempo, e sugli operatori derivati, che formano un vettore covariante. Affinché l’operatore γμ∂μ rimanga invariante, i gammi devono trasformarsi tra loro come un vettore contravariante rispetto al loro indice spaziale. Questi nuovi gammi soddisferanno essi stessi le relazioni di Clifford, a causa dell’ortogonalità della trasformazione di Lorentz. Per il teorema fondamentale, possiamo sostituire il nuovo insieme con il vecchio insieme soggetto a una trasformazione unitaria. Nel nuovo sistema, ricordando che la massa a riposo è uno scalare relativistico, l’equazione di Dirac avrà allora la forma
( i U † γ μ U ∂ μ ′ – m ) ψ ( x ′ , t ′ ) = 0 {displaystyle (iU^{{dagger }\gamma ^{\mu }U{parziale _{\mu }^{primo }-m)\psi (x^{primo },t^{primo })=0}
U † ( i γ μ ∂ μ ′ – m ) U ψ ( x ′ , t ′ ) = 0 . {U ψ ( i\gamma ^{\mu }parziale _{\mu }^{primo }-m)U\psi (x^{primo },t^{primo })=0~.}
Se ora definiamo lo spinore trasformato
ψ ′ = U ψ {displaystyle \psi ^{\primo }=U\psi }
allora abbiamo l’equazione di Dirac trasformata in un modo che dimostra la manifesta invarianza relativistica:
( i γ μ ∂ μ ′ – m ) ψ ′′ ( x ′ , t ′ ) = 0 . {\displaystyle (i\gamma ^{\mu }parziale _{\mu }^{primo }-m)\psi ^{\primo }(x^{primo },t^{primo })=0~.}
Quindi, una volta stabilita una qualsiasi rappresentazione unitaria dei gammi, essa è definitiva a condizione di trasformare lo spinore secondo la trasformazione unitaria che corrisponde alla trasformazione di Lorentz data.
Le varie rappresentazioni delle matrici di Dirac impiegate metteranno a fuoco aspetti particolari del contenuto fisico nella funzione d’onda di Dirac (vedi sotto). La rappresentazione mostrata qui è conosciuta come la rappresentazione standard – in essa, le due componenti superiori della funzione d’onda vanno a finire nella funzione d’onda a 2 spinori di Pauli nel limite di basse energie e piccole velocità rispetto alla luce.
Le considerazioni di cui sopra rivelano l’origine dei gammi nella geometria, che rimanda alla motivazione originale di Grassmann – essi rappresentano una base fissa di vettori unitari nello spaziotempo. Allo stesso modo, i prodotti dei gammi come γμγν rappresentano elementi di superficie orientati, e così via. Con questo in mente, possiamo trovare la forma dell’elemento di volume unitario sullo spaziotempo in termini di gamme come segue. Per definizione, è
V = 1 4 ! ϵ μ ν α β γ μ γ ν γ α γ β . V={frac {1}{4!}}{epsilon _{mu \nu \alpha \beta }gamma ^{\mu }gamma ^{\nu }gamma ^{alpha }gamma ^{beta }.}
Perché questo sia un invariante, il simbolo epsilon deve essere un tensore, e quindi deve contenere un fattore di √g, dove g è il determinante del tensore metrico. Poiché questo è negativo, tale fattore è immaginario. Quindi
V = i γ 0 γ 1 γ 2 γ 3 . {V = i γ 0 γ 1 γ 2 γ 3 .
A questa matrice viene dato il simbolo speciale γ5, per la sua importanza quando si considerano trasformazioni improprie dello spazio-tempo, cioè quelle che cambiano l’orientamento dei vettori base. Nella rappresentazione standard è
γ 5 = ( 0 I 2 I 2 0 ) . {\displaystyle \gamma _{5}={\begin{pmatrix}0&I_{2}\\I_{2}&0\end{pmatrix}}~.}
Questa matrice si troverà anche in anticommutazione con le altre quattro matrici di Dirac:
γ 5 γ μ + γ μ γ 5 = 0 {displaystyle \gamma ^{5}\gamma ^{\mu }+\gamma ^{\mu }\gamma ^{5}=0}
Prende un ruolo di primo piano quando sorgono questioni di parità perché l’elemento di volume come grandezza diretta cambia segno sotto una riflessione spazio-temporale. Prendere la radice quadrata positiva di cui sopra equivale quindi a scegliere una convenzione di parità sullo spazio-tempo.
Conservazione della corrente di probabilitàModifica
Definendo lo spinore contiguo
ψ ¯ = ψ † γ 0 {\displaystyle {\bar {\psi }}=\psi ^{\dagger }\gamma ^{0}}
dove ψ† è la trasposizione coniugata di ψ, e notando che
( γ μ ) † γ 0 = γ 0 γ μ , {\displaystyle (\gamma ^{\mu })^{dagger }gamma ^{0}=\gamma ^{0}\gamma ^{\mu }~,
otteniamo, prendendo il coniugato Hermitiano dell’equazione di Dirac e moltiplicando da destra per γ0, l’equazione di aggancio:
ψ ¯ ( i γ μ ∂ μ + m ) = 0 , {\displaystyle {\bar {\psi }}(i\gamma ^{\mu }parziale _{\mu }+m)=0~,
dove si intende che ∂μ agisce verso sinistra. Moltiplicando l’equazione di Dirac per ψ da sinistra, e l’equazione di aggiustamento per ψ da destra, e aggiungendo, si ottiene la legge di conservazione della corrente di Dirac:
∂ μ ( ψ ¯ γ μ ψ ) = 0 . {∇ ∇ ∇ ∇ ∇ ∇ ∇ ∇ ∇ ∇ ∇ ∇ ∇ ∇ ∇ ∇ ∇ ∇ ∇ ∇ ∇ ∇ ∇ ∇
Ora vediamo il grande vantaggio dell’equazione del primo ordine rispetto a quella che aveva provato Schrödinger – questa è la densità di corrente conservata richiesta dall’invarianza relativistica, solo che ora la sua quarta componente è definita positivamente e quindi adatta al ruolo di una densità di probabilità:
J 0 = ψ ¯ γ 0 ψ = ψ † ψ . {J^{0} = ψ ψ † ψ ψ = ψ † ψ ψ ψ ψ ψ ψ ψ ψ ψ ψ ψ ψ ψ ψ ψ ψ ψ ψ ψ ψ ψ ψ ψ ψ ψ ψ ψ ψ ψ ψ ψ ψ ψ ψ ψ ψ
Perché la densità di probabilità appare ora come la quarta componente di un vettore relativistico e non un semplice scalare come nell’equazione di Schrödinger, essa sarà soggetta ai soliti effetti delle trasformazioni di Lorentz come la dilatazione temporale. Così, per esempio, i processi atomici che sono osservati come tassi, saranno necessariamente aggiustati in modo coerente con la relatività, mentre quelli che implicano la misura dell’energia e della quantità di moto, che formano essi stessi un vettore relativistico, subiranno un aggiustamento parallelo che conserva la covarianza relativistica dei valori osservati. La corrente di Dirac stessa è quindi il quadruplice vettore spazio-tempo-covariante:
J μ = ψ ¯ γ μ ψ . {La corrente di Dirac stessa è quindi un quadruplice vettore spaziale-covariante: J μ = ψ ¯ γ μ ψ .
SoluzioniEdit
Vedi spinore di Dirac per dettagli sulle soluzioni dell’equazione di Dirac. Si noti che poiché l’operatore di Dirac agisce su 4-tuple di funzioni integrabili al quadrato, le sue soluzioni dovrebbero essere membri dello stesso spazio di Hilbert. Il fatto che le energie delle soluzioni non abbiano un limite inferiore è inaspettato – vedi la sezione sulla teoria dei buchi qui sotto per maggiori dettagli.
Confronto con la teoria di PauliModifica
La necessità di introdurre spin semintegrali risale sperimentalmente ai risultati dell’esperimento di Stern-Gerlach. Un fascio di atomi viene fatto passare attraverso un forte campo magnetico disomogeneo, che poi si divide in N parti a seconda del momento angolare intrinseco degli atomi. Si scoprì che per gli atomi di argento, il fascio si divideva in due – lo stato fondamentale non poteva quindi essere intero, perché anche se il momento angolare intrinseco degli atomi fosse il più piccolo possibile, 1, il fascio si dividerebbe in tre parti, corrispondenti ad atomi con Lz = -1, 0, +1. La conclusione è che gli atomi di argento hanno un momento angolare intrinseco netto di 1⁄2. Pauli ha elaborato una teoria che spiega questa scissione introducendo una funzione d’onda a due componenti e un corrispondente termine di correzione nell’hamiltoniana, che rappresenta un accoppiamento semiclassico di questa funzione d’onda a un campo magnetico applicato, così come in unità SI: (Si noti che i caratteri in grassetto implicano vettori euclidei in 3 dimensioni, mentre il quadrovettore Minkowski Aμ può essere definito come A μ = ( ϕ / c , – A ) {displaystyle A_{\\mu }=(\phi /c,-\mathbf {A} )}
.) H = 1 2 m ( σ ⋅ ( p – e A ) ) 2 + e ϕ . H={frac {1}{2m}}{frac {1}{2m}{sinistra({boldsymbol {sigma }}cdot \left(\mathbf {p} -e\mathbf {A} \destra)^{2}+e\phi ~.}
Qui A e ϕ {displaystyle \phi }
rappresentano le componenti del quadripotenziale elettromagnetico nelle loro unità SI standard, e i tre sigma sono le matrici di Pauli. Al quadrato del primo termine, si trova un’interazione residua con il campo magnetico, insieme alla solita hamiltoniana classica di una particella carica che interagisce con un campo applicato in unità SI: H = 1 2 m ( p – e A ) 2 + e ϕ – e ℏ 2 m σ ⋅ B . {H={frac {1}{2m}} a sinistra(\mathbf {p} -e\mathbf {A} a destra)^{2}+e\phi -{frac {e\hbar }{2m}}{boldsymbol {sigma}}cdot \mathbf {B} ~.}
Questa hamiltoniana è ora una matrice 2 × 2, quindi l’equazione di Schrödinger basata su di essa deve utilizzare una funzione d’onda a due componenti. Introducendo il potenziale elettromagnetico esterno a 4 vettori nell’equazione di Dirac in modo simile, noto come accoppiamento minimo, essa assume la forma:
( γ μ ( i ℏ ∂ μ – e A μ ) – m c ) ψ = 0 . {\displaystyle (\gamma ^{\mu }(i\hbar \parziale _{\mu }-eA_{\mu })-mc)\psi =0~.}
Una seconda applicazione dell’operatore di Dirac riproduce ora il termine di Pauli esattamente come prima, perché le matrici spaziali di Dirac moltiplicate per i, hanno le stesse proprietà di quadratura e commutazione delle matrici di Pauli. Inoltre, il valore del rapporto giromagnetico dell’elettrone, che sta davanti al nuovo termine di Pauli, è spiegato dai primi principi. Questa è stata una grande conquista dell’equazione di Dirac e ha dato ai fisici una grande fiducia nella sua correttezza generale. Ma c’è di più. La teoria di Pauli può essere vista come il limite a bassa energia della teoria di Dirac nel modo seguente. Prima l’equazione è scritta nella forma di equazioni accoppiate per 2-spinori con le unità SI ripristinate:
( m c 2 – E + e ϕ ) c σ ⋅ ( p – e A ) – c σ ⋅ ( p – e A ) ( m c 2 + E – e ϕ ) ) ( ψ + ψ – ) = ( 0 0 ) . (mc^{2}-E+e{2}phi )&c{boldsymbol {sigma }cdot \sinistra(\mathbf {p} -e\mathbf {A} \destra)\c{boldsymbol {sigma} \destra)\c{boldsymbol {sigma}cdot \sinistra(\mathbf {p} -e\mathbf {A} \right)&\left(mc^{2}+E-e\phi \right)\end{pmatrix}}{\begin{pmatrix}\psi _{+}\\\psi _{-}\end{pmatrix}}={\begin{pmatrix}0\\0\end{pmatrix}}~.}
così
( E – e ϕ ) ψ + – c σ ⋅ ( p – e A ) ψ – = m c 2 ψ + {\displaystyle (E-e\phi )\psi _{+}-c{boldsymbol {\sigma }}}cdot \sinistra(\mathbf {p} -e\mathbf {A} \destra)\psi _{-}=mc^{2}\psi _{+}
– ( E – e ϕ ) ψ – + c σ ⋅ ( p – e A ) ψ + = m c 2 ψ – {\displaystyle -(E-e\dphi )\psi _{-}+c{boldsymbol {\sigma }}{cdot \sinistra(\mathbf {p} -e\mathbf {A} \destra)\psi _{+}=mc^{2}\psi _{-}
Assumendo che il campo sia debole e il moto dell’elettrone non relativistico, abbiamo l’energia totale dell’elettrone approssimativamente uguale alla sua energia di riposo, e la quantità di moto che torna al valore classico,
E – e ϕ ≈ m c 2 {displaystyle E-e\phi \approx mc^{2}}
p ≈ m v {displaystyle \mathbf {p} \approx m\mathbf {v}
e quindi la seconda equazione può essere scritta
ψ – ≈ 1 2 m c σ ⋅ ( p – e A ) ψ + {\displaystyle \psi _{-Approssimativamente {frac {1}{2mc}}{boldsymbol {sigma }}cdot \sinistra(\mathbf {p} -e\mathbf {A} \destra)\psi _{+}
che è di ordine v/c – quindi ad energie e velocità tipiche, le componenti inferiori dello spinore di Dirac nella rappresentazione standard sono molto soppresse rispetto alle componenti superiori. Sostituendo questa espressione nella prima equazione si ottiene, dopo qualche riarrangiamento,
( E – m c 2 ) ψ + = 1 2 m 2 ψ + + e ϕ ψ + {\displaystyle (E-mc^{2})\psi _{+}={frac {1}{2m}}\left^{2}\psi _{+}+e\phi \psi _{+}
L’operatore a sinistra rappresenta l’energia della particella ridotta della sua energia di riposo, che è solo l’energia classica, quindi recuperiamo la teoria di Pauli se identifichiamo il suo 2-spinor con le componenti superiori dello spinor di Dirac nell’approssimazione non relativistica. Un’ulteriore approssimazione dà l’equazione di Schrödinger come limite della teoria di Pauli. Così, l’equazione di Schrödinger può essere vista come l’estrema approssimazione non relativistica dell’equazione di Dirac quando si può trascurare lo spin e lavorare solo a basse energie e velocità. Anche questo è stato un grande trionfo per la nuova equazione, poiché ha fatto risalire la misteriosa i che appare in essa, e la necessità di una funzione d’onda complessa, alla geometria dello spaziotempo attraverso l’algebra di Dirac. Evidenzia anche perché l’equazione di Schrödinger, anche se superficialmente sotto forma di un’equazione di diffusione, rappresenta in realtà la propagazione delle onde.
Si deve sottolineare fortemente che questa separazione dello spinore di Dirac in componenti grandi e piccole dipende esplicitamente da un’approssimazione a bassa energia. L’intero spinore di Dirac rappresenta un insieme irriducibile, e le componenti che abbiamo appena trascurato per arrivare alla teoria di Pauli porteranno nuovi fenomeni in regime relativistico – l’antimateria e l’idea di creazione e annichilimento di particelle.
Confronto con la teoria di WeylModifica
Nel limite m → 0, l’equazione di Dirac si riduce all’equazione di Weyl, che descrive particelle relativistiche senza massa spin-1⁄2.
Lagrangiana di DiracModifica
Sia l’equazione di Dirac che l’equazione di Dirac Adjoint possono essere ottenute (variando) l’azione con una specifica densità lagrangiana che è data da:
L = i ℏ c ψ ¯ γ μ ∂ μ ψ – m c 2 ψ ¯ ψ {\displaystyle {\mathcal {L}}=i\hbar c{overline {\psi }}gamma ^{\mu }parziale _{\mu }}psi -mc^{2}{overline {\psi }}psi }