Ecuația lui Dirac
Ecuația lui Dirac în forma propusă inițial de Dirac este:
( β m c 2 + c ∑ n = 1 3 α n p n ) ψ ( x , t ) = i ℏ ∂ ψ ( x , t ) ∂ t {\displaystyle \left(\beta mc^{2}+c\sum _{n\mathop {=} 1}^{3}\alpha _{n}p_{n}\right)\psi (x,t)=i\hbar {\frac {\partial \psi (x,t)}{\partial t}}}{\partial t}}
unde ψ = ψ(x, t) este funcția de undă pentru electronul cu masa de repaus m cu coordonatele spațiu-timp x, t. P1, p2, p3 sunt componentele impulsului, înțeles ca fiind operatorul de impuls din ecuația lui Schrödinger. De asemenea, c este viteza luminii, iar ħ este constanta Planck redusă. Aceste constante fizice fundamentale reflectă relativitatea specială și, respectiv, mecanica cuantică.
Scopul lui Dirac în formularea acestei ecuații a fost acela de a explica comportamentul electronului care se mișcă relativist și, astfel, de a permite tratarea atomului într-o manieră compatibilă cu relativitatea. Speranța sa destul de modestă era că corecțiile introduse în acest fel ar putea avea o influență asupra problemei spectrelor atomice.
Până la acel moment, încercările de a face vechea teorie cuantică a atomului compatibilă cu teoria relativității, încercări bazate pe discretizarea momentului unghiular stocat în orbita posibil necirculară a electronului în jurul nucleului atomic, eșuaseră – iar noua mecanică cuantică a lui Heisenberg, Pauli, Jordan, Schrödinger și a lui Dirac însuși nu se dezvoltase suficient pentru a trata această problemă. Deși intențiile inițiale ale lui Dirac au fost satisfăcute, ecuația sa a avut implicații mult mai profunde pentru structura materiei și a introdus noi clase matematice de obiecte care sunt acum elemente esențiale ale fizicii fundamentale.
Noile elemente din această ecuație sunt cele patru matrici 4 × 4 α1, α2 , α3 și β și funcția de undă cu patru componente ψ. Există patru componente în ψ deoarece evaluarea acesteia în orice punct dat al spațiului de configurație este un bispinor. Ea este interpretată ca o suprapunere a unui electron cu spin în sus, a unui electron cu spin în jos, a unui pozitron cu spin în sus și a unui pozitron cu spin în jos (a se vedea mai jos pentru o discuție suplimentară).
Matricele 4 × 4 αk și β sunt toate hermitiene și sunt involuntare:
α i 2 = β 2 = I 4 {\displaystyle \alpha _{i}^{2}=\beta ^{2}=I_{4}}
și toate se anticomunică reciproc:
α i α j + α j α i = 0 ( i ≠ j ) {\displaystyle \alpha _{i}\alpha _{j}+\alpha _{j}\alpha _{j}\alpha _{i}=0\quad (i\neq j)}
α i β + β α i = 0 {\displaystyle \alpha _{i}\beta +\beta \alpha _{i}=0}}
Aceste matrici și forma funcției de undă au o semnificație matematică profundă. Structura algebrică reprezentată de matricile gamma fusese creată cu aproximativ 50 de ani mai devreme de către matematicianul englez W. K. Clifford. La rândul lor, ideile lui Clifford au apărut din lucrările de la mijlocul secolului al XIX-lea ale matematicianului german Hermann Grassmann în lucrarea sa Lineale Ausdehnungslehre (Teoria extensiilor liniare). Aceasta din urmă fusese considerată ca fiind aproape de neînțeles de către majoritatea contemporanilor săi. Apariția a ceva atât de aparent abstract, la o dată atât de târzie și într-o manieră fizică atât de directă, este unul dintre cele mai remarcabile capitole din istoria fizicii.
Ecuația simbolică unică se desface astfel în patru ecuații diferențiale parțiale liniare de ordinul întâi cuplate pentru cele patru mărimi care alcătuiesc funcția de undă. Ecuația poate fi scrisă mai explicit în unități Planck sub forma::
i ∂ t = i ∂ x + ∂ y + i ∂ z + m {\displaystyle i\partial _{t}{\begin{bmatrix}\psi _{1}\\psi _{2}\psi _{3}\psi _{4}\end{bmatrix}}}=i\partial _{x}{\begin{bmatrix}-\psi _{4}\\\\-\psi _{3}\\-\psi _{2}\\\-\psi _{1}\end{bmatrix}}+\partial _{y}\begin{bmatrix}-\psi _{4}\\\+\psi _{3}\\-\psi _{2}\\\+\psi _{1}\end{bmatrix}}+i\partial _{z}{\begin{bmatrix}-\psi _{3}\\+\psi _{4}\-\psi _{1}\\\i+\psi _{2}\end{bmatrix}}+m{\begin{bmatrix}+\psi _{1}\\\i+\psi _{2}\\-\psi _{3}\\-\psi _{4}\end{bmatrix}}}}}
ceea ce face mai clar că este un set de patru ecuații diferențiale parțiale cu patru funcții necunoscute.
Transformarea ecuației lui Schrödinger în ecuație relativistăEdit
Ecuația lui Dirac este superficial asemănătoare cu ecuația lui Schrödinger pentru o particulă liberă masivă:
– ℏ 2 2 2 m ∇ 2 ϕ = i ℏ ∂ ∂ t ϕ . {\displaystyle -{\frac {\hbar ^{2}}}{2m}}\nabla ^{2}\phi =i\hbar {\frac {\partial }{\partial t}}\phi ~.}
Latura stângă reprezintă pătratul operatorului de impuls împărțit la dublul masei, care este energia cinetică non-relativistă. Deoarece relativitatea tratează spațiul și timpul ca un întreg, o generalizare relativistă a acestei ecuații necesită ca derivatele spațiale și temporale să intre simetric, așa cum se întâmplă în ecuațiile lui Maxwell care guvernează comportamentul luminii – ecuațiile trebuie să fie diferențiale de același ordin în spațiu și timp. În relativitate, impulsul și energiile sunt părțile spațială și temporală ale unui vector spațiu-timp, impulsul cvadruplu, și sunt legate între ele prin relația relativist invariantă
E 2 = m 2 c 4 + p 2 c 2 {\displaystyle E^{2}=m^{2}c^{4}+p^{2}c^{2}}}.
care spune că lungimea acestui cvadruplu vector este proporțională cu masa de repaus m. Înlocuind operatorii echivalenți ai energiei și impulsului din teoria Schrödinger, obținem ecuația Klein-Gordon care descrie propagarea undelor, construită din obiecte invariante relativist,
( – 1 c 2 ∂ 2 ∂ t 2 + ∇ 2 ) ϕ = m 2 c 2 ℏ 2 ϕ {\displaystyle \left(-{\frac {1}{c^{2}}}{\frac {\partial ^{2}}}{\partial t^{2}}}+\nabla ^{2}}\right)\phi ={\frac {m^{2}}c^{2}}}{\hbar ^{2}}}\phi }
cu funcția de undă ϕ fiind un scalar relativist: un număr complex care are aceeași valoare numerică în toate cadrele de referință. Derivatele spațială și temporală intră ambele la ordinul al doilea. Acest lucru are o consecință revelatoare pentru interpretarea ecuației. Deoarece ecuația este de ordinul al doilea în derivata temporală, trebuie specificate valorile inițiale atât ale funcției de undă însăși, cât și ale primei sale derivate temporale, pentru a rezolva probleme definite. Deoarece ambele pot fi specificate mai mult sau mai puțin arbitrar, funcția de undă nu își poate păstra rolul anterior de a determina densitatea de probabilitate de a găsi electronul într-o anumită stare de mișcare. În teoria lui Schrödinger, densitatea de probabilitate este dată de expresia definită pozitiv
ρ = ϕ ∗ ϕ {\displaystyle \rho =\phi ^{*}\phi }
și această densitate este convectată în funcție de vectorul curent de probabilitate
J = – i ℏ 2 m ( ϕ ∗ ∇ ϕ – ϕ ∇ ϕ ∗ ) {\displaystyle J=-{\frac {i\hbar }{2m}}}(\phi ^{*}\nabla \phi -\phi \nabla \phi ^{*})}
cu conservarea curentului de probabilitate și a densității care rezultă din ecuația de continuitate:
∇ ⋅ J + ∂ ρ ∂ t = 0 . {\displaystyle \nabla \cdot J+{\frac {\partial \rho }{\partial t}}=0~.}
Faptul că densitatea este definită pozitiv și convectată în conformitate cu această ecuație de continuitate implică faptul că putem integra densitatea pe un anumit domeniu și să fixăm totalul la 1, iar această condiție va fi menținută de legea de conservare. O teorie relativistă adecvată cu un curent de densitate probabilă trebuie să împărtășească și această caracteristică. Acum, dacă dorim să menținem noțiunea de densitate convectată, atunci trebuie să generalizăm expresia Schrödinger a densității și a curentului astfel încât derivatele spațială și temporală să intre din nou simetric în raport cu funcția de undă scalară. Ni se permite să păstrăm expresia Schrödinger pentru curent, dar trebuie să înlocuim densitatea de probabilitate cu expresia formată simetric
ρ = i ℏ 2 m c 2 ( ψ ∗ ∂ t ψ – ψ ∂ t ψ ψ ∗ ) . {\displaystyle \rho ={\frac {i\hbar }{2mc^{2}}}(\psi ^{*}\partial _{t}\psi -\psi \partial _{t}\psi ^{*})~{*}.}
care devine acum a 4-a componentă a unui vector spațio-temporal, iar întreaga densitate de probabilitate a celor 4 curenți are expresia covariantă relativistă
J μ = i ℏ 2 m ( ψ ∗ ∂ μ ψ – ψ ∂ μ ψ ∗ ) . {\displaystyle J^{\mu }={\frac {i\hbar }{2m}}(\psi ^{*}\partial ^{\mu }\psi -\psi \partial ^{\mu }\psi ^{*})~.}
Ecuația de continuitate este ca mai înainte. Acum totul este compatibil cu relativitatea, dar vedem imediat că expresia pentru densitate nu mai este definită pozitiv – valorile inițiale atât ale lui ψ cât și ale lui ∂tψ pot fi alese în mod liber, iar densitatea poate deveni astfel negativă, ceea ce este imposibil pentru o densitate de probabilitate legitimă. Astfel, nu putem obține o generalizare simplă a ecuației lui Schrödinger în ipoteza naivă că funcția de undă este un scalar relativist, iar ecuația pe care o satisface, de ordinul doi în timp.
Deși nu este o generalizare relativistă reușită a ecuației lui Schrödinger, această ecuație este resuscitată în contextul teoriei cuantice a câmpurilor, unde este cunoscută sub numele de ecuația Klein-Gordon, și descrie un câmp de particule fără spini (de exemplu, mezonul pi sau bosonul Higgs). Din punct de vedere istoric, Schrödinger însuși a ajuns la această ecuație înaintea celei care îi poartă numele, dar a renunțat curând la ea. În contextul teoriei cuantice a câmpurilor, se înțelege că densitatea nedeterminată corespunde densității de sarcină, care poate fi pozitivă sau negativă, și nu densității de probabilitate.
Lovitura lui DiracEdit
Dirac s-a gândit astfel să încerce o ecuație care să fie de ordinul întâi atât în spațiu cât și în timp. Se putea, de exemplu, în mod formal (i.e. prin abuz de notație) să se ia expresia relativistă pentru energie
E = c p 2 + m 2 c 2 , {\displaystyle E=c{\sqrt {p^{2}+m^{2}c^{2}}~,}
înlocuiți p cu echivalentul său de operator, dezvoltați rădăcina pătrată într-o serie infinită de operatori derivativi, stabiliți o problemă de valori proprii, apoi rezolvați ecuația în mod formal prin iterații. Majoritatea fizicienilor aveau puțină încredere într-un astfel de proces, chiar dacă ar fi fost posibil din punct de vedere tehnic.
Cum se povestește, Dirac privea în șemineu la Cambridge, meditând la această problemă, când i-a venit ideea de a lua astfel rădăcina pătrată a operatorului de undă:
∇ 2 – 1 c 2 ∂ 2 ∂ t 2 = ( A ∂ x + B ∂ y + C ∂ z + i c D ∂ t ) ( A ∂ x + B ∂ y + C ∂ z + i c D ∂ t ) . {\displaystyle \nabla ^{2}-{\frac {1}{c^{2}}}{\frac {\partial ^{2}}}{\partial t^{2}}}=\left(A\partial _{x}+B\partial _{y}+C\partial _{z}+{\frac {i}{c}}}D\partial _{t}\dreapta)\left(A\partial _{x}+B\partial _{y}+C\partial _{z}+{\frac {i}{c}}}D\partial _{t}\dreapta)~.}
După multiplicarea părții drepte vedem că, pentru ca toți termenii încrucișați, cum ar fi ∂x∂y, să dispară, trebuie să presupunem
A B + B A = 0 , … {\displaystyle AB+BA=0,~\ldots ~}
cu
A 2 = B 2 = … = 1 . {\displaystyle A^{2}=B^{2}=\ldots =1~.}
Dirac, care tocmai atunci se implicase intens în elaborarea fundamentelor mecanicii matriciale a lui Heisenberg, a înțeles imediat că aceste condiții pot fi îndeplinite dacă A, B, C și D sunt matrici, cu implicația că funcția de undă are componente multiple. Acest lucru a explicat imediat apariția funcțiilor de undă cu două componente în teoria fenomenologică a spinului a lui Pauli, lucru care până atunci fusese considerat misterios, chiar și pentru Pauli însuși. Cu toate acestea, este nevoie de cel puțin 4 × 4 matrici pentru a configura un sistem cu proprietățile necesare – astfel, funcția de undă avea patru componente, nu două, ca în teoria lui Pauli, sau una, ca în teoria simplă a lui Schrödinger. Funcția de undă cu patru componente reprezintă o nouă clasă de obiecte matematice în cadrul teoriilor fizice, care își face aici prima apariție.
Dată factorizarea în termenii acestor matrici, se poate scrie acum imediat o ecuație
( A ∂ x + B ∂ y + C ∂ z + i c D ∂ t ) ψ = κ ψ ψ {\displaystyle \left(A\partial _{x}+B\partial _{y}+C\partial _{z}+{\frac {i}{c}}}D\partial _{t}\right)\psi =\kappa \psi }
cu κ {\displaystyle \kappa }
de determinat. Aplicând din nou operatorul matricial pe ambele părți se obține ( ∇ 2 – 1 c 2 ∂ t 2 ) ψ = κ 2 ψ . {\displaystyle \left(\nabla ^{2}-{\frac {1}{c^{2}}}\partial _{t}^{2}\right)\psi =\kappa ^{2}\psi ~.}
La luarea κ = m c ℏ {\displaystyle \kappa ={\tfrac {mc}{\hbar }}}
aflăm că toate componentele funcției de undă satisfac individual relația energie-momentum relativistă. Astfel, ecuația căutată care este de ordinul întâi atât în spațiu cât și în timp este ( A ∂ x + B ∂ y + C ∂ z + i c D ∂ t – m c ℏ ) ψ = 0 . {\displaystyle \left(A\partial _{x}+B\partial _{y}+C\partial _{z}+{\frac {i}{c}}}D\partial _{t}-{\frac {mc}{\hbar }}\right)\psi =0~.}
Setting
A = i β α 1 , B = i β α 2 , C = i β α 3 , D = β , {\displaystyle A=i\beta \alpha _{1}\,,\,B=i\beta \alpha _{2}\,,\,C=i\beta \alpha _{3}\,,\,D=\beta ~,}
și pentru că D 2 = β 2 = I 4 , {\displaystyle D^{2}=\beta ^{2}=I_{4}~,}
obținem ecuația lui Dirac așa cum este scrisă mai sus.
Forma covariantă și invarianța relativistăEdit
Pentru a demonstra invarianța relativistă a ecuației, este avantajos să o punem într-o formă în care derivatele spațială și temporală apar pe picior de egalitate. Se introduc matrici noi, după cum urmează:
D = γ 0 , {\displaystyle D=\gamma ^{0}~,}
A = i γ 1 , B = i γ 2 , C = i γ 3 , {\displaystyle A=i\gamma ^{1}~,\quad B=i\gamma ^{2}~,\quad C=i\gamma ^{3}~,}
și ecuația ia forma (amintindu-ne de definiția componentelor covariante ale 4-gradient și mai ales că ∂0 = 1/c∂t )
i ℏ γ μ ∂ μ ψ – m c ψ = 0 {\displaystyle i\hbar \gamma ^{\mu }\partial _{\mu }\psi -mc\psi =0}}
unde există o însumare implicită peste valorile indicelui repetat de două ori μ = 0, 1, 2, 3, iar ∂μ este gradientul 4-. În practică, matricile gamma se scriu adesea în termeni de submatrici 2 × 2 luate din matricile Pauli și din matricea identitate 2 × 2. În mod explicit, reprezentarea standard este
γ 0 = ( I 2 0 0 0 – I 2 ) , γ 1 = ( 0 σ x – σ x 0 ) , γ 2 = ( 0 σ y – σ y 0 ) , γ 3 = ( 0 σ z – σ z 0 ) . {\displaystyle \gamma ^{0}={\begin{pmatrix}I_{2}&0\\0&-I_{2}\end{pmatrix}}~,\gamma ^{1}=\left({\begin{array}{cccc}0&\sigma _{x}\\-\sigma _{x}&0\end{array}}\right)~,\gamma ^{2}=\left({\begin{array}{cccc}0&\sigma _{y}\\-\sigma _{y}&0\end{array}}\right)~,\gamma ^{3}=\left({\begin{array}{cccc}0&\sigma _{z}\\-\sigma _{z}&0\end{array}}\right)~.}
Sistemul complet se rezumă folosind metrica Minkowski pe spațiu-timp sub forma
{ γ μ , γ ν } = 2 η μ ν I 4 {\displaystyle \{\gamma ^{\mu },\gamma ^{\nu }\}=2\eta ^{\mu \nu }I_{4}}}.
unde expresia în paranteze
{ a , b } = a b b + b a {\displaystyle \{a,b\}=ab+ba}
reprezintă anticomutatorul. Acestea sunt relațiile definitorii ale unei algebre Clifford pe un spațiu pseudo-ortogonal 4-dimensional cu semnătura metrică (+ – – – -). Algebra Clifford specifică utilizată în ecuația Dirac este cunoscută astăzi sub numele de algebra Dirac. Deși nu a fost recunoscută ca atare de către Dirac la momentul formulării ecuației, retrospectiv, introducerea acestei algebre geometrice reprezintă un enorm pas înainte în dezvoltarea teoriei cuantice.
Ecuația Dirac poate fi interpretată acum ca o ecuație cu valori proprii, în care masa de repaus este proporțională cu o valoare proprie a operatorului 4-momentum, constanta de proporționalitate fiind viteza luminii:
P o p ψ = m c ψ . {\displaystyle P_{\mathrm {op} }\psi =mc\psi ~.}
Utilizarea ∂ / = d e f γ μ ∂ ∂ μ {\displaystyle {\partial \!\!\!\!/}\ {\stackrel {\mathrm {\def} }{=}}}\ \gamma ^{\mu }\partial _{\mu }}
( ∂ / {\displaystyle {\partial \!\!\!\!{\big /}}}}
se pronunță „d-slash”), conform notației Feynman slash, ecuația lui Dirac devine: i ℏ ∂ / ψ – m c ψ = 0. {\displaystyle i\hbar {\partial \!\!\!\!\big /}}\psi -mc\psi =0.}
În practică, fizicienii folosesc adesea unități de măsură astfel încât ħ = c = 1, cunoscute ca unități naturale. Ecuația ia atunci forma simplă
( i ∂ / – m ) ψ = 0 {\displaystyle (i{\partial \!\!\!\!\big /}}}-m)\psi =0}
O teoremă fundamentală afirmă că, dacă sunt date două seturi distincte de matrici care satisfac relațiile Clifford, atunci ele sunt conectate între ele printr-o transformare de similaritate:
γ μ ′ = S – 1 γ μ S . {\displaystyle \gamma ^{\mu \prime }=S^{-1}\gamma ^{\mu }S~.}
Dacă în plus matricile sunt toate unitare, ca și setul Dirac, atunci S însuși este unitar;
γ μ ′ = U † γ μ U . {\displaystyle \gamma ^{\mu \prime }=U^{\dagger }\gamma ^{\mu }U~.}
Transformarea U este unică până la un factor multiplicativ de valoare absolută 1. Să ne imaginăm acum că s-a efectuat o transformare Lorentz asupra coordonatelor spațiale și temporale, precum și asupra operatorilor derivați, care formează un vector covariant. Pentru ca operatorul γμ∂μμ să rămână invariant, gammele trebuie să se transforme între ele sub forma unui vector contravariant în raport cu indicele lor spațio-temporal. Aceste noi gamme vor satisface la rândul lor relațiile Clifford, datorită ortogonalității transformării Lorentz. Prin teorema fundamentală, putem înlocui noul ansamblu cu vechiul ansamblu supus unei transformări unitare. În noul cadru, amintindu-ne că masa de repaus este un scalar relativist, ecuația lui Dirac va lua atunci forma
( i U † γ μ U ∂ μ ′ – m ) ψ ( x ′ , t ′ ) = 0 {\displaystyle (iU^{\dagger }\gamma ^{\mu }U\partial _{\mu }^{\prime }-m)\psi (x^{\prime },t^{\prime })=0}
U † ( i γ μ ∂ μ ′ – m ) U ψ ( x ′ , t ′ ) = 0 . {\displaystyle U^{\dagger }(i\gamma ^{\mu }\partial _{\mu }^{\prime }-m)U\psi (x^{\prime },t^{\prime })=0~.}
Dacă definim acum spinorul transformat
ψ ′ = U ψ {\displaystyle \psi ^{\prime }=U\psi }
atunci avem ecuația Dirac transformată într-un mod care demonstrează invarianța relativistă manifestă:
( i γ μ ∂ μ ′ – m ) ψ ′ ( x ′ , t ′ ) = 0 . {\displaystyle (i\gamma ^{\mu }\partial _{\mu }^{\prime }-m)\psi ^{\prime }(x^{\prime },t^{\prime })=0~.}
Atunci, odată ce ne-am stabilit asupra oricărei reprezentări unitare a gamelor, aceasta este definitivă cu condiția să transformăm spinorul conform transformării unitare care corespunde transformării Lorentz date.
Diferitele reprezentări ale matricelor Dirac utilizate vor pune în evidență aspecte particulare ale conținutului fizic din funcția de undă Dirac (vezi mai jos). Reprezentarea prezentată aici este cunoscută sub numele de reprezentarea standard – în ea, cele două componente superioare ale funcției de undă trec în funcția de undă cu 2 spinori a lui Pauli în limita energiilor joase și a vitezelor mici în comparație cu lumina.
Considerările de mai sus dezvăluie originea gamelor în geometrie, amintind de motivația inițială a lui Grassmann – ele reprezintă o bază fixă de vectori unitari în spațiu-timp. În mod similar, produsele gamelor, cum ar fi γμγν, reprezintă elemente de suprafață orientate, și așa mai departe. Ținând cont de acest lucru, putem găsi forma elementului de volum unitar în spațiu-timp în termenii gamelor după cum urmează. Prin definiție, acesta este
V = 1 4 ! ϵ μ ν α β γ μ γ γ ν γ α γ γ β . {\displaystyle V={\frac {1}{4!}}\epsilon _{\mu \nu \alpha \beta }\gamma ^{\mu }\gamma ^{\nu }\gamma ^{\alpha }\gamma ^{\beta }.
Pentru ca acesta să fie un invariant, simbolul epsilon trebuie să fie un tensor, și deci trebuie să conțină un factor de √g, unde g este determinantul tensorului metric. Deoarece acesta este negativ, factorul respectiv este imaginar. Astfel
V = i γ 0 γ 1 γ 2 γ 3 . {\displaystyle V=i\gamma ^{0}\gamma ^{1}\gamma ^{2}\gamma ^{3}~.}
Această matrice primește simbolul special γ5, datorită importanței sale atunci când se iau în considerare transformări improprii ale spațiu-timpului, adică cele care schimbă orientarea vectorilor de bază. În reprezentarea standard, ea este
γ 5 = ( 0 I 2 I 2 I 2 0 ) . {\displaystyle \gamma _{5}={\begin{pmatrix}0&I_{2}\\I_{2}&0\end{pmatrix}}~.}
Se va constata, de asemenea, că această matrice este anticomună cu celelalte patru matrici Dirac:
γ 5 γ μ + γ μ γ γ 5 = 0 {\displaystyle \gamma ^{5}\gamma ^{\mu }+\gamma ^{\mu }\gamma ^{5}=0}
Aceasta are un rol principal atunci când apar probleme de paritate, deoarece elementul de volum, ca mărime dirijată, își schimbă semnul sub o reflexie spațiu-timp. Luarea rădăcinii pătrate pozitive de mai sus echivalează astfel cu alegerea unei convenții de handedness asupra spațiu-timpului.
Conservarea curentului de probabilitateEdit
Prin definirea spinorului adjunct
ψ ¯ = ψ † γ 0 {\displaystyle {\bar {\psi }}=\psi ^{\dagger }\gamma ^{0}}
unde ψ† este transpunerea conjugată a lui ψ, și observând că
( γ μ ) † γ 0 = γ 0 γ μ , {\displaystyle (\gamma ^{\mu })^{\dagger }\gamma ^{0}=\gamma ^{0}\gamma ^{0}\gamma ^{mu }~,}
obținem, luând conjugatul hermitian al ecuației lui Dirac și înmulțind din dreapta cu γ0, ecuația adjunctă:
ψ ¯ ( i γ μ ∂ μ μ + m ) = 0 , {\displaystyle {\bar {\psi }}(i\gamma ^{\mu }\partial _{\mu }+m)=0~,}
unde se înțelege că ∂μ acționează spre stânga. Înmulțind ecuația Dirac cu ψ din stânga, iar ecuația adjunctă cu ψ din dreapta, și adunând, se obține legea de conservare a curentului Dirac:
∂ μ ( ψ ¯ γ μ ψ ) = 0 . {\displaystyle \partial _{\mu }\left({\bar {\psi }}\gamma ^{\mu }\psi \right)=0~.}
Acum vedem marele avantaj al ecuației de ordinul întâi față de cea încercată de Schrödinger – aceasta este densitatea de curent conservată cerută de invarianța relativistă, numai că acum cea de-a 4-a componentă a sa este definită pozitiv și deci potrivită pentru rolul unei densități de probabilitate:
J 0 = ψ ¯ γ 0 ψ = ψ † ψ . {\displaystyle J^{0}={\bar {\psi }}\gamma ^{0}\psi =\psi ^{\dagger }\psi ~.}
Pentru că densitatea de probabilitate apare acum ca a patra componentă a unui vector relativist și nu ca un simplu scalar ca în ecuația lui Schrödinger, ea va fi supusă efectelor obișnuite ale transformărilor Lorentz, cum ar fi dilatarea timpului. Astfel, de exemplu, procesele atomice care sunt observate ca viteze, vor fi în mod necesar ajustate într-un mod compatibil cu relativitatea, în timp ce cele care implică măsurarea energiei și a impulsului, care la rândul lor formează un vector relativist, vor fi supuse unei ajustări paralele care păstrează covarianța relativistă a valorilor observate. Curentul Dirac însuși este atunci cvadruplul vector covariant spațio-temporal:
J μ = ψ ¯ γ μ ψ . {\displaystyle J^{\mu }={\bar {\psi }}\gamma ^{\mu }\psi .}
EditareSoluții
Vezi spinor Dirac pentru detalii despre soluțiile la ecuația Dirac. Rețineți că, din moment ce operatorul Dirac acționează asupra unor 4-cupluri de funcții pătrat-integrabile, soluțiile sale ar trebui să fie membre ale aceluiași spațiu Hilbert. Faptul că energiile soluțiilor nu au o limită inferioară este neașteptat – a se vedea secțiunea de mai jos despre teoria găurilor pentru mai multe detalii.
Comparație cu teoria lui PauliEdit
Necesitatea introducerii spinului pe jumătate întreg datează, din punct de vedere experimental, de rezultatele experimentului Stern-Gerlach. Un fascicul de atomi este trecut printr-un câmp magnetic puternic neomogen, care apoi se împarte în N părți în funcție de momentul unghiular intrinsec al atomilor. S-a constatat că, în cazul atomilor de argint, fasciculul se împarte în două – prin urmare, starea fundamentală nu poate fi întreagă, deoarece, chiar dacă momentul unghiular intrinsec al atomilor ar fi cât mai mic posibil, 1, fascicululul s-ar împărți în trei părți, corespunzând atomilor cu Lz = -1, 0, +1. Concluzia este că atomii de argint au un moment unghiular intrinsec net de 1⁄2. Pauli a stabilit o teorie care a explicat această divizare prin introducerea unei funcții de undă cu două componente și a unui termen de corecție corespunzător în hamiltonian, reprezentând un cuplaj semiclasic al acestei funcții de undă la un câmp magnetic aplicat, deci în unități SI: (Rețineți că caracterele îngroșate implică vectori euclidieni în 3 dimensiuni, în timp ce cvadruplul vector Minkowski Aμ poate fi definit ca A μ = ( ϕ / c , – A ) {\displaystyle A_{\mu }=(\phi /c,-\mathbf {A} )}
.) H = 1 2 m ( σ ⋅ ( p – e A ) ) 2 + e ϕ . {\displaystyle H={\frac {1}{2m}}}\left({\boldsymbol {\sigma }}\cdot \left(\mathbf {p} -e\mathbf {A} \right)\right)\right)^{2}+e\phi ~.}
Aici A și ϕ {\displaystyle \phi }
reprezintă componentele cvadruplului potențial electromagnetic în unitățile lor SI standard, iar cele trei sigme sunt matricile Pauli. La ridicarea la pătrat a primului termen, se găsește o interacțiune reziduală cu câmpul magnetic, împreună cu Hamiltonianul clasic obișnuit al unei particule încărcate care interacționează cu un câmp aplicat în unități SI: H = 1 2 m ( p – e A ) 2 + e ϕ – e ℏ 2 m σ ⋅ B . {\displaystyle H={\frac {1}{2m}}\left(\mathbf {p} -e\mathbf {A} \right)^{2}+e\phi -{\frac {e\hbar }{2m}}{\boldsymbol {\sigma }}\cdot \mathbf {B} ~.}
Acest hamiltonian este acum o matrice 2 × 2, astfel încât ecuația lui Schrödinger bazată pe el trebuie să utilizeze o funcție de undă cu două componente. La introducerea potențialului electromagnetic extern de 4 vectori în ecuația Dirac într-un mod similar, cunoscut sub numele de cuplaj minim, acesta ia forma:
( γ μ ( i ℏ ∂ μ – e A μ ) – m c ) ψ = 0 . {\displaystyle (\gamma ^{\mu }(i\hbar \partial _{\mu }-eA_{\mu })-mc)\psi =0~.}
O a doua aplicare a operatorului Dirac va reproduce acum termenul Pauli exact ca înainte, deoarece matricile Dirac spațiale înmulțite cu i, au aceleași proprietăți de cuadratură și comutație ca și matricile Pauli. Mai mult, valoarea raportului giroscopic al electronului, care stă în fața noului termen al lui Pauli, este explicată din primele principii. Aceasta a fost o realizare majoră a ecuației lui Dirac și le-a dat fizicienilor o mare încredere în corectitudinea sa generală. Mai este însă și altceva. Teoria Pauli poate fi văzută ca fiind limita de joasă energie a teoriei Dirac în felul următor. În primul rând, ecuația este scrisă sub forma unor ecuații cuplate pentru 2-spioni cu unitățile SI restaurate:
( ( ( m c 2 – E + e ϕ ) c σ ⋅ ( p – e A ) – c σ ⋅ ( p – e A ) ( m c 2 + E – e ϕ ) ) ( ψ + ψ – ) = ( 0 0 ) . {\displaystyle {\begin{pmatrix}(mc^{2}-E+e\phi )&c{\boldsymbol {\sigma }}\cdot \left(\mathbf {p} -e\mathbf {A} \right)\\-c{\boldsymbol {\sigma }}\cdot \left(\mathbf {p} -e\mathbf {A} \right)&\left(mc^{2}+E-e\phi \right)\end{pmatrix}}{\begin{pmatrix}\psi _{+}\\\psi _{-}\end{pmatrix}}={\begin{pmatrix}0\\0\end{pmatrix}}~.}
so
( E – e ϕ ) ψ + – c σ ⋅ ( p – e A ) ψ – = m c 2 ψ + {\displaystyle (E-e\phi )\psi _{+}-c{\boldsymbol {\sigma }}\cdot \left(\mathbf {p} -e\mathbf {A} \right)\psi _{-}=mc^{2}\psi _{+}}
– ( E – e ϕ ) ψ – + c σ ⋅ ( p – e A ) ψ + = m c 2 ψ – {\displaystyle -(E-e\phi )\psi _{-}+c{\boldsymbol {\sigma }}\cdot \left(\mathbf {p} -e\mathbf {A} \right)\psi _{+}=mc^{2}\psi _{-}}
Să presupunem că câmpul este slab și că mișcarea electronului este nerelativistă, avem că energia totală a electronului este aproximativ egală cu energia de repaus a acestuia, iar impulsul trece la valoarea clasică,
E – e ϕ ≈ m c 2 {\displaystyle E-e\phi \approx mc^{2}}.
p ≈ m v {\displaystyle \mathbf {p} \approx m\mathbf {v} }
și astfel cea de-a doua ecuație poate fi scrisă
ψ – ≈ 1 2 m c σ ⋅ ( p – e A ) ψ + {\displaystyle \psi _{-}\approx {\frac {1}{2mc}}{\boldsymbol {\sigma }}\cdot \left(\mathbf {p} -e\mathbf {A} \right)\psi _{+}}
care este de ordinul v/c – deci la energii și viteze tipice, componentele inferioare ale spinorului Dirac în reprezentarea standard sunt mult suprimate în comparație cu componentele superioare. Înlocuind această expresie în prima ecuație se obține, după o oarecare rearanjare
( E – m c 2 ) ψ + = 1 2 m 2 ψ + + + e ϕ ψ + {\displaystyle (E-mc^{2})\psi _{+}={\frac {1}{2m}}\left^{2}\psi _{+}+e\phi \psi _{+}}.
Operatorul din stânga reprezintă energia particulei redusă cu energia sa de repaus, care este doar energia clasică, astfel încât recuperăm teoria lui Pauli dacă identificăm spinorul său 2 cu componentele superioare ale spinorului Dirac în aproximația nerelativistă. O altă aproximare oferă ecuația lui Schrödinger ca limită a teoriei lui Pauli. Astfel, ecuația Schrödinger poate fi văzută ca o aproximație nerelativistă îndepărtată a ecuației Dirac, atunci când se poate neglija spinul și se lucrează doar la energii și viteze mici. Acesta a fost, de asemenea, un mare triumf pentru noua ecuație, deoarece a trasat misteriosul i care apare în ea și necesitatea unei funcții de undă complexe înapoi la geometria spațiu-timpului prin intermediul algebrei Dirac. Aceasta evidențiază, de asemenea, de ce ecuația lui Schrödinger, deși superficial sub forma unei ecuații de difuzie, reprezintă de fapt propagarea undelor.
Ar trebui subliniat cu tărie faptul că această separare a spinorului Dirac în componente mari și mici depinde în mod explicit de o aproximare de joasă energie. Întregul spinor Dirac reprezintă un întreg ireductibil, iar componentele pe care tocmai le-am neglijat pentru a ajunge la teoria Pauli vor aduce fenomene noi în regim relativist – antimateria și ideea de creare și anihilare a particulelor.
Comparație cu teoria WeylEdit
În limita m → 0, ecuația Dirac se reduce la ecuația Weyl, care descrie particule relativiste fără masă de spin-1⁄2.
Lagrangianul DiracEdit
Atât ecuația Dirac cât și ecuația Dirac adiacentă pot fi obținute din (variația) acțiunii cu o densitate specifică a lagrangianului care este dată de:
L = i ℏ c ψ ¯ ψ γ μ ∂ μ ψ – m c 2 ψ ¯ ψ {\displaystyle {\mathcal {L}}=i\hbar c{\overline {\psi }}\gamma ^{\mu }\partial _{\mu }\psi -mc^{2}{\overline {\psi }}}\psi }