Equation de Dirac

Mai 31, 2021
admin

L’équation de Dirac sous la forme initialement proposée par Dirac est :

( β m c 2 + c ∑ n = 1 3 α n p n ) ψ ( x , t ) = i ℏ ∂ ψ ( x , t ) ∂ t {\displaystyle \left(\beta mc^{2}+c\sum _{n\mathop {=} 1}^{3}\alpha _{n}p_{n}\right)\psi (x,t)=i\hbar {\frac {\partial \psi (x,t)}{\partial t}}

{\displaystyle \left(\beta mc^{2}+c\sum _{n\mathop {=} 1}^{3}\alpha _{n}p_{n}\right)\psi (x,t)=i\hbar {\frac {\partial \psi (x,t)}{\partial t}}

où ψ = ψ(x, t) est la fonction d’onde pour l’électron de masse au repos m avec des coordonnées spatio-temporelles x, t. Les p1, p2, p3 sont les composantes de la quantité de mouvement, entendue comme l’opérateur quantité de mouvement dans l’équation de Schrödinger. De plus, c est la vitesse de la lumière, et ħ est la constante de Planck réduite. Ces constantes physiques fondamentales reflètent respectivement la relativité restreinte et la mécanique quantique.

Le but de Dirac en coulant cette équation était d’expliquer le comportement de l’électron en mouvement relativiste, et ainsi de permettre de traiter l’atome d’une manière compatible avec la relativité. Son espoir, plutôt modeste, était que les corrections introduites de cette manière pourraient avoir une incidence sur le problème des spectres atomiques.

Jusqu’à cette époque, les tentatives pour rendre l’ancienne théorie quantique de l’atome compatible avec la théorie de la relativité, tentatives basées sur la discrétisation du moment angulaire stocké dans l’orbite éventuellement non circulaire de l’électron autour du noyau atomique, avaient échoué – et la nouvelle mécanique quantique de Heisenberg, Pauli, Jordan, Schrödinger et Dirac lui-même ne s’était pas suffisamment développée pour traiter ce problème. Bien que les intentions initiales de Dirac aient été satisfaites, son équation avait des implications bien plus profondes sur la structure de la matière et introduisait de nouvelles classes mathématiques d’objets qui sont maintenant des éléments essentiels de la physique fondamentale.

Les nouveaux éléments de cette équation sont les quatre matrices 4 × 4 α1, α2 , α3 et β, et la fonction d’onde ψ à quatre composantes. Il y a quatre composantes dans ψ parce que son évaluation en tout point de l’espace de configuration est un bispinteur. Elle est interprétée comme une superposition d’un électron de spin supérieur, d’un électron de spin inférieur, d’un positron de spin supérieur et d’un positron de spin inférieur (voir ci-dessous pour une discussion plus approfondie).

Les matrices 4 × 4 αk et β sont toutes hermitiennes et involutives :

α i 2 = β 2 = I 4 {\displaystyle \alpha _{i}^{2}=\beta ^{2}=I_{4}}.

\alpha _{i}^{2}=\beta ^{2}=I_{4}

et ils s’anticommutent tous mutuellement :

α i α j + α j α i = 0 ( i ≠ j ) {\displaystyle \alpha _{i}\\alpha _{j}+\alpha _{j}\alpha _{i}=0\quad (i\neq j)}

{\displaystyle \alpha _{i}\alpha _{j}+\alpha _{j}\alpha _{i}=0\quad (i\neq j)}

α i β + β α i = 0 {\displaystyle \alpha _{i}\beta +\beta \alpha _{i}=0}

{{displaystyle \alpha _{i}\beta +\beta \alpha _{i}=0}

Ces matrices et la forme de la fonction d’onde ont une profonde signification mathématique. La structure algébrique représentée par les matrices gamma avait été créée quelque 50 ans plus tôt par le mathématicien anglais W. K. Clifford. À leur tour, les idées de Clifford étaient issues des travaux du milieu du XIXe siècle du mathématicien allemand Hermann Grassmann dans sa Lineale Ausdehnungslehre (théorie des extensions linéaires). Cette dernière avait été considérée comme pratiquement incompréhensible par la plupart de ses contemporains. L’apparition de quelque chose d’aussi apparemment abstrait, à une date aussi tardive, et d’une manière physique aussi directe, est l’un des chapitres les plus remarquables de l’histoire de la physique.

L’unique équation symbolique se défait donc en quatre équations différentielles partielles linéaires couplées du premier ordre pour les quatre quantités qui composent la fonction d’onde. L’équation peut être écrite plus explicitement en unités de Planck comme suit :

i ∂ t = i ∂ x + ∂ y + i ∂ z + m{\displaystyle i\partial _{t}{but{bmatrix}\psi _{1}\\\\\psi _{2}\\\psi _{3}\\\\psi _{4}\end{bmatrix}}=i\partial _{x}{but{bmatrix}-\psi _{4}\\-\psi _{3}\\-\psi _{2}\-\psi _{1}\\-\N-\N-\N-\N-\N-\N-\N- +partiel _{y}{\begin{bmatrix}-\psi _{4}\\\N- +psi _{3}\-\N-\N-\N-\N-\N- _{2}\N-\N-\N-\N-\N-\N- +i\Partiel _{z}{\begin{bmatrix}-\psi _{3}\\N+psi _{4}\N-\psi _{1}\N+psi _{2}\N- fin{bmatrix}}+m{\begin{bmatrix}+\psi _{1}\N+psi _{2}\N-\psi _{3}\N-\psi _{4}\end{bmatrix}}

ce qui permet de comprendre qu’il s’agit d’un ensemble de quatre équations différentielles partielles avec quatre fonctions inconnues.

Rendre l’équation de Schrödinger relativisteEdit

L’équation de Dirac est superficiellement similaire à l’équation de Schrödinger pour une particule libre massive:

– ℏ 2 2 m ∇ 2 ϕ = i ℏ ∂ ∂ t ϕ . {\displaystyle -{\frac {\hbar ^{2}{2m}}\nabla ^{2}\phi =i\hbar {\frac {\partial }{\partial t}}\phi ~.}

{\displaystyle -{\frac {\hbar ^{2}}{2m}}\nabla ^{2}\phi =i\hbar {\frac {\partial }{\partial t}}\phi ~.}

Le côté gauche représente le carré de l’opérateur de quantité de mouvement divisé par deux fois la masse, qui est l’énergie cinétique non relativiste. Comme la relativité traite l’espace et le temps comme un tout, une généralisation relativiste de cette équation exige que les dérivées de l’espace et du temps entrent symétriquement comme dans les équations de Maxwell qui régissent le comportement de la lumière – les équations doivent être différentiellement du même ordre dans l’espace et le temps. En relativité, le momentum et les énergies sont les parties spatiales et temporelles d’un vecteur spatio-temporel, le quatre-momentum, et ils sont reliés par la relation relativiste invariante

E 2 = m 2 c 4 + p 2 c 2 {\displaystyle E^{2}=m^{2}c^{4}+p^{2}c^{2}}.

{\displaystyle E^{2}=m^{2}c^{4}+p^{2}c^{2}}

ce qui dit que la longueur de ce quadrivecteur est proportionnelle à la masse au repos m. En substituant les équivalents opérateurs de l’énergie et de la quantité de mouvement de la théorie de Schrödinger, on obtient l’équation de Klein-Gordon décrivant la propagation des ondes, construite à partir d’objets relativistes invariants ,

( – 1 c 2 ∂ 2 ∂ t 2 + ∇ 2 ) ϕ = m 2 c 2 ℏ 2 ϕ {\displaystyle \left(-{\frac {1}{c^{2}}}{\frac {\partial ^{2}}{\partial t^{2}}+\nabla ^{2}\right)\phi ={\frac {m^{2}c^{2}}{\hbar ^{2}}\phi }

{\displaystyle \left(-{\frac {1}{c^{2}}{\frac {\partial ^{2}}{\partial t^{2}}}+\nabla ^{2}\right)\phi ={\frac {m^{2}c^{2}}{\hbar ^{2}}\phi }

avec la fonction d’onde ϕ étant un scalaire relativiste : un nombre complexe qui a la même valeur numérique dans tous les cadres de référence. Les dérivées spatiales et temporelles entrent toutes deux au second ordre. Ceci a une conséquence révélatrice pour l’interprétation de l’équation. Puisque l’équation est du second ordre dans la dérivée temporelle, il faut spécifier les valeurs initiales à la fois de la fonction d’onde elle-même et de sa première dérivée temporelle afin de résoudre des problèmes précis. Comme ces deux valeurs peuvent être spécifiées de manière plus ou moins arbitraire, la fonction d’onde ne peut pas conserver son ancien rôle de détermination de la densité de probabilité de trouver l’électron dans un état de mouvement donné. Dans la théorie de Schrödinger, la densité de probabilité est donnée par l’expression définie positive

ρ = ϕ ∗ ϕ {\displaystyle \rho =\phi ^{*}\phi }.

{{displaystyle \rho =\phi ^{*}\phi }

et cette densité est convexe selon le vecteur courant de probabilité

J = – i ℏ 2 m ( ϕ ∗ ∇ ϕ – ϕ ∇ ϕ ∗ ) {\displaystyle J=-{\frac {i\hbar }{2m}}(\phi ^{*}\nabla \phi -\phi \nabla \phi ^{*})}

{\displaystyle J=-{\frac {i\hbar }{2m}}(\phi ^{*}\nabla \phi -\phi \nabla \phi ^{*})}

avec la conservation du courant et de la densité de probabilité suivant l’équation de continuité:

∇ ⋅ J + ∂ ρ ∂ t = 0 . {\displaystyle \nabla \cdot J+{\frac {\partial \rho }{\partial t}}=0~.}

{{displaystyle \nabla \cdot J+{\frac {\partial \rho }{\partial t}}=0~.}

Le fait que la densité soit définie positive et convexe selon cette équation de continuité implique que nous pouvons intégrer la densité sur un certain domaine et fixer le total à 1, et cette condition sera maintenue par la loi de conservation. Une théorie relativiste correcte avec un courant de densité de probabilité doit également partager cette caractéristique. Maintenant, si nous souhaitons conserver la notion de densité convexe, nous devons généraliser l’expression de Schrödinger de la densité et du courant de sorte que les dérivées spatiales et temporelles entrent à nouveau de manière symétrique par rapport à la fonction d’onde scalaire. Nous sommes autorisés à conserver l’expression de Schrödinger pour le courant, mais nous devons remplacer la densité de probabilité par l’expression symétriquement formée

ρ = i ℏ 2 m c 2 ( ψ ∗ ∂ t ψ – ψ ∂ t ψ ∗ ) . {\displaystyle \rho ={\frac {i\hbar }{2mc^{2}}(\psi ^{*}\partiel _{t}\psi -\psi \partiel _{t}\psi ^{*})~.}

{\displaystyle \rho ={\frac {i\hbar }{2mc^{2}}(\psi ^{*}\partial _{t}\psi -\psi \partial _{t}\psi ^{*})~.}

qui devient maintenant la 4e composante d’un vecteur spatio-temporel, et toute la densité de probabilité à 4 courants a l’expression relativiste covariante

J μ = i ℏ 2 m ( ψ ∗ ∂ μ ψ – ψ ∂ μ ψ ∗ ) . {\displaystyle J^{\mu }={\frac {i\hbar }{2m}}(\psi ^{*}\partiel ^{\mu }\psi -\psi \partiel ^{\mu }\psi ^{*})~.}

{\displaystyle J^{\mu }={\frac {i\hbar }{2m}}(\psi ^{*}\partial ^{\mu }\psi -\psi \partial ^{\mu }\psi ^{*})~.}

L’équation de continuité est comme avant. Tout est compatible avec la relativité maintenant, mais nous voyons immédiatement que l’expression de la densité n’est plus définie positive – les valeurs initiales de ψ et de ∂tψ peuvent être librement choisies, et la densité peut donc devenir négative, ce qui est impossible pour une densité de probabilité légitime. Ainsi, nous ne pouvons pas obtenir une généralisation simple de l’équation de Schrödinger sous l’hypothèse naïve que la fonction d’onde est un scalaire relativiste, et l’équation qu’elle satisfait, du second ordre dans le temps.

Bien qu’elle ne soit pas une généralisation relativiste réussie de l’équation de Schrödinger, cette équation est ressuscitée dans le contexte de la théorie quantique des champs, où elle est connue sous le nom d’équation de Klein-Gordon, et décrit un champ de particules sans spin (par exemple le méson pi ou le boson de Higgs). Historiquement, Schrödinger lui-même est arrivé à cette équation avant celle qui porte son nom, mais l’a rapidement écartée. Dans le contexte de la théorie quantique des champs, la densité indéfinie est comprise comme correspondant à la densité de charge, qui peut être positive ou négative, et non à la densité de probabilité.

Le coup de DiracEdit

Dirac a donc pensé à tenter une équation qui soit du premier ordre à la fois dans l’espace et dans le temps. On pouvait, par exemple, formellement (c’est-à-dire… par abus de notation) prendre l’expression relativiste de l’énergie

E = c p 2 + m 2 c 2 , {\displaystyle E=c{\sqrt {p^{2}+m^{2}c^{2}}~,}

{\displaystyle E=c{\sqrt {p^{2}+m^{2}c^{2}}~,}

remplacer p par son équivalent opérateur, développer la racine carrée dans une série infinie d’opérateurs dérivés, établir un problème de valeur propre, puis résoudre formellement l’équation par itérations. La plupart des physiciens n’avaient guère confiance dans un tel procédé, même s’il était techniquement possible.

Selon l’histoire, Dirac regardait la cheminée de Cambridge en réfléchissant à ce problème, lorsqu’il eut l’idée de prendre la racine carrée de l’opérateur d’onde ainsi :

∇ 2 – 1 c 2 ∂ 2 ∂ t 2 = ( A ∂ x + B ∂ y + C ∂ z + i c D ∂ t ) ( A ∂ x + B ∂ y + C ∂ z + i c D ∂ t ) . {\displaystyle \nabla ^{2}-{\frac {1}{c^{2}}{\frac {\partial ^{2}}{\partial t^{2}}=\left(A\partial _{x}+B\partial _{y}+C\partial _{z}+{\frac {i}{c}}D\partial _{t}\right)\left(A\partial _{x}+B\partial _{y}+C\partial _{z}+{\frac {i}{c}}D\partial _{t}\right)~.}

{\displaystyle \nabla ^{2}-{\frac {1}{c^{2}}{\frac {\partial ^{2}}{\partial t^{2}}=\left(A\partial _{x}+B\partial _{y}+C\partial _{z}+{\frac {i}{c}}D\partial _{t}\right)\left(A\partial _{x}+B\partial _{y}+C\partial _{z}+{\frac {i}{c}}D\partial _{t}\right)~.}

En multipliant le côté droit, nous voyons que, pour que tous les termes croisés tels que ∂x∂y disparaissent, nous devons supposer

A B + B A = 0 , … {\displaystyle AB+BA=0,~\ldots ~}.

{\displaystyle AB+BA=0,~\ldots ~}

avec

A 2 = B 2 = … = 1 . {\displaystyle A^{2}=B^{2}=\ldots =1~.}

{{displaystyle A^{2}=B^{2}=\ldots =1~.}

Dirac, qui venait alors de s’investir intensément dans l’élaboration des fondements de la mécanique matricielle d’Heisenberg, comprit immédiatement que ces conditions pouvaient être remplies si A, B, C et D étaient des matrices, ce qui impliquait que la fonction d’onde avait plusieurs composantes. Cela expliquait immédiatement l’apparition de fonctions d’onde à deux composantes dans la théorie phénoménologique du spin de Pauli, quelque chose qui, jusqu’alors, avait été considéré comme mystérieux, même pour Pauli lui-même. Cependant, il faut au moins 4 × 4 matrices pour établir un système ayant les propriétés requises – la fonction d’onde avait donc quatre composantes, et non pas deux, comme dans la théorie de Pauli, ou une, comme dans la théorie simple de Schrödinger. La fonction d’onde à quatre composantes représente une nouvelle classe d’objet mathématique dans les théories physiques qui fait sa première apparition ici.

Donné la factorisation en termes de ces matrices, on peut maintenant écrire immédiatement une équation

( A ∂ x + B ∂ y + C ∂ z + i c D ∂ t ) ψ = κ ψ ψ {\displaystyle \left(A\partial _{x}+B\partial _{y}+C\partial _{z}+{\frac {i}{c}}D\partial _{t}\right)\psi =\kappa \psi }

{\displaystyle \left(A\partial _{x}+B\partial _{y}+C\partial _{z}+{\frac {i}{c}}D\partial _{t}\right)} \psi =\kappa \psi }

with κ {\displaystyle \kappa }

\kappa

à déterminer. En appliquant à nouveau l’opérateur matriciel des deux côtés, on obtient ( ∇ 2 – 1 c 2 ∂ t 2 ) ψ = κ 2 ψ . {\displaystyle \left(\nabla ^{2}-{\frac {1}{c^{2}}}\partial _{t}^{2}\right)\psi =\kappa ^{2}\psi ~.}

{\displaystyle \left(\nabla ^{2}-{\frac {1}{c^{2}}}\partiel _{t}^{2}\right)\psi =\kappa ^{2}\psi ~.}

On taking κ = m c ℏ {\displaystyle \kappa ={\tfrac {mc}{\hbar }}

{\displaystyle \kappa ={\tfrac {mc}{\hbar }}

on trouve que toutes les composantes de la fonction d’onde satisfont individuellement la relation énergie-momentum relativiste. Ainsi, l’équation recherchée qui est du premier ordre à la fois dans l’espace et dans le temps est ( A ∂ x + B ∂ y + C ∂ z + i c D ∂ t – m c ℏ ) ψ = 0 . {\displaystyle \left(A\partial _{x}+B\partial _{y}+C\partial _{z}+{\frac {i}{c}}D\partial _{t}-{\frac {mc}{\hbar }\right)\psi =0~.} }

Réglage

A = i β α 1 , B = i β α 2 , C = i β α 3 , D = β , {\displaystyle A=i\beta \alpha _{1}\,,\,B=i\beta \alpha _{2}\,,\,C=i\beta \alpha _{3}\,,\,D=\beta ~,}

{\displaystyle A=i\beta \alpha _{1}\,,\,B=i\beta \alpha _{2}\,,\,C=i\beta \alpha _{3}\,,\,D=\beta ~,}

et parce que D 2 = β 2 = I 4 , {\displaystyle D^{2}=\beta ^{2}=I_{4}~,}

{{displaystyle D^{2}=\beta ^{2}=I_{4}~,}

on obtient l’équation de Dirac telle qu’écrite ci-dessus.

Forme covariante et invariance relativisteModifié

Pour démontrer l’invariance relativiste de l’équation, il est avantageux de la couler dans une forme dans laquelle les dérivées spatiales et temporelles apparaissent sur un pied d’égalité. De nouvelles matrices sont introduites comme suit :

D = γ 0 , {\displaystyle D=\gamma ^{0}~,}

{\displaystyle D=\gamma ^{0}~,}

A = i γ 1 , B = i γ 2 , C = i γ 3 , {\displaystyle A=i\gamma ^{1}~,\quad B=i\gamma ^{2}~,\quad C=i\gamma ^{3}~,}

{\displaystyle A=i\gamma ^{1}~,\quad B=i\gamma ^{2}~,\quad C=i\gamma ^{3}~,}

et l’équation prend la forme (en se rappelant la définition des composantes covariantes du 4-et surtout que ∂0 = 1/c∂t )

équation de Dirac

i ℏ γ μ ∂ μ ψ – m c ψ = 0 {\displaystyle i\hbar \gamma ^{\mu }\partial _{\mu }\psi -mc\psi =0}

i\hbar \gamma ^{\mu }\partial _{\mu }\psi -mc\psi =0

où il y a une sommation implicite sur les valeurs de l’indice deux fois répété μ = 0, 1, 2, 3, et ∂μ est le gradient 4. En pratique, on écrit souvent les matrices gamma en termes de sous-matrices 2 × 2 prises dans les matrices de Pauli et la matrice identité 2 × 2. Explicitement, la représentation standard est

γ 0 = ( I 2 0 0 – I 2 ) , γ 1 = ( 0 σ x – σ x 0 ) , γ 2 = ( 0 σ y – σ y 0 ) , γ 3 = ( 0 σ z – σ z 0 ) . {\displaystyle \gamma ^{0}={\begin{pmatrix}I_{2}&0\\0&-I_{2}\end{pmatrix}}~,\gamma ^{1}=\left({\begin{array}{cccc}0&\sigma _{x}\\-\sigma _{x}&0\end{array}}\right)~,\gamma ^{2}=\left({\begin{array}{cccc}0&\sigma _{y}\\-\sigma _{y}&0\end{array}}\right)~,\gamma ^{3}=\left({\begin{array}{cccc}0&\sigma _{z}\\-\sigma _{z}&0\end{array}}\right)~.}

{\displaystyle \gamma ^{0}={\begin{pmatrix}I_{2}0\\0-I_{2}\end{pmatrix}}~,\gamma ^{1}=\left({\begin{array}{cccc}0\sigma _{x}\\-\sigma _{x}0\end{array}}\right)~,\gamma ^{2}=\left({\begin{array}{cccc}0\sigma _{y}\-\sigma _{y}0\end{array}}\right)~,\gamma ^{3}=\left({\begin{array}{cccc}0\sigma _{z}\-\sigma _{z}0\end{array}}\right)~. }.}

Le système complet se résume en utilisant la métrique de Minkowski sur l’espace-temps sous la forme

{ γ μ , γ ν }. = 2 η μ ν I 4 {\displaystyle \{\gamma ^{\mu },\gamma ^{\nu }\}=2\eta ^{\mu \nu }I_{4}}

{\displaystyle \{\gamma ^{\mu },\gamma ^{\nu }\}=2\eta ^{\mu \nu }I_{4}}

où l’expression entre parenthèses

{a , b } = a b + b a {\displaystyle \{a,b\}=ab+ba}

{\displaystyle \{a,b\}=ab+ba}

désigne l’anticommutateur. Ce sont les relations de définition d’une algèbre de Clifford sur un espace pseudo-orthogonal à 4 dimensions avec signature métrique (+ – – -). L’algèbre de Clifford spécifique employée dans l’équation de Dirac est connue aujourd’hui comme l’algèbre de Dirac. Bien qu’elle n’ait pas été reconnue comme telle par Dirac au moment où l’équation a été formulée, rétrospectivement, l’introduction de cette algèbre géométrique représente un énorme pas en avant dans le développement de la théorie quantique.

L’équation de Dirac peut maintenant être interprétée comme une équation de valeur propre, où la masse au repos est proportionnelle à une valeur propre de l’opérateur 4-momentum, la constante de proportionnalité étant la vitesse de la lumière:

P o p ψ = m c ψ . {\displaystyle P_{\mathrm {op} }\psi =mc\psi ~.}

{\displaystyle P_{\mathrm {op}}\psi =mc\psi ~.} }\psi =mc\psi ~.}

Utilisation de ∂ / = d e f γ μ ∂ μ {\displaystyle {\partial \!\!\!/} {\\stackrel {\mathrm {def}

{\displaystyle {\partial \!\!/}\ {\ {\stackrel {\mathrm {def}}{{\i1}-{\i1}-{\i1}-{\i1}}.

{\partial \!\!\!{\big /}

se prononce « d-slash »), selon la notation Feynman slash, l’équation de Dirac devient : i ℏ ∂ / ψ – m c ψ = 0. {\displaystyle i\hbar {\partial \!\!\!{\big /}\psi -mc\psi =0.}

{{displaystyle i\hbar {\partial \!\!\!{\big /}\psi -mc\psi =0.}

En pratique, les physiciens utilisent souvent des unités de mesure telles que ħ = c = 1, dites unités naturelles. L’équation prend alors la forme simple

équation de Dirac (unités naturelles)

( i ∂ / – m ) ψ = 0 {\displaystyle (i{\partial \!\!\!{\big /}}-m)\psi =0}.

{displaystyle (i{partiel \!\!\!{\big /}}-m)\psi =0}

Un théorème fondamental stipule que si deux ensembles distincts de matrices sont donnés qui satisfont tous deux les relations de Clifford, alors ils sont reliés l’un à l’autre par une transformation de similarité :

γ μ ′ = S – 1 γ μ S . {\displaystyle \gamma ^{\mu \prime }=S^{-1}\gamma ^{\mu }S~.}

{{displaystyle \gamma ^{\mu \prime }=S^{-1}\gamma ^{\mu }S~.}

Si en plus les matrices sont toutes unitaires, comme le sont les ensembles de Dirac, alors S lui-même est unitaire;

γ μ ′ = U † γ μ U . {\displaystyle \gamma ^{\mu \prime }=U^{\dagger }\gamma ^{\mu }U~.}

{{displaystyle \gamma ^{\mu \prime }=U^{\dagger }\gamma ^{\mu }U~.}

La transformation U est unique jusqu’à un facteur multiplicatif de valeur absolue 1. Imaginons maintenant qu’une transformation de Lorentz ait été effectuée sur les coordonnées d’espace et de temps, et sur les opérateurs dérivés, qui forment un vecteur covariant. Pour que l’opérateur γμ∂μ reste invariant, les gammas doivent se transformer entre eux en un vecteur contravariant par rapport à leur indice spatio-temporel. Ces nouveaux gammas vont eux-mêmes satisfaire les relations de Clifford, du fait de l’orthogonalité de la transformation de Lorentz. Par le théorème fondamental, nous pouvons remplacer le nouvel ensemble par l’ancien ensemble soumis à une transformation unitaire. Dans le nouveau cadre, en se rappelant que la masse au repos est un scalaire relativiste, l’équation de Dirac prendra alors la forme

( i U † γ μ U ∂ μ ′ – m ) ψ ( x ′ , t ′ ) = 0 {\displaystyle (iU^{\dagger }\gamma ^{\mu }U\partial _{\mu }^{\prime }-m)\psi (x^{\prime },t^{\prime })=0}

(iU^{\dagger }\gamma ^{\mu }U\partial _{\mu }^{\prime }-m)\psi (x^{\prime },t^{\prime })=0

U † ( i γ μ ∂ μ ′ – m ) U ψ ( x ′ , t ′ ) = 0 . {\displaystyle U^{\dagger }(i\gamma ^{\mu }\partiel _{\mu }^{\prime }-m)U\psi (x^{\prime },t^{\prime })=0~.}

{\displaystyle U^{\dagger }(i\gamma ^{\mu }\partiel _{\mu }^{\prime }-m)U\psi (x^{\prime },t^{\prime })=0~.}

Si nous définissons maintenant le spinor transformé

ψ ′ = U ψ {\displaystyle \psi ^{\prime }=U\psi }.

{displaystyle \psi ^{\prime }=U\psi }

alors nous avons l’équation de Dirac transformée d’une manière qui démontre l’invariance relativiste manifeste:

( i γ μ ∂ μ ′ – m ) ψ ′ ( x ′ , t ′ ) = 0 . {\displaystyle (i\gamma ^{\mu }partiel _{\mu }^{\prime }-m)\psi ^{\prime }(x^{\prime },t^{\prime })=0~.}

{\displaystyle (i\gamma ^{\mu }\partiel _{\mu }^{\prime }-m)\psi ^{\prime }(x^{\prime },t^{\prime })=0~.}

Donc, une fois qu’on s’est fixé sur une représentation unitaire quelconque des gammas, elle est définitive à condition de transformer le spinor selon la transformation unitaire qui correspond à la transformation de Lorentz donnée.

Les diverses représentations des matrices de Dirac employées mettront en évidence des aspects particuliers du contenu physique dans la fonction d’onde de Dirac (voir ci-dessous). La représentation montrée ici est connue comme la représentation standard – dans celle-ci, les deux composantes supérieures de la fonction d’onde passent dans la fonction d’onde du spinateur 2 de Pauli dans la limite des basses énergies et des petites vitesses par rapport à la lumière.

Les considérations ci-dessus révèlent l’origine des gammas en géométrie, en rappelant la motivation originale de Grassmann – ils représentent une base fixe de vecteurs unitaires dans l’espace-temps. De même, les produits des gammas tels que γμγν représentent des éléments de surface orientés, et ainsi de suite. Avec cela en tête, nous pouvons trouver la forme de l’élément de volume unitaire sur l’espace-temps en termes de gammas comme suit. Par définition, il est

V = 1 4 ! ϵ μ ν α β γ μ γ ν γ α γ β . {\displaystyle V={\frac {1}{4!}\epsilon _{\mu \nu \alpha \beta }\gamma ^{\mu }\gamma ^{\nu }\gamma ^{\alpha }\gamma ^{\beta }.}

V={\frac {1}{4!}\epsilon _{\mu \nu \alpha \beta }\gamma ^{\mu }\gamma ^{\nu }\gamma ^{\alpha }\gamma ^{\beta }.

Pour que ce soit un invariant, le symbole epsilon doit être un tenseur, et doit donc contenir un facteur de √g, où g est le déterminant du tenseur métrique. Comme celui-ci est négatif, ce facteur est imaginaire. Ainsi

V = i γ 0 γ 1 γ 2 γ 3 . {\displaystyle V=i\gamma ^{0}\gamma ^{1}\gamma ^{2}\gamma ^{3}~.}

{\displaystyle V=i\gamma ^{0}\gamma ^{1}\gamma ^{2}\gamma ^{3}~.}

Cette matrice reçoit le symbole spécial γ5, en raison de son importance lorsqu’on considère des transformations impropres de l’espace-temps, c’est-à-dire celles qui changent l’orientation des vecteurs de base. Dans la représentation standard, elle est

γ 5 = ( 0 I 2 I 2 0 ) . {\displaystyle \gamma _{5}={\begin{pmatrix}0&I_{2}\\I_{2}&0\end{pmatrix}}~.}

{\displaystyle \gamma _{5}={\begin{pmatrix}0I_{2}\\I_{2}0\end{pmatrix}}~.}

On trouvera également que cette matrice s’oppose aux quatre autres matrices de Dirac:

γ 5 γ μ + γ μ γ 5 = 0 {\displaystyle \gamma ^{5}\gamma ^{\mu }+\gamma ^{\mu }\gamma ^{5}=0}

{\displaystyle \gamma ^{5}\gamma ^{\mu }+\gamma ^{\mu }\gamma ^{5}=0}

Il joue un rôle prépondérant lorsque des questions de parité se posent car l’élément de volume en tant que grandeur dirigée change de signe sous une réflexion spatio-temporelle. Prendre la racine carrée positive ci-dessus revient donc à choisir une convention de parité sur l’espace-temps.

Conservation du courant de probabilitéEdit

En définissant le spinor adjoint

ψ ¯ = ψ † γ 0 {\displaystyle {\bar {\psi }}=\psi ^{\dagger }\gamma ^{0}}.

{{displaystyle {\bar {\psi }}=\psi ^{\dagger }\gamma ^{0}}

où ψ† est le transposé conjugué de ψ, et en remarquant que

( γ μ ) † γ 0 = γ 0 γ μ , {\displaystyle (\gamma ^{\mu })^{\dagger }\gamma ^{0}=\gamma ^{0}\gamma ^{\mu }~,}

{\displaystyle (\\gamma ^{\mu })^{\dagger }\gamma ^{0}=\gamma ^{0}\gamma ^{\mu }~,}

on obtient, en prenant le conjugué hermitien de l’équation de Dirac et en multipliant de droite par γ0, l’équation adjointe :

ψ ¯ ( i γ μ ∂ μ + m ) = 0 , {\displaystyle {\bar {\psi }}(i\gamma ^{\mu }\partiel _{\mu }+m)=0~,}

{\displaystyle {\bar {\psi }}(i\gamma ^{\mu }\partiel _{\mu }+m)=0~,}

où ∂μ est compris comme agissant vers la gauche. En multipliant l’équation de Dirac par ψ à gauche, et l’équation adjointe par ψ à droite, et en additionnant, on obtient la loi de conservation du courant de Dirac :

∂ μ ( ψ ¯ γ μ ψ ) = 0 . {\displaystyle \partial _{\mu }\left({\bar {\psi }}\gamma ^{\mu }\\right)=0~.}

{\displaystyle \partial _{\mu }\left({\bar {\psi }}\gamma ^{\mu }\psi \right)=0~.}

Maintenant nous voyons le grand avantage de l’équation du premier ordre par rapport à celle que Schrödinger avait essayée – c’est la densité de courant conservée requise par l’invariance relativiste, seulement maintenant sa 4ème composante est définie positive et donc appropriée pour le rôle d’une densité de probabilité:

J 0 = ψ ¯ γ 0 ψ = ψ † ψ . {\displaystyle J^{0}={\bar {\psi }}\gamma ^{0}\psi =\psi ^{\dagger }\psi ~.}

{\displaystyle J^{0}={\bar {\psi }}\gamma ^{0}\psi =\psi ^{\dagger }\psi ~.}

Parce que la densité de probabilité apparaît maintenant comme la quatrième composante d’un vecteur relativiste et non comme un simple scalaire comme dans l’équation de Schrödinger, elle sera soumise aux effets habituels des transformations de Lorentz tels que la dilatation du temps. Ainsi, par exemple, les processus atomiques qui sont observés comme des taux, seront nécessairement ajustés d’une manière compatible avec la relativité, tandis que ceux qui impliquent la mesure de l’énergie et de la quantité de mouvement, qui forment eux-mêmes un vecteur relativiste, subiront un ajustement parallèle qui préserve la covariance relativiste des valeurs observées. Le courant de Dirac lui-même est alors le quadrivecteur covariant espace-temps :

J μ = ψ ¯ γ μ ψ . {\displaystyle J^{\mu }={\bar {\psi }}\gamma ^{\mu }\psi .}

{{displaystyle J^{\mu }={\bar {\psi }}\gamma ^{\mu }\psi .}

SolutionsEdit

Voir spinor de Dirac pour les détails des solutions de l’équation de Dirac. Notez que puisque l’opérateur de Dirac agit sur 4-tuples de fonctions intégrables au carré, ses solutions devraient être membres du même espace de Hilbert. Le fait que les énergies des solutions n’aient pas de borne inférieure est inattendu – voir la section sur la théorie des trous ci-dessous pour plus de détails.

Comparaison avec la théorie de PauliModification

Voir aussi : Équation de Pauli

La nécessité d’introduire un spin demi-entier remonte expérimentalement aux résultats de l’expérience de Stern-Gerlach. On fait passer un faisceau d’atomes dans un fort champ magnétique inhomogène, qui se divise alors en N parties selon le moment angulaire intrinsèque des atomes. On a constaté que pour les atomes d’argent, le faisceau se divisait en deux – l’état fondamental ne pouvait donc pas être entier, car même si le moment cinétique intrinsèque des atomes était le plus petit possible, 1, le faisceau se diviserait en trois parties, correspondant à des atomes avec Lz = -1, 0, +1. La conclusion est que les atomes d’argent ont un moment cinétique intrinsèque net de 1⁄2. Pauli a établi une théorie qui explique ce fractionnement en introduisant une fonction d’onde à deux composantes et un terme de correction correspondant dans l’hamiltonien, représentant un couplage semi-classique de cette fonction d’onde à un champ magnétique appliqué, ainsi en unités SI : (Notez que les caractères gras impliquent des vecteurs euclidiens en 3 dimensions, alors que le quadrivecteur de Minkowski Aμ peut être défini comme A μ = ( ϕ / c , – A ) {\displaystyle A_{\mu }=(\phi /c,-\mathbf {A} )}.

{\displaystyle A_{\mu }=(\phi /c,-\mathbf {A} )}

.) H = 1 2 m ( σ ⋅ ( p – e A ) ) 2 + e ϕ . {\displaystyle H={{frac {1}{2m}}\left({\boldsymbol {\sigma }}\cdot \left(\mathbf {p} -e\mathbf {A} \right)\right)^{2}+e\phi ~.}

{{displaystyle H={\frac {1}{2m}}\left({\boldsymbol {\sigma }}\cdot \left(\mathbf {p} -e\mathbf {A} \right)\right)^{2}+e\phi ~.}

Ici A et ϕ {\displaystyle \phi }

\phi

représentent les composantes du quadri-potentiel électromagnétique dans leurs unités SI standard, et les trois sigmas sont les matrices de Pauli. En élevant au carré le premier terme, on trouve une interaction résiduelle avec le champ magnétique, ainsi que l’hamiltonien classique habituel d’une particule chargée interagissant avec un champ appliqué en unités SI : H = 1 2 m ( p – e A ) 2 + e ϕ – e ℏ 2 m σ ⋅ B . {\displaystyle H={\frac {1}{2m}\left(\mathbf {p} -e\mathbf {A} \right)^{2}+e\phi -{\frac {e\hbar }{2m}{\boldsymbol {\sigma }}\cdot \mathbf {B} ~.}

{\displaystyle H={\frac {1}{2m}}Gauche(\mathbf {p} -e\mathbf {A} \droite)^{2}+e\phi -{\frac {e\hbar }{2m}}{\boldsymbol {\sigma }}\cdot \mathbf {B} ~.}

Cet hamiltonien est maintenant une matrice 2 × 2, donc l’équation de Schrödinger basée sur celui-ci doit utiliser une fonction d’onde à deux composantes. En introduisant le potentiel électromagnétique externe à 4 vecteurs dans l’équation de Dirac d’une manière similaire, connue sous le nom de couplage minimal, elle prend la forme:

( γ μ ( i ℏ ∂ μ – e A μ ) – m c ) ψ = 0 . {\displaystyle (\gamma ^{\mu }(i\hbar \partial _{\mu }-eA_{\mu })-mc)\psi =0~.}

{\displaystyle (\gamma ^{\mu }(i\hbar \partial _{\mu }-eA_{\mu })-mc)\psi =0~.}

Une seconde application de l’opérateur de Dirac reproduira maintenant le terme de Pauli exactement comme précédemment, car les matrices de Dirac spatiales multipliées par i, ont les mêmes propriétés d’élévation au carré et de commutation que les matrices de Pauli. De plus, la valeur du rapport gyromagnétique de l’électron, placée devant le nouveau terme de Pauli, est expliquée à partir des premiers principes. Il s’agit là d’une réalisation majeure de l’équation de Dirac, qui a donné aux physiciens une grande confiance dans son exactitude générale. Mais il y a plus. La théorie de Pauli peut être considérée comme la limite à basse énergie de la théorie de Dirac de la manière suivante. Tout d’abord, l’équation est écrite sous la forme d’équations couplées pour les 2-spinors avec les unités SI restituées :

( ( ( m c 2 – E + e ϕ ) c σ ⋅ ( p – e A ) – c σ ⋅ ( p – e A ) ( m c 2 + E – e ϕ ) ). ( ψ + ψ – ) = ( 0 0 ) . {\displaystyle {\begin{pmatrix}(mc^{2}-E+e\phi )&c{\boldsymbol {\sigma }}\cdot \left(\mathbf {p} -e\mathbf {A} \right)\-c{\boldsymbol {\sigma }}\cdot \left(\mathbf {p} -e\mathbf {A} \right)&\left(mc^{2}+E-e\phi \right)\end{pmatrix}}{\begin{pmatrix}\psi _{+}\\\psi _{-}\end{pmatrix}}={\begin{pmatrix}0\\0\end{pmatrix}}~.}

{\displaystyle {\begin{pmatrix}(mc^{2}-E+e\phi )c{\boldsymbol {\sigma }}\cdot \left(\mathbf {p} -e\mathbf {A} \right)\-c{\boldsymbol {\sigma }}\cdot \left(\mathbf {p} -e\mathbf {A} \right)\left(mc^{2}+E-e\phi \right)\end{pmatrix}{\begin{pmatrix}\psi _{+}\\\\\\\psi _{-}\end{pmatrix}={\begin{pmatrix}0\\0\end{pmatrix}~.}

so

( E – e ϕ ) ψ + – c σ ⋅ ( p – e A ) ψ – = m c 2 ψ + {\displaystyle (E-e\phi )\psi _{+}-c{\boldsymbol {\sigma }}\cdot \left(\mathbf {p} -e\mathbf {A} \right)\psi _{-}=mc^{2}\psi _{+}

{\displaystyle (E-e\phi )\psi _{+}-c{\boldsymbol {\sigma }}\cdot \left(\mathbf {p} -e\mathbf {A} \right)\psi _{-}=mc^{2}\psi _{+}}

– ( E – e ϕ ) ψ – + c σ ⋅ ( p – e A ) ψ + = m c 2 ψ – {\displaystyle -(E-e\phi )\psi _{-}+c{\boldsymbol {\sigma }}\cdot \left(\mathbf {p} -e\mathbf {A} \right)\psi _{+}=mc^{2}\psi _{-}}

{\displaystyle -(E-e\phi )\psi _{-}+c{\boldsymbol {\sigma }}\cdot \left(\mathbf {p} -e\mathbf {A} \right)\psi _{+}=mc^{2}\psi _{-}

En supposant que le champ est faible et le mouvement de l’électron non-relativiste, nous avons l’énergie totale de l’électron approximativement égale à son énergie de repos, et le momentum passant à la valeur classique,

E – e ϕ ≈ m c 2 {\displaystyle E-e\phi \approx mc^{2}}

E-e\phi \approx mc^{2}

p ≈ m v {\displaystyle \mathbf {p} \approx m\mathbf {v} }

\mathbf {p} \approx m\mathbf {v}

et donc la deuxième équation peut s’écrire

ψ – ≈ 1 2 m c σ ⋅ ( p – e A ) ψ + {\displaystyle \psi _{-]}\approx {\frac {1}{2mc}}{\boldsymbol {\sigma }}\cdot \left(\mathbf {p} -e\mathbf {A} \right)\psi _{+}

{\displaystyle \psi _{-}\approx {\frac {1}{2mc}}{\boldsymbol {\sigma }}\cdot \left(\mathbf {p} -e\mathbf {A} \right)\psi _{+}

qui est d’ordre v/c – donc à des énergies et vitesses typiques, les composantes inférieures du spinor de Dirac dans la représentation standard sont très réduites par rapport aux composantes supérieures. En substituant cette expression dans la première équation, on obtient après quelques réarrangements

( E – m c 2 ) ψ + = 1 2 m 2 ψ + + e ϕ ψ + {\displaystyle (E-mc^{2})\psi _{+}={\frac {1}{2m}}\left^{2}\psi _{+}+e\phi \psi _{+}}.

{\displaystyle (E-mc^{2})\psi _{+}={\frac {1}{2m}\left^{2}\psi _{+}+e\phi \psi _{+}

L’opérateur de gauche représente l’énergie de la particule réduite par son énergie au repos, qui est juste l’énergie classique, donc on retrouve la théorie de Pauli si on identifie son 2-spinor avec les composantes supérieures du spinor de Dirac dans l’approximation non-relativiste. Une autre approximation donne l’équation de Schrödinger comme limite de la théorie de Pauli. Ainsi, l’équation de Schrödinger peut être considérée comme l’approximation non relativiste lointaine de l’équation de Dirac lorsque l’on peut négliger le spin et travailler uniquement à de faibles énergies et vitesses. Il s’agit également d’un grand triomphe pour la nouvelle équation, car elle permet de faire remonter le mystérieux i qui y apparaît, et la nécessité d’une fonction d’onde complexe, à la géométrie de l’espace-temps par le biais de l’algèbre de Dirac. Elle met également en évidence pourquoi l’équation de Schrödinger, bien que se présentant superficiellement sous la forme d’une équation de diffusion, représente en fait la propagation des ondes.

Il faut souligner fortement que cette séparation du spinor de Dirac en grandes et petites composantes dépend explicitement d’une approximation à basse énergie. L’ensemble du spinor de Dirac représente un tout irréductible, et les composantes que nous venons de négliger pour arriver à la théorie de Pauli apporteront de nouveaux phénomènes dans le régime relativiste – l’antimatière et l’idée de création et d’annihilation de particules.

Comparaison avec la théorie de WeylEdit

Dans la limite m → 0, l’équation de Dirac se réduit à l’équation de Weyl, qui décrit les particules relativistes sans masse de spin-1⁄2.

Lagrangien de DiracEdit

L’équation de Dirac et l’équation de Dirac adjointe peuvent toutes deux être obtenues en faisant (varier) l’action avec une densité lagrangienne spécifique qui est donnée par :

L = i ℏ c ψ ¯ γ μ ∂ μ ψ – m c 2 ψ ¯ ψ {\displaystyle {\mathcal {L}}=i\hbar c{\overline {\psi }}\gamma ^{\mu }\partiel _{\mu }\psi -mc^{2}{overline {\psi }}\psi }

{\mathcal {L}}=i\hbar c{\overline {\psi }}gamma ^{\mu }\partial _{\mu }\psi -mc^{2}{\overline {\psi }}\psi

Laisser un commentaire

Votre adresse e-mail ne sera pas publiée.