(Savoirs Actuels) Franck Laloë - Comprenons-Nous Vraiment La Mécanique Quantique - EDP Sciences - CNRS Éditions (2017)
(Savoirs Actuels) Franck Laloë - Comprenons-Nous Vraiment La Mécanique Quantique - EDP Sciences - CNRS Éditions (2017)
(Savoirs Actuels) Franck Laloë - Comprenons-Nous Vraiment La Mécanique Quantique - EDP Sciences - CNRS Éditions (2017)
Comprenons-nous vraiment
la mécanique quantique ?
2e édition, révisée et augmentée
S AV O I R S A C T U E L S
EDP Sciences/CNRS ÉDITIONS
Dans la même collection :
Mécanique quantique - Tome III
Claude Cohen-Tannoudji, Bernard Diu et Franck Laloë
Cohomologie galoisienne - Et théorie du corps de classes
David Harari
Optique non linéaire
François Hache
Chimie verte - Concepts et applications
Jacques Augé et Marie-Christine Scherrmann
De la solution à l’oxyde - Chimie aqueuse des cations métalliques,
Synthèse de nanostructures
Jean-Pierre Jolivet
Physique de la conversion d’énergie
Jean-Marcel Rax
Imprimé en France
Préface ix
Avant-propos xi
I Perspective historique 1
A Trois périodes . . . . . . . . . . . . . . . . . . . . . . . . . . . 2
A-1 Préhistoire . . . . . . . . . . . . . . . . . . . . . . . . 3
A-2 La période ondulatoire . . . . . . . . . . . . . . . . . . 4
A-3 Emergence de l’interprétation de Copenhague . . . . . 5
B Le vecteur d’état . . . . . . . . . . . . . . . . . . . . . . . . . 8
B-1 Définition, équation de Schrödinger, règle de Born . . 8
B-2 Processus de mesure . . . . . . . . . . . . . . . . . . . 10
B-3 Statut . . . . . . . . . . . . . . . . . . . . . . . . . . . 14
C Autres formalismes, théorie des champs, intégrales de chemin 19
IV Le théorème de Bell 79
A Inégalités de Bell . . . . . . . . . . . . . . . . . . . . . . . . . 80
A-1 Mécanique quantique : deux spins dans un état singulet 80
A-2 Réalisme local : démonstration de l’inégalité BCHSH . 82
A-3 Contradiction entre l’inégalité et la mécanique quantique 84
A-4 Contenu logique . . . . . . . . . . . . . . . . . . . . . 90
A-5 Contradiction avec les expériences . . . . . . . . . . . 92
B Diverses démonstrations du théorème . . . . . . . . . . . . . . 95
B-1 Autres hypothèses de départ . . . . . . . . . . . . . . . 95
B-2 Généralisations du théorème, théories non déterministes 97
B-3 Statut du théorème ; tentatives de le contourner . . . . 111
C Impact du théorème de Bell, échappatoires . . . . . . . . . . . 112
C-1 Echappatoires (loopholes), conspirations . . . . . . . . 113
C-2 La mécanique quantique est-elle non locale ? Contra-
factualité . . . . . . . . . . . . . . . . . . . . . . . . . 125
Conclusion 432
APPENDICES
Appendice A : Contenu “mental” du vecteur d’état . . . . 461
Appendice B : Inégalités de Bell et théories locales non
déterministes . . . . . . . . . . . . . . . . . . . . . . . . 463
Appendice C : Une tentative pour construire une théorie
quantique séparable . . . . . . . . . . . . . . . . . . . . 469
Appendice D : Probabilité maximale pour un état parti-
culier . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 473
Appendice E : Influence d’une sélection des paires observées 475
Appendice F : Impossibilité d’une transmission superlu-
minale de messages . . . . . . . . . . . . . . . . . . . . 481
Appendice G : Mesures quantiques à des instants différents 487
Appendice H : Manipulation des variables supplémentaires 493
Appendice I : Corrélations et trajectoires en théorie de
Bohm . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 497
Appendice J : Modèles de réduction spontanée du vecteur
d’état . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 513
Appendice K : Familles d’histoires cohérentes . . . . . . . 519
Appendice L : Dynamique de Schrödinger attractive . . . 523
BIBLIOGRAPHIE 532
INDEX 589
********
Préface
Claude Cohen-Tannoudji
Avant-propos
La mécanique quantique est une théorie étonnante dans tous les sens
du terme. C’est un lieu commun que de faire remarquer qu’elle est peu in-
tuitive, souvent contraire à toute représentation des phénomènes physiques
issue de notre expérience journalière. Mais elle est également étonnante par
le contraste qu’elle présente entre ses triomphes et ses difficultés.
D’une part, de toutes les théories scientifiques, la mécanique quantique
est probablement l’une des plus couronnées de succès. Inventée initialement
dans le cadre de la physique atomique, elle a rapidement débordé dans de
très nombreux domaines, permettant de concevoir et de réaliser maintes ex-
périences en optique, en physique du solide, des liquides, en astrophysique,
etc. Plus qu’une simple théorie, elle est ainsi devenue une méthode générale,
un cadre qui a permis de développer la théorie des fluides et des solides,
celle des champs, celle des particules élémentaires et l’unification des inter-
actions en physique. Elle a ainsi très largement dépassé les objectifs initiaux
de ses inventeurs sans qu’il soit nécessaire, ce qui est vraiment remarquable,
de modifier les principes généraux de la théorie qu’ils avaient élaborée. Ses
applications sont multiples, peuplant notre environnement au XXIe siècle de
multiples dispositifs qui auraient été inimaginables il y a 50 ans.
D’autre part, cependant, cette théorie reste relativement fragile du fait
des difficultés conceptuelles et d’interprétation qu’elle présente, sans d’ailleurs
que cela affecte son efficacité. Ce n’est pas que les physiciens aient voulu
ignorer ou occulter ces difficultés, bien au contraire ! En témoigne le nombre
important d’interprétations de la théorie qui ont été proposées au cours des
décennies, mettant en jeu des méthodes d’approche et des techniques mathé-
matiques souvent très diverses. C’est une situation rare dans l’histoire des
sciences : un consensus général se dégage concernant une approche des phé-
nomènes et des méthodes de calcul, dont la puissance prédictive est extraor-
dinaire ; et cependant, presque un siècle après l’introduction de ces méthodes,
le même consensus est loin d’être obtenu en ce qui concerne l’interprétation
de la théorie, sa base en quelque sorte. On retrouve l’image du colosse d’airain
aux pieds d’argile.
L’essentiel des difficultés fondamentales de la mécanique quantique tient
au vecteur d’état |Ψ qu’elle utilise pour décrire les systèmes physiques. Alors
xii AVANT-PROPOS
qu’en mécanique classique un système est décrit de façon directe par des po-
sitions et des vitesses, en mécanique quantique il s’y substitue l’objet mathé-
matique |Ψ, qui n’en donne qu’une description relativement indirecte. C’est
un énorme changement, non seulement sur le plan mathématique, mais aussi
conceptuel ; c’est lui qui ouvre la porte à de nombreuses discussions concer-
nant l’interprétation de la théorie. Beaucoup des difficultés rencontrées par
ceux qui ont essayé (ou essayent toujours) de “vraiment comprendre” la mé-
canique quantique sont liées aux questions concernant le statut exact de |Ψ.
Le vecteur d’état décrit-il la réalité physique elle-même, ou seulement une
connaissance (partielle) que nous aurions de cette réalité ? Décrit-il seulement
des ensembles de systèmes (description statistique), ou un système physique
unique (une seule réalisation, un événement unique) ? Si |Ψ contient une
composante reliée à notre connaissance imparfaite de la réalité du système,
n’est-il alors pas naturel de rechercher une description plus précise, qui de-
vrait exister au moins en principe ? Dans ce cas, quelle serait cette meilleure
description de la réalité ?
Une autre propriété troublante de |Ψ est que, pour des systèmes phy-
siques qui sont étendus dans l’espace (par exemple un système physique
constitué de deux particules éloignées), le vecteur d’état donne une des-
cription globale de toutes les propriétés physiques du système, en un tout
indissociable d’où la notion d’espace semble avoir disparu ; les propriétés des
deux systèmes peuvent être “intriquées” d’une telle façon que les notions ha-
bituelles d’espace-temps et d’événement (au sens de la relativité) paraissent
s’être en quelque sorte diluées. En particulier il peut devenir difficile, voire
impossible, de donner une représentation spatio-temporelle de leurs corréla-
tions qui reste compatible avec la relativité. Tout cela est évidemment très
contraire aux concepts habituels en physique classique, où l’on attribue des
propriétés locales aux systèmes physiques en spécifiant en chaque point de
l’espace la densité, la valeur du champ, etc. En mécanique quantique, cette
séparabilité entre les contenus physiques des différents points de l’espace
n’est plus possible en général. Bien sûr, on pourrait penser que cette perte
d’une description locale est juste une propriété innocente du formalisme,
sans conséquence particulière. On sait par exemple, en électromagnétisme
classique, qu’il est souvent commode d’introduire de façon intermédiaire un
choix de jauge pour décrire les champs ; dans la jauge de Coulomb, le potentiel
se propage de façon instantanée, alors que la relativité d’Einstein interdit la
propagation d’un signal plus rapidement qu’à la vitesse de la lumière. Mais
cette propagation instantanée est juste un artefact mathématique qui dis-
paraît dès qu’un calcul complet est effectué : on voit alors apparaître des
annulations entre termes opposés qui, au bout du compte, font que la limita-
tion relativiste est parfaitement respectée. N’en serait-il pas de même pour
le formalisme de la mécanique quantique ? En réalité nous verrons que, dans
le cadre de cette théorie, la situation est bien plus compliquée qu’en élec-
xiii
Remerciements
Nombreux sont ceux qui ont joué un rôle important dans la naissance
de ce livre. En tout premier lieu, c’est Claude Cohen-Tannoudji à qui vont
mes remerciements. Il m’a fait bénéficier, comme d’ailleurs tant d’autres, de
sa façon unique et profonde d’aborder (et même de penser) la mécanique
quantique ; plus de 40 années d’amitié (et de rédactions communes) m’ont
permis de bénéficier d’innombrables discussions passionnantes et éclairantes
pour moi. Alain Aspect est un autre ami avec qui, depuis le début de sa
thèse au milieu des années 70, l’échange d’idées sur la mécanique quantique
a été et continue à être riche et fructueux ; à l’époque, les fondements de
la mécanique quantique n’avaient souvent pas très bonne presse parmi les
physiciens “mainstream”, et nous nous sommes abondamment appuyés l’un
sur l’autre pour progresser dans un domaine qui nous passionnait tous deux,
ainsi que Bernard d’Espagnat. Jean Dalibard et Philippe Grangier ont été
d’autres interlocuteurs privilégiés, disponibles et toujours d’une grande pré-
cision intellectuelle, que je tiens également à remercier chaleureusement. Le
titre “Comprenons-nous vraiment la mécanique quantique ?” m’a été suggéré
il y a bien longtemps par Pierre Fayet, à l’occasion de deux séminaires qu’il
m’avait demandé de présenter ; je l’ai gardé depuis. A la source de ce livre
se trouve une première version d’un texte publié en 2001, sous la forme d’un
article avec le même titre dans l’American Journal of Physics, et initié lors
d’un séjour à l’Institut de physique théorique de l’Université de Californie
à Santa Barbara. Lors d’une session consacrée à la condensation de Bose-
Einstein, j’ai eu la chance de pouvoir discuter de mécanique quantique avec
son organisateur, Antony Leggett ; une autre chance favorisant les échanges
a été de partager le bureau de Wojciech Zurek ! Un peu plus tard, un séjour à
l’Institut Lorentz de Leyde m’a fait bénéficier de contacts stimulants et d’une
relecture fort utile de Stig Stenhlom. Quant à Abner Shimony, il m’a guidé
de maints conseils utiles et encouragé dans la rédaction de cette première
version.
Parmi ceux qui ont beaucoup aidé pour la version actuelle du texte, Mi-
chel Le Bellac a joué un rôle important, en effectuant une lecture détaillée
de l’ensemble et en donnant des conseils avisés, sources de nombreuses amé-
liorations. Michèle Leduc et lui ont participé à la mise au point de ce livre,
en particulier en trouvant un excellent rapporteur anonyme qui, lui aussi, a
fait des remarques fort pertinentes ; que tous trois en soient vivement remer-
ciés. Parmi les autres amis qui ont également joué un rôle essentiel figurent
Roger Balian, Serge Reynaud, William Mullin, Olivier Darrigol et Catherine
Chevalley ; je les remercie tous vivement pour de nombreux avis scientifiques,
conseils, précisions, etc., qui m’ont été précieux.
Pour le Chapitre XI qui décrit les diverses interprétations de la mécanique
quantique, j’ai demandé à des spécialistes de chacune d’entre elles de bien
xvii
vouloir vérifier leur accord avec mon texte. Je remercie Sheldon Goldstein et
Ward Struyve pour une relecture de la mécanique quantique de Bohm, Philip
Pearle et Giancarlo Ghirardi pour leurs conseils sur la dynamique de Schrö-
dinger modifiée, Robert Griffiths et Roland Omnès pour leurs commentaires
sur l’interprétation des histoires, Bernard d’Espagnat pour ses précieuses
remarques sur l’interprétation du réel voilé, Richard Healey pour son aide
concernant l’interprétation modale, Carlo Rovelli pour ses avis et sugges-
tions concernant l’interprétation relationnelle, Alexei Grinbaum pour bien
des clarifications concernant la logique quantique et les théories formelles,
et Thibault Damour pour sa relecture fort utile de la présentation de l’in-
terprétation d’Everett. Comme le veut la tradition ajoutons que, si toutefois
des erreurs avaient subsisté dans le texte, la responsabilité en serait celle de
l’auteur ! Enfin, sans le cadre exceptionnel de travail qu’offre le LKB, sans
les échanges constants avec ses membres, et sans l’environnement intellectuel
de l’ENS, rien n’aurait été possible.
Deuxième édition
Cette seconde édition a bénéficié de nombreuses discussions avec des col-
lègues, de la participation à des séminaires, etc. dans de nombreux labora-
toires ; tout ceci a stimulé des améliorations et des additions à la première
édition. Je suis particulièrement reconnaissant à Philip Stamp, qui a lu en
détail la première édition et proposé une excellente liste de suggestions. Mon
vieil ami Bill Mullin a également été d’une grande aide par ses remarques
judicieuses sur certains chapitres, alors que lui était occupé à la rédaction
de son propre ouvrage Quantum weirdness (Oxford University Press, 2017).
J’ai grandement bénéficié de la compréhension profonde de Johannes Ko-
fler concernant le domaine de validité des diverses inégalités de Bell et leurs
possibles “échappatoires” lors de l’interprétation des expériences. Philippe
Grangier, Patrick Peter, Jean Bricmont, Ward Struyve, Roger Balian, Julia
Kempe et Michel Le Bellac ont eux aussi fourni d’excellentes suggestions et
remarques qui ont permis d’améliorer le texte.
Enfin, une caractéristique merveilleuse d’Internet est de permettre à l’au-
teur d’un livre de recevoir par courriel les réactions de nombreux lecteurs du
monde entier. C’est particulièrement le cas sur un sujet comme la mécanique
quantique, et c’est précieux. Parmi eux, je voudrais remercier particulière-
ment Paul Slater qui, depuis la Californie, m’a envoyé une liste particulière-
ment utile, mais hélas je ne puis pas nommer ici la longue liste de tous les
collègues qui m’ont ainsi rendu service.
Chapitre I
Perspective historique
A. Trois périodes
A-1. Préhistoire
Heisenberg reprit le problème et, en 1925, introduisit la théorie qui est main-
tenant connue sous le nom de “mécanique des matrices” 4 , une construction in-
tellectuelle abstraite avec une forte composante philosophique, parfois proche
du positivisme ; dans cette théorie, les propriétés physiques classiques sont
remplacées par des “observables”, mathématiquement des matrices, définies
par des postulats adéquats ne faisant pas grand appel à l’intuition. Cepen-
dant, la mécanique des matrices contenait des éléments qui se sont révélés
essentiels dans la construction de la mécanique quantique moderne.
Avec le recul, on peut être frappé par le caractère abstrait et quelque
peu mystérieux de la théorie atomique à cette période de l’histoire ; pourquoi
les électrons devraient-ils obéir à des règles qui leur interdisent de quitter
certaines orbites particulières, comme s’ils étaient guidés miraculeusement
sur elles ? Quelle était l’origine de ces sauts quantiques, supposés sans aucune
durée temporelle, de sorte que la question de l’état physique d’un électron
pendant un tel saut était vide de sens ? Pourquoi des matrices devraient-elles
apparaître en physique d’une façon aussi abstraite, sans aucune relation avec
une description classique du mouvement d’une particule ? On peut deviner
le soulagement que ressentirent beaucoup de physiciens quand apparut un
autre point de vue, d’apparence beaucoup plus simple et, de plus, bien dans
la tradition de la physique du XIXe siècle : la théorie ondulatoire.
L’idée d’associer une onde avec toute particule matérielle a été initia-
lement introduite par de Broglie dans sa thèse (1924) [30]. Quelques an-
nées plus tard (1927), elle fut confirmée expérimentalement par Davisson et
Germer lors de leur fameuse expérience de diffraction électronique [31]. A
l’époque toutefois, pour une raison ou une autre, de Broglie n’est pas allé
plus avant dans l’étude de cette onde, de sorte que sa contribution sera de
lever le voile du mystère, mais une partie seulement, selon le mot d’Einstein
(voir par exemple la discussion dans [32]). On dit parfois que ce fut Debye
qui, le premier, après avoir entendu parler des idées de De Broglie, remar-
qua qu’en physique une onde est généralement associée avec une équation
d’onde : l’étape suivante devait donc être de découvrir cette équation. L’his-
toire ajoute que cette remarque fut faite en présence de Schrödinger, qui peu
après commença à travailler sur ce programme ; c’est alors qu’il réussit à pro-
poser une équation, qui maintenant porte son nom, une des équations les plus
fondamentales de toute la physique. Il est amusant de noter que Debye lui-
même ne semble pas s’être souvenu de l’épisode. Il est d’ailleurs parfaitement
possible que cette anecdote ne soit pas véridique ; de fait, les partenaires de
4
Les noms de Born et Jordan sont également associés à l’introduction de cette théorie ;
ce sont eux qui ont immédiament fait le lien entre les règles abstraites de la mécanique de
Heisenberg et celles du calcul matriciel en mathématiques.
A. TROIS PÉRIODES 5
bien que les particules ne se “diluent” jamais dans toutes les directions de
l’espace ! Cette constatation a stimulé Born, en 1926, à proposer une inter-
prétation probabiliste de la fonction d’onde [34] : les processus quantiques
comme les collisions sont fondamentalement non déterministes, et la seule
prédiction qui puisse être calculée est un ensemble de probabilités, données
par le carré du module de la fonction d’onde. Une seconde difficulté apparaît
dès qu’on considère des systèmes composés de plus d’une seule particule :
alors, l’onde de Schrödinger n’est plus une onde “ordinaire” puisque, au lieu
de se propager dans l’espace ordinaire à 3 dimensions, elle se propage dans
un espace dit “espace des configurations”, dont la dimension est 3N pour
un système composé de N particules ! Déjà, pour le plus simple des atomes,
l’atome d’hydrogène, l’onde se propage à 6 dimensions6 . Pour un ensemble
d’atomes, la dimension de l’espace des configurations croît rapidement, et de-
vient un nombre astronomique pour l’ensemble des atomes d’un échantillon
macroscopique. Chacun s’est alors rendu compte que la nouvelle onde n’était
en rien semblable à une onde classique qui, elle, se propage dans l’espace
ordinaire ; cette profonde différence apparaîtra un peu comme un leitmotiv
dans ce livre7 , sous des formes diverses8 .
Faisant une petite digression, nous pouvons remarquer au passage que
l’observation relativement récente (1995) du phénomène de condensation de
Bose-Einstein dans des gaz dilués [35] peut être vue, en un sens, comme une
sorte de réalisation des espoirs initiaux de Schrödinger : cette condensation,
en effet, fournit un cas particulier où une onde de matière se propage effecti-
vement dans l’espace habituel à 3 dimensions, alors qu’elle est associée à de
nombreuses particules. Avant que la condensation ne se produise, nous avons
la situation habituelle : le gaz est décrit par une fonction d’onde dans un
espace des configurations de dimension très élevée. Mais, lorsque les atomes
sont totalement condensés dans une fonction d’onde unique à une seule parti-
cule, leur fonction d’onde à plusieurs particules devient beaucoup plus simple
puisqu’elle est construite à partir d’une seule fonction d’onde à une particule.
En d’autres termes, l’onde de matière devient alors semblable à un champ
classique avec deux composantes (la partie réelle et la partie imaginaire de la
6
Nous ignorons ici les spins, sinon il faudrait considérer 4 ondes de ce type qui, chacune,
se propage dans un espace à 6 dimensions.
7
Par exemple, les effets non locaux se produisant avec deux particules peuvent être
décrits comme une conséquence du fait que la fonction d’onde se propage de façon locale,
mais dans un espace à 6 dimensions, alors que la définition habituelle de la localité fait
intervenir l’espace ordinaire à 3 dimensions.
8
Il est également possible de formuler la mécanique quantique d’une façon qui ne fait
pas intervenir l’espace des configurations, mais seulement l’espace ordinaire, en utilisant
le formalisme des opérateurs de champ (parfois appelé seconde quantification pour des
raisons historiques) – cf. § C. On peut écrire ces opérateurs sous une forme mathéma-
tique formellement similaire à celle d’une fonction d’onde, mais il restent des opérateurs
quantiques de sorte que leur ressemblance avec un champ classique est encore moins claire.
A. TROIS PÉRIODES 7
9
Voir cependant le § K du Chapitre XI pour une discussion d’une approche non standard
purement ondulatoire de la mécanique quantique.
10
Dans la littérature, on trouve souvent le mot “ontologique” pour décrire le point de
vue initial de Schrödinger sur la fonction d’onde, par opposition avec “épistémologique”
qui s’applique à l’interprétation probabiliste.
11
Il existe en physique une quatrième interaction fondamentale, la gravitation. Le “mo-
dèle standard” en théorie des champs contient une unification des trois premières interac-
8 CHAPITRE I. PERSPECTIVE HISTORIQUE
B. Le vecteur d’état
Résumons brièvement comment le vecteur d’état est utilisé dans les équa-
tions de la mécanique quantique – on trouvera si nécessaire plus de détails
aux §§ A-1 et suivants du Chapitre XII.
B-1-a. Définition
appelé “espace des états” (ou, quelquefois, “espace de Hilbert”, pour des rai-
sons historiques), de dimension infinie pour notre exemple. Les calculs dans
cet espace sont souvent menés avec l’aide d’une notation très commode, la
notation de Dirac [39], que nous utiliserons effectivement dans cet ouvrage,
et où les vecteurs de l’espace des états sont souvent appelés “kets”.
Dire que le vecteur d’état appartient à un espace vectoriel entraîne que
toute superposition linéaire de deux kets |Ψ1 et |Ψ2 est également un vec-
teur de l’espace des états :
Cette somme est également un projecteur, qui peut être appliqué au vecteur
d’état |Ψ(t1 ) avant la mesure :
PM (m) Ψ(t1 ) = Ψm (I-5)
15
La référence [40] contient les phrases suivantes : “Il est important de noter que la
complémentarité de Bohr ne fait aucune mention de la réduction du paquet d’ondes... ou
d’un rôle privilégié de la conscience subjective de l’observateur. Bohr n’était en aucune
façon un positiviste. Beaucoup de ce qui passe pour l’interprétation de Copenhague vient
des écrits de Werner Heisenberg, mais pas de ceux de Bohr” (voir également la note bas
de page 22).
12 CHAPITRE I. PERSPECTIVE HISTORIQUE
B-2-b. Bohr
frontière entre les deux parties18 . Si par exemple elles doivent être distinguées
en termes de tailles des systèmes physiques, on peut se demander à partir
de quelle taille exactement un système est suffisamment macroscopique pour
devenir directement accessible à l’expérience humaine, et pourra se compor-
ter comme un appareil de mesure. Si la distinction doit être faite en fonction
d’un autre critère plus élaboré que la taille, il semble nécessaire de préciser
comment, afin de rendre le concept moins vague. Dans [41], Bohr écrit (voir
également la citation de Bell dans le § E du Chapitre II) : “Cette nécessité de
discriminer dans chaque dispositif expérimental entre les parties du système
physique considéré qui doivent être traitées comme des appareils de mesure
et celles qui constituent les objets étudiés peut sans nul doute être qualifiée
comme la distinction principale entre les descriptions classique et quantique
des phénomènes physiques”.
B-3. Statut
Dans le cadre qui vient d’être rappelé, quel est pour finir le statut du
vecteur d’état (ou de la fonction d’onde) en mécanique quantique standard ?
20
Nous supposons que les deux observateurs utilisent le même référentiel d’espace-temps,
et que c’est juste la quantité d’information qui varie de l’un à l’autre. Sinon, nous devrions
appliquer des transformations mathématiques simples (unitaires) pour passer d’un vecteur
d’état à l’autre. Cette opération n’a toutefois pas plus d’impact conceptuel qu’en méca-
nique classique, où des règles simples permettent également de passer des positions et des
vitesses dans un référentiel à celles dans un autre référentiel.
Ajoutons qu’en mécanique quantique on peut aussi introduire des probabilités classiques
associées à une connaissance imparfaite du système, en particulier par le formalisme de
l’opérateur densité (§ A-6 du Chapitre XII). Ici nous nous limitons à la discussion de
vecteurs d’états et de fonctions d’onde (états purs) sans prendre en compte ce type d’in-
certitude.
Enfin, nous nous limitons ici à une discussion simplifiée ; dans un contexte plus élaboré,
il faudrait par exemple introduire la notion d’intersubjectivité, etc. [10, 24].
16 CHAPITRE I. PERSPECTIVE HISTORIQUE
Si aucun de ces points de vue n’est correct, comment alors les combiner
pour obtenir le statut du vecteur d’état en mécanique quantique orthodoxe ?
Dans quelle mesure devons-nous considérer qu’il décrit le système physique
lui-même (interprétation réaliste), ou plutôt qu’il contient l’information que
nous pouvons avoir sur ce système (interprétation positiviste par exemple),
d’une façon qui est plus subtile qu’une distribution de probabilités classique ?
De fait, en mécanique quantique, le vecteur d’état possède un statut réelle-
ment non trivial, qui n’a aucun équivalent dans tout le reste de la physique.
Il faut dire que l’interprétation orthodoxe de Copenhague n’est pas définie
exactement de la même façon par tous les auteurs 22 ; des nuances existent
concernant la définition d’un état quantique. C’est pourquoi il est probable-
ment plus approprié de parler de la définition “standard”, celle qui se trouve
dans la majorité des livres d’enseignement. Le point de vue standard est
que le vecteur d’état (ou fonction d’onde) est associé avec une procédure de
préparation du système physique étudié – il est alors commode d’utiliser le
point de vue de Heisenberg (§ A-5 du Chapitre XII), où le vecteur d’état
est indépendant du temps (la dépendance en temps est transposée aux ob-
servables/opérateurs dans ce point de vue). Dirac, dans le Chapitre I de son
fameux livre [39], écrit : “Nous devons d’abord généraliser la signification d’un
‘état’ de sorte qu’il puisse concerner un système atomique... La méthode de
préparation peut alors être considérée comme spécifiant cet état”. Ou Stapp,
lorsqu’il introduit l’interprétation de Copenhague [43] : “La spécification de
la grandeur A sur la méthode de préparation du système physique est en pre-
mier lieu transcrite dans une fonction d’onde ΨA (x)”. De façon semblable,
Peres écrit [44] : “ un vecteur d’état n’est pas une propriété du système phy-
22
Par exemple, Howard écrit [40] : “La plupart de ce qui passe pour l’interprétation de
Copenhague se trouve dans les écrits de Werner Heisenberg, mais pas ceux de Bohr. En
fait, Bohr et Heisenberg ont été en désaccord pendant des décennies de façon profonde et
importante. L’idée qu’il y ait eu un point de vue unifié de Copenhague sur l’interprétation
est, nous allons le montrer, une invention postérieure à la seconde guerre mondiale, dont
Heisenberg est le principal responsable. Bien d’autres physiciens ou philosophes, chacun
de sa façon, ont contribué à la promotion de cette invention pour des buts polémiques ou
rhétoriques”.
18 CHAPITRE I. PERSPECTIVE HISTORIQUE
sorte que si le vecteur d’état la décrit il doit avoir une certaine composante
objective – le vecteur d’état ne peut pas être purement mental et dépendre
de l’observateur. Parfois, certaines propriétés du système existent, parfois
d’autres, mais dans tous les cas la plupart n’existe pas, ce qui implique que
leurs mesures vont donner des résultats aléatoires ; les deux interprétations
sont combinées dans un tout qui met l’accent sur l’ensemble du dispositif
expérimental. Bohr décrivait ce genre de situation en utilisant le concept gé-
néral de “complémentarité” ; par exemple, dans [46], il écrit “le point de vue
de la complémentarité se présente comme une généralisation rationnelle de
l’idée même de causalité” (comment relier de façon causale une procédure de
préparation à une autre d’observation).
En ce qui concerne les probabilités, la mécanique quantique standard uti-
lise une notion de probabilité ne se réfèrant pas à tel ou tel observateur spé-
cifique, puisqu’elle concerne tous les observateurs indépendamment de leur
identit é personnelle. Ces probabilités ne sont pas subjectives, mais “inter-
subjectives”. Les sauts brusques de ces probabilités sont donc de nature dif-
férente de ceux d’une distribution classique de probabilité, qui se produisent
lorsqu’une information nouvelle est acquise par un observateur donné.
La mécanique quantique peut être formulée sous des formes diverses qui
mettent en jeu des équations différentes ; ces formes sont équivalentes, mais
s’avèrent plus ou moins commodes en fonction du système physique étudié.
Depuis l’introduction initiale de l’équation de Schrödinger en 1926, de nom-
breux développements et généralisations du formalisme quantique ont été
proposés. Il est évidemment hors de question de les décrire tous ici ; le seul
but de cette brève partie est d’en mentionner quelques-uns qui sont particu-
lièrement importants.
Une étape décisive dans le développement de la mécanique quantique a
été l’inclusion de la notion de particules identiques. Elles peuvent être, soit
des bosons (photons, atomes 4 He, etc.), soit des fermions (électrons, protons,
etc.), et obéissent à des règles différentes concernant la symétrie de leur vec-
teur d’état lors d’un échange entre particules identiques : les bosons sont
décrits par un état complètement symétrique, alors que les fermions ont un
vecteur d’état complètement antisymétrique. Une conséquence directe est que
deux fermions ne peuvent jamais occuper le même état quantique individuel,
comme postulé par Pauli en 1925 avec son principe d’exclusion (ce principe
a été initialement introduit pour les électrons des atomes [47], puis généralisé
à tous les fermions). Plus tard, Dirac [48], Fock [49], et Jordan [50] ont pro-
posé un traitement très commode des particules identiques grâce à l’usage
d’opérateurs de création et d’annihilation, qui prennent en compte automati-
quement ces règles de symétrisation, à la fois pour fermions et bosons ; cette
20 CHAPITRE I. PERSPECTIVE HISTORIQUE
Situation actuelle,
des difficultés conceptuelles
subsistent
Von Neumann, dans son traité publié en 1932 (Chapitres 4-6 de [4]),
a introduit une théorie explicite de la mesure quantique, que nous avons
rappelée au § B-2-a du Chapitre I. A la différence du point de vue de Bohr,
von Neumann considère l’appareil de mesure comme un système quantique
sur le même plan que le système mesuré. Il étudie ce qui se produit lorsque le
système mesuré S est mis en contact avec un appareil de mesure M et interagit
avec lui pendant un certain temps. M inclut un “pointeur” (ou aiguille de
cadran) macroscopique qui, une fois que l’interaction est terminée, a atteint
une position qui dépend de l’état initial de S. Dans ce chapitre, nous donnons
une introduction aux idées générales concernant la chaîne de von Neumann,
sans écrire d’équations ; nous reviendrons dans un chapitre ultérieur sur un
A. LA CHAÎNE SANS FIN DE VON NEUMANN 27
en deux paquets d’ondes différents, l’un dévié vers le haut, l’autre vers le
bas ; c’est à nouveau une conséquence directe de la linéarité de l’équation
de Schrödinger. Lorsqu’ils se propagent plus loin, chacun des deux paquets
d’ondes peut frapper un détecteur avec lequel il interagit et dont il modifie
l’état (ainsi que le sien) ; par exemple, les atomes de spin 1/2 sont ionisés
et produisent des électrons, de sorte que la superposition linéaire englobe
maintenant plus de particules. De plus, lorsqu’une cascade d’électrons est
produite dans un multiplicateur d’électrons, tous ces électrons supplémen-
taires deviennent également partie de la superposition. Il n’y a pas de limite
intrinsèque à ce qui devient bientôt la propagation d’une chaîne sans fin : rapi-
dement, la linéarité de l’équation de Schrödinger conduit à un vecteur d’état
qui est la superposition cohérente d’états complètement différents pour un
nombre macroscopique de particules, des courants macroscopiques et, pour-
quoi pas, des aiguilles d’appareils ou des enregistreurs qui écrivent des chiffres
macroscopiques sur une feuille de papier ! Si nous restons dans le cadre de
l’équation de Schrödinger, rien ne nous permet de stopper la progression de
cette régression infinie. Devons-nous alors accepter l’idée qu’à la fin c’est le
cerveau de l’expérimentateur, lorsqu’il prend connaissance des résultats im-
primés, et donc un être humain doué de conscience, qui entre dans une telle
superposition ?
Le notion même de cerveau ou de conscience se trouvant dans une su-
perposition macroscopique n’a rien d’intuitif ni de très clair ; personne n’a
jamais observé à la fois deux résultats contradictoires. Est-ce que cette si-
tuation étrange devrait être vue comme celle où un résultat expérimental
imprimé sur une feuille de papier ressemblerait à deux diapositives superpo-
sées, ou une photographie doublement exposée ? En pratique, nous savons
bien que nous observons toujours un résultat unique et bien défini dans une
expérience ; il semble donc que la superposition linéaire se soit réduite d’une
façon ou d’une autre avant de nous atteindre – probablement avant même
qu’elle ne devienne suffisamment macroscopique pour mettre en jeu des ap-
pareils de mesure. Il semble alors évident4 qu’une théorie raisonnable devrait
briser quelque part la chaîne de von Neumann, quand (ou peut-être avant)
elle atteint le monde macroscopique. Cette opération porte souvent le nom
de “coupure de Heisenberg” (“Heisenberg cut” en anglais). Mais quand et où
exactement effectuer cette coupure ?
Von Neumann conclut à partir de son analyse que, effectivement, il n’est
pas possible de formuler les lois de la mécanique quantique sans faire réfé-
rence à la prise de conscience humaine. Il considère l’émergence de la percep-
tion d’un résultat unique lors d’une mesure comme un élément irréductible
4
Peut-être pas si évident après tout ? De fait, il existe une interprétation de la mé-
canique quantique qui repose précisément sur l’idée que la chaîne n’est jamais rompue :
l’interprétation d’Everett, qui sera discutée au § M du Chapitre XI.
B. LE CHAT DE SCHRÖDINGER ; MESURES 29
B-1. L’argument
Le chat n’apparaît que dans quelques lignes dans le contexte d’une dis-
cussion bien plus générale dans un article de Schrödinger [59] dont le titre
est “La situation actuelle de la mécanique quantique”. Il écrit en allemand
(pour une traduction en anglais, voir [60]) “On peut même imaginer des si-
tuations tout à fait grotesques. Un chat est enfermé dans une boîte en acier,
dans laquelle se trouve le dispositif diabolique suivant (sur lequel le chat ne
peut avoir aucune action) : dans un compteur Geiger se trouve une toute
petite quantité de matière radioactive, si petite qu’il faudra par exemple une
heure pour avoir des probabilités égales que l’un des noyaux se désintègre, ou
alors aucun. En cas de désintégration, le compteur à décharge se déclenche
et, par un relais, relâche un marteau qui vient briser une petite ampoule
contenant de l’acide cyanhydrique (poison violent). Si on laisse à lui-même
l’ensemble du système pendant une heure, on dirait que le chat est toujours
vivant seulement si entre-temps aucun noyau ne s’est désintégré. La première
désintégration atomique l’aurait empoisonné. La fonction Ψ du système total
5
En ses termes ([4], pp. 418-421) : “... la mesure ou le processus correspondant de
la perception est une nouvelle entité relative à l’environnement physique, sans lui être
réductible. Assurément, la perception subjective nous conduit à la vie intellectuelle inté-
rieure de l’individu, qui de par sa nature même échappe à l’observation ... Toutefois, une
exigence fondamentale du point de vue scientifique – le principe appelé de parallélisme
psycho-physique – est qu’il doit être possible de décrire les processus extra-physiques de la
perception subjective comme s’ils faisaient partie du monde physique – c’est-à-dire d’at-
tribuer à ses éléments des processus physiques équivalents dans l’environnement objectif,
et dans l’espace ordinaire”.
30 CHAPITRE II. SITUATION ACTUELLE ET DIFFICULTÉS
(7
B-2. Malentendus
8
Le chat lui-même n’est jamais dans une superposition cohérente de vivant ou mort.
En effet, lors de la création de la curieuse superposition, le chat est déjà corrélé quantique-
ment avec la source radioactive, le système mécanique, et la bouteille de poison ouverte
ou fermée, le gaz dans la boîte, etc. Toutes ces composantes agissent déjà comme un envi-
ronnement et produisent une complète décohérence. Rétablir cette cohérence demanderait
de mettre toutes ces composantes dans le même état quantique, une tâche clairement im-
possible. La propagation de la décohérence encore plus loin dans l’environnement n’ajoute
rien de nouveau à l’argument.
9
C’est par exemple le but principal des théories mettant en jeu une dynamique de
Schrödinger modifiée, souvent non linéaire (§ K du Chapitre XI) : elles introduisent des
équations du mouvement où, lorsque le niveau macroscopique est atteint, toutes les pro-
babilités tendent vers zéro du fait de la dynamique, sauf une.
34 CHAPITRE II. SITUATION ACTUELLE ET DIFFICULTÉS
paraître lunatique, en fait impossible. Il réalise que si les lois de la nature pre-
naient cette forme pendant par exemple seulement un quart d’heure, nous
trouverions tout notre environnement transformé en une sorte de bourbier,
une sorte de gelée sans structure ou un plasma, tous les contours devenant
flous, et nous-mêmes devenant des sortes de méduses”. Pour Schrödinger, au-
cun théoricien raisonnable ne peut prendre cette éventualité bien au sérieux.
Il arrive toutefois que le sens des mots change en physique. Dans la litté-
rature récente en électronique et optique quantiques, il est devenu de plus en
plus fréquent d’utiliser les mots “chat de Schrödinger”, ou “Schrödinger cat
(SC)” dans un sens assez différent, voire presque contradictoire avec le sens
initial. Au départ, le chat était en effet le symbole d’une impossibilité, un
animal qui ne pourra évidemment jamais exister (une gargouille de Schrö-
dinger ?), l’étape finale d’un raisonnement par l’absurde – bref, un symbole
de quelque chose qui n’a jamais existé et n’existera jamais. De nos jours, les
mêmes mots sont souvent utilisés pour désigner des états qui sont parfaite-
ment réalisables, à savoir toute superposition cohérente d’états qui sont plus
ou moins différents à un niveau le plus macroscopique possible (ici la cohé-
rence est essentielle). Avec cette nouvelle définition, l’existence de chats de
Schrödinger a été prévue et effectivement observée pour toute une catégorie
de systèmes, comme une grande molécule se propageant à la fois dans les
branches d’un interféromètre [63], ou alors un ion qui se trouve localisé à la
fois dans deux positions différentes dans un piège. Bien sûr, de tels systèmes
peuvent subir une décohérence du fait de l’apparition de corrélations avec
l’environnement (§ C-3 du Chapitre VII). Des calculs théoriques de cette dé-
cohérence sont possibles à l’aide de l’équation de Schrödinger, qui peut être
utilisée pour calculer comment se déroulent les premières étapes de la chaîne
de von Neumann, et avec quelle rapidité le vecteur d’état tend à se ramifier
en plusieurs branches mettant en jeu l’état quantique de l’environnement.
Pour résumer ce § B, le paradoxe met en lumière la composante centrale
de la plupart de nos difficultés avec la mécanique quantique ; comme l’écrit
Wigner [64], “les mesures qui laissent le système objet-plus-appareil de me-
sure dans un état où le pointeur de l’appareil est dans une position bien
définie ne peuvent être obtenues dans le cadre des lois linéaires de la mé-
canique quantique”. La question est alors : quel est donc le processus exact
qui force la Nature à rompre cette linéarité et à faire un choix parmi les
différents résultats possibles ? Il est clair que l’émergence d’un seul résultat
est une question essentielle. Comme Pearle le résume de façon concise [14],
le problème est d’expliquer “pourquoi les événements se produisent” !
C. L’ami de Wigner
porte du laboratoire (Fig. II.2). Mais quelle est alors la situation juste après
que la particule est sortie de l’analyseur et que sa position a été observée
dans le laboratoire, tandis qu’elle reste inconnue à l’extérieur ? Depuis de-
hors, il est naturel de considérer l’ensemble du laboratoire fermé contenant
l’expérience et l’ami comme une partie du “système” qui doit être décrit par
un grand vecteur d’état. Tant que la porte du laboratoire reste fermée et
que le résultat de la mesure est inconnu à l’extérieur, ce vecteur d’état conti-
nuera à contenir une superposition des deux résultats ; ce n’est que plus tard,
lorsque le résultat est connu, qu’il semble pertinent d’appliquer le postulat
de réduction du vecteur d’état. Mais, à l’évidence, pour l’ami de Wigner qui
est dans le laboratoire, ce raisonnement est tout simplement absurde ! Que
peut faire l’ouverture de la porte de son point de vue ? Il va évidemment
préférer considérer que le vecteur d’état est réduit dès que le résultat est
observé dans son propre laboratoire. Nous retombons alors sur un point que
nous avons déjà discuté (§ B-3 du Chapitre I), le caractère absolu ou relatif
du vecteur d’état : est-ce que cette contradiction signifie que nous devrions
prendre en compte deux vecteurs d’état, l’un réduit et l’autre non réduit,
pendant la période intermédiaire de l’expérience12 ? Pour une discussion par
Wigner lui-même du problème de la mesure, voir [64].
Une interprétation souvent associée au nom de Wigner13 suppose que
la réduction du vecteur d’état est un effet réel qui se produit au moment
où un esprit humain acquiert une certaine connaissance du monde physique
qui l’entoure, et avec lequel il interagit ; nous y reviendrons au § A-1-b du
Chapitre XI. On peut par exemple considérer que les courants électriques
d’un cerveau humain sont à l’origine de la réduction de l’état quantique
des objets mesurés, via un processus physique encore inconnu. Alors, si l’on
adopte ce point de vue, la réduction se produit sous l’effet de l’expérimen-
tateur qui se trouve dans le laboratoire (l’ami de Wigner) et la contradic-
tion du paragraphe précédent est levée. Mais, même si l’on accepte l’idée un
peu provocatrice d’une action possible de l’esprit (ou de la conscience) sur
l’environnement, ce point de vue ne supprime pas toutes les difficultés lo-
giques : qu’est-ce qu’un esprit humain, quel niveau de prise de conscience est
nécessaire 14 pour réduire l’état, comment agissent les courants électriques
correspondants dans le cerveau, etc. ?
12
Hartle considère que la réponse à cette question est “oui” [45] ; voir également l’inter-
prétation relationnelle (§ C-1 du Chapitre XI).
13
Le titre de la Ref. [65] suggère effectivement cette catégorie d’interprétation ; de plus,
Wigner y écrit que “il s’ensuit (de l’argument de l’ami de Wigner) que la description
quantique des objets est influencée par des impressions pénétrant la conscience”. A la fin
de l’article, il discute également l’influence de non-linéarités qui pourraient imposer une
limite à la validité de l’équation de Schrödinger, et être cacactéristiques de la vie.
14
Voir le § A-1 du Chapitre XI pour une discussion de la relation entre conscience et
introspection (London et Bauer).
D. MESURES NÉGATIVES ET “SANS INTERACTION” 37
"
la particule dans cet angle solide, mais à une plus grande distance. Pour sim-
plifier, nous supposons que l’expérience est idéale et que les détecteurs ont
une efficacité de 100 %.
'
'
Figure II.3 – Une source S émet une particule, et se trouve entourée par
un détecteur D1 . Ce dernier capture la particule et enregistre un signal de
détection dans un premier appareil de mesure, sauf si la particule passe par
un trou correspondant à un petit angle solide (vers le haut sur la figure). Dans
ce cas la particule est détectée par D2 et enregistrée par un second appareil.
Nous supposons dans la discussion que les détecteurs sont idéaux avec une
efficacité de 100 %.
(ii) La Figure II.4 montre une expérience semblable : une source S émet
des particules une par une, chacune décrite par une onde de Schrödinger se
propageant vers la droite. Cette onde interagit avec un dispositif de type
lame séparatrice qui la scinde en deux parties (les photons, les neutrons, et
d’autres particules peuvent ainsi être séparés avec des dispositifs appropriés).
Après s’être propagée sur une distance L1 ou L2 , chacune des ondes tombe
sur un détecteur, D1 dans un cas, D2 dans l’autre. Lors de chaque réalisation
de l’expérience, une seule particule est émise par S, et une seule particule
est détectée, soit par D1 soit par D2 . Dans la description de l’expérience
purement en termes d’onde de Schrödinger, la situation reste parfaitement
symétrique : en chacun des détecteurs, une chaîne de von Neumann intervient,
mettant en jeu des états des détecteurs où la particule a été ou n’a pas été
enregistrée. Plus précisément, l’état du système total est la somme de deux
kets qui chacun contient une chaîne de von Neumann : pour l’un, elle naît en
D1 tandis que rien ne se passe en D2 , pour l’autre c’est la situation inverse. La
mécanique quantique prédit donc qu’un seul résultat de mesure est observé :
pour une réalisation donnée, soit la particule est détectée en D1 , soit en D2 ,
mais jamais aux deux endroits. Si L1 < L2 , la première mesure est celle en
D1 , et il en résulte un effet de mesure négative semblable au précédent : si
D1 ne détecte pas la particule, elle est toujours détectée en D2 . Inversement,
lorsqu’elle est détectée en D1 , il devient certain qu’elle ne sera jamais détectée
en D2 . Voilà qui donne déjà un avant-goût de la non-localité quantique :
une détection en D1 rend immédiatement impossible une détection en D2 ,
même si la distance entre les détecteurs est arbitrairement grande (de sorte
qu’aucune information se propageant à la vitesse de la lumière n’a le temps
de se propager de l’un à l’autre). La résolution de la chaîne de von Neumann
sur l’un des détecteurs (réduction du vecteur d’état si l’on préfère) est un
40 CHAPITRE II. SITUATION ACTUELLE ET DIFFICULTÉS
phénomène non local dont les conséquences se font immédiatement sentir sur
des mesures situées à des distances arbitrairement grandes.
'
/
/
6 '
Figure II.4 – Des particules sont émises une par une par une source S.
Les ondes de Schrödinger décrivant les particules sont scindées en deux par
une lame séparatrice ; chaque composante se propage vers un détecteur, D 1
ou D2 . Dans une expérience idéale, lors de chaque réalisation la particule est
toujours détectée, soit en D1 soit en D2 et de façon totalement aléatoire ; la
particule n’est jamais détectée aux deux endroits.
Comme plus haut, on peut remarquer que les mêmes résultats sont facile-
ment explicables par un modèle local : il est suffisant de supposer que, lors de
chaque réalisation de l’expérience, la particule “choisit” au hasard une seule
direction lorsqu’elle croise la lame séparatrice. La difficulté semble alors ne
venir que de la description inhabituelle des phénomènes donnée par la méca-
nique quantique. Mais nous verrons dans le Chapitre IV des exemples de cas
où aucun modèle local ne peut être inventé pour reproduire les prédictions
quantiques.
(iii) Considérons maintenant le dispositif schématisé sur la Figure II.5,
avec un interféromètre de Mach-Zhender dans lequel une source émet une
par une des particules, qui sont ensuite comptées sur les détecteurs D1 et
D2 . Comme le fait la Ref. [69], nous supposons que les différences de chemins
sont réglées de façon à créer une interférence destructive dans la voie de sor-
tie du détecteur D2 ; aucune particule ne peut alors atteindre ce détecteur de
sorte que toutes sont détectées en D1 (à nouveau, nous supposons les détec-
teurs parfaits avec un rendement de 100 %). Que se produit-il maintenant
si l’on insère un objet opaque O dans le bras inférieur de l’interféromètre ?
On annule l’effet d’interférence destructive, ce qui permet à certaines par-
ticules d’atteindre D2 ; cet événement se produit une fois sur quatre si les
deux lames semi-réfléchissantes ont des transmissions de 50 %. Dans un tel
D. MESURES NÉGATIVES ET “SANS INTERACTION” 41
'
'
Figure II.5 – Une source S émet une série de particules, une par une, vers
un interféromètre (Mach-Zehnder). La différence de chemin de ce dernier
est ajustée de façon que toutes les particules atteignent le détecteur D1 et
qu’aucune particule ne puisse atteindre D2 . Lorsqu’un objet opaque O est
inséré afin de bloquer un des chemins pour la particule, l’effet d’interférence
destructive ne se produit plus et des particules sont parfois détectées en D2 .
Dans un tel événement, la présence d’un objet est mesurée avec certitude,
alors qu’il semble qu’aucune interaction avec l’objet n’est mise en jeu, puisque
la particule détectée est nécessairement passée par le chemin supérieur dans
l’interféromètre (sinon elle aurait été absorbée).
cas, comme la particule n’a pas été bloquée par l’objet, il semble qu’elle soit
nécessairement passée par le bras du haut de l’interféromètre, ce qui veut
dire qu’elle n’a jamais rencontré l’objet et pu être absorbée par lui. Mais,
inversement, si l’objet n’avait pas été inséré, jamais la particule n’aurait pu
atteindre D2 ! Le résultat final est que la seule observation d’une détection
en D2 révèle la présence d’un objet, bien que le processus exclue toute inter-
action avec cet objet. Ce phénomène est appelé “mesure sans interaction” 15 .
En termes simplifiés, on pourrait le résumer en disant que l’objet a absorbé
l’onde associée à la particule, mais pas la particule elle-même. La chose très
curieuse est alors que la particule et son onde semblent dissociées dans ce
processus, puisqu’elles se propagent dans des bras différents, situés à une
distance arbitrairement grande l’un de l’autre.
En réalité, cette expérence illustre plutôt le fait que, tant que la localisa-
tion d’une particule n’a pas été mesurée, il est vain en mécanique quantique
standard de vouloir lui attribuer une position ou une trajectoire unique. La
15
Dénomination discutable puisque le phénomène demande que la particule test puisse
interagir avec l’objet : il est clair que l’effet ne se produirait pas si l’objet était totalement
transparent pour la particule. Alain Aspect a proposé le nom plus approprié de “détection
sans absorption”.
42 CHAPITRE II. SITUATION ACTUELLE ET DIFFICULTÉS
L’idée générale [82] est en effet de mesurer un effet d’interférence entre deux
chemins possibles suivis par un système quantique composé de deux photons :
un chemin où la création de la paire de photons se produit dans le premier
cristal non linéaire, un second où elle se produit dans le second. L’objet absor-
bant ou déphasant est inséré après le premier cristal dans le trajet du premier
photon idler, qui est ensuite dirigé vers le second cristal de façon que les deux
modes possibles du photons idler se recouvrent le plus parfaitement possible.
Lorsque cette condition d’accord de modes est satisfaite, la trace sur le pho-
ton idler montre que le photon signal est dans une superposition cohérente
de deux modes issus des deux cristaux ; un coefficient de cette superposition
dépend de l’absorption et du déphasage introduit par l’objet, mais pas l’autre
coefficient. On fait alors interférer les deux composantes du photon signal sur
une lame semi-réfléchissante, ce qui donne accès au déphasage et à l’absorp-
tion introduite par l’objet. Une caractéristique remarquable de ce schéma est
que le photon signal qui est détecté donne une information sur l’objet sans
avoir jamais interagi directement avec lui ; l’interaction est en quelque sorte
médiée par l’autre photon. Ainsi, les perturbations subies par le photon idler
(y compris le fait que l’on ait superposé les modes issus des deux cristaux)
changent complètement le comportement du photon signal, qui est pourtant
à une distance arbitraire. A nouveau, nous avons une situation où les effets
quantiques semblent délocalisés dans l’espace habituel. L’interférence ne se
produit pas entre deux champs classiques qui se propageraient dans l’espace
à trois dimensions, mais entre des amplitudes de probabilité quantiques qui
se propagent dans celui à six dimensions exploré par une paire de photons.
Il a également été suggéré que les mesures négatives puissent se révéler
utiles dans le contexte de la cryptographie quantique (§ B du Chapitre VIII).
L’idée proposée dans [83] est que deux partenaires éloignés, Alice et Bob, ef-
fectuent aléatoirement des choix entre deux polarisations orthogonales ; Alice
envoie un photon avec la polarisation qu’elle a choisie à Bob, qui renvoie le
photon à Alice grâce à un miroir si, et seulement si, sa polarisation diffère
du choix local qu’il a effectué. L’ensemble du dispositif comprend un interfé-
romètre qui est réglé de façon que, si le photon revient de Bob vers Alice, la
probabilité qu’Alice puisse observer un photon sur un détecteur D1 s’annule,
à cause d’un effet d’interférence destructive tout à fait semblable à celui de
l’exemple (ii) ci-dessus. Dans ces conditions, en sélectionnant seulement les
événements où Alice observe un photon en D1 (de sorte qu’alors Bob ne peut
détecter la particule), on sélectionne automatiquement des événements où les
deux choix aléatoires faits par Alice et Bob se sont trouvés être identiques.
Si Alice et Bob se communiquent mutuellement le résultat de chaque expé-
rience (quel détecteur a cliqué ou non), mais conservent secrets leurs choix
de polarisations, en faisant une liste de leurs choix binaires locaux pour les
événements sélectionnés, ils se constituent progressivement une clé secrète.
Une caractéristique remarquable de ce dispositif est que les événements pris
44 CHAPITRE II. SITUATION ACTUELLE ET DIFFICULTÉS
Les citations qui suivent peuvent être utiles pour se faire une idée18 de la
variété des positions intéressantes qui ont été exprimées depuis l’apparition
de la mécanique quantique.
Interprétation de Copenhague :
(i) Bohr ([21], 2e édition, page 204 et [84]) : “Il n’existe pas de monde
quantique. Il n’existe qu’une description physique abstraite. Il est faux de
penser que la tâche de la physique est de découvrir comment la Nature est
réellement. Ce qui concerne la physique est ce que nous pouvons dire sur la
Nature”. Ou, de façon similaire : “Il n’existe pas de concept quantique” [85].
Pour ce qui est des phénomènes physiques : “on peut plaider vigoureuse-
ment pour une limitation de l’usage du mot phénomène au cas où il se réfère
exclusivement à des observations, obtenues dans des circonstances bien spé-
cifiées, incluant une description de l’ensemble de l’expérience” [46].
Bohr définit également l’objet de la physique de la façon suivante [86,
87] : “La physique doit être considérée, non pas tellement comme l’étude de
quelque chose qui est fourni a priori, mais plutôt comme le développement
de méthodes qui permettent de classer et de rendre compte de l’expérience
humaine. De ce point de vue, notre tâche doit être de rendre compte de
cette expérience d’une façon qui soit indépendante de jugements individuels
subjectifs, qui donc est objective au sens qu’elle peut être communiquée de
façon non ambigüe dans un langage humain ordinaire”.
17
Les événements utiles sont ceux où Bob n’a pas renvoyé vers Alice l’onde de Schrö-
dinger, mais sans absorber la particule. Chaque fois qu’Alice et Bob choisissent la même
polarisation, le vecteur d’état comprend une composante où la particule se propage vers le
site de Bob, de sorte qu’on pourrait mesurer sa présence le long de la ligne de transmission
ou sur le site de Bob. Mais cette composante s’annule au moment où Alice observe la
particule en D1.
18
Avec, bien sûr, la précaution habituelle : il est vrai que de courtes citations peuvent,
lorsqu’elles sont isolées de leur contexte, donner une idée un peu superficielle de la position
précise de leurs auteurs.
E. UNE GRANDE VARIÉTÉ DE POINTS DE VUE 45
19
De façon semblable, Bohr voyait probablement la relativité d’Einstein comme une
généralisation rationnelle de l’électromagnétisme classique (équations de Maxwell).
20
A la fin de cet article, il discute le “mode de description par complémentarité” et
illustre sa généralité en écrivant “Un exemple est donné par la biologie où les arguments
mécaniques et vitalistes sont utilisés d’une façon typique de la complémentarité. En socio-
logie également, une telle dialectique peut se révéler souvent utile, en particulier dans les
problèmes où nous sommes confrontés avec la comparaison entre les différentes cultures
humaines...”.
46 CHAPITRE II. SITUATION ACTUELLE ET DIFFICULTÉS
(iii) Heisenberg [21, 94] : “Mais les atomes ou les particules élémentaires
ne sont pas réels ; ils forment un monde de potentialités ou de possibilités,
plutôt qu’un monde de choses et de faits”.
Dans “Physics and philosophy” [94] (Chapitre V) : “Les sciences de la
nature ne donnent pas simplement une description et une explication de la
nature ; elles font partie des interactions entre la nature et nous-mêmes ; elles
décrivent la nature telle qu’elle réagit à notre méthode pour lui poser des
questions”.
Le Chapitre III de ce livre a pour titre “L’interprétation de Copenhague
de la théorie quantique”, et il y écrit : “Nous ne pouvons complètement ob-
jectiver le résultat d’une observation, nous ne pouvons décrire que ce qui
‘se produit’ entre cette observation et la suivante”. Plus bas, il ajoute : “En
conséquence, la transition entre le ‘possible’ et le ‘réalisé’ se produit pendant
l’acte d’observation. Si nous voulons décrire ce qui se produit pendant un
événement atomique, nous devons réaliser que le mot ’se produit’ ne peut
s’appliquer qu’à l’observation, et pas à l’état des choses entre les deux obser-
vations”.
Il conclut ce chapitre avec : “l’appareil de mesure a été construit par l’ob-
servateur, et nous devons nous souvenir que ce que nous observons n’est pas
la nature en elle-même mais la nature soumise à notre méthode de question-
nement. Notre tâche scientifique en physique consiste à poser des questions
concernant la Nature dans le langage que nous possédons, et à essayer d’ob-
tenir une réponse de l’expérience par les moyens qui sont à notre disposition.
C’est ainsi que la théorie quantique nous rappelle, comme Bohr l’a dit, la
vieille sagesse qui dit que, lorsque nous sommes à la recherche d’une har-
monie dans la vie, nous ne devons jamais oublier que nous sommes à la fois
acteurs et spectateurs dans le drame de la vie. Il est compréhensible que, dans
notre relation scientifique avec la nature, notre propre activité devienne très
importante lorsque nous nous préoccupons de parties de la nature auxquelles
nous n’avons accès que par les outils les plus élaborés”.
(iv) Jordan (tel que cité par Bell dans [95]) : “les observations ne se
contentent pas de perturber ce qui doit être mesuré, elles le produisent. Dans
une mesure de la position, l’électron est forcé de prendre une décision. Nous
le contraignons à occuper une position bien précise ; auparavant, il n’était ni
ici ni là, il n’avait pris aucune décision concernant une position précise... ”.
(v) Landau et Lifchitz, au début du premier chapitre de leur livre sur la
mécanique quantique [96] : “La possibilité de la description quantitative du
mouvement de l’électron exige également l’existence d’êtres physiques obéis-
sant avec une précision suffisante à la mécanique classique. Si un électron
entre en interaction avec un ‘être classique’, alors l’état de ce dernier change
en général... Ceci étant, l’être classique est appelé ordinairement appareil, et
on parle de son processus d’interaction avec l’électron comme d’une mesure.
Il convient toutefois de souligner qu’on n’a alors nullement en vue un proces-
E. UNE GRANDE VARIÉTÉ DE POINTS DE VUE 47
La situation actuelle :
Comme on peut s’en douter à la lecture de ces citations, loin d’être conver-
gentes ou parfois même contradictoires, aucun consensus général n’a réelle-
ment émergé au sein de toute la communauté des physiciens concernant le
22
Le Chapitre III expose plus en détail les discussions concernant le caractère complet
(ou incomplet) de la mécanique quantique.
50 CHAPITRE II. SITUATION ACTUELLE ET DIFFICULTÉS
sens précis du vecteur d’état. L’accord est général en ce qui concerne le for-
malisme et la façon d’utiliser en pratique le vecteur d’état. Pour toutes les
expériences qui ont été réalisées, un choix pragmatique entre les deux pos-
tulats d’évolution peut être laissé à l’évaluation du physicien ; pour faire des
prédictions concrètes sur une expérience, jusqu’à maintenant un peu de bon
sens s’est révélé suffisant (cf. § A-1 du Chapitre XI), de sorte que les pro-
blèmes liés aux fondements de la théorie quantique peuvent parfaitement
être mis de côté dans les laboratoires. Mais ceci n’empêche pas qu’il serait
préférable de disposer de préceptes mathématiques précis, au lieu de devoir
se contenter de recettes physiquement raisonnables ! Il n’est donc pas surpre-
nant de constater que, lorsque la question des fondements revient sur le tapis,
ou celle du sens précis des objets mathématiques de la mécanique quantique,
le débat recommence, et parfois devient passionné. De plus, on constate que
même ceux qui annoncent être en total accord avec l’interprétation standard
font usage, dans la pratique, de toute une série de nuances (pouvant parfois
aller jusqu’à la contradiction interne...) dès qu’on leur demande d’expliquer
en détail leur point de vue.
Pour résumer, le statut du vecteur d’état en mécanique quantique or-
thodoxe est un mélange subtil entre différents concepts concernant la réalité
et la connaissance que nous pouvons avoir de cette réalité. Les fantastiques
succès de la théorie quantique standard signifient-ils que le vecteur d’état est
réellement la description ultime et la plus précise d’un système quantique
que la physique donnera jamais dans les siècles à venir ? Faut-il renoncer à
toute description réaliste en physique et adopter un point de vue positiviste ?
La question n’est pas réglée. Il faut dire que même Bohr est considéré plus
comme un réaliste 23 que comme un positiviste ou un opérationnaliste [21].
Comme le dit Jammer ([58], p. 157) : “Bohr, comme Von Weizsäcker [111] l’a
souligné, n’a jamais rejeté la notion de réalité, il l’a seulement modifiée”. Si
on lui avait demandé quelles sont exactement les relations entre la fonction
d’onde et la réalité, Bohr aurait probablement dit que la fonction d’onde est
assurément un outil très utile, mais que le concept de réalité ne peut être
défini à ce seul niveau de façon correcte ; il doit impérativement inclure tous
les appareils de mesure macroscopiques qui servent à avoir accès à l’informa-
tion microscopique (nous reviendrons plus en détail sur ce point au § C du
Chapitre III).
Pour finir, une question générale qui émerge de toutes ces discussions est
de savoir ce que nous attendons d’une théorie physique satisfaisante. Est-
il suffisant qu’elle fournisse des prévisions parfaitement correctes (aucune
contradiction avec aucun résultat expérimental), même si elle ne permet au-
23
Nous revenons au § C-2 du Chapitre III sur la façon dont Bohr considère que la réalité
physique peut être définie sans ambigüité. Bohr accepte la notion de réalité physique, mais
seulement si elle est correctement définie (avec une description complète de l’ensemble de
l’expérience).
F. DES ARGUMENTS PEU CONVAINCANTS 51
Le théorème d’Einstein,
Podolsky et Rosen
A. Un théorème
les hypothèses dont le théorème part ne sont pas pertinentes dans le domaine
quantique, ce qui rend le théorème inapplicable dans le cadre de la mécanique
quantique. Plus précisément, le mot qu’il utilise pour caractériser ces hypo-
thèses est “ambigu”, mais jamais il n’a affirmé que le raisonnement est faux
(pour plus de détails, voir § C-2). Un théorème qui n’est pas applicable dans
une certaine situation n’en est pas pour autant incorrect : les théorèmes
de la géométrie euclidienne ne sont ni faux, ni sans intérêt, du fait qu’on
puisse également bâtir des géométries non euclidiennes ! En ce qui concerne
des contradictions éventuelles avec des résultats expérimentaux, nous ver-
rons pourquoi, d’une certaine façon, ces contradictions ajoutent à l’intérêt
du théorème, principalement du fait qu’elles peuvent être utilisées dans le
cadre d’un raisonnement logique par l’absurde.
Nombreux sont les bons textes décrivant l’argument EPR ; par exemple,
un classique est le petit article de Bell de la Ref. [95]. Une autre excel-
lente introduction est la Ref. [56], qui contient une description complète de
l’expérience de pensée EPR dans un cas particulier (deux types de mesures
seulement sont utilisés) et propose une discussion générale éclairante sur
bien des aspects du problème. Pour une liste détaillée de références, voir par
exemple [119]. Le schéma considéré dans l’argument EPR est résumé dans la
Figure III.1 : une source S émet deux particules corrélées, qui se propagent
vers des régions éloignées de l’espace où elles sont soumises à des mesures. Le
type de mesure est défini par un “paramètre7 de mesure” a dans une région, b
dans l’autre (typiquement l’orientation d’un analyseur de Stern et Gerlach),
chaque paramètre étant le résultat d’un choix arbitraire d’un expérimenta-
teur dans la région concernée. Dans chaque région, un résultat est obtenu,
qui ne peut prendre que deux valeurs, que nous symboliserons par ±1 avec
la notation habituelle. Une hypothèse cruciale est ajoutée : chaque fois qu’il
se trouve que les paramètres choisis des deux côtés ont la même valeur, les
résultats de mesure sont eux aussi égaux (corrélations parfaites).
Plutôt que de paraphraser les textes existant sur EPR ou l’article original,
nous présenterons volontairement les choses de façon quelque peu différente,
en nous basant sur une analogie, une sorte de parabole. Notre objectif est de
mettre en lumière un aspect fondamental de l’argument : l’essence du raison-
nement EPR n’est en fait autre que ce que l’on appelle habituellement “la
méthode scientifique”, au sens de Francis Bacon ou Claude Bernard. Dans ce
but, nous quitterons un instant la physique pour la botanique ! De fait, dans
les deux disciplines, une procédure scientifique rigoureuse est nécessaire pour
arriver à prouver l’existence de relations et de causes, et c’est précisément
notre objectif.
7
En anglais, on utilise souvent le mot “setting”.
56 CHAPITRE III. EINSTEIN, PODOLSKY ET ROSEN
PHVXUHDYHF PHVXUHDYHF
SDUDPqWUH SDUDPqWUH
Figure III.1 – Une source S émet deux particules, qui se propagent ensuite
dans l’espace et atteignent deux régions éloignées, où Alice et Bob effectuent
des mesures sur elles dans leurs laboratoires respectifs ; a et b sont les para-
mètres (par exemple orientation des analyseurs de Stern et Gerlach) utilisés
pour les deux appareils de mesure.
la même gousse et que les paramètres de croissance sont les mêmes, l’observa-
tion montre que les couleurs sont systématiquement les mêmes (toutes deux
restent aléatoires, d’une expérience à la suivante, mais elles sont toujours
égales).
Qu’en conclure alors ? Comme les pois poussent dans des endroits éloi-
gnés avec des couleurs aléatoires mais identiques, il n’existe aucune possibi-
lité d’influence par un phénomène local mal contrôlé qui les détermine, et
agirait de la même façon sur les deux ; une influence mutuelle des deux crois-
sances qui jouerait d’une façon ou d’une autre est également exclue. Si donc
nous croyons que les causes sont locales, et que des corrélations parfaites
ne peuvent jamais apparaître purement par hasard, nous sommes conduits à
une conclusion simple : la seule explication possible de cette couleur identique
est que les pois pris dans une même gousse partagent en commun une cer-
taine propriété, qui détermine la couleur8 . Certes, il peut être très difficile de
détecter directement cette propriété commune, puisqu’elle est probablement
encodée quelque part dans un minuscule fragment d’une molécule biologique,
mais la propriété existe et suffit à déterminer les résultats des expériences.
C’est l’essence de l’argument EPR, et en un sens nous pourrions arrêter la
discussion à ce point. Toutefois, de façon à aller plus loin dans l’analyse, ren-
dons chaque étape du raisonnement EPR encore plus explicite. L’idée centrale
est que la nature et le nombre des “éléments de réalité” associés à chacun des
pois ne peut pas varier sous l’influence d’une expérience réalisée en un point
éloigné, avec l’autre pois. Supposons par exemple que les deux expériences
soient faites à des instants différents : une semaine, l’expérimentateur fait
pousser un pois, et ce n’est que la semaine suivante que l’autre pois issu de
la même gousse est mis en terre pour pousser ailleurs, mais exactement dans
les mêmes conditions. Nous supposons que des corrélations parfaites entre
les couleurs sont alors observées, sans aucune influence particulière du temps
passé entre les expériences. Juste après la fin de la première expérience (ob-
servation de la première couleur), le résultat de la seconde a déjà une valeur
parfaitement déterminée ; en conséquence, il doit exister un élément de réalité
attaché au second pois qui traduit l’existence de cette certitude. Il est clair
que cet élément ne peut pas être attaché à aucun autre objet que le pois, par
exemple un des appareils de mesure, puisque la corrélation n’est observée que
si les deux pois proviennent de la même gousse. Symétriquement, le premier
pois avait lui aussi un élément de réalité qui assure que le premier résultat
coïncide toujours avec celui de la seconde mesure. Nous pouvons supposer
que les éléments de réalité associés aux deux pois sont codés génétiquement
quelque part, et que les valeurs des codes sont les mêmes pour tous les pois
provenant de la même gousse ; mais d’autres possibilités existent, et la na-
8
Le fait que les corrélations disparaissent si les paramètres ne sont plus ajustés aux
mêmes valeurs montre que la couleur est une fonction à la fois de cette propriété commune
et des paramètres locaux de l’expérience.
B. DES POIS, DES GOUSSES, ET DE LEURS GÈNES 59
ture exacte ainsi que le mécanisme mis en jeu par ces éléments de réalité ne
sont pas essentiels pour le raisonnement. Ce qui est essentiel est que de tels
éléments de réalité, qui ne peuvent pas apparaître à partir d’une action à
distance, existent nécessairement avant qu’aucune expérience ne soit réalisée
– probablement avant même que les pois ne soient séparés.
Il semble difficile de ne pas reconnaître la méthode scientifique dans la
méthode qui a conduit à ces conclusions ; aucun tribunal ne croirait que des
corrélations aléatoires parfaites et répétées à loisir puissent apparaître en des
points éloignés sans être la conséquence d’une caractéristique commune aux
deux objets. De telles corrélations parfaites ne peuvent que refléter la valeur
initiale d’une variable commune attachée aux pois, valeur qui est à son tour
la conséquence d’une cause commune fluctuante dans le passé (par exemple,
le choix au hasard d’une gousse dans un sac qui en est rempli).
9
Nous supposons ici que les ordinateurs en question ne sont pas des ordinateurs quan-
tiques (si un jour on réussit à construire des ordinateurs quantiques complexes, ce sera une
autre question).
60 CHAPITRE III. EINSTEIN, PODOLSKY ET ROSEN
C. Transposition à la physique
C-1-a. Hypothèses
Supposons que deux particules de spin 1/2 soient émises par une source S
dans un état singulet11 où leurs spins sont corrélés (nous choisissons ce cas
pour simplifier, mais le théorème EPR ne se limite pas à deux spins 1/2
dans un état singulet, cf. § D-1) ; elles se propagent ensuite vers deux régions
éloignées de l’espace où elles sont soumises à des mesures des composantes de
leurs spins selon la direction repérée par l’angle a pour la région de gauche,
et par l’angle b pour la région de droite (Fig. III.2). Selon la tradition, nous
appelons Alice et Bob les deux opérateurs qui effectuent ces expériences dans
des laboratoires différents, qui peuvent être très éloignés l’un de l’autre. Alice
choisit librement la direction a, qui définit son “type de mesure”, et ne peut
obtenir que les résultat +1 ou −1 quel que soit le type de mesure choisi ; de
même, Bob choisit arbitrairement la direction b et obtient l’un des résultats
+1 ou −1. Dans l’expérience de pensée EPR, on suppose pour simplifier que
les deux spins, une fois émis par la source, n’interagissent qu’avec les appareils
de mesure, sans avoir d’évolution propre ; la mécanique quantique standard
prédit alors (§ A-1 du Chapitre IV) que les distances et les instants auxquels
les mesures sont effectuées ne jouent aucun rôle dans les probabilités d’obtenir
les différents couples possibles de résultats. Par exemple, si les angles a et
b sont choisis égaux (directions de mesures parallèles), les résultats seront
toujours opposés pour les deux mesures, même si les mesures ont lieu en des
points très éloignés. Ceci reste vrai, quel que soit le choix a = b qui est fait, et
si les deux opérateurs opèrent de façon totalement indépendante dans leurs
régions de l’espace et font un choix au dernier moment (après l’émission de
la paire de particules).
Le point de départ de EPR est de supposer que les prédictions de la
mécanique quantique concernant les probabilités de résultats de mesure sont
correctes. Plus précisément, le raisonnement suppose que les corrélations par-
faites prédites par cette théorie sont toujours observées, quelle que soit la
distance entre les appareils de mesure. Dans la parabole des pois, la couleur
rouge ou bleue est évidemment l’analogue des deux résultats ±1, les para-
mètres expérimentaux (température, etc.) sont les analogues de l’orientation
des appareils analysant les composantes des spins. Nous avons supposé que
les mêmes couleurs sont toujours observées pour une paire de pois donnée,
dès que les conditions expérimentales dans les deux régions de l’espace sont
les mêmes, alors qu’en mécanique quantique nous venons juste de voir que
les résultats sont toujours opposés pour des directions d’analyse identiques ;
11
A ce stade, nous n’avons pas besoin de connaître la définition précise d’un état de spin
singulet. Elle sera donnée, ainsi que le calcul des probabilités quantiques associées à des
valeurs quelconques des directions d’analyse quelconques a et b, au § A-1 du Chapitre IV.
Ces probabilités montrent que, lorsque a et b sont égaux, des corrélations parfaites sont
obtenues, ce qui est le seul élément nécessaire pour comprendre le raisonnement EPR. Voir
également Chapitre XII, relation (XII-76).
62 CHAPITRE III. EINSTEIN, PODOLSKY ET ROSEN
Figure III.2 – Schéma d’une expérience EPRB. Une source S émet des
paires de particules dans un état de spin singulet. Ces particules se propagent
le long de la direction Oz vers deux régions éloignées de l’espace, A et B, où
des appareils de Stern et Gerlach sont utilisés pour mesurer les composantes
de leurs spins sur des directions perpendiculaires à Oz. Pour la première par-
ticule, la direction est définie par l’angle a, pour la seconde par l’angle b.
Chaque mesure fournit le résultat +1 ou −1, et l’on s’intéresse aux corréla-
tions entre ces résultats lorsque l’expérience est répétée un grand nombre de
fois.
C-1-b. Conclusions
13
Einstein écrit dans [115] : “Les objets de la physique baignent dans un continuum
d’espace-temps. Ces objets demandent une existence autonome dans la mesure où ils se
trouvent dans des parties différentes de l’espace”.
14
En mécanique quantique standard, si l’on applique le postulat de réduction du vecteur
d’état à la mesure d’un des spins, le spin qui n’est pas mesuré “saute” soudainement vers
un état qui possède une composante bien définie du spin le long d’une direction parallèle
à celle qui a été mesurée pour l’autre spin. Vue de cette façon, la mécanique quantique
attribue effectivement un élément de réalité au second spin avant même qu’il ait subi une
mesure, ce qui est en accord partiel avec la conclusion EPR. Cependant le désaccord reste
total avant la première mesure, puisque la mécanique quantique standard n’attribue aucun
élément de réalité de ce type à aucun des spins.
64 CHAPITRE III. EINSTEIN, PODOLSKY ET ROSEN
Le point (i) peut être appelé le résultat EPR-1 ; il implique que quelque
chose manque dans la mécanique quantique (la description des propriétés in-
trinsèques des particules individuelles avant la mesure), qui est donc incom-
plète – EPR considèrent qu’une théorie complète doit être telle que “chaque
élément de réalité doit avoir son correspondant dans la théorie physique”.
Il est donc parfaitement possible que le vecteur d’état soit une description
suffisante pour un ensemble statistique de paires de particules, mais pas pour
une paire unique, où elle devrait être complétée par une information addi-
tionnelle. En d’autres termes, parmi l’ensemble de toutes les paires, on peut
distinguer des sous-ensembles qui ont des propriétés physiques différentes.
Le point (iii) va plus loin et établit la validité du déterminisme à partir
d’une hypothèse de localité, combinée avec celle que les prédictions de la
mécanique quantique sont correctes.
Le point (iv) peut être appelé le résultat EPR-2 ; il montre que la no-
tion d’observables incompatibles n’est pas fondamentale, mais seulement une
conséquence du caractère incomplet de la théorie. Ce point fournit une rai-
son de rejeter la complémentarité (au § D-1, nous généralisons ce résultat
à d’autres systèmes quantiques que deux spins 1/2 dans un état singulet).
Curieusement, EPR-2 est souvent présenté comme le résultat EPR majeur,
parfois même sans mention des autres. En fait, le rejet de la complémentarité
est relativement marginal ou, du moins, pas aussi important que la preuve
d’incomplétude. Dans les raisonnements qui seront faits plus bas, nous n’au-
rons besoin que de EPR-1. Einstein lui-même n’accordait pas beaucoup
d’importance à la relation entre le raisonnement EPR et les variables ne
commutant pas15 , et il semble probable que ce soit Podolsky qui ait intro-
duit cette composante dans la rédaction de l’article.
15
A la fin de la lettre déjà mentionnée à Schrödinger [114], il écrit “quant au fait que les
différents états du système puissent être considérés comme les vecteurs propres d’opéra-
teurs différents, je m’en fiche totalement” (“Das ist mir Wurst” en allemand).
C. TRANSPOSITION À LA PHYSIQUE 65
J.S. Bell résume la réponse de Bohr de façon concise en écrivant [95] que,
du point de vue de Bohr “il n’existe pas de réalité en dessous d’un certain
niveau classique macroscopique”. Effectivement, si l’on prend un point de vue
où la réalité physique ne peut être que macroscopique, alors la tentative de
EPR pour attribuer des éléments de réalité à l’un des spins seulement, ou
à une région de l’espace le contenant, est incompatible avec la mécanique
17
Heisenberg non plus n’était pas en accord avec Einstein, et décrivait la position de
ce dernier sur la mécanique quantique dans les termes suivants (Chapitre V de [94]) :
“Lorsqu’Einstein a critiqué la mécanique quantique, il l’a fait sur la base du réalisme
dogmatique. C’est une attitude extrêmement naturelle. N’importe quel scientifique qui
fait de la recherche sent qu’il est en quête de quelque chose qui est objectivement vrai. Ses
affirmations ne sont pas supposées dépendre des conditions dans lesquelles elles peuvent
être vérifiées”.
Dans sa conférence Nobel en 1933, il avait déjà écrit “Le seul fait que le formalisme
de la mécanique quantique ne peut être interprété comme une description visuelle d’un
phénomène se produisant dans l’espace et le temps montre que la mécanique quantique
n’est en rien concernée par la détermination objective de phénomènes dans l’espace-temps”.
68 CHAPITRE III. EINSTEIN, PODOLSKY ET ROSEN
quantique et donc sans fondement physique18 – même si cette région est très
grande et isolée du reste du monde. Dit autrement, un système physique qui
s’étend dans une grande région de l’espace doit être considéré comme une en-
tité unique, au sein duquel il n’est pas permis de distinguer des sous-systèmes
physiques ni aucune structure ; essayer d’attacher des réalités physiques in-
dépendantes à des régions différentes de l’espace est une tentative vouée à
l’échec. En termes de notre leitmotiv du § A-3 au Chapitre I, la différence
profonde entre espace ordinaire et espace des configurations, nous pourrions
dire la chose suivante : la fonction d’onde unique du système de deux parti-
cules se propage dans un espace des configurations qui a plus de 3 dimensions,
et ce fait doit être pris très au sérieux ; il ne faut donc pas tenter de revenir à
3 dimensions et de mettre en œuvre des arguments de localité dans l’espace
habituel. Le point de vue de Bohr n’est bien sûr pas contradictoire avec la
relativité, mais il réduit certainement l’importance de notions comme celles
d’espace-temps ou d’événement (une mesure en mécanique quantique n’est
pas locale, ce n’est donc pas un événement relativiste stricto sensu). Son
point de vue n’est donc pas très compatible avec une interprétation stricte
de la relativité.
Bien des physiciens reconnaissent qu’une caractérisation précise de l’at-
titude de Bohr est délicate, par exemple pour spécifier exactement quels
principes traditionnels doivent être abandonnés (voir par exemple la discus-
sion de la Ref. [10]). Ce qui est clair est que Bohr considère qu’il est vain
de chercher des explications physiques au-delà de ce que dit déjà la méca-
nique quantique orthodoxe. Dans sa réponse à EPR [41] publiée à Physical
Review, on croit retrouver une influence des discussions qu’il avait eues anté-
rieurement avec Einstein aux conférences Solvay ; ceci expliquerait pourquoi
il répète simplement le point de vue orthodoxe concernant une seule particule
soumise à des mesures incompatibles, ce qui n’a rien à voir avec l’argument
EPR. Il ne parle jamais explicitement de localité. A-t-il complètement ap-
précié à quel point la discussion devient passionnante pour deux particules
éloignées qui sont corrélées, et donc la nouveauté de l’argument EPR, qui est
le point de départ du théorème de Bell par exemple19 ? Pour Pearle, il s’ex-
prime de façon catégorique : “la réponse de Bohr était essentiellement qu’il
ne partageait pas l’opinion d’Einstein” [122]. Même Bell admettait qu’il avait
de grandes difficultés à comprendre Bohr (“Je n’ai pas vraiment une idée sur
le sens de ces mots” – voir l’appendice de [95]). Quoi qu’il en soit, le point de
18
On pourrait ajouter que le rejet par EPR de la notion d’observables incompatibles
(argument EPR-2) implique qu’au moins deux dispositifs expérimentaux soient pris en
compte pour l’un des appareils de mesure. Mais cela correspondrait dans le point de vue
de Bohr à deux réalités physiques différentes (une pour chaque couple a,b différent), au
lieu d’une seule comme le supposent EPR dans leur raisonnement.
19
Si Bohr avait connu le théorème de Bell, il aurait tout simplement pu répondre à EPR
que leur système logique n’était pas cohérent (voir § A-3 du Chapitre IV) !
C. TRANSPOSITION À LA PHYSIQUE 69
vue de Bohr reste actuellement toujours aussi solide, alors que nous savons
maintenant que les hypothèses EPR posent un problème de compatibilité
mutuelle, comme nous allons le voir dans le Chapitre IV.
auquel est associé un cône de lumière ; la distance entre les appareils fait
que chacun des deux événements tombe hors du cône de lumière de l’autre.
Dans ces conditions, aucune influence ne peut se propager d’un événement à
l’autre. Le raisonnement EPR suppose alors que les éléments de réalité as-
sociés à un système physique en un point d’espace-temps donné ne peuvent
changer (ou apparaître) que de façon causale, c’est-à-dire sous l’effet d’autres
événements s’étant produits dans le passé du cône de lumière de ce point. Il
en découle que les éléments de réalité du second spin ne peuvent être affectés
par la mesure réalisée sur le premier spin. Dans ce point de vue, on peut
dire que l’objectif principal de EPR est de rétablir une description de tous
les processus physiques en termes d’événements d’espace-temps s’influençant
mutuellement de façon causale. C’est l’opposé de la description en mécanique
quantique standard où un processus de mesure peut constituer un événement
totalement délocalisé couvrant une grande région de l’espace (Fig. IV.5). EPR
ne formulent aucune objection particulière contre le non-determinisme, mais
ils demandent que l’influence d’événements aléatoires ne se propage jamais
plus vite que la vitesse de la lumière. Nous reviendrons sur cette discussion
dans le cadre du théorème de Bell au § C du Chapitre V.
C-3-b. Relativité
D. Généralisations
Nous avons déjà mentionné que, dans leur article historique [112], EPR
discutent les mesures de position et d’impulsion de deux particules sans spin
qui sont intriquées ; l’état intriqué EPR est choisi de sorte que la mesure de
la position d’une particule détermine la position de l’autre, et également que
la mesure de l’impulsion d’une particule détermine l’impulsion de l’autre.
Cependant, dans le § C-1, au lieu d’introduire l’argument EPR avec des
variables de position et d’impulsion continues, nous avons choisi d’étudier les
résultats discrets fournis par des mesures des composantes de spins 1/2 dans
un état singulet. La raison de ce choix est qu’il conduit plus naturellement
au théorème de Bell. Mais cela ne signifie pas que le théorème EPR est limité
à ce cas ! Au § D-1, nous montrons que le raisonnement peut se généraliser
à toute paire de systèmes quantiques dont les espaces des états ont la même
dimension. Le théorème peut également être généralisé à des condensats à
spin, qui peuvent être macroscopiques, comme indiqué au § D-2.
Nous avons supposé que les deux spins 1/2 étaient dans un état singulet
|Ψ s’écrivant :
1
|Ψ = √ [|+, − − |−, +] (III-1)
2
où |±, ∓ est l’état propre commun des composantes sur Oz des spins 1 et 2
de valeurs propres respectives ±/2 et ∓/2. Cet état singulet possède une
D. GÉNÉRALISATIONS 73
propriété qui est cruciale pour le raisonnement EPR : si nous choisissons une
direction de l’espace Ou quelconque, |Ψ peut également s’écrire (invariance
par rotation) :
1
|Ψ = √ [|+u , −u − |−u , +u ] (III-2)
2
Les kets |±u , ∓u sont les vecteurs propres communs des composantes sur Ou
des spins 1 et 2 avec des valeurs propres respectives ±/2 et ∓/2. La rela-
tion (III-2) indique simplement que |Ψ garde la même forme, quel que soit
l’axe de quantification. C’est là une propriété cruciale pour le raisonnement
EPR, où la mesure de plusieurs observables incompatibles joue un rôle essen-
tiel : quelle que soit la direction arbitraire u choisie par Alice pour réaliser
sa mesure, immédiatement après la composante du spin de Bob sur la même
direction est déterminée. Si l’on accepte le réalisme local, le raisonnement
montre alors que cette composante était déterminée avant toute mesure. Il
s’ensuit que toutes les composantes du spin de Bob sont déterminées dans
l’état initial (ainsi bien sûr que, par symétrie, toutes les composantes du spin
d’Alice), ce qui est contradictoire avec la mécanique quantique standard (où
des composantes non parallèles correspondent à des observables incompa-
tibles).
Hemmick et Shakur discutent une généralisation de ce résultat, qu’ils ap-
pellent le “paradoxe de Schrödinger” ou encore le “théorème de Schrödinger”
(Chapitre 4 de [125]) ; ils montrent que, si deux systèmes quantiques ont des
espaces des états de même dimension N quelconque (pas nécessairement 2),
on peut construire des “états EPR généralisés” où toutes les observables des
deux systèmes sont parfaitement corrélées. Commençons par considérer une
observable A et la base {|θi } de ses vecteurs propres orthonormés (i = 1,
2,..., N ) ; nous supposons que toutes les valeurs propres ai de A sont non
dégénérées. Nous introduisons alors l’état suivant du système total :
1
N
|Ψ = √ |1 : θi |2 : θi (III-3)
N i=1
N
∗
Uki Ukj = δij (III-6)
k=1
Comme ϕi |ϕj = δij , nous obtenons les relations (III-6), qui expriment
simplement le fait que la base {|ϕi } est orthonormale (en d’autres termes,
que U est unitaire).
Nous pouvons ensuite introduire un autre opérateur U , dont les éléments
de matrice sont les complexes conjugués de ceux de U dans la base {|θi } :
N
∗
U ki U kj = δij (III-9)
k=1
Cette relation est l’équivalente pour U de (III-6) pour U , ce qui montre que U
est lui aussi unitaire. Nous pouvons donc obtenir une autre base orthonormale
{|ϕi } (i = 1, 2,..., N ) en définissant les kets :
1
N
|Ψ = √ θi |θj |1 : θi |2 : θj
N i,j=1
1
N
=√ θi |ϕk ϕk |θj |1 : θi |2 : θj
N i,j,k=1
1
N
=√ θi |ϕk θj |ϕk |1 : θi |2 : θj (III-12)
N i,j,k=1
1
N
|Ψ = √ |1 : ϕk |2 : ϕk (III-13)
N k=1
Nous voyons ainsi que |Ψ ne change pas si une transformation U est appli-
quée à la première particule et la transformation U à la seconde.
En conséquence, |Ψ peut être développé sur la base propre d’un opéra-
teur quelconque B (1) pour la particule 1, à condition que la base pour la
particule 2 soit simultanément changée selon l’opérateur U ; les |2 : ϕk sont
les vecteurs propres d’une autre observable B (2). Le ket |Ψ prend alors exac-
tement la même forme, à savoir la somme de N produits contenant chacun
des états orthonormés des deux particules. Comme plus haut, si l’observable
B (1) est mesurée (nous avons supposé que cet opérateur n’a pas de valeur
propre dégénérée), le postulat de projection sélectionne un seul des produits,
ce qui signifie que l’état du système total aboutit dans un état factorisé qui
est un état propre de B (2). En d’autres termes, les deux mesures donnent
des résultats qui sont parfaitement corrélés, de sorte qu’une mesure de B (1)
est équivalente à une mesure de B (2), exactement comme pour la situation
de deux spins 1/2 dans un état singulet.
Le raisonnement EPR s’applique alors et montre que, si l’on accepte réa-
lisme et localité, les résultats des mesures ne font que révéler des propriétés
des systèmes quantiques qui doivent pré-exister avant toute mesure. De plus,
quelle que soit l’observable B (1) choisie, il existe une observable B (2) parfai-
tement corrélée avec B (1) : la mesure de B (1) fournit le résultat de mesure
de B (2) sur la particule 2 avec certitude. La conclusion est donc que, si deux
systèmes quantiques sont décrits par un état du type (III-3), ce n’est pas
seulement quelques observables qui correspondent à des éléments de réalité
pré-existants, mais toutes les observables !
Dans le contexte du théorème BKS et de la contextualité (§ D du Cha-
pitre VI), on s’intéresse souvent à des mesures sur des particules de spin 1
76 CHAPITRE III. EINSTEIN, PODOLSKY ET ROSEN
(ce qui correspond au cas N = 3). Ce que nous avons vu montre qu’il est
possible d’intriquer deux particules de spin 1 de façon que la connaissance
parfaite de la valeur d’une observable absolument quelconque d’un des sys-
tèmes puisse être obtenue par une mesure sur l’autre ; voir le § 4.4.3 de [125]
pour une discussion plus précise des observables mises en jeu, et la relation
avec le théorème de Kochen-Specker. Les particules de spin 1 sont également
importantes dans le cadre de la démonstration du théorème de Conway-
Kochen [126, 127].
région de l’espace peut-elle dépendre d’une mesure à une très grande dis-
tance ? Cependant, la différence importante avec l’argument original EPR
est que le nombre de particules concernées est maintenant arbitrairement
grand, de sorte que la polarisation de spin peut être macroscopique. Si les
spins portent un moment magnétique, ils fournissent une aimantation trans-
verse macroscopique, qui peut être détectée avec des appareils très ordinaires
comme une simple boussole. Pour des objets macroscopiques de taille arbi-
trairement grande, il semble difficile d’invoquer l’argument de Bohr et de
dire qu’ils n’ont droit à une réalité physique que lorsqu’ils sont associés avec
des appareils de mesure bien définis ! Mais, bien évidemment, nous ne pou-
vons savoir ce que Bohr aurait dit concernant la version macroscopique de
l’argument EPR.
Dans ce cas particulier, l’élément de réalité EPR pré-existant serait donc
la phase relative des deux condensats. La notion d’une phase pré-existante est
reliée à celle de brisure spontanée de symétrie et de l’apparition d’une phase
pour un système qui passe par une transition superfluide (phase d’Anderson
[129]). La phase relative de condensats de Bose-Einstein contient également
quelques effets de non-localité quantiques intéressants [130], mais les effets
non locaux seront discutés dans le chapitre suivant.
Chapitre IV
Le théorème de Bell
exemple, les variables λ peuvent déterminer les probabilités des résultats des
expériences futures, et non les résultats eux-mêmes, sans que cela invalide le
théorème (pour plus de détails, voir aussi l’Appendice B).
Enfin, au § C, nous examinons la situation actuelle découlant de l’ob-
servation expérimentale des violations des inégalités de Bell, et discutons
en particulier les différentes “échappatoires” possibles au raisonnement qui
conduit à une contradiction entre les observations expérimentales et le réa-
lisme local.
De façon générale, la condition vraiment essentielle pour la validité du
théorème est la localité : des fluctuations de toutes sortes peuvent être prises
en compte, mais il faut que leurs effets physiques soient locaux. Si nous sup-
posons que jeter un dé à Paris peut influencer instantanément les événements
qui se déroulent à Tokyo, ou même dans d’autres galaxies, la preuve du théo-
rème n’est plus possible. Pour une discussion générale du théorème de Bell,
voir par exemple [56, 95, 132, 133].
Au Chapitre V, nous démontrerons un certain nombre d’autres inégalités
qui découlent également du réalisme local, et nous examinons plus en dé-
tail les relations entre le théorème de Bell et la relativité (impossibilité de
transmission instantanée de signaux à distance).
A. Inégalités de Bell
Les inégalités de Bell sont des relations satisfaites par les valeurs moyennes
de produits de variables aléatoires qui sont corrélées classiquement – nous
entendons par là que leurs corrélations proviennent des fluctuations d’un
événement qui s’est produit dans le passé et qui a influencé leurs valeurs,
comme dans le chapitre précédent pour les pois. L’intérêt principal de ces
inégalités est qu’elles peuvent se révéler contradictoires avec la mécanique
quantique ; une situation où cela se produit est la version avec spins de l’ar-
gument EPR [120], déjà introduite au § C-1 du Chapitre III, où deux par-
ticules de spin 1/2 sont soumises à des mesures en des points éloignés de
l’espace. C’est pourquoi nous commençons par brièvement rappeler quelles
sont les prédictions de la mécanique quantique pour un tel système – le seul
ingrédient dont nous aurons besoin pour le moment se limite aux prédictions
de la mécanique quantique concernant les résultats possibles. Ensuite nous
reviendrons à l’argument EPR-Bell, discuterons les contradictions avec la
mécanique quantique, le contenu logique du théorème et les contradictions
avec les expériences.
Nous supposons que deux particules de spin 1/2 dans un état singulet
de spin se propagent dans des directions opposées après avoir été émises par
A. INÉGALITÉS DE BELL 81
une source commune. Leur état de spin est alors donné par :
1
| Ψ >= √ |+, − − |−, + (IV-1)
2
où, selon la notation habituelle, l’état à deux spins |±, ∓ contient le premier
spin dans un état propre de valeur propre ±/2 de la composante de son spin
sur Oz 1 , et le second dans un état propre de valeur propre ∓/2. Comme
indiqué sur la Figure III.2, lorsqu’elles atteignent des régions éloignées, elles
sont alors soumises à des mesures de leurs spins, au moyen d’appareils de
Stern et Gerlach orientés selon les angles a et b autour de la direction de
propagation, ce qui signifie que ce sont les composantes des spins le long de
a et b qui sont mesurées.
Si :
θab = a − b (IV-2)
est l’angle entre les directions définies par a et b, la mécanique quantique
prédit que la probabilité d’une double détection de résultats +1, +1 (ou −1,
−1) est :
1 θab
P(+,+) = P(−,−) = sin2 (IV-3)
2 2
tandis que la probabilité de deux résultats opposés est :
1 θab
P(+,−) = P(−,+) = cos2 (IV-4)
2 2
Nous n’avons pour le moment pas besoin d’en savoir plus sur les prédic-
tions de la mécanique quantique, il nous suffit des probabilités d’observer
les résultats de mesure. Une remarque essentielle est que, si θab = 0 (donc
lorsque les orientations des deux mesures sont parallèles), les formules pré-
disent que deux probabilités s’annulent, alors que les deux autres sont égales
à 1/2. On est alors toujours certain d’obtenir le même résultat dans les deux
mesures, ce qui signifie que les corrélations parfaites nécessaires au raison-
nement EPR se produisent effectivement (en fait, pour un état singulet les
résultats des mesures sont toujours opposés, et non égaux, mais cela revient
au même puisqu’il suffit de changer l’orientation d’un des axes pour qu’ils
redeviennent égaux – voir la discussion du § C-1-a au Chapitre III).
Un état tel que (IV-1), où les propriétés des deux sous-systèmes physiques
(ici les deux spins) sont corrélées dans le vecteur d’état lui-même, est appelé
en mécanique quantique “état intriqué” ; nous reviendrons plus en détail au
Chapitre VII sur la notion d’intrication quantique.
1
On peut montrer que le vecteur d’état (IV-1) est invariant dans toute rotation, ce qui
implique qu’il garde la même expression quel que soit le choix de l’axe de quantification
Oz.
82 CHAPITRE IV. LE THÉORÈME DE BELL
Nous partons donc du théorème EPR et, comme Bell, nous supposons que
λ représente les “éléments de réalité” associés aux spins ; en fait λ n’est qu’une
notation concise qui peut parfaitement sous-entendre un vecteur avec de très
nombreuses composantes, de sorte que le nombre d’éléments de réalité inclus
dans λ est totalement arbitraire – aucune restriction n’est donc introduite par
cette notation. Il est d’ailleurs possible d’inclure dans λ des composantes qui
ne jouent aucun rôle particulier dans le problème ; la seule chose importante
est que λ contienne suffisamment d’information pour donner les résultats
de toutes les mesures envisageables sur les spins. Nous faisons usage d’une
autre notation usuelle pour les résultats, A et B, à ne pas confondre avec
les lettres minuscules a et b utilisées pour les paramètres de la mesure des
deux appareils. Bien évidemment, A et B peuvent dépendre, non seulement
de λ, mais également des paramètres de mesure a et b ; néanmoins, la localité
impose que b n’ait aucune influence sur le résultat A (du fait que la distance
entre les mesures est arbitrairement grande) ; inversement, a n’a aucune in-
fluence sur le résultat B. Nous notons donc A(a, λ) et B(b, λ) les fonctions
correspondantes, qui prennent les deux valeurs +1 ou −1.
Dans ce qui suit, il est suffisant de prendre en compte deux directions
seulement pour chaque mesure individuelle ; nous utiliserons donc la notation
plus simple :
A ≡ A(a, λ) A ≡ A(a , λ) (IV-5)
et :
B ≡ B(b, λ) B ≡ B(b , λ) (IV-6)
Pour chaque paire de particules émise, λ est fixé, et les quatre nombres
ont des valeurs bien définies, qui ne peuvent chacune être que ±1. Avec
Eberhard [134] nous remarquons que la somme de produits :
est toujours égale à, soit +2, soit −2 ; en effet une des parenthèses dans
le membre de droite de cette équation s’annule toujours, tandis que l’autre
vaut ±2. Si maintenant nous prenons la valeur moyenne M de M (λ) sur
un grand nombre de paires émises (moyenne sur λ), nous avons :
M = ABλ − AB λ + A B λ + A B λ (IV-8)
Ce résultat est la forme dite BCHSH (Bell, Clauser, Horne, Shimony et Holt)
du théorème de Bell [135]. L’inégalité est satisfaite pour toutes les sortes de
paires de mesures qui fournissent des résultats aléatoires2 , quel que soit le
mécanisme qui crée les corrélations, pourvu que la condition de localité soit
respectée : A est indépendant du paramètre de mesure b, et B est indépendant
de a.
Toute théorie entrant dans le cadre du “réalisme local” doit donc conduire
à des prédictions qui satisfont la relation (IV-9). Le réalisme est nécessaire
puisque nous avons fait usage dans la démonstration de la notion d’éléments
de réalité EPR pour en déduire l’existence des fonctions A et B ; la localité
(§ C-3 du Chapitre III) l’est également puisque c’est elle qui interdit à A
de dépendre de b et inversement à B de dépendre de a. Au § A-4 nous
reviendrons plus en détail sur le contenu logique du théorème de Bell.
Dans ce contexte, le caractère aléatoire des observations ne peut provenir
que des fluctuations d’une source commune fluctuant dans le passé ; on peut
également voir ceci comme une hypothèse générale très naturelle qui concerne
tous les processus physiques. La Figure IV.1 schématise cette situation, et
la Figure IV.2 montre la représentation spatio-temporelle correspondante ;
les lignes connectant la cause et les effets doivent se trouver à l’intérieur du
cône de lumière x = ±ct pour que la relativité soit satisfaite (x est la po-
sition, t le temps et c la vitesse de la lumière). Mais les inégalités restent
en fait valables si, par exemple, d’autres causes fluctuantes agissent égale-
ment sur les particules durant leur propagation vers les appareils de mesure,
ou directement sur les appareils de mesure eux-mêmes (Fig. IV.3). Il faut
alors inclure dans λ des composantes stochastiques associées aux processus
aléatoires correspondants, ce qui peut complètement changer la distribution
de cette variable multidimensionnelle, mais pas le fait que la moyenne d’un
nombre M toujours égal à ±2 satisfait nécessairement l’inégalité (IV-9).
La simplicité de cette démonstration est telle qu’on peut s’attendre à
ce que l’inégalité reste valable dans de nombreuses situations ; c’est effective-
ment le cas, comme nous le verrons plus en détail dans les §§ B-1 et B-2. Pour
le moment, contentons-nous de remarquer que le résultat est indépendant de
l’interprétation de la variable λ, qui n’est pas nécessairement définie comme
une variable supplémentaire ou un élément de réalité. On peut par exemple
supposer que cette variable sert simplement à repérer la réalisation de l’ex-
périence : λ = 1 correspond à la première expérience, λ = 2 à la seconde,...,
λ = N à la dernière d’une série d’expériences. Si, pour chaque réalisation, les
4 nombres A, B, A et B ont des valeurs bien définies, toutes égales à ±1, le
2
Dans notre définition (IV-7) de M , le terme AB est précédé d’un signe moins alors
que les trois autres termes ont un signe plus, mais la position du singe moins est arbitraire.
En effet, si l’on écrit AB + AB ± A B ∓ A B = A(B + B ) ± A (B − B ) et ±AB ∓ AB +
A B + A B = ±A(B − B ) + A (B + B ) on peut obtenir quatre inégalités où le signe
moins est attribué à l’un quelconque des quatre termes de la somme.
84 CHAPITRE IV. LE THÉORÈME DE BELL
nombre M est lui aussi bien défini pour chaque réalisation et est égal à −2
ou +2. Quelles que soient les valeurs qui peuvent apparaître dans une série
quelconque de N mesures, il est mathématiquement impossible à la somme
des M de dépasser 2N ou d’être plus petite que −2N . En conséquence, la
valeur moyenne obtenue en divisant cette somme par N satisfait nécessaire-
ment (IV-9) : la simple existence des 4 nombres pour chaque réalisation est
suffisante pour obtenir l’inégalité. En d’autres termes, l’existence de 2 fonc-
tions A(a, λ) et B(b, λ) des paramètres de mesure a et b et du numéro de
l’expérience λ = 1, 2, 3,... est suffisante pour obtenir les inégalités BCHSH.
Figure IV.1 – Une source S émet des particules vers deux appareils de me-
sure situés en des points éloignés, réglés avec des paramètres de mesure respec-
tifs a et b ; chaque appareil fournit un résultat ±1. L’ovale sous la source sym-
bolise un processus aléatoire fluctuant qui contrôle les conditions d’émission
des particules émises, et donc leurs propriétés. On observe des corrélations
entre les résultats obtenus ; ces corrélations sont conséquence des propriétés
aléatoires communes que les particules ont acquises lors de leur émission sous
l’effet du processus fluctuant.
Supposons alors que les quatre directions soient dans un même plan, et que
les vecteurs rangés dans l’ordre a, b, a et b font chacun un angle ◦
√ de 45 avec
le précédent (cf.
√ Fig. IV.4) ; tous les cosinus valent
√ alors 1/ 2, sauf cos θab
qui vaut −1/ 2. On obtient ainsi Q √ = −2 2 ; si l’on renverse les direc-
tions de b et b , on obtient Q = 2 2. Dans les deux cas,√on obtient ainsi
√ BCHSH (IV-9) par un facteur 2, donc plus de
une violation de l’inégalité
40 % (il se trouve que 2 est la plus grande violation possible autorisée par
la mécanique quantique – cf. § B du Chapitre V). Malgré l’apparente sim-
plicité de la variation en cosinus contenue dans l’expression (IV-11), aucune
théorie locale réaliste n’est capable de la reproduire, puisque qu’elle ne peut
86 CHAPITRE IV. LE THÉORÈME DE BELL
Figure IV.3 – Des causes fluctuantes non contrôlées peuvent influencer, non
seulement l’émission des particules, mais aussi leur propagation, ainsi que les
appareils de mesure, sans que cela ne change en rien la validité des inégalités
BCHSH.
nement passé inconnu dont les conséquences se sont propagées jusqu’aux deux
expérimentateurs (voir la discussion du § C-1-c sur le fatalisme et le super-
déterminisme.). C’est la notion même de variable libre d’une théorie qui est
en jeu : les paramètres de mesure a et b sont considérés comme des variables
libres externes à la théorie, et non comme les conséquences d’un événement
passé dont les influences se seraient propagées jusqu’aux deux laboratoires
en obéissant à une équation dynamique de la théorie.
Enoncé de cette façon, le théorème de Bell est conceptuellement très
général, mais bien évidemment impossible à vérifier expérimentalement du
fait de la trop grande généralité de l’hypothèse 3. On peut alors préférer une
autre forme d’auto-contradiction logique, où cette hypothèse est remplacée
par deux autres qui sont plus particulières, ne concernant qu’une expérience
donnée (par exemple : deux spins 1/2 dans un état singulet, ou deux photons
émis dans une cascade atomique 0-1-0) :
(3’) Dans cette expérience, les prédictions de la mécanique quantique
concernant les corrélations parfaites qui sont observées avec les mêmes para-
mètres d’expériences (a = b) sont correctes (c’est cette hypothèse qui mène
à l’existence des éléments de réalité EPR).
(3”) Les prédictions concernant les corrélations pour des paramètres diffé-
rents sont également correctes.
Retirer soit (3’), soit (3”), de l’ensemble des hypothèses est suffisant pour
supprimer l’auto-contradiction. La motivation des expériences qui ont testé
les inégalités de Bell était précisément de vérifier si ce n’était pas l’hypothèse
(3”) qui devrait être abandonnée. Peut-être, après tout, que le théorème de
Bell n’est autre qu’un indicateur très efficace pour pointer du doigt les rares
situations où les prédictions de la mécanique quantique deviennent tellement
paradoxales qu’elles sont en fait fausses ? C’était l’espoir d’un certain nombre
de théoriciens, et en même temps un défi à relever pour les expérimentateurs.
La référence [141] contient une discussion claire du contenu logique de
l’argument EPR et du théorème de Bell ainsi que de leurs relations avec le
réalisme, la localité, et la séparablité.
8
En ce qui concerne les effets de la gravité, il a même été montré [156] que les corrélations
du type EPR peuvent subsister à des échelles cosmiques.
B. DIVERSES DÉMONSTRATIONS DU THÉORÈME 95
Nous avons donné une démonstration du théorème de Bell qui part d’un
groupe possible d’hypothèses permettant de l’établir (§ A-4). La seule condi-
tion pour que la démonstration soit possible est en fait l’existence de quatre
nombres A, B, A et B , tous égaux à ±1, qui doivent être bien définis
mais peuvent être inconnus (de façon équivalente, on peut supposer l’exis-
tence d’une distribution de probabilité commune aux résultats des quatre
mesures [162]). Il n’est donc pas surprenant que d’autres groupes d’hypo-
thèses puissent également servir de point de départ au raisonnement, ce qui
ajoute à la portée du résultat de Bell : une violation des inégalités signifie
alors que, dans chacun de tous ces groupes, une des hypothèses au moins doit
être rejetée, de sorte que la discussion du § A-4 peut être généralisée. Pour
illustrer cette possibilité, nous donnons ici quelques exemples de groupes
d’hypothèses possibles ; nous ne mentionnons pas à chaque fois l’hypothèse
du “libre arbitre” déjà évoquée (voir aussi § C-1-c), car elle est commune à
tous les groupes.
(i) Dans l’introduction de ce chapitre, nous avons déjà mentionné que le
théorème de Bell peut être vu comme un théorème s’appliquant spécifique-
ment aux théories à variables cachées. Dans ce cas, les λ proviennent, non
du raisonnement EPR et de leur notion de réalisme, mais tout simplement
du fait qu’on suppose a priori l’existence de ces λ. Une fois la démonstration
faite, la conclusion du théorème est que, si ces variables évoluent localement,
les résultats des mesures doivent satisfaire les inégalités de Bell. Récipro-
quement, une violation des inégalités signifie, soit que les variables cachées
n’existent pas, soit qu’elles évoluent non localement (ou encore que le libre
arbitre n’existe pas, en d’autres termes que a et b sont des fonctions d’une
composante supplémentaire de λ). Ce point de vue est moins général que
celui que nous avons choisi jusqu’ici, mais aussi plus simple, ce qui explique
96 CHAPITRE IV. LE THÉORÈME DE BELL
probablement pourquoi il est souvent utilisé. Par exemple, dans l’un de ses
fameux livres sur la mécanique quantique [58], Jammer introduit le théo-
rème de Bell au cours d’un chapitre consacré spécifiquement aux théories à
variables cachées.
Ce n’est cependant pas le point de vue pris par Bell dans son article histo-
rique [131], où il introduit clairement son raisonnement comme un prolonge-
ment de l’argument EPR. Le titre est “Sur le paradoxe de Einstein Podolsky
Rosen” et les premières phrases de l’introduction sont “Le paradoxe d’Ein-
stein, Podolsky et Rosen a été proposé comme un argument selon lequel la
mécanique quantique ne pouvait pas être une théorie complète, mais devait
être complétée par des variables supplémentaires. Le but de ces variables
supplémentaires était de restaurer causalité et localité dans la théorie. Dans
cette note cette idée est formulée mathématiquement (italiques ajoutées) ; on
montre qu’elle est incompatible avec les prédictions statistiques de la mé-
canique quantique. C’est la contrainte de localité,..., qui crée la difficulté
essentielle”. En d’autres termes, la variable supplémentaire λ qu’il considère
n’est pas introduite a priori, en postulant l’existence d’une nouvelle “variable
cachée” ; c’est simplement l’objet mathématique qui décrit les éléments de
réalité dont EPR ont démontré l’existence. Bell distingue donc clairement
entre “variables supplémentaires” et “variables cachées”, et continue ensuite
en discutant ces dernières dans le cas particulier de la théorie de Bohm : “Il
a existé des tentatives pour montrer que, même sans une telle contrainte de
séparabilité ou de localité, aucune interprétation à ‘variables cachées’ de la
mécanique quantique n’est possible. Il a été cependant montré que ces tenta-
tives ont échoué. De plus, une interprétation à variables cachées de la théorie
quantique élémentaire a été construite explicitement”. Le point de vue de
Bell est donc sans ambigüité.
(ii) Supposer la contrafactualité est une autre façon de pouvoir démontrer
le théorème de Bell : la pré-existence de tous les résultats possibles d’expé-
riences permet d’en déduire les inégalités BCHSH et d’autres inégalités. En
effet, dès que les 4 quantités A, A , B et B (toutes égales à ±1) peuvent
être définies pour chaque réalisation de l’expérience, la méthode du § A-2
s’applique immédiatement pour obtenir (IV-9), ce qui conduit à une preuve
de l’inégalité. La contrafactualité n’est pas nécessairement reliée à la notion
d’espace et à la localité9 , de sorte que ce point de vue fournit effectivement
un autre cadre de raisonnement indépendant.
La citation de Peres du § A-3 [136] fournit la conclusion à tirer d’une
violation des inégalités, qui est équivalente à la discussion de la fin du § A-2 :
9
La contrafactualité peut être postulée ab initio, sans aucune référence particulière à
la localité. Inversement, si l’on suppose localité et réalisme, alors le raisonnement EPR
permet de montrer l’existence d’éléments de réalité qui peuvent jouer le rôle d’éléments
contrafactuels. Toutefois il demande de supposer plus que la seule localité, puisqu’il fait
aussi intervenir l’hypothèse du réalisme EPR.
B. DIVERSES DÉMONSTRATIONS DU THÉORÈME 97
une violation des inégalités BCHSH montre qu’il est impossible de trouver
deux fonctions A(a, λ) et B(b, λ) des paramètres de mesure a et b et du
numéro de l’expérience qui donnent les valeurs des résultats de mesure.
(iii) Supposer la non-contextualité est encore une autre possibilité pour
obtenir les inégalités ; cette question sera discutée plus en détail au § D
du Chapitre VI. A nouveau, la non-contextualité peut, si on le désire, être
vue comme une conséquence naturelle de la séparation spatiale entre les
laboratoires d’Alice et Bob ; mais elle peut aussi être acceptée comme un
principe indépendant et même plus général (satisfait par exemple par la
physique classique, locale ou non locale).
On peut en fait obtenir ainsi le théorème de Bell dans toute une série
de contextes logiques en combinant entre elles des hypothèses assez diverses,
comme la séparabilité, l’existence de causes communes dans les cônes du passé
(causalité relativiste, comme dans la Figure IV.2), etc. Toutes les démons-
trations ainsi obtenues sont intéressantes, dans la mesure où elles élargissent
la liste des ensembles d’hypothèses qui sont incompatibles avec la mécanique
quantique, et donc la portée du théorème. Nous en présentons maintenant
quelques-unes.
çon continue, qu’elles n’effectuent pas de sauts dans l’espace”. Une autre
hypothèse découle de la relativité : cette propagation ne peut pas se faire à
une vitesse dépassant celle de la lumière (elle a lieu à l’intérieur du cône de
lumière du futur) ; on crée ainsi un lien plus étroit entre théorème de Bell
et relativité. Nous discutons maintenant les conséquences de cette notion de
localité relativiste sur les prédictions possibles des théories, qu’elles soient dé-
terministes ou non. Nous suivrons de près l’analyse de Bell dans son fameux
article “La nouvelle cuisine” [166] – voir également [167] et Norsen [165].
Considérons les événéments se produisant dans une région donnée de
l’espace-temps R, comme représenté sur la Figure IV.8 ; l’axe horizontal re-
présente l’espace (symbolisé ici par une seule dimension le long d’un axe Ox)
et l’axe vertical le temps (multiplé par la vitesse de la lumière c). Les causes
de tous ces événements ne peuvent se trouver que dans le cône de lumière du
passé de la région R ainsi que, si un expérimentateur fait une expérience dans
cette région, du choix qu’il peut faire pour le paramètre de mesure a de ses
expériences (hypothèse du “libre choix”, § C-1-c). Introduisons maintenant
une région C d’espace-temps qui couvre toute une tranche du cône du passé
de la région R, comme le montre la figure. Si les influences se propagent de
façon continue, pour atteindre R en venant de loin dans le passé, elles doivent
croiser C ; ainsi, pour rendre compte de l’effet de toutes les causes lointaines
dans le passé, il est suffisant de spécifier toutes les causes se produisant dans
C. En d’autres termes, cette spécification “écrante” la région R de toutes les
causes plus lointaines dans le passé ; elle rend redondante toute information
sur ces causes par comparaison avec celles déjà contenues dans C (autre-
ment dit : la connaissance de causes plus lointaines du passé fournissant des
informations superflues).
α. Variables et “existables”
Il est utile à ce stade de préciser quels types de causes doivent être pris en
compte dans notre raisonnement. Il est clair que n’importe quel objet mathé-
matique qui apparaît dans une équation physique ne convient pas pour carac-
tériser une cause. En électromagnétisme classique par exemple, il est connu
que le potentiel de Coulomb ne se propage pas dans l’espace, mais dépend
de la position instantanée de toutes les charges ; ceci n’est pas contradictoire
avec la relativité car les effets instantanés du potentiel sont compensés par
d’autres effets du potentiel vecteur ; les “véritables” champs électromagné-
tiques (champ électrique E et magnétique B) se propagent bien à la vitesse
finie c. Ainsi, les équations de la physique peuvent contenir des fonctions ma-
thématiques qui ne sont que des quantités intermédiaires à partir desquelles
on peut obtenir des quantités réellement physiques ; ces fonctions ne se pro-
pagent pas nécessairement dans l’espace avec une vitesse finie, et jouent juste
B. DIVERSES DÉMONSTRATIONS DU THÉORÈME 101
le rôle de variables commodes10 . Par opposition avec ces variables, Bell intro-
duit [166] ce qu’il appelle “beables”, et que nous traduirons par “existables”,
jeu de mots construit à partir du début du mot “exister” et de la fin du mot
“variable”. Elles sont définies par : “les existables de la théorie sont ces enti-
tés de cette théorie qui sont, au moins putativement, à prendre au sérieux,
comme correspondant à quelque chose de réel”. Dans [167], il oppose exis-
10
“Des conventions peuvent se propager aussi vite qu’il se trouve que cela est pratique.
Mais alors nous devons distinguer dans notre théorie ce qui est convention et ce qui ne
l’est pas” [166].
102 CHAPITRE IV. LE THÉORÈME DE BELL
P (A a, λ) (IV-12)
P (A, λ a) = P (A a, λ) P (λ a) (IV-14)
P (A, B a, b, λ1 , λ2 ) = P (A a, λ1 ) P (B b, λ2 ) (IV-22)
Figure IV.9 – Deux systèmes quantiques sont émis au cours d’un processus
se produisant dans une région d’espace-temps S, se propagent dans l’espace
et le temps depuis leur source, et sont alors soumis à deux mesures dans
deux régions de l’espace-temps R1 et R2 ; ces deux régions sont séparées par
un grand intervalle du genre espace. Dans chacune de ces deux régions, un
expérimentateur choisit librement un paramètre de mesure, a dans R1 et b
dans R2 . Nous introduisons deux régions d’espace-temps intermédiaires C1
et C2 , choisies de sorte que C1 contienne toutes les informations concernant
des influences pouvant agir sur les existables locales de R1 , tout en restant
hors du cône du passé de R2 (inversement, C2 contient toute l’information
concernant les influences pouvant agir sur les existables locales dans R2 , mais
reste hors du cône du passé de R1 ). L’ensemble des existables contenues dans
C1 (y compris celles associées à l’appareil de mesure) est noté λ1 , celui des
existables contenues dans C2 est noté λ2 .
bien sûr, n’interdit pas les corrélations entre les résultats A et B lorsque λ1
et λ2 fluctuent de façon corrélée).
Comme dans (IV-15), le libre choix des paramètres a et b nous permet
d’écrire :
P (λ1 , λ2 a, b) = ρ (λ1 , λ2 ) (IV-23)
où ρ (λ1 , λ2 ) est la distribution des valeurs λ1 et λ2 des existables sur un
grand nombre de réalisations de l’expérience. Nous avons :
ρ (λ1 , λ2 ) ≥ 0 ; dλ1 dλ2 ρ (λ1 , λ2 ) = 1 (IV-24)
106 CHAPITRE IV. LE THÉORÈME DE BELL
Lorsque les résultats ne prennent que les deux valeurs ±1, il est pratique
d’introduire deux fonctions X (A; a, λ1 ) caractérisant les probabilités selon :
1
P (A = ±1 a, λ1 ) = [1 ± X (a, λ1 )] − 1 ≤ X (a, λ1 ) ≤ +1
2
1
P (B = ±1 b, λ2 ) = [1 ± Y (b, λ2 )] − 1 ≤ Y (a, λ1 ) ≤ +1 (IV-26)
2
La moyenne sur un grand nombre de réalisations du produit des résultats
s’écrit alors :
AB = dλ1 dλ2 ρ (λ1 , λ2 ) X (A; a, λ1 ) Y (B; b, λ2 ) (IV-27)
avec :
−2 ≤ F (λ1 , λ2 ) ≤ +2 (IV-31)
Pour établir ce résultat, commençons pas supposer que chacune des 4 va-
riables X, X , Y et Y prend l’une de ses valeurs extrémales ±1. Alors l’un
des deux crochets [Y (λ2 ) ± Y (λ2 )] de la seconde ligne de (IV-30) s’annule,
de sorte que F est égal à ±2 – c’est vrai pour les 16 combinaisons possibles des
valeurs extrêmes des variables. Puis, tout en maintenant les autres variables
à leurs valeurs constantes, mettons X à une valeur intermédiaire quelconque
comprise entre −1 et +1 ; ce changement modifie F par interpolation linéaire
entre deux valeurs ±2, de sorte que le résultat est nécessairement lui aussi
compris entre −2 et +2 – en fait, on obtient ainsi 8 résultats associés aux
8 combinaisons possibles des valeurs des 3 autres variables X , Y et Y . Don-
nons maintenant à X une valeur quelconque comprise entre −2 et +2 ; une
seconde interpolation s’ensuit et, à nouveau, des valeurs de F entre −2 et +2
sont obtenues (elles sont au nombre de 4, correspondant aux 4 combinaisons
pour les variables restantes Y et Y ). De la même manière, deux étapes sup-
plémentaires du raisonnement pour fixer Y et Y permettent de voir que, à
la fin, F reste toujours compris entre les valeurs −2 et +2, quelles que soient
les valeurs intermédiaires des 4 variables.
L’équation (IV-29) définit alors M comme la moyenne, avec une fonc-
tion de pondération normalisée et positive ρ (λ1 , λ2 ), d’une fonction qui est
comprise entre −2 et +2 ; nous avons donc :
−2 ≤ M ≤ +2 (IV-32)
qui n’est autre que l’inégalité BCHSH pour des processus stochastiques.
. Discussion
Trois classes de théories non déterministes jouent un rôle dans ces consi-
dérations :
Le temps peut dans certains cas jouer le rôle des paramètres de mesure
dans les inégalités BCHSH. Pour les systèmes macroscopiques, Leggett et
Garg [176, 177] ont démontré l’existence d’inégalités de type BCHSH pour
les valeurs à des instants différents d’une même grandeur physique macrosco-
pique. Dans le même esprit que le raisonnement EPR, ils commencent par
énoncer deux postulats :
(i) réalisme macroscopique : un système macroscopique ayant accès à
deux (ou plus) états quantiques macroscopiquement distincts est toujours
dans l’un de ces états (il n’est jamais dans une superposition cohérente de
ces états).
(ii) possibilité de mesures non invasives au niveau macroscopique : il est en
principe possible de déterminer l’état d’un système physique en lui imposant
une perturbation arbitrairement faible sur son évolution future.
Ces hypothèses permettent d’obtenir toute une série d’inégalités mettant
en jeu des moyennes de produits de résultats de mesures réalisées à des ins-
tants différents. Considérons par exemple un système macroscopique ayant
accès à deux états macroscopiquement distincts |Φ1 et |Φ2 . A quatre ins-
tants différents ti (i = 1, 2, 3, 4) nous associons un nombre Ai = ±1, égal à
+1 si le système est dans l’état |Φ1 , et égal à −1 si les système est dans l’état
|Φ2 . Pour chaque évolution du système (chaque réalisation de l’expérience),
les quatre nombres Ai possèdent des valeurs bien définies. Le raisonnement
du § A-2 montre alors que la combinaison de nombres :
est toujours égale à ±2. Si l’expérience est répétée un grand nombre de fois,
et si l’on prend la valeur moyenne Ai Aj des différents termes, on obtient
nécessairement :
N = A1 A2 + A2 A3 − A1 A3 = A1 (A2 − A3 ) + A2 A3 (IV-35)
Pourvu que le réalisme local soit admis (plus précisément les hypothèses
du § A-4), le théorème de Bell est très général ; il est donc particulièrement
difficile de construire une théorie raisonnable qui viole les inégalités, plus dif-
ficile en fait que beaucoup ne le croient. Les auteurs potentiels qui pensent
avoir trouvé une explication simple aux violations devraient réfléchir à deux
fois avant de prendre leur plume et d’envoyer un manuscrit à un journal
scientifique ! Chaque année un nombre important de textes de ce type sont
soumis, avec pour objectif de proposer une “nouvelle” façon d’échapper aux
contraintes du théorème de Bell, et donc d’expliquer simplement pourquoi
les expériences ont donné des résultats qui sont en contradiction avec les in-
égalités. Par exemple, les violations pourraient provenir d’une nouvelle sorte
de statistique, de perturbations créées par les rayons cosmiques, de collisions
gazeuses avec des paramètres fluctuants, des effets aléatoires de la gravité,
etc. L’imagination n’a pas de limites pour invoquer des processus physiques
toujours nouveaux. Mais il reste vrai que nous savons depuis le début que
toutes les tentatives sont vouées à l’échec : si élaborées que soient ces théo-
ries, il n’est pas possible d’obtenir des violations des inégalités dans le cadre
de théories classiques locales.
D’une certaine façon, la situation rappelle les tentatives des siècles passés
pour inventer des mouvements perpétuels : même si certaines de ces inven-
tions étaient extrêmement ingénieuses, à tel point qu’il peut parfois être
difficile de trouver la raison exacte qui leur interdit de fonctionner, il reste
vrai que la loi de conservation de l’énergie nous permet de savoir dès le dé-
part qu’elles ne fonctionnent certainement pas. De même, certains de ces
schémas pour vaincre les contraintes du théorème de Bell sont remarquable-
ment construits, mais nous savons que le théorème est un résultat tout à fait
général de statistique : dans toutes les situations qui entrent dans le cadre
des mathématiques permises par l’utilisation des λ ainsi que des fonctions A
et B (et il y en a beaucoup !), il est impossible d’échapper aux inégalités. En
fait, une violation est une situation extrêmement rare, si rare qu’en pratique
elle n’a jamais été observée que dans des expériences conçues précisément
dans ce but. Si nous voulions construire des automates avec des mécanismes
complexes et des ordinateurs puissants, nous ne pourrions jamais reproduire
tous les résultats de la mécanique quantique sans introduire de communica-
tion entre eux ; il est même possible de calculer la quantité minimale d’in-
112 CHAPITRE IV. LE THÉORÈME DE BELL
formation qu’ils doivent échanger pour réussir cette simulation [198]. Cette
impossibilité ne disparaîtra jamais – du moins tant que des ordinateurs to-
talement différents fonctionnant sur des principes purement quantiques ne
sont pas construits12 .
La seule façon de contourner le théorème de Bell est de renoncer explici-
tement à l’une au moins des hypothèses mentionnées au § A-4 ; nous revenons
au § C-1 sur l’hypothèse du libre arbitre des expérimentateurs.
tales, mais le théorème de Bell montre qu’elles ne sont pas aussi universelles
qu’on aurait pu le penser auparavant. La mécanique quantique nous force à
les adopter “avec un petit grain de sel”. Un autre aspect provient des progrès
incroyables qu’ont effectué les méthodes expérimentales au cours du XXe
siècle, stimulés par la mécanique quantique. On en retire l’impression que
nous pouvons maintenant, ou pourrons bientôt, avoir accès à des objets de
toutes les échelles intermédiaires, passant continûment du macroscopique au
microscopique. En conséquence, alors qu’à l’époque de Bohr on pouvait rai-
sonnablement penser que la définition précise de la frontière entre le monde
macroscopique des appareils de mesure et les objets microscopiques n’était
pas cruciale, voire académique, la question va probablement devenir d’une
importance pratique croissante. Dans le § D-2 du Chapitre III, nous avons
donné un exemple (systèmes macroscopiques dans un état de Fock), mais
probablement bien d’autres possibilités vont apparaître ; on peut l’espérer
qu’elles donnent lieu à des expériences dans les années qui viennent. Tous
ces changements, mis ensemble, donnent l’impression que la forme définitive
de la théorie n’est pas encore nécessairement atteinte et que des révolutions
conceptuelles sont toujours possibles ; mais pour le moment aucun résultat
nouveau précis n’est venu affaiblir l’interprétation standard, au contraire.
Du fait de l’impact conceptuel important du théorème de Bell, de nom-
breux auteurs se sont penchés sur les résultats expérimentaux afin d’en scru-
ter la signification ; dans quelle mesure démontrent-ils réellement que la Na-
ture viole les inégalités, et donc le réalisme local. Bien évidemment, personne
ne nie que l’interprétation de toute expérience ne peut se faire que dans un
cadre où l’on pose un certain nombre d’hypothèses. En fait, les auteurs eux-
mêmes des expériences se sont inquiétés dès le début de l’existence possible
d’explications de leurs résultats en termes de théories réalistes et locales, mais
inconnues. Si c’était possible, cela fournirait une échappatoire au conflit entre
résultats et réalisme local (ce que l’on appelle en anglais “loopholes”). Même
si le consensus général est maintenant que ces échappatoires ont été fermées
l’une après l’autre (en particulier grâce à une remarquable série d’expériences
en 2015 et 2016, cf. § C-1-e), il est toujours intéressant d’examiner leur na-
ture, car cela éclaire le contenu logique du théorème de Bell.
rimentaux d’une façon qui donne l’impression d’un accord parfait avec la
mécanique quantique. Dans cette optique, on pourrait aussi bien remettre en
question tous les résultats expérimentaux de la physique, et les attribuer à des
erreurs dues au hasard et à des fluctuations ! Mais la variété et le nombre des
résultats qui confirment la mécanique quantique avec des appareillages très
divers font que les physiciens ne prennent pas cette explication au sérieux.
On pourrait aussi penser à des scénarios plus compliqués : par exemple,
des variables physiques locales inconnues pourraient se coupler entre elles
pour donner la (fausse) impression de résultats non locaux, alors qu’en réa-
lité elles obéissent à des mécanismes qui restent locaux. En d’autres termes,
ces variables mystérieuses “conspireraient” contre les physiciens afin de les
tromper, et de les conduire à des conclusions erronées. Nous discutons main-
tenant certains de ces scénarios ; pour des revues sur les échappatoires, voir
par exemple [199], [200], ainsi que [201] pour le cas spécifique des expériences
avec des photons.
13
Supposons par exemple que les paires détectées des deux côtés pour les orientations
a et b des analyseurs font partie d’un premier sous-ensemble, celles détectées pour les
orientations a et b d’un second. Si le choix de la première orientation est a, le résultat
observé localement peut alors être écrit, ou bien Aa,b si la paire appartient au premier sous-
ensemble, ou Aa,b si elle appartient au second. Le nombre M est donc la combinaison de
8 nombres différents ±1 au lieu de 4, et l’on ne peut plus démontrer l’existence de la limite
de Bell.
116 CHAPITRE IV. LE THÉORÈME DE BELL
compte en pratique des particules qui peuvent avoir des propriétés qui dé-
pendent de l’autre paramètre de mesure, en un point éloigné ; dans une telle
situation, la localité ne peut plus être exprimée simplement en fonction de a
et b (voir l’Appendice E pour plus de détails). Nous obtenons ainsi un cas où
les inégalités sont violées dans le cadre du réalisme local, seulement à cause
d’un effet de sélection locale.
D’un point de vue expérimental, il n’y a aucune difficulté particulière à
partir d’un ensemble de paires émises qui soit indépendant des paramètres de
mesure, mais il est beaucoup plus difficile de s’assurer que toutes les paires
sont détectées. Or, nous l’avons vu, si certaines paires échappent à la détec-
tion, il est alors envisageable que la statistique des paires détectées diffère de
celle des paires émises ; en toute rigueur, il n’y a alors plus de raison pour que
la limite de Bell soit toujours une conséquence du réalisme local – voir par
exemple le cas étudié par Pearle dans [202] et l’Appendice E. En pratique,
dans la plupart des expériences avec des photons, le rendement de détection
est faible : seule une petite fraction des paires émises sont recueillies par
les détecteurs. Ce qui est mesuré est un nombre de coïncidences pendant un
temps donné, mais le nombre de paires émises pendant ce temps n’est pas ac-
cessible. Bien sûr, en théorie ce nombre dépend de paramètres connus comme
le rendement quantique des détecteurs, les angles de collecte des photons, etc.
et ces paramètres sont en principe indépendants de a et b. Il reste vrai que,
en toute généralité et en l’absence de toute hypothèse théorique, ce nombre
pourrait dépendre de a et b, ce qui ouvre la possibilité d’une échappatoire.
Bien sûr, en pratique cela ne supprime pas l’intérêt des expériences avec
des photons : on peut parfaitement supposer qu’aucun biais n’est introduit
par la sélection des paires, ce qui est après tout une hypothèse très plausible :
par exemple, il n’y a aucune raison pour laquelle les pertes géométriques de
photons devraient dépendre de leur polarisation. Mais cela reste une hypo-
thèse, et donc un point faible de la preuve.
Une situation idéale serait celle où l’on disposerait d’un dispositif avec
un bouton actionné par un expérimentateur, qui puisse déclencher avec cer-
titude l’émission d’une paire de particules qui serait doublement détectée
également avec certitude (avec un rendement de 100 %). Le “loophole” serait
ainsi définitivement refermé. Au cours de certaines discussions, Bell introdui-
sait la notion de “détecteurs préliminaires” [203], des appareils qu’il représen-
tait schématiquement comme des cylindres à travers lesquels toute particule
devait nécessairement se propager avant d’atteindre les deux extrémités de
l’expérience (où se trouvent les mesures dépendant de a et b). Le rôle de ces
détecteurs préliminaires était donc de signaler la présence de paires qui, plus
tard, seraient toujours détectées par les deux appareils de mesure, quel que
soit le choix de a et b. En d’autres termes, ce but était de rendre la défini-
tion de l’ensemble plus précise, même si initialement les paires étaient émises
dans toutes les directions. De tels dispositifs permettant une définition d’un
C. IMPACT DU THÉORÈME DE BELL, ÉCHAPPATOIRES 117
violations des inégalités sans violer le réalisme local, et donner aux physiciens
la fausse impression que ce dernier est mis en défaut ; les conclusions à tirer
des résultats des expériences seraient alors totalement différentes, puisqu’il
s’agirait alors de la mise en évidence de nouvelles interactions, totalement
inconnues jusqu’à présent.
Une façon d’exclure cette possibilité et l’existence de tels processus est
d’utiliser la causalité relativiste. Si les distances entre les deux analyseurs
et entre les analyseurs et la source sont suffisamment grandes, et si les pa-
ramètres de mesure sont choisis au tout dernier moment, alors aucune in-
fluence physique n’a le temps de se propager (à la vitesse maximale de la
lumière) entre les différentes parties de l’expérience. A moins de violer la re-
lativité, ces processus inconnus sont alors exclus, de sorte que l’échappatoire
est donc close. Un premier pas dans cette direction a été fait par Aspect et
al. en 1982 [150]. Mais, les progrès techniques aidant, des expériences plus
récentes [209] ont permis d’effectuer des choix aléatoires extrêmement ra-
pides de a et b, excluant toute possibilité de conspiration des analyseurs, et
refermant ainsi ce “loophole”. Elles ont vérifié que la mécanique quantique
continue à donner des prédictions parfaitement correctes dans ces conditions
plus sévères, et confirmé l’absence d’effet d’interactions inconnues dans les
résultats précédents. Les expériences de 2015 [158–160] ont également fermé
cette échappatoire ; elles sont discutées plus en détail dans le § C-1-e.
Un peu dans le même esprit, on trouve ce que l’on appelle parfois l’échap-
patoire fataliste (“fatalistic loophole” 16 ), ou encore superdéterminisme. L’idée
est de remettre en question une hypothèse implicite dans le raisonnement qui
conduit aux inégalités de Bell : la possibilité pour les expérimentateurs de
faire chacun un choix complètement arbitraire des paramètres de mesure
a et b. D’habitude, on considère effectivement a et b comme des variables
libres : leurs valeurs sont une conséquence, non pas d’un événement prélimi-
naire qui se serait produit dans le passé, mais d’un libre choix effectué par
des êtres humains, éventuellement juste avant la mesure pour éviter mieux
encore toute influence mutuelle possible. Mais il reste vrai que, pour deux
événements quelconques (le choix des paramètres dans notre cas), il existe
toujours un recouvrement dans le cône de passé, éventuellement lointain. Il
est donc toujours possible en théorie de supposer qu’ils partagent une cause
passée commune ; avec ce point de vue, a et b ne sont plus des paramètres
libres, mais des variables qui peuvent fluctuer (en particulier, si la cause elle-
même fluctue) avec toutes sortes de corrélations. Dans une telle éventualité,
16
Ou parfois encore “freedom of choice loophole”.
C. IMPACT DU THÉORÈME DE BELL, ÉCHAPPATOIRES 119
il est facile de voir que la preuve du théorème de Bell n’est plus possible 17 , de
sorte que toute contradiction entre réalisme local et la mécanique quantique
est évitée. L’interprétation de la mécanique quantique par des “automates
cellulaires” de G. ’t Hooft [210] appartient à cette catégorie de théories.
Un tel point de vue remet en question la notion de libre choix des expé-
rimentateurs, dont les décisions sont en fait supposées être prédéterminées
par des événements antérieurs sans qu’ils s’en rendent compte. De façon tout
à fait générale, la notion même de paramètres expérimentaux extérieurs et
arbitraires perd son sens dans un tel cadre logique. Une fois qu’on a accepté
de payer ce prix, on peut en principe construire une théorie qui est à la fois
réaliste, locale, et (super)déterministe, incluant une sorte de théorie physique
de la prise de décision humaine, et qui peut violer les inégalités de Bell – voir
par exemple la Ref. [211]. Il s’agit là, bien évidemment, d’un point de vue peu
répandu, car la notion de paramètres expérimentaux externes arbitraires est
très généralement acceptée en physique ; Bell s’exprime en ces termes [212] :
“une classe de théories fort respectables, incluant la mécanique quantique
telle qu’elle est pratiquée, possèdent des variables ‘externes libres’ en plus
des variables internes qui obéissent à la théorie... Ces variables représentent
les conditions expérimentales. Elles fournissent également un levier d’action
pour des expérimentateurs doués de libre choix... ”.
En pratique, quand de nombreuses valeurs des paramètres expérimentaux
sont choisies aléatoirement dans une expérience, ces valeurs ne sont pas déci-
dées par un être humain mais créées automatiquement par un générateur de
nombres aléatoires. Par exemple, dans l’expérience avec dépendance tempo-
relle mentionnée plus haut [150], un double générateur de nombres aléatoires
était utilisé pour déterminer les valeurs des paramètres expérimentaux aux
deux extrémités du dispositif. Si l’on transpose la problématique du libre
arbitre à cette situation, on arrive à la question : les générateurs de nombres
sont-ils vraiment aléatoires ? Ou fournissent-ils des valeurs qui sont consé-
quences d’une cause commune dans le passé ? Si c’est le cas, ce sont des
fonctions d’une variable λ, et le théorème de Bell ne peut plus s’appliquer.
On peut également imaginer des influences du générateur de nombres aléa-
toires sur la source des particules, qui seraient alors émises dans un état
corrélé avec le type de mesures qu’elles subiraient ensuite ; ceci empêcherait
également la démonstration du théorème. Il n’est alors pas totalement exclu
que les fluctuations de λ arrivent à reproduire les prédictions de la mécanique
quantique, mais à partir d’un mécanisme totalement différent et compatible
avec le réalisme local. Une façon de diminuer la plausibilité de cette explica-
tion est de faire usage d’appareils de mesure très éloignés avec des générateurs
17
Par exemple, dans la preuve qui fait usage d’une densité de probabilité ρ(λ), si l’on
suppose que a et b deviennent deux fonctions a(λ) et b(λ), la comparaison des valeurs
moyennes des résultats pour des valeurs fixées différentes de a and b revient à introduire
des probabilités conditionnelles.
120 CHAPITRE IV. LE THÉORÈME DE BELL
photons, mais elle reste faible. De plus, la transmission des analyseurs est
plus faible que 1 (elle est en réalité inférieure à 1/2 si des filtres polariseurs
ordinaires sont utilisés, mais des expériences ont aussi été réalisées avec des
analyseurs biréfringents à deux canaux [149], qui ne sont pas limités à 50 %).
Enfin, le rendement quantique des détecteurs de particules (par exemple des
photomultiplicateurs pour des photons) n’est pas 100 % non plus, de sorte
que des particules sont également perdues à cette étape. Le résultat final
est que beaucoup d’expériences ne fournissent aucun moyen indépendant de
caractériser le nombre de paires détectées, puisque le processus de détection
dépend évidemment de a et b ; c’est pourquoi les résultats expérimentaux
ne sont interprétables que dans le cadre d’une hypothèse “échantillon non
biaisé”, qui revient à supposer que les paramètres de mesure n’introduisent
aucun biais dans la statistique des événements.
Il ne faut pas en conclure que ces expériences ne sont pas conclusives !
Leurs résultats sont tout aussi convaincants que ceux de la plupart des expé-
riences en physique. Il faut en effet garder à l’esprit qu’il n’existe absolument
aucune raison pour laquelle un tel biais de l’échantillon pourrait se produire.
Les expérimentateurs ne sont pas dans le noir concernant l’efficacité de dé-
tection dans leur expérience. Tout au contraire, ils peuvent la calculer avec
précision à partir des caractéristiques géométriques de leur appareillage, du
rendement quantique des détecteurs, du taux d’excitation de la source, etc.
Tous ces paramètres peuvent être contrôlés avec soin avec ce que prévoit la
théorie. Les taux de détection double sont également comparés avec ceux
de détection simple de particules dans les mêmes conditions expérimentales ;
rien n’interdit aux expérimentateurs de tester d’autres quantités que les va-
riations relatives en fonction de a et b. Le même soin a été apporté à faire
toutes les vérifications possibles que dans d’autres expériences importantes
de physique ; le résultat de tout ce travail est un accord parfait avec toutes
les prédictions de la mécanique quantique. Il serait vraiment extraordinaire
qu’il existe un effet physique mystérieux qui dépende aussi crucialement du
rendement quantique des détecteurs ; pour de faibles rendements, cet effet
mimerait les résultats de la mécanique quantique et tromperait les physi-
ciens ; ce ne serait que pour des rendements quantiques supérieurs que l’effet
se comporterait complètement différemment, cessant de reproduire la méca-
nique quantique afin d’entrer dans les limites de Bell. C’est probablement
la raison pour laquelle la plupart des physiciens restent très sceptiques sur
l’existence d’un tel scénario.
Pour les premières propositions d’expériences réellement sans échappa-
toire18 , voir [216,217] et [218]. Cette dernière référence propose d’utiliser des
18
Une corrélation parfaite entre les clics des deux appareils (quels que soient les résultats)
fournirait un autre schéma d’une expérience sans échappatoire – ceci impliquerait, bien
sûr, que l’on utilise des deux côtés des détecteurs à deux canaux avec un rendement de
100 %. En lui-même, le fait qu’un clic d’un côté est toujour corrélé avec un clic de l’autre,
122 CHAPITRE IV. LE THÉORÈME DE BELL
fonctions mathématiques qu’il est loisible d’utiliser dans des équations, même
si elles sont inconnues – en algèbre, on écrit tout le temps des relations
entre quantités inconnues sans que cela pose le moindre problème. C’est
donc très naturel : comme le remarquent d’Espagnat [234, 235] et Griffiths
[236], “le point de vue contrafactuel semble être une composante nécessaire à
toute version réaliste de la mécanique quantique dans laquelle les propriétés
des systèmes microscopiques ne sont pas créées par la mesure”. On peut
également voir le critère de réalité EPR comme une affirmation de l’existence
d’éléments contrafactuels.
Il reste toutefois vrai que, en pratique, il n’est jamais possible de réaliser
plus d’une expérience parmi les 4 qui sont nécessaires pour obtenir une vio-
lation des inégalités BCHSH : pour une paire donnée, il faut choisir lors de
la mesure une seule orientation des analyseurs, de sorte que les autres orien-
tations resteront pour toujours du domaine des spéculations. Par exemple,
dans le raisonnement du § A-2, au moins la moitié des nombres A, A , B
et B sont nécessairement contrafactuels. On pourrait alors conclure que la
contrafactualité est la notion essentielle à rejeter de la mécanique quantique.
Nous avons déjà cité une phrase écrite par Peres [136], qui résume la situa-
tion de façon magistrale dans le point de vue standard : “des expériences non
réalisées n’ont pas de résultat” ; comme Bell l’a remarqué avec regret [212] :
“il est extrêmement dommage que le monde réel ne nous soit donné qu’en un
seul exemplaire” !
Mais, après tout, on peut également accepter la contrafactualité et main-
tenir un point de vue cohérent, pourvu que l’on accepte une forme plus ou
moins explicite de non-localité. Le théorème de Bell n’est un théorème d’im-
possibilité, ni pour la contrafactualité, ni pour les variables cachées – une
sorte de forme (correcte) du théorème de von Neumann. Après tout, accepter
la non-localité est naturel : pourquoi imposer aux théories contrafactuelles
et/ou à variables supplémentaires d’être explicitement locales à toutes les
étapes, alors qu’on ne donne pas la même contrainte à la mécanique quan-
tique ? De fait, dans cette théorie, ni le postulat de réduction du vecteur
d’état, ni le calcul des corrélations des résultats expérimentaux dans le point
de vue des corrélations (§ A-2 du Chapitre XI), ne correspondent mathé-
matiquement à ces calculs locaux. Nous verrons au § D-2-b du Chapitre V
que, en termes de boîtes logiques, la mécanique quantique ne satisfait pas
les relations associées aux boîtes stochastiques locales. Ainsi, même si l’on
peut discuter à un niveau fondamental si oui ou non la mécanique quantique
est locale, il est parfaitement clair que son formalisme ne l’est pas ; il serait
donc illogique d’imposer un formalisme parfaitement local à une théorie non
standard – tout particulièrement si cette théorie a pour but de reproduire la
mécanique quantique ! Pour illustrer cette remarque, citons Goldstein [18] :
“au cours des dernières années il est devenu courant de rencontrer des phy-
siciens... qui ne se rendent pas compte que ce que Bell a démontré n’est pas
128 CHAPITRE IV. LE THÉORÈME DE BELL
Autres inégalités,
limite de Cirelson,
transmission de signaux
A. Autres inégalités
qui est l’inégalité de Bell de 1964. Nous remarquons au passage que sa dé-
monstration requiert les corrélations parfaites contenues dans (V-2), ce qui
n’est pas le cas des inégalités BCHSH.
La mécanique quantique prévoit des violations de cette inégalité
√ : si nous
choisissons θab = 45◦ et θac = 135◦ , la relation (IV-10) donne 2 pour le
membre de gauche de (V-8) alors√ que le membre de droite est égal à 1, donc
une violation par un facteur 2.
p2 (A = +1, A = −1) = p3 (+1, +1, −1) + p3 (+1, −1, −1) (V-11)
p2 (A = −1, A = +1) = p3 (+1, −1, +1) + p3 (−1, −1, +1) (V-12)
1 θaa
p2 (A = +1, A = −1) = p2 (A = +1, B = +1) = sin2 (V-16)
2 2
θ
2 cos2 ≤1 (V-18)
2
qui est violée4 dans tout l’intervalle −π/2 < θ < +π/2. Ainsi apparaît un
autre cas où les prédictions de la mécanique quantique sont en contradiction
brutale avec celles du réalisme local.
La méthode de comptage des événements associés avec les deux membres
de l’inégalité (V-15) illustre son contenu physique dans le cadre du réalisme
local, en particulier parce qu’elle identifie les événements qui font la différence
entre les deux membres. Elle est bien adaptée à illustrer la validité de telles
inégalités s’appliquant à la vie courante. Dans son ouvrage A la recherche
du réel ([25], p. 27), d’Espagnat formule l’inégalité en écrivant : “Dans une
population quelconque, le nombre de femmes de moins de quarante ans est
inférieur ou égal au nombre de femmes fumeurs augmenté du nombre des
individus âgés de moins de quarante ans et non-fumeurs”. Dans son essai
“Les chaussettes de Bertlmann et la nature de la réalité” [95], Bell utilise
des analogies avec des tests de consommateurs sur la qualité des chaussettes
neuves. Toutefois, d’un point de vue expérimental, une inégalité qui contient
directement des probabilités n’est pas nécessairement le meilleur choix pour
réaliser des comparaisons entre mécanique quantique et réalisme local.
3
Inutile de dire que des inégalités similaires existent pour toutes les probabilités p2 (A =
±1, B = ±1).
4
La fonction sin2 θaa /2 + sin2 θa a /2 − sin2 θaa /2 passe par un minimum −1/4 quand
θaa = θa a = π/3 et θaa = 2π/3.
134 CHAPITRE V. CIRELSON, ÉCHAPPATOIRES
Une autre inégalité a été proposée par Mermin pour la même configu-
ration expérimentale [237], mais avec des angles différents de ceux pris en
compte par Wigner. Dans le § B-2-c du Chapitre III, nous avons mentionné
l’image de Schrödinger destinée à illustrer le raisonnement réaliste local :
il assimile les particules à des élèves passant des examens, les appareils de
mesure à des examinateurs leur posant des questions, et le résultat de la me-
sure à la réponse de l’élève, que l’on suppose binaire (+1 pour oui, −1 pour
non). Prolongeant cette image, supposons que deux élèves nommés Albert
et Bernard se présentent pour être interrogés par deux examinateurs dans
deux pièces séparées ; chaque examinateur tire au sort la question qu’il va
poser parmi trois questions possibles, avec des probabilités 1/3 chacune (ces
trois questions correspondent bien sûr aux trois réglages possibles du para-
mètre de mesure a ou b). Les deux élèves se sont donné pour but de tenter
de reproduire au mieux les prédictions de la mécanique quantique avec leurs
réponses ; ils connaissent à l’avance les trois questions, mais ne savent pas
à laquelle chacun va devoir répondre ; de plus, au moment de l’interroga-
tion, ils ignorent quelle est la question posée à l’autre. Avant l’examen, ils
sont cependant parfaitement libres de mettre au point ensemble une stratégie
commune, et de convenir quelle sera la réponse de chacun à chaque question ;
a priori, le nombre total de stratégies possibles est alors 23 × 23 = 64.
Comme plus haut, afin de reproduire les prédictions quantiques, chaque
fois que les questions posées sont les mêmes, les élèves doivent faire une ré-
ponse opposée. Il leur suffit pour cela de décider à l’avance quelle réponse
donnera l’un d’entre eux à chacune des trois questions, et que l’autre don-
nera la réponse opposée. Ceci ramène alors à 8 le nombre de stratégies pos-
sibles, qui peuvent être notées (A, A , A ) où les trois nombres entre paren-
thèses donnent les réponses d’Albert, égales à ±1. Parmi ces stratégies, deux
sont (+1, +1, +1) et (−1, −1, −1) : les réponses d’Albert sont alors iden-
tiques quelle que soit la question ; pour les 6 autres stratégies (+1, +1, −1),
(+1, −1, −1), etc. deux réponses d’Albert sont du même signe et la troisième
opposée.
Supposons maintenant que l’on répète l’expérience un grand nombre de
fois, les élèves étant d’ailleurs libres s’ils le désirent de changer de stratégie à
chaque fois ; à la fin d’une série de réalisations de l’expérience, on ne retient
que le sous-ensemble des réalisations où les deux questions posées ont été
différentes. Pour chaque cas retenu, deux cas sont possibles :
(i) soit la stratégie choisie par les élèves est l’une parmi les deux où les
trois réponses d’Albert sont toujours identiques, quelle que soit la question ;
comme celles de Bernard sont toujours opposées, les deux réponses four-
nies pas les élèves (résultats de mesure) sont alors nécessairement opposées,
quelles que soient les questions posées de part et d’autre.
A. AUTRES INÉGALITÉS 135
(ii) soit c’est une des six autres stratégies qui a été choisie ; comme les
questions sont tirées au hasard par les examinateurs parmi 3 possibilités
(donc avec des probabilités égales à 1/3), il y a 1 chance sur 3 que le couple de
questions différentes posées dans une réalisation corresponde précisément au
couple de questions pour lesquelles Albert a prévu de faire la même réponse ;
inversement, il y a 2 chances sur 3 pour que les deux questions tombent sur
un cas où Albert a prévu de faire des réponses différentes. Dans le premier
cas, du fait de la stratégie choisie, Albert et Bernard donnent des réponses
opposées, ce qui correspond à une probabilité 1/3 ; dans le second cas, les
deux examinateurs obtiennent des réponses identiques, ce qui correspond à
une probabilité 2/3.
Pour finir, quelles que soient les stratégies choisies, la probabilité d’obtenir
des réponses opposées est comprise entre 1/3 et 1, mais ne peut jamais être
plus faible que 1/3. Ceci donne l’inégalité entre probabilités classiques :
1
P(+1, −1) + P(−1, +1) (V-19)
3
Revenons maintenant au problème quantique de deux spins dans un état
singulet, et supposons que les trois directions a, a et a soient trois directions
coplanaires à 120◦ , les trois directions b, b et b étant les mêmes comme plus
haut. Les formules (IV-4) montrent que la probabilité d’obtenir des résultats
136 CHAPITRE V. CIRELSON, ÉCHAPPATOIRES
opposés est :
1 1 1 1
P(+,−) + P(−,+) = + = (V-20)
2 4 4 4
Comme cette probabilité est inférieure à 1/3, la valeur minimale possible
d’après (V-19), nous obtenons un autre cas où les prédictions de la mécanique
quantique violent des inégalités découlant du réalisme local.
Clauser et Horne [164] ont établi des inégalités, souvent appelées inégali-
tés CH, qui sont particulièrement bien adaptées aux expériences réalisées avec
des photons. Cette forme peut être obtenue sans supposer que les particules
détectées fournissent un échantillon non biaisé de l’ensemble des particules
émises ; ceci permet de refermer l’échappatoire de l’échantillon biaisé (§ C-
1-a du Chapitre IV). De plus, elle fournit une généralisation naturelle des
inégalités de Bell aux théories non déterministes (§ B-2-b du Chapitre IV).
Dans bien des expériences avec des photons, des analyseurs de polarisation
sont placés devant des photomultiplicateurs qui détectent les particules. La
rotation de ces analyseurs permet alors de choisir la polarisation transmise,
et l’angle de rotation détermine le paramètre de mesure, a pour Alice, et
b pour Bob. Si le photon est transmis par l’analyseur, il peut ensuite être
détecté par le photomultiplicateur comme un “clic”, qui est ensuite enregistré
par l’équipement électronique ; si le photon est absorbé par l’analyseur, rien
n’est enregistré. En d’autres termes, au lieu des deux résultats qui pourraient
être observés dans une expérience idéale, un seul résultat est possible dans
ce cas. Pour chaque combinaison des paramètres de mesure a et b, on peut
alors mesurer un taux de coïncidence, qui correspond à l’enregistrement quasi
simultané d’un clic par chacun des photomultiplicateurs.
Pour étudier cette situation, Clauser et Horne (voir aussi la thèse de
Freedman [143]) se placent dans le cadre de ce qu’ils appellent “objective
local theories” (théories locales objectives), c’est-à-dire des théories d’un ca-
ractère très général, déterministes ou non. Dans ce type de théorie, pour
chaque réalisation de l’expérience, l’état de la source peut être décrit par une
variable λ, qui est de nature quelconque et qu’il est inutile de préciser plus
en détail. Lorsqu’Alice choisit la valeur a pour son paramètre de mesure, et
Bob choisit b, la probabilité Pa,b (λ) qu’Alice et Bob obtiennent tous deux
un clic dans leurs photomultiplicateurs respectifs est le produit :
0 ≤ x1 ≤ X ; 0 ≤ x2 ≤ X
0 ≤ y1 ≤ Y ; 0 ≤ y2 ≤ Y (V-23)
U = x1 y1 + x2 y2 + x2 y1 − x1 y2 − Y x2 − Xy1 (V-24)
−XY ≤ U ≤ 0 (V-25)
Pour établir ces inégalités, commençons par supposer que x1 ≥ x2 . Le
coefficient de y2 dans U est alors négatif, de sorte que U est toujours plus
grand que (ou égal à) la valeur obtenue lorsque y2 prend sa valeur minimale
y2 = Y ; nous avons donc :
Pour finir, puisque y1 est positif (ou nul), le membre de droite de cette inéga-
lité est minimal lorsque x2 = 0 (ce qui est compatible avec notre hypothèse
x1 ≥ x2 ) ; donc :
U ≥ −XY (V-28)
138 CHAPITRE V. CIRELSON, ÉCHAPPATOIRES
U ≤ (x1 − X) y1 (V-30)
Comme y1 est positif, le membre de droite est plus petit que la valeur obtenue
lorsque x1 prend sa valeur minimale x1 = X, de sorte que :
Umax ≤ 0 (V-31)
−1 ≤ Pa,b (λ) + Pa ,b (λ) + Pa ,b (λ) − Pa,b (λ) − Pa (λ) − Pb (λ) ≤ 0 (V-33)
A. AUTRES INÉGALITÉS 139
−1 ≤ D2 (a, b) + D2 a , b + D2 a , b − D2 a, b − D1 a − D1 (b) ≤ 0
(V-34)
De façon équivalente, la seconde inégalité peut être écrite sous la forme :
plus, les termes de détection d’un seul photon sont bien plus petits que 1/2.
Dans un tel cas, l’inégalité est satisfaite pour des raisons triviales.
L’inégalité (V-35) est utile dans toutes les expériences où le taux de coïn-
cidences est comparable au taux de détection simple. C’est le cas lorsque les
paires de photons sont obtenues par conversion paramétrique de la lumière
dans un cristal non linéaire, ce qui fournit une source où les directions d’émis-
sion des deux photons sont fortement corrélées. Cette méthode a permis des
expériences conduisant à l’observation de violations particulièrement nettes
des inégalités de Bell, dans des conditions où l’échappatoire de l’échantillon
biaisé (§ C-1-a du Chapitre IV) était fermé [159, 160, 238, 239] (certaines de
ces expériences utilisent des inégalités qui diffèrent des inégalités CH, mais
sont mathématiquement équivalentes).
−D (∞, ∞) ≤ D (a, b) +D a , b + D a , b
− D a, b − D a , ∞ − D (∞, b) ≤ 0 (V-42)
Cette inégalité a été utilisée dans plusieurs expériences, par exemple celles
des Refs. [143, 148, 150].
a a
+1 0 −1 +1 0 −1
+1 * * * * * *
b 0 * * * * * *
−1 * * * * * *
+1 * * * * * *
b 0 * * * * * *
−1 * * * * * *
Lorsque l’expérience est réalisée un très grand nombre de fois, on peut me-
surer la fréquence relative avec laquelle chacune des cases est obtenue et en
déduire une probabilité.
Examinons maintenant comment caractériser les événements d’émission
dans le cadre d’une théorie réaliste locale de cette expérience ; notre but
est de les classer en différentes catégories, comme dans le raisonnement de
Wigner [138] déjà mentionné au § A-3, (iii) du Chapitre IV. Le raisonnement
EPR montre que, lors de l’émission de la particule qui se dirige vers Alice,
la particule emporte des propriétés qui déterminent le résultat parmi les 3
possibles si Alice choisit a, ainsi que le résultat parmi les 3 possibles si Alice
choisit a ; il existe donc 9 catégories de particules qui peuvent atteindre
le laboratoire d’Alice. Il en est évidemment de même pour la particule de
Bob. Pour la paire de particules émise par la source, cela fait 81 catégories
de propriétés possibles5 . Nous ne faisons aucune hypothèse concernant les
probabilités d’apparition de chacune de ces catégories, mais nous supposons
que la source est stable et que ces probabilités ne varient pas : si l’on répète
l’expérience un très grand nombre de fois, la proportion de chacune de ces
catégories tend vers une constante bien déterminée.
5
Pour une théorie non locale, il faudrait prendre en compte le dispositif expérimental
dans son ensemble, qui a 4 configurations possibles ; pour chacune de ces configurations,
9 résultats sont possibles. Les paires émises se diviseraient alors en 94 catégories possibles.
A. AUTRES INÉGALITÉS 143
a a
+1 0 −1 +1 0 −1
+1 * X * X * *
b 0 * * * * * *
−1 * * * * * *
+1 * * * * * *
b 0 * X * X * *
−1 * * * * * *
a a
+1 0 −1 +1 0 −1
+1 T * * x x’ x”
b 0 * * * * * *
−1 * * * * * *
+1 y * *
b 0 y’ * *
−1 y” * *
P ≥ Pa,b (+1, +1) − Pa ,b (0, +1) − Pa ,b (−1, +1) (V-44)
En effet, la probabilité Pa ,b (0, +1) comprend, non seulement celle des ca-
tégories d’émission conduisant aux résultats conjoints a ⇒ 0, b ⇒ +1 et
a ⇒ +1, mais aussi celles pour lesquelles la mesure a fournit les résultats
0 et −1 ; la différence de (V-44) retranche donc un excès de probabilité, de
sorte que le membre de droite est plus petit que P. De même, la probabilité
Pa ,b (−1, +1) retranche un trop grand nombre de catégories d’événements
puisqu’elle ne sélectionne pas la valeur de la mesure a.
A l’échantillon restant, retranchons maintenant les émissions associées à
l’une des cases y ou y’. Il ne reste alors que la probabilité P̃ associée à une
catégorie bien définie d’événements d’émission, celle associée aux 4 points T,
X, Y et Z formant les coins d’un carré dans le tableau suivant :
a a
+1 0 −1 +1 0 −1
+1 T * * X * *
b 0 * * * * * *
−1 * * * * * *
+1 Y * * Z * *
b 0 * * * * * *
−1 * * * * * *
A. AUTRES INÉGALITÉS 145
Cette probabilité P̃ est positive, et le même raisonnement que celui qui vient
d’être fait montre qu’elle obéit à :
P̃ ≥ P − Pa,b (+1, 0) − Pa,b (+1, −1)
≥ Pa,b (+1, +1) − Pa ,b (0, +1) − Pa ,b (−1, +1)
− Pa,b (+1, 0) − Pa,b (+1, −1) (V-45)
Mais, d’autre part, P̃ est majorée par la probabilité associée à l’un quel-
conque des points marqués T, X, Y ou Z sur le tableau précédent ; si nous
choisissons Z, nous obtenons :
Pa ,b (+1, ; +1) ≥ P̃ (V-46)
A-5-c. Généralisation
a a
+1 0 −1 +1 0 −1
+1 Z * * Y * *
b 0 * * * y’ * *
−1 * * * y” * *
+1 X x’ x” T * *
b 0 * * * * * *
−1 * * * * * *
où les événements de détection retranchés sont ici aussi représentés par x’,
x” et y’, y”. L’inégalité correspondante est alors :
Pa,b (+1, +1) ≥
Pa ,b (+1, +1) − Pa,b (0, +1) − Pa,b (−1, +1) − Pa ,b (+1, 0) − Pa ,b (+1, −1)
(V-48)
146 CHAPITRE V. CIRELSON, ÉCHAPPATOIRES
a a
+1 0 −1 +1 0 −1
+1 * * * * * *
b 0 * * * * * *
−1 * * T x’ x” X
+1 * * y’ * * *
b 0 * * y” * * *
−1 * * Y * * Z
conduit à l’inégalité :
Cette fois, ce sont les résultats +1 et −1 qui sont intervertis par rapport à
l’inégalité (V-47).
Ainsi, chacun des 81 rectangles associés aux divers événements d’émission
donne lieu à des inégalités ; toutes ne sont bien sûr pas indépendantes. Nous
allons nous intéresser à deux d’entre elles, (V-47) et (V-49).
AB = Pa,b (+1, +1)+Pa,b (−1, −1)−Pa,b (+1, −1)−Pa,b (−1, +1) (V-50)
soit, compte tenu du fait que la somme des 4 probabilités est égale à 1 :
On obtient de même les 3 autres valeurs moyennes A B, AB et A B ;
pour la première par exemple, il suffit de remplacer au second membre a par
a dans les probabilités du second membre de (V-51).
A. AUTRES INÉGALITÉS 147
1 1 1 1
A B + 1 ≥ [AB + 1]− − A B + 1 − − AB + 1 (V-52)
2 2 2 2
c’est-à-dire, en multipliant par 2 :
A B − AB − A B − AB ≥ −2 (V-53)
et donc :
AB + A B + AB − A B ≤ 2 (V-54)
Nous retrouvons bien ainsi l’une des inégalités BCHSH (cf. note 2).
Pa,b (+1, +1) − Pa,b (+1, 0) − Pa ,b (0, +1) − Pa ,b (+1, +1) ≤ 0 (V-55)
Pour écrire les résultats des expériences en termes d’une variable binaire
(égale à ±1), introduisons les nombres G± définis par :
1 ± AB
G± (A, B) = (V-56)
2
et définissons S comme :
M
S = G+ (A, B) + G+ (A, B ) + G+ (A , B) + G− (A , B ) = 2 + (V-57)
2
où :
M = AB + AB + A B − A B (V-58)
Ce nombre M est en fait très similaire au nombre M défini en (IV-7), la
seule différence étant la position du signe moins qui est ici placé en dernier ;
cependant cette différence disparaît par un simple échange des définitions
de b et b . Donc M et M possèdent les mêmes propriétés et, en termes de
la quantité S définie en (V-57), l’inégalité BCHSH −2 ≤ M ≤ +2 devient
1 ≤ S ≤ 3. En conséquence, dans le cadre du réalisme local, la valeur moyenne
S de S obéit à la relation :
1 ≤ S ≤ 3 (V-59)
√ √
M peut atteindre la valeur 2 2 , et donc S la valeur 2 + 2 = 3.141 qui
est supérieure à 3.
Ce calcul peut servir de base à l’introduction d’un jeu pour Alice et
Bob, appelé par Gisin le “jeu de Bell” [170]. Les deux joueurs sont placés
dans deux pièces différentes, avec aucune communication possible entre eux ;
toutefois, avant que ne commence le jeu, ils peuvent décider ensemble d’une
stratégie commune pour essayer de gagner (c’est un jeu collaboratif). Dès
que l’expérience commence, toutes les dix secondes (par exemple) une lampe
s’allume dans chacune de leurs pièces, aléatoirement verte ou rouge. Dans
chaque pièce, la couleur est déterminée indépendamment par un générateur
de nombres aléatoires local (ou par le libre choix d’un auxiliaire local du jeu
attaché à la pièce en question) ; ni Alice ni Bob ne peuvent influencer ces
choix, qui sont complètement incorrélés entre les deux pièces. Dès qu’Alice
et Bob voient la couleur, chacun d’entre eux presse à sa guise, soit un bouton
“oui”, soit un bouton “non”. La règle du jeu est la suivante : pour chaque
événement où au moins une des deux couleurs est verte, Alice et Bob reçoivent
un point si leurs réponses sont les mêmes, aucun sinon ; pour tout événement
où les deux couleurs sont rouges, ils reçoivent un point si leurs réponses sont
opposées, aucun sinon.
Un ordinateur enregistre tous les événements, les couleurs des lampes et
les choix faits ensuite par Alice et Bob. Dans un premier temps, l’ordinateur
prend uniquement en compte tous les événements où deux lampes vertes se
sont allumées, et calcule le nombre moyen de fois où Alice et Bob ont reçu un
point (il divise le nombre de fois où un point a été obtenu par le nombre total
d’événements vert-vert). Puis il effectue le même calcul pour les trois autres
sortes d’événements (vert-rouge, rouge-vert, et rouge-rouge). Enfin il ajoute
les 4 moyennes pour obtenir le score final S. Si le score final est supérieur à
3, Alice et Bob ont gagné le jeu, sinon ils ont perdu.
Si Alice et Bob pressent les boutons au hasard, leurs chances de recueillir
un point sont une sur deux, et la somme S prend nécessairement une valeur
proche de 2 ; ils perdent le jeu. Peuvent-ils alors utiliser une stratégie moins
élémentaire pour gagner ? En fait, s’ils ne font pas usage de la physique quan-
tique, cela leur est impossible 6 . Ils peuvent établir une stratégie commune, et
décider à l’avance ce qu’Alice fera pour chaque événement dans les deux cas,
lampe verte ou rouge, et de même pour Bob. Chacun d’entre eux peut même
emporter un tableau contenant, par exemple 1000 lignes correspondant aux
1000 premiers événements et contenant les choix (“oui” ou “non”) à faire dans
les deux cas possibles (vert et rouge). Mais cela revient à définir une fonction
A(a, λ) pour Alice, B(b, λ) pour Bob ; les valeurs de ces fonctions peuvent
alors être reportées dans l’expression (V-57). Or cette expression correspond
6
Sauf bien sûr très rarement, en profitant par pur hasard d’une fluctuation aléatoire,
ce qui devient d’autant plus improbable que le nombre d’événements est grand.
150 CHAPITRE V. CIRELSON, ÉCHAPPATOIRES
B. Théorème de Cirelson
Une raison qui pousse en ce sens est que chacune des 4 valeurs moyennes
AB, A B, etc. qui apparaissent dans Q est comprise entre −1 et +1 ;
si ces moyennes étaient des variables indépendantes, la valeur maximale√ ac-
cessible mathématiquement à Q serait 4, donc nettement plus que 2 2.
On peut donc légitimement se demander s’il existe de √ meilleures situations
quantiques, avec des violations bien plus grandes que 2 2.
Dans le cadre de la mécanique quantique, le théorème de Cirelson [240,
241] montre que, avec un système composé de deux sous-systèmes
√ physiques,
il est en fait impossible de dépasser cette borne de 2 2, quelle que soit la
série de mesures envisagée sur les sous-systèmes et l’état initial du système
total. Cette limitation provient de la structure même de tout espace des états
qui est le produit tensoriel de deux espaces de dimension deux chacun.
La valeur moyenne quantique Q qui généralise (IV-11) est alors égale à
Ψ| Q |Ψ, où |Ψ est un état normé quelconque du système à deux particules,
et où l’opérateur Q est donné par :
Q = [σa (1)] [σb (2)]−[σa (1)] [σb (2)]+[σa (1)] [σb (2)]+[σa (1)] [σb (2)] (V-64)
√
Notre but est de montrer que cette valeur moyenne ne peut dépasser 2 2
en module, quels que soient |Ψ et le choix des 4 vecteurs a, b, a et b .
Pour cela, nous prenons le carré de cet opérateur, qui comprend alors
trois sortes de termes : ceux contenant les carrés des quatre opérateurs appa-
raissant dans (V-64), les termes croisés où l’un des opérateurs entre crochets
se répète, et enfin ceux où tous les opérateurs σ sont différents. Puisque les
les premiers termes donnent :
carrés des matrices de Pauli valent I,
4 × I (V-65)
qui s’annule puisque les carrés de toutes les composantes de σ valent I (§ A-7
du Chapitre XII). Il reste les termes croisés contenant 4 opérateurs σ diffé-
rents, qui s’écrivent :
(a · σ) , a · σ = 2i a × a · σ
B. THÉORÈME DE CIRELSON 153
pour obtenir :
Q2 = 4 × I − 4 a×a · σ(1) b×b · σ(2) (V-70)
Les valeurs propres de l’opérateur (a×a ) · σ(1) sont ± |a×a |, qui sont
en général inférieures en module à 1 puisque la longueur du vecteur a×a ne
peut dépasser 1 ; de même, l’opérateur (b×b ) σ(2) a des valeurs propres qui
sont en module égales ou inférieures à 1. Il s’ensuit que la valeur moyenne du
produit de ces opérateurs (qui commutent) ne peut dépasser 1 en module,
de sorte que :
2
Q = Ψ| Q2 |Ψ ≤ 4 + 4 × 1 = 8 (V-71)
Remarques :
(i) La démonstration de √ cette inégalité permet de prévoir les conditions
dans lesquelles la borne ±2 2 est accessible, c’est-à-dire quand (V-71) et
(V-72) deviennent des égalités. Une première condition est que les deux opé-
rateurs entre crochets au membre de droite de (V-70) doivent avoir des va-
leurs propres de module unité ; il faut alors que les vecteurs a×a et b×b
soient de module unité, ce qui nécessite que a et a soient orthogonaux, ainsi
que b et b . Une seconde condition est que l’état |Ψ doit être un vecteur
propre de valeur propre −1 du produit de la composante du premier spin se-
lon l’axe a×a par la composante du second spin selon l’axe b×b ce qui, dans
la configuration coplanaire des 4 vecteurs, correspond à des composantes se-
lon le même axe qu’on peut appeler Oz. Un état singulet est effectivement
un tel vecteur propre de σz (1)σz (2) – comme l’est d’ailleurs un état triplet de
composante du spin total selon Oz nulle, dont on peut vérifier qu’elle donne
lieu à la même violation que l’état singulet.
(ii) Nous verrons au § B du Chapitre VI un cas où, en s’affranchissant des
hypothèses de Cirelson par l’introduction de trois sous-systèmes physiques,
√
la mécanique quantique conduit à une valeur de |Q| qui dépasse 2 2, et
atteint la limite mathématique 4.
7
Cette inégalité est une inégalité de Schwarz, obtenue en écrivant que la valeur moyenne
de [Q − Q]2 est positive ; elle apparaît dans la définition du carré de l’écart quadratique
moyen ΔQ.
154 CHAPITRE V. CIRELSON, ÉCHAPPATOIRES
Dans ce qui suit, nous nous limiterons à deux valeurs possibles a, a pour
le premier paramètre expérimental, deux valeurs b, b pour le second, ce qui
revient à prendre en compte quatre dispositifs expérimentaux pour l’ensemble
de l’expérience. Nous avons ainsi 16 probabilités soumises à 4 relations de
somme du type (V-73) ; il reste donc 12 paramètres libres pour le modèle le
plus général entrant dans ce cadre.
Lorsque l’expérience est répétée, Bob n’ayant pas accès aux résultats
d’Alice, la seule chose qu’il puisse mesurer est la fréquence d’occurrence de
D. NON-TRANSMISSION INSTANTANÉE DE SIGNAUX 159
Figure V.2 – La figure de gauche schématise une boîte logique qui, à partir
des valeurs ±1 des variables d’entrée a et b, fournit des variables de sortie
A = ±1 et B = ±1. Pour une boîte déterministe, A et B sont des fonctions
données de a et b ; pour une boîte stochastique, A et B sont données par des
distributions de probabilités dépendant de a et b.
La figure de droite illustre comment une boîte logique stochastique peut être
caractérisée par un point appartenant à un polytope dans l’espace des proba-
bilités Pi (a, b) (j = 1,...,4) ; en fait, pour une valeur donnée du couple (a, b),
comme la somme des probabilités vaut 1, il suffit de porter les trois premières
probabilités sur trois axes ; le point caractérisant la boîte appartient à un té-
traèdre de côté unité. Comme cependant quatre valeurs sont possibles pour le
couple de variables d’entrée, le polytope caractérisant la boîte est le produit de
quatre tétraèdres. Les boîtes déterministes sont caracterisées par des points
se trouvant sur les coins des tétrahèdres.
Une sous-catégorie des boîtes précédentes est donnée par les boîtes sto-
chastiques locales, ayant la propriété de “outcome independence” 8 . Les plus
simples sont celles où la probabilité se factorise en deux probabilités :
P(A, B|a, b) = p(A|a) × p(B|b) (V-77)
où p(A|a) et p(B|b) sont deux probabilités locales comprises entre 0 et 1
satisfaisant les deux conditions séparées de normalisation :
p(A|a) = 1 q(B|b) = 1 (V-78)
A B
8
Comme nous l’avons vu dans le § B-2-b du Chapitre IV, le théorème des proba-
bilités conditionnelles (théorème de Bayes) indique que l’on a toujours : P(A, B|a, b) =
p(A|a, b)×p(B|A, a, b), où p(B|A, a, b) est la probabilité conditionnelle d’obtenir B si la va-
leur A a été obtenue. L’hypothèse de “setting independence” permet de remplacer p(A|a, b)
par p(A|a) ainsi que p(B|A, a, b) par p(B|A, b). L’hypothèse de “outcome independence”
revient à supposer que cette dernière probabilité conditionnelle est indépendante du résul-
tat (outcome) A, et donc d’obtenir (V-77). Les mêmes hypothèses s’appliquent lorsqu’il
faut prendre en compte la variable fluctuante λ et permettent d’arriver à (V-80).
162 CHAPITRE V. CIRELSON, ÉCHAPPATOIRES
On suppose alors que, si λ est fixé (ce peut être un paramètre multi-dimen-
sionnel), les conditions de fonctionnement de la boîte sont suffisamment bien
définies pour qu’un argument de localité permette d’écrire une factorisation :
qui est bien indépendant de a (la démonstration est semblable pour la som-
mation sur B).
La mécanique quantique satisfait les relations (V-75) et (V-76), et per-
met donc de construire des boîtes NS. Puisqu’elle permet des violations du
théorème de Bell, lorsque c’est le cas elles n’appartiennent pas à la catégorie
des boîtes stochastiques locales.
Le calcul est très simple du fait que nous avons choisi des probabilités pour
que le produit AB ait toujours la valeur +1 pour les trois couples de valeurs
(a, b), (a , b) et (a , b ) des paramètres de mesure, alors que selon les relations
(V-85) ce produit a toujours la valeur −1 pour (a, b ). Par suite :
M = 4 (V-87)
11
Alice et Bob désirent calculer une fonction booléenne F (a, b) de la variable a, choisie
par Alice et connue d’elle seule, et de la variable b choisie par Bob et connue de lui seul.
La “communication complexity” de F est dite triviale si l’opération est réalisée par la
transmission d’un seul bit classique de communication.
166 CHAPITRE V. CIRELSON, ÉCHAPPATOIRES
Autres théorèmes
Pendant de nombreuses années, chacun pensait que Bell avait à peu près
épuisé le sujet en considérant toutes les situations les plus intéressantes, et
que les systèmes à deux spins fournissaient les violations quantiques les plus
spectaculaires du réalisme local. Ce fut donc une grande surprise quand en
1989 Greenberger, Horne et Zeilinger (GHZ) montrèrent que des systèmes
contenant plus de deux particules corrélées pouvaient présenter des violations
encore plus spectaculaires du réalisme local [250, 251], mettant en jeu une
contradiction de signe (violation de 100 %) pour des corrélations parfaites
(au lieu d’inégalités violées de 40 % pour des corrélations imparfaites). Nous
considérons ici des systèmes à trois particules, mais des généralisations à
N particules sont possibles et seront discutées au § A-3.
A-1-a. Démonstration
η = ±1 (VI-2)
Calculons maintenant les probabilités quantiques des résultats que l’on peut
obtenir en effectuant des mesures des composantes des spins σ1,2,3 des trois
particules, soit le long de la direction Ox, soit de la direction perpendiculaire
Oy (Fig. VI.1). Nous commençons par considérer une mesure du produit
σ1y × σ2y × σ3x ; un calcul simple (explicité au § A-3 dans le cas plus général
d’un nombre quelconque de particules1 ) montre alors que | Ψ > est un vecteur
propre de ce produit d’opérateurs avec la valeur propre −η, qui donne le seul
résultat possible avec l’état (VI-1). La probabilité correspondante est donc :
tandis que la probabilité P(σ1y ×σ2y ×σ3x =⇒ +η) de l’autre résultat possible
est nulle. De même, nous trouvons que | Ψ > est un vecteur propre des deux
produits d’opérateurs σ1x × σ2y × σ3y et σ1y × σ2x × σ3y , avec les valeurs
propres −η, de sorte que les probabilités correspondantes sont :
Les trois produits prennent donc la valeur −η, et les résultats sont connus
avec certitude avant la mesure2 . Maintenant, si nous considérons le produit
des composantes des trois spins le long de l’axe Ox, il est également facile
de voir (§ A-3) que le même vecteur d’état est également un état propre de
1
Avec les notations de ce paragraphe, ici nous avons η = eiξ , ϕ1 = ϕ2 = π/2 et ϕ3 = 0,
de sorte que ζ = ei(ξ−ϕ1 −ϕ2 −ϕ3 ) = −η donne la valeur propre. De façon similaire, pour
une mesure du produit σ1x × σ2x × σ3x , nous avons ζ = eiξ = η, et la valeur propre est
+η.
2
Le produit est fixé, mais chacune des composantes individuelles peut fluctuer entre les
résultats +1 et −1.
A. PROPRIÉTÉS QUANTIQUES DES ÉTATS GHZ 169
Figure VI.1 – Schéma d’une expérience GHZ, où trois spins dans l’état
quantique (VI-1) subissent des mesures en trois régions différentes de l’espace
où se trouvent des appareils de mesure. Chacun d’entre eux est muni d’un
bouton permettant à l’expérimentateur local de choisir entre deux positions ;
ces dernières correspondent à la mesure du spin, soit le long de Ox, soit le
long de Oy. Dans tous les cas, les résultats fournis par les trois appareils sont
A = ±1, B = ±1 et C = ±1.
l’opérateur produit σ1x × σ2x × σ3x , mais avec la valeur propre +η, de sorte
que :
P(σ1x × σ2x × σ3x =⇒ +η) = 1 (VI-5)
A-1-b. Discussion
où |ϕa,b,c sont trois états orbitaux dont les fonctions d’onde ne se recouvrent
pas. Ces fonctions peuvent par exemple être entièrement localisées dans des
boîtes séparées, où sont effectuées les mesures, de sorte qu’aucune particule
n’échappe à la mesure et que chacune d’entre elles est interrogée séparément.
La procédure est, après avoir choisi une composante, Ox ou Oy pour chaque
spin, de réaliser les trois expériences correspondantes, d’obtenir les trois ré-
sultats Ax,y , Bx,y et Cx,y , et ensuite de calculer leur produit. Le moyennage
sur de nombreuses réalisations permet d’obtenir la moyenne Ax,y Bx,y Cx,y .
On commence par mesurer Ay By Cx , Ax By Cy et Ay Bx Cy pour vérifier
que les corrélations parfaites prédites par la mécanique quantique sont bien
observées, à partir de quoi le résultat EPR permet de déduire l’existence
de 6 éléments de réalité séparés. Alors on mesure Ax Bx Cx et, si la mé-
canique quantique continue à donner des prédictions correctes, on obtient
le signe opposé ; la conclusion est alors que le réalisme local est violé. Ou,
de façon équivalente, on peut conclure que la valeur obtenue en mesurant,
par exemple, σ1x dépend de la composante Ox ou Oy qui est mesurée pour
les autres spins, même si les opérateurs correspondants commutent avec σ1x .
On arrive alors à la notion de “contextualité quantique”, que nous discuterons
plus en détail au § D.
(ii) Un point de vue différent est de considérer qu’il a été possible d’in-
venter une procédure expérimentale pour mesurer directement le produit de
trois opérateurs, sans obtenir d’information concernant les valeurs séparées
des trois facteurs dans le produit. Alors les quatre opérateurs en jeu com-
mutent tous les uns avec les autres3 , ce qui introduit une différence concep-
tuelle importante avec les violations habituelles des inégalités de Bell, où
la non-commutation est essentielle. Ici, au moins en principe, rien ne s’op-
pose à ce que l’on puisse mesurer les quatre observables avec un appareillage
unique ; Bohr n’aurait pas pu invoquer des mesures incompatibles. Dans de
telles conditions, où est alors la contradiction entre le raisonnement réaliste
local et la mécanique quantique ? Alors que, dans le cadre du réalisme local,
une mesure du produit de trois opérateurs est équivalente à des mesures sépa-
rées de chacun des facteurs, ce n’est pas le cas en mécanique quantique. Il est
en principe possible d’imaginer un appareillage unique qui mesure les quatre
produits, mais impossible d’en concevoir un qui mesure à la fois les six fac-
teurs Ax,y , Bx,y et Cx,y (puisque, par exemple, Ax et Ay sont associés à deux
mesures incompatibles). Ceci donne effectivement accès à quatre résultats,
mais il est impossible de trouver six valeurs des composantes individuelles
3
Prenons deux quelconques de ces produits. Pour un spin, ils contiennent la même com-
posante, mais des composantes différentes pour les deux autres. Or changer l’ordre de deux
matrice de Pauli (§ A-7 du Chapitre XII) introduit un signe moins, puisqu’elles anticom-
mutent. Comme ici deux ordres doivent être changés, deux signes moins se compensent,
et les produits de trois opérateurs commutent.
172 CHAPITRE VI. AUTRES THÉORÈMES
M = σ1x σ2x σ3x − σ1y σ2y σ3x − σ1x σ2y σ3y − σ1y σ2x σ3y (VI-9)
de valeur propre 4η. Donc la valeur moyenne de M dans l’état (VI-1) est :
M = 4η (VI-10)
avec :
η = ±1 (VI-11)
4
On ne pourrait plus supposer que des dispositifs expérimentaux différents sélectionnent
des groupes de particules différents, puisqu’un seul dispositif serait utilisé.
A. PROPRIÉTÉS QUANTIQUES DES ÉTATS GHZ 173
M = Ax Bx Cx − Ay By Cx − Ax By Cy − Ay Bx Cy
= Ax (Bx Cx − By Cy ) − Ay (By Cx + Bx Cy ) (VI-12)
1
Bx Cx = = By Cy (VI-13)
By C y
−2 ≤ M ≤ +2 (VI-14)
1
By Cx = − = −Bx Cy (VI-15)
Bx C y
1
|Ψ = √ |+, +, ..., + + eiξ |−, −, ..., − (VI-16)
2
où ξ est un paramètre réel définissant la phase relative des deux composantes
de l’état ; |Ψ est une superposition cohérente de deux états à N particules
où toutes, ou alors aucune, sont dans l’état individuel 5 |+. Ceci explique le
nom de “états par tout ou rien” que nous utilisons ici6 , mais utiliser les mots
“état GHZ multi-particules” serait tout aussi approprié. On trouve également
parfois les mots “états d’intrication maximale”, ou encore “états NOON” dans
la littérature7 .
L’état que nous considérons est donc réellement très spécial, puisqu’il est
une superposition de deux états à N particules où toutes sont dans des états
individuels orthogonaux. Un tel état ne doit pas être confondu avec un état
différent où chaque particule se trouve placée dans la même superposition
cohérente de deux états. Par exemple, si nous préparons N spins 1/2 en leur
faisant traverser un filtre de polarisation (lame séparatrice dépendante du
spin, analyseur de Stern et Gerlach, etc.) qui crée une superposition cohérente
α |+ + β |− pour chaque spin, nous obtenons un état très différent. L’effet
du filtre sur le groupe de N particules est de les mettre dans un état qui est
un produit d’états cohérents à une particule, à savoir :
Ψ = α |1 : + + β |1 : − ⊗ α |2 : + + β |2 : − ⊗
(VI-17)
⊗... ⊗ α |N : + + β |N : −
Or un tel état contient des composantes variées où certains spins sont vers le
haut, d’autres vers le bas, en des proportions variées. Dans (VI-17), en fait
chaque particule est dans le même état de spin, une situation qui n’est pas
sans rappeler un condensat de Bose-Einstein où toutes les particules seraient
dans un même état cohérent – par exemple un condensat se trouvant à la fois
des deux côtés d’une barrière de potentiel du fait de l’effet tunnel, comme
dans l’effet Josephson. C’est très différent de l’état (VI-16) où la cohérence
5
Des états par tout ou rien ne demandent pas nécessairement que tous les spins soient
dans l’état vers le haut dans la première composante, et vers le bas dans la seconde. Ce
qui est important est que chaque spin aille vers un état quantique individuel orthogonal
lorsqu’on passe d’une composante à N particules de |Ψ à l’autre (en d’autres termes, l’axe
de quantification peut varier d’un spin au suivant).
6
En toute rigueur, nous devrions parler d’état “par tout et rien”, puisque les deux
possibilités sont simultanément présentes dans |Ψ.
7
Ces états peuvent être écrits comme la superposition d’états notés N, 0 et 0, N , d’où
le nom.
A. PROPRIÉTÉS QUANTIQUES DES ÉTATS GHZ 175
N
1
Q(ϕ1 , ϕ2 , ..., ϕN ) = e−iϕj σ+ (j) + eiϕj σ− (j) (VI-21)
2
j=1
Compte tenu de (VI-19), il est facile d’obtenir l’action de cet opérateur sur
l’état (VI-16). Si l’on commence par la première composante de | Ψ >, la
seule façon de ne pas obtenir zéro par application de l’opérateur (VI-21) est
de sélectionner le terme en eiϕj σ− (j) dans chaque facteur du produit sur j ;
ainsi :
Q(ϕ1 , ϕ2 , ..., ϕN ) |+, +, ..., + = ei(ϕ1 +ϕ2 +...+ϕN ) |−, −, ..., − (VI-22)
De même :
Q(ϕ1 , ϕ2 , ..., ϕN ) |−, −, ..., − = e−i(ϕ1 +ϕ2 +...+ϕN ) |+, +, ..., + (VI-23)
nous obtenons :
1 1
Q(ϕ1 , ϕ2 , ..., ϕN ) |Ψ = √ ζ |+, +, ..., + + eiξ |−, −, ..., − (VI-25)
2 ζ
Si la condition :
1
ζ= = ±1 (VI-26)
ζ
est satisfaite, l’action de Q sur |Ψ reconstruit exactement ζ |Ψ ; le ket |Ψ
est donc un état propre de Q avec la valeur propre ζ. En d’autres termes,
176 CHAPITRE VI. AUTRES THÉORÈMES
pourvu que la somme de tous les angles ϕj soit égale à ξ (plus un multiple
entier de π), le produit de tous les opérateurs σj (ϕj ) correspond à une mesure
dont le résultat est certain et vaut ζ 8 .
A partir de (VI-25) et (VI-24), nous pouvons calculer la moyenne quan-
tique de Q, et obtenir pour des valeurs quelconques des angles :
Par exemple si tous les angles ϕj sont égaux à une même valeur ϕ, cette
formule prédit que la moyenne de Q oscille rapidement en fonction de ϕ si
N est grand. Or, quelle que soit la valeur de N , il se trouve alors qu’il est
totalement impossible de reproduire les oscillations contenues dans (VI-27)
au sein du réalisme local [267]. Dans le cas N = 2, ceci n’est bien sûr que le
théorème de Bell habituel. Mais, dès que N devient égal à 3 ou prend une
valeur plus grande, la contradiction devient encore plus nette. Dans [267], on
suppose qu’une théorie probabiliste locale reproduit (VI-27) seulement pour
un certain nombre de valeurs particulières des angles ϕ (ceux pour lesquels le
résultat est certain). On peut ainsi montrer que la théorie en question prédit
que Q est indépendant de tous les ϕ : la moyenne reste alors strictement
constante à la valeur +1 ! De fait, l’existence même de l’oscillation prédite
par (VI-27) est un pur effet quantique non local.
Comme nous l’avons déjà remarqué, il s’agit d’un effet de cohérence à
N particules : il faut mesurer des composantes de tous les spins pour obtenir
des effets physiques intéressants. Si un seul spin est ignoré par la mesure, dans
(VI-21) le nombre d’opérateurs de spin n’est plus suffisant pour transformer
le ket |+, +, ..., + en |−, −, ..., − comme c’était le cas dans (VI-22), et le
résultat devient complètement indépendant de la phase relative eiξ des deux
composantes. Aucun effet de cohérence quantique ne se produit plus. En
fait, il est facile de voir que la valeur moyenne de tous les produits de N − 1,
N − 2, etc., composantes des spins est nulle ; l’effet d’interférence quantique
qui conduit à (VI-27) ne se produit que si tous les N spins sont mesurés.
Ce n’est pas la seule propriété remarquable des états “par tout ou rien”.
Par exemple on peut montrer que, pour de grandes valeurs de N , ces états
conduisent à des violations exponentielles des limites imposées par le réalisme
local [259]. Dans le cadre de l’étude générale du rôle des corrélations dans
8
Dans le § A, nous avons supposé que N = 3, α = π ; dans (VI-3) et (VI-4), nous avons
pris la somme des trois angles de mesure égale à π, de sorte que la valeur propre était
+1 comme attendu ; mais dans (VI-5) les angles sont tels que la somme des ϕ est 0, et
effectivement nous avons trouvé que la valeur propre était −1. Les résultats obtenus ici
sont donc une généralisation directe de ceux du § A à un nombre arbitraire de particules.
Par exemple, si N = 7 et α = π, on trouve que le produit de 6 composantes de spin
le long de Oy par une le long de Ox possède la valeur propre +1, alors que le produit
de toutes les composantes le long de Ox a la valeur propre −1, en contradiction avec la
prédiction du réalisme local.
B. INÉGALITÉ DE CABELLO 177
B. Inégalité de Cabello
1
|Ψ = √ |ϕa (1) |ϕb (2) |ϕc (3) ⊗ |1 : +, 2 : +, 3 : + + |1 : −, 2 : −, 3 : −
2
(VI-28)
où |ϕa,b,c sont trois états orbitaux localisés dans trois régions différentes de
l’espace A, B, et C où les trois opérateurs Alice, Bob et Carole effectuent des
mesures.
Supposons par exemple qu’une mesure des trois composantes selon Ox
des spins soit effectuée. Nous avons vu au § A que les produits des trois
résultats valent toujours η = +1 ; il en découle que, soit deux résultats valent
−1 et un +1, soit les trois valent +1. Nous pouvons alors numéroter les spins :
si deux résultats −1 sont obtenus, nous appelons i et j les régions de l’espace
où se trouvent les spins correspondants, et leur attribuons ce même numéro
(i étant attribué à la première région dans l’ordre alphabétique A, B, C), et
k la région où le résultat +1 a été obtenu. Si les trois résultats sont égaux10
à +1, i = A, j = B et k = C. Dans tous les cas nous avons :
σx (i)σx (j) = 1 (VI-29)
qui est bien une relation portant sur deux spins seulement.
X Y + mY + nX Y − mY (VI-30)
avec :
m = ±1 ; n = ±1 (VI-31)
L’expression (VI-30) est toujours égale à ±2 lorsque les 4 nombres qui y
apparaissent sont égaux à ±1. Ici nous introduisons la combinaison suivante
des 9 nombres :
Xi (Xj + mYj ) + nYi (Xj − mYj ) (VI-32)
qui, elle aussi, est toujours égale à ±2 ; en effet, ou bien (Xj + mYj ), ou bien
(Xj − mYj ) est nul, et tous les nombres ont un module 1. Comme Yk = ±1,
on peut choisir m = n = −Yk , et cette expression devient :
Xi (Xj − Yk Yj ) − Yi Yk (Xj + Yk Yj ) (VI-33)
ce qui donne :
Xi Xj − Xi Yk Yj − Yi Xj Yk − Yi Yj = ±2 (VI-34)
Mais, puisque par définition de l’indice k nous avons Xk = 1, l’équation
(VI-34) peut encore s’écrire :
Xi Xj Xk − Xi Yj Yk − Yi Xj Yk − Yi Yj Xk = ±2 (VI-35)
Ainsi, dans le cadre du réalisme local, le produit de trois mesures selon
Ox moins la somme des trois produits de deux composantes selon Oy et
d’une selon Ox est toujours égal à ±2. Lorsque l’on prend la valeur moyenne
sur un grand nombre de réalisations, il vient donc :
−2 ≤ Xi Xj Xk − Xi Yj Yk − Yi Xj Yk − Yi Yj Xk ≤ +2 (VI-36)
La valeur moyenne du produit de trois X différents moins les trois combinai-
sons différentes de deux Y et de un X est toujours comprise entre ±2.
180 CHAPITRE VI. AUTRES THÉORÈMES
Mais nous avons vu plus haut (§ A) que le premier terme vaut +1, alors que
tous les autres valent −1. Il s’ensuit que la mécanique quantique prédit pour
cette quantité une valeur +4, en forte violation de (VI-36), par un facteur 2.
Nous voyons ainsi qu’en combinant des éléments du raisonnement BCHSH
avec d’autres du raisonnement GHZ, il est possible d’obtenir avec trois parti-
cules des violations d’inégalités BCHSH généralisées qui saturent une limite
absolue, mathématiquement impossible à dépasser. La troisième particule
joue en quelque sorte un rôle de “marqueur” qui permet de choisir pour les
deux autres particules une inégalité BCHSH qui dépasse la borne de Cirel-
son. La Ref. [278] propose une autre méthode mettant en jeu des ensembles
quantiques déterminés par pré- et post-sélection, et permettant également
d’atteindre la limite absolue de 4.
C. Impossibilités de Hardy
TXHOTXHIRLV
WRXMRXUV
MDPDLV
forme d’une exclusion : des “double 1” A = 1, B = 1 ou A = 1, B = 1 ne se
produisent jamais ;
(iii) lorsque les deux paramètres ont des primes, nous supposons que le
“double −1” est impossible : A = −1, B = −1 n’est jamais observé.
Il se trouve que ces trois hypothèses sont en fait incompatibles. En ef-
fet, considérons le schéma logique de la Figure VI.2, où la partie supérieure
correspond à la possibilité découlant de la proposition (i) ; la proposition (ii)
entraîne alors que, si A = 1, on a nécessairement B = −1, ce qui corres-
pond à la première diagonale de la figure ; la seconde diagonale s’ensuit par
symétrie. Nous voyons alors que tous les événements correspondant aux ré-
sultats A = B = 1 correspondent nécessairement aussi à A = B = −1, de
sorte que la contradiction avec (iii) surgit. Ainsi, le “quelquefois” de (i) est
contradictoire avec le “jamais” de la proposition (iii).
Mais il se trouve que la mécanique quantique permet la réalisation simul-
tanée des trois propositions ! Pour voir comment, considérons par exemple
un état quantique à deux spins de la forme :
où les kets |±, ± sont des notations de spin commodes pour les états propres
de A et B :
|±, ± = A = ±, B = ±1 (VI-39)
L’absence dans |Ψ de toute composante sur |A = −1, B = −1 fait que la
proposition (iii) est automatiquement réalisée. Pour les mesures sans prime,
pour des spins nous supposons qu’elles sont toutes deux réalisées le long de
directions du plan xOz qui font un angle 2θ avec Oz ; le vecteur propre de
182 CHAPITRE VI. AUTRES THÉORÈMES
soit :
α = β = −γ cot θ (VI-44)
Alors, à un coefficient arbitraire près, nous pouvons écrire | Ψ > sous la
forme :
|Ψ = − cos θ |+, − + |−, + + sin θ |+, + (VI-45)
Le calcul suivant est alors celui du produit scalaire de ce ket par celui où les
deux spins sont dans l’état (VI-40) ; le résultat est :
L’étape finale est de diviser le carré de ce résultat par la norme du ket (VI-45)
afin d’obtenir la probabilité de processus considéré en (iii), calcul simple qui
est donné en détail dans l’Appendice D. Cette probabilité n’est pas nulle ;
la valeur du maximum en fonction de θ trouvée dans l’Appendice C est à
peu près 9 %. Ceci établit donc effectivement que le couple de résultats
associés à la proposition (i) peut parfois être obtenu simultanément avec (ii)
et (iii) : dans 9 % des cas, les prédictions de la mécanique quantique sont en
contradiction complète avec celles d’un raisonnement réaliste local.
Une particularité intéressante des propositions ci-dessus est qu’elles se
généralisent à un nombre arbitraire de mesures [280] ; il se trouve que ceci
permet une augmentation significative du taux d’événements qui seraient
impossibles dans le cadre du réalisme local, de 9 % à presque 50 % ! La
généralisation met en jeu une chaîne (Fig. VI.3), qui maintient inchangées
les deux premières lignes (i) et (ii), et itère la seconde de façon récurrente,
en supposant que :
C. IMPOSSIBILITÉS DE HARDY 183
TXHOTXHIRLV
WRXMRXUV
WRXMRXUV
«
WRXMRXUV
MDPDLV
(iii) pour des mesures du type (a , b ) ou (a , b ), on n’obtient jamais des
résultats opposés11 ;
(iv) de même, pour des mesures de type (a , b ) ou (a , b ), on n’obtient
jamais des résultats opposés ;
etc.
(n) mais, pour une mesure de type (an , bn ), on n’obtient jamais −1 et
−1.
La démonstration d’incompatibilité est très similaire à celle donnée plus
haut ; elle est résumée dans la Figure VI.3.
Dans les deux cas, la façon de résoudre la contradiction est la même que
pour le théorème de Bell : en mécanique quantique, pour une paire donnée
de spins, il n’est pas correct de raisonner sur les quatre quantités A, A , B
et B , même comme des quantités inconnues qui pourraient éventuellement
être déterminées dans une expérience ultérieure. La raison en est simplement
que, pour une paire donnée, il est évidemment impossible de concevoir une
expérience qui les mesure toutes les quatre : les mesures sont incompatibles.
Pour une discussion d’effets non locaux avec d’autres états quantiques, voir
[281].
11
En fait, le raisonnement demande seulement que le couple de résultats −1, +1 ne soit
jamais obtenu, et ne pose aucune contrainte sur le couple de résultats +1, −1.
184 CHAPITRE VI. AUTRES THÉORÈMES
Des égalités GHZ, ou des impossibilités de Hardy, qui sont violées par la
mécanique quantique peuvent sembler conduire à une contradiction encore
plus forte que juste une violation des inégalités BCHSH. Mais un examen
plus détaillé montre que, en réalité, les deux sont reliées et que toutes les
violations que nous avons discutées se ramènent à des inégalités à un niveau
plus profond [282].
Ax = 0 ou 1 ; Ay = 0 ou 1 ; Az = 0 ou 1 (VI-49)
Nous notons |1, |0 et |−1 les vecteurs propres de Sz avec les valeurs propres
respectives +1, 0 et −1, et |0θ le vecteur propre de Sθ de valeur propre nulle.
Ce vecteur est égal à :
sin θ sin θ
|0θ = √ |1 − cos θ |0 − √ |−1 (VI-51)
2 2
car il est facile de vérifier que l’action de l’opérateur (VI-50) sur ce ket donne
zéro. Ce ket est appelé “neutrally polarized state” dans la référence [286].
Le produit scalaire 0 |0θ = − cos θ s’annule lorsque θ = π/2. Comme il est
possible de choisir deux directions orthogonales quelconques pour les axes Ox
et Oz d’un référentiel orthonormé, il en découle que le produit scalaire de
deux “neutrally polarized states” |0θ,ϕ et 0θ ,ϕ est zéro si les deux directions
définies par les angles polaire et azimuthal θ, ϕ et θ , ϕ sont orthogonales :
0θ,ϕ 0θ ,ϕ = 0 pour des directions orthogonales (VI-52)
Au = 2 [u · S]2 − 1 (VI-53)
Su |0u = 0 (VI-55)
188 CHAPITRE VI. AUTRES THÉORÈMES
Dϯ
Dϱ
Ɛ W
Dϭ Ă
DϮ
Dϰ
ƌ
Figure VI.4 – Les cinq points M1 , M2 ,...,M5 sont les sommets d’un penta-
gramme régulier de centre P . Le point O, sur l’axe Oz du pentagramme, est
tel que l’angle entre OMi et OMi+1 est égal à π/2. La longueur a est celle du
segment Mi Mi+1 (pour tout i), s celle du segment P Mi , r celle du segment
OMi , et enfin θ est l’angle entre Oz et OMi .
Le produit des cinq produits Ai Ai+1 est toujours égal à +1, puisqu’il est égal
au produit de tous les (Ai )2 ; en conséquence, le nombre de produits Ai Ai+1
égaux à −1 ne peut être qu’impair, de sorte qu’au moins l’un d’entre eux
vaut +1. La valeur minimale de T est donc −3 :
T ≥ −3 (VI-63)
Cette équation est appelée “inégalité du pentagramme”. Elle est clairement
incompatible avec le résultat quantique (VI-61).
on peut dire qu’elles sont créées lors de l’acte de mesure. Nous notons que,
contrairement au cas étudié au § D-1, ce résultat est “state dependent” : il de-
mande que le système quantique soit dans un état spécifique, en l’occurrence
l’état |0u=ez .
Dans la même veine, Peres [287] a montré que les résultats de la méca-
nique quantique sont incompatibles avec les deux propositions suivantes :
(i) le résultat de la mesure d’un opérateur A dépend seulement de A et
du système subissant la mesure (non-contextualité).
(ii) si les opérateurs A et B commutent, le résultat de la mesure de leur
produit AB est le produit de ceux correspondant aux mesures séparées de A
et B (règle du produit).
192 CHAPITRE VI. AUTRES THÉORÈMES
Tous ces opérateurs ont des valeurs propres ±1. Les trois opérateurs d’une
même ligne commutent entre eux, ainsi que les trois opérateurs d’une même
colonne (les produits de deux σ qui anti-commutent sont des opérateurs qui
commutent, puisque le changement d’ordre introduit deux signes −1 dont
l’effet s’annule). De plus, le produit des trois opérateurs est toujours +1, ex-
cepté pour la dernière colonne pour laquelle il est14 −1 . Ici, au lieu d’avoir
à prendre en compte un nombre infini de triplets de directions dans l’espace,
nous avons simplement trois groupes de trois opérateurs, mais la même ques-
tion que plus haut se pose : pouvons-nous attribuer une valeur ±1 à chacun
des 9 éléments du tableau (VI-70) d’une façon qui soit compatible avec les
résultats de la mécanique quantique ?
Pour obtenir cette condition de cohérence, chaque ligne ou chaque colonne
doit contenir, soit trois valeurs +1, soit un +1 et deux −1, excepté la dernière
colonne qui doit contenir un ou trois −1. Ce petit problème est bien plus
simple15 que le problème d’attribution des couleurs dans le § D-1. On peut
calculer le produit de tous les éléments de matrice, soit comme le produit
des produits dans chaque ligne, soit comme le produit des produits dans
les colonnes. Le produit de toutes les lignes doit être (+1)3 = +1, alors
que le produit de toutes les colonnes est (+1)2 (−1), c’est-à-dire −1 ; il y
a contradiction de signe. Il est donc impossible de trouver 9 nombres qui
satisfassent toutes les conditions.
Pour une autre illustration de ce genre d’impossibilité, voir le § VI de la
Ref. [9] qui considère trois spins 1/2 au lieu de deux.
13
Nous remarquons au passage que le raisonnement est proche de celui du § A, ce qui
illustre à nouveau la similarité entre le théorème GHZ et cette forme du théorème BKS
sur la contextualité.
14
Ceci peut facilement être vérifié à partir des propriétés bien connues des matrices
de Pauli ; le signe moins pour la troisième colonne vient du produit de deux facteurs i,
dont l’origine est la relation σx σy = iσz ; d’autre part, dans la troisième ligne, on obtient
i × (−i) = 1 du fait du changement de l’ordre des opérateurs.
15
Les complications du problème géométrique du théorème BKS original sont évitées en
passant d’un espace des états de dimension 3 à 4.
D. CONTEXTUALITÉ 193
E-2-b. Démonstration
|ψa = |+
1
|ψb = √ [|+ + |−] (VI-71)
2
Ils supposent ensuite que, pour chaque réalisation de l’expérience, deux tels
systèmes S et S sont préparés de façon totalement indépendante. Avec une
probabilité p2 , les deux systèmes ont des propriétés physiques P et P qui
tombent dans le domaine commun de |ψ1 et |ψ2 . En d’autres termes, pour
ces réalisations particulières de l’expérience, l’ensemble des deux systèmes
peut être décrit indifféremment par les quatre vecteurs d’état :
(dans notre notation, le premier ket du produit tensoriel spécifie l’état quan-
tique de S1 , le second celui de S2 ).
Les deux systèmes sont alors envoyés vers le même appareil de mesure
(Fig. VI.5) où ils subissent une mesure intriquée (similaire à celle discutée
§ C-2 du Chapitre VII) dont les vecteurs propres sont les kets :
1
|M1 = √ [|+, − + |−, +]
2
1
|M2 = [|+, + − |+, − + |−, + + |−, −]
2
1
|M3 = [|+, + + |+, − − |−, + + |−, −]
2
1
|M4 = √ [|+, + − |−, −] (VI-73)
2
On vérifie facilement que ces quatre états forment une base orthonormée.
Mais chacun d’entre eux est également orthogonal à l’un des états (VI-72) :
M1 |Ψaa = 0
M2 |Ψab = 0
M3 |Ψba = 0
M4 |Ψbb = 0 (VI-74)
La règle de Born implique alors que, si |Ψaa est choisi pour décrire la paire,
le premier résultat ne peut jamais être obtenu ; si l’on choisit plutôt |Ψab , le
E. RÉALITÉ DU VECTEUR D’ÉTAT 199
deuxième résultat ne peut jamais être obtenu ; si c’est |Ψba , c’est le troisième
résultat qui est exclu ; enfin, le choix de |Ψbb conduit à une impossibilité du
quatrième résultat. Nos hypothèses ont conduit à une situation absurde où
aucun résultat ne peut être obtenu par la mesure ! Avec une probabilité p2
se produit donc une forte contradiction avec les prédictions de la mécanique
quantique. Remarquons au passage que la valeur exacte de p est sans impor-
tance, pourvu qu’elle ne soit pas nulle. L’hypothèse initiale selon laquelle les
deux états quantiques (VI-71) peuvent parfois décrire le même ensemble de
propriétés physique se révèle contradictoire avec l’ensemble des hypothèses
PBR listées ci-dessus.
Jusqu’ici nous n’avons pris en compte que deux états particuliers, |ψa et
|ψb ; ceci donne une idée générale de l’essentiel du théorème, mais bien sûr
une démonstration complète requiert de généraliser à deux états quantiques
arbitraires. Ceci est fait dans la Ref. [302] grâce à l’introduction de plus
de deux systèmes : une contradiction du même type peut effectivement être
obtenue en considérant N systèmes quantiques non corrélés. On a alors 2N
états quantiques équivalents qui sont compatibles avec les mêmes propriétés
physiques de l’ensemble. On considère alors une mesure intriquée appropriée
pour montrer que chacun de ces états conduit à une probabilité nulle pour
l’un des résultats ; cette mesure met en jeu un circuit comprenant N portes
quantiques (§ D-2 du Chapitre VIII) agissant sur les systèmes individuels
considérés comme des qubits, une porte d’intrication agissant sur l’état à
N particules, et à nouveau N portes quantiques individuelles (portes de
Hadamard). L’ensemble complète la démonstration du théorème.
Les implications générales du théorème PBR ont été discutées par Schlos-
shauer et Fine [304]. Ils introduisent la notion de fonction de réponse A (R, P )
donnant la probabilité pour que, si le système possède les propriétés P , une
mesure de A va fournir un résultat appartenant à l’ensemble de résultats R.
Si A dépend du vecteur d’état, ils appellent le modèle ψ-dépendant ; sinon,
il est appelé ψ-indépendant. Ils montrent ensuite que le théorème PBR ne
concerne que les modèles ψ-indépendants, et analysent les hypothèses néces-
saires au raisonnement pour des systèmes composites. Une des conclusions
est que le théorème PBR peut donc être vu comme une illustration des diffi-
cultés à bâtir des théories à variables supplémentaires, lorsque l’on forme des
composites de systèmes préparés de façon identique. Ce point de vue général
fournit un lien avec le théorème BKS (§ D).
Les auteurs de la Ref. [305] mettent également en avant le caractère essen-
tiel de l’hypothèse de préparations indépendantes lorsque l’on désire exclure
la possibilité que plusieurs états quantiques soient compatibles avec un état
physique unique P . L’abandon de cette hypothèse leur permet de construire
des modèles ψ-épistémiques qui sont parfaitement compatibles avec toutes
les prédictions de la mécanique quantique.
Dans [306], Hardy discute la réalité des états quantiques en faisant des
hypothèses qui sont également différentes de celles de PBR ; en particulier, le
raisonnement ne demande pas de mettre en jeu un grand nombre de copies
du système physique. La nouvelle hypothèse cruciale est appelée “indifférence
ontique” (ontic indifference) : un changement du dispositif expérimental qui
n’a aucun effet sur le vecteur d’état ne modifie pas non plus les variables
physiques P . Hardy illustre ces idées avec une expérience mettant en jeu
un interféromètre de Mach-Zhender muni de deux détecteurs D1 et D2 à
la sortie (Fig. VI.6). Dans la relation (VI-71), l’état |ψa correspond à une
particule qui se propage dans le bras (a) de l’interféromètre, tandis que le
second état |ψb décrit une particule qui traverse l’interféromètre dans une
superposition cohérente de deux états se propageant dans les deux bras (a)
et (b). Le dispositif est ajusté de façon que toutes les particules dans l’état
|ψb atteignent à la sortie le détecteur D1 ; toutefois, on peut insérer une lame
de phase dans le bras (b) afin que toutes les particules atteignent plutôt le
détecteur D2 .
L’indifférence ontique assure que les propriétés physiques Pa associées à
|ψa , qui se propage dans le bras (a), ne sont pas modifiées lorsque la lame
de phase est insérée dans le bras (b). Les particules dans l’état |ψa peuvent
atteindre les deux détecteurs, et leurs propriétés physiques sont décrites par
E. RÉALITÉ DU VECTEUR D’ÉTAT 201
Figure VI.6 – Schéma de l’expérience discutée par Hardy dans la Ref. [306].
Un interféromètre de Mach-Zhender reçoit des particules provenant d’une
source S ; les lames séparatrices LS1 et LS2 créent et recombinent ensuite
deux chemins d’interférence (a) et (b) ; D1 et D2 sont deux détecteurs placés
à la sortie de BS2 . Deux éléments de l’interféromètre sont amovibles : la
lame séparatrice BS1 , et une lame de phase Π qui peut être insérée dans
le chemin (b). Si BS1 est retirée, la particule ne suit que le chemin (a),
aucun effet d’interférence ne se produit, et l’état quantique est |ψa ; la lame
de phase ne joue aucun rôle. Si BS1 est en place, la particule est décrite
par une superposition quantique |ψb incluant les deux chemins ; la différence
de chemin entre (a) et (b) est ajustée de sorte que, en l’absence de la lame
de phase, toutes les particules vont alors vers le détecteur D1 ; elles vont
vers le détecteur D2 lorsque la lame est insérée. Le but du raisonnement est
de montrer que |ψa et |ψb ne peuvent pas partager de propriété physique
commune.
insérée, les deux ensembles de propriétés décrivent des particules qui vont
atteindre des détecteurs différents ; de même, ΛD 1
a possède une intersection
vide avec Λb pour la même raison lorsque la lame est insérée. Il découle alors
de (VI-75) que :
Λa ∪ Λ b = 0 (VI-76)
qui montre que les deux états quantiques (VI-71) ne peuvent partager au-
cune propriété physique commune. Comme dans la démonstration ci-dessus
du théorème PBR, le résultat peut être généralisé à deux états quantiques
distincts quelconques. Hardy en conclut que, si les hypothèses sont correctes,
l’état quantique est “quelque chose de réel”, car il est écrit parmi les variables
sous-jacentes qui décrivent la réalité.
Une revue générale détaillée du sujet peut être trouvée dans la Ref. [299].
D’autres méthodes de rejet des modèles ψ-épistémiques peuvent être trou-
vées dans les Refs. [307] et [308]. Une discussion plus récente de Colbeck et
Renner [309] suppose que P fournit une description complète de l’état phy-
sique du système, et examine les conditions dans lesquelles ψ est déterminé
de façon unique par P . Comme dans leur travail précédent [303], ces auteurs
supposent réalisée une condition (suffisante) de “libre choix”, reliée à la notion
de “paramètres expérimentaux” et similaire aux “variables externes” de Bell,
déjà discutées au § C-1-c du Chapitre IV (des définitions précises du libre
choix et d’une description complète sont proposées dans [309]). La conclusion
de cette analyse est que, si les conditions correspondantes sont satisfaites, ψ
est aussi objectif que P .
Un test expérimental avec des ions est décrit dans [310], et avec des
photons dans [311] et [312] ; tous ces résultats confirment les prédictions de
la mécanique quantique.
Chapitre VII
Intrication quantique
|Ψ = |1 : ϕ |2 : χ ≡ |1 : ϕ; 2 : χ (VII-1)
les deux systèmes ne sont pas corrélés ; le premier est décrit par l’état quan-
2
Heisenberg a publié en 1969 un livre dont le titre est précisément La partie et le tout,
où il relate comment la mécanique quantique a émergé au cours de discussions qu’il a
pu avoir avec d’autres physiciens. Il semble toutefois que ce titre n’ait aucune relation
particulière avec l’intrication, mais plutôt avec un concept plus abstrait : “C’est une er-
reur fondamentale que de séparer la partie du tout, d’atomiser ce qui ne doit pas être
atomisé. C’est l’unité et la complémentarité qui constituent la réalité” (phrase attribuée à
Heisenberg [314]).
3
La notion de produit tensoriel est discutée au Chapitre XII, voir équation (XII-68).
Nous utilisons trois notations équivalentes pour le produit tensoriel :
|1 : ϕ ⊗ |2 : χ ≡ |1 : ϕ |2 : χ ≡ |1 : ϕ; 2 : χ
Suivant le contexte, l’une ou l’autre peut être plus commode et mieux correspondre à
l’usage.
206 CHAPITRE VII. INTRICATION QUANTIQUE
tique |ϕ, le second par l’état quantique |χ. Alors les trois systèmes (total
et sous-systèmes) sont tous associés avec un vecteur d’état, la description
la plus précise qui soit possible en mécanique quantique standard pour un
système physique.
Mais supposons maintenant que le système global soit dans l’état :
|Ψ = α |1 : ϕa |2 : χa + β |1 : ϕb |2 : χb (VII-2)
où les |1 : ϕa,b sont deux états orthogonaux normés pour le premier sous-
système, et |2 : χa,b deux autres états normés et orthogonaux pour le second ;
α et β sont deux nombres complexes quelconques (non nuls) satisfaisant la
relation |α|2 + |β|2 = 1. Avec (VII-2), le système global est toujours dans
un état quantique parfaitement bien défini. Mais le premier sous-système
se trouve avoir la probabilité |α|2 d’être dans l’état |ϕa et une probabilité
|β|2 d’être dans l’état |ϕb ; il est alors décrit par un mélange statistique au
lieu d’un état pur4 – nous revenons sur ce point plus en détail ci-dessous.
Il s’ensuit que les sous-systèmes sont décrits avec moins de précision que le
système global, une situation sans aucun équivalent en physique classique.
On utilise les mots “intrication quantique” pour décrire de telles situations
physiques.
Le formalisme de l’opérateur densité (§ A-6 du Chapitre XII) permet
d’exprimer cette propriété de façon plus quantitative, en particulier grâce à
l’utilisation des traces partielles (§ B-3 du Chapitre XII). L’opérateur densité
ρ associé à l’état normé |Ψ est :
qui est tout simplement le projecteur sur l’état |Ψ, de trace unité, et satis-
faisant la relation ρ2 = ρ car :
ρ1 = T r2 {ρ} (VII-6)
4
De même, le second sous-système a une probabilité |α|2 d’être dans l’état |χa et une
probabilité |β|2 d’être dans l’état |χb , de sorte que lui aussi est associé à un mélange
statistique.
A. UNE NOTION PUREMENT QUANTIQUE 207
Cette expression diagonale montre que le système 1 est décrit par un mélange
statistique des états |ϕa et |ϕb avec des probabilités |α|2 et |β|2 .
On a également :
2 |α|4 0
(ρ1 ) = (VII-8)
0 |β|4
et :
2
T r (ρ1 )2 = |α|4 + |β|4 = |α|2 + |β|2 − 2 |α|2 |β|2
(VII-9)
= 1 − 2 |α|2 |β|2 ≤ 1
Si l’un des deux coefficients α ou β est nul, on revient au cas des sous-
systèmes non corrélés comme dans (VII-1) ; il vient (ρ1 )2 = ρ1 et la trace de
(ρ1 )2 vaut 1, ce qui permet de retrouver que le premier sous-système est lui
aussi dans un état pur (c’est également vrai du second). Mais, si aucun de ces
coefficients n’est nul, les sous-systèmes sont corrélés, on a (ρ1 )2 = ρ1 , et la
trace de (ρ1 )2 est inférieure à 1 ; donc le premier sous-système est décrit avec
moins de précision que s’il était dans un état pur, par un mélange statistique.
Il va sans dire qu’on peut ajouter plus de deux termes dans la somme de
(VII-2), ce qui va tendre à diminuer encore plus la connaissance de l’état de
chaque sous-système, alors que l’état du système total reste toujours parfai-
tement bien défini. Par exemple, si |Ψ contient une superposition de trois
termes, tous contenant des états individuels orthogonaux, l’opérateur densité
ρ1 décrivant le système 1 devient un opérateur diagonal 3×3, ce qui introduit
trois états possibles pour ce système (états propres de ρ1 ). De plus, et comme
remarqué par Schrödinger [313], la détermination des états possibles pour le
sous-système n’est pas nécessairement unique ; on ne peut alors même pas
faire une liste non ambigüe des états accessibles6 . On peut même atteindre
une situation où la description de chaque sous-système est minimale, de sorte
qu’aucune information n’est disponible sur leurs états : tous les kets dans leur
espace des états sont également probables. Dans ce type de cas d’intrication
extrême, le système global possède les propriétés physiques associées à son
état quantique, mais rien ne peut être dit sur les propriétés spécifiques des
5
Selon la formule (XII-84) du Chapitre XII définissant
une trace partielle, les éléments
de matrice de ρA sont donnés par ϕi | ρ1 |ϕj = 1 : ϕi ; 2 : χk | Ψ Ψ |1 : ϕj ; 2 : χk
k=a,b,...
(où i, j et k sont égaux à a ou b) ce qui donne, compte tenu de l’expression (VII-2) de |Ψ,
la relation ϕi | ρ1 |ϕj = (αδi,a ) (α∗ δj,a ) + (βδi,b ) (β ∗ δj,b ), soit la matrice (VII-7).
6
Ceci se produit chaque fois que deux probabilités (valeurs propres de l’opérateur den-
sité réduit) sont égales.
208 CHAPITRE VII. INTRICATION QUANTIQUE
(où eiξ est un facteur de phase quelconque). Avec cet état, le système total est
parfaitement défini, alors qu’aucune information n’est disponible sur chacun
des deux spins individuels, qui ont seulement des probabilités égales d’être
dans les états |+ ou |−.
Ainsi apparaît clairement le caractère spécifiquement quantique de l’in-
trication. En mécanique classique, partant de deux systèmes physiques clas-
siques dont les propriétés sont aussi bien définies que possible, après inter-
action mutuelle on arrive nécessairement à une situation du même type où
chacun des sous-systèmes est resté tout aussi bien défini. En revanche, en mé-
canique quantique, partant à nouveau de systèmes aussi bien définis que le
permet leur nature quantique, à la fin du processus ils sont en général moins
bien définis, ce qui fournit une signature du caractère purement quantique
de l’intrication qui est apparue (en termes d’entropies des deux systèmes
– § B-3 – on dira qu’en mécanique classique ils gardent une entropie nulle
s’ils l’avaient avant d’interagir, alors ce que n’est en général pas le cas en
mécanique quantique).
classique. Dans le second, on se place “au niveau en dessous”, à celui qui met
en jeu directement des vecteurs d’état et des amplitudes de probabilité (au
lieu des probabilités elles-mêmes). On élargit alors l’ensemble des corrélations
possibles, comme l’illustre par exemple le théorème de Bell.
On peut combiner les deux processus, et associer au système total un
mélange statistique d’états qui ne sont pas nécessairement des produits. Le
formalisme de l’opérateur densité (§ A-6 du Chapitre XII) permet d’inclure
les deux possibilités dans un seul opérateur, ce qui est très commode ; inver-
sement, ceci a parfois l’inconvénient de perdre la trace de la nature de corré-
lations d’origines différentes, statistique classique ou purement quantique7 .
On parle parfois de “mélange propre” pour désigner la situation de statistique
classique habituelle, de “mélange impropre” pour la seconde situation (sans
équivalent classique).
B. Caractérisations de l’intrication
1
|Ψ = √ |1 : ϕa |2 : χa + |1 : ϕb |2 : χb (VII-11)
2
Au vu de cette expression, on pourrait avoir l’impression qu’elle indique
directement que ce sont les états |1 : ϕa,b qui sont intriqués avec les états
|2 : χa,b , en d’autres termes que la base des états individuels dans laquelle
l’intrication s’exprime naturellement est parfaitement déterminée. Mais nous
pouvons introduire une nouvelle base d’états pour le système 1 :
1
|ξ± = √ |ϕa ± eiξ |ϕb (VII-12)
2
(si |ϕa = |+ et |ϕb = |− sont les deux états propres de la composante sur
Oz d’un spin 1/2, les |ξ± sont les états propres de la composante du spin le
long de l’axe Oξ du plan xOy qui fait un angle ξ avec Ox). Nous remarquons
alors que |Ψ peut également s’écrire :
1
|Ψ = √ |1 : ξ+ ⊗ |2 : Ξ+ + |1 : ξ− ⊗ |2 : Ξ− (VII-13)
2
avec :
1
|Ξ± = √ |χa ± e−iξ |χb (VII-14)
2
L’équation (VII-13) possède exactement la même forme que (VII-11) ; il est
suffisant de remplacer les deux kets |± par les deux autres kets |ξ± ainsi
que les |χa,b par les |Ξ± . Au vu de l’expression (VII-13 ) du vecteur d’état
intriqué, on a maintenant l’impression que la base naturelle pour caractériser
l’intrication est celle des |ξ± (pour un spin 1/2, ce serait la composante
du spin le long de Oξ qui est intriquée avec l’autre système, au lieu de la
composante sur Oz) et des |Ξ± . La conclusion est que la base des états
individuels sur laquelle un état intriqué se développe naturellement n’est pas
définie de façon unique (contrairement à des corrélations classiques entre des
états classiques bien définis des systèmes individuels) ; en ce sens l’intrication
est ambigüe8 . Cette remarque peut aisément être généralisée à des systèmes
individuels qui ont accès à plus de deux états quantiques différents.
La conclusion est que la base d’états individuels produits sur laquelle un
état intriqué peut être développé n’est pas toujours définie de façon unique.
Une telle situation est très différente de ce qui se produit avec des corrélations
classiques, qui mettent en jeu des corrélations entre états classiques bien
définis.
8
Au § B-2, nous montrons que cette ambigüité résulte de la forme particulière (VII-11)
du vecteur d’état ; l’ambigüité ne se produit pas si les valeurs de α et β dans l’état général
(VII-2) sont quelconques.
B. CARACTÉRISATIONS DE L’INTRICATION 211
Nous pouvons alors décomposer l’état |Ψ sur la base des kets produits
tensoriels {|1 : ui ⊗ |2 : vl }, que nous notons pour simplifier {|ui , vl } en
supposant que le premier ket représente l’état de 1 et le second celui de 2 ;
nous écrivons donc :
|Ψ = xi,l |ui , vl (VII-17)
i,l
où les xi,l sont les composantes de |Ψ dans cette base. Si nous introduisons
le ket |wi , appartenant à l’espace des états de 2, par :
|wi = xi,l |vl (VII-18)
l
212 CHAPITRE VII. INTRICATION QUANTIQUE
Mais, par construction de la base {|ui } que nous avons utilisée, ρ1 est
diagonal et donné par l’expression (VII-16) ; la comparaison avec (VII-23)
montre que l’on a nécessairement :
wj |wi = δi,j × qi (VII-24)
Pour toutes les valeurs de l’indice i correspondant à des valeurs propres qi
non nulles, cette relation indique qu’on peut définir un ensemble de vecteurs
orthonormés |wi de l’espace des états du système 2 par :
1
|wi = √ |wi (VII-25)
qi
Pour toutes les valeurs de l’indice i associées à des valeurs propres qi nulles,
la même relation indique que les kets |wi sont nuls.
Pour finir, compte tenu de ce résultat, l’expression (VII-19) devient :
√
|Ψ = qi |ui , wi (VII-26)
i
B-2-b. Discussion
Nous constatons ainsi que la symétrie est rétablie entre les deux systèmes
physiques : les |ui ont été définis comme vecteurs propres de ρ1 , mais nous
voyons que les |wi sont également des vecteurs propres de ρ2 ; de plus, les
deux opérateurs densité partiels ont toujours les mêmes valeurs propres9 , leur
somme valant 1 puisque les deux opérateurs sont de trace unité. Dans le cas
particulier où elles sont toutes nulles sauf une, chacun des deux sous-systèmes
est dans un état pur. Mais, en général, plusieurs des valeurs propres sont non
nulles, et on voit immédiatement que (ρ1 )2 n’est pas égal à ρ1 , et de même
pour ρ2 . Nous retombons sur un cas où les deux sous-systèmes sont alors
décrits par des mélanges statistiques, alors que le système total est dans un
état pur.
Le nombre de valeurs propres qi différentes de zéro, soit le nombre de
termes effectifs dans (VII-26), est appelé le “rang de Schmidt” de |Ψ et
noté R. Si R = 1, l’état du système total n’est pas intriqué, les deux sous-
systèmes se trouvant donc dans des états purs. Si R = 2, on tombe sur
l’exemple étudié au § A-1, si R = 3 sur une intrication plus compliquée,
etc. Le fait que R soit une grandeur indépendante du sous-système, 1 ou
2, montre que l’intrication est en quelque sorte partagée entre eux de façon
symétrique ; il n’est par exemple pas possible qu’un des deux sous-systèmes
soit dans un état pur et l’autre dans un mélange statistique. La dimension de
l’espace des états du système 2 avec lequel 1 est intriqué donne évidemment
une borne supérieure au nombre de vecteurs |wi indépendants, donc au rang
R ; en fait, R ne peut dépasser la dimension d’aucun des espaces des deux
sous-systèmes : il faut donc que les deux sous-systèmes aient des espaces des
états de dimensions suffisantes si l’on veut obtenir une intrication de rang
élevé entre eux.
Si toutes les valeurs propres qi de ρA (et de ρB ) sont distinctes, les dé-
compositions (VII-16) et (VII-28) de ρB selon les projecteurs sur ses vecteurs
propres coïncident nécessairement ; la série des vecteurs propres |wi coïncide
9
Ces propriétés découlent du fait que nous avons supposé que le système total est dans
un état pur ; elles ne sont pas nécessairement satisfaites s’il est décrit par un mélange
statistique.
214 CHAPITRE VII. INTRICATION QUANTIQUE
alors avec celles des |vl . Les vecteurs propres des opérateurs densité partiels
donnent directement la décomposition de Schmidt, qui est donc unique dans
ce cas.
Lorsque certaines valeurs propres qi sont dégénérées, la décomposition
n’est plus unique. Par exemple, pour un état singulet, les deux matrices
densité partielles ont deux valeurs propres égales à 1/2. Or cet état singulet
peut être décomposé de la même façon sur des produits de vecteurs propres
de composantes des spins le long d’une même direction arbitraire ; il admet
donc une infinité de décompositions de Schmidt possibles. Dans le § B-1,
nous avons vu un autre cas où les deux valeurs propres sont dégénérées, de
sorte que l’intrication est ambigüe.
S1 = −kB T r {ρ1 ln ρ1 } ≥ 0
(VII-29)
S2 = −kB T r {ρ2 ln ρ2 } ≥ 0
Il en découle que :
S1 + S2 ≥ S (VII-30)
(l’égalité correspondant au cas particulier où |Ψ est un produit, et où le rang
de Schmidt est donc égal à 1).
Mais, de façon plus générale, le système total est décrit par un opérateur
densité ρ qui ne correspond pas nécessairement à un état pur, de sorte que
son entropie S n’est pas nulle non plus. On peut cependant montrer que
cette entropie S reste toujours inférieure ou égale à la somme des entropies
des deux sous-systèmes10 , de sorte que la relation (VII-30) reste valable dans
ce cas plus général ; l’égalité est obtenue uniquement quand ρ est un produit :
ρ = ρ1 ⊗ ρ2 (VII-31)
B-5. Monogamie
Un état tel que (VII-10) est un état où deux spins sont fortement in-
triqués, et l’état GHZ (VI-1) en quelque sorte l’équivalent pour trois spins.
On pourrait penser que cet état à trois spins préserve l’intrication entre les
deux premiers spins du premier, tout en les intriquant avec un troisième.
En réalité, ce n’est pas du tout ce qui se produit : en passant de (VII-10) à
(VI-1), si l’on intrique effectivement le troisième spin avec les deux premiers,
en même temps on détruit totalement leur intrication initiale. Nous l’avons
d’ailleurs déjà noté au § A-3 du Chapitre VI : les états ne manifestent de
fortes corrélations entre les spins que si l’ensemble des spins est mesuré ; si
la mesure porte sur deux spins au lieu de trois, elle ne fait plus apparaître
aucune corrélation entre eux.
Comment faire alors pour ajouter un spin supplémentaire sans détruire
la corrélation entre les deux premiers ? On peut supposer que l’état des trois
spins est :
1
| Ψ > = √ |1 : +; 2 : − + eiξ |1 : −; 2 : + ⊗ |3 : θ
2
1
= √ |1 : +; 2 : −; 3 : θ + eiξ |1 : −; 2 : +; 3 : θ (VII-33)
2
(où |θ est un état normé quelconque pour le troisième spin), avec un état
factorisé du spin supplémentaire ; ce choix préserve visiblement la même in-
trication entre les spins 1 et 2 que pour l’état (VII-10)11 . Mais le troisième
spin est alors totalement décorrélé avec les deux premiers !
Un compromis entre les deux tentatives précédentes est alors :
1
√ |1 : +; 2 : −; 3 : θ1 + eiξ |1 : −; 2 : +; 3 : θ2 (VII-34)
2
Si |θ1 = |θ2 , on retombe sur (VII-33), et le spin n’est pas intriqué du tout
avec les deux premiers ; si |θ1 et |θ2 sont orthogonaux, on retombe sur un
état GHZ où aucune des trois paires de spins n’a la moindre intrication, cette
dernière n’apparaissant qu’au niveau des trois particules. Lorsque |θ1 et |θ2
ne sont ni parallèles, ni orthogonaux, la situation est intermédiaire : plus ils
sont parallèles, plus les deux spins initiaux restent intriqués (nous verrons au
§ suivant que les termes cohérents font intervenir le produit scalaire θ1 |θ2 ),
mais alors le troisième l’est très peu ; inversement, plus ils sont orthogonaux,
plus les deux spins initiaux perdent leur corrélation pour la transmettre entiè-
rement au niveau des trois spins. En fait, le troisième spin joue pour les deux
premiers un rôle analogue à l’environnement dans la décohérence qui sera
11
Dans le calcul de l’effet du terme cohérent (en eiξ ) selon la méthode du § A-3 du
Chapitre VI, il suffit maintenant de retourner deux spins, le troisième restant toujours
dans l’état |θ.
B. CARACTÉRISATIONS DE L’INTRICATION 217
de sorte que les wn peuvent être interprétés comme des probabilités14 (chaque
12
La Ref [318] utilise une mesure de l’intrication appelée “concurrence”. Elle établit que
la somme des carrés de la concurrence entre A et B et de celle entre A et C ne peut
dépasser le carré de la concurrence entre A et la paire BC.
13
Dans son article initial, Werner parle de sous-systèmes “classiquement corrélés” [190],
mais le mot “séparable” utilisé par Peres [322] est maintenant plus fréquemment utilisé.
14
Si l’on remplace la variable discrète n par une variable continue λ, on tombe alors sur
le cas étudié à l’Appendice C.
218 CHAPITRE VII. INTRICATION QUANTIQUE
wn donne la probabilité pour que le premier système soit décrit par ρn1 et
le second par ρn2 ). En revanche, si le développement (VII-35) comporte né-
cessairement des coefficients wn qui ne soient pas des réels positifs, on dit
que l’opérateur densité ρ n’est pas séparable et qu’il contient de l’intrication
quantique15 .
Si l’on effectue des mesures séparées sur les sous-systèmes 1 et 2, un
système décrit par un opérateur densité séparable satisfait toujours les iné-
galités de Bell [190] (la réciproque n’est cependant pas vraie : un opérateur
densité non séparable ne conduit pas nécessairement à des violations de ces
inégalités). Dans une telle situation, chacun des sous-systèmes possède des
propriétés qui peuvent être arbitrairement quantiques, mais la façon dont
sont introduites les corrélations entre ces propriétés reste classique. Un sys-
tème séparable n’est donc jamais intriqué quantiquement, quel que soit le
caractère fortement quantique ou non de chacun des deux systèmes séparés.
Le critère de Peres-Horodecki [322, 323] indique qu’une condition nécessaire
pour qu’une matrice densité représente un opérateur ρ qui soit séparable
est que la matrice obtenue par transposition partielle (transposition des in-
dices relatifs à l’un des deux sous-systèmes seulement) n’ait que des valeurs
propres non négatives. L’apparition de valeurs propres négatives de cet opé-
rateur semi-transposé peut donc signaler l’apparition d’intrication quantique,
avec une meilleure sensibilité qu’une violation des inégalités de Bell.
piégées et peuvent donc être observées pendant longtemps. La Ref. [325] dé-
crit l’obtention d’une telle intrication avec des ions de Béryllium placés dans
un piège de Paul à radiofréquences, selon la méthode proposée par Cirac et
Zoller [326]. Pour une revue de l’obtention d’intrication dans des ions, voir
la Ref. [327]. Enfin l’intrication peut être observée en physique du solide
avec des courants supraconducteurs [328] mettant en jeu un grand nombre
d’électrons (systèmes macroscopiques). Nous discutons maintenant une autre
méthode, l’échange d’intrication (“entanglement swapping”) qui permet d’in-
triquer des paires de particules sans qu’elles interagissent, uniquement sous
l’effet du processus de mesure quantique concernant d’autres particules.
nous obtenons une base orthonormée de l’espace des états associé aux parti-
cules i et j. Comme :
| ΦB
1,4 >(+) ⊗ | Φ2,3 >(+) + | Φ1,4 >(−) ⊗ | Φ2,3 >(−) = [|HHHH + |V V V V ]
B B B
(pour simplifier l’écriture, nous supposons implicitement que l’ordre des par-
ticules est 1, 2, 3 et 4 dans le second membre) et :
1,4 >(+) ⊗ | Θ2,3 >(+) + | Θ1,4 >(−) ⊗ | Θ2,3 >(−) = [|HHV V + |V V HH]
| ΘB B B B
(VII-40)
nous pouvons écrire l’état (VII-38) sous la forme :
| Ψ >= 12 | ΦB1,4 >(+) ⊗ | Φ2,3 >(+) + | Φ1,4 >(−) ⊗ | Φ2,3 >(−) +
B B B
(VII-41)
Supposons maintenant que le schéma de l’expérience soit celui de la Fi-
gure VII.1 : on effectue sur les particules 2 et 3 une mesure où les deux
C. CRÉATION ET PERTE DE L’INTRICATION 221
^
ϭ Ϯ ϯ ϰ
particules interfèrent et dont les vecteurs propres de mesure sont les quatre
états de Bell de ces deux particules – ceci peut être réalisé en envoyant les
deux particules sur une lame semi-réfléchissante et en observant avec des
détecteurs Da et Db dans quels canaux de sortie les particules sont mesu-
rées17 après la lame. La projection sur l’un des quatre états de Bell pour
ces particules projette le système sur un état où les deux autres particules
occupent le même état de Bell. Les deux particules non observées sont donc
projetées dans un état totalement intriqué. Ce qui est remarquable dans ce
schéma est que, initialement, la paire des deux particules 1 et 2 est intriquée
de façon interne, mais pas avec la paire de particules 3 et 4, qui elle aussi
17
Parmi les quatre états de Bell, le seul pour lequel chacune des deux directions de
sortie contient une particule est l’état | ΘB
23 >(−) ; les trois autres états correspondent à
des situations où les deux particules sortent toujours dans le même canal de sortie (effet
Hong-Ou-Mandel). Si donc les deux détecteurs Da et Db enregistrent une particule, la
mesure projette les particules 1 et 4 dans l’état totalement intriqué | ΘB 14 >(−) .
222 CHAPITRE VII. INTRICATION QUANTIQUE
n’a qu’une intrication interne. En effectuant une mesure appropriée sur une
particule de chaque paire, on projette les deux particules restantes sur un
état fortement intriqué, même si ces deux particules n’ont interagi à aucune
étape du processus.
Il est intéressant de comparer les corrélations obtenues par échange d’in-
trication avec des corrélations classiques. Supposons que deux sources indé-
pendantes émettent des paires d’objets corrélés, numérotés 1 et 2 pour la
première source, 3 et 4 pour la seconde, comme sur la Figure VII.1. Dans
chaque réalisation de l’expérience, chaque source émet deux objets parta-
geant une propriété commune (par exemple la même couleur, des moments
angulaires opposés, etc.), mais les deux sources sont totalement incorrélées
(les objets émis dans la même réalisation par deux sources différentes ne pré-
sentent aucune corrélation entre leurs couleurs, moments angulaires, etc.).
Si toutefois nous sélectionnons les événements où les particules 2 et 3 pré-
sentent une certaine corrélation (par exemple couleurs identiques, couleurs
différentes, moments angulaires parallèles ou antiparallèles, etc.), il est clair
que les particules 1 et 4 seront également corrélées de la même façon, et ceci
même si elles n’ont jamais interagi dans le passé. Ce résultat est juste une
conséquence de la sélection opérée dans une distribution classique de proba-
bilités, et pourrait s’appeler “échange de corrélations classiques”. Cependant,
même avec cette sélection, si une expérience de Bell est réalisée avec les ob-
jets 1 et 4, les corrélations obtenues seront toujours telles que les inégalités
de Bell seront satisfaites. En revanche, la méthode d’échange d’intrication
permet d’obtenir de fortes violations de ces inégalités. C’est donc une mé-
thode plus puissante pour créer des corrélations que l’échange de corrélations
classiques. Nous avons déjà discuté dans le § C-1-e du Chapitre IV plusieurs
exemples d’expériences de Bell utilisant cette méthode.
Nous avons déjà mentionné la possibilité d’intriquer un plus grand nombre
de particules [274] par des méthodes du même type. D’autres protocoles
créant de l’intrication quantique ont été mis en œuvre, permettant ainsi de
mettre 6 ions dans un état NOON [331] ou jusqu’à 8 ions dans un état W
(superposition cohérente d’états où une seule excitation est localisée sur l’un
quelconque des ions avec des amplitudes de probabilité égales) [332]. En op-
tique quantique, les techniques de conversion paramétrique dans des cristaux
non linéaires ont été utilisées pour des expériences mettant en jeu l’intrication
de 2, 4 ou 6 photons [333, 334]. Dans le § C-1-d du Chapitre IV nous avons
également vu comment l’échange d’intrication a pu être mis en œuvre pour
créer avec des photons des corrélations quantiques entre ions éloignés dans
des pièges différents (dans la Figure VII.1, les particules 1 et 4 sont alors des
ions, les particules 2 et 3 des photons). Ceci a conduit à des violations des
inégalités de Bell se rapprochant un peu plus d’une expérience idéale (sans
échappatoire).
C. CRÉATION ET PERTE DE L’INTRICATION 223
Diverses méthodes expérimentales ont été mises au point pour créer une
intrication entre atomes neutres [335, 336]. La méthode récente dite “sculp-
ture d’états intriqués” consiste à partir d’un état produit pour les atomes,
pour ensuite en supprimer certaines composantes et aboutir ainsi à un état
fortement intriqué [337, 338].
C-3. Décohérence
C-3-a. Mécanisme
qui est le produit de deux états, l’un décrivant un atome dans une superpo-
sition cohérente de deux états orthogonaux |ϕa et |ϕb , localisés dans des
régions différentes de l’espace, l’autre décrivant une autre particule, un pho-
ton par exemple, initialement dans l’état |k0 (nous supposons tous ces états
normalisés).
Initialement, l’atome est décrit par un état possédant des propriétés quan-
tiques qui dépendent de la phase relative de α et β, et sont donc cohérentes ;
la décohérence est un processus dans lequel ces propriétés cohérentes dispa-
raissent. Supposons en effet que le photon interagisse avec l’atome et soit
diffusé dans un état quantique qui est différent selon l’endroit où la diffusion
s’est produite : si l’atome diffusant est dans le premier état |ϕa , le photon
est diffusé vers l’état |k+ ; s’il est dans l’état |ϕb , le photon est diffusé dans
l’état |k− (nous supposons que les états |k± sont normalisés)18 . Après dif-
fusion l’atome n’a pas changé de position, et retourne au même état initial
(on suppose tout transfert d’impulsion négligeable), et le vecteur d’état qu’il
18
Nous aurions tout aussi bien pu supposer que le photon est focalisé de sorte qu’il
n’interagit qu’avec l’atome s’il se trouve dans l’un des deux états, mais n’est pas diffusé si
l’atome est dans l’autre état.
224 CHAPITRE VII. INTRICATION QUANTIQUE
Supposons maintenant que nous ne soyons intéressés que par les pro-
priétés de l’atome, pas par celles du photon ; la raison pourrait en être, par
exemple, que la détection de ce photon est, soit impossible, soit très difficile
(comme c’est le cas pour un photon de l’infrarouge lointain). Il est alors utile
de calculer la trace partielle (cf § B-3 du Chapitre XII) sur ce photon, afin
d’obtenir l’opérateur densité qui décrit les atomes seuls. Un calcul simple,
analogue à celui qui a conduit à (VII-23), montre que cette trace partielle
peut être écrite, dans la base des deux états |ϕa et |ϕb :
| α |2 αβ ∗ k− |k+
ρ= (VII-44)
α∗ β k+ |k− | β |2
Nous voyons sur cette formule que, si le produit scalaire k− |k+ était égal
à 1, la matrice densité de l’atome ne serait pas affectée par la diffusion du seul
photon. Mais cela reviendrait à supposer que le photon est diffusé exactement
dans le même état, quelle que soit la localisation spatiale en |ϕa ou |ϕb de
l’atome diffusant, de sorte qu’il n’emporte strictement aucune information sur
l’endroit où il a été diffusé ! C’est très peu probable si la distance entre les
positions de l’atome est bien plus grande que la longueur d’onde du photon.
En fait, il est bien plus réaliste de penser que ce produit scalaire est proche
de zéro, ce qui signifie que les éléments non diagonaux de (VII-44) sont, eux
aussi, presque zéro. Nous en concluons que la diffusion d’une seule particule
détruit presque totalement la cohérence entre les deux états atomiques, dès
lors qu’ils sont situés en des endroits différents.
La perte de cohérence devient encore pire quand plus de photons sont
diffusés (en supposant qu’ils sont tous dans le même état initial |k0 ), car il
faut alors remplacer (VII-43) par l’état :
Ψ = α |ϕa ⊗ |k+ k+ k+ ... + β |ϕb ⊗ |k− k− k− ... (VII-45)
Maintenant nous avons, dans les éléments non diagonaux, le produit d’un
grand nombre de produits scalaires k− |k+ , tous plus petits que 1 ; il est
clair que ces éléments ont un module encore plus petit que lorsqu’un seul
photon est diffusé. En fait, dès que les deux états |k+ et |k− ne sont pas
C. CRÉATION ET PERTE DE L’INTRICATION 225
Plus le nombre d’atomes se trouvant initialement dans les états |ϕa et |ϕb
est élevé, plus rapidement se produira la diffusion de nombreux photons, en-
traînant une décroissance encore plus rapide des éléments non diagonaux.
Or nous avons vu qu’il suffit de la diffusion d’un seul photon dans deux
états orthogonaux pour détruire la cohérence. Ainsi la grande taille d’un
système physique dans une superposition cohérente rend cette superposition
extrêmement fragile. La cohérence des objets macroscopiques se transforme
rapidement en une cohérence mettant en jeu l’environnement avec des cor-
rélations de plus en plus complexes (le photon diffusé peut, à son tour, se
corréler avec d’autres particules) ; rapidement cette cohérence devient im-
possible à détecter expérimentalement et tout se passe comme si elle avait
simplement disparu. Un tel phénomène est inévitable – à moins bien sûr que
les propriétés de diffusion des deux états symbolisés par |ϕa et |ϕb soient
exactement les mêmes, ce qui exclut toute séparation spatiale notable entre
les états, sinon la différence serait invisible ! Ceci montre combien fragiles sont
les superpositions macroscopiques d’objets, chaque fois qu’elles comprennent
des états qui peuvent être perçus comme distincts19 .
linéaires. Bien sûr, personne ne doute qu’un processus de mesure fasse inter-
venir la décohérence dans sa première étape, mais la vraie question est de
savoir ce qui se produit ensuite pour faire émerger un résultat unique.
En d’autres termes, une fois que dans une étape préliminaire les éléments
non diagonaux ont disparu sous l’effet de la décohérence, la question est de
comprendre ce qu’il advient des éléments diagonaux. Pour obtenir une dy-
namique quantique qui soit compatible avec le fait qu’une mesure fournit un
seul résultat (ou, plus généralement, pour obtenir l’unicité macroscopique),
il faudrait introduire un processus qui soit capable de forcer tous les éléments
diagonaux à se concentrer en un seul (pour l’atome à deux niveaux considéré
plus haut ; pour le chat, cette coalescence doit se faire vers un seul des deux
blocs diagonaux, soit ceux décrivant un chat vivant, soit ceux décrivant un
chat mort). Comment cela peut-il se produire ? C’est la partie difficile du
problème de la mesure : expliquer pourquoi, à la fin du processus de mesure,
les éléments diagonaux peuvent coalescer. Bien sûr, ils rappellent beaucoup
les probabilités habituelles, dont ils possèdent toutes les propriétés mathéma-
tiques : ce sont des nombres positifs et leur somme est l’unité (cf. la discussion
du § B-3 du Chapitre II) ; on pourrait les appeler des “pré-probabilités” [339].
Mais toutes ces pré-probabilités apparaissent simultanément lors de chaque
réalisation de l’expérience, alors que de véritables probabilités caractérisent
des événements qui sont exclusifs (cf. la citation de Bell dans la note 20).
Transformer des pré-probabilités en de véritables probabilités est une étape
importante, qui demande pour être franchie par exemple l’introduction du
postulat de réduction de von Neumann.
Poussés à ce point de la discussion, certains physiciens rétorquent qu’après
tout on peut toujours supposer qu’ultérieurement, et d’une façon ou d’une
autre, la superposition quantique de l’équation de Schrödinger se résout en
une seule de ses branches. C’est assurément exact, mais cela revient à faire
sortir un problème par la porte, et le laisser rentrer ensuite par la fenêtre !
Cette attitude revient en effet à considérer que l’équation dynamique stan-
dard ne peut pas toujours être valable, ce qui était précisément le point du pa-
radoxe. Une solution plus logique serait de compléter la décohérence par l’in-
terprétation d’Everett de la mécanique quantique (§ M du Chapitre XI) ; alors
effectivement on obtient un point de vue cohérent, où l’émergence d’un ré-
sultat n’a plus à être expliquée, tout simplement parce qu’on suppose qu’elle
ne se produit jamais (l’équation de Schrödinger n’a plus de frontière de va-
lidité). Mais, bien sûr, dans ce point de vue il faut se préoccuper des autres
difficultés intrinsèques qu’introduit cette interprétation, que nous discuterons
plus bas (§ M du Chapitre XI). Une discussion générale des relations entre
décohérence et le problème de la mesure, ainsi que de son rôle dans le cadre
des diverses interprétations de la mécanique quantique, est donnée dans la
Ref. [340].
Concernant la terminologie, nous avons déjà mentionné au § B du Cha-
228 CHAPITRE VII. INTRICATION QUANTIQUE
pitre II qu’au fil des années il est devenu de plus en plus courant d’utiliser les
mots “chat de Schrödinger” (Schrödinger cat ou SC en anglais) pour décrire
des états cohérents tels que (VI-16), même parfois pour de petites valeurs de
N (parfois pour un ion unique !). Ceci introduit une redéfinition des mots,
du fait que la propriété essentielle du chat original est d’avoir un nombre de
degrés de liberté macroscopique, et donc de toujours résoudre les superposi-
tions linéaires (par opposition à un atome radioactif ou un ion). Supposons
un instant que l’on puisse réaliser un état “par tout ou rien” avec une très
grande valeur de N , serait-ce une meilleure réalisation du chat de Schrödinger
tel que l’entendait son inventeur ? Dans une certaine mesure, oui, puisque le
chat peut être vu comme le symbole d’un système de beaucoup de particules
qui changent d’état quantique individuel pour aller vers un état orthogonal,
lorsqu’on passe d’une composante du vecteur d’état à l’autre. Effectivement
il est très probable que beaucoup des atomes qui constituent le chat prennent
part à des liaisons chimiques différentes, selon que le chat est vivant ou mort.
Mais il semble plutôt difficile d’inventer une raison pour laquelle tous les
atomes et tous les degrés de liberté devraient nécessairement passer vers des
états orthogonaux, alors que c’est la propriété essentielle des états par tout
ou rien. En un sens, ils en font plus que ce qui est requis pour un chat
de Schrödinger standard, de sorte que pour finir les deux concepts restent
relativement distincts, même pour de grandes valeurs de N .
L’état final correspondant |Ψ peut alors être développé sur la base des
produits tensoriels |un ⊗ |Θq selon :
B −1
NS N
Ψ =
(n)
xn ,q |un ⊗ |Θq (VII-51)
n
n =1 q=0
(pour des raisons qui deviendront claires au § D-3, il est commode de faire
courir l’indice de sommation q entre 1 et NB − 1) ou encore :
B −1
N ! !
(n)
Ψ = u q ⊗ Θq (VII-52)
n
q=0
avec :
! NS !
(n) (n)
uq = xn ,q un (VII-53)
n =1
!
(n)
Les états uq de S qui apparaissent dans ce développement ne sont né-
cessairement ni orthogonaux, ni normalisés. Nous pouvons introduire les NB
opérateurs linéaires Mq agissant dans ES et définis par :
! !
Mq un = uq(n) (VII-54)
B −1
N
Ψ = Mq |un ⊗ |Θq (VII-55)
n
q=0
B −1
N
ϕ0 | Mq† Mq |ϕ0 = 1 (VII-57)
q=0
D. DYNAMIQUE QUANTIQUE D’UN SOUS-SYSTÈME 233
NS
NS !
Ψ = (n)
cn |un ⊗ Θn (VII-61)
n=1 n =1
!
(n)
Les (NS )2 kets Θn engendrent un sous-espace EB de EB dont la dimension
est NB ≤ (NS )2 . Dans ce sous-espace, nous choisissons
! une base orthonormée
(n)
de NB kets |Ξq . Le développement de tous les Θn sur cette base conduit
à:
NS NB −1 " ! !
NS (n)
Ψ = cn Ξ q Θ n |un ⊗ Ξq (VII-62)
n=1 n =1 q=0
B −1 †
22
L’opérateur N q=0 Mq Mq est hermitique, ce qui permet de le diagonaliser. La relation
(VII-57) montre alors que toutes ses valeurs propres sont nécessairement égales à 1, ce qui
signifie que l’opérateur lui-même est égal à l’opérateur identité agissant dans ES .
234 CHAPITRE VII. INTRICATION QUANTIQUE
NS " !
(n)
Mq un = Ξ q Θn |un (VII-63)
n =1
et obtenir :
NB −1
NS !
Ψ = cn Mq un ⊗ Ξq
n=1 q=0
−1
NB
!
= Mq |ϕ0 ⊗ Ξq (VII-64)
q=0
Cette expression a la même forme que (VII-56), mais la somme est mainte-
nant réduite à un nombre de termes NB qui est plus petit ou égal à (NS )2 . Le
domaine de sommation peut donc être beaucoup plus petit si la dimension
de l’espace des états EB est très grande. La relation d’unitarité (VII-58) est
toujours valable, pour la même raison que ci-dessus. De façon générale, on
remarque que les opérateurs de Kraus ne sont pas définis de façon unique : il
existe une grande flexibilité dans le choix de la base |Ξq dans le sous-espace
de dimension NB , ce qui peut conduire à des opérateurs Mq différents.
Nous supposons maintenant que l’interaction entre les deux systèmes est
faible et, pour simplifier, nous ignorons leur évolution propre entre les instants
t = 0 et t = τ . L’opérateur d’évolution U (0, τ ) est alors proche de 1, et le
ket |Ψ n’est pas très différent de |Ψ. Si nous choisissons une base {|Θq }
dont le premier vecteur est |Φ0 , nous avons :
Ψ |Ψ = |ϕ0 ⊗ |Θ0 (VII-68)
et la contribution de la valeur q = 0 domine donc dans (VII-56), avec M0 1.
Nous écrivons alors M0 sous la forme :
M0 = 1 + J + iK (VII-69)
où [C, D]+ est l’anticommutateur CD + DC, alors que [C, D] est le commu-
tateur CD − DC.
236 CHAPITRE VII. INTRICATION QUANTIQUE
ou encore :
N −1
1 †
J =− Mq Mq (VII-74)
2
q=1
N −1
dρS −i † 1 † 1 †
= [Heff , ρS ] + L q ρ S L q − L q L q ρ S − ρS L q L q (VII-76)
dt 2 2
q=1
et Lq un “opérateur de Lindblad” :
√
Lq = nMq (VII-78)
linéarité implique alors que les équations (VII-75) et (VII-76) sont toujours
valables.
(ii) Si B est également décrit par un opérateur densité associé à un mé-
lange statistique et si l’opérateur densité initial du système total est le produit
de cet opérateur densité par ρ0 , le raisonnement n’est plus aussi direct du
fait que les opérateurs Mq dépendent de l’état initial |Φ0 de B. Toutefois,
des formes de Lindblad peuvent toujours être obtenues dans ce cas (voir par
exemple § 4.3 de [365]).
(iii) Nous avons supposé que le même système S interagit successivement
et pour un instant très court avec un grand nombre d’autres systèmes B. Une
situation plus fréquente est celle où S interagit constamment (mais faible-
ment) avec un seul système B, par exemple un réservoir thermique. Dans un
tel cas, on peut encore obtenir des équations pilotes du même type, à condi-
tion que les temps de corrélation associés au système B soient suffisamment
courts. Physiquement, on comprend bien qu’un grand système avec des temps
de corrélation courts soit équivalent à une série de systèmes physiques prépa-
rés indépendamment. Pour plus de détails, on pourra par exemple consulter
le Chapitre IV de [366].
(iv) L’évolution propre des systèmes S et B peut être incluse dans l’équa-
tion pilote.
Chapitre VIII
Applications de l’intrication
quantique
A. Deux théorèmes
Les deux théorèmes qui suivent sont quelque peu similaires ; le premier
concerne la création et la duplication d’états quantiques, le second leur dé-
termination.
A-1. Non-clonage
Considérons alors
deux! valeurs
! différentes |ϕ1 et |ϕ2 de |ϕ, associées
(1) (2)
aux états initiaux Ψi et Ψi ; d’après (VIII-1) le produit scalaire de
ces derniers est : " !
(1) (2)
Ψi Ψi = ϕ1 |ϕ2 (VIII-3)
– soit :
ϕ1 |ϕ2 × Φf (ϕ1 ) |Φf (ϕ2 ) = 1 (VIII-6)
Si cette seconde possibilité est réalisée, puisque tous les kets de cette ex-
pression sont normés, chacun des deux produits scalaires de cette expression
est en module inférieur ou égal à 1 (inégalité de Schwarz), l’égalité ne se
produisant que si les vecteurs eux-mêmes sont égaux (moyennant un fac-
teur de phase sans importance). La relation (VIII-6) implique donc à la fois
que |ϕ1 = |ϕ2 et |Φf (ϕ1 ) = |Φf (ϕ2 ), alors que nous avons supposé les
états |ϕ1 et |ϕ2 différents. Nous aboutissons donc à une contradiction, ce
qui signifie que c’est l’autre possibilité qui est réalisée : le produit scalaire
ϕ1 |ϕ2 est nécessairement nul. Pour finir, du fait de la condition d’unita-
rité, si le clonage est possible pour un état |ϕ1 , les seuls autres états |ϕ2
qui peuvent être clonés sont des états orthogonaux ; il est impossible pour
des combinaisons linéaires quelconques d’états de la source.
Si maintenant nous renonçons à l’une des hypothèses, à savoir que l’état
|ϕ reste invariant dans tout le processus, le clonage devient-il alors possible ?
Nous supposons maintenant que, au lieu de mettre deux systèmes dans l’état
initial |ϕ de la source, le processus les met tous les deux dans un autre état
|ϕ qui est une fonction de |ϕ donnée par :
Après tout, ce serait également une sorte utile de clonage, puisque connais-
sant l’état |ϕ l’on peut toujours remonter à |ϕ. Mais ce processus est tout
aussi interdit par les règles de la mécanique quantique. En effet, si l’on ap-
plique le même raisonnement que plus haut à l’opérateur unitaire obtenu en
−1 −1
multipliant l’opérateur d’évolution par le produit U (source) × U (cible),
on arrive aux mêmes équations et donc aux mêmes contradictions. Ainsi,
abandonner l’invariance de l’état source ne facilite en rien le processus.
S’il est impossible de cloner exactement des états, peut-on au moins le
faire de façon approchée ? L’argument qui suit montre que c’est tout aussi
impossible. En effet, sans imposer l’égalité stricte de (VIII-2) pour l’état final,
écrivons maintenant la condition plus faible :
où |ϕ et |ϕ
# sont de bonnes approximations de l’état initial cible |ϕ. La
condition de conservation du produit scalaire donne alors :
B. Cryptographie quantique
tème optique très élaboré à la fibre qui court entre Alice et Bob, et en faisant
des mesures ? Si Ève absorbe les photons qu’elle mesure, elle change immé-
diatement les propriétés de corrélations que peuvent observer Alice et Bob,
et la tentative d’espionnage est immédiatement détectable. Cette prise de
conscience ne fait pas nécessairement cesser la tentative d’espionnage, mais
au moins Alice et Bob savent quelles données ont été perturbées et peuvent
n’utiliser que les autres comme clé cryptographique parfaitement sûre.
Supposons qu’Alice envoie à Bob des photons un par un, soit dans l’état
|H de polarisation horizontale pour signaler un bit de la clé égal à 0, soit
dans l’état |V de polarisation verticale pour signaler un bit égal à 1 (Fig.
VIII.1). Bob, mesurant la polarisation des photons qu’il reçoit, peut recons-
truire la clé, mais dans ce cas il n’existe aucune garantie que cette clé n’ait
pas été interceptée en chemin par Ève. En effet cette dernière peut, dans son
laboratoire le long de la ligne de transmission, effectuer la même mesure que
Bob ; ceci la conduit à absorber le photon envoyé par Alice, mais elle a la
possibilité de renvoyer ensuite un autre photon sur la ligne de communication
avec la polarisation qu’elle vient de mesurer. Bob reçoit alors exactement les
mêmes signaux qu’en l’absence d’intervention de Ève, sans que lui ni Alice
ne puissent se rendre compte qu’ils sont espionnés.
Le protocole BB84 (pour Bennett et Brasssard, 1984 [379]) permet de
s’affranchir de ce risque. Il met en jeu l’utilisation de deux bases différentes
pour les polarisations, celle déjà mentionnée des deux états |H et |V , et en
plus une base de deux nouveaux états :
|A = √1
2
[|H + |V ]
(VIII-13)
|B = √1
2
[|H − |V ]
3 5 9 5¶
$
V
+ %
$OLFH %RE
échange permet à Bob de ne retenir que les bits mesurés dans le cas où les
bases sont les mêmes, et de rejeter les autres mesures comme inutiles. Ce
sont alors les bits retenus qui constituent la clé secrète, dont le nombre est
proche de la moitié du nombre de particules envoyées par Alice (si ce nombre
est grand). Cette méthode peut sembler compliquée, mais nous allons voir
qu’elle assure que toute interception des données devient ainsi détectable par
Alice et Bob.
3RODULVDWLRQVG¶$OLFH
9 $ 9 + % % + 9
%LWVHQYR\pV
'LUHFWLRQVG¶DQDO\VH
GH%RE
5pVXOWDWVGH%RE
%LWVGHODFOp FRPPXQH
passer inaperçue, à chaque interception elle renvoie vers Bob une particule de
même polarisation. Mais, au moment du transfert des particules quantiques
(avant communication des bases entre Alice et Bob), aucune information n’est
disponible sur la polarisation utilisée par Alice, de sorte qu’Ève ne sait pas
si elle doit effectuer l’analyse selon la base {|H , |V } ou la base {|A , |B} ;
nous avons vu au § A qu’il lui est impossible de déterminer l’état quantique
d’une particule unique, et que de plus le théorème du non-clonage lui interdit
de pouvoir multiplier la particule reçue en plusieurs particules dans le même
état. Pour finir, tout comme Bob, Ève a une chance sur deux de se tromper
de base. Si par exemple Alice a utilisé la première et Ève la seconde, cette
dernière recevra un état |H ou |V mais renverra une particule dans l’un
des états |A ou |B, ce qui perturbe le flux de particules reçues par Bob et
peut créer des anomalies visibles. Comme il y a une chance sur deux qu’Ève
se trompe de base, et ensuite une chance sur deux que cela entraîne une
perturbation du résultat observé par Bob, c’est au total dans 25 % des cas
que la perturbation créée par Alice se traduit par une telle anomalie.
La stratégie d’Alice et Bob est donc de sacrifier un certain nombre des
bits obtenus lorsque les bases coïncident, de se les communiquer publique-
ment, ce qui leur permet de vérifier qu’ils sont bien identiques comme attendu
(Fig. VIII.2) ; peu importe qu’Ève intercepte alors la valeur de ces bits sacri-
fiés, puisqu’ils ne seront plus utilisés. Alice et Bob comparent leurs résultats
et, s’ils diffèrent de 25 % environ, c’est que quelqu’un est en train de s’in-
terposer dans leur communication. Ainsi, tout ce que Ève peut faire pour
obtenir de l’information modifie inévitablement les propriétés de corrélation
des photons observées aux deux extrémités du canal de communication. Alice
et Bob peuvent donc se rendre compte de la tentative d’intrusion – en suppo-
sant évidemment qu’ils comparent soigneusement leurs données et les taux
de corrélation.
Bien sûr, notre discussion est simplifiée et se limite aux principes géné-
raux. Dans la pratique, même lorsqu’Alice et Bob utilisent la même base et en
l’absence d’Ève, la coïncidence entre leurs résultats n’est pas parfaite, à cause
de diverses perturbations qui peuvent se produire lors de la propagation et
lors des mesures. Si le taux des erreurs introduites ne dépasse par une certaine
valeur, on peut alors parfaitement avoir recours à toutes les techniques habi-
tuelles mettant en œuvre les codes classiques de corrections d’erreur (comme
ceux qui servent lors de la lecture des CD ou des disques durs d’ordinateurs,
par exemple des contrôles de parité) ; on réduit alors encore un peu la taille
de la clé, mais on élimine efficacement des erreurs aléatoires. Pour une dis-
cussion des diverses méthodes d’amplification de la confidentialité (“privacy
amplification” et “quantum secret growing” en anglais), nous renvoyons à la
Ref. [383].
Le schéma fonctionne en principe avec des particules quantiques quel-
conques mais, en pratique, ce sont généralement des photons se propageant
B. CRYPTOGRAPHIE QUANTIQUE 249
dans des fibres optiques. Or ces dernières modifient la polarisation des pho-
tons, au risque de détruire les corrélations utilisées dans la transmission de
la clé. Pour résoudre ce problème, Bennett [384] a proposé une autre tech-
nique mettant en jeu une résolution temporelle, et où Alice et Bob font cha-
cun usage d’un interféromètre de Mach-Zhender muni d’un réglage de phase
ajustable dans un bras. Chaque photon émis dans le laboratoire d’Alice peut
atteindre les détecteurs de Bob via plusieurs chemins quantiques, dont deux
interfèrent dans l’impulsion temporelle qu’il mesure. L’effet d’interférence
quantique qui se produit alors est très similaire à l’interférence entre deux
polarisations différentes dans le schéma précédent ; un protocole analogue se
basant sur des mesures quantiques associées à des opérateurs ne commutant
pas peut être utilisé pour transmettre des clés cryptographiques. Ce schéma a
été mis en pratique avec succès dans une expérience en 1993 [385] et continue
à être utilisé.
des deux partenaires les résultats de mesures où il se trouve que les deux
choix de directions de mesure ont coïncidé. Avec ce protocole, souvent appelé
“protocole EPR”, la clé cryptographique extraite par Alice et Bob de leurs
mesures est totalement aléatoire : aucun d’entre eux ne peut imposer la suite
de bits constituant la clé (alors que, dans le protocole BB84, Alice pourrait
la choisir), mais cela n’affecte en rien son utilisation dans la transmission
ultérieure de messages.
La discussion des possibilités d’intrusion par Ève est du même type que
plus haut : comme Ève ne sait pas quelle base sera utilisée par Alice et
Bob, toute intervention de sa part implique une probabilité importante de
modifier les corrélations entre les polarisations des spins observées par les
deux partenaires dans les cas où ils ont choisi la même base. Plus précisément,
au moment où Ève effectue une mesure sur un des spins et trouve un résultat,
l’autre spin est projeté dans un état propre selon la direction de mesure qu’elle
a choisie, avec la valeur propre opposée. Si Ève renvoie sur la ligne un second
spin ayant la polarisation correspondant à son résultat de mesure, et si par
hasard Alice et Bob choisissent une direction d’analyse parallèle à celle d’Ève,
ils vont constater une anti-corrélation parfaite de leurs résultats, comme si
de rien n’était : l’intervention d’Ève n’est pas visible. En revanche, si par
hasard ils choisissent une direction commune perpendiculaire à celle d’Ève, il
apparaît une chance sur deux pour qu’ils observent le même résultat, ce qui
serait impossible sans la perturbation imposée par Ève ; un taux d’erreur de
25% s’introduit alors. Ainsi, si Alice et Bob décident de sacrifier une fraction
de leurs résultats à une vérification de l’absence de toute perturbation, comme
dans le protocole BB84, ils peuvent aisément s’assurer de la confidentialité
de leur communication.
De plus, ils peuvent utiliser un éventail plus varié de directions de me-
sures, en particulier celles qui conduisent à une violation quantique des in-
égalités BCHSH [135] ; ceci fournit un autre test qui leur permet de vérifier
qu’aucune intervention sur les deux spins n’a été faite entre les sources et les
deux régions de mesure. En effet, la direction choisie par Ève et le résultat
qu’elle observe jouent un rôle semblable à la variable supplémentaire λ, qui
ici détermine la polarisation des particules reçues par les deux partenaires ;
les moyennes sur cette variable conduisent tout naturellement aux inégalités
BCHSH (on tombe en fait ici sur le cas précis étudié dans l’Appendice C).
Si donc Alice et Bob vérifient qu’ils sont capables d’obtenir des résultats qui
conduisent à des violations des inégalités, ils vérifient en quelque sorte que
personne n’a projeté entre temps la polarisation de leurs photons sur une
direction donnée, et donc la confidentialité de la transmission. On voit ainsi
apparaître un lien intéressant entre le théorème de Bell et la cryptographie
quantique.
Sur le plan conceptuel, le protocole EPR reste cependant assez différent
du protocole BB84 puisque, au moment où Ève peut tenter son intrusion dans
C. TÉLÉPORTATION D’UN ÉTAT QUANTIQUE 251
le système, l’information qui sera utilisée par Alice et Bob pour construire
leur clé n’existe toujours pas : tous les résultats possibles de toutes les com-
posantes des spins sont toujours potentiellement présents dans l’état intriqué
singulet, puisqu’aucune mesure n’a encore été effectuée – en d’autres termes
l’information utile n’existe pas encore. Nous l’avons vu, si Ève s’interpose,
c’est elle en quelque sorte qui prend la responsabilité de projeter le vecteur
d’état et d’attribuer des polarisations définies aux spins ; on comprend assez
aisément que cette opération soit détectable par Alice et Bob.
On peut aller encore plus loin dans cette direction et envisager un schéma
ou, pour les événements utiles à la construction de la clé, aucune particule
ne se propage dans la ligne de transmission où Ève pourrait s’interposer ; il
a déjà été discuté brièvement à la fin du § D du Chapitre II – voir aussi la
Ref. [83]. Il s’agit d’un protocole mettant en jeu des mesures ne concernant
qu’une seule particule ; la construction de la clé se fait à partir des événements
où la particule est restée localisée dans le laboratoire d’Alice, de sorte qu’elle
ne s’est jamais propagée entre les laboratoires d’Alice et Bob, à cause d’un
effet d’interférence destructive. C’est un cas extrême où, pour les événements
retenus dans la distribution de la clé, aucune particule ne se propage entre
les partenaires, ce qui interdit évidemment à Ève toute intervention.
Ceci ne clôt pas la liste des protocoles possibles pour la distribution quan-
tique de clés cryptographiques. Il est possible par exemple d’utiliser des pro-
tocoles mettant en jeu six états quantiques, ou des systèmes quantiques in-
dividuels dont la dimension de l’espace des états est plus grande que 2 ; à
nouveau nous renvoyons à l’article de revue [383] pour plus de détails.
2
Pour filtrer un état de spin, il est évident que l’on a besoin d’utiliser une méthode
non destructive dans la détection de la particule après l’aimant de Stern et Gerlach. On
pourrait par exemple imaginer un schéma de détection laser, conçu de façon que l’atome
passe par un état excité et émette alors un photon en retournant vers son état fondamental
de départ (cycle de pompage optique fermé, ce qui est possible par un choix approprié de
la transition atomique et de la polarisation du laser).
C. TÉLÉPORTATION D’UN ÉTAT QUANTIQUE 253
Figure VIII.3 – Une source S émet deux particules de spin 1/2 intriquées,
qui se propagent vers Alice et Bob. Alice reçoit en plus une particule de spin
1/2 qui se trouve dans un état arbitraire |ϕ, qu’elle ne connaît pas. Elle ef-
fectue alors une mesure M qui met en jeu à la fois cette particule et l’une des
particules de la paire émise par S. Ensuite elle envoie un message à Bob pour
lui communiquer le résultat de son expérience (deux bits d’information clas-
sique). Bob fait usage de cette information pour effectuer sur sa particule une
transformation unitaire qui lui permet de transférer sa particule exactement
dans le même état que la particule lointaine fournie à Alice. Ce proccessus
est souvent appelé “téléportation quantique”.
inconnu d’elle. En second lieu, le message envoyé ne contient que deux bits3
d’information binaire classique (le résultat de l’expérience combinée faite par
Alice), ce qui ne procure pas suffisamment d’information pour reconstruire
un état quantique (un état quantique dépend de paramètres continus). En un
certain sens, le processus de téléportation a réussi à transformer une infor-
mation binaire finie en une information continue ! Cette dernière, en théorie
classique de l’information, correspondrait à un nombre infini de bits.
Du point de vue de Bob, l’information reçue comprend deux compo-
santes : de l’information classique envoyée par Alice, dont le contenu n’est
pas décidé par elle, mais décrit le résultat aléatoire d’une expérience ; de
l’information quantique contenue dans l’état téléporté (que nous appelons
3
Alice peut observer quatre résultats différents avec son expérience sur deux particules.
254 CHAPITRE VIII. APPLICATIONS DE L’INTRICATION
“qubit” dans le § suivant), qui peut être contrôlée par elle. Si la téléportation
est répétée un grand nombre de fois sur le même état préparé par Alice, grâce
à des mesures successives Bob pourra déterminer l’état quantique avec une
précision arbitraire, donc la direction qui a été choisie par Alice ; il reçoit de
sa part un message réel (pour une discussion de la stratégie optimale que
Bob devrait utiliser, voir Ref. [390]).
Ainsi, si l’on veut présenter la téléportation d’une façon sensationnelle,
on peut expliquer que, avant même que Bob ne reçoive l’information clas-
sique, il a déjà reçu “presque toute l’information” sur l’état quantique, et
de plus toute l’information contrôlable (le contenu du message classique est
totalement aléatoire) ; cette “information” lui est parvenue de façon instan-
tanée, exactement au moment où Alice a effectué sa mesure combinée, sans
aucun retard qui soit proportionnel à la distance parcourue. Le reste de cette
information, la différence entre une information continue et une information
discrète, ne vient qu’ensuite, puisqu’il est soumis au retard minimal de trans-
mission imposé par la relativité. Mais tout ce raisonnement fait intervenir
une notion intuitive de “différence entre l’information quantique contrôlable
et l’information classique non contrôlable” que nous n’avons pas définie de fa-
çon précise ; inutile de dire que cela n’implique aucune violation des principes
de base de la relativité !
Pour finir, est-ce que véritablement “quelque chose” a été transporté dans
la téléportation, ou seulement de l’information ? Ce qui est parfaitement clair
est que ce qui est transporté est un état quantique, pas une particule. L’es-
sence même du processus de téléportation est totalement différente d’aucun
scénario imaginable pour la communication classique entre des êtres humains.
La relation entre la téléportation quantique et les expériences de non-localité
de Bell est discutée dans [391] ; voir aussi [392] ainsi que [393] pour une revue
de résultats récents, et [394] pour une expérience de téléportation d’un état
GHZ à N photons grâce à une seule paire de particules intriquées. Récem-
ment, un groupe a mis en évidence la téléportation d’états quantiques de
photons dans l’espace libre sur une distance de 16 kilomètres [395].
L’idée générale du calcul quantique [403] est de baser des calculs numé-
riques, non plus sur des “bits” classiques qui ne peuvent occuper que deux
états discrets (correspondant à 0 et 1 dans la notation binaire habituelle),
mais sur des bits quantiques ou “qubits”, c’est-à-dire sur des systèmes quan-
tiques qui ont accès chacun à un espace des états à deux dimensions. Ceci
implique que des qubits peuvent, non seulement être dans des états |0 et
|1, mais aussi dans n’importe quelle superposition linéaire de ces états. Pour
un seul qubit, il est déjà clair qu’un continuum d’états est bien “plus grand”
que seulement deux états. Pour un ensemble de nombreux bits classiques ou
quantiques, la différence est encore plus grande : pour des bits classiques, la
dimension de l’espace des états augmente linéairement avec leur nombre (par
exemple, l’état d’un système à 3 bits définit un vecteur à trois composantes,
égales à 0 ou 1) ; pour des qubits, la dimension croît exponentiellement (c’est
une propriété du produit tensoriel d’espaces ; par exemple, pour 3 qubits, la
dimension de l’espace est 23 = 8). Si donc l’on suppose qu’un nombre im-
portant de qubits est disponible, on a accès à un espace des états avec une
“taille” énorme, au sein duquel un nombre immense d’effets d’interférence
peuvent se produire.
On comprend alors que, si l’on pouvait d’une façon ou d’une autre faire
“travailler en parallèle” toutes les branches du vecteur d’état pour réaliser
des calculs indépendants, on pourrait réaliser des calculs bien plus rapides,
au moins en théorie. Supposons par exemple que l’on souhaite résoudre un
système d’équations qui dépende d’un paramètre ; on pourrait imaginer un
algorithme où le système de qubits soit mis dans une superposition d’états
associés chacun à une valeur du paramètre, contenant simultanément toutes
les solutions des équations pour toute une série de valeurs du paramètre.
Mais la difficulté est alors d’avoir accès à ces composantes : on ne peut pas
mesurer directement les composantes d’un vecteur d’état, comme on le ferait
pour une variable classique. Toutefois, des protocoles de mesures quantiques
peuvent être conçus qui permettent effectivement de faire usage d’une partie
de ce “parallélisme quantique”, ce qui ouvre bien des possibilités. La notion
de complexité de calcul unique pour un problème mathématique donné, qui
limite l’efficacité des calculateurs classiques, ne s’applique plus de la même
façon.
Un résumé de l’histoire et de la préhistoire du calcul quantique se trouve
par exemple dans la Ref. [404]. Feynman, au cours d’une conférence don-
née en 1981 au MIT, avait remarqué qu’il semble en général impossible de
simuler avec une efficacité raisonnable l’évolution d’un système quantique
avec un ordinateur classique. Ceci l’a conduit à proposer un modèle de base
pour un calculateur quantique qui accomplirait cette tâche. En 1985, David
Deutsch [403] a décrit un “calculateur quantique universel”, ou “machine de
256 CHAPITRE VIII. APPLICATIONS DE L’INTRICATION
(si les deux états de base |0 et |1 correspondent à des états de photons
polarisés horizontalement et verticalement, l’effet de H est de tourner les po-
larisations linéaires de 45◦ ). Il existe également des portes quantiques agissant
sur les états à deux qubits, comme la “porte cNOT” (pour “controlled not”
en anglais) qui agit à la fois sur un qubit de contrôle et sur un qubit cible.
Pour une introduction aux différentes portes et une discussion simple de la
façon de les utiliser pour mettre en œuvre des algorithmes quantiques, voir
par exemple le § 6.5 de [389] ou le Chapitre 8 de [405].
Parmi les algorithmes quantiques, on cite souvent en premier celui de
Shor [406], qui a remarqué que la factorisation de grands nombres entiers en
facteurs premiers pourrait devenir immensément plus rapide que par des mé-
thodes classiques ; une discussion générale des relations entre la mécanique
quantique et la factorisation des nombres est donnée dans la Ref. [407], ou
avec plus de détails dans le Chapitre 3 de [400]. L’algorithme de Grover [408]
est un algorithme quantique qui permet la recherche de données à l’inté-
rieur d’une base d’une façon bien plus efficace que le calcul classique (le
gain est quadratique en fonction du nombre d’objets dans la base). C’est un
algorithme probabiliste qui donne la réponse correcte avec une grande pro-
babilité, la probabilité d’échec pouvant être diminuée autant que nécessaire
en répétant l’algorithme – pour plus de détails voir le Chapitre 4 de [400].
L’algorithme de Deutsch-Jozsa [409] fournit un autre cas où le gain obtenu
par le calcul quantique est exponentiel (voir par exemple § 2.2 de [400]).
Des gains analogues de la vitesse de calcul sont prédits pour la simulation
de systèmes quantiques à beaucoup de particules [410]. Le gain théorique en
vitesse est fonction du problème considéré, polynômial ou exponentiel selon
D. CALCUL ET SIMULATION QUANTIQUES 257
les cas ; mais il existe aussi des cas où aucun gain n’est obtenu ! Plus récem-
ment, un nouvel algorithme a été proposé pour obtenir des informations utiles
sur de très grands systèmes d’équations linéaires, en fournissant des valeurs
approchées de quantités mathématiques dépendant de la solution [411].
D’un point de vue fondamental, les différences sont nombreuses entre
bits classiques et qubits quantiques. Nous l’avons vu, les bits classiques pos-
sèdent deux états de référence fixés une fois pour toutes, alors que les qubits
peuvent utiliser n’importe quelle base orthogonale dans leur espace des états,
mais ceci est loin d’être la seule différence. Par exemple, les bits classiques
peuvent être copiés à volonté et un nombre infini de fois (en particulier grâce
à l’application de codes de corrections d’erreurs), alors que le théorème du
non-clonage interdit de faire de même pour des qubits. Mais, d’un autre côté,
les bits classiques ne peuvent être transmis qu’à l’intérieur de cônes de lu-
mière et dans la direction avant, alors que l’utilisation de l’intrication et de
la téléportation permet de s’affranchir dans certains cas de cette limitation
pour des qubits. Une autre différence est que l’information est codée moins
directement dans les bits quantiques que classiques : pour transmettre et re-
cevoir une information utilisable à partir de qubits, il faut spécifier quelles
sortes de mesures doivent être faites avec eux (ce point est relié à la flexibilité
dans l’espace des états mentionnée ci-dessus). Comme le processus de mesure
quantique met en jeu un processus fondamentalement aléatoire, souvent l’al-
gorithme fournira le résultat avec une certaine composante aléatoire, de sorte
qu’il peut devenir nécessaire de le répéter. Pour finir, comme tous les êtres
humains, Alice et Bob ne peuvent communiquer directement qu’à un niveau
classique, en ajustant des paramètres macroscopiques de leurs appareils de
mesure, et en observant des éclairs lumineux rouges ou verts associés aux
résultats de mesure. Pour paraphraser Bohr (voir la fin du § B-3 au Chapitre
I), nous pourrions dire que “il n’existe pas de concept d’information quan-
tique ; l’information échangée entre humains est classique de façon inhérente,
mais peut être transmise par l’intermédiaire de qubits quantiques”. En dépit
de cette remarque, tout ce champ de recherches très actives et intéressantes
est généralement appelé “théorie de l’information quantique”.
qui est un nombre plus grand mais reste toujours modeste. Les progrès sont
constants mais, pour le moment, nous sommes encore loin des applications
pratiques !
“répéteurs quantiques” [425] a été introduite pour corriger l’effet des imper-
fections et du bruit dans les communications quantiques. Une autre approche
très différente du calcul quantique a été proposée, basée sur un concept semi-
classique où les qubits sont toujours utilisés, mais communiquent entre eux
uniquement par des signaux classiques macroscopiques, signaux qui sont uti-
lisés pour déterminer le type de mesure à réaliser sur le qubit suivant [426] ;
ce genre de calculateur devrait être moins sensible à la décohérence.
Une autre façon de procéder est de contrôler avec précision le couplage
d’un système quantique avec son environnement. Si en général, pour de nom-
breuses formes de dissipation, la décohérence tend à détruire les effets qui
sont à la base du calcul quantique, la dissipation peut parfois avoir l’effet
opposé. Ainsi, avec un bon contrôle du couplage du système à un réservoir
externe, l’environnement peut en fait conduire le système vers un état quan-
tique dans lequel le résultat du calcul quantique est contenu [420, 421, 427].
De façon générale, personne ne peut prévoir avec certitude s’il sera un jour
possible de bloquer la décohérence dans un système physique suffisamment
grand pour que le calcul quantique devienne un véritable outil de calcul utile.
De plus, bien que la factorisation de nombres premiers soit une question
importante (en particulier pour la cryptographie), ainsi que le problème à N
corps quantiques, il serait utile de pouvoir généraliser ce genre d’approche
à une classe plus large de problèmes ! L’avenir dira si, oui ou non, le calcul
quantique doit réussir la percée attendue. Quoi qu’il en soit, il s’agit d’un
domaine de recherche passionnant.
Le but d’un autre champ de recherches relié au précédent est, non pas
d’utiliser des systèmes quantiques pour réaliser des calculs abstraits (comme
la factorisation de grands nombres), mais d’obtenir des simulations. L’idée,
introduite par Feynman dans des exposés célèbres en 1959 et 1981 [428],
est de simuler le système physique quantique auquel on s’intéresse par un
autre système physique qui est plus facile à manipuler. Il est bien connu
que le calcul direct des propriétés d’un grand système physique quantique,
comme ceux que l’on rencontre fréquemment en matière condensée, pose
des problèmes de calcul redoutables. On peut alors songer à remplacer le
grand système par un autre qui se comporte de la même façon, tout en
étant plus accessible et contrôlable sur le plan expérimental, afin d’obtenir
des informations utiles sur le comportement des deux systèmes. De façon
générale, deux types de simulations quantiques sont possibles : la simulation
numérique (“digital simulation” en anglais), où les calculs sont réalisés avec
un calculateur quantique ; la simulation analogique, où l’on ne fait pas de
calculs mais où l’on observe les propriétés du premier système qui imite le
second. Pour une revue de ce champ de recherches, voir les Refs. [429], [430]
260 CHAPITRE VIII. APPLICATIONS DE L’INTRICATION
Mesure quantique
A. Mesures directes
Supposons que la quantité physique mesurée sur S soit décrite, dans son
espace des états, par un opérateur A dont les vecteurs propres normés sont
les kets |an avec les valeurs propres an (que nous supposons non dégénérées
pour simplifier l’écriture) :
qui est maintenant un état où l’appareil de mesure est intriqué avec le système
mesuré S. Après la mesure, on ne peut plus attribuer un vecteur d’état au
système S (état pur), mais seulement un opérateur densité obtenu par trace
partielle. Comme les |Φn sont mutuellement orthogonaux et normés, cet
opérateur densité est donné par :
ρS = T rM Ψ Ψ = |cn |2 |an an | (IX-8)
n
Cette formule paraît très naturelle : elle nous dit que le système mesuré
a une probabilité |cn |2 de se trouver dans chacun des états |ϕn associés aux
résultats de mesure an , ce qui correspond bien à la règle des probabilités habi-
tuelles de Born. C’est donc une formule très utile qui résume de façon simple
un certains nombre de caractéristiques du postulat de la mesure en méca-
nique quantique. Cependant, et comme nous l’avons déjà indiqué à plusieurs
reprises (en particulier aux §§ A et B du Chapitre II), elle ne contient pas une
composante essentielle de ce postulat : l’unicité du résultat de mesure (émer-
gence de l’unicité macroscopique). Tous les résultats possibles continuent à
être présents dans la trace partielle, étant considérés comme également pos-
sibles même après la mesure ; ceci semble contradictoire avec l’observation
d’un seul résultat bien défini lors d’une réalisation unique de l’expérience.
Rien de surprenant à cela : la relation (IX-8) n’est qu’une conséquence di-
recte de l’équation de Schrödinger, qui est incapable à elle seule de faire
cesser la progression sans fin de la chaîne de von Neumann, et donc d’assurer
l’unicité macroscopique.
Comme nous l’avons vu au § B-2-a du Chapitre I, pour résoudre ce pro-
blème, von Neumann a introduit un postulat spécifique : le postulat de ré-
duction du vecteur d’état, dont le but est de forcer l’apparition de l’unicité
264 CHAPITRE IX. MESURE QUANTIQUE
Hint = g A PM (IX-9)
[XM , PM ] = i (IX-10)
L’état (IX-7) du système total après la mesure est un état intriqué, écrit
dans la base associée à la mesure. Mais nous avons remarqué dans le § B-1
du Chapitre VII que, pour un état intriqué, plusieurs développements de ce
type sur des bases différentes sont possibles (ambigüité de l’intrication). Cela
signifie-t-il que la nature même de l’observable mesurée dans le processus est
également ambigüe ? Il n’en est rien car, pour correspondre à une mesure
utilisable, n’importe quel processus d’interaction ne convient pas ; plusieurs
conditions doivent être respectées.
En premier lieu, nous avons vu dans le § A-1-b que l’observable mesurée
dépend de la forme de l’interaction entre S et l’appareil de mesure ; dans ce
modèle simple, les états propres de la mesure |an sont invariants sous l’effet
de cette interaction. Une seconde condition, évidente, est que les états |Φn
de l’appareil de mesure M doivent stocker l’information correspondant au
résultat de mesure de façon robuste, et ne pas la détruire immédiatement
4
Inutile de dire qu’un appareil de mesure est macroscopique et possède bien d’autres
degrés de liberté que la seule position du pointeur. Pour simplifier, nous n’introduisons
pas ces degrés de liberté dans les notations.
5
Des mesures QND peuvent par exemple être réalisées en optique quantique [438]. Au
cours du Chapitre X, nous donnons d’autres exemples de mesures QND.
266 CHAPITRE IX. MESURE QUANTIQUE
tant un cadran sur lequel se déplace une aiguille, cette base correspondra
à des états où l’aiguille est bien localisée en position (par opposition, par
exemple, avec une base constituée avec des états propres de l’impulsion du
centre de masse de l’aiguille, ou de n’importe quel état s’étendant dans une
grande région de l’espace). Zurek parle de “einselection” (pour “environment
induced selection”) pour décrire le phénomène.
C’est une idée importante : la constitution physique même d’un appareil
de mesure détermine la façon dont il est couplé à l’environnement, et c’est
l’hamiltonien responsable de ce couplage qui détermine la base des états poin-
teurs [445]. En fait, si la dynamique propre de l’appareil n’est pas prise en
compte, ces états sont simplement les vecteurs propres d’un opérateur réduit
qui commute avec l’hamiltonien d’interaction entre l’appareil de mesure et
son environnement [440] ; si cette dynamique est prise en compte, la situa-
tion est plus compliquée. Nous voyons ainsi apparaître plusieurs conditions
nécessaires pour qu’un dispositif puisse être considéré comme un appareil de
mesure satisfaisant pour donner accès à une grandeur physique de S ; il faut
évidemment que le couplage entre S et M soit approprié pour transférer la
bonne information de l’un à l’autre ; il faut également que cette information
transférée reste ensuite stable dans le temps vis-à-vis de l’évolution propre
de M , ainsi que du couplage entre M et E ; il faut enfin qu’elle soit robuste
vis-à-vis des perturbations.
Sur le plan fondamental cependant, la même remarque que plus haut
s’applique une fois de plus : la base des états pointeurs est certes privilé-
giée, en ce sens qu’elle correspond à des populations auxquelles on peut avoir
accès (alors que les effets de cohérence entre ces états se propagent rapide-
ment de plus en plus loin dans l’environnement, ce qui les rend rapidement
impossibles à observer). Cependant cette cohérence, même inobservable en
pratique, existe toujours, se contentant de se propager de façon de plus en
plus complexe dans l’univers physique ; après la mesure, la disparition de tous
les résultats au profit d’un seul d’entre eux n’est pas contenue dans la théorie,
de sorte qu’il faut bien recourir à un postulat indépendant pour l’expliquer.
Zurek [446] (voir également § VI-D de [441] et § III-F de [340]) a cependant
proposé d’utiliser la notion qu’il appelle “envariance” (“environment-assisted
invariance”), une symétrie que présentent les systèmes quantiques corrélés,
pour décrire la nature de l’ignorance statistique et en déduire la règle de
Born ainsi que la classicalité macroscopique, sans faire appel à la notion de
mesure ou de réduction du vecteur d’état.
l’effet tunnel. Supposons par exemple qu’une molécule isolée se trouve dans
l’état initial |L ; si la molécule était parfaitement isolée, elle oscillerait entre
cet état et l’état |R sous l’effet de son hamiltonien interne, à une fréquence
qui est déterminée par le taux d’effet tunnel entre ces états. Mais, en présence
des interactions avec l’environnement, cette oscillation ne se produit pas, la
molécule restant bloquée dans l’état |L (ce blocage porte parfois le nom de
“effet Zénon quantique”).
Considérons une particule de spin 1/2 qui est initialement dans un état
orbital |u0 et dans un état de spin |+ (vecteur propre de valeur propre /2
de la composante Sz du spin le long de l’axe Oz). La particule se propage
vers un aimant de Stern et Gerlach, qui fait partie d’un appareil de mesure
de cette composante. L’état initial du système total est :
|Ψ0 = |+ ⊗ |u0 ⊗ |M0 (IX-18)
où |M0 est l’état initial de l’appareil de mesure, qui est décrit en général par
un nombre macroscopique de variables (les positions de toutes les particules
qui constituent l’appareil). Il est commode d’introduire le ket |Φ décrivant à
la fois les variables orbitales de la particule et l’appareil de mesure ; la valeur
initiale |Φ0 de ce ket est :
|Φ0 = |u0 ⊗ |M0 (IX-19)
Comme dans (IX-3), l’état initial décrivant le système total est alors :
|Ψ0 = |+ ⊗ |Φ0 (IX-20)
Comme l’état initial est un état propre de la composante du spin mesurée,
après interaction avec l’appareil de mesure l’état du système total est, selon
le modèle de von Neumann du § A-1 :
Ψ+ = |+ ⊗ Φ+ (IX-21)
270 CHAPITRE IX. MESURE QUANTIQUE
En général, l’état initial du spin est une combinaison linéaire des deux états
de spin précédents :
|ϕS = c1 |+ + c2 |− (IX-25)
La linéarité de l’équation de Schrödinger impose alors que le vecteur d’état
|Ψ après la mesure doit prendre la valeur |Ψ qui est la combinaison li-
néaire :
Ψ = c1 |+ ⊗ Φ+ + c2 |− ⊗ Φ− (IX-26)
Le moment cinétique J du système total est la somme du moment an-
gulaire de spin S de la particule, de son moment cinétique orbital L, et du
moment cinétique M de l’appareil de mesure :
J=S+L+M=S+T (IX-27)
De façon similaire, lorsque le vecteur d’état évolue depuis (IX-22) vers (IX-23),
nous devons avoir :
Φ0 | T |Φ0 = Φ− T Φ− (IX-29)
Ainsi, les valeurs moyennes du moment cinétique dans les états Φ+ et Φ−
sont toutes deux nécessairement égales.
A. MESURES DIRECTES 271
A-4-b. Généralisation
J =S+T (IX-37)
272 CHAPITRE IX. MESURE QUANTIQUE
A-4-c. Discussion
avec :
an = |an + ε |un (IX-46)
où ε est un petit nombre. Nous limitons le calcul au premier ordre en ε ; si le
produit scalaire entre |un et |an s’annule, |an reste normalisé à cet ordre.
Alors :
Ψn J Ψp = δn,p an | S |ap + δn,p Φn T Φp
+ ε an |up Φn T Φp + ε up |an Φp T Φn + ε2 ...
(IX-47)
Du fait que les éléments de matrice Φn | T Φp et Φp T |Φn concernent un
système macroscopique, ils peuvent être beaucoup plus grands que ceux de
S, de sorte que la correction ajoutée par les termes en ε peut être importante.
Une petite non-orthogonalité des états finals de S peut donc introduire une
grande correction au membre de droite de (IX-43), rendant possible la conser-
vation de la valeur moyenne de J. Des discussions générales des conséquences
du théorème WAY peuvent être trouvées dans les Refs. [455, 456].
B. Mesures indirectes
Les deux kets |ϕ0 et |Φ0 sont normalisés. Comme les évolutions propres de
S et B sont ignorées, l’opérateur d’évolution entre les instants t = 0 et t = τ
est :
U (0, τ ) = e−igτ σz (S) Ξ(B)/ (IX-51)
Si S est initialement dans l’un des états |+ ou |−, la relation (IX-5)
devient :
|Ψ0 = |± ⊗ |Φ0 =⇒ Ψ = |± ⊗ Φ±B (IX-52)
avec : ±
Φ = e∓igτ Ξ(B)/ |Φ0 (IX-53)
B
L’état de S est alors inchangé, et ne sera pas affecté non plus par n’importe
sur B, puisque les deux systèmes ne sont pas intri-
quelle mesure effectuée
qués. Notons que Φ± B sont des vecteurs normalisés, car obtenus par action
B. MESURES INDIRECTES 275
d’opérateurs unitaires sur |Φ0 . Toutefois, ils ne sont en général pas orthogo-
naux : par exemple, si la constante de couplage g tend vers zéro, ils tendent
tous les deux vers le même vecteur |Φ0 dans l’espace des états de B.
Dans le cas plus général où S est initialement dans l’état (IX-50), l’en-
semble S + B après interaction est décrit pas l’état intriqué :
Ψ = U (0, τ ) |ϕ0 |Φ0 = α |+ Φ+ + β |− Φ− (IX-54)
B B
Le système S est de nouveau dans un état pur, l’état ϕq donné par :
ϕq = α Θq Φ+ |+ + β Θq Φ− |− (IX-57)
B B
soit :
ϕq = Mq |ϕ0 (IX-58)
où Mq est l’opérateur agissant dans ES défini par :
−
Mq = Θq Φ+
B |+ +| + Θq ΦB |− −| (IX-59)
Une sommation sur l’indice q dans (IX-61) introduit alors une relation de
fermeture sur la base {|Φq }, et l’on obtient :
NB
+ − −
Mq† Mq = Φ+
B ΦB |+ +| + ΦB ΦB |− −| = |+ +| + |− −|
q=1
(IX-63)
c’est-à-dire :
NB
Mq† Mq = 1 (IX-64)
q=1
qui entraîne que la somme des probabilités vaut 1, comme on s’y attendait
pour une série d’opérateurs de Kraus introduits6 dans le § D-1-a du Cha-
pitre VII.
Ainsi la série des opérateurs :
Πq = Mq† Mq (IX-65)
Nous supposons maintenant que la même mesure que ci-dessus est effec-
tuée sur le système B : les résultats (non dégénérés) possibles bm sont associés
aux vecteurs orthonormés |Θm . Le ket |Ψ peut être développé selon :
NS
NB
Ψ = cn Θm |ΦnB |un ⊗ |Θm (IX-69)
n=1 m=1
La probabilité
Pq d’obtenir le résultat bq est donnée par le carré de la
norme de Ψq dans le développement (IX-69) du vecteur d’état avant la
mesure. Selon (IX-72), cette probabilité est :
Pq = ϕ0 | Mq† Mq |ϕ0 Θq |Θq
= ϕ0 | Mq† Mq |ϕ0 (IX-73)
Comme la somme des probabilités est égale à l’unité, et comme |ϕ0 est un
ket quelconque dans ES , la règle de somme (IX-64) est conséquence de cette
relation. Les Mq sont des opérateurs de Kraus (§ D-1-a du Chapitre VII).
Définissons alors les opérateurs Πq par :
Πq = Mq† Mq (IX-74)
nous voyons que leur somme est égale à l’opérateur identité :
NB
Πq = 1 (IX-75)
q=1
avec :
Π1 + Π2 = 1 (IX-78)
Si M0 est un projecteur, ce n’est pas le cas de M1 (son carré est nul) ; les
produits croisés de ces opérateurs sont M0 M1 = M1 et M1 M0 = 0.
Les situations où seule une faible intrication est produite au cours de l’in-
teraction entre S et l’appareil de mesure M sont bien adaptées à la réalisation
de “mesures faibles” ou de “mesures continues”.
−1/4 −(x −x0 )2 /4σ2
xM |Φ0 (x0 ) = 2πσ 2 e M (IX-80)
2 −1/4 2 2
= 2πσ cn dxM e−(xM −x0 ) /4σ |an ⊗ |xM + gτ an
n
(IX-81)
Grâce à un changement de variable d’intégration xM en x = xM + gτ an ,
nous obtenons :
Ψ = 2πσ 2 −1/4 2 2
cn dx e−(x−x0 −gτ an ) /4σ |an ⊗ |x (IX-82)
n
Si le rapport entre les deux éléments de matrice ϕf | A |ϕ0 et ϕf |ϕ0 est
réel, nous obtenons finalement la relation simple :
Ψ ∼ |ϕf |Φ0 (x0 + Δx0 ) (IX-86)
avec :
ϕf | A |ϕ0
Δx0 = gτ (IX-87)
ϕf |ϕ0
7
Comme dans le § B-1, nous supposons pour simplifier que la seule évolution du système
total est due à l’hamiltonien d’interaction entre S et M , ignorant donc l’évolution propre
des deux systèmes isolés.
C. MESURES FAIBLES ET CONTINUES 281
Δx0 est le décalage moyen de la position du pointeur pour cette série par-
ticulière d’événements ; il peut être très grand si ϕf |ϕ0 a un module très
petit. Si le rapport entre les éléments de matrice est complexe :
ϕf | A |ϕ0
= R + iJ (IX-88)
ϕf |ϕ0
sont donc favorables, ce qui implique une post-sélection très sévère ; la plu-
part des événements sont rejetés, de sorte que l’expérience doit être répétée
un très grand nombre de fois afin de donner un résultat significatif. Pour un
spin 1/2, on peut par exemple supposer que
état dans une autre superposition, on peut obtenir des situations où l’évolu-
tion de S est équivalente à celle obtenue par la superposition d’hamiltoniens
différents, ou d’évolutions pendant des périodes de temps différentes [457].
L’idée générale de la mesure de valeurs faibles n’est pas limitée à la phy-
sique quantique, mais s’applique en fait à toute théorie ondulatoire. En op-
tique classique par exemple, pour détecter le faible champ diffusé par un
objet, il est bien connu qu’on peut augmenter le contraste en utilisant des
polariseurs presque orthogonaux sur les faisceaux d’illumination et de détec-
tion. Toute une série d’expériences ont été réalisées pour mesurer des valeurs
faibles, soit dans un régime d’optique classique, ou dans un régime pure-
ment quantique mettant en jeu l’intrication entre particules [458–466]. La
mesure de valeurs faibles a également été utilisée pour tester les inégalités
de Leggett-Garg (§ B-2 du Chapitre IV) [467] ou pour obtenir une “mesure
directe” d’une fonction d’onde quantique [375].
Ψ = 2πσ 2 −1/4 2 2
dx e−(x−x0 −gτ A) /4σ |ϕ0 ⊗ |x (IX-94)
où dxr σ. Après la mesure, l’état |Ψ est obtenu par projection de |Ψ
sur les états propres de XM correspondant à cet intervalle :
xr +dxr /2
−1/4 −(xr −x0 −gτ A)2 /4σ2
Ψ = 2πσ 2
e |ϕ0 ⊗ dx |x (IX-96)
xr −dxr /2
(où a est la plus grande des valeurs propres de A en module) est petit, et
effectuons un calcul au deuxième ordre par rapport à ce paramètre ; la raison
pour laquelle un calcul au premier ordre n’est pas suffisant apparaîtra à la
fin du § C-2-c-β.
xr = x0 + Δx0 (IX-104)
1 2 (xr − x0 )2 2 2
F =− A 0+ A 0 − A0
2 2σ 2
C. MESURES FAIBLES ET CONTINUES 285
xr − x0 − Δx0
ξr = (IX-105)
σ
2
ϕ ∼ e−[ξr − σ (A−A 0 )] /4 |ϕ0
gτ
(IX-106)
Pour obtenir un état normalisé, nous devons donc multiplier le ket par :
gτ 2 " ! −1/2
1+ [A − A0 ]2 2 (ξr )2 − 2 + ... (IX-109)
2σ 0
soit : gτ 2 " !
1− [A − A0 ]2 (ξr )2 − 1 + ... (IX-110)
2σ 0
286 CHAPITRE IX. MESURE QUANTIQUE
α. Mouvement brownien
Considérons une particule se déplaçant sur un axe Ox par sauts aléatoires
se produisant constamment, avec un intervalle de temps δt entre eux. Chaque
saut change la position de la particule d’une quantité ±δl, les deux valeurs
opposées ayant la même probabilité 1/2. Nous nous intéressons à la limite
continue où δl et δt tendent tous deux vers 0. Soit dt un intervalle de temps
que nous divisons en N intervalles plus petits δt = dt/N , correspondant aux
temps t0 , t1 ,...,tr ,...,tN auxquels se produisent des sauts δxr = ±δl. Chaque
saut est caractérisé par une variable sans dimension ξr = δxr /δl = ±1.
• Supposons d’abord que le rapport δl/δt garde une valeur constante :
δl
=c (IX-112)
δt
Comme, pendant l’intervalle de temps dt, la particule fait des sauts dans
les deux directions avec des probabilités égales, la valeur moyenne dx de la
variation de sa position x s’annule :
dx = 0 (IX-113)
En effet, dans le carré de la somme, tous les termes croisés contenant des
produits de deux ξr différents ont une valeur moyenne nulle, de sorte que ne
C. MESURES FAIBLES ET CONTINUES 287
avec10 :
A = ϕ| A |ϕ (IX-127)
Cette équation différentielle stochastique est nettement différente d’une
équation différentielle habituelle, l’équation de Schrödinger par exemple : le
√ en dW est stochastique et singulier, avec une amplitude proportionnelle
terme
à dt, au lieu de dt comme habituellement. Nous comprenons maintenant
pourquoi un calcul du second ordre par rapport à ε était nécessaire : le terme
en D dt provient du carré des variations (δWr )2 , qui est proportionnel à ε2 , et
aurait donc été manqué par un calcul limité au premier ordre11 . Ce terme est
appelé “terme d’Itô”, et l’intégrale correspondante une “intégrale d’Itô” [469].
Bien que le terme stochastique en dW soit bien plus grand que le terme d’Itô
à chaque instant, il est également stochastique et peut avoir des effets opposés
à des instants différents sur l’évolution du vecteur d’état qui se moyennent à
une valeur plus faible. En revanche, le terme d’Itô est non stochastique et a
des effets cumulatifs, qui ne sont pas négligeables à long terme quand on les
compare aux termes stochastiques qui sont bien plus grands. On remarque
également que l’équation (IX-126) est non linéaire, car A dépend de l’état
10
En utilisant (IX-124), on peut vérifier que (ϕ| + dϕ|) (|ϕ + |dϕ) = ϕ |ϕ + 0(dt2 ),
en d’autres termes que (IX-126) conserve la norme du vecteur d’état.
11
Le calcul du second ordre est toutefois suffisant, car les contributions du troisième
ordre sont en dt3/2 et ne jouent aucun rôle dans la limite dt → 0.
290 CHAPITRE IX. MESURE QUANTIQUE
|ϕ, de sorte que cette équation peut conduire à des évolutions qui sont
très différentes de l’évolution de Schrödinger habituelle. Comme on pouvait
s’y attendre, |dϕ s’annule si |ϕ est un vecteur propre quelconque de A de
valeur propre an (ces vecteurs propres constituent autant de points fixes de
l’équation d’évolution) : dans ce cas toutes les mesures successives fournissent
le même résultat xr = x0 + gτ an , et le processus n’est plus stochastique
puisqu’aucune évolution ne se produit. Ce type d’équation différentielle non
linéaire stochastique a été introduit par Gisin [470, 471] et discuté dans le
contexte de la mesure quantique [472]. Pour une introduction concernant
l’évolution stochastique du vecteur d’état et les mesures continues, voir par
exemple [473, 474].
produit de deux Wr s’annule pour des valeurs différentes de l’indice r (elles
contiennent des variables aléatoires indépendantes ξr ). De plus, l’intégration
de (IX-132) sur t introduit une intégrale qui est la limite continue de la
somme discrète :
1
1
δt 2
δWr δWr = δt 2 δr,r Dδt = D (IX-133)
δt
δt
r r
xr − x0 Δx0
ζr = = ξr + (IX-134)
σ σ
et, pour obtenir une limite continue adéquate comme en (IX-122), nous dé-
finissons la fonction stochastique R par :
gτ gτ Δx0
δRr = ζr = δWr + (IX-135)
2σ 2σ σ
S est appelé “liste des résultats” pour chaque réalisation de la série de me-
sures. Utilisant l’expression (IX-103) ainsi que (IX-121), nous obtenons alors :
gτ 2
δWr = δRr − 2 A = δRr − 2 A Dδt (IX-136)
2σ
et, en insérant ce résultat dans (IX-126) puis en prenant la limite continue :
1
|dϕ = dR [A − A] − D dt [A + A]2 − 4 A2 |ϕ (IX-137)
2
où |dϕr est donné par (IX-126) et dϕ|r est le bra correspondant. Habituel-
lement, le terme en |dϕr dϕ|r peut être ignoré au premier ordre, car il est
en dt2 , mais ici la situation est différente puisque |dϕ contient un terme
en dWr dont le carré est proportionnel à δt, comme le montre (IX-124). Ce
terme introduit une contribution :
En ajoutant à ce terme les termes linéaires en |dϕr , ainsi que ceux du bra
associé, on obtient l’évolution de ρ sous la forme :
1
dρ = dW [A, ρ]+ − 2 A ρ − Ddt A, [A, ρ] (IX-140)
2
qui contient un anticommutateur [A, ρ]+ et un double commutateur [A, [A, ρ]].
Cette équation est parfois appelée une équation de Belavkin [475]. Comme
plus haut pour le vecteur d’état, on peut remplacer dW par dR − 2 A Ddt
pour obtenir la variation de l’opérateur densité en fonction de la liste des
résultats, au lieu du processus de Wiener. On peut aisément vérifier que, si
ρ est un mélange statistique de projecteurs sur des états propres de A, il
commute avec A de sorte qu’aucune évolution ne se produit sous l’effet des
mesures successives, pour les mêmes raisons physiques que ci-dessus.
Les outils mathématiques que nous avons discutés dans ce chapitre (pro-
cessus de Wiener, équation différentielle stochastique, etc.) sont utilisés dans
certaines interprétations de la mécanique quantique que nous discutons au
Chapitre XI, en particulier celles mettant en jeu une dynamique de Schrö-
dinger stochastique.
Chapitre X
Expériences : la réduction
quantique vue en temps réel
Sur le plan théorique nous devons reconnaître que, depuis 1935 envi-
ron, notre compréhension des fondements de la mécanique quantique n’a
pas tellement progressé ; les idées vraiment nouvelles sont rares – à part
bien sûr la voie majeure ouverte par la contribution de Bell [6]. Il y a là
un grand contraste avec l’ensemble de la physique, où l’on a assisté à un
nombre impressionnant de découvertes remarquables, et ceci dans de nom-
breux domaines. Ces découvertes ont toutefois souvent mis en œuvre les outils
de la mécanique quantique, ainsi que des progrès expérimentaux spectacu-
laires qui ont complètement changé la situation. Aux débuts de la mécanique
quantique, l’observation de traces de particules uniques dans les chambres de
Wilson [476] a joué un rôle essentiel dans l’introduction des postulats quan-
tiques concernant la mesure ; sinon il était totalement impossible d’observer
continûment un seul électron, atome, ou ion. Les expériences que les théori-
ciens proposaient dans les discussions sur les fondements étaient donc le plus
souvent des “expériences de pensée” (“Gedanken Experiment”), comme celles
inventées lors des fameux congrès Solvay [1, 21]. De nos jours cependant, et
après presque un siècle de progrès continus, des expériences qui étaient alors
totalement impensables sont devenues réalité.
Un très grand nombre d’expériences de physique contemporaine met en
jeu la mécanique quantique en général, de sorte que plusieurs ouvrages ne
suffiraient pas à les décrire toutes. Cependant, dans la majorité d’entre elles,
les effets directs de la réduction du vecteur d’état ne sont pas directement
observables. Ce que l’on observe réellement est une somme sur un nombre
très grand de particules de la même observable quantique individuelle micro-
scopique (somme des dipôles atomiques par exemple). Or une telle somme
est bien décrite par la seule donnée de la valeur moyenne de cette obser-
vable ; il suffit alors d’utiliser l’équation de Schrödinger pour calculer cette
294 CHAPITRE X. MESURE QUANTIQUE EN TEMPS RÉEL
moyenne, qu’on va ensuite traiter comme une variable classique, sans faire
aucun usage de la règle de Born ou du postulat de projection – une illustra-
tion typique est donnée par les expériences de RMN (résonance magnétique
nucléaire) en physique et chimie. Dans les expériences de coïncidence, ce qui
est mesuré correspond au produit de deux opérateurs correspondant à des
taux de comptage d’appareils, et à nouveau on peut utiliser l’équation de
Schrödinger pour calculer la valeur moyenne de ce produit. Bien sûr, ce n’est
pas pour autant que le postulat de projection devient nécessairement sans
intérêt pour l’expérience ! En optique quantique et physique atomique par
exemple, on fait souvent usage d’une détection optique avec des photomulti-
plicateurs ou des diodes ; le postulat de projection détermine alors la taille et
les propriétés du “bruit de grenaille” aléatoire observé. Ce bruit limite la pré-
cision de l’expérience en ajoutant une composante fluctuante au signal, qui
lui-même varie de façon déterministe et régulière en fonction des paramètres
de l’expérience ; comme généralement ce qui est étudié est principalement le
signal, le postulat de projection ne joue alors plus qu’un rôle relativement
secondaire.
Ici nous nous focaliserons sur une toute petite fraction de ces expériences,
celles où les conditions sont telles que les effets de la projection du vecteur
d’état sont particulièrement évidents, comme celles où une particule unique
est observée et où “les sauts quantiques sont visibles en temps réel”. Les
observations ont alors un contenu quantique plus riche que ce que prévoit
l’équation de Schrödinger continue, et en ce sens vont au-delà de cette équa-
tion. Notre but n’est certainement pas de donner une revue complète du
sujet, mais plus modestement de présenter un certain nombre d’exemples
choisis parce qu’ils sont particulièrement illustratifs.
niveau excité e1 est fortement excitée par un premier laser intense, tandis
que la fluorescence à la longueur d’onde correspondante est mesurée en per-
manence. Le niveau e1 se désintègre par émission spontanée, non seulement
vers le niveau fondamental g, mais également vers le niveau métastable m1 ,
qui se désintègre vers l’état fondamental bien plus lentement que l’état e1 .
L’ion pourrait alors rester longtemps piégé dans cet état m1 , sans interagir
avec le laser, et la fluorescence cesserait immédiatement. Pour éviter ce pié-
geage, un autre laser excite la transition entre m1 et e1 . Ce second laser
crée en quelque sorte un circuit fermé g − e1 − m1 dont l’ion ne peut pas
s’échapper, ce qui est utilisé pour le refroidir. Si aucune autre excitation de
l’ion n’était produite, il fluorescerait constamment. Mais une autre source
lumineuse, bien plus faible, excite la transition g − e2 vers un second niveau
excité e2 . Or, parfois, lorsque l’ion a atteint le niveau e2 , il ne retombe pas
vers le niveau fondamental g, mais plutôt vers le niveau métastable m2 où il
ne peut plus être excité optiquement ; l’ion cesse alors de fluorescer, et l’on
dit qu’il a été “mis de côté” (en anglais, “shelved”) dans l’état métastable.
Toutefois, comme ce niveau possède une durée de vie finie, l’ion finit par
retomber spontanément dans le niveau fondamental g, et recommence alors
à fluorescer.
Si l’on applique l’équation de Schrödinger à une telle situation, il faut
inclure dans le système l’ion ainsi que le champ électromagnétique, dont plu-
sieurs modes sont peuplés, et prendre en compte l’effet de leurs interactions
(absorption, émission stimulée, émission spontanée). La solution de l’équa-
tion qui est alors obtenue est, au bout d’un certain temps, la superposition
de deux composantes : une où l’ion n’est pas “mis de côté” et où une forte
émission spontanée de lumière se produit, et une autre où l’ion est mis de
côté de sorte qu’aucun rayonnement n’est émis à la fréquence de la tran-
sition e1 − g. C’est donc simultanément que l’ion fluoresce et s’abstient de
fluorescer, comme le chat de Schrödinger qui est à la fois vivant et mort ; le
vecteur d’état permet de calculer une intensité de fluorescence moyenne qui
est intermédiaire entre les deux situations. En d’autres termes, dans le cadre
de l’équation de Schrödinger, tout reste continu, les “sauts quantiques” ne se
produisent jamais, et l’on atteint une sorte de moyenne des deux situations
possibles.
Mais, comme l’intensité de fluorescence est constamment mesurée dans
l’expérience, les deux composantes du vecteur d’état contiennent également
des états macroscopiquement différents des appareils de mesure, de sorte
que le postulat de projection s’applique : un processus fondamentalement
aléatoire se produit, et le système choisit spontanément une seule des deux
composantes. En conséquence, la fluorescence prend, soit sa valeur maximale
(correspondant à l’ion en train d’effectuer constamment un circuit entre les
trois niveaux g, e1 et m1 ), soit la valeur nulle, mais jamais une valeur inter-
médiaire.
296 CHAPITRE X. MESURE QUANTIQUE EN TEMPS RÉEL
Figure X.1 – Niveaux d’énergie d’un ion Barium mis en jeu dans l’ex-
périence. L’état fondamental de l’ion est g, tandis que e1 et e2 sont deux
états excités, m1 et m2 deux états métastables. Deux lasers de forte intensité
(flèches doubles) excitent les transitions g − e1 et m1 − e1 afin de produire
le refroidissement laser du mouvement de l’ion dans le piège. La fluorescence
par émission spontanée depuis le niveau e1 vers g est constamment mesurée ;
en présence de deux lasers seulement, elle ne cesse jamais. Cependant on uti-
lise également une lampe de faible intensité pour exciter la transition g − e2 ;
lorsque l’ion atteint le niveau e2 , il retombe parfois dans le niveau métastable
m2 (flèche tiretée), où il ne peut plus fluorescer ; on dit alors qu’il est “mis de
côté”. Cette situation dure jusqu’à ce que l’émission spontanée fasse retomber
l’ion dans le niveau fondamental g et que le cycle recommence.
2D
5/2 de durée de vie 0.1 s. Lorsque la transition entre les deux premiers
niveaux est constamment excitée, la fluorescence de l’ion à la longueur d’onde
correspondante reste constante. Cependant, si la transition entre le niveau
fondamental et le niveau métastable est également excitée, de temps en temps
l’ion passe dans le niveau métastable, de sorte que la fluorescence cesse,
jusqu’à ce que l’ion retombe ensuite dans le niveau fondamental par émission
spontanée. Les résultats sont montrés sur la Figure X.3. Comme dans la
Figure X.2, la fluorescence présente alors des discontinuités marquées entre
deux régimes, souvent appelées “sauts quantiques” par référence à la théorie
historique de l’atome de Bohr (§ A-1 du Chapitre I).
Bien avant que ces résultats ne soient obtenus, Schrödinger avait analysé
une expérience de pensée où la lumière émise par un atome était utilisée pour
obtenir des interférences [481] ; il avait mis en avant que les sauts quantiques,
s’ils se produisent lorsque les atomes émettent des photons, ne peuvent pas
être instantanés, mais qu’ils ont nécessairement une durée non nulle reliée à la
largeur radiative des niveaux atomiques. Ici la situation est similaire, puisque
le passage du régime “lumineux” (fluorescence) vers le régime “noir” (sans
fluorescence) est déclenché par l’émission spontanée du niveau e2 vers m2 ,
alors que la transition du régime noir vers le régime lumineux est déclenchée
par la transition entre m2 et le niveau fondamental g – en d’autre termes,
deux “sauts” jouent un rôle, au lieu d’un, mais la remarque de Schrödinger
s’applique également.
Dans ce cas, comment cela est-il compatible avec les observations de la
Figure X.2 ? L’explication est que le signal de la Figure X.2 est représenté
moyenné sur le temps, ce qui cache les discontinuités qui apparaissent dès
qu’on l’observe de plus près. A une échelle plus petite, le signal fourni par le
photo-multiplicateur mesurant la fluorescence est une série de “clics” soudains
qui se produisent à des instants aléatoires, et correspondent à la détection de
photons individuels ; la Figure X.2 ne montre en fait que la fréquence moyenne
de ces clics. Ce qui est réellement observé consiste donc en transitions entre
des périodes où les clics sont fréquents et d’autres où ils ne le sont pas ;
chaque transition entre ces périodes ne peut être définie plus précisément
que le temps entre deux clics consécutifs. Il s’ensuit que le temps auquel se
produisent les “sauts” n’est mesurable qu’avec une certaine incertitude, qui
est fonction du taux d’émission de photons et donc de la largeur radiative des
niveaux comme le prédisait l’argument de Schrödinger – pour une discussion
plus précise voir [482]. Une étude théorique plus détaillée du phénomène
d’intermittence de fluorescence est donnée dans les Refs. [483, 484].
Figure X.3 – Courbe du bas : signal de fluorescence d’un ion Hg+ unique
constamment excité sur sa transition de résonance, ainsi que sur une autre
transition entre son niveau fondamental et le niveau métastable 2 D5/2 .
L’échelle horizontale est en millisecondes, l’échelle verticale donne le nombre
de photoélectrons enregistrés par milliseconde. Lorsque l’ion passe dans ce ni-
veau métastable, il cesse de fluorescer, de sorte que des sauts quantiques sont
clairement visibles, comme dans la Figure X.2. La courbe du mileu est obte-
nue quand deux ions sont piégés ; trois cas peuvent alors se produire, selon le
nombre d’ions “mis de côté” (0, 1 ou 2), ce qui correspond à trois intensités
possibles pour la fluorescence. La courbe du haut montre la fluorescence quand
trois ions sont piégés et peuvent donner lieu à quatre niveaux de fluorescence
(figure aimablement fournie par D. Wineland et W. Itano).
sure, comme mis en évidence par Gabrielse et al. [485]. Dans leur expérience,
un piège de Penning refroidi est utilisé pour retenir un électron unique. Un tel
piège comprend un fort champ magnétique axial ainsi qu’un champ électrique
quadrupolaire créé par des électrodes. Dans le champ magnétique, les niveaux
quantifiés d’une particule chargée sont des niveaux orbitaux équidistants, les
“niveaux de Landau” d’énergies nhνc , où νc est la fréquence cyclotron et n
un nombre entier (l’énergie combine les effets du couplage avec le champ ma-
gnétique des variables orbitales et de spin). La mesure porte sur le nombre
300 CHAPITRE X. MESURE QUANTIQUE EN TEMPS RÉEL
Dans les deux expériences que nous venons de décrire, le système quan-
tique observé était une particule matérielle (une particule de masse au repos
non nulle), soit un ion soit un électron. A priori, il peut sembler que les
photons soient moins adaptés à une observation individuelle qu’une parti-
cule matérielle, du fait qu’ils sont prompts à disparaître, en particulier lors
de leur détection qui se fait souvent par absorption. Cependant des expé-
riences récentes ont réussi à obtenir des résultats comparables en observant
des photons dans une cavité, illustrant les propriétés de la mesure quantique
d’une façon particulièrement spectaculaire. Jusqu’à relativement récemment,
la seule méthode pour “voir” un photon était de l’absorber dans un détecteur
(un photo-multiplicateur par exemple), de sorte que des mesures ultérieures
avec la même particule devenaient impossibles. Mais divers schémas de me-
sure quantique non destructive sont maintenant accessibles, afin de mesurer
la présence et le nombre de photons sans les détruire [438, 487] – voir éga-
lement § 6.2 de [365]. La combinaison de cette possibilité avec les méthodes
de l’électrodynamique en cavité a permis des expériences où il est possible
d’avoir accès en temps réel au nombre de photons contenus dans une ca-
vité [488].
Les atomes de Rydberg sont des atomes dans des niveaux d’énergie éle-
vés, très proches du seuil d’ionisation ; ils possèdent un très grand dipôle
électrique qui les couple fortement au champ électromagnétique. Parmi les
niveaux de Rydberg, ceux correspondant à des atomes “circulaires” (où le
nombre quantique l prend sa valeur maximale) interagissent avec les photons
de façon particulièrement simple et contrôlée. Ceci permet de les utiliser
comme des sondes très sensibles des propriétés de ce champ, même si ce der-
nier ne contient que quelques photons. De plus, ils peuvent être ionisés et
détectés avec une grande efficacité, avec un accès sélectif aux divers niveaux
de Rydberg. Les techniques expérimentales actuelles permettent la produc-
tion de jets atomiques de tels états de Rydberg, qui peuvent être envoyés à
travers une cavité électromagnétique résonante afin de mesurer le nombre de
photons qu’elle contient.
On pourrait penser à faire usage de l’absorption des photons par les
302 CHAPITRE X. MESURE QUANTIQUE EN TEMPS RÉEL
6 5)
Figure X.5 – Un jet d’atomes dans un niveau très excité (niveau de Rydberg
circulaire) est créé par une source S. Chaque atome traverse, d’abord une ré-
gion où un générateur RF1 excite de façon cohérente la transition entre le
niveau de Rydberg initial et un niveau très voisin, puis une cavité C dont la
fréquence de résonance est déplacée par rapport à celle de la fréquence de tran-
sition atomique, puis une autre région où un appareil RF2 (bloqué en phase
avec RF1) excite à nouveau la même transition. Les appareils RF1 et RF2
réalisent ce que l’on appelle “spectroscopie Ramsey” sur chaque atome : la
première interaction crée un dipôle oscillant à la différence des fréquences de
Bohr des deux niveaux, et le second détecte la phase de ce dipôle, y compris
son évolution due au passage dans la cavité C. Comme le dipôle accumule
lors du passage dans C un déphasage qui dépend du nombre de photons dans
la cavité, les populations finales des deux niveaux de Rydberg concernés dé-
pendent également de ce nombre de photons. Le détecteur D y donne donc
directement accès en mesurant cette population. La cavité n’étant pas réso-
nante à la fréquence du dipôle atomique, l’interaction est dispersive et ne
modifie pas le nombre de photons qu’elle contient, de sorte qu’on obtient une
méthode de mesure non destructive, appelée “QND measurement” en anglais
(figure aimablement fournie par J.M. Raimond).
ment clair, en termes de nombre d’atomes qui sont nécessaires pour estimer
avec une bonne probabilité qu’un saut s’est produit [488]. Ce que l’on ob-
serve dans une réalisation donnée de l’expérience n’est pas l’évolution conti-
nue prédite par l’équation de Schrödinger, qui est la même pour toutes les
réalisations ; à chacune d’entre elles, on observe des marches bien visibles, qui
tombent à des instants différents à chaque fois. L’équation de Schrödinger ne
donne que la moyenne des observations sur un grand nombre d’expériences ;
les marches ne peuvent pas être expliquées par cette équation, et demandent
donc qu’un autre ingrédient y soit ajouté. C’est un autre cas particulièrement
spectaculaire où l’on peut voir “la réduction du paquet d’ondes se produisant
directement sous ses yeux”.
304 CHAPITRE X. MESURE QUANTIQUE EN TEMPS RÉEL
nombre de photons
nombre de photons
que les positions sont mesurées, la phase relative devient de mieux en mieux
définie. Déjà, la toute première mesure de position crée une certaine infor-
mation sur cette phase1 , qui joue un rôle pour la seconde mesure ; on montre
que sa distribution, au lieu d’être totalement indépendante de la phase, est
alors donnée par une sinusoïde dont les maxima et minima dépendent de la
position mesurée. Puis, au fur et à mesure que les mesures s’accumulent, la
distribution de la phase est donnée par le produit d’un nombre de plus en
plus élevé de sinusoïdes, qui présente un pic de plus en plus étroit, rendant
ainsi la phase de mieux en mieux déterminée ; on se rapproche ainsi d’une si-
tuation parfaitement classique où la phase est fixée. C’est donc un processus
quantique intéressant où, initialement, la phase relative n’existait pas, mais
où les projections successives dues à la mesure quantique la font émerger pro-
gressivement et lui attribuent une valeur de mieux en mieux déterminée. Tout
semble se passer comme si la phase avait existé depuis le début pour chaque
réalisation de l’expérience, sans que sa valeur soit connue. Toutefois, d’une
réalisation à l’autre, la nouvelle valeur qui émerge est totalement différente,
sans aucune corrélation avec la précédente.
Des expériences effectuées dans le groupe de Ketterle à MIT avec des
condensats d’atomes de Sodium ont permis de vérifier ces prédictions [490].
Deux condensats de Bose-Einstein étaient préparés dans des pièges séparés,
puis relâchés afin de leur permettre de se recouvrir spatialement ; on mesu-
rait ensuite par absorption optique la position des atomes dans la région de
recouvrement. La Figure X.7 montre le résultat obtenu pour une réalisation
donnée de l’expérience : on observe effectivement des franges avec une phase
bien définie, alors qu’elle n’existait pas avant la mesure ; ceci constitue donc
un cas où la réduction du paquet d’ondes apparaît de façon bien visible à
l’œil nu. Cette phase est aléatoire et, d’une expérience à l’autre, totalement
incorrélée ; en d’autre termes, si l’on fait la somme des mesures obtenues dans
plusieurs réalisations, les franges disparaissent, comme le prédit la théorie.
Une particularité de l’expérience est que la grandeur physique qui apparaît
(la phase) fixe la valeur d’une grandeur physique macroscopique (la densité
du gaz en chaque point de la région d’interférence), ce qui permet d’observer
directement les effets de la projection du vecteur d’état.
La question qui se pose alors tout naturellement est la même que pour
toute mesure quantique : faut-il réellement penser, comme nous y invite la
mécanique quantique standard, que c’est la mesure qui crée la valeur de la
grandeur physique mesurée, ici la phase ? Ou au contraire que la mesure
1
Par exemple, la mesure indique qu’elle ne peut pas prendre une valeur qui donne-
rait lieu à interférence totalement destructive à la position mesurée (en supposant pour
simplifier que les deux intensités sont égales).
D. PHASE SPONTANÉE 307
ne fait que révéler une phase qui existait déjà auparavant ? Lorsqu’une va-
riable est macroscopique, comme ce peut effectivement être le cas pour la
phase d’une figure d’interférence, il semble relativement peu naturel d’ad-
mettre qu’elle puisse véritablement être créée par la mesure, par exemple à
la suite d’un effet de perturbation incontrôlée de l’appareillage. C’est donc
la question des variables supplémentaires qui se pose à nouveau, mais cette
fois dans un cadre macroscopique, rappelant la façon dont la discussion du
chat de Schrödinger transpose au monde macroscopique une indétermination
quantique.
Leggett et Sols [491] ont donné une discussion d’une situation semblable,
celle où un courant Josephson apparaît entre deux supraconducteurs, la va-
leur de ce courant étant fixée par la différence des deux phases quantiques
supraconductrices. Ces auteurs posent la question de savoir si une telle phase,
avec ses conséquences sur un courant macroscopique, peut véritablement ap-
paraître sous l’effet d’une mesure qui, elle, peut être faite grâce à un appareil
très petit : “Est-ce que l’acte de ‘regarder pour voir’ si un courant Joseph-
son s’écoule peut en lui-même forcer le système à occuper un état propre du
courant, et donc à acquérir une phase relative ?... Se peut-il vraiment que,
lorsque l’on place par exemple une minuscule aiguille de boussole près du
308 CHAPITRE X. MESURE QUANTIQUE EN TEMPS RÉEL
système2 , avec un faisceau lumineux très faible pour lire sa position, on force
le système à ‘réaliser’ une valeur macroscopique définie d’un courant ? Le bon
sens se révolte contre cette idée, et nous pensons que dans ce cas le bon sens
a raison”.
$OLFH %RE
possible qu’une mesure effectuée par Alice sur un petit nombre de spins, une
centaine par exemple, détermine instantanément l’apparition d’une orienta-
tion macroscopique dans le laboratoire de Bob, surtout si ce dernier est très
éloigné ? On rejoint ainsi la logique de l’argument EPR, mais dans un cas où
les “éléments de réalité” concernent des grandeurs macroscopiques [128], ce
qui rend l’argument encore plus frappant. Peut-on vraiment admettre qu’une
orientation macroscopique soit créée dans le laboratoire de Bob sans qu’inter-
vienne la moindre interaction locale, et apparaisse en quelque sorte à partir
310 CHAPITRE X. MESURE QUANTIQUE EN TEMPS RÉEL
de rien ? Ou faut-il rejoindre EPR et dire que cette orientation existait né-
cessairement depuis le début de l’expérience, de sorte que les mesures ne font
que traduire l’existence d’une phase initiale tirée au sort ? Cette phase se-
rait alors la variable qu’il convient d’ajouter à la mécanique quantique pour
la compléter. Comme il s’agit maintenant de grandeurs physiques macrosco-
piques, donc a priori directement accessibles à l’expérience humaine, il semble
plus délicat de leur refuser le qualificatif d’élément de réalité physique indé-
pendamment des appareils de mesure ; il est difficile de deviner ce que Bohr
aurait répondu à cette version de l’argument EPR.
Dans un tel cas, la conservation du moment cinétique pose des questions
particulières. Comment le moment cinétique dans la région de Bob peut-il
varier instantanément sous l’effet de mesures effectuées par Alice en un point
arbitrairement éloigné4 ? Si l’on considère uniquement la région où Alice ef-
fectue ses mesures, aucune difficulté particulière ne se présente. L’appareil de
mesure qu’elle utilise, pour pouvoir mesurer le moment cinétique des spins,
doit interagir avec eux par un hamiltonien de couplage qui contient leur mo-
ment cinétique, ainsi que le sien propre, ce qui autorise un transfert entre
l’un et l’autre. On peut alors supposer que la quantité de moment transférée
dépende du résultat de la mesure de façon que le moment cinétique total
soit parfaitement conservé ; tout paradoxe est alors levé par un effet de recul
de l’appareil de mesure. En revanche, l’hamiltonien de couplage en question
commute certainement avec tous les opérateurs associés à des grandeurs loca-
lisées dans la région de Bob ; il lui est donc impossible de changer le moment
cinétique dans cette région. On comprend alors mal comment l’appareil de
mesure d’Alice peut faire apparaître à distance un tel moment cinétique. De
plus, si Alice effectue sa mesure sur un petit nombre de spins il semble pa-
radoxal de considérer, afin de conserver le moment cinétique total, que son
appareil de mesure acquière par effet de recul le moment cinétique associé au
très grand nombre de spins dans la région de Bob. Si l’on pense plutôt que
l’appareil de mesure d’Alice ne peut acquérir de moment cinétique supérieur
à la valeur maximale qu’autorise la mécanique quantique pour les spins avec
lesquels il interagit, on est conduit à l’abandon de la conservation du moment
cinétique. Ici aussi, on est donc tenté de suivre EPR et de lever toute dif-
ficulté en considérant que le moment cinétique macroscopique contenu dans
la région de Bob existait avant toute mesure, ce qui revient à compléter la
mécanique quantique en lui ajoutant une variable supplémentaire de phase.
Même si l’on modifie la mécanique quantique pour lui adjoindre cette
phase, ce n’est pas pour autant qu’elle se comporte toujours comme une
grandeur classique permettant de restaurer une notion stricte de localité. En
fait, la situation reste relativement semblable au cas habituel de deux spins,
4
Nous considérons ici une réalisation unique de l’expérience. Pour un grand nombre de
mesures, le moment cinétique peut prendre toutes les directions transverses, et se moyenne
donc à zéro dans les deux régions de l’espace ; aucun paradoxe n’apparaît alors.
D. PHASE SPONTANÉE 311
5
Les angles entre les directions des composantes à mesurer, eux, tendent vers zéro quand
le nombre de particules tend vers l’infini, mais pas le taux de violation des inégalités.
Chapitre XI
Diverses interprétations
et reconstructions de
la mécanique quantique
Une règle empirique qu’on peut utiliser est de considérer que, dès qu’une
décohérence “significative” s’est produite, la chaîne de von Neumann s’arrête
automatiquement : toutes ses branches, sauf une, disparaissent spontané-
ment, la Nature choisissant cette branche unique par un processus physique
inconnu. En d’autres termes, on associe systématiquement émergence à in-
trication et décohérence (l’émergence de l’unicité est associée à l’intrication
avec un environnement macroscopique et la décohérence qui en résulte). Par
exemple, dès qu’un appareil de mesure fait partie de l’expérience et qu’il
permet d’enregistrer des résultats, on considère qu’il n’enregistre qu’un seul
résultat, indépendamment du fait qu’un être humain observe ce résultat ou
non. Nous l’avons vu plus haut (Chapitre VII), de toute façon il est ab-
solument sans espoir de jamais voir les effets physiques des superpositions
cohérentes une fois qu’elles se sont propagées trop loin dans l’environnement ;
on ne prend donc aucun risque de contradiction avec les expériences si l’on
suppose qu’elles disparaissent tout simplement. La difficulté dans ce point de
vue est, bien sûr, de définir exactement le mot “significative” pour qualifier
la décohérence.
Briser ainsi “à la main” la chaîne de von Neumann n’est après tout pas
très différent d’une application du postulat de réduction du vecteur d’état
légèrement modifié : au lieu de l’acte de prise de connaissance consciente
de la mesure, on postule que c’est la décohérence à une certaine échelle qui
déclenche la réduction par un mécanisme inconnu. En d’autres termes, on
croit à l’équation de Schrödinger, mais pas au-delà d’une certaine limite :
jusqu’au point où elle commence à contenir des corrélations avec l’environ-
nement qui deviennent macroscopiques. La décohérence fixe quelque part la
frontière entre le monde de Schrödinger et celui de Born (introduction du
Chapitre II). Ce “postulat de décohérence macroscopique” n’est pas très dif-
férent non plus du point de vue de Bohr, puisqu’on y invoque également un
monde macroscopique qui est accessible à notre expérience humaine et qui
est unique. La non-localité est contenue de façon inhérente dans la notion
d’environnement du vecteur d’état, ce qui permet de rendre compte d’expé-
riences de type Bell : lorsque deux spins dans un état singulet sont soumis
à des mesures éloignées, la corrélation avec le monde macroscopique et la
décohérence supplémentaire que l’on postule font intervenir à la fois les deux
316 CHAPITRE XI. DIVERSES INTERPRÉTATIONS
aussi spéciales à l’opération de mesure sans supposer que l’esprit humain lui
aussi possède des propriétés très spéciales ?
§ B-2-a du Chapitre I) :
Les termes dans la somme sur m de (XI-2) sont tous orthogonaux entre eux ;
ils ne donneront jamais lieu à des effets d’interférence dans le futur, puisqu’ils
correspondent à des résultats de mesure différents. En fait, chacun de ces
termes se corrèle à un état orthogonal de l’environnement (l’aiguille du cadran
de mesure de l’appareil par exemple) de sorte que la décohérence se charge de
détruire tout effet d’interférence éventuel (cf. § C-3 du Chapitre VII). Au lieu
de faire un calcul complet incluant l’état de l’environnement, nous prenons
donc ici le point de vue plus simple où cet environnement est ignoré et où
les diverses composantes orthogonales |Ψm (t1 ) de |Ψ(t1 ) sont considérées
comme indépendantes les unes des autres.
Entre les instants t1 et t2 , l’état |Ψm (t1 ) évolue sous l’effet de l’équation
de Schrödinger et devient un état |Ψm (t2 ) donné par :
où |Ψm,n (t2 ) est obtenu par l’action du projecteur PN (n) sur le sous-espace
correspondant au résultat n obtenu par mesure de N :
dépendant du temps PM (m, t) et PN (n, t). Dans le cas où deux mesures sont
effectuées, la probabilité d’obtenir le résultat m, suivi du résultat n, peut
alors s’écrire2 :
P(m, t1 ; n, t2 ) = T r PN (n, t2 )PM (m, t1 )ρ(t0 )PM (m, t1 )PN (n, t2 ) (XI-9)
L’équation (XI-9) est parfois appelée formule de Wigner 3 . Elle peut aisément
être généralisée à plus de deux mesures par l’addition de projecteurs supplé-
mentaires des deux côtés dans l’ordre des temps inverses, et à des situations
où ρ(t0 ) décrit un mélange statistique au lieu d’un état pur.
Nous avons présenté les équations (XI-7) et (XI-9) comme des consé-
quences du postulat de réduction du vecteur d’état de la mécanique quan-
tique. Inversement, on peut prendre ces équations comme point de départ,
comme un postulat en soi qui permet de calculer la probabilité d’une séquence
quelconque de résultats de mesure. Le postulat de réduction du vecteur d’état
devient alors superflu, puisque la règle de Born généralisée (à des temps mul-
tiples) est suffisante pour obtenir ces probabilités – certes, on peut faire valoir
que la réduction du vecteur d’état est implicitement contenue dans l’opéra-
tion de trace de (XI-9), mais il reste vrai que nulle référence explicite à la
réduction n’est nécessaire. Dans cette optique, la projection du vecteur d’état
associée à la mesure n’est donc plus un postulat, mais seulement une règle
de calcul commode qui peut être déduite d’un autre postulat. Quant à l’évo-
lution de Schrödinger, elle est contenue dans l’évolution de Heisenberg des
opérateurs de projection, de sorte que l’évolution de | Ψ > lui-même n’est
plus directement visible.
Dans ce point de vue, il reste toujours nécessaire de postuler que les
résultats de mesure ne peuvent donner que les valeurs propres de l’opérateur
correspondant, et que le résultat est fondamentalement aléatoire – c’est le
contenu de la règle de Born. L’avantage d’utiliser directement la formule
(XI-9), tout en laissant de côté la réduction du vecteur d’état, est que les
problèmes associés à la difficile coexistence entre deux postulats d’évolution
s’éliminent ; aucun saut discontinu d’une quelconque quantité mathématique
n’apparaît dans le formalisme. Dans ces conditions, pourquoi ne pas tout
simplement laisser tomber les autres postulats et n’utiliser que cette formule
unique pour obtenir des prédictions sur tous les résultats possibles ?
Pour certains physiciens, c’est effectivement la meilleure solution ; si l’on
admet que le but de la physique est uniquement d’établir des corrélations
entre la préparation d’un système physique, mathématiquement contenue
2
Une permutation circulaire sous la trace permet en fait de supprimer l’un des projec-
teurs extrêmes P
N (n2 ; t2 ) dans la formule (XI-9), mais pas les autres.
3
On la trouve en effet dans l’équation (12) de [64, 492].
320 CHAPITRE XI. DIVERSES INTERPRÉTATIONS
dans ρ(t0 ), avec toutes les séquences possibles de mesures (en fournissant
leurs probabilités), il est vrai que la formule (XI-9) est parfaitement suffi-
sante. Pourquoi alors s’inquiéter de savoir quelle série particulière de résul-
tats se produit dans une réalisation donnée de l’expérience ? Il est suffisant
de supposer que tous les systèmes physiques ont un comportement fonda-
mentalement aléatoire ; nul n’est alors besoin en physique de faire plus que
de donner des règles permettant le calcul des probabilités associées aux di-
verses procédures de préparation et de mesure (voir par exemple la citation
de Dirac au § E du Chapitre II) ; inutile de chercher à décrire le système
physique lui-même à chaque réalisation de l’expérience.
L’interprétation des corrélations est parfaitement cohérente ; elle s’inscrit
bien dans l’idée que le vecteur d’état exprime une procédure de préparation
(voir § B-3 du Chapitre I), plus qu’une propriété physique quelconque du
système mesuré. D’un autre côté, ce raisonnement est totalement opposé à
celui de EPR, puisqu’il considère comme sans intérêt toute question reliée
à la réalité physique indépendante en tant que telle. Des questions comme
“comment décrire le système dans l’intervalle de temps où la première mesure
a été effectuée, mais où la seconde est toujours à venir” sont repoussées
comme des questions superflues ou sans signification réelle4 . Inutile de dire
que la notion elle-même d’éléments de réalité EPR devient totalement non
pertinente dans cette vue de la physique, ce qui résout automatiquement tous
les problèmes potentiels associés à des raisonnements de type Bell, GHZ ou
Hardy. Il en va de même pour l’émergence d’un résultat unique dans une
expérience isolée ; d’une certaine façon, le paradoxe du chat de Schrödinger
est évacué en le rejetant hors du domaine de la physique, puisque le paradoxe
n’est pas exprimé en termes de corrélations. Une caractéristique intéressante
de ce point de vue est que la frontière entre le système mesuré et les appareils
de mesure est flexible ; un avantage qui en découle est que la méthode est bien
adaptée à des approximations successives dans le traitement des processus de
mesure, par exemple les traces laissées par une particule dans une chambre
à bulles comme discuté par Bell [55].
A-2-c. Discussion
très explicite. Certains le font cependant ; voir par exemple l’article de Mer-
min [493], qui d’emblée part de la prise de position claire : “tout au long
de cet essai, je considérerai les corrélations et les probabilités comme des
concepts de base”. Dans un contexte un peu semblable, voir également un
texte de la rubrique “opinions” de Physics Today par Fuchs et Peres [110] qui
mettent l’accent sur “la cohérence interne de la théorie sans interprétation”.
D’un autre côté, nous l’avons déjà noté, l’interprétation des corrélations est
vue par certains physiciens comme quelque peu minimaliste, car elle consi-
dère comme non pertinentes un certain nombre de questions qu’ils trouvent
importantes ; le manque le plus important est probablement une notion de
réalité physique qui soit indépendante des opérations de mesure faites par
des êtres humains. Comme nous l’avons également mentionné, cette inter-
prétation peut aisément être complétée par d’autres éléments pour la rendre
plus riche. L’expérience semble montrer que, lors d’une discussion où on les
pousse vigoureusement pour qu’ils donnent plus de détails sur leur position,
les partisans du point de vue des corrélations s’expriment alors souvent en
des termes qui se rapprochent beaucoup de l’interprétation d’Everett (§ M) ;
en fait, ils se révèlent parfois comme des partisans de cette interprétation
sans qu’ils le réalisent eux-mêmes !
D’autre part, la formule (XI-9) peut être le point de départ de nom-
breuses discussions intéressantes, qu’elle soit juste considérée comme une
formule commode ou une composante de base de l’interprétation. Supposons
par exemple que la première mesure soit associée avec une valeur propre dé-
générée d’un opérateur, en d’autres termes que PM (m; t1 ) soit un projecteur
sur un sous-espace de plus d’une dimension :
n
PM (m; t1 ) = |ϕi ϕi | (XI-10)
i=1
système se corrèlent avec le même état de l’appareil de mesure, qui ici joue
le rôle de l’environnement ; ce n’est plus vrai dans le second cas, de sorte
que par trace partielle sur l’environnement, tous les termes d’interférence
s’annulent. Cette remarque est utile dans la discussion de la relation étroite
entre ce qu’on appelle le “paradoxe de Zénon” en mécanique quantique [494]
et la décohérence ; elle est également fondamentale dans la définition des
conditions de cohérence dans l’interprétation des histoires, sur laquelle nous
reviendrons plus bas (§ G).
d’état lui-même est avant tout informationnelle, soit même prendre le point
de vue extrême où il ne représente que de l’information (§ C-2). Le théorème
PBR (§ E-2 du Chapitre VI) fournit un cadre qui limite les possibles relations
entre le contenu informationnel du vecteur d’état et l’existence éventuelle
d’une réalité physique sous-jacente.
Dans tous les cas, il existe évidemment un certain lien avec l’interpréta-
tion des corrélations, et on peut même voir les deux points de vue comme
d’utiles compléments mutuels. Les discontinuités introduites par la réduction
du vecteur d’état semblent être expliquées de façon relativement naturelle,
sans toutefois que les difficultés déjà discutées aux §§ B-3-a du Chapitre I
et A-2 de ce chapitre ne soient réellement levées (par exemple les questions
concernant la division du monde entre les systèmes qui fournissent de l’infor-
mation et ceux sur lesquels l’information est acquise, ou celles concernant la
description de la réalité pendant l’expérience). Le paradoxe de l’ami de Wi-
gner n’est évidemment pas un problème particulier puisque, tant que l’ami à
l’extérieur du laboratoire dispose de moins d’information que celui qui est à
l’intérieur, il continue à utiliser un vecteur d’état non réduit, contrairement
à son ami à l’intérieur.
6
Dans son article, Ballentine remarque que “l’introduction de variables cachées est par-
faitement compatible avec les prévisions statistiques de la théorie quantique” et discute les
propriétés de telles variables à la fin de son article.
B. INTERPRÉTATIONS STATISTIQUES (ENSEMBLISTES) 325
Plus récemment, Allahverdyan et al. [505] ont développé une théorie des
mesures idéales faisant intervenir des sous-ensembles : au sein de l’ensemble
des réalisations d’une expérience de mesure quantique ils considèrent que, à
partir du moment où le système S et le pointeur de l’appareil de mesure M
se sont fortement corrélés selon le modèle de von Neumann, l’on peut distin-
guenr des sous-ensembles de réalisations. Les plus petits sous-ensembles sont
bien sûr les réalisations individuelles. Ils supposent que ces sous-ensembles
peuvent être décrits par le même formalisme et équations dynamiques que
l’ensemble total. A partir d’une étude détaillée de la relaxation introduite par
l’interaction entre S et M , et grâce à un ensemble de principes interprétatifs
adéquats, les auteurs de la Ref. [505] proposent une introduction progressive
du postulat de projection de von Neumann ; il est alors exprimé de façon
plus fine en termes de sous-ensembles de réalisations de l’expérience, et relié
de façon plus précise à des propriétés de la dynamique d’interaction entre S
et M . Aucune variable supplémentaire n’est introduite, mais des opérateurs
densité supplémentaires obéissant à l’équation dynamique standard ; mais ils
ont en fait le même objectif : permettre une description d’une expérience
unique qui soit plus précise que celle de l’opérateur densité standard unique.
326 CHAPITRE XI. DIVERSES INTERPRÉTATIONS
Nous avons vu plus haut (§ A-3) que, par pragmatisme, certains physi-
ciens mettent en avant le lien entre le vecteur d’état et l’information. On
peut aller encore plus loin, et prendre un point de vue informationnel ex-
trême qui dissocie totalement |Ψ de la réalité physique ; ce qui est pris en
compte est uniquement le contenu informationnel du vecteur d’état |Ψ, qui
décrit l’information que possède un observateur sur un système physique
donné (§ A-3), mais ne dit rien du système lui-même. Le vecteur d’état de-
vient ainsi “purement mental” (Appendice A). Rien n’empêche alors le vec-
teur d’état |Ψ de prendre des valeurs totalement différentes pour le même
système, en fonction des connaissances que l’on peut définir pour un observa-
teur arbitraire. L’analogie est alors évidente avec une distribution classique
de probabilités, qui exprime également une relation entre une certaine quan-
tité de connaissance et une réalité physique indépendante ; par exemple, une
telle distribution peut parfois décrire le système avec une parfaite précision,
mais elle peut également ne contenir aucune information (si l’observateur ne
sait rien sur le système).
C-2-a. Discussion
sa particule est dans un état pur bien défini. Jusqu’alors, les deux observa-
teurs peuvent en toute légitimité attribuer des états quantiques différents au
même système... Les états quantiques ne sont pas des objets physiques : ils
n’existent que dans notre imagination... La réponse à la question posée par
EPR ‘peut-on considérer que la description quantique de la réalité physique
est complète ?’ est oui. Cependant, il est possible que la réalité soit différente
pour des observateurs différents”.
La plupart des physiciens sont parfaitement prêts à accepter que des
opérateurs densité dépendent de l’observateur : si différents observateurs pos-
sèdent des quantités différentes d’information sur le même système physique,
il semble naturel qu’ils décrivent ce système par des opérateurs densité ρ
différents. Lorsque ρ décrit un mélange statistique, l’analogie avec une distri-
bution de probabilités classiques est directe, parce que ρ ne correspond pas
à la description la plus précise possible d’un système en mécanique quan-
tique ; cet opérateur attribue en fait des probabilités (classiques) à plusieurs
descriptions de ce type (avec des vecteurs d’état, donc des états purs). Mais
une dépendance des vecteurs d’état |Ψ eux-mêmes, alors qu’ils ne laissent
aucune place à une description quantique plus précise, semble plus délicate à
accepter. De surcroît, beaucoup acceptent l’idée que, au moins quelquefois,
la fonction d’onde contient des éléments de réalité. Par exemple, un système
physique décrit par la fonction d’onde de l’état fondamental est réellement
dans cet état et en possède les propriétés, pas seulement dans l’esprit des
humains. Les électrons d’un supraconducteur à très basse température sont
réellement dans un état fondamental BCS (Bardeen-Cooper-Schrieffer) ; la
fonction d’onde BCS n’est pas un processus mental, mais donne une des-
cription du système lui-même. Les chimistes pensent de même : les orbitales
moléculaires décrivent des propriétés intrinsèques des molécules, leur forme,
leur réactivité, etc., et non pas juste notre connaissance de leurs propriétés.
Ainsi, le point de vue standard est plutôt que l’évolution de Schrödinger
contient à la fois l’évolution des propriétés physiques que la mécanique quan-
tique attribue au système (observables qui admettent |Ψ comme vecteur
propre) et celle des probabilités (pour toutes les autres observables) qui re-
présentent notre connaissance du système et peuvent donc être vues comme
mentales.
Nous avons déjà discuté les difficultés associées avec ce point de vue pu-
rement informationnel dans les §§ B-3-a du Chapitre I et A-3 de ce chapitre.
Si |Ψ n’est que pure information, à quoi exactement s’applique cette infor-
mation ? Comment distinguer les systèmes qui produisent de l’information
(appareils de mesure) de ceux sur lesquels l’information est acquise ? Si l’on
admet l’existence d’une réalité indépendante, comment alors devrions-nous
parler du système lui-même et le décrire ? Est-ce que cela signifie qu’il faut
repousser cette idée, et que la physique renonce définitivement à l’espoir de
pouvoir jamais dire quelque chose à propos d’une réalité indépendante ? Dans
330 CHAPITRE XI. DIVERSES INTERPRÉTATIONS
certains de ses écrits initiaux, Heisenberg semblait n’être pas loin de ce point
de vue purement informationnel, mais plus tard il a nuancé sa position. En
ce qui concerne Bohr, ce n’était pas un positiviste mais un réaliste à sa fa-
çon pourrait-on dire (voir § E du Chapitre II, par exemple la citation de
Von Weizsäcker à la fin) ; le point de vue purement informationnel est gé-
néralement considéré comme au-delà de l’interprétation standard (§ A-3 du
Chapitre I).
C-2-b. QuBisme
ensuite été développé plus avant par Piron [536] qui, avec Jauch [537], a mon-
tré qu’on peut reconstruire un véritable treillis de Hilbert (et pas seulement
un treillis orthomodulaire) en introduisant une “covering property” adéquate.
Pour une revue plus détaillée du rôle de l’école de Genève dans ce domaine,
voir le § 8.5 de [58]. Une contribution plus récente et importante est celle du
théorème de Solèr [538] qui montre, à partir d’hypothèses algébriques, que
l’espace de Hilbert doit être construit, soit à partir des nombres réels, soit
encore des nombres complexes (comme en théorie standard), soit des qua-
ternions. Une introduction à la théorie des champs axiomatique est proposée
dans le § 3.8 de [518].
Les approches précédentes ne sont pas exemptes de difficultés, parfois
illustrées par des contre-exemples. L’une d’entre elles est que, alors que la
structure d’un espace de Hilbert permet de traiter de façon naturelle la com-
position de plusieurs systèmes physiques grâce à la notion de produit ten-
soriel (§ B du Chapitre XII), on ne peut pas simplement multiplier entre
eux des treillis de Hilbert. Ainsi la combinaison de plusieurs systèmes phy-
siques peut conduire à de nouvelles structures mathématiques. Ce problème
peut être traité par l’introduction d’ensembles convexes et du langage des
catégories [539–541] ; pour une revue, voir [542].
Comme nous l’avons rappelé dans les § D-1, chaque Pj est un opéra-
teur hermitique qui possède deux valeurs propres, 0 et 1. Physiquement, on
peut lui associer une mesure pouvant donner ces deux résultats. Si l’état |Ψ
du système est invariant sous l’action de Pj , le résultat obtenu est 1 avec
certitude ; si |Ψ est annulé sous l’action de Pj , le résultat est 0 avec certi-
tude. Dans toutes les autres situations, donc quand l’état est changé mais
pas annulé par l’action de Pj , le résultat est aléatoirement soit 1 soit 0 ; la
probabilité Pj (1) d’obtenir 1 est donnée par la moyenne de Pj dans |Ψ :
Pj (1) = Ψ| Pj |Ψ (XI-14)
Un opérateur Pj particulier est l’opérateur identité I(E) agissant dans E,
opérateur qui ne modifie aucun de ses vecteurs, et qui correspond à une
mesure donnant toujours le résultat 1, quel que soit l’état du système.
De façon générale, la somme d’opérateurs Pj n’est pas nécessairement un
autre opérateur Pn . Elle est cependant un projecteur si les espaces associés
aux Pj sont tous orthogonaux, ou de façon équivalente si tous les produits
d’opérateurs deux à deux Pi Pj s’annulent11 . Nous les appelons alors “projec-
teurs mutuellement exclusifs” ou simplement “projecteurs exclusifs”. Mathé-
matiquement, ils sont exclusifs parce qu’il est impossible de trouver un ket
|Ψ qui ne s’annule pas sous l’action successive des deux projecteurs orthogo-
naux. Physiquement, les projecteurs correspondent à des observables compa-
tibles qui peuvent être simultanément mesurées ; lorsque les observables sont
exclusives, il est impossible de trouver un état pour lequel les deux résultats
sont 1 avec certitude.
Si l’on ajoute un nombre suffisant de P orthogonaux, on peut arriver à
un point où leur somme projette sur tout l’espace E, ce qui permet d’obtenir
l’opérateur identité :
Pj1 + Pj2 + ... + Pjp = I(E) (XI-15)
On dit alors que cette série d’opérateurs fournit une “résolution de l’unité”.
Un exemple simple est donné par la série des projecteurs sur tous les états |ui
11
Si deux opérateurs Pi et Pj projettent sur des sous-espaces orthogonaux, on peut
choisir une base orthonormée dans chacun de ces sous-espaces, puis compléter une base
orthonormée dans l’espace E en ajoutant un nombre suffisant de vecteurs normés, tous or-
thogonaux entre eux et aux deux sous-espaces. Tous ces vecteurs sont des vecteurs propres
communs à Pi et Pj avec les valeurs propres 1 ou 0. Comme par construction aucun d’entre
eux ne peut avoir la valeur propre 1 pour les deux opérateurs Pi et Pj , le produit Pi Pj
s’annulle.
Réciproquement, si ce produit s’annule, le projecteurs commutent nécessairement (note
10), et à nouveau on peut construire une base commune de vecteurs propres dans E. Le
produit Pi Pj s’annule alors seulement si aucun de ces vecteur propres n’a deux fois la
valeur propre 1, ce qui signifie que Pi et Pj projettent sur des sous-espaces orthogonaux.
Dans les deux cas, on voit facilement que la somme Pi + Pj est alors le projecteur
orthogonal sur le sous-espace somme directe des sous-espaces de projection initiaux. La
généralisation à plus de deux projecteurs orthogonaux est obtenue par récurrence.
D. APPROCHES LOGIQUES, ALGÉBRIQUES ET DÉDUCTIVES 337
aux opérateurs POVM (en anglais : positive operator valued measures, voir
§ B-2 du Chapitre IX), cette limitation du théorème disparaît. Les POVM
correspondent à une classe plus grande d’opérateurs et conduisent à un plus
grand nombre possible de décompositions de l’unité que celles données par
des projecteurs orthogonaux. Ainsi, le théorème de Bush demande de faire
des hypothèses plus fortes que celui de Gleason : c’est le prix à payer pour
obtenir un résultat plus général (valable également pour deux dimensions),
ainsi qu’une démonstration mathématique plus simple.
E. Le réel voilé
Les auteurs de la Ref. [545] proposent une tout autre définition du réel,
qui s’exprime en termes d’association entre un objet quantique et l’environne-
ment de l’ensemble de ses appareils de mesure. Ils partent de trois postulats :
G. HISTOIRES COHÉRENTES 339
(i) Pour un système physique donné, ils définissent une “modalité” comme
l’ensemble des valeurs d’un ensemble complet de quantités physiques qui
peuvent être prédites avec certitude et répétabilité pour ce système. Cet
ensemble complet13 de propriétés physiques est appelé un contexte, et cor-
respond à un dispositif expérimental ; la modalité est attribuée de façon
conjointe au système et au contexte.
(ii) Pour un contexte donné, il existe N modalités différentes, mais elles
sont mutuellement exclusives : si une série de prédictions est vraie, les autres
sont fausses. La valeur de N est la même dans tous les contextes pertinents ;
c’est une propriété caractérisique d’un système quantique donné, appelée la
dimension.
(iii) Pour un système quantique donné, les divers contextes sont reliés par
des transformations g qui ont la structure d’un groupe G.
Le postulat (i) met l’accent sur les contextes, systèmes et modalités (d’où
l’acronyme CSM donné à cette approche), le postulat (ii) sur la quantifica-
tion, et le postulat (iii) sur les relations entre contextes différents. Les auteurs
de la Ref. [545] montrent alors que toute théorie compatible avec ces pos-
tulats est nécessairement probabiliste ; l’introduction des probabilités n’est
alors plus un postulat en soi, mais une conséquence des postulats. De plus,
par une suite de raisonnements appropriés, ils parviennent à établir l’en-
semble du formalisme quantique. La structure de la mécanique quantique
apparaît alors comme une conséquence commune, d’une part d’un nombre
quantifié de modalités accessibles à un système quantique, d’autre part d’un
continuum de contextes nécessaire à la définition de ces probabilités.
Cette approche rappelle le théorème de Gleason (§ D-3), mais en est
indépendante. Elle est également proche du point de vue de Bohr, où la
réalité physique ne peut être définie qu’en termes de l’ensemble du dispositif
expérimental (cf. § E (i) du Chapitre II, et la citation de Jammer à la fin de
cette section). Une différence importante, toutefois, est le rôle central de la
quantification, exprimé par le postulat (ii) ci-dessus.
G. Histoires cohérentes
où, comme ci-dessus, les Pi (ti ) sont les projecteurs sur les sous-espaces F1 ,
F2 , F3 dans le point de vue de Heisenberg.
Nous pouvons maintenant utiliser cette équation pour associer une “his-
toire” du système à la probabilité calculée : une histoire H est définie par
une série de temps arbitraires ti , chacun d’entre eux étant associé à un pro-
jecteur orthogonal Pi sur un sous-espace donné ; sa probabilité est donnée
15
Une autre possibilité est de considérer la mesure d’une observable M quelconque dont
une valeur propre m engendre le sous-espace propre F. Ce que nous désignons de façon
concise par “probabilité de trouver l’état du système dans F” n’est autre que la probabilité
que le résultat obtenu soit m, de sorte que l’état du système est projeté par la mesure sur
F.
G. HISTOIRES COHÉRENTES 341
par (XI-19) que, pour simplifier, nous écrirons P(H). En d’autres termes,
une histoire correspond à la sélection d’un chemin particulier, ou branche,
du vecteur d’état dans une chaîne de von Neumann ; cette dernière est définie
mathématiquement par une série de projecteurs associés à des temps donnés.
Aucune référence particulière n’est plus faite à une mesure dans ce point de
vue : une histoire décrit des propriétés intrinsèques du système physique,
indépendamment de toute interaction éventuelle avec des systèmes externes.
Inutile de préciser qu’il existe un très grand nombre d’histoires différentes,
qui peuvent avoir toutes sortes de propriétés ; certaines d’entre elles sont
précises car elles contiennent beaucoup de temps qui sont associés avec des
projecteurs sur de petits sous-espaces F ; d’autres restent très vagues parce
qu’elles ne contiennent que peu de temps et des projecteurs sur de grands
sous-espaces F (on peut même choisir pour F l’ensemble de l’espace des
états, de sorte que l’histoire correspondante ne contient aucune information
au temps correspondant).
Il existe en fait tellement d’histoires qu’il est commode de les regrouper
en familles. Une famille est définie à nouveau par une série de temps t1 , t2 ,
t3 ,..., mais maintenant nous associons à chacun de ces temps ti un ensemble
de projecteurs mutuellement orthogonaux Pi,j dont la somme sur j donne
le projecteur sur l’ensemble de l’espace des états initial. Pour chaque temps
nous avons alors une série de projecteurs orthogonaux qui donnent une dé-
composition de l’opérateur unité :
Pi,j = 1 (XI-20)
j
ce qui s’interprète en disant que le système suivra toujours une, et une seule,
des histoires de la famille considérée.
Le cas le plus simple se produit lorsqu’une famille est construite à partir
d’une seule histoire : une façon triviale d’incorporer une histoire dans une
famille est d’associer, à chaque temps ti (i = 1, 2, ..., N ), en plus du projecteur
Pi , le projecteur supplémentaire Qi = 1 − Pi ; la famille contient alors 2N
histoires individuelles. Inutile de dire qu’il existe bien d’autres façons de
compléter une histoire avec d’autres histoires qui sont plus “précises” que
celles contenant les Q ; on peut décomposer chaque Q en beaucoup d’autres
projecteurs individuels, la seule limite étant la dimension totale de l’espace
des états considéré.
342 CHAPITRE XI. DIVERSES INTERPRÉTATIONS
des sous-espaces associés aux histoires parentes, mais peut également être
une combinaison linéaire de tels états. C’est pourquoi une règle de somme
concernant les probabilités n’est pas évidente.
Une façon de rétablir l’additivité des probabilités est de ne considérer
que des familles pour lesquelles les termes croisés s’annulent, ce qui conduit
à imposer les conditions :
Tr ...P3,j3 (t3 )P2,j2 (t2 )P1,j1 (t1 )ρ(t0 )P1,j1 (t1 )P2,j2 (t2 )P3,j3 (t3 )...
(XI-22)
∝ δj1 ,j1 × δj2 ,j2 × δj3 ,j3 × ...
associées aux projecteurs particuliers Pi,j qui sont concernés par l’histoire
choisie.
Cette méthode fournit une description de l’évolution de ses propriétés
physiques qui peut être plus précise que celle du vecteur d’état ; en fait, plus
les sous-espaces associés aux projecteurs Pi,j sont petits, plus l’on gagne en
précision18 . Par exemple, si le système est une particule et si le projecteur
est le projecteur sur une région de l’espace, nous pourrons dire que pour une
histoire donnée la particule est dans cette région à l’instant correspondant,
même si l’ensemble de la fonction d’onde de Schrödinger s’étend sur une ré-
gion bien plus grande. Ou alors, si un photon pénètre dans un interféromètre
de Mach-Zehnder, certaines histoires du système peuvent contenir de l’infor-
mation sur la trajectoire choisie par le photon dans l’interféromètre19 , alors
que la mécanique quantique standard considère que la particule prend toutes
les trajectoires à la fois. Comme les histoires comprennent plusieurs temps
différents, on peut même tenter de reconstruire une trajectoire approchée
pour la particule, chose qui est totalement exclue en mécanique quantique
standard (par exemple pour une fonction d’onde qui est une onde sphérique) ;
mais, bien sûr, il faut toujours s’assurer que les projecteurs introduits dans
ce but restent compatibles avec la condition de cohérence pour une famille.
L’information contenue dans les histoires ne concerne pas nécessairement
que la position : un projecteur peut également projeter sur un ensemble de
vecteurs propres de l’impulsion, ou inclure une information mélangée entre
position et impulsion (en tenant compte, bien sûr, des relations de Heisen-
berg, comme toujours en mécanique quantique), une information sur le spin,
etc. Il existe en fait une immense flexibilité concernant le choix des opéra-
teurs ; pour chaque choix, les propriétés physiques qui peuvent être attribuées
au système sont toutes celles qui appartiennent en commun à tous les états
invariants sous l’action du projecteur, mais pas les états qui s’annulent sous
son action. Un choix fréquent est de supposer que, à un instant particulier ti ,
tous les Pi,j sont les projecteurs sur les états propres d’un opérateur her-
18
Inversement, il est bien évident qu’aucune information n’est gagnée si tous les projec-
teurs Pi,j sont des projecteurs sur tout l’espace des états ; cela correspond à un cas trivial
de peu d’intérêt.
19
Supposons effectivement que, avec un interféromètre de Mach-Zhender, la famille four-
nisse de l’information sur le chemin pris par le photon à l’intérieur de l’interféromètre. Dans
ce cas, la cohérence demande que l’histoire ne donne aucune information sur la voie de
sortie de la particule (après la seconde lame séparatrice), et donc quel détecteur est activé
par la particule. La raison en est que, dans les probabilités de présence de la particule dans
chacune des voies de sortie, il existe des termes d’interférence entre les chemins intermé-
diaires, alors que ces termes disparaissent si l’on somme les probabilités sur les deux voies
de sortie.
On peut également construire des familles d’histoires cohérentes où le canal de sortie est
spécifié (quel détecteur est activé), mais alors la cohérence exige qu’aucune information ne
soit donnée sur le trajet du photon dans l’interféromètre. C’est une illustration de la façon
dont la complémentarité apparaît dans le cadre de l’interprétation des histoires cohérentes.
G. HISTOIRES COHÉRENTES 345
mitique H : le premier opérateur Pi,j=1 est le projecteur sur tous les états
propres de H correspondant à la valeur propre h1 , le second Pi,j=2 le projec-
teur correspondant pour la valeur propre h2 , etc. Dans un tel cas, toutes les
histoires de la famille incluent une information exacte sur la valeur à l’ins-
tant ti de la grandeur physique associée à H (l’énergie par exemple, si H
est l’hamiltonien). Mais, comme déjà signalé, il n’est pas possible de choisir
n’importe quel opérateur Hi à tout instant ti : si l’on choisit arbitrairement
des quantités physiques de cette façon, en général il n’y a aucune raison pour
que la condition de cohérence soit satisfaite pour une famille.
Avec les histoires, nous obtenons une description des propriétés du systè-
me en lui-même, sans faire référence particulière à des mesures, des obser-
vateurs, etc. Ceci n’implique pas que les mesures sont exclues ; elles peuvent
en fait simplement être considérées comme des cas particuliers, à condition
d’inclure les appareils physiques correspondants dans le système étudié. De
plus, on attribue des propriétés au système à des temps différents, ce qui s’op-
pose à l’interprétation orthodoxe, où l’opération de mesure ne révèle aucune
propriété pré-existante du système, et de surcroît le projette sur un nouvel
état qui peut être complètement indépendant de l’état initial. Il est facile de
montrer que le formalisme des histoires cohérentes est invariant par renver-
sement du temps, en d’autres termes qu’il ne fait aucune distinction entre le
passé et le futur (au lieu de l’opérateur densité initial ρ(t0 ), on peut se don-
ner l’opérateur densité final ρ(tN ) et continuer à utiliser le même formalisme
quantique [551]) – pour plus de détails, et même une définition intrinsèque
de la cohérence qui ne met en jeu aucun opérateur densité, voir le § III de
la Ref. [552]. De plus, il est possible d’étudier une relation entre les familles
cohérentes et les descriptions semi-classiques d’un système physique ; voir
la Ref. [547] pour une discussion de la façon dont les équations classiques
peuvent être obtenues pour un système quantique pourvu qu’un moyennage
à gros grains suffisant soit effectué (afin de garantir, non seulement la déco-
hérence nécessaire entre les diverses histoires de la famille, mais également
ce que les auteurs de cette référence appellent l’inertie pour retrouver la pré-
dictabilité classique). Voir aussi le Chapitre 16 de [548] pour une discussion
de la façon dont le déterminisme classique est rétabli, dans une forme faible
qui garantit des corrélations parfaites entre les valeurs d’observables quasi-
classiques à des temps différents (il va sans dire qu’il n’est pas question de
déterminisme fondamental dans ce contexte). Le point de vue des histoires
quantiques a sans nul doute bien des aspects séduisants, et paraît particu-
lièrement clair et simple à mettre en œuvre, du moins tant qu’on se limite à
une seule famille d’histoires cohérentes.
346 CHAPITRE XI. DIVERSES INTERPRÉTATIONS
Dans l’interprétation des histoires, nul n’est besoin d’invoquer des obser-
vateurs, des appareils de mesure, etc. Le système possède des propriétés en
lui-même, comme dans la théorie de Bohm (§ H-1) ou celles de dynamique
de Schrödinger modifiée (§ K). Lorsqu’on la compare aux autres interpréta-
tions, la caractéristique de l’interprétation des histoires qui saute le plus aux
yeux est probablement l’immense flexibilité qui existe pour la sélection des
points de vue possibles pour décrire le système. On peut même se demander
si l’interprétation en question est suffisamment spécifique, et si ce nombre
immense d’histoires n’est pas un sérieux problème.
Quelle est la relation exacte entre l’interprétation des histoires et l’inter-
prétation orthodoxe ? Elles sont assurément proches, mais plusieurs concepts
sont exprimés de façon plus précise dans le point de vue des histoires. Par
G. HISTOIRES COHÉRENTES 347
20
Ces variables dépendraient alors de la famille considérée, et ne seraient donc pas des
éléments de réalité au sens de EPR, comme nous le verrons plus bas.
G. HISTOIRES COHÉRENTES 349
par définition, appartient toujours à l’intervalle [0, 1], et postuler que cette
variable donne un critère pour fixer, parmi tous les projecteurs Pji à chaque
instant ti , lequel est “réalisé” (quel projecteur définit des propriétés physiques
qui sont effectivement associées à cette histoire à cet instant). Mathémati-
quement, ceci peut être obtenu en divisant l’intervalle [0, 1] en Qi intervalles
plus petits Iij (avec j = 1, 2, ..., Qi ) et en associant les valeurs de x(ti ) com-
prises dans l’intervalle Iij à la réalisation du projecteur Pji . De cette façon,
une “trajectoire”, définie par les valeurs de x(t) à tous les instants discrets t1 ,
t2 , ...,ti , ... définit une histoire unique dans la famille. A l’instant initial t1 ,
comme en théorie de Bohm, on peut alors supposer une distribution de pro-
babilités qui reproduit les prédictions quantiques, et pour finir définir une
loi de mouvement pour le point qui garantisse la compatibilité avec les pré-
dictions de la mécanique quantique standard21 – ici la relation (XI-19). En
ajoutant ainsi la variable x(t) à l’interprétation des histoires, cette dernière
peut donc être rendue déterministe et, dans une certaine mesure, compatible
avec les idées de Bohm. Il reste que, dans l’état actuel des deux théories,
on conclurait plutôt que les deux théories donnent des points de vue très
différents sur la mécanique quantique.
Enfin, comment s’effectue la comparaison avec les théories à dynamique
de Schrödinger modifiée (§ K) ? En un sens, elles découlent d’une stratégie
complètement opposée, puisqu’elles introduisent dans une équation unique
l’évolution continue du vecteur d’état ainsi qu’un mécanisme simulant sa
réduction (quand c’est nécessaire) ; à l’opposé, l’interprétation des histoires
met sur des niveaux différents l’évolution continue de Schrödinger et une
sélection des histoires suivies par le système qui est totalement aléatoire. On
pourrait se risquer à dire que la dynamique modifiée est un prolongement du
programme purement ondulatoire de Schrödinger, alors que l’interprétation
des histoires est une version moderne des idées mises en avant par Bohr.
Une autre différence importante est, bien sûr, qu’une théorie à dynamique
modifiée n’est pas parfaitement équivalente à la théorie standard, ce qui peut
conduire à des tests expérimentaux, alors que l’interprétation des histoires
cohérentes est construite pour reproduire strictement les prédictions de la
mécanique quantique standard – même si elle peut parfois fournir des points
de vue qui sont utiles pour mieux en comprendre le contenu [426].
hérence logique. Nous avons déjà remarqué qu’il n’existe pas, et de loin, une
seule façon dont cette interprétation peut décrire les propriétés physiques
d’un système – par exemple toutes les descriptions complémentaires de l’in-
terprétation de Copenhague apparaissent au même niveau. Il s’agit là d’une
souplesse énorme, bien plus grande qu’en physique classique ou même qu’en
théorie de Bohm. Les règles que nous avons définies ci-dessus (“pas de combi-
naison de points de vue différents”) sont-elles véritablement suffisantes pour
garantir que la théorie est vraiment satisfaisante ? La réponse à cette ques-
tion n’est pas très claire, et pour plusieurs raisons. En premier lieu, pour
des systèmes macroscopiques, il serait naturel de souhaiter que la théorie in-
troduise naturellement une restriction à des familles d’histoires qui aient un
caractère quasi classique ; par malheur, le nombre de familles cohérentes est
bien trop grand pour qu’elles possèdent cette propriété [444]. C’est la raison
pour laquelle ont été proposés des critères plus restrictifs pour sélectionner
les familles, mais pour le moment aucune solution complète n’a été trouvée
de sorte que le consensus n’est pas complet ; les conséquences physiques dé-
taillées des conditions de cohérence sont toujours l’objet de travaux, et de fait
fournissent un sujet de recherche intéressant. De plus, les paradoxes histo-
riques ne sont pas tous résolus dans l’interprétation des histoires. Certains le
sont, par exemple le paradoxe de l’ami de Wigner, dans la mesure où aucune
référence à l’observateur n’est faite dans cette interprétation. Mais d’autres
restent sans réponse, trouvant juste une reformulation dans un formalisme
et un vocabulaire différents.
Prenons par exemple le paradoxe du chat de Schrödinger, paradoxe qui
initialement provient du fait que l’équation de Schrödinger ne contient aucun
ingrédient qui permette l’émergence de résultats macroscopiques uniques –
en d’autres termes qui permette d’exclure des superpositions macroscopiques
pour un système isolé et non observé. Dans l’interprétation des histoires, le
paradoxe se transpose en termes de familles d’histoires où le chat peut se trou-
ver à la fois mort et vivant ; en fait, la plupart des histoires qui sont mathéma-
tiquement acceptables en termes de condition de cohérence contiennent des
projecteurs sur des superpositions macroscopiques, tout en gardant exacte-
ment le même statut que les familles “physiques” pour lesquelles ce n’est pas le
cas. On aurait alors tendance à rechercher une condition de “super-cohérence”
qui permette d’éliminer systématiquement ces superpositions, mais pour le
moment cette condition n’existe pas. A ce stade, on peut faire deux choses :
soit considérer que la question du choix d’un ensemble d’histoires raisonnables
est juste une question de bon sens – mais alors on retourne à la situation
habituelle dans l’interprétation standard, où l’application du postulat de ré-
duction du vecteur d’état est également laissée au bon goût du physicien ;
soit invoquer la décohérence et le couplage au monde extérieur pour éliminer
toutes les familles indésirables – mais alors on revient à la situation habituelle
où, conceptuellement, il est impossible d’attribuer des propriétés physiques
G. HISTOIRES COHÉRENTES 351
22
Par exemple, dans le contexte des histoires, on invoque parfois l’impossibilité de
construire un appareillage permettant de distinguer une superposition macroscopique
d’une superposition orthogonale ; ceci justifierait l’élimination de celles qui devraient vrai-
ment être utilisées pour décrire la réalité. Un tel argument réintroduit la notion de mesure
et d’observateurs, en contradiction avec les motivations initiales de cette approche – voir la
citation de Rosenfeld dans le § E du Chapitre II. De plus, ceci ré-ouvrirait immédiatement
la porte aux paradoxes du type ami de Wigner, etc.
352 CHAPITRE XI. DIVERSES INTERPRÉTATIONS
H-1-a. Historique
2 Δ |Ψ(r, t)|
Vquantum (r) = − (XI-25)
2m |Ψ(r, t)|
quantique”. Elle n’est pas due à une préparation du système qui serait insuf-
fisamment précise, mais postulée comme conséquence d’un principe physique
fondamental. Pour une réalisation donnée d’une expérience, il n’existe au-
cune méthode permettant de sélectionner la valeur de la position qui est
effectivement réalisée parmi toutes celles de la distribution ; d’une réalisation
à la suivante, un nouveau choix totalement aléatoire de cette position est fait
par la Nature, sans possibilité par exemple de répéter la valeur précédente.
Ainsi le caractère fondamentalement aléatoire de la mécanique quantique est
maintenu [567].
Ainsi, les variables supplémentaires dépendent de la fonction d’onde de
deux façons, à la fois par leurs valeurs initiales et par leur évolution. Com-
binant l’équation de Schrödinger avec la forme du terme de “vitesse quan-
tique” (XI-23) on peut montrer que, si à l’instant t la distribution des po-
sitions est égale à |Ψ(Q1 , Q2 , ...)|2 , l’égalité reste vraie à l’instant t + dt.
Ceci assure que la propriété continue à être satisfaite à tout instant, et pré-
serve automatiquement les prédictions de la mécanique quantique concernant
toutes les probabilités de mesures de positions27 . En particulier, sous l’effet
du terme de vitesse quantique, les particules sont constamment entraînées
par la fonction d’onde de sorte qu’elles ne peuvent jamais la quitter ; le fait
qu’elles restent toujours dans les régions de l’espace où elle ne s’annule pas
assure que l’équation de guidage (XI-23) et le potentiel quantique (XI-25)
ne contiennent jamais de quantités indéterminées. Une autre conséquence
utile de cette hypothèse concernant la distribution initiale des positions est
d’éviter un conflit avec la relativité car toute autre distribution ouvrirait
la possibilité de transmission de signaux à une vitesse dépassant celle de la
lumière [568] (Appendice H). Comme la règle de Born est une conséquence
de l’équilibre quantique, on peut donc considérer que cette règle n’est pas
un postulat indépendant qu’il faut introduire en mécanique quantique, mais
juste une conséquence de l’impossibilité d’une transmission instantanée de
signal et donc de la relativité.
On peut alors rétablir le déterminisme28 , et supposer que les résultats de
mesures ne font que mettre en évidence les valeurs pré-existantes des posi-
tions, prises parmi toutes celles qui sont initialement possibles (au § H-1-d-α,
nous revenons plus en détail sur la mesure en théorie dBB). Cette hypothèse
résout plusieurs difficultés, comme celle de comprendre pourquoi des sys-
tèmes quantiques peuvent présenter un comportement à la fois ondulatoire
et particulaire dans des expériences d’interférence. En fait, le système quan-
tique contient toujours deux objets, une onde et une particule ; l’onde peut
produire des effets d’interférence et guider la particule d’une façon qui force
sa position à reproduire les caractéristiques d’une figure d’interférence – rien
27
On peut toutefois également constuire des versions modifiées de la théorie dBB qui ne
sont pas exactement équivalentes à la mécanique quantique standard ; voir § H-1-g.
28
Au moins dans une certaine mesure, voir la discussion du § H-1-i.
358 CHAPITRE XI. DIVERSES INTERPRÉTATIONS
du Chapitre I). La fonction d’onde joue un role similaire à celui d’un ha-
miltonien ou d’un lagrangien en mécanique classique : ces fonctions sont
définies mathématiquement dans tout l’espace de configuration multidimen-
sionnel, mais physiquement n’interviennent que leurs valeurs aux positions
des particules, ou dans leur voisinage infinitésimal. Une illustration de cette
analogie est donnée par un changement de jauge pour tenir compte de l’effet
d’un champ magnétique extérieur : le lagrangien classique change, mais les
forces agissant sur les particules ne sont pas modifiées ; de même, la fonction
d’onde change, mais pas les vitesses des positions bohmiennes. On peut alors
considérer que la réalité physique existe et se propage dans l’espace habituel
à 3 dimensions, et non dans l’espace des configurations multidimensionnel
comme dans le premier point de vue. La référence [570] discute ce second
point de vue plus en détail ; voir en particulier les Remarques 5 et 6 du
§ 5.1.1, où une comparaison est développée entre les propriétés de la fonction
d’onde et celles des champs électrique et magnétique en électromagnétisme
classique. Pour une discussion plus détaillée du sujet “Réalité et le rôle de
la fonction d’onde”, en particulier la fonction d’onde de l’Univers, voir par
exemple la Ref. [571].
Dans un point de vue comme dans l’autre, deux types de variables sont
nécessaires et suffisants pour fournir une description complète de la réalité.
Nous avons déjà mentionné qu’il n’existe aucune rétroaction des variables
supplémentaires sur le vecteur d’état, ce qui crée une situation inhabituelle
en physique : habituellement, quand deux quantités physiques sont couplées,
elles s’influencent mutuellement29 . Une autre caractéristique inhabituelle est
que l’effet du champ sur la position de la particule ne dépend pas de l’in-
tensité du champ correspondant, mais juste de ses variations relatives dans
l’espace. De façon amusante, nous sommes alors en présence d’une autre sorte
de dualité, qui distingue entre actions directes entre systèmes physiques (ou
leur préparation), directement exprimables en termes de vecteur d’état, et
résultats des expériences qui sont réalisées, déterminés par les variables sup-
plémentaires.
Dès lors que les particules ont une position à chaque instant, elles re-
trouvent également une vitesse, une accélération, etc. et une trajectoire comme
en physique classique. En étudiant ces trajectoires, on obtient toute une série
d’informations intéressantes et parfois inattendues. Par exemple, même dans
le cas simple d’une particule unique libre dans l’espace, les trajectoires ne
sont généralement pas de simples lignes droites [573, 574] ; elles peuvent se
29
La référence [572] discute les effets possibles d’une rétro-action des positions sur la
fonction d’onde. Une variante de la théorie dBB où cette rétro-action joue un rôle essentiel
est discutée dans le § K-4.
H. VARIABLES SUPPLÉMENTAIRES (“CACHÉES”) 361
courber d’une façon inhabituelle. Pour illustrer cette propriété, nous passons
à une étude de quelques situations conduisant à des trajectoires de Bohm
caractéristiques.
α. Une particule
Une première remarque est que, chaque fois que la fonction d’onde est
réelle, l’équation (XI-23) donne zéro30 : une vitesse ne peut exister que si la
phase de la fonction d’onde varie dans l’espace. En conséquence, par exemple
dans l’état fondamental de l’atome d’Hydrogène, la position bohmienne de
l’électron ne tourne pas autour du proton comme on aurait pu s’y attendre,
mais reste statique en un point fixe de l’espace. L’effet du potentiel quantique
compense exactement l’attraction par le proton de l’électron dans son état
fondamental, qui ne ressent donc aucune force. De même, pour un oscilla-
teur harmonique dans l’état fondamental (ou n’importe lequel de ses états
stationnaires), la position de la particule n’oscille pas dans le potentiel, mais
reste au même endroit.
Cette propriété est générale : chaque fois que l’hamiltonien est invariant
par renversement du temps, on peut choisir une base de fonctions d’onde sta-
tionnaires qui sont réelles, de sorte que la vitesse de Bohm correspondante
s’annule pour tous ces états stationnaires31 . Bien sûr, avec des fonctions
d’onde quelconques qui sont des superpositions cohérentes d’états station-
naires, la situation est différente : sous l’effet du changement de phase induit
par l’équation de Schrödinger, les positions et vitesses associées deviennent
des fonctions du temps. Un exemple est un oscillateur dans un état cohérent
quasi classique, pour lequel l’évolution temporelle de la position reproduit
parfaitement l’oscillation classique dans le puits de potentiel. De plus, même
dans des états stationnaires réels, les fonctions de corrélations des positions
sont des fonctions du temps car, en théorie dBB, l’effet de la mesure sur la
fonction d’onde et toutes les positions bohmiennes doit être pris en compte
(nous revenons sur les corrélations entre mesures à des instants différents
dans la discussion du § H-1-h, page 379).
Considérons maintenant une expérience habituelle d’interférence, comme
celle montrée schématiquement sur la Figure XI.1 : une source S émet une par
30
Nous supposons que le champ magnétique et le potentiel vecteur sont nuls.
31
L’atome d’hydrogène a des fonctions d’onde qui ne sont pas réelles, avec un facteur
de phase eiml ϕ , où ϕ est l’angle azimuthal et ml le nombre quantique associé à une com-
posante du moment cinétique orbital. Pour ces états, les trajectoires de Bohm tournent
effectivement autour du proton, comme dans l’image orbitale classique. Cependant, en
l’abscence de champ magnétique, les valeurs ±ml correspondent à la même énergie ; on
peut, par combinaison linéaire, construire une base de fonctions d’onde stationnaires qui
sont réelles et donnent donc une vitesse de Bohm nulle. Il s’ensuit que, pour une énergie
donnée, si elle est dégénérée, selon le choix de la base que l’on effectue, on trouve des
vitesses qui s’annulent ou pas.
362 CHAPITRE XI. DIVERSES INTERPRÉTATIONS
une toute une série de particules qui peuvent atteindre un écran D à travers
lequel deux ouvertures ont été percées ; des interférences sont observées dans
la région R de l’autre côté de l’écran. L’expérience est symétrique par rapport
à un plan horizontal représenté par une ligne tiretée sur la figure. Nous savons
que la mécanique de Bohm est construite de façon à reproduire exactement
les prédictions de la mécanique quantique standard concernant les mesures
de positions des particules ; comment donc cette théorie peut-elle réussir à
reproduire les franges d’interférence qui sont observées après l’écran si l’on
mesure la position de la particule dans cette région ?
C1
S R
C2
cette propriété est en fait indispensable pour que la statistique des positions
reproduise les prédictions habituelles de la mécanique quantique [575]. Deux
trajectoires typiques sont représentées sur la Figure XI.1. Un premier effet
intéressant se produit lorsque la particule passe à travers un des trous de
l’écran, si ce trou est suffisamment petit pour diffracter la fonction d’onde
(si son diamètre est plus petit que, ou comparable à, la longueur d’onde de
De Broglie) : sans toucher les parois, la particule est déviée parce que la
fonction d’onde qui pilote sa vitesse est soumise à la diffraction. De plus,
après l’écran et dans la région R où les fonctions d’onde provenant des deux
orifices se recouvrent, des effets de déviations de la trajectoire se produisent
à nouveau, car la vitesse de la particule est modifiée par des effets d’inter-
férence. Ces modifications sont telles que, lorsque la position de la particule
est mesurée successivement dans un grand nombre d’expériences identiques,
l’ensemble des résultats de mesure reconstruit exactement la figure d’inter-
férence quantique.
On peut facilement voir par symétrie que, aux points du plan de symétrie
de l’expérience (ligne centrale tiretée de la Figure XI.1), la vitesse de Bohm
est toujours contenue dans ce plan : aucune trajectoire de la particule ne peut
croiser ce plan. Ce résultat est parfois appelé “règle de non-croisement” des
trajectoires de Bohm. Considérons maintenant deux paquets d’ondes, chacun
venant d’un orifice différent, et se croisant dans la région du plan de symétrie.
La règle du non-croisement implique donc que les trajectoires “rebondissent”
sur le plan de symétrie de sorte que, lorsque les paquets d’onde se sont croisés,
les trajectoires qui suivaient un paquet d’ondes sautent sur l’autre. Il s’ensuit
que, après l’écran, une trajectoire qui se trouve au-dessus du plan de symétrie
est nécessairement passée par l’orifice du haut, et réciproquement.
Voir [55] pour une discussion de comment la trajectoire d’une particule
peut être reconstruite à partir de l’observation de ses positions successives
dans une chambre à bulles, et le Chapitre 5 de [574] pour une discussion
des trajectoires de Bohm à travers une barrière de potentiel (effet tunnel).
Des effets du même type se produisent lorsque des particules se propagent
dans un interféromètre de Mach-Zhender ; en l’abscence de la dernière lame
séparatrice, la position des particules saute d’un paquet d’onde à l’autre, de
sorte que la trajectoire prend une forme de zigzag [576].
On peut trouver ces trajectoires particulièrement étranges, et être tenté
de rejeter l’interprétation dBB pour cette raison. Il faut toutefois garder à
l’esprit que ces trajectoires ne sont pas introduites de façon arbitraire par
l’interprétation dBB : en fait, elles existent déjà dans l’interprétation stan-
dard, où elles sont simplement les trajectoires du fluide de probabilité. La
seule addition de l’interprétation dBB est de leur donner un contenu phy-
sique plus fort : la vitesse d’un fluide de probabilité y est considérée comme
la vitesse d’une position ponctuelle.
364 CHAPITRE XI. DIVERSES INTERPRÉTATIONS
β. Deux particules
Pour un système de deux particules ou plus, la situation devient encore
plus intéressante32 . Les vitesses des deux particules sont données à partir de
la fonction d’onde à deux particules Ψ(r1 , r2 ; t) par :
d 1 ∗
Q1 = Re Ψ (Q1 , Q2 ; t)∇r1 Ψ(Q1 , Q2 ; t)
dt m1 |Ψ(Q1 , Q2 ; t)|2 i
d 1 ∗
Q2 = Re Ψ (Q1 , Q2 ; t)∇r2 Ψ(Q1 , Q2 ; t)
dt m2 |Ψ(Q1 , Q2 ; t)|2 i
(XI-26)
où m1 et m2 sont leurs masses. Puisque l’équation de Schrödinger reste in-
changée en théorie dBB, comme en mécanique quantique standard la fonction
d’onde se propage toujours dans l’espace des configurations, qui a 6 dimen-
sions ; cette fonction d’onde pilote le vecteur à 6 dimensions dont les com-
posantes sont l’ensemble de celles de Q1 et Q2 . Le fait que les vitesses des
positions doivent être calculées dans l’espace des configurations est un élé-
ment essentiel de la théorie dBB, avec de nombreuses conséquences comme
nous le verrons plus bas. Toutefois chacune des deux positions de Bohm, prise
isolément, se propage dans l’espace ordinaire à trois dimensions. Du fait de
cette opposition, des effets non locaux peuvent apparaître dans la propa-
gation : la vitesse de chaque particule dépend, non seulement de sa propre
position, mais également de la position de l’autre particule, et ceci même si
elle est très éloignée.
Si la fonction d’onde Ψ(r1 , r2 ; t) est un produit :
γ. Ondes vides
En théorie dBB, l’apparition des ondes vides ne se limite pas au cas où
deux particules sont intriquées comme ci-dessus. Dans l’expérience à une
33
Si, dans (XI-26), nous remplaçons Ψ par son expression (XI-29), puis ∇r1 ϕ(Q1 , t) par
ϕ(Q1 , t) × W(Q1 , t) et ∇r1 ϕ (Q1 , t) par ϕ (Q1 , t) × W(Q1 , t), nous obtenons dQ1 /dt =
Im [W(Q1 , t)] /m1 , qui est indépendant de Q2 .
34
Selon la trajectoire considérée, ce peut être l’une ou l’autre des composantes qui est
vide.
366 CHAPITRE XI. DIVERSES INTERPRÉTATIONS
seule particule décrite sur la Figure XI.1 par exemple, chaque fois qu’une
particule est émise par la source, la position initiale de la variable bohmienne
détermine quel chemin elle va suivre et par quel trou du diaphragme elle
va passer. Une composante de la fonction d’onde guide alors la particule,
tandis que l’autre devient une onde vide, ne jouant provisoirement aucun rôle
tant que les deux composantes ne se recouvrent pas. Plus tard cependant,
lorsque les deux ondes se recombinent dans la région d’interférence R, elles
contribuent toutes deux au guidage de la particule et créent le système de
franges observé. Pendant l’interférence, l’onde vide a alors en quelque sorte
retrouvé sa particule, de sorte qu’elle n’est plus vide. De plus, comme nous
l’avons vu au § H-1-c-α, pendant que les paquets d’ondes se croisent, c’est
l’onde vide qui “attrape” la particule au passage, comme deux joueurs qui se
passent un ballon ; après leur croisement, l’onde qui était vide devient non
vide, et inversement.
Un phénomène semblable peut également se produire dans l’exemple ci-
dessus de la fonction d’onde (XI-29). Quand les deux particules sont intri-
quées mais que les fonctions χ (r2 ) and χ (r2 ) n’ont pas de recouvrement,
nous avons vu que l’une des composantes est nécessairement vide : la parti-
cule 2 est guidée par une seule onde, et aucun effet d’interférence ne peut se
produire entre ϕ (r1 ) et ϕ (r1 ), même si ces fonctions ont un recouvrement
spatial35 . Mais supposons maintenant que l’évolution future du système crée
un recouvrement entre χ(r2 , t) et χ (r2 , t), tandis que ϕ (r1 ) et ϕ (r1 ) conti-
nuent à se recouvrir (au moins partiellement). Si Q1 et Q2 tombent dans leur
région respective de recouvrement, la composante vide de la fonction d’onde
à deux particules devient active, de sorte que des effets d’interférence peuvent
à nouveau se produire : en général, la vitesse de chaque particule dépend (de
façon non locale) de la position des deux particules. Un mouvement com-
pliqué des deux positions couplées peut alors se produire. Cette situation se
produit dans les expériences d’interférence à deux particules [577,578], où les
trajectoires bohmiennes reproduisent les résultats de la mécanique quantique
standard [579].
Si finalement la particule 2 devient intriquée avec un très grand nombre
d’autres particules, par exemple celles contenues dans un appareil de mesure
(§ H-1-d-α), alors la chaîne de von Neumann se propage trop loin de sorte
qu’il devient impossible en pratique de faire apparaître à nouveau des effets
d’interférence entre les composantes. Quand la décohérence atteint le point
où elle est devenue irréversible, les ondes vides restent vides pour toujours.
Une discussion plus détaillée du rôle des ondes vides dans le contexte de
la théorie dBB ou d’autres interprétations peut être trouvée par exemple
dans [71] et [580].
35
Cette absence d’interférence se produit également en mécanique quantique standard :
par trace partielle sur la particule 2 , les cohérences associées à la particule 1 disparaissent.
H. VARIABLES SUPPLÉMENTAIRES (“CACHÉES”) 367
tout aussi bien pendant toutes les étapes d’un processus de mesures qu’à
tout autre instant.
Considérons en effet un système physique après qu’il ait interagi avec un
appareil de mesure. Il est alors nécessairement intriqué avec l’appareil (§ A),
de sorte que la fonction d’onde de l’ensemble des deux systèmes prend la
forme :
Ψ(r, r1 , r2 , ..., rN ; t) = ϕj (r, t) χj (r1 , r2 , ..., rN ; t) (XI-31)
j
où les ϕj (r, t) sont des fonctions d’onde du système mesuré associées aux
différents résultats possibles de mesure, qui sont mutuellement orthogonales.
Les χj (r1 , r2 , ..., rN ; t) sont les fonctions d’onde correspondantes pour l’ap-
pareil de mesure (y compris l’aiguille du cadran, souvent appelée “pointeur”),
elles aussi orthogonales ; elles dépendent d’un très grand nombre de positions
r1 , r2 , ..., rN puisque l’appareil est évidemment constitué d’un très grand
nombre de particules. En fait les fonctions d’onde de l’appareil sont, non
seulement orthogonales, mais également sans recouvrement – pour que l’ob-
servation de la position de l’aiguille fournisse une mesure, il faut que les
positions d’un grand nombre des particules qui constituent l’appareil soient
différentes selon le résultat observé. Nous retombons sur une forme du vec-
teur d’état semblable à (XI-29), dans le cas où il n’y a pas de recouvrement,
de sorte que la même discussion reste valable. Nous avons vu (§ H-1-b) que
les variables de position de Bohm ne peuvent jamais “quitter” la fonction
d’onde (atteindre des points de l’espace des configurations où elle s’annule).
Après la mesure, les variables Q1 , Q2 ,... QN associées à l’appareil de me-
sure se trouvent donc nécessairement dans l’un des domaines de l’espace des
configurations où l’une des fonctions d’onde χj ne s’annule pas ; comme ces
domaines sont disjoints, elles ne peuvent appartenir à plus de l’un de ces do-
maines. Ainsi, pour n’importe quelle trajectoire, seul un terme de la somme
(XI-31) intervient, alors que tous les autres sont des “ondes vides”.
De plus, nous avons vu à la fin du § H-1-c-γ que, du fait du très grand
nombre de variables associées à un appareil de mesure et à son environne-
ment, il devient totalement impossible en pratique de rétablir un recouvre-
ment des différentes composantes de la fonction d’onde et de guider chacune
des très nombreuses positions bohmiennes vers sa région propre de recouvre-
ment pour la fonction d’onde. Ainsi, ces ondes vides ne peuvent plus jouer
aucun rôle dans le guidage des particules, et aucun rôle non plus concernant
les résultats de mesures futures de positions ; elles resteront vides pour tou-
jours. Il est donc possible de ne garder que le terme non vide, et d’ignorer
tous les autres sans affecter aucunement la dynamique ultérieure du système
total. On peut également normaliser ce terme non vide (en théorie dBB, les vi-
tesses sont invariantes si l’on multiplie la fonction d’onde par une constante).
H. VARIABLES SUPPLÉMENTAIRES (“CACHÉES”) 369
Le résultat final est que, pour toute réalisation donnée d’une expérience, la
trajectoire des positions est donnée, et :
– un seul résultat est obtenu ;
– une seule des composantes de (XI-31) joue un rôle dans le calcul du
mouvement ultérieur des positions bohmiennes dans l’espace des configu-
rations (ainsi que dans le calcul des probabilités associées à toute mesure
éventuelle qu’on pourrait ensuite effectuer sur le système). Ceci reconstruit
la réduction du vecteur d’état.
Dans le point de vue de De Broglie-Bohm, le résultat d’une expérience
n’est que la conséquence de la position initiale aléatoire du système dans
l’espace des configurations. L’unicité de ce résultat résulte simplement de
l’impossibilité pour un seul point de l’espace des configurations d’appartenir
à la fois à plus d’un des domaines associés aux composantes de (XI-31).
Ceci produit automatiquement une annulation de toutes les composantes
de la fonction d’onde, sauf celle correspondant au résultat de la mesure.
Le déterminisme est rétabli en principe mais, du fait que cette variable de
position ne peut être contrôlée lors de l’étape de préparation du système
– voir ci-dessus et le point (ii) du § H-1-b – en pratique les expériences
donnent toujours des résultats aléatoires. Alors qu’en mécanique quantique
standard le mécanisme de la décohérence (corrélation avec l’environnement)
n’est pas suffisant pour expliquer l’émergence d’un résultat unique dans une
expérience unique, en théorie dBB il l’est grâce à l’introduction des variables
de position de l’appareil de mesure et au mécanisme des ondes vides. C’est
un succès considérable !
γ. Ondes effectives
Plus généralement, considérons une série d’expériences dont le produit est
une liste de résultats successifs pour des observables arbitraires (par exemple
des spins, comme discuté au § H-1-e-α). Pour chaque réalisation de la série
d’expériences, la liste de résultats effectivement observés est étiquetée par les
370 CHAPITRE XI. DIVERSES INTERPRÉTATIONS
δ. Non-localité
Dans le § H-1-c-β, nous avons vu que les positions bohmiennes évoluent
selon des équations qui sont explicitement non locales. La non-localité est
évidemment une propriété singulière pour une théorie physique, mais nous
devons garder à l’esprit que cette propriété n’est pas plaquée de façon artifi-
cielle sur une théorie qui serait sinon parfaitement locale : la mécanique quan-
tique standard n’est pas vraiment locale elle non plus. En fait, dans l’espace
des configurations, les deux théories sont bien locales, mais c’est le passage
à l’espace ordinaire à 3 dimensions qui fait apparaître les non-localités.
Considérons par exemple deux particules sans spin et leur espace des
configurations à 6 dimensions. Le formalisme de la mécanique quantique
standard ne propose aucune description locale de la physique se produisant
à la position d’une seule particule, même si les deux particules sont conte-
nues dans des régions très éloignées de l’espace. La description standard est
contenue dans la fonction d’onde36 , dont les valeurs dépendent des positions
r1 et r2 des deux particules. Si la fonction d’onde n’est pas un produit, la
seule façon correcte de caractériser le système physique met en jeu l’espace
des configurations. Par exemple, l’évolution de la phase de la fonction d’onde
met en jeu les valeurs des potentiels à une particule V (r1 ) et V (r2 ). Il en est
36
Ceci est vrai dans le point de vue de Schrödinger. Dans le point de vue de Heisen-
berg, la dynamique est contenue dans l’évolution d’opérateurs ; leurs éléments de matrice
appartiennent à un espace dont la dimension est le carré de celle de l’espace des configu-
rations, donc encore bien plus grande. Si l’on utilise la seconde quantification ou la théorie
des champs, la dimension devient infinie (en théorie des champs, les coordonnées de l’es-
pace ordinaire apparaissent dans le formalisme comme des paramètres dont dépendent les
opérateurs, mais l’espace dans lequel agissent ces opérateurs est de dimension infinie).
H. VARIABLES SUPPLÉMENTAIRES (“CACHÉES”) 371
de même du courant de probabilité J, qui est lui aussi défini dans l’espace
des configurations, et dont la dérivée contient en général les deux potentiels
(toutefois, pour les deux théories, la non-localité disparaît dès qu’on effectue
une trace partielle sur l’autre particule ; en théorie dBB, ceci met en jeu une
intégration sur toutes les positions possibles de la seconde particule).
La différence entre les deux théories ne tient donc pas tellement aux
équations mathématiques, qui ne sont vraiment locales ni dans un cas ni
dans l’autre. Elle tient plutôt au fait que la théorie dBB attribue une réalité
physique à des variables qui évoluent de façon non locale, alors qu’en théorie
standard les évolutions non locales ne concernent que des variables dont le
lien avec la réalité physique est moins direct.
d 1
∗
Q= * Re Ψ μ (Q, t)∇Ψμ (Q, t) (XI-32)
dt m μ |Ψμ (Q, t)|2 μ
i
1
* 2 ∇× Ψ∗μ (Q, t) [σΨ(Q, t)]μ (XI-33)
m μ |Ψμ (Q, t)| μ
[ % %
2 ]
Figure XI.2 – Dans une expérience de Stern et Gerlach, les atomes se pro-
pageant le long de la direction Oz pénètrent dans une région (rectangle) où
règne un champ magnétique intense B le long de la direction Ox. Son fort
gradient agit sur les moments magnétiques des atomes et les dévie d’une fa-
çon dépendant de leur spin. Initialement, les atomes ont une direction du spin
transverse le long de Oy. Lorsqu’ils se propagent dans le gradient, cette di-
rection change : lorsqu’ils quittent l’appareil, deux faisceaux séparés sont for-
més avec des spins parallèles ou antiparallèles à Ox. La figure montre quatre
exemples de trajectoires bohmiennes (les directions des flèches montrent les
changements de l’angle polaire entre le spin et Ox ; pour plus de clarté, la
précession rapide de l’angle azimuthal du spin autour de B n’est pas prise en
compte).
H. VARIABLES SUPPLÉMENTAIRES (“CACHÉES”) 373
β. Quelques exemples
Les effets qui se produisent pour une particule sans spin ont leur contre-
partie lorsqu’elle possède un spin. Nous en discutons maintenant quelques
exemples.
(i) La direction d’un spin ne reste pas toujours nécessairement constante
le long d’une trajectoire, même pour une particule libre – pour plus de détails,
voir par exemple les Chapitres 9 et 11 de [574] et [586]. Comme dans la
Ref. [587], considérons un atome qui pénètre dans un appareil de Stern et
Gerlach mesurant la composante du spin sur Ox. Si initialement le spin
pointait dans une direction perpendiculaire Oy, la direction du spin change
progressivement au fur et à mesure que la trajectoire se propage dans le
gradient de champ magnétique, et finit par devenir parallèle (ou antiparallèle)
à Ox à la sortie de l’appareil. Le premier cas correspond aux trajectoires
conduisant au résultat +1, le second à celles donnant le résultat −1.
Des rotations du spin le long des trajectoires se produisent même pour des
particules libres ; il existe un équivalent de la “règle du non-croisement” : si
deux paquets d’ondes associés avec des directions opposées du spin se croisent
dans l’espace libre, le long de toute trajectoire de Bohm la direction du spin
tourne au cours du croisement et, après que la position ait sauté d’un paquet
d’ondes à l’autre, termine dans la direction opposée de la direction initiale
– un effet analogue à l’échange de paquets d’ondes par les trajectoires que
nous avons discuté plus haut.
(ii) Une expérience de pensée intéressante fait intervenir une particule
avec spin se propageant le long de la direction Oz qui est envoyée successive-
ment à travers toute une série d’analyseurs (des aimants de Stern et Gerlach
par exemple) d’orientations différentes (Fig. XI.3) ; le premier analyseur sé-
pare les deux valeurs de la composante du spin de long de Ox, le second le
long d’une direction perpendiculaire Oy, le troisième à nouveau le long de Ox,
etc. (à chaque étape, la direction selon laquelle la mesure est effectuée tourne
de 90◦ ). Le premier analyseur divise les trajectoires en deux groupes, celles
qui vont dans des directions positives le long de Ox, et celles qui vont dans
des directions négatives, en fonction de la position initiale de la particule.
Le second analyseur divise à nouveau chacun de ces deux groupes de trajec-
toires en deux sous-groupes, parmi lesquels la trajectoire de la particule fait
un choix en fonction de sa position initiale. Le même phénomène se répète
pour les mesures suivantes. On pourrait alors espérer, au bout d’un certain
nombre de mesures, que l’information obtenue sur la position bohmienne de-
vienne suffisamment précise pour permettre de prédire la trajectoire dans
l’analyseur suivant. En fait, quel que soit le nombre d’analyseurs utilisés, on
n’atteindra jamais une situation où la position bohmienne est suffisamment
bien connue pour permettre une détermination parfaite du résultat de la me-
sure suivante : sans aucune limite, le résultat reste toujours complètement
374 CHAPITRE XI. DIVERSES INTERPRÉTATIONS
aléatoire. La raison en est que la répétition des mesures introduit une sensibi-
lité aux conditions initiales qui croît exponentiellement, d’une façon analogue
à une situation chaotique en mécanique classique. A chaque étape, la distri-
bution de la position de Bohm reste exactement celle d’équilibre quantique.
Il n’existe ainsi aucune façon, même avec un très grand nombre de mesures,
d’éliminer le caractère fondamentalement non déterministe de la mécanique
quantique.
<
<
"
[ [
plus applicable lorsque le vecteur d’état est une superposition contenant des
nombres totaux de bosons différents. On peut alors procéder comme ci-dessus
pour le champ électromagnétique, et introduire des variables bohmiennes
pour les champs37 . On peut même introduire des opérateurs de création et
d’annihilation [593, 594] qui créent ou annihilent des positions bohmiennes,
de sorte que les trajectoires démarrent ou se terminent en des points. Pour
finir, la situation pour les bosons est qu’il semble exister un choix entre les
variables bohmiennes de position ou de champ.
Pour des champs fermioniques, si l’état quantique contient un nombre
fixé de particules, la situation est la même que plus haut : les positions boh-
miennes sont guidées par une fonction d’onde totalement antisymétrique. Il
est plus compliqué d’introduire des variables bohmiennes pour des champs
qui sont associés à des opérateurs qui anticommutent ; pour éviter la dif-
ficulté, on peut postuler que les variables bohmiennes sont uniquement les
positions. Si l’on combine ceci avec la description ci-dessus, on arrive à une
description de la réalité où les fermions et bosons sont traités de façon très
différente, les premiers ayant des variables bohmiennes de position et les
seconds de champ. La symétrie de la seconde quantification habituelle est
perdue. Mais, après tout, les bosons et les fermions sont effectivement des
systèmes physiquement très différents, et il n’y a aucune raison particulière
pour qu’ils soient traités de la même manière ! De plus, des bosons composites
(par exemple des atomes) contenant un nombre pair de fermions acquièrent
effectivement une position dans cette théorie, le centre de masse des consti-
tuants fermioniques.
Bell a également discuté la quantification dans un cadre réaliste de champs
fermioniques sur un réseau d’espace discret [560] ; c’est d’ailleurs à cette oc-
casion qu’il a introduit le mot “beable”. Dans son modèle, l’équation pilote
déterministe est remplacée par des probabilités de transitions stochastiques,
mais il conjecture que cette composante stochastique pourrait disparaître
d’une façon ou d’une autre à la limite continue. Aucune variable supplé-
mentaire n’est introduite pour les bosons ; les variables bosoniques standard
apparaissent seulement dans le vecteur d’état, comme habituellement. Pour
des revues sur les théories dBB des champs, voir par exemple [593] et [595]
ou, pour une théorie relativiste, [596, 597].
Pour aller plus loin, on peut alors traiter le facteur d’échelle de façon
approximative, c’est-à-dire comme un nombre classique ; bien évidemment,
ceci n’est pas très satisfaisant sur le plan conceptuel. Mais l’on peut aussi dé-
velopper une théorie dBB de la gravité quantique selon les mêmes lignes que
pour le champ électromagnétique ; il apparaît alors une variable bohmienne
pour la métrique. Les références [598] et [599] ont cependant montré que, une
fois qu’une transformation unitaire a été appliquée pour mettre l’hamiltonien
sous forme d’une somme de deux termes, il est utile d’introduire la trajectoire
de Bohm du facteur d’échelle. Cette trajectoire peut être calculée à des ordres
successifs, ce qui rend possible d’injecter les valeurs correspondantes dans les
diverses équations de perturbation des autres degrés de liberté. Cette façon
de procéder ne signifie en aucune manière que les effets quantiques ont été
ignorés : comme nous l’avons vu, les trajectoires bohmiennes sont sensibles
aux effets d’interférence et d’effet tunnel, et leur usage ne supprime aucun
effet quantique. Par exemple, la méthode s’applique aux théories où l’Uni-
vers passe par des cycles d’expansion-contraction, mais où la contraction ne
dépasse pas une valeur petite (mais non nulle) du facteur d’échelle, pour la-
quelle les effets quantiques gravitationnels deviennent tellement répulsifs que
l’Univers rebondit vers l’extérieur (“Big Bounce”) [600]. Cette approche est
particulièrement bien adaptée à la définition d’un temps global en cosmolo-
gie ; divers résultats intéressants en cosmogenèse quantique ont été obtenus de
cette façon. Bien sûr on peut, au choix, interpréter les trajectoires de Bohm
comme définissant un phénomène physique réel, ou simplement comme un
outil mathématique intermédiaire commode rendant plus aisé un calcul de
perturbations.
H. VARIABLES SUPPLÉMENTAIRES (“CACHÉES”) 379
Nous ne pouvons discuter ici tous les aspects de la théorie dBB. Ce n’est
pas une théorie d’usage général en physique quantique ; elle n’a certainement
pas été appliquée à tous les problèmes qui ont été traités avec succès dans le
cadre de la mécanique quantique standard, allant des innombrables applica-
tions en matière condensée, optique quantique, etc. jusqu’à la chromodyna-
mique quantique (théorie des interactions fortes mettant en jeu les quarks,
une composante essentielle de notre description actuelle du monde physique).
Puisque notre propos ici est plutôt de nous concentrer sur l’interprétation,
nous nous contenterons de discuter quelques exemples d’application de la
théorie dBB. Nous les choisirons parce qu’ils mettent en lumière le contenu
physique de cette théorie, et permettent au passage de clarifier un certain
380 CHAPITRE XI. DIVERSES INTERPRÉTATIONS
Figure XI.4 – Une expérience d’interférence avec une source S et des écrans
disposés de façon à ce que les paquets d’ondes se croisent dans la région
d’interférence R.
seconde particule qui passe dans la cavité du haut ; le résultat est que les deux
trajectoires s’influencent mutuellement, alors que jamais elles ne sont proches.
De cette constation surprenante, les auteurs concluent que les trajectoires
rétrodictives de Bohm sont “surréalistes”. Nous étudions maintenant cette
question.
Remarques :
(ii) Une autre remarque est que, dans le cadre de l’interprétation parfai-
tement standard de la mécanique quantique, les “mesures sans interactions”
sont décrites d’une façon qui est en réalité très proche de cette description de
Bohm. Dans le § D, nous avons décrit une expérience où certains événements
ne peuvent se produire que parce que l’onde de Schrödinger est absorbée
dans un bras d’un interféromètre, alors que la particule n’a accès qu’à l’autre
bras pour se propager ; dans de tels événements, les propagations de l’onde
et de la particule semblent tout aussi dissociées. Les processus de mesure
sans interaction tout à fait standard ne sont pas moins “surréalistes” que les
trajectoires de Bohm !
H. VARIABLES SUPPLÉMENTAIRES (“CACHÉES”) 383
d’onde :
1
Ψ(r, r1 , r2 ) = √ [ϕupper (r)χe (r1 )θg (r2 ) + ϕlower (r)χg (r1 )θe (r2 )] (XI-34)
2
où ϕupper (r) et ϕlower (r) sont les fonctions d’onde de la particule qui partent
respectivement des orifices supérieur et inférieur dans l’écran, χg,e (r1 ) les
fonctions d’onde associées au premier oscillateur harmonique dans son état
fondamental g et son premier état excité e, et θg,e (r2 ) les fonctions d’onde
analogues pour l’autre oscillateur.
Les localisations les plus probables des positions Q, Q1 et Q2 sont celles
où |Ψ(Q, Q1 , Q2 )|2 prend des valeurs relativement grandes, ce qui implique
que l’une des deux composantes au moins de (XI-34) ait un grand module.
Une valeur maximale de la première composante demande que Q1 soit choisi
de façon à donner une valeur maximale à |χe (Q1 )|2 , tandis que la seconde
composante demande que |χg (Q1 )|2 soit maximal. Mais les deux fonctions
χe,g (r) sont significativement différentes (elles sont en fait orthogonales), et
leurs maximums ne coïncident pas ; quelle que soit la valeur aléatoire de Q1 ,
au plus l’une de ces fonctions peut prendre une valeur relativement grande,
l’autre restant assez petite40 . Il en est évidemment de même pour Q2 . Ainsi,
pour un choix quelconque de Q1 et Q2 , la probabilité ne peut être signifi-
cative que lorsqu’une des composantes de (XI-34) domine l’autre. Il s’ensuit
que, pour une trajectoire particulière du système (dans l’espace des états
des configurations à 9 dimensions), la probabilité est grande que les deux
composantes de (XI-34) aient un module différent. Ceci brise la symétrie
initiale et change le système d’interférences : la règle de non-croisement ne
s’applique évidemment plus. Certes, il existe toujours des trajectoires para-
doxales (celles où la trajectoire passe par une cavité mais excite le champ
dans une autre), mais elles demandent une configuration peu probable de Q1
et Q2 , de sorte que leur probabilité en est nettement diminuée.
De plus, si nous désirons obtenir une information sur l’état du champ
dans les cavités, il nous faut le coupler à d’autres systèmes physiques, une
seconde particule par exemple. A son tour, la position de cette particule sera
diffusée dans une direction qui dépend de l’état du champ dans les cavités.
La superposition écrite en (XI-34) doit maintenant contenir 4 fonctions et 4
variables, et le déséquilibre entre les deux termes de (XI-34) sera encore plus
marqué pour la plupart des trajectoires (dans l’espace des configurations à
12 dimensions). Enfin, lorsque cette seconde particule atteindra un appareil
de mesure, le nombre de degrés de liberté intriqués devient très grand et
on atteint la même situation que plus haut : l’une des ondes devient totale-
ment vide, et toutes les trajectoires paradoxales disparaissent complètement
40
Par exemple, si Q1 tombe exactement sur un maximum de la distribution de proba-
bilité pour l’état fondamental, la fonction d’onde de l’état excité s’annule exactement, de
sorte que l’un des termes de (XI-34) disparaît totalement.
H. VARIABLES SUPPLÉMENTAIRES (“CACHÉES”) 385
Remarque :
On peut trouver un lien entre cette analyse et l’un des fameux para-
doxes discutés par Einstein et Bohr aux conférences Solvay. Einstein élevait
une objection contre le principe d’incertitude, en considérant une expérience
d’interférence où le recul d’impulsion de l’écran est mesuré, ce qui fournit
une information “Welcher Weg” (quel chemin) – voir par exemple le Complé-
ment DI de [608]). Bohr a répondu [609] qu’il faut tenir compte du caractère
quantique de l’écran, qui lui aussi est soumis aux relations d’incertitude ; un
calcul correct montre alors que, si l’interférence peut être observée, l’état de
l’écran est nécessairement tel qu’il est impossible de déterminer le trajet de la
particule. Einstein a alors reconnu que le paradoxe était levé. Ici, nous avons
une situation similaire : de l’impulsion est également transférée de la parti-
cule vers l’écran, par exemple lorsque sa trajectoire se courbe lors du passage
dans les trous. Ceci a nécessairement des conséquences sur les positions boh-
miennes associées à l’écran. Il serait incohérent de traiter les deux systèmes
différemment, l’un avec une position bohmienne, l’autre sans. Le fait que la
mécanique quantique s’applique de la même façon à tous les systèmes était
précisément la conclusion de cette discussion entre Einstein et Bohr. Il est
amusant de voir que cet argument historique s’applique également dans le
cadre de la théorie dBB !
Au niveau microscopique, le fait que deux trajectoires puissent s’influen-
cer mutuellement même si elles ne passent jamais près l’une de l’autre (dans
une expérience de type EPR par exemple) n’est en rien une absurdité, mais
simplement une illustration du caractère explicite de la non-localité en théo-
rie dBB – voir la citation de Bell ci-dessus ou la discussion de cette expérience
de pensée par Griffiths [610]. Il existe bien d’autres exemples illustrant que
les phénomènes quantiques sont bien locaux dans l’espace des configurations,
mais pas dans l’espace ordinaire.
γ. Pointeurs lents
Cette analyse illustre pourquoi un bon recouvrement entre les deux états
quantiques du pointeur (les états intriqués avec ceux de la particule test) favo-
rise le non-croisement des trajectoires, et donc leur caractère surréaliste éven-
tuel. Il a été suggéré de maximiser ce recouvrement par l’usage de “pointeurs
lents” [611,612]. Il s’agit de détecteurs de chemin qui se trouvent initialement,
juste après intrication avec la particule test, dans deux états quantiques ayant
la même répartition spatiale de densité de probabilité, mais cependant ortho-
gonaux : les deux fonctions d’onde correspondent à des impulsions différentes
386 CHAPITRE XI. DIVERSES INTERPRÉTATIONS
racine carrée de la densité de probabilité de la position, et une phase dont le gradient est
proportionnel à la vitesse ordinaire.
J. INTERPRÉTATIONS MODALE ET INTERACTIVE 393
sant que l’état physique pouvait être n’importe quel état apparaissant dans
la décomposition de l’état dynamique (il peut être n’importe quelle combi-
naison linéaire des états propres de valeur propre non nulle de l’opérateur
densité partiel ρS définissant l’état dynamique de S). Cette définition reste
alors relativement peu précise. D’autres auteurs ont proposé de se limiter à
la décomposition bi-orthonormale (décomposition de Schmidt, § B-2 du Cha-
pitre VII) pour écrire l’état intriqué du système complet T sous la forme :
|Ψ = cn |ϕn ⊗ Φn (XI-35)
n
où les |ϕn sont normés et mutuellement orthogonaux ainsi que les |Φn . Les
|ϕn donnent alors les états physiques possibles pour décrire le système S.
Bien sûr, si tous les cn sont nuls sauf un, le système S est déjà dans un
état pur dans le cadre de la mécanique quantique standard, et cet énoncé
n’apporte rien de nouveau. Mais l’interprétation modale postule que, même
lorsque plusieurs des cn ne sont pas nuls, le système S possède toutes les
propriétés physiques associées à un seul |ϕn . Ce postulat reste fondamen-
talement non déterministe : la seule prévision possible est que le système S
a une probabilité |cn |2 d’être dans l’état |ϕn , ce qui reconstruit la règle de
Born (à ce stade, l’usage de l’état dynamique est donc inévitable). Mais,
même s’il est impossible de prédire à l’avance quel état physique accessible
sera atteint, lorsqu’il est atteint, toutes les propositions concernant S qui se-
raient vraies en mécanique quantique standard si S était dans l’état |ϕn sont
effectivement vraies. Ce point de vue, où l’état dynamique ne détermine pas
d’une façon unique l’état physique mais ne fournit que des valeurs possibles
de cet état, est appelé “modal” parce qu’il conduit à une logique modale de
propositions quantiques (§ D-1).
Le résultat final est que l’état physique de S peut en général contenir plus
d’information sur les propriétés physiques de S que son état dynamique. Une
limite générale est toutefois imposée sur la quantité d’information supplé-
mentaire en question : l’ensemble des propriétés physiques qui résultent de
cette description plus précise ne peut excéder le maximum contenu dans une
description standard par un vecteur d’état quelconque. En d’autres termes,
on peut parfaitement attribuer à S un état pur même s’il est intriqué avec
un autre système quantique (donc même si S n’est pas décrit par un état
pur en mécanique quantique standard), mais il n’est pas possible d’aller au-
delà pour obtenir une description encore plus précise. En conséquence, on ne
peut jamais attribuer simultanément des valeurs parfaitement définies à des
grandeurs physiques correspondant à des opérateurs qui ne commutent pas,
position et impulsion par exemple (contrairement à la mécanique bohmienne,
où une particule possède une position et une vitesse parfaitement précises à
tout instant). On arrive alors à une description avec deux vecteurs d’état qui
rappelle un peu la théorie de Bohm-Bub de la mesure [7], sur laquelle nous
J. INTERPRÉTATIONS MODALE ET INTERACTIVE 395
devient alors sans objet ; une loi d’évolution unique suffit, et l’on peut dire
que macro- et micro-dynamiques sont unifiées. La condition (ii) ajoute que
la sélection d’une seule branche doit être (ou sembler être) aléatoire d’une
façon qui reproduise exactement les règles de probabilité de la mécanique
quantique standard, ainsi que l’effet de la réduction du vecteur d’état. La
condition (iii) implique que les conséquences de la modification de l’équation
de Schrödinger doivent rester extrêmement petites dans toutes les situations
ne mettant en jeu que des objets microscopiques (atomes, molécules, etc.) ;
ceci assure immédiatement la préservation de l’immense capital de prédic-
tions excellentes fournies par la mécanique quantique dans ce domaine.
Ainsi, deux extrêmes doivent être évités : ou bien trop perturber l’équa-
tion de Schrödinger, et faire disparaître les effets d’interférence dans des cas
où l’on souhaite les conserver (par exemple une recombinaison de deux jets
atomiques à la sortie d’un aimant de Stern et Gerlach lorsqu’aucune déco-
hérence ne s’est produite) ; ou alors trop peu, et ne plus assurer la totale
disparition d’incertitude macroscopique (chats de Schrödinger). Le nouveau
terme doit devenir important au moment où (et pas avant) un système mi-
croscopique s’est corrélé à un environnement macroscopique, ce qui assure
qu’une décohérence efficace s’est déjà produite ; de toute façon, dans le cadre
de la théorie standard, la restauration d’effets d’interférence est déjà devenue
impossible. Le nouveau terme reproduit alors bien les effets du postulat de
réduction du paquet d’ondes, qui n’est ainsi plus un postulat indépendant,
mais juste une conséquence de l’évolution tout à fait “normale” de la fonction
d’onde.
Inclure de cette façon l’émergence de l’unicité macroscopique dès l’équa-
tion dynamique fondamentale de la théorie résout bien des difficultés concep-
tuelles de la mécanique quantique. Il n’est plus nécessaire de préciser une
frontière entre les domaines d’application de deux postulats, puisque les pro-
cessus de mesure deviennent des processus d’interaction tout à fait ordinaires
entre deux systèmes physiques ; l’observation ne joue aucun rôle particulier,
ce qui supprime toute nécessité de traiter les mesures différemment de l’évo-
lution “normale”. De plus, il devient alors parfaitement possible de considérer
que le vecteur d’état décrit directement la réalité physique, au lieu de n’y voir
qu’un simple outil de calcul. La théorie contient donc tous les éléments néces-
saires pour expliquer [14] “pourquoi les événements se produisent” ! L’utilité
d’introduire en physique quantique la notion d’événement, ainsi que la “trans-
mutation des possibilités en faits”, est discutée dans les Refs. [641, 642].
Pour véritablement définir une théorie, les conditions générales ci-dessus
ne sont évidemment pas suffisantes ; il faut préciser de quelle façon exacte
on choisit de modifier l’équation de Schrödinger, sans autre guide que les
“lignes jaunes à ne pas dépasser” (ii) et (iii). Il n’est donc pas étonnant que
plusieurs versions des théories à dynamique de Schrödinger modifiée aient
été proposées.
398 CHAPITRE XI. DIVERSES INTERPRÉTATIONS
En 1966, Bohm et Bub [7] ont proposé une théorie de la mesure conte-
nant un mécanisme conduisant à la réduction du vecteur d’état. Cette théorie
appartient à la seconde catégorie (avec variables supplémentaires), puisque
ces auteurs introduisent dans leur théorie les variables supplémentaires de
Wiener et Siegel [12], qui sont contenues dans un “vecteur dual”. Ce dernier
est un objet mathématique très semblable au vecteur d’état | Ψ >, mais
qui obéit à une équation de mouvement totalement différente – en fait les
deux vecteurs évoluent sous l’effet d’équations couplées. Les probabilités des
résultats de mesure sont simplement des conséquences d’une distribution ini-
tiale aléatoire du vecteur dual. Pour certaines distributions “normales” de ces
nouvelles variables, les prédictions de la mécanique quantique standard sont
retrouvées ; mais il est également possible de supposer l’existence de distri-
butions “sans dispersion” qui conduisent à des prédictions plus précises, donc
non standard. Il en résulte que cette théorie conduit à une statistique plus
riche que celle de la mécanique quantique habituelle. Les auteurs discutent
dans quelles circonstances les effets des nouvelles variables, qui n’ont pas été
observées pour le moment, pourraient être détectées dans le futur.
En 1976, Pearle [13] a introduit une version de la théorie qui, elle, ap-
partient à la première catégorie, celle sans variables supplémentaires. On
considère le vecteur d’état du système comprenant à la fois le système me-
suré et l’appareil de mesure, juste après l’interaction ; ils sont alors fortement
intriqués dans une superposition cohérente d’états macroscopiquement dif-
férents (§ A du Chapitre IX). L’idée est de supposer que le résultat de la
mesure est déterminé par les phases relatives des diverses composantes du
vecteur d’état ; comme ces phases ne peuvent pas être contrôlées expérimen-
talement avec une parfaite précision, le résultat final de la mesure apparaît
alors comme aléatoire. Ce comportement est obtenu en ajoutant dans l’équa-
tion d’évolution du vecteur d’état un nouveau terme non linéaire, avec une
constante de temps γ, qui réduit le vecteur d’état à l’une seule de ses compo-
santes macroscopiques d’une façon qui dépend des phases initiales relatives.
Dans ce point de vue, le caractère aléatoire du processus de mesure, postulé
en mécanique quantique standard comme fondamental, n’est qu’une consé-
quence du fait que les conditions expérimentales ne sont jamais parfaitement
reproductibles. Le formalisme habituel de la mécanique quantique est rela-
tivement peu modifié, le terme nouveau dans l’équation d’évolution devant
K. DYNAMIQUE DE SCHRÖDINGER MODIFIÉE 399
En 1986 Ghirardi, Rimini et Weber (GRW) ont introduit une nouvelle ver-
sion de la théorie fournissant une “théorie unifiée des systèmes microscopiques
et macroscopiques” [15]. Ils arrivent à ce résultat en ajoutant à l’équation de
Schrödinger habituelle des processus d’évolution qu’ils nomment “localisa-
tion spontanée” (“spontaneous localization”, ou SL en anglais) ; ces derniers
changent brusquement le vecteur d’état en localisant sa fonction d’onde dans
400 CHAPITRE XI. DIVERSES INTERPRÉTATIONS
l’espace – comme si les positions des particules étaient mesurées à des temps
aléatoires, et avec une précision imparfaite (la localisation garde une certaine
imprécision). Un certain nombre des propriétés de cette théorie rappellent
l’effet des observations et mesures continues en mécanique quantique stan-
dard [645, 646] (§ C-2), ou celles de mesures approximatives. La localisation
spontanée se produit à des instants aléatoires avec une constante de temps qui
est ajustée de façon que, pour des systèmes macroscopiques, toute superposi-
tion d’états de localisations spatiales éloignées soit très rapidement détruite
– cf. condition (i) ci-dessus ; mais ceci n’est vrai que pour des systèmes ma-
croscopiques, et pas pour des systèmes microscopiques – cf. condition (ii)
ci-dessus. Un peu auparavant (1984), Gisin avait également introduit une
dynamique modifiée de Schrödinger avec des équations semblables réalisant
le postulat de projection [472], mais dans ce cas le temps de réduction du
vecteur d’état est infini.
Une propriété remarquable de l’approche GRW est qu’elle résout le pro-
blème de la “base privilégiée” (la base correspond nécessairement à des états
localisés en position) ainsi que le problème du “déclenchement”. Dans ce mo-
dèle, pour une réalisation unique d’un système quantique (par opposition
avec l’ensemble d’un très grand nombre de réalisations46 du même système),
les processus de localisation sont soudains ; on les appelle parfois en anglais
“hitting processes”. Ceci les rend bien sûr totalement différents de ce qui peut
se produire dans une dynamique de Schrödinger habituelle. Considérons par
exemple une particule unique décrite par un vecteur d’état |Ψ(t) pouvant
subir un processus de localisation spontanée. Dans un tel processus, |Ψ(t)
est soudainement remplacé par le ket |Ψ (t) donné par :
Fj |Ψ(t)
Ψ (t) = (XI-36)
Ψ(t)| (Fj )2 |Ψ(t)
(le numérateur de cette expression assure la conservation de la norme du
vecteur d’état) où Fi est un opérateur hermitique diagonal en représentation
position. GRW supposent que Fj localise la particule autour d’un point de
l’espace rj avec une précision caractérisée par un paramètre arbitraire α de
la théorie (α−1/2 est une longueur) :
2
Fj = c e−α(R−rj ) /2
(XI-37)
de l’espace où le module de la fonction d’onde est très faible. Quel que soit
celui des rj qui est sélectionné par le premier processus de localisation, il a
2
pour effet de multiplier la fonction d’onde par e−α(r−rj ) /2 , ce qui tend à la
restreindre dans un voisinage du point rj avec une extension spatiale α−1/2 .
Commençons par supposer pour simplifier que la fonction d’onde n’a pas
le temps d’évoluer entre cette localisation et la suivante. A cause de l’effet
sur la fonction d’onde de la première localisation, la seconde se produit avec
une grande probabilité autour d’un point situé dans le voisinage proche de
rj , la troisième dans le voisinage des deux points précédents, et ainsi de
suite : après quelques processus de localisation, la fonction d’onde est très
efficacement restreinte autour d’un point r qui est, certes aléatoire, mais bien
défini. C’est le processus spontané de réduction spatiale de la fonction d’onde.
Si maintenant une évolution de la fonction d’onde a lieu entre les processus
de localisation, les points autour desquels ils se produisent reconstituent de
façon approchée la trajectoire de la particule, comme une trace dans une
chambre de Wilson.
Ce schéma peut immédiatement être généralisé à un système constitué de
N particules ; on suppose que toutes les particules subissent en parallèle des
processus de localisation de façon indépendante. Les opérateurs Fj sont alors
remplacés par des opérateurs hermitiques Fji agissant sur la i-ème particule
pour la localiser autour du point rj ; il faut maintenant sommer leurs effets
sur les indices i et j dans l’équation de Schrödinger du système, mais à
nouveau pour chaque réalisation l’on obtient une trajectoire unique pour
le vecteur d’état |Ψ(t) décrivant le système physique. L’effet des processus
aléatoires est de localiser spatialement la fonction d’onde autour d’un seul
point de l’espace des configurations à 3N dimensions, avec une extension
linéaire α−1/2 dans chaque direction.
Prenons maintenant un ensemble de réalisations du même système phy-
sique, décrit par un opérateur densité ρ. La moyenne sur toutes les réalisa-
tions des localisations donne une évolution de ρ qui s’écrit :
⎡ ⎤
dρ(t)
i = [H(t), ρ(t)] + γ ⎣ Fj ρ(t) Fj − ρ⎦ (XI-43)
dt
j
système mesuré et appareil de mesure, tous deux sont intriqués et décrits par
l’état (IX-7). Sous l’effet des termes anti-hermitiens contrôlés par les fonc-
tions aléatoires wj (t), le module des amplitudes de probabilité cn (t) fluctue
dans le temps, au lieu de rester constant. Parmi le très grand nombre de
wj (t) qui sont mathématiquement possibles, d’après la loi CSL des probabi-
lités qui a été postulée, seule une très petite proportion peut se produire avec
une probabilité non négligeable, la proportion des réalisations qui conduit à
une grande valeur de la somme sur n de tous les |cn (t)|2 . Or il se trouve que,
parmi toutes ces fonctions très particulières, les plus efficaces pour donner
une grande norme au vecteur d’état sont celles qui donnent une grande valeur
à l’un seul des |cn (t)|2 . En effet, les fluctuations de wj (t) peuvent favoriser
une des valeurs de n, mais pas plusieurs à la fois ; si les fluctuations des wj (t)
favorisent successivement deux (ou plus) des valeurs de n, elles conduisent
à une dilution de l’effet de préservation de la norme et, au bout du compte,
à une valeur exponentiellement plus faible de la norme totale. Nous obte-
nons ainsi un processus qui sélectionne un seul résultat de mesure, quelque
peu semblable au “jeu de la ruine du parieur” de [14]. Les fluctuations des
fonctions aléatoires brisent la symétrie entre tous les résultats possibles de
mesure, de sorte que cette théorie reproduit la réduction du vecteur d’état.
En théorie CSL, l’opérateur A n’est pas associé à un processus particu-
lier de mesure – sinon l’on perdrait immédiatement une des motivations de la
théorie (ne donner aucun rôle particulier aux opérations de mesure). On pré-
fère supposer que A est remplacé par une série d’opérateurs de localisation
des positions Aj , agissant sur toutes les particules du système, et les situant
à toutes les positions possibles de l’espace (j devient alors un indice caracté-
risant des positions spatiales, et peut ainsi être continu). Comme en théorie
GRW, une localisation parfaite poserait problème, puisqu’elle transférerait
une énergie infinie aux particules, ce qui est physiquement inacceptable. On
postule donc que la localisation réalisée par chaque Aj est imparfaite, et
caractérisée par une imprécision spatiale α−1/2 ; tous les Aj commutent mu-
tuellement. En dépit de ces changements concernant la définition des opéra-
teurs, l’essence du processus de localisation reste presque la même que celle
qui a été discutée plus haut, et conduit à une sélection qui finit toujours
par localiser les particules dans une seule région aléatoire de l’espace – c’est
une réduction spatiale du vecteur d’état. Pour de petits systèmes quantiques
(particule unique, atomes, molécules, etc.), la probabilité pour qu’un effet de
réduction du vecteur d’état se produise reste extrêmement faible pendant des
temps très longs (γ est très petit). Pour des systèmes macroscopiques dans
des superpositions quantiques de deux états distincts spatialement, comme
toutes les particules sont simultanément sujettes au processus de localisation,
et que la localisation d’une seule d’entre elles est suffisante pour détruire la
coexistence des deux composantes, il devient très probable qu’une telle ré-
duction apparaisse en un temps très court.
406 CHAPITRE XI. DIVERSES INTERPRÉTATIONS
γ
N
dρ(t)
i = [H(t), ρ(t)] + 2Aj ρAj − (Aj )2 ρ(t) − ρ(t) (Aj )2 (XI-44)
dt 2
j=1
où les Aj sont des opérateurs hermitiques commutant entre eux (ils peuvent
en principe être quelconques, mais ici l’on choisit des opérateurs de localisa-
tion de position). De façon générale, des processus de Markov discrets dans un
espace de Hilbert peuvent toujours être ramenés, dans une limite appropriée,
à une localisation continue spontanée. Effectivement, si l’on choisit dans (XI-
44) des opérateurs tels que Aj = Fj , on retrouve (XI-43) compte tenu de
(XI-38) ; ceci introduit une correspondance entre les modèles discrets (type
GRW) et des théories du type CSL en ce qui concerne l’évolution moyenne
des opérateurs densité. Inversement, les théories CSL ne demandent pas né-
cessairement que la somme des carrés des opérateurs soit 1 ; la forme la plus
générale d’un opérateur de Lindblad ne peut pas être obtenue à partir d’une
théorie à “hitting processes”. Les théories CSL couvrent donc un domaine
plus grand de possibilités, ce qui peut s’avérer utile dans l’élaboration de
versions relativistes de la théorie (§ K-1-e), ou en théorie cosmologique [652].
Un problème qui subsiste cependant est qu’en théorie CSL, ici aussi, une
réduction complète de la fonction d’onde ne se produit jamais en un temps
fini. Même quand la plus grande partie de la fonction d’onde est concentrée
dans une composante correspondant à un résultat unique dans une expé-
rience, il reste toujours une minuscule composante sur les autres (même si
elle est extrêmement petite et décroissante dans le temps). L’existence de
cette composante n’est pas considérée comme posant un problème sérieux
par les défenseurs de la théorie [653]. Cependant, Shimony a fait valoir [654]
que, de son point de vue, il est philosophiquement peu justifié d’associer la
réalité avec un seul état, tant que le système reste dans une superposition
de cet état et d’un autre ; il considère que cela reste problématique même si
le poids du premier est énorme en comparaison de celui du second. Le pro-
K. DYNAMIQUE DE SCHRÖDINGER MODIFIÉE 407
ment excités (ou même dissociés). Ghirardi et al. ont proposé une modifica-
tion de la théorie de Diosi qui résout ces problèmes tout en conservant l’idée
de faire intervenir la constante de Newton ; cependant une autre constante
reste nécessaire, ayant la dimension d’une longueur. En ce sens, le caractère
“universel” de la théorie est perdu – les auteurs considèrent d’ailleurs ce fait
comme un signe du caractère indispensable d’un paramètre nouveau pour
résoudre le problème de la théorie quantique de la mesure.
Penrose a souvent invoqué l’existence d’une relation profonde entre gra-
vité et unicité de la réalité macroscopique en mécanique quantique (réduction
du vecteur d’état). Dans [660], il se place dans un contexte plutôt philoso-
phique et général incluant la notion de conscience, et émet l’idée que “le seuil
quantique de la gravité qui produit une auto-réduction du vecteur d’état joue
un rôle vis-à-vis de la conscience”. Dans [661], il considère une superposition
quantique du même objet massif en deux positions différentes de l’espace ;
en l’absence de gravité, cette superposition peut avoir une énergie très bien
définie, du fait de l’invariance par translation. Il prend alors en compte la
relativité générale pour en déduire que, puisqu’une masse courbe l’espace-
temps, cette situation crée en fait une superpostion de deux espace-temps
différents. Il met alors en jeu un “principe de covariance générale” pour étu-
dier les propriétés de l’opérateur de translation dans le temps, et montre que
la situation considérée implique une incertitude ΔE de l’énergie. Se basant
ensuite sur la relation d’incertitude temps-énergie, il conjecture que l’inverse
de ΔE correspond à une durée de vie finie de la superposition initiale : elle est
instable, et se décompose spontanément en l’une de ses deux composantes.
Ceci donne lieu à une réduction du vecteur d’état et assure l’unicité macro-
scopique de la position spatiale de tous les corps massifs. Il avertit toutefois
le lecteur que “cette proposition ne constitue pas une théorie de la réduction
quantique du vecteur d’état. Elle indique seulement le niveau auquel il faut
s’attendre à des déviations introduites par les effets gravitationnels s’ajoutant
à l’évolution (unitaire) prédite par l’équation de Schrödinger standard”.
fait selon une théorie dynamique unifiée, indépendamment du fait que des
mesures, des observations humaines, etc., se produisent ou non. Bien sûr,
cela ne veut pas dire que la théorie redevienne plus ou moins semblable à la
mécanique classique. Par exemple, comme le vecteur d’état évolue dans un
espace des états complexe (espace de Hilbert), c’est dans cet espace que la
description de la réalité doit être faite, au lieu de l’espace habituel à 3 dimen-
sions ; or les deux espaces sont très différents (pas uniquement du fait de leurs
dimensions ; même si l’on accepte de passer à l’espace classique des configu-
rations de dimension bien plus élevée, on a toujours un espace très différent
de l’espace de Hilbert). Cependant, le but général d’unification de la théo-
rie et de sa dynamique est parfaitement atteint, ce qui apporte une grande
simplification conceptuelle. En comparaison de la théorie de De Broglie et
Bohm, cette description de la réalité est plus simple, du fait qu’elle ne met
en jeu qu’une fonction d’onde sans aucune position pour les particules. La
présence d’un mécanisme de réduction agissant directement sur le vecteur
d’état supprime également l’existence des “ondes vides”.
Des descriptions physiques assez semblables sont obtenues quelle que soit
la forme spécifique de théorie à dynamique non linéaire. Par exemple, quand
une particule passe à travers une chambre à bulles, les termes nouveaux se
chargent de faire apparaître à un niveau macroscopique une trajectoire pour
la particule ; ils sélectionnent également un seul des paquets d’ondes à la sortie
d’un aimant de Stern et Gerlach (et éliminent l’autre), mais pas avant que ces
paquets d’ondes ne se soient corrélés avec l’environnement (par exemple des
détecteurs). Bien sûr, un processus de localisation de la fonction d’onde qui
agit dans l’espace des positions, plutôt que celui des impulsions, détruit la
symétrie habituelle en mécanique quantique entre position et impulsion. Mais
ceci n’est pas un problème insurmontable : on peut aisément se convaincre
que ce qu’on mesure en pratique dans les expériences est en fait la position
des particules ou d’objets comme les aiguilles des cadrans des appareils de
mesure, alors que les impulsions ne sont accessibles que de façon indirecte.
Qu’en est-il du chat de Schrödinger et des paradoxes de ce type ? Si
le terme non linéaire ajouté possède toutes les propriétés nécessaires pour
mimer les effets de la réduction du vecteur d’état, ces paradoxes sont aisément
résolus. Par exemple, une bouteille cassée de poison doit avoir au moins
certaines parties qui sont dans une position spatiale différente (dans l’espace
des configurations) que si la bouteille est intacte, sinon toutes leurs propriétés
physiques seraient identiques. Il est alors clair que la dynamique modifiée
résoudra les composantes du vecteur d’état bien avant que la superposition
n’atteigne le chat, ce qui assure l’émergence d’une seule possibilité. Pour une
revue récente des effets de la dynamique modifiée sur les “états par tout ou
rien” (§ A-3 du Chapitre VI) dans le contexte de l’optique quantique, et sur
les effets de la perception en termes d’états relatifs du cerveau, voir le § M
et la Ref. [678].
412 CHAPITRE XI. DIVERSES INTERPRÉTATIONS
49
Les équations sont similaires à celles écrites dans la seconde partie de l’Appendice I
dans le contexte de la théorie de Bohm, à ceci près qu’elles mettent en jeu l’intrication
avec l’environnement, et pas seulement l’autre spin.
K. DYNAMIQUE DE SCHRÖDINGER MODIFIÉE 413
que dans cette interprétation, puisqu’elle requiert une intrication avec l’en-
vironnement expérimental, et pas seulement une séparation magnétique des
états de spin d’une particule. Cependant, les deux théories mettent en lumière
de façon explicite la non-localité, bien que par un mécanisme différent.
On peut voir ce programme comme une sorte de résurgence des espoirs
initiaux de Schrödinger, pour qui l’essentiel de la physique devait être contenu
dans la fonction d’onde et dans son évolution progressive (voir la fin du § A-2
au Chapitre I) ; c’est tout particulièrement vrai, évidemment, des versions de
la dynamique non linéaire qui sont continues (même si des quantités supplé-
mentaires fluctuantes peuvent être introduites), et moins vrai des versions
incluant les “hits” qui, elles, sont plutôt dans la ligne des sauts quantiques et
du postulat de réduction du vecteur d’état. Ici, c’est bien le vecteur d’état
qui décrit directement la réalité physique, en opposition avec ce qui a été
dit au § B du Chapitre I ; nous sommes donc en présence d’une nouvelle ca-
tégorie de mécanique ondulatoire, où la notion de particules ponctuelles est
totalement abandonnée au profit de petits paquets d’ondes. La théorie est évi-
demment très différente de la théorie de Bohm puisque la notion de position
infiniment précise dans l’espace des configurations n’apparaît jamais. Elle ne
présente pas les difficultés mentionnées au § H-1-i, puisqu’elle n’impose pas
de distinction entre niveaux de réalité pouvant, soit être observés, soit mani-
pulés ; elle introduit toutefois dans l’équation d’évolution du vecteur d’état
des fonctions aléatoires (ou des processus de sauts aléatoires) qui ne peuvent
a priori être contrôlés par aucune action humaine. Comme nous l’avons vu,
une autre différence importante est que ces théories à dynamique modifiée
sont véritablement de nouvelles théories : il peut arriver qu’elles conduisent
à des prédictions différentes de celles de la mécanique quantique standard,
de sorte que des tests expérimentaux sont en principe envisageables. Enfin,
nous devrions rappeler une fois de plus que, dans ce point de vue non plus, il
n’est pas possible de considérer la fonction d’onde comme un champ classique
ordinaire, puisqu’elle se propage dans l’espace des configurations et non dans
l’espace ordinaire.
Nous concluons notre discussion de la dynamique de Schrödinger modifiée
en citant l’essai de Bell “Speakable and unspeakable in quantum mechanics”
(Chapitre 18 de [6]). Il écrit à propos de la mécanique quantique standard :
“Le ‘problème’ est alors le suivant : comment le monde doit-il être divisé en
un appareil dont on peut parler normalement... et un système quantique dont
on ne peut rien dire ? Combien d’électrons, d’atomes, ou de molécules sont
nécessaires pour constituer un ‘appareil de mesure’ ? La mathématique de la
théorie standard demande qu’une telle division soit effectuée, mais ne nous
dit rien sur la façon de la faire50 ... A mon avis, les pères fondateurs (de la
50
On peut par exemple comparer avec la citation de Landau et Lifshitz du § E au
Chapitre II.
414 CHAPITRE XI. DIVERSES INTERPRÉTATIONS
d
i Φ (t) = H (t) + H L (t) Φ (t) (XI-45)
dt
416 CHAPITRE XI. DIVERSES INTERPRÉTATIONS
Dans cette équation, γL est un paramètre libre du modèle, Ψ (r) est l’opéra-
teur champ des particules identiques, et DΦ (r) est la densité locale quantique
standard :
DΦ (r, t) = Φ (t) Ψ† (r) Ψ (r) Φ (t) (XI-47)
Nous introduisons également une quantité NB (r,t) qui reflète le nombre de
positions bohmiennes qn se trouvant à une distance du point r comparable
à une disance αL :
N
2 2
NB (r,t) = e−(r−qn ) /(aL ) (XI-48)
n=1
NB (r,t)
nB (r,t) = (XI-49)
(a0 )3
L’équation
(XI-45) est non linéaire puisque DΦ (r ) dépend du vecteur d’état
Φ . L’appendice L fournit plus de détails sur les propriétés de ce modèle.
Comme dans les théories GRW et CSL, les deux paramètres γL et αL
sont choisis de façon à n’avoir qu’un effet totalement négligeable pour des
systèmes microscopiques, mais à entraîner une disparition rapide de toute
superposition d’états quantiques correspondant à des densités macroscopi-
quement distinctes dans l’espace. La dynamique de ce processus est très
différente de celles de GRW ou de CSL, puisqu’elle est déterministe ; le ca-
ractère aléatoire du résultat de mesure n’est qu’une conséquence du fait que
les positions bohmiennes initiales sont tirées au hasard. La forme du terme
attractif ajouté à l’équation de Schrödinger conserve automatiquement la
symétrie d’échange du vecteur d’état de particules identiques.
Les difficultés provenant de l’existence des ondes vides qui subsistent
pour toujours sont alors supprimées. En théorie dBB, les positions des par-
ticules fournissent une description directe de la réalité physique. Ici, elles ne
jouent que le rôle de variables mathématiques aléatoires qui permettent de
calculer l’évolution stochastique de la distribution de densité dans l’espace.
Cette distribution n’est pilotée qu’indirectement par la fonction d’onde, par
l’intermédiaire des positions qui, elles, sont pilotées directement. La notion
de particules physiques ponctuelles disparaît au profit d’une distribution de
densité nB (r,t) dans l’espace, semblable à celle d’un fluide, que l’on peut
voir comme fournissant la description physique la plus proche de la réalité.
K. DYNAMIQUE DE SCHRÖDINGER MODIFIÉE 417
Une autre spécificité du modèle est que chaque particule n’est pas constam-
ment soumise à une perturbation aléatoire très rapide qui tend à la localiser.
Seul un effet plus progressif et moyenné dans l’espace est supposé ; dans un
solide par exemple, nous montrons dans l’Appendice L que l’attraction ne se
produit que dans l’ensemble du volume du solide, de sorte que le processus
de localisation se fait sur une distance bien plus grande. En d’autres termes,
le processus de localisation n’est pas seulement déterministe, mais aussi spa-
tialement plus doux, ce qui atténue beaucoup les effets de chauffage prédits
par les théories GRW/CSL, par exemple à l’intérieur d’un solide. En fait, le
processus de localisation se produit surtout à la surface du solide, avec un
effet semblable à une force de cohésion supplémentaire.
Dans l’appendice L, nous montrons que ce modèle n’introduit que très
peu de modifications à la dynamique habituelle, sauf dans une situation par-
ticulière : le moment où un branchement se produit dans le vecteur d’état
pour le conduire vers une superposition quantique d’états où un objet ma-
croscopique est localisé dans des régions différentes de l’espace. En effet,
dans chaque branche de la superposition les particules qui constituent l’ob-
jet doivent occuper la même région de l’espace si l’objet est maintenu comme
un tout par des forces de cohésion entre ses particules. Comme les positions
bohmiennes ne peuvent pas “quitter la fonction d’onde” 51 il s’ensuit que, lors
d’une réalisation de l’expérience, les positions bohmiennes doivent également
rester toutes regroupées ensemble. Toutes ces positions créent alors une forte
attraction dans la région de l’espace associée à une seule composante de la
fonction d’onde, de sorte que le terme attractif projette la fonction d’onde
dans cette région ; ce processus est très efficace si l’objet contient un très
grand nombre de particules. Lors d’une mesure, le pointeur de l’appareil
peut jouer le rôle de l’objet macroscopique, de sorte que cette localisation
spatiale introduit exactement ce qui est nécessaire pour obtenir une réduc-
tion dynamique du vecteur d’état reproduisant le postulat de von Neumann.
Par le même mécanisme, on obtient immédiatement l’unicité de la position
de tout objet macroscopique que des forces cohésives maintiennent ensemble
(absence de chats de Schrödinger). Mais des objets macroscopiques qui n’ont
pas de cohésion, comme des gaz condensés de Bose-Einstein, peuvent par-
faitement rester dans des superpositions quantiques de positions différentes.
Dans un monde qui serait fait uniquement de substances sans aucune co-
hésion interne, par exemple des gaz, la projection du vecteur d’état ne se
produirait pas, ou alors serait extrêmement lente ; les chats de Schrödinger
purement gazeux pourraient durer très longtemps avant d’être réduits !
51
Plus précisément, l’ensemble des positions bohmiennes définit un point de l’espace des
configurations où la fonction d’onde ne doit pas s’annuler.
418 CHAPITRE XI. DIVERSES INTERPRÉTATIONS
L. Interprétation transactionnelle
M. Interprétation d’Everett
qui ne provient pas d’une mesure52 . Les différentes branches associées à des
situations macroscopiquement différentes, par exemple à des positions diffé-
rentes des pointeurs des appareils de mesures et à leurs conséquences, sont
indépendantes. En effet, aucun hamiltonien d’interaction n’a d’éléments de
matrice entre des états où un nombre macroscopique de particules sont dans
des états différents ; elles ne peuvent pas donner lieu à des effets d’interfé-
rence, car cela demanderait d’agir de façon cohérente sur l’état d’un nombre
beaucoup trop grand de systèmes quantiques élémentaires. C’est pourquoi
l’on considère parfois ces branches comme des “mondes” différents existant
en parallèle, ce qui est l’origine de l’appellation “interprétation des mondes
multiples” ; d’autres préfèrent considérer que le monde est toujours unique,
dans une superposition d’états macroscopiques très différents – on l’appelle
parfois “multiverse” [691]. Quoi qu’il en soit, l’Univers est ainsi dans un état
quantique unique, mais ses sous-systèmes, y compris les observateurs, sont à
la fois dans de nombreux états qui peuvent être très différents.
Etablir (ii) demande que, sans faire intervenir des observations exté-
rieures, on fasse émerger la notion de probabilité à partir de considérations
sur la structure mathématique du vecteur d’état intriqué, et ensuite que les
valeurs des probabilités soient obtenues [694, 695]. L’équation de Schrödin-
ger est linéaire et n’attribue en elle-même aucune signification particulière
aux carrés des normes des différentes composantes du vecteur d’état, qu’il
faut donc relier aux fréquences d’occurrence des différentes séries de résul-
tats possibles. Une situation intéressante est celle où la même expérience est
répétée de nombreuses fois, ce qui fait apparaître de nombreuses branches
dans le vecteur d’état, associées à toutes les séquences possibles de résultats ;
l’objectif est alors de montrer que, dans la plupart des cas, l’observateur se
trouve dans une branche où la fréquence relative des résultats reproduit la
règle de Born. La difficulté est, bien sûr, de donner un sens précis aux mots
“dans la plupart des cas” ; il faut pour cela introduire une notion de proba-
bilité, c’est-à-dire une mesure (au sens mathématique du terme) associée à
M. INTERPRÉTATION D’EVERETT 423
Q (N+ + 1, N− − 1) N− |α|2
= (XI-56)
Q (N+ , N− ) N+ |β|2
N+ |α|2
(XI-57)
N− |β|2
De plus, lorsque N est très grand, on sait que cette distribution est étroite-
ment centrée√ autour de son maximum (la largeur relative de cette distribution
varie en 1/ N ).
Bien évidemment, si nous désirons établir la règle de Born dans le cadre
de l’interprétation d’Everett, ce serait un raisonnement circulaire de sup-
poser que les normes que nous avons calculées sont égales aux probabilités
recherchées. Mais nous pouvons faire un postulat plus faible : nous pouvons
supposer, par exemple, que les événements pour lesquels la norme est infé-
rieure à un petit nombre ε ne se produisent jamais ; ce nombre peut être
aussi petit que l’on veut, 10−20 par exemple. Alors, comme la distribution
binomiale devient de plus en plus étroite lorsque le nombre N de mesures
augmente, tous les événements qui ne sont pas rejetés par cette règle satis-
font la relation (XI-57) avec une précision qui augmente (Fig. XI.5) ; dans la
limite d’un nombre infini de mesures, ils la satisfont exactement.
Le résultat de cette analyse est que la règle de Born a été rétablie, au prix
d’un faible postulat destiné à introduire les normes dans le raisonnement. Il
reste que nous n’avons discuté qu’une version simplifiée, avec seulement deux
résultats de mesure possibles (elle peut toutefois être généralisée sans grande
difficulté, juste avec une légère complication des notations). La démonstration
n’est valable qu’à la limite N → ∞, alors qu’un raisonnement plus général
devrait prendre en compte une obtention de la règle de Born pour de petites
M. INTERPRÉTATION D’EVERETT 425
M-3. Discussion
Comment apparaît une expérience EPRB dans ce point de vue ? Dans l’in-
terprétation de Bohm, nous avons insisté sur le rôle des analyseurs de Stern
et Gerlach ; dans l’interprétation de la dynamique de Schrödinger modifiée,
sur l’évolution non linéaire des détecteurs et sur la décohérence. Ici nous de-
vons mettre en avant les corrélations avec le monde extérieur qui prennent
place et mettent en jeu les mémoires conscientes des deux observateurs. Le
vecteur d’état va effectivement développer sa chaîne de von Neumann à tra-
vers les analyseurs et les détecteurs et, à un certain point, les observateurs
dont la mémoire enregistre les résultats. Pour chaque choix des paramètres
expérimentaux a et b, quatre branches du vecteur d’état coexistent donc ;
chaque branche dépend explicitement des deux paramètres, et on ne peut
pas écrire mathématiquement de vecteur d’état qui soit relatif à une région
de l’espace et qui ne dépendrait seulement que de a, ou de b. Or, dans l’inter-
prétation d’Everett, le vecteur d’état fournit la représentation la plus directe
de la réalité, de sorte que l’expression même d’un vecteur d’état intriqué im-
plique automatiquement une description non locale de cette réalité. Quant
aux observateurs Alice et Bob, ils sont eux-mêmes pris dans une chaîne de
von Neumann où chacune des composantes dépend à la fois de a et de b,
de sorte que le choix de a a une influence à distance sur ce qu’enregistre
la mémoire de Bob et réciproquement. Il est donc clair que l’interprétation
d’Everett implique une description intrinsèquement fortement non locale de
la réalité 57 .
Une question qui se pose naturellement est l’existence, ou non, de la no-
tion de “variables externes” à la théorie dans le cadre de cette interprétation
(cf. discussion et citation de Bell au § C-1-c du Chapitre IV). Les mémoires
des observateurs sont considérées comme des registres dont le fonctionnement
relève de l’équation déterministe de Schrödinger. Faut-il cependant considérer
que ces observateurs conservent un libre arbitre, de sorte que les paramètres
de mesure a et b peuvent effectivement être choisis arbitrairement, ou au
contraire que ces choix sont déterministes au même titre que le fonctionne-
ment des mémoires ? Dans le second cas, on arrive à un cadre “superdéter-
ministe” d’où la notion de variables externes à la théorie disparaît, de sorte
que la démonstration des inégalités de Bell devient impossible ; toutes les
discussions que nous avons menées sur les tests expérimentaux de la localité
perdent alors leur sens, les paramètres a et b pouvant être considérés comme
des conséquences d’une cause commune fluctuante dans le passé.
57
Cependant, si l’on considère le flux d’information se produisant lors de l’évolution de
Schrödinger/Heisenberg d’un système de qubits reproduisant une expérience EPR, on est
conduit à des équations qui restent locales [702]. Les auteurs de cette référence en concluent
qu’une violation des inégalités de Bell remet en cause le fait qu’on puisse attribuer des
variables stochastiques aux résultats des expériences, ce qui s’apparente à remettre en
cause la contrafactualité (ou le réalisme EPR).
M. INTERPRÉTATION D’EVERETT 429
M-3-b. Cosmologie
Nous avons vu plus haut que les différentes branches du vecteur d’état
de l’Univers sont en principe indépendantes. Alors, par construction, l’inter-
prétation d’Everett conduit à des prédictions expérimentales qui sont iden-
tiques à celles de l’interprétation standard ; en ce sens, elle n’est pas réfu-
table. DeWitt [16] considère même que cette interprétation est une simple
conséquence du formalisme : après avoir posé la question “la solution du di-
lemme de l’indéterminisme pourrait-elle être un univers où les expériences
fournissent en réalité tous les résultats possibles au lieu d’un seul ?” il af-
firme que “le formalisme mathématique de la théorie quantique est capable
de fournir sa propre interprétation” – voir également un intéressant débat
contradictoire [19] suscité directement par la publication de ce point de vue.
Il considère également que ce point de vue est une nécessité58 en cosmologie
quantique : “L’interprétation d’Everett a été adoptée par l’auteur [Bryce De-
Witt] par simple nécessité pratique : il n’en connaît aucune autre. Tout au
moins, c’est la seule qu’il connaisse qui n’impose ni limitations artificielles
ni métaphysique floue tout en restant capable de servir aux besoins variés
de la cosmologie quantique, de la physique quantique mésoscopique, et de la
discipline en chantier qu’est la physique quantique” (page 144 de [703]).
On comprend bien que prendre en compte la fonction d’onde de l’Univers
soit naturel dans l’étude de cet univers comme un tout. De façon générale,
l’idée d’univers multiples n’est pas étrangère à l’astrophysique et à la cosmo-
logie. Elle a parfois été évoquée pour expliquer l’existence de la matière noire
et de l’énergie noire ; dans le cadre de la théorie d’Everett, on pourrait dans ce
but supposer l’existence d’une certaine interaction entre les diverses branches
du vecteur d’état de l’Univers. On a également spéculé l’existence d’univers
multiples dans le contexte du “principe anthropique” (on suppose que l’état
de l’Univers contient de nombreuses branches où les conditions physiques
sont telles que l’apparition d’êtres pensants n’est pas possible ; cependant
l’humanité ne peut effectuer d’observations que dans la petite proportion
de ces branches où cette apparition a été possible, donc dans des univers
aux propriétés très particulières. Pour une revue des univers parallèles et des
mondes multiples dans le contexte de la cosmologie, voir les articles de Teg-
mark [704], qui insiste sur le fait que “L’existence d’univers parallèles n’est
pas une théorie, mais une prédiction de certaines théories”. Il semble effecti-
vement que la majorité des physiciens spécialistes de cosmologie quantique
aient une nette préférence pour l’interprétation d’Everett [705].
58
Il existe toutefois d’autres interprétations, comme celles qui font intervenir une dy-
namique de Schrödinger modifiée (§ K), qui permettent de prendre en compte le vecteur
d’état de l’Univers.
430 CHAPITRE XI. DIVERSES INTERPRÉTATIONS
M-3-c. Critiques
59
Si l’on supprime à la main toutes les branches d’univers sauf une, on arrive à une inter-
prétation très proche de l’interprétation pragmatique discutée au § A-1-a de ce chapitre.
432 CHAPITRE XI. CONCLUSION
Conclusion
scopiques simples, les gènes sont des arrangements de tels objets, et que toute
la machine biologique qui les lit va très au-delà de tout ce que l’on pouvait
imaginer à l’époque de Mendel. De même, si la mécanique quantique est un
jour complétée par des variables supplémentaires, ces variables ne seront pro-
bablement pas un prolongement simple d’autres variables que nous utilisons
déjà en physique, mais de nature réellement différente. Bien évidemment, ceci
n’est à l’heure actuelle que spéculation, et rien ne garantit que les histoires
de la biologie et de la physique soient parallèles !
Une comparaison naturelle qui vient à l’esprit est avec la relativité res-
treinte, car ni la mécanique quantique ni la relativité ne sont intuitives ; l’ex-
périence prouve que toutes deux, lorsqu’on les découvre, demandent beau-
coup de réflexion pour être assimilées. Mais la similarité ne va pas plus loin :
en relativité, plus on traite de problèmes relativistes, plus les concepts de-
viennent clairs (à un certain point, on acquiert le sentiment qu’elle est une
sorte de nécessité logique !) ; on peut difficilement en dire autant de la mé-
canique quantique, qui ne perd jamais son mystère. Toutefois, parmi toutes
les constructions de l’esprit humain, on peut considérer que la mécanique
quantique est la plus couronnée de succès de toutes puisque, malgré tous
les efforts des physiciens depuis des décennies pour lui trouver des limites
de validité (comme ils le font pour toutes les autres théories), et un nombre
immense de spéculations, personne n’a pour le moment réussi à trouver le
moindre signe clair de l’existence de ces limites. Le futur nous dira si c’est
possible, les surprises ne sont jamais à exclure !
Chapitre XII
et de façon unique ; les xi sont appelés les composantes de |Ψ dans la base
correspondante.
Si la dimension de l’espace des états est finie et égale à P , le nombre
de vecteurs |ui (et donc de termes dans cette somme) est nécessairement
A. SYSTÈME PHYSIQUE GÉNÉRAL 437
égal à P . La base {|ui } est orthonormée si les produits scalaires entre ses
vecteurs satisfont aux relations :
On a également :
P
P
Ψ |Ψ = |xi |2 Φ |Ψ = yi∗ xi (XII-7)
i i
A-2. Opérateurs
Dans une base finie quelconque, l’opérateur A peut s’écrire comme une ma-
trice P × P , dont les éléments de matrice sont notés Ai,j ; les colonnes de
cette matrice contiennent les composantes des transformés des vecteurs de
1
Les vecteurs de bases continues ne sont pas normalisables et n’appartiennent donc pas
véritablement à E, ce qui explique les guillemets ; voir par exemple la discussion du § A-3
de la Ref. [XII − 1].
438 CHAPITRE XII. OUTILS MATHÉMATIQUES DE BASE
base sous l’action de A. Dans une base orthonormée {|ui }, les éléments de
matrice Ai,j sont donnés par le produit scalaire de A |uj par |ui :
[A, B] = AB − BA (XII-13)
Une façon d’obtenir les valeurs propres et les vecteurs propres de A est de
procéder à la diagonalisation de la matrice des coefficients Ai,j ; pour certaines
matrices, la diagonalisation complète n’est d’ailleurs pas toujours possible.
Si une valeur propre donne lieu à plusieurs vecteurs propres qui ne sont pas
proportionnels, on dit qu’elle est “dégénérée”.
Un opérateur A est hermitique s’il est égal à son propre hermitique conjugué,
A = A† , c’est-à-dire si tous ses éléments de matrice satisfont les relations2 :
(en d’autres termes, les éléments de matrice qui sont symétriques par rapport
à la première diagonale de la matrice sont complexes conjugués). On peut
montrer qu’un opérateur hermitique est toujours diagonalisable et que toutes
ses valeurs propres sont réelles (ce qui n’implique pas qu’elles soient toutes
distinctes : certaines peuvent être dégénérées).
(ii) Un opérateur linéaire U est dit unitaire si le produit de son hermitique
conjugué par U donne l’opérateur identité :
U †U = 1 (XII-17)
Considérons deux kets quelconques |Φ et |Ψ de l’espace des états et l’action
de U sur ces kets :
Φ = U |Φ et Ψ = U |Ψ (XII-18)
A-3. Probabilités
Considérons l’opérateur :
où |Φ est supposé normé (Φ |Φ = 1). Son action sur un ket quelconque
|Ψ est :
PΦ |Ψ = |Φ Φ |Ψ = c |Φ (XII-25)
où c = Φ |Ψ est un nombre. Tout ket est donc transformé par action de PΦ
en un ket proportionnel à |Φ ; ceci indique que P est le projecteur sur l’état
|Φ, satisfaisant à la relation des projecteurs P 2 = P . Notons maintenant
P (ak ) le projecteur sur le vecteur propre |ak :
lorsque ak est non dégénérée ; si elle est dégénérée, P (ak ) est défini comme
la somme des projecteurs sur un ensemble de vecteurs propres orthonormés
correspondant à cette même valeur propre. L’application de la règle de Born
pour les probabilités montre que la probabilité d’obtenir le résultat ak est
alors donnée par :
d
i U (t, t0 ) = H(t) U (t, t0 ) (XII-31)
dt
avec :
U (t0 , t0 ) = 1 (XII-32)
De plus, l’opérateur d’évolution U (t, t0 ) entre les instants t0 et t obéit à la
relation en chaîne traduisant une évolution entre les instants t et t , suivie
par une évolution entre les temps t et t :
Il est en effet facile de vérifier que les relations (XII-31) et (XII-32) sont alors
satisfaites.
Les équations d’évolution temporelle que nous avons écrites ci-dessus ap-
partiennent à ce que l’on appelle souvent le point de vue de Schrödinger, où
A. SYSTÈME PHYSIQUE GÉNÉRAL 443
Nous pouvons donc simplifier la notation |ΨH (t) en |ΨH . De même, tout
opérateur A dans le point de vue de Schrödinger devient dans celui de Hei-
senberg un opérateur dépendant du temps AH (t, t0 ) défini par :
A-6-a. Définition
T r {ρ} = 1 (XII-40)
et un opérateur hermitique :
ρ = ρ† (XII-41)
On peut alors remplacer les expressions (XII-22) et (XII-23) par :
et :
A = T r {Aρ} (XII-43)
L’intérêt de ces expressions est d’être linéaires, ce qui peut permettre une
combinaison commode entre les notions de probabilité classique et de proba-
bilité quantique. Supposons en effet que l’état |Ψ d’un système physique ne
soit pas connu, mais que l’on sache qu’il a une probabilité p1 de se trouver
dans l’état normé |Ψ1 , une probabilité p2 de se trouver dans l’état normé
|Ψ2 ,... une probabilité pn de se trouver dans l’état normé |Ψn . Si l’on défi-
nit maintenant l’opérateur densité ρ comme la somme des opérateurs densité
associés à chacun des états, pondérée par ces probabilités :
ρ= pn |Ψn Ψn | (XII-44)
n
avec :
0 ≤ pn ≤ 1 ; pn = 1 (XII-45)
n
les formules (XII-40) à (XII-43) restent valables. Par exemple, la trace (XII-40),
calculée dans une base orthonormée quelconque {|ui }, découle de la norma-
lisation des |Ψn et des pn :
T r {ρ} = pn |Ψn |ui |2 = pn = 1 (XII-46)
i n n
quel que soit le ket normé |Φ. Il suffit pour le voir de remplacer ρ par sa
définition (XII-44), d’utiliser l’inégalité de Schwarz, et enfin de prendre en
compte la relation (XII-45). C’est donc un opérateur toujours diagonalisable,
dont on note |θm les vecteurs propres et qm les valeurs propres associées ;
ceci permet d’écrire ρ sous la forme :
ρ= qm |θm θm | (XII-48)
m
α. Etat pur
Si une seule de ses valeurs propres qm est égale à 1, toutes les autres
étant nulles, et un seul terme joue un rôle dans la sommation sur m de
(XII-48) ; ρ est donc le projecteur sur un état quantique unique, son premier
vecteur propre qu’on peut renommer |Ψ. Nous sommes alors dans le cas
où le système est décrit par un “état pur” |Ψ, comme en (XII-39) ; cette
description correspond à l’information maximale que l’on puisse donner sur
un système physique dans le cadre de la mécanique quantique. Compte tenu
de (XII-51), et comme 12 = 1 et 02 = 0, on vérifie que ρ2 = ρ ; en termes
d’opérateur densité on peut caractériser un état pur, soit par cette égalité
entre ρ et son carré, soit par la relation :
T r ρ2 = T r {ρ} = 1 (XII-52)
446 CHAPITRE XII. OUTILS MATHÉMATIQUES DE BASE
β. Mélange statistique
Si plusieurs valeurs propres qm sont non nulles, il n’est plus possible de
décrire le système par un état |Ψ unique ; il faut lui associer plusieurs états
pondérés par des probabilités dont la valeur n’est ni 0, ni 1, mais intermé-
diaire. On dit alors que l’opérateur densité ρ décrit un “mélange statistique”.
Contrairement au cas précédent, la description quantique d’un système par
ρ n’est pas la plus précise possible compatible avec la mécanique quantique ;
elle peut même être très imprécise si de nombreux états |θm sont associés
à des probabilités qm égales ou comparables. Comme, pour tout nombre q
compris entre 0 et 1 on a q 2 < q, on voit sur (XII-51) que l’opérateur den-
sité n’est pas égal à son carré (ρ2 = ρ). Une autre façon de caractériser un
mélange statistique est la relation :
T r ρ2 < T r {ρ} = 1 (XII-53)
Lorsque dans (XII-44) les |Ψn deviennent des fonctions du temps |Ψn (t)
qui évoluent selon l’équation de Schrödinger, l’opérateur densité ρ devient
également une fonction du temps (les kets évoluent mais les probabilités
pn elles-mêmes, qui définissent le tirage au sort initial de l’état du système,
restent constantes). En y reportant (XII-28) et l’équation associée pour l’évo-
lution temporelle du bra Ψn (t)|, on obtient l’équation d’évolution de l’opé-
rateur densité :
dρ(t)
i = [H(t), ρ(t)] (XII-54)
dt
où [H(t), ρ(t)] est le commutateur de l’hamiltonien H(t) et de ρ(t). Cette
équation est souvent appelée “équation de von Neumann”.
Le raisonnement est aussi valable si l’on part de la décomposition (XII-48)
de ρ sur ses vecteurs propres ; on voit ainsi que les valeurs propres de ρ, sa
trace ainsi que celle de ρ2 , restent constantes au cours de l’évolution tempo-
relle.
S = −kB T r {ρ ln ρ} (XII-55)
où kB est la constante de Boltzmann de la mécanique statistique (et de la
thermodynamique) et où ln désigne le logarithme népérien (dans le domaine
de l’information quantique, on prend souvent kB = 1 et l’on préfère le loga-
rithme de base 2, mais cela ne change rien d’essentiel). La formule (XII-48)
A. SYSTÈME PHYSIQUE GÉNÉRAL 447
permet d’écrire :
S = −kB qm ln qm (XII-56)
m
Pour un opérateur densité décrivant un état pur, toutes les valeurs propres
sont nulles, sauf une qui vaut 1 ; on a donc S = 0. En revanche, pour un
mélange statistique, les relations (XII-49) entraînent4 que S > 0 ; par exemple
si le système a des probabilités égales d’être dans deux états orthogonaux,
deux valeurs propres de ρ sont égales à 1/2 et S = 2 ln 2 (ou simplement 2 si
l’on a choisi les logarithmes de base 2). La valeur de S caractérise donc l’écart
entre la description quantique donnée par ρ et une description optimale par
état pur, la plus précise possible en mécanique quantique.
Nous avons vu que les probabilités qm restent constantes au cours de
l’évolution temporelle de ρ selon (XII-54) ; l’évolution hamiltonienne d’un
opérateur densité conserve donc son entropie : dS/dt = 0.
Les trois composantes Sx,y,z du spin selon les trois directions Ox, Oy
et Oz sont associées à trois opérateurs, dont l’action sur ce vecteur colonne
(XII-58) est caractérisée par les trois “matrices de Pauli” σx , σy et σz définies
par5 :
0 1 0 −i 1 0
σx = σy = σz = (XII-59)
1 0 i 0 0 −1
4
La fonction −x ln x est positive si 0 < x < 1.
5
Plus précisément, les trois composantes du spin correspondent à ces trois matrices de
Pauli multipliées par la constante /2 ; c’est pourquoi nous employons le mot “associées”
et pas “égales”.
448 CHAPITRE XII. OUTILS MATHÉMATIQUES DE BASE
Un calcul simple montre que les carrés des matrices de Pauli sont tous égaux
à la matrice unité :
2 2 2 1 0
[σx ] = [σy ] = [σz ] = (XII-60)
0 1
Les relations de commutation des matrices de Pauli sont :
[σx , σy ] ≡ σx σy − σy σx = 2iσz (XII-61)
mais ces matrices anti-commutent :
[σx , σy ]+ ≡ σx σy + σy σx = 0 (XII-62)
(dans les deux cas, deux autres relations peuvent être obtenues par permu-
tation circulaire des opérateurs σx , σy et σz ).
La matrice de l’opérateur densité ρ correspondant à l’état |Ψ s’écrit :
∗
α α β∗α
ρ= (XII-63)
α∗ β β ∗ β
qui correspond donc à un état pur (on peut facilement vérifier que ρ2 = ρ si
|Ψ est normé). On montre que l’opérateur densité le plus général (cas pur
ou mélange statistique) s’écrit :
1 1
ρ= [1 + aσx + bσy + cσz ] = [1 + M · σ] (XII-64)
2 2
où le vecteur M , de composantes a, b et c sur les trois axes Ox, Oy et Oz,
est appelé “vecteur de Bloch” ; sa longueur est égale à 1 si l’état est pur,
inférieur à 1 pour un mélange statistique (ρ2 = ρ). Le Chapitre IV de la Ref.
[XII − 1] donne plus d’exemples de calculs quantiques dans un espace des
états de spin de dimension 2.
où les xi sont les composantes (complexes) de |Φ dans cette base. De même,
les vecteurs {|vj } constituent une base de G de sorte que l’on peut écrire :
|Ξ = yj |vj (XII-66)
j
|1 : ui ⊗ |2 : vj (XII-67)
Nous emploierons souvent pour ces kets des notations simplifiées, supposant
que le premier état désigne toujours implicitement celui du système physique
1:
|1 : ui ⊗ |2 : vj ≡ |1 : ui ; 2 : vj ≡ |ui , vj (XII-68)
Si K est la dimension de F (donc le nombre de valeurs distinctes que peut
prendre l’indice i) et Q celle de G (nombre de valeurs distinctes que peut
prendre l’indice j), le nombre de vecteurs produits distincts est R = KQ,
qui détermine également la dimension de E. Un état quelconque |Ψ de E
s’écrira donc :
K Q
|Ψ = zi,j |ui , vj (XII-69)
i=1 j=1
E =F ⊗G (XII-70)
Dans le cas particulier où toutes les composantes zi,j de |Ψ dans (XII-69)
peuvent s’écrire comme des produits :
zi,j = xi yj (XII-71)
Le cas le plus simple est celui où F et G sont tous deux les espaces des
états de spins 1/2, de dimension 2 chacun. L’espace des états total E est alors
de dimension 4, avec une base fournie par les vecteurs :
|1 : +; 2 : + , |1 : +; 2 : − , |1 : −; 2 : + et |1 : −; 2 : − (XII-74)
Un état particulier qui généralise (XII-76) est l’état souvent appelé “état
GHZ”, ou état “par tout ou rien” :
|Ψ = α |+, +, +, ..., + + β |−, −, −, ..., − (XII-78)
et qui, au contraire, possède des propriétés plus proches de celles d’un état
classique.
ρ12 (1, 2) = |Ψ(1, 2) Ψ(1, 2)| = |Φ(1) Φ(1)| ⊗ |Ξ(2) Ξ(2)| = ρ1 (1)ρ1 (2)
(XII-81)
Les 3 systèmes, total et partiels, sont alors dans des états purs.
Mais si |Ψ(1, 2) n’est pas un produit (si les deux sous-systèmes sont
intriqués), la situation est plus compliquée. On peut partir de la matrice
densité totale :
ρ12 = |Ψ(1, 2) Ψ(1, 2)| (XII-82)
452 CHAPITRE XII. OUTILS MATHÉMATIQUES DE BASE
Ainsi l’état de chacun des spins est totalement inconnu : il a autant de chances
d’être l’état |+ que l’état |− ou, de fait, d’être n’importe quelle combinaison
linéaire de ces états8 . Ainsi, même lorsque le système total est connu au mieux
dans le cadre de la mécanique quantique, dans ce cas strictement aucune
information n’est disponible sur les deux sous-systèmes, une situation qui n’a
aucun équivalent en mécanique classique (pour une discussion plus détaillée
de cette situation inhabituelle, remarquée en particulier par Schrödinger, voir
le § A du Chapitre VII).
7
L’opérateur densité partiel ρ1 est indépendant de la base {|ui , vj } choisie
pour le
définir. On montre en effet à partir de (XII-84) que, dans une autre base uq , vl , on a
uq ρ1 ur = l uq , vl ρ12 ur , vl .
8
La matrice est proportionnelle à la matrice unité, qui garde la même expression dans
n’importe quelle base.
C. PARTICULES DANS UN POTENTIEL 453
Cette condition est bien sûr essentielle pour pouvoir interpréter n(r) comme
densité de probabilité. Si une fonction d’onde ne donne pas la valeur 1 pour
l’intégrale de son module au carré, on dit qu’elle n’est pas normalisée, mais
il suffit alors de la diviser par la racine carrée de cette intégrale pour la
normaliser. Cependant, cette opération n’est possible que si l’intégrale dans
tout l’espace converge ; seules sont normalisables les fonctions “de carré som-
mable”, condition essentielle pour qu’une fonction soit acceptable comme
fonction d’onde.
La probabilité de trouver l’impulsion dans un certain domaine est donnée
par une formule semblable à (XII-91) : la densité de probabilité correspon-
2
dante n(p) est donnée par Ψ(p) , où Ψ(p) est la transformée de Fourier de
Ψ(r).
∂ 2
i Ψ(r,t) = − ΔΨ(r,t) + V (r, t) Ψ(r,t) (XII-94)
∂t 2m
A partir de la fonction d’onde, on peut définir un courant de probabilité :
∗
J(r, t) = Ψ (r,t)∇Ψ(r,t) − Ψ(r,t)∇Ψ∗ (r,t) (XII-95)
2im
et, en utilisant (XII-94), démontrer l’équation de conservation locale de la
probabilité :
∂
n(r, t) + ∇ · J(r, t) = 0 (XII-96)
∂t
Intégrée sur tout l’espace, cette relation permet de vérifier que la norme d’une
fonction d’onde reste constante au cours du temps : si elle est initialement
normalisée par (XII-93), l’équation de Schrödinger conserve cette normalisa-
tion au cours du temps.
C. PARTICULES DANS UN POTENTIEL 455
]
(
%
6
N
p2i
H(r, p ; t) = + V(r1 , r2 , ..., rN ; t) (XII-99)
2mi
i=1
La fonction :
d’onde à deux particules Ψ(r1 , r2 ) est le produit tensoriel des espaces des
fonctions d’onde individuelles. Cette notion se généralise à N particules, dont
les fonctions d’onde s’écrivent :
Ψ(r1 , r2 , ..., rN ) = ... φμ (r1 ) φν (r2 ) ... φξ (rN ) (XII-102)
μ ν ξ
∂ 2
i Ψ(r1 , ..., rN ; t) = − ΔΨ(r1 , ..., rN ; t) + V (r1 , ..., rN ; t) Ψ(r1 , ..., rN ; t)
∂t 2m
(XII-103)
où, comme en mécanique classique, le potentiel V peut comprendre une part
due au potentiel extérieur agissant séparément sur chaque particule, ainsi
qu’une part d’interaction entre elles (généralement la somme d’interactions
binaires entre particules). On peut aisément définir un courant de probabi-
lité J dans un espace à 3N dimensions (espace des configurations) afin de
généraliser les relations (XII-95) et (XII-96) et obtenir ainsi une relation de
conservation multi-dimensionnelle.
Si les N particules ont des spins 1/2, la fonction d’onde se divise en 2N
composantes, repérées par N indices valant ± :
mais, à part ce changement, l’idée générale reste la même : l’espace des états
du système de l’ensemble des particules est le produit tensoriel des espaces
des états des particules individuelles.
Remarque : la quantification des systèmes physiques n’est pas limitée à
celle des particules matérielles, mais s’applique également aux champs ; pour
une introduction voir par exemple les Refs. [XII − 7] et [XII − 8].
Références
P+
A
(a, λ) + P−
A
(a, λ) = 1 (App. B-1)
avec une condition semblable pour les probabilités P±B . Nous pouvons alors
ainsi que, bien sûr, une relation semblable pour la différence P+ B (b, λ) −
P+
A
(a, λ)P+
B
(b, λ) (App. B-4)
Les trois autres possibilités (+, −), (−,+) and (−, −) donnent lieu à des
égalités similaires. Supposons maintenant que nous désirions calculer la valeur
moyenne du produit des deux résultats obtenus. Pour chaque valeur de λ, il
s’introduit la somme des probabilités associées avec les résultats (+, +) et
(−,−), à laquelle il faut retrancher la somme des probabilités associées aux
résultats (+, −) et (−, +), ce qui conduit au terme :
P+A (a, λ)P B (b, λ) + P A (a, λ)P B (b, λ) − P A (a, λ)P B (b, λ) − P A (a, λ)P B (b, λ)
+ − − A + − − +
= P+ (a, λ) − P−A (a, λ) × P B (b, λ) − P B (b, λ)
+ −
(App. B-5)
La valeur moyenne de cette expression est obtenue par sommation sur λ qui,
d’après (App. B-3), donne l’intégrale :
1 1
dλ dμ A(a, λ, μ) dμ B(b, λ, μ ) (App. B-6)
0 0
P (A, B a, b, λ1 , λ2 ) = P (A B, a, λ1 , λ2 ) P (B b, λ1 , λ2 )
(App. B-8)
2
Cette indépendance est une nécessité relativiste qui correspond à l’impossibilité de
transmettre des signaux instantanés (§ D-1 du Chapitre V).
466 APPENDICE B
Cette forme n’est toujours pas suffisante pour obtenir une inégalité de
Bell, à cause de la dépendance en B du premier terme dans le produit.
suffit pour arriver à l’inégalité BCHSH. Une violation de cette inégalité signi-
fie donc qu’au moins l’une de ces indépendances n’est pas satisfaite, comme
c’est le cas en mécanique quantique.
Appendice C : Une tentative pour construire
une théorie quantique “séparable”
(non déterministe mais locale)
P+
A
(a, λ) = +(a)| ρ1 (λ) |+(a) (App. C-1)
P−
A
(a, λ) = −(a)| ρ1 (λ) |−(a) (App. C-2)
Si, au lieu de la direction a, une autre direction a est choisie, les calculs sont
les mêmes et conduisent à deux fonctions P± A (a , λ). Quant aux mesures effec-
tuées dans la deuxième région de l’espace, elles fournissent les deux fonctions
P+B (b, λ) et P B (b, λ).
−
Calculons maintenant la moyenne du produit des deux résultats, qui n’est
autre que la moyenne sur λ de l’expression déjà écrite en (App. B-5). Si nous
définissons A(λ)
et B(λ) par :
A(λ) = P+
A (a, λ) − P A (a, λ)
−
(App. C-3)
B(λ) = P+
B (b, λ) − P B (b, λ)
−
(i) soit nous procédons comme dans l’Appendice B et introduisons une va-
riable supplémentaire μ pour exprimer les différences de probabilités comme
celles de (App. B-3) en termes de nouvelles quantités A(a, λ, μ) et B(b, λ, μ ),
toujours égales à ±1. Ceci conduit à la même expression mathématique et la
même démonstration des inégalités BCHSH que ci-dessus.
(ii) soit nous introduisons les couples d’orientation (a, b), (a, b ), (a , b),
(a , b ) pour calculer la moyenne sur λ de l’expression :
B(λ)
A(λ) B
− A(λ) (λ) + A
(λ)B(λ)
(λ)B
+A (λ) (App. C-5)
Les A et B,
qui sont maintenant définis comme des différences de probabilités,
ne sont plus nécessairement égaux à ±1, mais il est facile de voir qu’ils
prennent des valeurs entre +1 et −1 , quelle que soit la valeur de λ. Il
s’ensuit2 que l’expression (App. C-5) est nécessairement comprise entre ±2,
ce qui nous ramène au calcul du § A-2 du Chapitre IV.
Le théorème de Bell reste vrai dans un grand nombre de situations diffé-
rentes. On peut cependant se demander à quel point exactement l’approche
de notre physicien sceptique est devenue incorrecte et pourquoi ses résultats,
du fait qu’ils satisfont aux inégalités de Bell, sont nécessairement incompa-
tibles avec ceux de la mécanique quantique standard (pas forcément toujours,
mais au moins dans certains cas) ; après tout, son raisonnement était fondé
sur une utilisation du formalisme quantique habituel. En fait, ce qui a causé
l’erreur était la volonté de traiter les mesures quantiques éloignées comme
des événements indépendants, séparables, alors que la mécanique quantique
nous impose de considérer le système des deux spins comme un tout indis-
sociable ; au sein de ce tout, il est interdit de distinguer deux sous-systèmes.
Le raisonnement quantique correct fait donc usage de vecteurs d’état (ou
d’opérateurs densité) qui décrivent à la fois l’ensemble du système dans un
objet mathématique unique. Cet exemple illustre donc que c’est réellement la
séparabilité et/ou la localité qui sont en jeu dans une violation des inégalités
de Bell, pas le déterminisme.
2
Pour voir pourquoi, considérons pour un instant λ, A
et A
comme fixés, ne gardant
que B et B comme variables. Dans l’espace de ces variables, l’expression (App. C-5)
correspond à une surface plane qui, aux quatre coins du carré B
= ±1, B
= ±1, prend les
valeurs ±2A ou ±2A , qui sont comprises entre ±2 ; au centre du carré, le plan passe par
l’origine. Par interpolation linéaire il est clair que, à l’intérieur du carré, la fonction donnée
par (App. C-5) reste également comprise entre ±2 ; ainsi, sa valeur moyenne possède la
même propriété.
Appendice D : Probabilité maximale
pour un état particulier
Dans cet appendice nous donnons plus de détails sur les calculs du § C du
Chapitre VI ; l’état à deux particules correspondant à la mesure considérée
en (i) est le produit tensoriel du ket (VI-40) par l’état correspondant pour le
second spin :
cos2 θ |+, + + sin θ cos θ [|+, − + |−, +] + sin2 θ |−, − (App. D-1)
(ii) Les particules qui ont passé avec succès la sélection précédente et
arrivent donc sur l’analyseur et le détecteur donnent un résultat qui dépend
d’une variable aléatoire λ1 pour la première, λ2 pour la seconde. Comme
au § A-2 du Chapitre IV, ces résultats dépendent également du paramètre
local choisi pour la mesure ; ils sont notés A(a, λ1 ) = ±1 pour la première
particule, B(b, λ2 ) pour la seconde (nous supposons l’existence de détecteurs
à deux voies, comme dans une expérience EPRB). Pour les particules qui
n’ont pas passé la sélection (i), on peut par convention leur attribuer le
résultat de mesure 0.
L’ensemble des λ1 , λ2 , ω1 , ω2 , peuvent être groupés formellement en un
paramètre unique Λ avec plusieurs composantes (un vecteur dans un espace
à plusieurs dimensions) ; chaque paire est alors caractérisée par une valeur
donnée de Λ, qui détermine si la paire sera détectée ou non par les appa-
reils de mesure et quels résultats elle fournira. Supposons maintenant que la
source émette les paires de particules de façon aléatoire. Les valeurs de Λ
sont alors associées à une distribution de probabilité ρ(Λ), avec la condition
de normalisation :
dΛ ρ(Λ) = dλ1 dλ2 dω1 dω2 ρ(λ1 , λ2 , ω1 , ω2 ) = 1 (App. E-2)
La valeur moyenne du produit des résultats des deux mesures est alors :
AB = dλ1 dλ2 dω1 dω2 ρ(Λ) A(a, λ1 ) B(b, λ2 )
D1 (Ω1 ) D2 (Ω2 )
(App. E-3)
qui, si les tailles des domaines dΩ1,2 centrés autour des valeurs ωdet 1,2 sont
petites, est également donnée par :
AB dΩ1 dΩ2 dλ1 dλ2 ρ(λ1 , λ2 , ωdet 1 , ωdet 2 ) A(a, λ1 ) B(b, λ2 )
(App. E-4)
Ces deux relations sont exactement du type de celles qui relèvent du théo-
rème de Bell et permettent de démontrer les inégalités correspondantes, par
E. SÉLECTION DES PAIRES OBSERVÉES 477
soit :
dΩ1 dΩ2 dλ1 dλ2 ρ(λ1 , λ2 , ωdet 1 , ωdet 2 ) 1 (App. E-6)
A ce stade, il devient clair que le modèle permet une souplesse bien plus
grande que ci-dessus pour reproduire des dépendances en a et b arbitraires ;
nous sommes en effet libres de choisir la distribution positive ρ(Λ) à notre
gré, en particulier sa dépendance par rapport aux variables ω1 et ω2 qui,
alors, introduit dans (App. E-9) une dépendance de ρ en a et b.
Pour voir de façon mathématiquement précise pourquoi, simplifions en-
core le modèle, en supposant par exemple que les domaines D1± de la variable
λ1 où A(a, λ1 ) = ±1 sont indépendants de a, et une hypothèse semblable
pour l’autre particule ; c’est certes un cas extrême, puisque λ ne joue plus
aucun rôle direct, toute la dépendance étant reportée dans celle de ρ en a et
b, mais il permet toutefois de reproduire la mécanique quantique. En effet,
on a alors :
avec :
I±,± = dλ1 dλ2 ρ(λ1 , λ2 , a, b) (App. E-11)
D1± D2±
1
La Ref. [206] donne quelques exemples concrets de processus de sélection des paires
dépendant des paramètres de mesure qui conduisent à des violations artificielles des inéga-
lités BCHSH ; dans son § 3-3, elle montre que la sélection peut conduire à dépasser la borne
de Cirelson et, dans le § 3-4, qu’on peut obtenir la violation maximale mathématiquement
possible, même avec des paires de spins non corrélés.
Appendice F : Impossibilité
d’une transmission superluminale de messages
1. Introduction
2. Un premier schéma
Pour calculer cette somme, nous commençons par remarquer que les deux
projecteurs POA (m, t1 ) et POB (n, t2 ) commutent entre eux : ils correspondent
en effet à des opérateurs agissant sur des particules différentes, et évoluent en
point de vue de Heisenberg sous l’influence d’hamiltoniens indépendants H1
et H2 . Dans le membre de droite de (App. F-1), considérons l’avant-dernier
opérateur POA (m, t1 ), que nous pouvons amener en dernière position. En-
suite, à cause de l’invariance par permutation des opérateurs sous la trace,
nous pouvons le faire passer en toute première position, juste avant le pre-
mier POB (n, t2 ), ou encore juste après puisqu’il commute avec cet opérateur.
Comme le carré du projecteur POA (m, t1 ) est égal au projecteur lui-même,
pour finir nous avons ainsi simplement fait disparaître l’un des opérateurs
POA (m, t1 ) de (App. F-1). Il ne nous reste maintenant qu’à effectuer la som-
mation sur m. Comme :
POA (m, t1 ) = 1 (App. F-3)
m
3. Généralisation
Il n’est alors pas difficile de vérifier que OAlice et OBob commutent. En effet,
dans le produit entre ces deux opérateurs les termes en PA PB s’annulent
lorsque les deux projecteurs contiennent la même particule ; il ne subsiste
donc que la somme de deux termes :
et celui où les numéros des deux particules sont échangés. Ceci correspond
au fait que, si les deux opérateurs effectuent chacun une mesure sur une par-
ticule, c’est soit la particule 1 qui est dans la région A et la particule 2 qui
est dans le région B, soit l’inverse, mais les deux particules ne peuvent pas se
trouver du même côté. On voit alors immédiatement qu’il est possible d’inter-
vertir l’ordre des facteurs dans (App. F-7) sans changer le résultat, de sorte
que les deux opérateurs OAlice et OBob commutent. Cette commutation nous
permet donc d’appliquer la démonstration précédente et d’obtenir le même
résultat : l’information disponible dans une région de l’espace est totalement
indépendante de la nature de la mesure qui est effectuée dans l’autre. L’envoi
de messages superluminaux est donc impossible, et la mécanique quantique
n’est pas contradictoire avec la relativité !
Appendice G : Mesures quantiques
à des instants différents
1. Formule de Wigner
Pour voir comment (XI-7) peut être démontré, commençons par calculer
la probabilité pour que la première mesure donne le résultat m au temps t1 .
La règle de Born habituelle (I-6) indique que cette probabilité est donnée par
le carré de la norme du ket |Ψm (t1 ) défini en (XI-3) :
qui, après évolution entre les instants t1 et t2 , n’est autre que le ket |Ψm (t2 )
écrit en (XI-4) et (XI-5), divisé par la racine carrée de Ψm (t1 ) |Ψm (t1 ). Le
même raisonnement que ci-dessus donne alors la probabilité conditionnelle
sous la forme :
1
QN/M (m, t1 ; n, t2 ) = Ψm,n (t2 ) |Ψm,n (t2 ) (App. G-4)
Ψm (t1 ) |Ψm (t1 )
où |Ψm,n (t2 ) est défini par (XI-6). Nous en déduisons la probabilité d’obtenir
la séquence des résultats m et n :
|Ψm,n (t2 ) = U (t2 , t0 )PN (n, t2 )PM (m, t1 ) |Ψ(t0 ) (App. G-10)
Pour finir, compte tenu de (App. G-6) et après une permutation circulaire
d’opérateurs sous la trace (qui fait disparaître deux U ), nous obtenons :
P1 (m, t1 ; n, t2 ) = T r PN (n, t2 )PM (m, t1 ) |Ψ(t0 ) Ψ(t0 )| PM (m, t1 )PN (n, t2 )
(App. G-11)
qui conduit à (XI-9). Par la même méthode, il est possible de généraliser
cette formule à plus de deux mesures, avec des projecteurs supplémentaires
des deux côtés de ρ(t0 ). Par linéarité, le résultat reste valable dans les cas
où l’opérateur densité ρ(t0 ) n’est pas un projecteur (état pur) comme dans
(XI-8), mais un mélange statistique.
Nous adoptons maintenant une approche différente qui met l’accent sur
l’intrication du système mesuré S avec les appareils de mesure1 . Une mesure
associée avec l’opérateur M est effectuée à l’instant t1 , une autre associée
à l’opérateur N à l’instant t2 , etc. (nous supposons que deux mesures sont
effectuées, mais la généralisation à un nombre arbitraire de mesures ne pose
aucun problème).
Initialement, à l’instant t0 , le système S est dans l’état ΨS (t0 ) ; les deux
appareils de mesure M et N , qui n’ont pas encore servi,
sont
dans les états
de départ ΨM (t0 ) et ΨN (t0 ) , et le vecteur d’état Ψ(t0 ) du système total
y compris les appareils est le produit (tensoriel) :
Ψ(t0 ) = ΨS (t0 ) ⊗ ΨM (t0 ) ⊗ ΨN (t0 ) (App. G-12)
(tous ces états sont normalisés). Nous supposons que les trois systèmes évo-
luent indépendamment (sans aucune interaction), excepté entre les instants
t1 et t1 où S interagit avec le premier appareil de mesure M , et entre les
instants t2 et t2 où il interagit avec le second appareil de mesure N . Les deux
appareils de mesure sont macroscopiques ; chacun d’entre eux comprend une
aiguille de mesure (pointeur) qui, une fois la mesure effectuée, indique le ré-
sultat qu’il fournit. Ils n’interagissent jamais entre eux, mais seulement avec
le système S.
1
Cette approche s’impose si l’on choisit l’interprétation d’Everett (§ M du Chapitre XI).
490 APPENDICE G
Entre les instants t0 et t1 l’état de S évolue de ΨS (t0 ) vers ΨS (t1 )
selon l’équation de Schrödinger (XI-1) et, de même,les vecteurs d’état des
appareils de mesure deviennent ΨM (t1 ) et ΨN (t1 ) .
Considérons maintenant l’effet de la première mesure. Comme dans les
§§ B-2-a du Chapitre I et A-2 du Chapitre XI, nous appelons PM (m) les
projecteurs sur les vecteurs propres de Sl’opérateur
M , de valeurs propres
m = m1 , m2 ,...,mi ,..., et développons Ψ (t1 ) sur ces vecteurs propres ; les
relations (XI-2) et (XI-3) deviennent ici :
S S
Ψ (t1 ) = Ψm (t1 ) (App. G-13)
m
avec : S
Ψm (t1 ) = PM (m) ΨS (t1 ) (App. G-14)
S
S’il se trouve que Ψ (t1 ) est un vecteur propre de M avec la valeur propre
mi , alors un seul terme m = mi est présent dans la sommation ; le résultat
de la première mesure est certain. A l’instant t1 juste après cette mesure,
le
premier appareil de mesure atteint un état normalisé bien défini ΨM (t
mi 1
)
Mais il faut prendre des précautions chaque fois que l’on ajoute un terme
non local dans les équations du mouvement : comme la relativité implique
l’impossibilité de transmettre un message plus vite qu’à la vitesse de la lu-
mière, il faut éviter tout élément dans la théorie qui entre en conflit avec
ce principe. Nous devons distinguer deux cas, suivant que l’on considère les
influences sur les variables supplémentaires qui sont directes (on les modi-
fie “à la main”, de façon complètement arbitraire, comme la position d’une
boule de billard), ou indirectes (appliquer des champs externes modifie l’ha-
miltonien du système, ce qui modifie l’évolution de la fonction d’onde et,
ensuite, affecte l’évolution des variables supplémentaires). Dans le second
cas, on peut vérifier que le terme non local ne pose aucun problème, car il
ne peut pas être utilisé pour envoyer instantanément une information via
les variables supplémentaires. Il s’agit là d’un résultat général, valable sim-
plement parce que les prédictions statistiques de la théorie de Bohm sont
équivalentes à la mécanique quantique standard, qui elle-même ne permet
aucune communication superluminale (§ D du Chapitre V et Appendice F).
Mais supposons par exemple que nous puissions directement manipuler la
variable supplémentaire associée à une particule d’une paire EPR corrélée,
et de façon totalement arbitraire (même à une échelle microscopique), sans
changer la fonction d’onde ; alors le terme de vitesse quantique agissant sur
les variables supplémentaires de la seconde particule en serait immédiatement
changé, ainsi donc que ses positions ultérieures dans l’espace ; comme cette
seconde particule peut se trouver à une distance en principe arbitrairement
grande, on pourrait utiliser ce phénomène pour envoyer des messages plus
rapidement que la vitesse de la lumière. La conclusion est, bien sûr, qu’une
telle manipulation doit être considérée comme impossible : le seul mécanisme
d’évolution des variables supplémentaires doit rester leur couplage à la fonc-
tion d’onde, sans intervention humaine directe.
Si les variables supplémentaires ne peuvent pas être directement mani-
pulées, pourrions-nous alors supposer qu’il est possible par une méthode ap-
propriée de les filtrer dans un domaine donné, comme on le fait pour le
vecteur d’état lorsque l’on sélectionne une composante selon Oz à la sortie
d’un aimant de Stern et Gerlach ? Si nous pouvions par exemple, pour une
particule dans un état propre de la composante Oz de son spin, sélectionner
les valeurs d’une variable supplémentaire en choisissant celles qui donnent
un résultat +1 dans une mesure future de la composante du spin selon Ox,
que se produirait-il ? Si une telle sélection était possible grâce à un appareil
de physique approprié, la théorie à variables supplémentaires cesserait d’être
équivalente à la mécanique quantique standard, puisqu’elle introduirait du
déterminisme à un endroit où la théorie standard l’exclut1 . De plus, Valen-
1
En théorie orthodoxe, si une particule de spin 1/2 est initialement mise dans l’état
de spin +1 par un appareil de Stern et Gerlach orienté selon Oz, il devient totalement
impossible de faire aucune prédiction concernant la déviation observée lorsque la particule
H. MANIPULATION DES VARIABLES SUPPLÉMENTAIRES 495
tini a montré [568] que, si la distribution initiale des positions de Bohm est
différente de celle donnée par “l’équilibre quantique” habituel (§ H-1-b du
Chapitre XI), alors l’envoi de messages plus rapides que la lumière devient
possible. Donc, si l’on pouvait d’une façon ou d’une autre préparer à la main
une distribution des positions de Bohm qui diffère de |Ψ(Q1 , Q2 , ...)|2 , par
exemple une distribution plus étroite, des contradictions avec la relativité
apparaîtraient immédiatement. C’est la raison pour laquelle on considère gé-
néralement que de telles préparations sont impossibles2 .
En résumé, il est nécessaire de supposer que les variables supplémen-
taires ne peuvent, ni être manipulées directement, ni filtrées, contrairement
au vecteur d’état. Les variables supplémentaires décrivent une réalité objec-
tive, mais à un niveau différent de la réalité associée à la fonction d’onde,
puisque seule cette dernière peut être influencée directement par des décisions
humaines. Les variables supplémentaires sont bien visibles (les résultats des
expériences) mais non contrôlables, alors que les fonctions d’onde possèdent
les propriétés complémentaires. Nous avons donc deux niveaux de réalité, l’un
correspondant à des champs classiques (les fonctions d’onde) qui sont expé-
rimentalement contrôlables mais non observables, l’autre pour les positions
qui sont directement observables mais non contrôlables.
De plus, lors de la création d’ondes vides dans un processus de mesure,
les champs classiques se divisent à leur tour en deux sous-niveaux de réalité :
une partie continue à jouer un rôle effectif de pilotage dans l’évolution de la
position des particules, et une partie d’ondes vides qui ne joue plus aucun
rôle pour déterminer les résultats des expériences futures. Cette seconde par-
tie prend ainsi une sorte de statut virtuel. Si l’on considère par exemple la
fonction d’onde de l’Univers, comme en théorie d’Everett elle est ramifiée en
un nombre fantastique de composantes orthogonales (bien qu’ici avec un sta-
tut différent, sans relation avec les observateurs et leurs registres mémoire).
Parmi toutes ces composantes, une seule joue un rôle pour piloter la position
du point représentant l’Univers dans son espace des configurations gigan-
tesque. Toutes les autres, trop loin de la position réalisée dans cet espace,
resteront pour toujours dans les limbes.
En conclusion, l’interprétation de De Broglie-Bohm ne conduit pas à une
description simple et directe de la réalité, semblable à celle que donne la
mécanique quantique pour des particules ou des champs. En fait, cette des-
cription n’est pas immune vis-à-vis de certaines difficultés présentant une
certaine analogie avec celles de la théorie quantique standard.
puisque la fonction d’onde est réelle. Si l’on ignore l’effet de la première me-
sure, la position bohmienne de la particule va rester " au même! endroit, ce qui
2
correspond à une fonction de corrélation égale à [X(t)] , donc positive :
on semble arriver à une contradiction. Mais si l’on tient compte de l’effet de
la première mesure on trouve que, juste après la première mesure, chaque
position de l’oscillateur est corrélée avec des positions différentes de l’aiguille
de l’appareil de mesure. Comme la fonction d’onde n’est alors plus un pro-
duit, les mouvements des deux systèmes se corrèlent : pour chaque position
de l’aiguille, la particule qui a été mesurée prend une vitesse différente. En
pratique, juste après la première mesure, la distribution de position de l’os-
cillateur devient une fonction étroite, qui commence à osciller dans le puits
de potentiel, de sorte que la fonction de corrélation de la position à deux
temps devient une fonction oscillante. Le désaccord avec la fonction de cor-
rélation quantique standard disparaît alors totalement, ainsi bien sûr que la
contradiction de signe.
Un cas semblable est étudié dans la Ref. [615], avec deux oscillateurs
harmoniques indépendants, initialement dans l’état :
1
|Ψ = √ |1, 0 + |0, 1 (App. I-1)
2
où |n, p désigne l’état où le premier oscillateur a le nombre quantique n et le
second oscillateur le nombre quantique p ; pour simplifier, nous supposons que
les fréquences des deux oscillateurs sont les mêmes, égales à ω/2π. Comme les
fonctions d’onde stationnaires de l’oscillateur harmonique peuvent être choi-
sies réelles, les fonctions d’onde associées le sont également, ce qui implique
qu’aucune des deux particules ne subit le moindre mouvement.
Les opérateurs de position des deux oscillateurs commutent entre eux et
peuvent être mesurés, soit simultanément, soit avec un délai entre les deux
mesures (on peut par exemple supposer que les deux oscillateurs sont centrés
en des points différents de l’espace, de sorte que faire la distinction entre leurs
deux positions ne pose aucun problème particulier). Cette commutation rend
très simple le calcul standard de la fonction de corrélation des positions des
deux particules. Après la mesure de la position du premier oscillateur au
point x01 , l’état des deux particules est proportionnel au produit d’un état
du premier oscillateur localisé autour de x01 par un état du second oscillateur
qui est une superposition cohérente :
x02 peut être fait à partir de cette seule fonction d’onde ; on trouve facile-
ment que cette probabilité contient en général une composante oscillant à la
fréquence ω/2π (sauf s’il se trouve que x01 tombe à un nœud de la fonction
ϕ1 ). Mais, d’autre part, nous avons vu que les positions de Bohm sont sta-
tiques, de sorte qu’une moyenne de leur produit sur toutes les trajectoires
possibles donne un résultat constant. A nouveau, on a l’impression d’arriver
à une contradiction entre les prédictions de la mécanique quantique standard
et celles de la théorie de Bohm.
Mais en réalité ce n’est pas ainsi que les fonctions de corrélation doivent
être calculées en théorie de Bohm : ici aussi, il faut tenir compte correctement
de l’effet de la première mesure, même si les deux observables commutent, et
même si elles correspondent à des systèmes indépendants (mais intriqués). La
première mesure corrèle la position bohmienne de la particule avec celle d’une
aiguille de mesure, ce qui crée des “ondes vides” et entraîne une dynamique
modifiée du système, ce qui modifie à son tour la fonction de corrélation.
Quand la particule 1 est mesurée, le système devient un système à trois corps
(ou plus) comprenant les positions des deux particules et celles du pointeur
de mesure. Chaque trajectoire de Bohm sélectionne une position du pointeur
(par exemple celle correspondant à une mesure positive dans le volume de
détection) ; pour chacune de ces trajectoires, les deux particules se déplacent
ensuite guidées par une fonction d’onde qui est maintenant un produit. Les
corrélations ont disparu de sorte qu’il n’y a pas à s’inquiéter de possibles effets
non locaux ; les deux particules subissent alors une évolution de Schrödinger
locale. Après la mesure, les positions des deux particules oscillent dans leurs
puits de potentiel, d’une façon qui reproduit exactement le résultat de la
mécanique quantique standard pour la fonction de corrélation.
1
|Ψ = ϕ(r1 ) χ(r2 ) √ |1 : +, 2 : − − |1 : −, 2 : + (App. I-3)
2
Supposons maintenant que la première particule pénètre dans un gradient
de champ magnétique comme celui d’un aimant de Stern et Gerlach orienté
500 APPENDICE I
Ψ = √1 ϕ+ (r1 ) |1 : + |2 : − − ϕ− (r1 ) |1 : − |2 : + χ(r2 )
a a a a
2
(App. I-4)
où les indices a dans les états de spin indiquent que la direction de quan-
tification a été choisie parallèle à la direction a. Dans une telle situation,
la position de Bohm de la première particule doit se trouver, soit dans le
paquet d’ondes ϕ+ (r1 ), soit dans le paquet d’ondes ϕ− (r1 ). L’autre onde est
nécessairement une “onde vide”, qui ne joue plus aucun rôle, et que l’on peut
supprimer sans conséquence. Une des composantes de (App. I-4) ayant ainsi
disparu, tout se passe comme si l’état de spin de la seconde particule avait
été projeté sur l’état de spin opposé à celui de la première particule. La sé-
paration spatiale du paquet d’ondes d’une des particules est donc suffisante
pour effectuer une projection de l’état des deux spins, avant même que la se-
conde particule ait éventuellement pénétré dans un autre gradient de champ
magnétique. On obtient ainsi un mécanisme très efficace qui reproduit la
projection du vecteur d’état.
de ces trois ondes. Si la position suit la première onde, elle atteint le premier
détecteur D1 ; si elle suit la seconde onde, elle atteint le second détecteur
D2 ; si elle suit la troisième, elle ne passe par aucun détecteur. Pendant que
le paquet d’onde traverse le plan PD , pour la première onde la position R1 se
déplace depuis R01 vers une nouvelle valeur R∗1 qui indique l’enregistrement
du passage d’une particule par D1 (les autres positions des pointeurs restent
inchangées) ; pour la seconde onde, R2 se déplace de R02 vers une nouvelle
valeur R∗2 ; et pour la troisième onde aucune position de pointeur ne change.
Ainsi, jusqu’à cet instant, nous vérifions qu’il existe un accord parfait entre
les positions bohmiennes des pointeurs des détecteurs (qui indiquent les ré-
sultats des mesures quantiques de position) et la trajectoire bohmienne suivie
par la particule.
Après le croisement du plan PD , les trois ondes sont associées avec trois
combinaisons différentes des positions des pointeurs, ce qui signifie que X
se propage dans trois régions sans recouvrement de l’espace des configura-
tions ; dès que les appareils de mesure indiquent les premiers résultats, et
tant qu’ils restent enregistrés, une seule des trois ondes est sélectionnée. Les
deux variables de pointeurs sélectionnent donc l’une seule des trois branches
du vecteur d’état, i = 1, ou 2 ou 3, les deux autres étant des ondes vides
qui ne jouent aucun rôle dans le futur1 . La seule onde qui reste (onde effec-
tive) est alors un produit. En conséquence, la situation pour la seconde série
de mesures dans le plan PE est très similaire à celle pour la première série
de mesures dans le plan PD . La fonction d’onde ϕi (r, t) se divise en trois
branches ϕi,j (r, t), qui guident la position bohmienne vers E1 si j = 1, vers
E2 si j = 2, ou hors de leur domaine de détection si j = 3. Dans chacune de
ces branches, les positions bohmiennes des pointeurs atteignent des valeurs
différentes : R∗1 , R02 , T∗1 , T02 si i = j = 1, ou R∗1 , R02 , T01 , T∗2 si i = 1 et j = 2,
ou R01 , R∗2 , T∗1 , T02 si i = 2 et j = 1, etc. A nouveau, nous observons un com-
plet accord entre les résultats de mesures quantiques à deux temps différents,
les positions bohmiennes des détecteurs, et la trajectoire bohmienne suivie
par la particule. Les mesures quantiques de position révèlent effectivement à
travers quels détecteurs est passée la trajectoire bohmienne de la particule.
Il faut toutefois noter que, comme nous avons supposé que les domaines de
détection des appareils de mesure sont suffisamment grands pour éviter de
forts effets de diffraction, cette détermination de la trajectoire n’est possible
qu’avec une précision limitée ; c’est une propriété générale de la théorie dBB
qu’une trajectoire bohmienne ne puisse jamais être déterminée avec une pré-
cision parfaite – voir par exemple la discussion de l’expérience illustrée dans
la Figure XI.3.
1
Nous supposons que, une fois qu’un résultat de mesure est enregistré, il le reste de
façon permanente et ne peut plus changer par la suite.
I. CORRÉLATIONS EN THÉORIE DBB 507
Remarques :
(i) Nous avons limité notre analyse à deux plans de détection et deux dé-
tecteurs de position dans chaque plan, mais la discussion peut être généralisée
à un nombre arbitraire de détections de position et un nombre arbitraire de
temps de mesure. De plus, nous n’avons pris en compte qu’une seule variable
par détecteur, ce qui est irréaliste puisque ce sont des appareils macrosco-
piques composés d’un très grand nombre de particules. Cette variable unique
que nous avons considérée symbolise en fait une variable collective compo-
sée de la position d’un grand nombre de particules ; nous discutons au § 3.2
les limites d’un tel traitement. On peut toutefois généraliser le raisonnement
précédent en considérant que R ou T résument un grand nombre de variables
bohmiennes.
(ii) Notre raisonnement montre que les fonctions de corrélation obtenues
à partir de mesures quantiques ou celles qu’on peut inférer à partir des tra-
jectoires bohmiennes sont en accord. Il est cependant important de noter que,
dans notre raisonnement, nous avons supposé que deux mesures quantiques
sont effectivement réalisées, et pris en compte leur effet sur le vecteur d’état
et les variables bohmiennes. Il serait incorrect d’utiliser les trajectoires pour
inférer à partir des positions dans le passé les valeurs des fonctions de corré-
lation lorsqu’une seule mesure est réalisée ; en d’autres termes, il ne faut pas
chercher à deviner ce qui aurait été observé au cours d’une mesure passée si
un appareil de mesure avait été inséré (raisonnement contrafactuel, §§ B-1
et C-2 du Chapitre IV). Nous avons maintenant vu à plusieurs occasions
que, comme en mécanique quantique standard, les fonctions de corrélation
des résultats de mesure doivent toujours être évaluées en prenant en compte
le couplage avec les deux appareils de mesure, sinon il peut en découler des
résultats incorrects.
1
Ψ(r, r1 ; t = 0) = √ [ϕupper (r)χupper (r1 ) + ϕlower (r)χlower (r1 )] (App. I-16)
2
où χupper (r1 ) et χlower (r1 ) sont les deux fonctions d’onde initiales de la par-
ticule jouant le rôle de pointeur, de même module :
χupper (r1 ) = eiK·r1 |χupper (r1 )| ; χlower (r1 ) = e−iK·r1 |χlower (r1 )|
(App. I-18)
Les impulsions moyennes du pointeur dans les deux états ont alors des di-
rections opposées. A l’instant t = 0, nous supposons cependant que les deux
fonctions d’onde du pointeur se recouvrent parfaitement. Ce n’est plus le
cas dès que le temps augmente : quand t croît, le recouvrement décroît pro-
gressivement, avec une constante de temps de l’ordre de TPO (PO symbolise
“pointer ovelap”). Pour des temps t TPO , l’évolution des deux positions
bohmiennes Q et Q1 associées à r et r1 obéit à une dynamique couplée par
l’intrication de la fonction d’onde, et leurs trajectoires peuvent être compli-
quées. Mais, pour des temps t TPO , la situation est plus simple du fait
que la position bohmienne Q1 ne peut suivre qu’une seule des deux compo-
santes (l’autre composante est alors vide) ; l’intrication ne joue plus de rôle
dans l’évolution de la position bohmienne, qui se propage comme si les deux
particules étaient indépendantes.
Si le temps auquel les paquets d’ondes se croisent dans la région d’interfé-
rence est grand devant TPO , pendant le croisement les positions bohmiennes
ne sont sensibles qu’à une seule composante de la fonction d’onde, et les tra-
jectoires sont pratiquement rectilignes (partie gauche de la Figure I-3). En
revanche, si la particule pointeur est lente, et si la particule test passe par
la région d’interférence longtemps avant que les paquets d’ondes du pointeur
ne se séparent, la dynamique des deux positions bohmiennes est bien plus
complexe. Des simulations numériques [611, 612] montrent alors que, dans
la limite où la particule pointeur est très lente, les trajectoires de la parti-
cule test dépendent de la position bohmienne initiale de la particule jouant
le rôle de pointeur. La partie de droite de la figure montre un cas où cette
position initiale est neutre (centrée sur son paquet d’ondes), et où la règle
du non-croisement s’applique à nouveau. La partie du milieu de la Figure
I-3 montre une situation intermédiaire où la particule pointeur n’est ni très
rapide ni très lente. La conclusion est que des effets d’interaction non locales
entre les trajectoires peuvent effectivement apparaître avec deux particules
microscopiques.
I. CORRÉLATIONS EN THÉORIE DBB 509
pointeur lent : un pointeur qui indique le trou par lequel la particule est passée
longtemps après que cette particule ait traversé la région d’interférence. La
question qui se pose est alors de savoir si les effets non locaux précédents, et
donc les trajectoires “surréalistes” qui en découlent, continuent à se produire
à une échelle macroscopique. Comme nous l’avons vu, l’élément crucial pour
répondre à la question est de savoir si deux éléments de la fonction d’onde
continuent à être simultanément actifs pour piloter la particule test. Nous
devons alors remplacer (App. I-16) par :
Ψ(r, r1 , ..., rk , ; ..., rN ; t = 0)
% &
1 N N
= √ ϕupper (r) χupper (rk ) + ϕlower (r)
k
χ lower (rk )
k
(App. I-19)
2 k=1 k=1
qui décroît bien rapidement en fonction du temps, 1020 fois plus rapidement
si le pointeur contient 1020 particules ! Le temps au bout √ duquel le recou-
vrement a décru de façon significative est environ τ = Tpo / N , qui est 1010
fois plus court que Tpo . La conséquence est que, en pratique, un pointeur
macroscopique agit toujours comme un pointeur rapide, de sorte que la règle
du non-croisement ne s’applique pas. Dans un tel cas, une des ondes devient
presque instantanément vide, et ne joue plus aucun rôle dans l’évolution ulté-
rieure des variables bohmiennes. Ainsi, les effets non locaux discutés ci-dessus
peuvent se produire avec un petit nombre de degrés de liberté, mais pas avec
le pointeur macroscopique d’un appareil de mesure (qui, de plus, n’est pas
un système fermé, et tend donc à rapidement mettre en jeu les positions
bohmiennes de son environnement).
En conclusion, il est parfaitement approprié d’étudier l’intrication entre
des systèmes microscopiques au moyen d’un petit nombre de variables boh-
miennes (souvent deux). Toutefois, lorsque l’un des systèmes intriqués devient
I. CORRÉLATIONS EN THÉORIE DBB 511
1. Un seul opérateur
Si les |an sont les vecteurs propres de A avec des valeurs propres1 an ,
nous pouvons développer |Ψ(t) selon :
|Ψ(t) = xn (t) |an (App. J-5)
n
1
En cas de dégénérescence, plusieurs valeurs consécutives de an sont égales, mais cor-
respondent à des vecteurs propres différents (orthogonaux).
J. MODÈLES DE RÉDUCTION SPONTANÉE 515
où t = N Δt, et où w1 , w2 , ...wN sont les valeurs choisies pour w(t) pendant les
intervalles de temps successifs ; le coefficient de normalisation cN est obtenu
en écrivant que la somme des probabilités pour toutes les réalisations est 1.
La relation (App. J-9) est appelée la loi de probabilité CSL (pour “conti-
nuous spontaneous localization”). A partir de cette condition, le théorème de
Bayes permet de calculer la probabilité que, si w(t) a une valeur donnée à un
instant donné, la fonction va sauter à n’importe quelle autre valeur pendant
l’intervalle de temps discret suivant.
Parmi toutes les réalisations possibles des fonctions aléatoires w(t), la loi
de probabilité CSL favorise fortement un petit sous-ensemble, les fonctions
qui préservent une grande norme pour |Ψ(t), donc les fonctions qui sont
constamment égales (ou presque) à l’une des valeurs propres an . Toutes les
autres possibilités, si nombreuses qu’elles soient, sont par hypothèse considé-
rées comme très peu probables. Pour chaque réalisation, le mécanisme ainsi
obtenu brise la symétrie entre toutes les valeurs propres : la même fonction
aléatoire ne peut pas rester la plupart du temps très proche de plus d’une
valeur propre an ; elle doit faire un choix entre elles. Il en résulte que, au bout
d’un certain temps, on finit toujours par obtenir un vecteur d’état qui est très
516 APPENDICE J
2. Plusieurs opérateurs
Ak commutent alors toujours entre eux, mais leur produit pour deux valeurs
différentes de k n’est pas nécessairement nul à cause du recouvrement mutuel
des ϕk (r).
Nous introduisons alors un second réseau, bien plus fin que le précédent,
fait de “cellules” cubiques de dimensions bien plus petites que α−1/2 , qui sont
repérées par l’indice q. A l’intérieur de chacune de ces cellules, chacun des
ϕk (r) reste pratiquement constant, de sorte que dans ce volume l’action de
Ak peut être assimilée à une multiplication par une constante, la valeur ϕqk
de ϕk (r) au centre de la cellule. Ainsi, si nous développons le vecteur d’état
initial sur ses composantes dans les cellules2 :
0 !
|Ψ(0) = Ψ q (App. J-11)
q
nous avons : ! !
0 q 0
A k Ψ q ϕ k Ψ q (App. J-12)
!
0
qui signifie que Ψq est pratiquement un vecteur propre de Ak . Dans ces
conditions :
t !
q 2 0
e− 0 dt k [wk (t )−ϕk ] Ψq
|Ψ(t) (App. J-13)
q
La situation est alors semblable à celle qui se produit pour un seul opéra-
teur A. En effet, l’équation (App. J-13) montre qu’une composante associée à
une cellule q particulière ne peut garder une norme importante que si chaque
fonction aléatoire wk (t) reste très proche de la valeur ϕqk pendant presque
tout l’intervalle de temps [0, t]. Cela signifie que la fonction wk (t) correspon-
dant au point k du réseau initial le plus proche de la cellule q doit prendre une
valeur significative ; quant aux autres fonctions aléatoires wk (t) avec k = k,
elles doivent être bien plus petites puisque ϕqk prend une valeur d’autant plus
2 0
La composante Ψq est définie par le fait que, dans la cellule q, sa fonction d’onde
est égale à celle de |Ψ(0), mais qu’elle est nulle hors de la cellule q.
518 APPENDICE J
Une méthode simple est de choisir une base quelconque {|uk } dans l’es-
pace des états du système, et d’introduire les projecteurs :
Si, dans l’équation (XI-22), nous insérons ces projecteurs des deux côtés de
l’opérateur densité, nous obtenons :
T r Pj1 ρ(t0 )Pj1 (App. K-3)
Pour terminer nous remarquons que, dans notre construction des familles,
l’opérateur densité initial ρ(t0 ) n’a joué aucun rôle : la méthode est univer-
selle, quel que soit l’état initial du système. Mais il est aussi possible de choisir
une base {|uk } constituée par les vecteurs propres de l’opérateur densité. La
description par histoires selon le procédé ci-dessus devient alors, en un sens,
triviale : initialement, on peut considérer que le système est dans l’un des
états propres de ρ(t0 ), avec une probabilité égale à la valeur propre corres-
pondante, et évolue ensuite de façon déterministe sous l’effet de l’opérateur
U (t, t0 ). L’avantage de cette méthode est de montrer que, dans tous les sous-
espaces propres de l’opérateur densité qui ont une valeur propre nulle, les
projecteurs peuvent être absolument quelconques, sans que la condition de
cohérence intervienne réellement.
Appendice L : Dynamique de Schrödinger
attractive
où la somme court sur toutes les particules. Nous introduisons une fonction
plus régulière, l’intégrale de DB (r) sur un volume de dimension aL :
2 /(a 2
N
2 2
NB (r,t) = d3 r e−(r−r ) L)
D B r , t = e−(r−qn ) /(aL ) (App. L-3)
n=1
d
i Φ (t) = H (t) + H L (t) Φ (t) (App. L-6)
dt
L. DYNAMIQUE DE SCHRÖDINGER ATTRACTIVE 525
avec :
H L (t) = iγL d3 r Ψ† (r) Ψ (r) − DΦ (r) NB (r,t) (App. L-7)
La seule différence avec l’équation non normalisée (App. L-5) est que l’opéra-
teur Ψ† (r) Ψ (r) est remplacé par la différence qui se trouve dans le crochet
sous l’intégrale, qui n’est en fait rien d’autre que l’opérateur associé à la
fluctuation de la densité locale.
L’équation (App. L-5) est linéaire mais dépendant du temps (même si
l’hamiltonien H est indépendant du temps), car les positions bohmiennes
et donc NB (r, t) dépendent du temps. La version qui conserve la norme
(App. L-7) est de plus non linéaire puisque DΦ (r ) dépend du vecteur d’état
|Φ.
n
526 APPENDICE L
γL = 10−16 s−1
aL 10−6 m (App. L-12)
Bien évidemment, notre but ici n’est pas de définir des valeurs précises de ces
constantes ; nous souhaitons juste montrer qu’il existe un large domaine de
L. DYNAMIQUE DE SCHRÖDINGER ATTRACTIVE 527
valeurs qui sont compatibles avec l’immense corpus des données expérimen-
tales qui sont en accord avec la mécanique quantique standard (parfois avec
une précision incroyable de 10−12 !), tout en introduisant une dynamique très
rapide de projection du vecteur d’état lorsqu’une mesure est effectuée.
retenons que le terme en (a0 /aL )2 , nous voyons que les parties de la fonction
d’onde à la périphérie de l’atome sont réduites à un taux γ donné par :
2
a0
γ γL N2 (App. L-13)
aL
Ainsi, même pour une expérience d’interférence longue durant une seconde, si
N < 107 , l’effet du terme de localisation reste négligeable, et l’interférence se
produit dans les mêmes conditions que ce que prévoit la dynamique standard
de Schrödinger ; mais, pour des valeurs plus élevées de N , le modèle prédit
que le contraste des franges devrait décroître, et s’annuler dans la limite où
√
N 1/ γL t, où t est le temps passé par les particules dans l’interféromètre.
Remarque : dans une expérience d’interférence avec un gaz condensé de
Bose, la situation est différente puisqu’aucune force de cohésion ne maintient
les atomes ensemble. La fonction d’onde contient alors des composantes où
certains atomes se trouvent dans un bras de l’interféromètre, d’autres dans
le bras opposé. En conséquence, les positions bohmiennes peuvent parfaite-
ment se répartir entre les deux bras de l’interféromètre, de sorte que l’effet
d’amortissement se produit avec un taux par unité de temps qui reste très
inférieur à (App. L-14).
L. DYNAMIQUE DE SCHRÖDINGER ATTRACTIVE 529
γ γ L NB N (App. L-15)
Même si, par précaution, nous choisissons des valeurs relativement petites
NP = 1020 , NB = 1011 , nous obtenons toujours un taux très rapide γ 1015 ;
l’équation dynamique conduit à une projection très rapide de la fonction
d’onde.
Deux situations sont alors possibles :
(i) Une situation “normale” où la fonction d’onde à N particules contient
seulement des composantes où toutes les particules sont localisées à l’intérieur
du volume V du cube. L’équation (App. L-5) prédit alors une croissance
uniforme de la fonction d’onde qui n’a aucun effet physique ; si l’on préfère
utiliser la version normalisée (App. L-6), on vérifie que le terme contenant
l’intégrale spatiale de DΦ (r) compense exactement cette croissance. Le terme
de localisation n’a alors aucun effet à l’intérieur du volume V.
(ii) Une situation de “chat de Schrödinger” où la fonction d’onde à N par-
ticules contient deux (ou plus) composantes où les particules constituantes
sont localisées dans des régions différentes de l’espace. Lors d’une mesure
quantique, ceci se produit par exemple si le pointeur de l’appareil se trouve
dans une superposition quantique d’états qui indiquent des résultats de me-
sure différents. Il devient alors clair que le processus de localisation agit
différemment sur les différentes composantes de la fonction d’onde. En effet,
comme plus haut, les différentes positions bohmiennes doivent suivre la même
composante de la fonction d’onde (les points de l’espace des configurations
où la fonction d’onde s’annule ne sont jamais atteints). Ainsi une composante
530 APPENDICE L
1
Ces auteurs étudient l’évolution des qn lorsque la fonction d’onde évolue selon l’équa-
tion de Schrödinger standard (sans terme de localisation). Comme ils prédisent des temps
de relaxation relativement courts, leurs conclusions pour des objets microscopiques ne de-
vraient pratiquement pas être changées par la présence d’un terme de localisation dont la
constante de couplage est très faible.
Bibliographie
[1] N. Bohr, Atomic Physics and Human Knowledge, Wiley (1958), and
Dover (2011), voir en particulier “Discussions with Einstein on episte-
mological problems in atomic physics” ou, avec une bibliographie et un
glossaire : C. Chevalley : Physique atomique et connaissance humaine,
Folio essais, Gallimard (1991) ; Essays 1933 to 1957 on Atomic Physics
and Human Knowledge, Ox Bow Press (1987) ; Essays 1958–62 on Ato-
mic Physics and Human Knowledge, Wiley (1963) and Ox Bow Press
(1987) ; Atomic Physics and the Description of Nature, Cambridge Uni-
versity Press (1934 et 1961).
[5] J.S. Bell, “On the problem of hidden variables in quantum mechanics”,
Rev. Mod. Phys. 38, 447–452 (1966) ; reproduit dans Quantum Theory
and Measurement, J.A. Wheeler and W.H. Zurek eds., Princeton Uni-
versity Press (1983), 396–402 et dans le Chapitre 1 de [6].
[8] D. Bohm and J. Bub, “A refutation of the proof by Jauch and Piron
that hidden variables can be excluded in quantum mechanics”, Rev.
Mod. Phys. 38, 470–475 (1966).
[9] N.D. Mermin, “Hidden variables and the two theorems of John Bell”,
Rev. Mod. Phys. 65, 803–815 (1993) ; voir en particulier le § III.
[12] N. Wiener and A. Siegel, “A new form for the statistical postulate
of quantum mechanics”, Phys. Rev. 91, 1551–1560 (1953) ; A. Siegel
and N. Wiener, “Theory of measurement in differential space quantum
theory”, Phys. Rev. 101, 429–432 (1956).
[14] P. Pearle, “Toward explaining why events occur”, Int. J. Theor. Phys.
18, 489–518 (1979).
[15] G.C. Ghirardi, A. Rimini and T. Weber, “Unified dynamics for micro-
scopic and macroscopic systems”, Phys. Rev. D 34, 470–491 (1986) ;
“Disentanglement of quantum wave functions”, Phys. Rev. D 36, 3287–
3289 (1987).
[16] B.S. DeWitt, “Quantum mechanics and reality”, Phys. Today 23, 30–35
(September 1970).
[19] “Quantum mechanics debate”, Phys. Today 24, 36–44 (April 1971) ;
“Still more quantum mechanics”, Phys. Today 24, 11–15 (Oct. 1971).
[20] B.S. DeWitt and R.N. Graham, “Resource letter IQM-1 on the inter-
pretation of quantum mechanics”, Am. J. Phys. 39, 724–738 (1971).
Bibliographie 535
[28] A. Pais, “Einstein and the quantum theory”, Rev. Mod. Phys. 51, 863–
914 (1979).
[29] E.H. Lieb and R. Seiringer, The Stability of Matter in Quantum Me-
chanics, Cambridge University Press (2010).
[30] L. de Broglie, “Recherches sur la théorie des quanta”, thèse Paris (1924).
[43] H.P. Stapp, “The Copenhagen interpretation”, Am. J. Phys. 40, 1098–
1116 (1972).
[44] A. Peres, “What is a state vector ?”, Am. J. Phys. 52, 644–650 (1984).
[48] P.A.M. Dirac, “The quantum theory of the emission and absorption of
radiation”, Proc. Roy. Soc A 114, 243-265 (1927).
[52] R.P. Feynman and A.R. Hibbs, Quantum mechanics and path integrals,
McGraw-Hill (1965).
[53] J.S. Bell, “Six possible worlds for quantum mechanics”, Found. Phys.
22, 1201–1215 (1992).
[54] N.D. Mermin, “Quantum mechanics : fixing the shifty split”, Physics
Today, 8-10 (July 2012).
[56] N.D. Mermin, “Is the moon there when nobody looks ? Reality and the
quantum theory”, Phys. Today 38, 38–47 (April 1985).
[64] E.P. Wigner, “The problem of measurement”, Am. J. Phys. 31, 6–15
(1963) ; reproduit dans Symmetries and Reflections, Indiana University
Press, pp. 153–170 (1967) ; ou encore dans Quantum Theory of Measu-
rement, J.A. Wheeler and W.H. Zurek eds., Princeton University Press
(1983), pp. 324–341.
[71] L. Hardy, “On the existence of empty waves in quantum theory”, Phys.
Lett. A 167, 11–16 (1992).
[90] N. Bohr, “Atomic theory and mechanics”, Nature 116, 845–852 (1925).
[92] N. Bohr, “The quantum postulate and the recent development of atomic
theory”, Nature, Supplement April 14 1928, 580–590 (1928).
[95] J.S. Bell, “Bertlmann’s socks and the nature of reality”, J. Physique
colloques C2, 41–62 (1981). Cet article est reproduit dans les pages
139–158 de [6].
[117] T. Sauer, “An Einstein manuscript on the EPR paradox for spin ob-
servables”, Studies in History and Philosophy of Modern Physics, 38,
879–887 (2007).
[118] A. Peres, “Einstein, Podolsky, Rosen, and Shannon”, Found. Phys. 35,
511–514 (2005).
[119] D. Home and F. Selleri, “Bell’s theorem and the EPR paradox”, Rivista
del Nuov. Cim. 14, 1–95 (1991).
[123] J.F. Clauser and A. Shimony, “Bell’s theorem : experimental tests and
implications”, Rep. Progr. Phys. 41, 1881–1927 (1978).
[125] D.J. Hemmick and A.M. Shakur, Bell’s theorem and quantum realism ;
reassessment in light of the Schrödinger paradox, Springer (2012).
[126] J. Conway and S. Kochen, “The free will theorem”, Found. of Phys. 36,
1441-1473 (2006) ; “The strong free will theorem”, Notices of the AMS
56, 1441-1473 (2009).
[128] F. Laloë, “The hidden phase of Fock states ; quantum non-local ef-
fects”, Europ. Phys. J. 33, 87–97 (2005) ; “Bose–Einstein condensates
and quantum non-locality”, in Beyond the Quantum, T.M. Nieuwen-
hiuzen et al. eds., World Scientific (2007).
[130] W.J. Mullin and F. Laloë, “Quantum non-local effects with Bose–
Einstein condensates”, Phys. Rev. Lett. 99, 150401 (2007) ; “EPR argu-
ment and Bell inequalities for Bose–Einstein spin condensates”, Phys.
Rev. A 77, 022108 (2008).
Bibliographie 543
[135] J.F. Clauser, M.A. Horne, A. Shimony and R.A. Holt, “Proposed ex-
periment to test local hidden-variables theories”, Phys. Rev. Lett. 23,
880–884 (1969).
[137] J.A. Wheeler, “Niels Bohr in today’s words” in Quantum Theory and
Measurement, J.A. Wheeler and W.H. Zurek eds., Princeton University
Press (1983), pp. 182–213.
[138] E.P. Wigner, “On hidden variables and quantum mechanical probabi-
lities”, Am. J. Phys. 38, 1005–1009 (1970).
[143] S.J. Freedman and J.F. Clauser, “Experimental test of local hidden
variable theories”, Phys. Rev. Lett. 28, 938–941 (1972) ; S.J. Freedman,
thesis, University of California, Berkeley.
[145] E.S. Fry and R.C. Thompson, “Experimental test of local hidden va-
riable theories”, Phys. Rev. Lett. 37, 465–468 (1976).
[152] T.E. Kiess, Y.E. Shih, A.V. Sergienko and C.O. Alley, “Einstein–
Podolsky–Rosen–Bohm experiments using pairs of light quanta pro-
duced by type-II parametric down conversion”, Phys. Rev. Lett. 71,
3893–3897 (1993).
[155] J. Yin, Y. Cao, Y-H. Li, S-K. Liao, L. Zhang, J-G. Ren, W-Q. Cai,
W-Y. Liu, B. Li, H. Dai, G-B. Li, Q-M. Lu, Y-H. Gong, Y. Xu,
S-L. Li, F-Z. Li, Y-Y. Yin, Z-Q. Jiang, M. Li, J-J. Jia, G. Ren,
D. He, Y-L. Zhou, X-X. Zhang, N. Wang, X. Chang, Z-C. Zhu,
N-L. Liu, Y-A. Chen, C-Y. Lu, R. Shu, C-Z. Peng, J-Y. Wang and
Bibliographie 545
[165] T. Norsen, “John S. Bell concept of local causality”, Am. J. Phys. 79,
1261-1274 (2011) ; see also "Bell locality and the nonlocal character of
Nature", Found. Physics Lett. 19, 633-655 (2006).
[167] J.S. Bell, “The theory of local beables”, Epistemological letters, march
1976 ; reproduit dans les pages 52–62 de [6].
[171] J.P. Jarrett, “On the physical significance of the locality conditions in
the Bell arguments”, Nőus 18, 569–589 (1984).
[172] L.E. Ballentine and J.P. Jarrett, “Bell’s theorem : does quantum me-
chanics contradict relativity ?”, Am. J. Phys. 55, 696–701 (1987).
[177] A.J. Leggett, “The current status of quantum mechanics at the ma-
croscopic level”, Proceedings 2nd Int. Symp. Foundations of quantum
mechanics, Tokyo, 287–297 (1986).
[181] P. Grangier, M.J. Potasek and B. Yurke, “Probing the phase cohe-
rence of parametrically generated photon pairs : a new test of Bell’s
inequalities”, Phys. Rev. A 38, 3132–3135 (1988).
[182] J.D. Franson, “Bell inequality for position and time”, Phys. Rev. Lett.
62, 2205–2208 (1989).
[183] J.G. Rarity and P.R. Tapster, “Experimental violation of Bell’s inequa-
lity based on phase and momentum”, Phys. Rev. Lett. 64, 2495–2498
(1990).
[186] N. Gisin, “Bell’s inequality holds for all non-product states”, Phys. Lett.
A154, 201–202 (1991).
[187] N. Gisin and A. Peres, “Maximal violation of Bell’s inequality for arbi-
trarily large spin”, Phys. Lett. A 162, 15–17 (1992).
[192] A. Peres, “Collective tests for quantum nonlocality”, Phys. Rev. A 54,
2685–2689 (1996).
548 Bibliographie
[195] S.M. Tan, D.F. Walls and M.J. Collett, “Nonlocality of a single photon”,
Phys. Rev. Lett. 66, 252–255 (1991).
[198] B.F. Toner and D. Bacon, “Communication cost of simulating Bell cor-
relations”, Phys. Rev. Lett. 91, 187904 (2003).
[203] J.S. Bell, Présentation orale à la conférence EGAS à Paris, juillet 1979
(publiée en version abrégée dans la référence suivante).
[204] J.S. Bell, “Atomic cascade photons and quantum mechanical non-
locality”, Comments on Atomic and Molecular Physics 9, 121 (1980) ;
CERN preprint TH.2053 et TH 2252 ; Chapitre 13 de [6].
[207] D.S. Tasca, S.P. Walborn, F. Toscano and P.H. Souto Ribeiro, “Obser-
vation of tunable Popescu–Rohrlich correlations through postselection
of a Gaussian state”, Phys. Rev. A 80, 030101 (2009).
[211] C.H. Brans, “Bell’s theorem does not eliminate fully causal hidden va-
riables”, Int. J. Theor. Phys. 27, 219–226 (1988).
[212] J.S. Bell, “Free variables and local causality”, Epistemological Lett., Feb.
1977 ; Chapitre 12 de [6].
[215] P.H. Eberhard, “Background level and counter efficiencies required for
a loophole-free Einstein–Podolsky–Rosen experiment”, Phys. Rev. A
47, R747-R750 (1993).
[216] P.G. Kwiat, P.H. Eberhard, A.M. Steinberg and R.Y. Chiao, “Proposal
for a loophole-free Bell inequality experiment”, Phys. Rev. A 49, 3209–
3220 (1994).
[217] E.S. Fry, T. Walther and S. Li, “Proposal for a loophole-free test of the
Bell inequalities”, Phys. Rev. A 52, 4381–4395 (1995).
[222] D.N. Matsukevich, T. Chanelière, S.D. Jenkins, S.Y. Lan, T.A.B. Ken-
nedy and A. Kuzmich, “Entanglement of remote atomic qubits”, Phys.
Rev. Lett. 96, 030405 (2006).
[228] H.P. Stapp, “Whiteheadian approach to quantum theory and the gene-
ralized Bell’s theorem”, Found. Phys. 9, 1–25 (1979) ; “Bell’s theorem
and the foundations of quantum physics”, Am. J. Phys. 53, 306–317
(1985).
[229] H.P. Stapp, “Nonlocal character of quantum theory”, Am. J. Phys. 65,
300–304 (1997).
[230] N.D. Mermin, “Nonlocal character of quantum theory ?”, Am. J. Phys.
66, 920–924 (1998).
[232] A.J. Leggett, “Realims and the physical world”, Rep. Progr. Phys. 71,
022001 (2008).
[237] N.D. Mermin, “Bringing home the atomic world : quantum mysteries
for anybody”, Am. J. Phys. 49, 940–943 (1981).
[241] L.J. Landau, “On the violations of Bell’s inequality in quantum theory”,
Phys. Lett. A 120, 54–56 (1987).
[242] A. Shimony, Search for a naturalistic world view, vol. II, p. 131, Cam-
bridge Universtity Press (1993).
[249] M.L. Almeida, J.-D. Bancal, N. Brunner, A. Acin, N. Gisin and S. Pi-
ronio, “Guess your neighbor’s input : a multipartite nonlocal game with
no quantum advantage”, Phys. Rev. Lett. 104, 230404 (2010).
[250] D.M. Greenberger, M.A. Horne and A. Zeilinger, “Going beyond Bell’s
theorem”, in Bell’s Theorem, Quantum Theory, and Conceptions of the
Universe, M. Kafatos ed., Kluwer (1989), pp. 69–72 ; cette référence
n’est pas toujours facile à obtenir, mais on peut également consulter
l’article qui suit, publié l’année suivante.
[252] N.D. Mermin, “Quantum mysteries revisited”, Am. J. Phys. 58, 731–
733 (1990) ; voir égalmement “What’s wrong with these elements of
reality ?”, Physics Today, 9-11 (juin 1990).
[255] Z. Zhao, T. Yang, Y.-A Chen, A.-N. Zhang, M. Zukowski and J.W. Pan,
“Experimental violation of local realism by four-photon Greenberger–
Horne–Zeilinger entanglement”, Phys. Rev. Lett. 91, 180401 (2003).
[261] J. Acacio de Barros and P. Suppes, “Inequalities for dealing with de-
tector efficiencies in Greenberger–Horne–Zeilinger experiments”, Phys.
Rev. Lett. 84, 793–797 (2000).
[268] D.J. Wineland, J.J. Bollinger, W.M. Itano, F.L. Moore and D.J. Hein-
zen, “Spin squeezing and reduced quantum noise in spectroscopy”, Phys.
Rev. A 46, R6797–6800 (1992).
[269] J.J. Bollinger, W.M. Itano, D.J. Wineland and D.J. Heinzen, “Optimal
frequency measurements with maximally correlated states”, Phys. Rev.
A 54, R4649–4652 (1996).
554 Bibliographie
[271] A.N. Boto, P. Kok, D.S. Abrams, S.L. Braunstein, C.P. Williams and
J.P. Dowling, “Quantum interferometric optical lithography : exploiting
entanglement to beat the diffraction limit”, Phys. Rev. Lett. 85, 2733–
2736 (2000).
[279] N.D. Mermin, “What’s wrong with this temptation ?”, Phys. Today 47,
June 1994, pp. 9–11 ; “Quantum mysteries refined”, Am. J. Phys. 62,
880–887 (1994).
[283] S. Kochen and E.P. Specker, “The problem of hidden variables in quan-
tum mechanics”, J. Math. Mech. 17, 59–87 (1967).
[286] A.A. Klyachko, M.A. Can, S. Binicioglu and A.S. Shumovsky, “Simple
tests for hiddden variables in spin-1 systems”, Phys. Rev. Lett. 101,
020403 (2008).
[288] N.D. Mermin, “Simple unified form for the major no-hidden-variables
theorems”, Phys. Rev. Lett. 65, 3373 (1990).
[292] Y.-F. Huang, C.-F. Li, Y.-S. Zhang, J.-W. Pan and G.-C. Guo, “Ex-
perimental test of the Kochen–Specker theorem with single photons”,
Phys. Rev. Lett. 90, 250401 (2003).
[296] O. Moussa, C.A. Ryan, D.G. Gory and R. Laflamme, “Testing contex-
tuality on quantum ensembles with one clean qubit”, Phys. Rev. Lett.
104, 160501 (2010).
[297] P. Grangier, “Contextual objectivity : a realistic interpretation
of quantum mechanics”, Eur. J. Phys. 23, 331–337 (2002) ; or
arXiv:quant-ph/0012122 (2000); quant-ph/0111154 (2001), quant-
ph/0301001 (2003) et quant-ph/0407025 (2004).
[298] N. Harrigan and R.W. Spekkens, “Einstein, incompleteness, and the
epistemic view of quantum states”, Found. Phys. 40, 125-157 (2010).
[299] M.S. Leifer, “Is the quantum state real ? An extended review of
ψ-ontology theorems”, Quanta 3, 67-155 (2014) ;
arXiv:1409.1570 [quant-ph]; voir également:
http://mattleifer.info/2011/11/20/can-the-quantum-state-be-
interpreted-statistically.
[300] Y. Aharonov, J. Anandan and L. Vaidman, “Meaning of the wave func-
tion”, Phys. Rev. A 47, 4616–4626 (1993).
[301] W.G. Unruh, “Reality and measurement of the wave function”, Phys.
Rev. A 50, 882–887 (1993).
[302] M.F. Pusey, J. Barrett and T. Rudolph, “On the reality of the quantum
state”, Nature Physics 8, 475-478 (2012) ; “The quantum state cannot
be interpreted statistically”, arXiv:1111.3328 [quant-phys] (2011).
[303] R. Colbeck and R. Renner, “Is a system’s wave function in one-to-one
correspondence with its elements of reality ?”, Phys. Rev. Lett. 108,
150402 (2012) ; arXiv:1111.6597 [quant-ph] (2011).
[304] M. Schlosshauer and A. Fine, “Implications of the Pusey-Barrett-
Rudolph non-go theorem”, Phys. Rev. Lett. 108, 260404 (2012).
[305] P.G. Lewis, D. Jennings, J. Barrett and T. Rudolph, “Distinct quantum
states can be compatible with a single state of reality”, Phys. Rev. Lett.
109, 150404 (2012).
[306] L. Hardy, “Are quantum states real ?”, Int. J. Mod. Phys. 27, 1345012
(2013) ; arXiv:1205.1439 [quant-phys] (2012) .
[307] J. Barrett, E.G. Cavalcanti, R. Lal and O.J.E. Maroney, “No ψ-
epistemic model can fully explain the indistinguishability of quantum
states”, Phys. Rev. Lett. 112, 250403 (2014).
[308] C. Branciard, “How ψ-epistemic models fail at explaining the indistin-
guishability of quantum states”, Phys. Rev. Lett. 113, 020409 (2014).
Bibliographie 557
[312] K.Y. Liao, X.D. Zhang, G.Z. Guo, B.Q. Ai, H. Yan and S.L. Zhu,
“Experimental test of the non-go theorem for continuous ψ-epistemic
models”, Nature, scientific reports 6, 26519 (2016).
[322] A. Peres, “Separability criterion for density matrices”, Phys. Rev. Lett.
77, 1413–1415 (1996).
558 Bibliographie
[325] Q.A. Turchette, C.S. Wood, B.E. King, C.J. Myatt, D. Leibfried,
W.M. Itano, C. Monroe and D.J. Wineland, “Deterministic entangle-
ment of two trapped ions”, Phys. Rev. Lett. 81, 3631–4 (1998).
[326] J.I. Cirac and P. Zoller, “Quantum computations with cold trapped
ions”, Phys. Rev. Lett. 74, 4091–4094 (1995).
[336] L. Isenhower, E. Urban, X.L. Zhang, A.T. Gill, T. Henage, T.A. Hohn-
son, T.G. Walker and M. Saffman, “Demonstration of a neutral atom
controlled-NOT quantum gate”, Phys. Rev. Lett. 104, 010503 (2010).
[339] L’usage de ces mots a été suggéré par Roger Balian lors d’une conver-
sation privée.
[341] J.F. Poyatos, J.I. Cirac and P. Zoller, “Quantum reservoir engineering
with laser cooled trapped ions”, Phys. Rev. Lett. 77, 4728–4731 (1996).
[345] W. Happer, “Optical pumping”, Rev. Mod. Phys. 44, 169-250 (1966).
[351] R.P. Feynman and F.L. Vernon, “The theory of a general quantum
system interacting with a linear dissipative system”, Ann. Phys. 24,
181–173 (1963).
[353] A.J. Leggett, S. Chakravarty, A.T. Dorsey, M.P.A. Fisher, A. Garg and
W. Zwerger, “Dynamics of the dissipative two state system”, Rev. Mod.
Phys. 59, 1–86 (1987).
[354] N.V. Prokof’ev and P.C.E. Stamp, “Theory of the spin bath”, Rep.
Prog. Phys. 63, 669-726 (2000).
[355] P.C.E. Stamp, “The decoherence puzzle”, Studies Hist. Phil. Mod. Phys.
37, 467-497 (2006).
[356] A. Hagar, “Decoherence : the view from the history and philosophy of
science”, Philo. Trans. Royal Soc. A 270, 4594-4609 (2012).
[358] C.H. van der Wal, A.C.J. ter Haar, F.K. Wilhelm, R.N. Schouten,
C.J.P.M. Harmans, T.P Orlando, S. Lloyd and J.E. Mooij, “Quantum
superposition of macroscopic persistent-current states”, Science 290,
773-777 (2000).
Bibliographie 561
[360] S. Takahashi, I.S. Tupitsyn, J. van Tol, C.C. Beedle, D.N. Hendrick-
son and P.C.E. Stamp, “Decoherence in crystals of quantum molecular
magnets”, Nature 476, 76-79 (2011).
[363] C.H. Bennett, D.P. DiVincenzo, J.A. Smolin and W.K. Wootters,
“Mixed-state entanglement and quantum error correction”, Phys. Rev.
A 54, 3824–3851 (1996).
[365] S. Haroche and J.-M. Raimond, Exploring the Quantum ; Atoms, Ca-
vities and Photons, Oxford University Press (2008).
[367] W.K. Wootters and W.H. Zurek, “A single quantum cannot be cloned”,
Nature 299, 802–803 (1982).
[373] Y. Aharonov, D.Z. Albert and L. Vaidman, “How the result of a mea-
surement of a component of the spin of a spin-1/2 particle can turn
out to be 100”, Phys. Rev. Lett. 60, 1351–1354 (1988).
[377] A. Peres, “How the no-cloning theorem got its name”, Fortschritte der
Phys. 51, 458–461 (2003).
[385] P. Townsend, J.G. Rarity and P.R. Tapster, “Single photon interference
in a 10 km-long optical fiber interferometer”, Electron. Lett. 29, 634–
635 (1993).
Bibliographie 563
[392] T. Sudbury, “The fastest way from A to B”, Nature 390, 551–552
(1997).
[395] X.M. Jin, J.G. Ren, B. Yang, Z.H. Yi, F. Zhou, X.F. Xu, S.K. Wang,
D. Yang, Y.F. Hu, S. Jiang, T. Yang, H. Yin, K. Chen, C.Z. Peng and
J.W. Pan, “Experimental free-space quantum teleportation”, Nature
Photonics 4, 376–381 (2010).
[398] C.H. Bennett and D.P. DiVincenzo, “Quantum information and com-
putation”, Science 404, 247–255 (2000).
564 Bibliographie
[402] M.A. Nielsen and I.L Chuang, Quantum Computation and Quantum
Information, Cambridge University Press (2011).
[407] N.D. Mermin, “What has quantum mechanics to do with factoring ?”,
Phys. Today 60, 8–9 (April 2007) ; “Some curious facts about quantum
factoring”, Phys. Today 60, 10–11 (October 2007).
[411] A.W. Harrow, A. Hassidim and S. Lloyd, “Quantum algorithm for linear
systems of equations”, Phys. Rev. Lett. 103, 150502 (2009).
[414] N. Xu, J. Zhu, D. Lu, X. Zhou, X. Peng and J. Du, “Quantum factoriza-
tion of 143 on a dipolar-coupling nuclear magnetic resonance system”,
Phys. Rev. Lett. 108, 130501 (2012) ; see also Phys. Rev. Lett. 109,
269902 (2012).
[417] A.M. Steane, “Error correcting codes in quantum theory”, Phys. Rev.
Lett. 77, 793–796 (1996).
[420] S.J. Devitt, W.J. Munro and K. Nemoto, “Quantum error correction
for beginners”, Rep. Progr. Phys. 76, 07001 (35 pages) (2013).
[421] B.M. Terhal, “Quantum error correction for quantum memories”, Rev.
Mod. Phys. 87, 307–343 (2015).
[424] C.H. Bennett, D.P. DiVincenzo, J.A. Smolin and W.A. Wootters,
“Mixed-state entanglement and quantum error correction”, Phys. Rev.
A 54, 3824–3851 (1996).
[425] H.J. Briegel, W. Dür, J.I. Cirac and P. Zoller, “Quantum repeaters : the
role of imperfect local operations in quantum communication”, Phys.
Rev. Lett. 81, 5932–5935 (1998).
[426] R.B. Griffiths and Chi-Sheng Niu, “Semiclassical Fourier transform for
quantum computation”, Phys. Rev. Lett. 76, 3228–3231 (1996).
[427] F. Verstraete, M.M. Wolf and J.I. Cirac, “Quantum computation and
quantum-state engineering driven by dissipation”, Nature Physics 5,
633–636 (2009).
[428] I. Cirac and P. Zoller, “Goals and opportunities in quantum simulation”,
Nature Physics 8, 264–266 (2012).
[429] I. Buluta and F. Nori, “Quantum simulators”, Science 326, 108–111
(2009).
[430] J.D. Biamonte, V. Bergholm, J.D. Whitfield, J. Fitzsimons and
A. Aspuru-Guzik, “Adiabatic quantum simulators”, AIP Advances 1,
022126 (2011).
[431] I.M. Georgescu, S. Ashab and F. Nori, “Quantum simulation”, Rev.
Mod. Phys. 86, 153–185 (2014).
[432] P. Hauke, F.M. Cucchiette, L. Tagliacozzo, I. Deutsch and M. Lewen-
stein, “Can one trust quantum simulators ?”, Rep. Progr. Phys. 75,
082401 (2012).
[433] M. Greiner, O. Mandel, T. Esslinger, T.W. Hänsch and I. Bloch, “Quan-
tum phase transition from a superfluid to a Mott insulator in a gas of
ultracold atoms”, Nature 415, 39–44 (2002).
[434] X. Peng, J. Zhang, J. Du and D. Suter, “Quantum simulation of a
system with competing two- and three-body interactions”, Phys. Rev.
Lett. 103, 140501 (2009).
[435] J.Q. You and F. Nori, “Quantum information”, Physics Today 58, 42-
47 (2005) ; “Atomic physics and quantum optics using superconducting
circuits”, Nature 474, 589-597 (2011).
[436] B.P. Lanyon, J.D. Whitfield, G.G. Gillett, M.E. Goggin, M.P. Almeida,
I. Kassal, J.D. Biamonte, M.Mohseni, B.J. Powell, M. Barbieri, A.
Aspuru-Guzik and A.G. White, “Towards quantum chemistry on a
quantum computer”, Nature Chemistry 2, 106-111 (2010).
Bibliographie 567
[438] P. Grangier, J.A. Levenson and J.P. Poizat, “Quantum non demolition
measurements in optics”, Nature 396, 537–542 (1998).
[440] W.H. Zurek, “Pointer basis of quantum apparatus : into what mixture
does the wave packet collapse ?”, Phys. Rev. D 24, 1516–1525 (1981) ;
“Environment-induced superselection rules”, Phys. Rev. D 26, 1862–
1880 (1982).
[441] W.H. Zurek, “Decoherence, einselection, and the quantum origin of the
classical”, Rev. Mod. Phys. 75, 715–775 (2003).
[443] J.S. Bell, “On wave packet reduction in the Coleman-Hepp model”,
Helv. Phys. Acta 48, 93–98 (1975) ; reproduit dans [6].
[447] F. Hund, “Zur Deutung der Molekelspektren III”, Zeit. Phys. 43, 805–
826 (1927).
[448] J. Trost and K. Hornberger, “Hund’s paradox and the collisional stabi-
lization of chiral molecules”, Phys. Rev. Lett. 103, 023202 (2009).
[459] D.R. Solli, C.F. McCormick, R.Y. Chiao, S. Popescu and J.M. Hick-
mann, “Fast light, slow light, and phase singularities : a connection to
generalized weak values”, Phys. Rev. Lett. 92, 043601 (2004).
[461] G.J. Pryde, J.L. O’Brien, A.G. White, T.C. Ralph and H.M. Wiseman,
“Measurement of quantum weak values of photon polarization”, Phys.
Rev. Lett. 94, 220405 (2005).
[462] R. Mir, J.S. Lundeen, M.W. Mitchell, A.M. Steinberg, J.L. Garret-
son and H.M. Wiseman, “A double slit ‘which way’ experiment on the
complementarity-uncertainty debate”, New. J. Phys. 9, 287–297 (2007).
[463] J.S. Lundeen and A.M. Steinberg, “Experimental joint weak measure-
ment on a photon pair as a probe of Hardy’s paradox”, Phys. Rev. Lett.
102, 020404 (2009).
Bibliographie 569
[465] P. Ben Dixon, D.J. Starling, A.N. Jordan and J.C. Howell, “Ultra-
sensitive beam deflection measurement via interferometric weak va-
lue amplification”, Phys. Rev. Lett. 102, 173601 (2009). D.J. Starling,
P. Ben Dixon, A.N. Jordan and J.C. Howell, “Optimizing the signal-
to-noise ratio of a beam-deflection measurement with interferometric
weak values”, Phys. Rev. A80, 041803 (2009).
[467] N.S. Williams and A.N. Jordan, “Weak values and the Leggett-Garg
inequality in solid-state qubits”, Phys. Rev. Lett. 100, 026804 (2008).
[471] N. Gisin, “Irreversible quantum dynamics and the Hilbert space struc-
ture of quantum dynamics”, J. Math. Phys. 24, 1779–1782 (1983).
[476] N.F. Mott, “The wave mechanics of α-ray tracks”, Proc. Royal Soc.
A 126, 79–84 (1929) ; reproduit dans “Quantum theory of measure-
ment”, J.A. Wheeler and W.H. Zurek eds., Princeton University Press
(1983), pp. 129–134.
[479] J.C. Bergquist, R.G. Hulet, W.M. Itano and D.J. Wineland, “Observa-
tion of quantum jumps in a single atom”, Phys. Rev. Lett. 57, 1699–1702
(1986).
[480] W.M. Itano, J.C. Bergquist, R.G. Hulet and D.J. Wineland, “Radiative
decay rates in Hg+ from observation of quantum jumps in a single ion”,
Phys. Rev. Lett. 59, 2732–2735 (1987).
[481] E. Schrödinger, “Are there quantum jumps ?”, British J. Phil. Sci. 3,
109–123 and 233–242 (1952).
[482] G. Greenstein and A.G. Zajonc, “Do quantum jumps occcur at well-
defined moments of time ?”, Am. J. Phys. 63, 743–745 (1995).
[508] M. Smerlak and C. Rovelli, “Relational EPR”, Found. Phys. 37, 427–
445 (2007).
[509] C.M. Caves, C.A. Fuchs and R. Schack, “Subjective probability and
quantum certainty”, Stud. Hist. Phil. Mod. Phys. 38, 255-274 (2007).
[513] F. Zwicky, “On a new type of reasoning and some of its possible conse-
quences”, Phys. Rev. 43, 1031–1033 (1933).
Bibliographie 573
[524] J.S. Bell, “A new approach to quantum logic”, Brit. J. Phil. Sci. 37
83–99 (1986).
[529] I.M. Gelfand and M.A. Naimark, “On the embedding of normed rings
into the ring of operators in Hilbert space”, Mat. Sbornik 12, 197–213
(1943).
[530] I.E. Segal, “Irreductible representations of operator algebras”, Bull.
Amer. Math. Soc. 61, 69–105 (1947) ; “Postulates for general quantum
mechanics”, Ann. Math. 48, 930–948 (1947).
[531] R. Haag and D. Kastler, “An algebraic approach to quantum field
theory”, J. Math. Phys. 7, 848–861 (1964).
[532] F.J. Murray and J. von Neumann, “On rings of operators”, Ann. Math.
37, 116–229 (1936).
[533] A. Connes, “Une classification des facteurs du type III”, Ann. Sci. Ecole
Norm. Sup. 6, 133–252 (1973).
[534] A. Connes, Noncommutative Geometry, Academic Press (1994).
[535] G. Mackey, The Mathematical Foundations of Quantum Mechanics,
Benjamin, New York and Amsterdam (1963).
[536] C. Piron, “Axiomatique quantique”, Helv. Phys. Acta 37, 439–468
(1964).
[537] J.M. Jauch and C. Piron, “On the structure of quantal proposition
systems”, Helv. Phys. Acta 42, 842–848 (1969).
[538] M.P. Solèr, “Characterization of Hilbert spaces by orthomodular
spaces”, Comm. Algebra 23, 219–243 (1995).
[539] B. Coecke and E.O. Paquette, “Categories for the practicing physicist”,
arXiv:0905.3010v2 [quant-ph] ; in New Structures for Physics, Sprin-
ger (2011), pp. 173–286.
[540] B. Coecke, “Quantum picturalism”, Contemp. Phys. 51, 59–83 (2010).
[541] H. Barnum and A. Wilce, “Information processing in convex operational
theories”, Electronic Notes in Theor. Computer Sci. 12, 3–15 (2011).
[542] A. Wilce, “Quantum logic and probability theory”, Stanford ency-
clopedia of philosophy (2008), http ://plato.stanford.edu/entries/qt-
quantlog/.
[543] A.M. Gleason, “Measures on the closed subspaces of a Hilbert space”,
J. Math. and Mech. 6, 885–893 (1957).
[544] P. Bush, “Quantum states and generalized observables : a simple proof
of Gleason’s theorem”, Phys. Rev. Lett. 91, 120403 (2003).
Bibliographie 575
[547] M. Gell-Mann and J.B. Hartle, “Classical equations for quantum sys-
tems”, Phys. Rev. D 47, 3345–3382 (1993).
[549] R.B. Griffiths and R. Omnès, “Consistent histories and quantum mea-
surements”, Phys. Today 52, 26–31 (August 1999).
[559] J.S. Bell, “Are there quantum jumps ?”, in Schrödinger–Centenary Cele-
bration of a Polymath, C.W. Kilmister ed., Cambridge University Press
(1987), p. 41 ; voir aussi le Chapitre 22 de [6].
[560] J.S. Bell, “Beables for quantum field theory”, CERN-TH.4035/84 (Au-
gust 2 1984) ; Phys. Rep. 137, 49–54 (1986) ; Chapitre 19 de [6].
[575] J.S. Bell, “De Broglie–Bohm, delayed choice double slit experiment,
and density matrix”, International Journal of Quantum Chemistry 18,
supplement symposium 14, 155–159 (1980) ; Chapitre 14 de [6].
[576] B.J. Hiley, “Welcher Weg experiments from the Bohm perspective”,
contribution à la conférence de Växjö (2005),
http ://www.bbk.ac.uk/tpru/BasilHiley/WelcherWegBohmBJH2.pdf.
[585] T. Nikuni and J.E. Williams, “Kinetic theory of a spin 1/2 Bose-
condensed gas”, J. Low Temperature Phys. 133, 323-374 (2003).
578 Bibliographie
[592] S. Colin and W. Struyve, “A Dirac sea pilot-wave model for quantum
field theory”, J. Phys. A Math. Theor. 40, 7309-7341 (2007).
[595] W. Struyve, “Field beables for quantum field theory”, Rept. Prog. Phys.
73, 106001 (2010) ; arXiv:0707.3685v2 [quant-ph] (2007).
[601] D. Bohm and J.P. Vigier, “Model of the causal interpretation of quan-
tum theory in terms of a fluid with irregular fluctuations”, Phys. Rev.
96, 208–216 (1954).
[604] M.D. Towler, N.J. Russel and A. Valentini, “Time scales for dynamical
relaxation to the Born rule”, Proc. Royal Soc. A 468, 990-1013 (2015).
[606] M.O. Scully, “Do Bohm trajectories always provide a trustworthy phy-
sical picture of particle motion ?”, Phys. Scripta T 76, 41-46 (1998).
[640] L. Diosi, “Quantum stochastic processes as models for state vector re-
duction”, J. Phys. A 21, 2885–2898 (1988).
[643] P. Pearle, “How stands collapse I”, J. Phys. A : Math. Theor. 40, 3189–
3204 (2007).
[644] P. Pearle, “On the time it takes a state vector to reduce”, J. Stat. Phys.
41, 719–727 (1985).
[645] A. Barchielli, L. Lanz and G.M. Prosperi, “A model for the macroscopic
description and continual observations in quantum mechanics”, Nuov.
Cim. 42 B, 79–121 (1982).
[656] L.F. Santos and C.O. Escobar, “A proposed solution to the tail problem
of dynamical reduction models”, Phys. Lett. A 278, 315–318 (2001).
[660] R. Penrose, The Emperor’s New Mind, Oxford University Press (1989) ;
Shadows of the Mind, Oxford University Press (1994).
[673] P. Pearle, J. Ring, J.I Collar and F.T. Avignone, “The CSL collapse
model and spontaneous radiation : an update”, Found. Phys. 29, 465–
80 (1998).
[674] H.S. Miley, F.T. Avignone, R.L. Brodzinski, J.I. Collar and J.H. Reeves,
“Suggestive evidence for the two-neutrino double-β decay of 76 Ge”,
Phys. Rev. Lett. 65, 3092–3095 (1990).
[675] F. Laloë, W. Mullin and P. Pearle, “Heating of trapped ultracold atoms
by collapse dynamics”, Phys. Rev. A 90, 052119 (2014).
[676] K. Hornberger, S. Gerlich, P. Haslinger, S. Nimmrichter and M. Arndt,
“Quantum interference of clusters and molecules”, Rev. Mod. Phys. 84,
157–173 (2012).
[677] A. Bassi, K. Lochan, S. Satin, T.P. Singh and H. Ulbricht, “Models of
wave-function collapse, underlying theories, and experimental tests”,
Rev. Mod. Phys. 85, 471-527 (2013).
[678] G.C. Ghirardi, “Quantum superpositions and definite perceptions : en-
visaging new feasible tests”, Phys. Lett. A 262, 1–14 (1999).
[679] J. Dalibard, Y. Castin and K. Mølmer, “Wave function approach to
dissipative processes in quantum optics”, Phys. Rev. Lett. 68, 580–583
(1992).
[680] K. Mølmer, Y. Castin and J. Dalibard, “Monte Carlo wave-function
method in quantum optics”, Journ. Optical. Soc. Am. B 10, 524–538
(1993).
[681] H.J. Carmichael, An Open System Approach to Quantum Optics, Lec-
tures notes in Physics, monograph 18, Springer-Verlag (1993).
[682] M.B. Plenio and P.L. Knight, “The quantum-jump approach to dis-
sipative dynamics in quantum optics”, Rev. Mod. Phys. 70, 101–141
(1998).
[683] N. Gisin and I.C. Percival, “The quantum-state diffusion model applied
to open systems”, J. Phys. A 25, 5677–5691 (1992) ; “Quantum state
diffusion, localization and quantum dispersion entropy”, 26, 2233–2243
(1993) ; “The quantum state diffusion picture of physical processes”, 26,
2245–2260 (1993).
[684] I.C. Percival, Quantum State Diffusion, Cambridge University Press
(1998).
[685] F. Laloë, “Modified Schrödinger dynamics with attractive densities”,
Eur. Phys. J. D 69, 162 (2015).
586 Bibliographie
[691] D. Deutsch, “The structure of the multiverse”, Proc. Roy. Soc. London
A 458, 2911–2923 (2002).
[692] A. Kent, “Against many world interpretations”, Int. Journ. Mod. Phys
A 5, 1745–1762 (1990).
[693] P. Van Esch, “On the Born rule and the Everett programme”, Ann.
Fond. Louis de Broglie 32, 51–59 (2007).
[695] M.A. Rubin, “Relative frequency and probability in the Everett inter-
pretation of Heisenberg–picture quantum mechanics”, Found. Phys. 33,
379–405 (2002).
[706] J.S. Bell, “The measurement theory of Everett and de Broglie’s pilot
wave”, in Quantum Mechanics, Determinism, Causality, and Particles,
M. Flato et al. eds., Dordrecht-Holland, D. Reidel (1976), pp. 11–17 ;
chapitre 11 de l’édition 2004 de [6].
[708] M.H. Anderson, J.R. Ensher, M.R. Matthews, C.E. Wieman and
E.A. Cornell, “Observation of Bose–Einstein condensation in a dilute
atomic vapor”, Science 269, 198–201 (1995).
[709] K.B. Davis, M.-O. Mewes, M.R. Andrews, N.J. van Druten, D.S. Dur-
fee, D.M. Kurn and W. Ketterle, “Bose–Einstein condensation in a gas
of sodium atoms”, Phys. Rev. Lett. 75, 3969–3973 (1995).