Mathematics">
Nothing Special   »   [go: up one dir, main page]

Transformation de Lorentz

Télécharger au format pdf ou txt
Télécharger au format pdf ou txt
Vous êtes sur la page 1sur 89

RELATIVITÉ RESTREINTE

ET

THÉORIE CLASSIQUE DES CHAMPS

LE MINIMUM THÉORIQUE

LEONARD SUSSKIND ET ART FRIEDMAN

Traduit de l’anglais par André Cabannes


Table des matières

Préface i
Introduction iv
Leçon 1 Transformation de Lorentz 1
Leçon 2 Vélocités et quadrivecteurs 89
Leçon 3 Lois relativistes du mouvement 109
Leçon 4 Théorie classique des champs 156
Leçon 5 Particules et champs 214
Interlude Constantes et unités 262
Leçon 6 Loi de la force de Lorentz 276
Leçon 7 Principes fondamentaux
et invariance de jauge 347
Leçon 8 Équations de Maxwell 365
Leçon 9 Conséquences physiques
des équations de Maxwell 409
Leçon 10 De Lagrange à Maxwell 439
Leçon 11 Champs et mécanique classique 472
Appendice A Les monopoles magnétiques
existent-ils ? 521
Appendice B Révision des opérateurs
sur les trivecteurs 539
Index 546
Leçon 1 : Transformation de Lorentz

La théorie de la relativité restreinte est avant tout une théo-


rie des repères dans l’espace – ou plus exactement dans
l’espace-temps. Le nom consacré pour un repère dans l’espa-
ce-temps est référentiel. Et nous allons étudier différents
référentiels en mouvement les uns par rapport aux autres.
Si nous affirmons qu’un phénomène du monde physique est
vrai dans un référentiel, l’est-il encore dans un autre ? Est-
ce qu’une observation faite par une personne immobile par
rapport au sol reste valide pour une autre personne pas-
sant en avion ? Existe-t-il des quantités ou des affirmations
qui soient invariantes – c’est-à-dire ne dépendent pas du
référentiel de l’observateur ? Les réponses aux questions de
ce genre s’avèrent intéressantes et surprenantes. En fait,
elles ont déclenché une révolution en physique au début du
XXe siècle.

1
1.1 Référentiels
Vous connaissez déjà les repères dans l’espace. J’en ai parlé
dans le Volume 1 sur la mécanique classique. La plupart des
gens sont familiers avec les coordonnées cartésiennes dans
le plan ou dans l’espace. Un repère cartésien dans l’espace à
trois dimensions est un système de coordonnées consistant
en un point origine et trois axes perpendiculaires permet-
tant de noter les trois coordonnées spatiales x, y et z de
n’importe quel point. Si vous voulez y penser concrètement,
imaginez une grande salle parallélépipédique, mettons une
cafétéria. Vous êtes à la porte qui est dans le coin à gauche,
et la pièce s’ouvre devant vous. Un repère possible est le
suivant : l’origine est précisément le coin en bas à gauche
à vos pieds, l’axe horizontal des x part le long du mur sur
votre droite, l’autre axe horizontal perpendiculaire, celui
des y, part devant vous le long des baies vitrées, et l’axe
des z est vertical au dessus de l’origine. Alors n’importe
quel point dans la salle est repéré par ses trois coordon-
nées. Par exemple, l’assiette qui vous attend sur la table
avec vos amis peut être à x = 5 mètres, y = 16 mètres et
z = 0, 8 mètres. Pensez que vous avez à votre disposition
des bâtons gradués de 1 mètre de long pour mesurer les dis-
tances le long des trois axes. Alors avec les trois nombres
caractérisant la position de votre assiette, vous savez exac-
tement où aller. Bien sûr on pourrait construire un autre
repère avec une autre origine, d’autres axes et une autre
unité. Mais ça ne changerait rien ni à la salle ni aux points
dans celle-ci. Votre assiette resterait au même endroit, sim-
plement ses coordonnées changeraient. Voilà ce qu’est un
repère dans l’espace. Il nous permet de spécifier où quelque
chose se trouve.
Afin de spécifier quand un événement a lieu nous avons
besoin aussi d’une coordonnée temporelle. Un référentiel

2
est un système de coordonnées pour l’espace et le temps
– ce qu’on appelle l’espace-temps. Il consiste en trois axes
dans l’espace définissant les trois coordonnées spatiales x,
y et z et un axe dans le temps définissant la coordonnée
temporelle t. Le référentiel comporte aussi une origine dans
l’espace et le temps : le point (0, 0, 0) dans l’espace consi-
déré à une certaine date notée 0 1 . Nous pouvons étoffer
notre exemple concret de repère dans notre cafétéria en
imaginant qu’en chaque point de l’espace il y a une hor-
loge, et qu’on les a toutes synchronisées. À chaque instant
elles marquent toutes exactement la même heure. Voilà ce
qu’est un référentiel dans l’espace-temps : un système de co-
ordonnées x, y, z et t permettant de spécifier où et quand
un événement a lieu.
En français courant le mot événement signifie "quelque
chose de notable qui se passe ou s’est passé quelque part".
Mais en théorie de la relativité c’est simplement le nom
donné un point dans l’espace à une date donnée. En d’autres
termes, un point a trois coordonnées spatiales (x, y, z), et
un événement a quatre coordonnées (x, y, z, t). On parle
aussi parfois pour un événement de point dans l’espace-
temps.
Nous avons beaucoup de liberté dans la façon de re-
pérer les points dans l’espace et le temps, c’est-à-dire de
construire un référentiel dans l’espace-temps. Nous pouvons
considérer différents référentiels. À partir de notre premier
référentiel, nous pouvons en fabriquer un deuxième simple-
ment en translatant l’origine x = y = z = t = 0 en un
autre point, ce qui produira de nouvelles coordonnées des
événements dans l’espace-temps. Noter encore une fois que

1. Nous appellerons les différentes valeurs possibles de t des dates,


des temps ou des instants. La différence entre deux dates sera appelée
un intervalle de temps ou une période.

3
ça ne déplace pas les événements eux-mêmes dans l’espace-
temps. Nous pouvons aussi opérer une rotation des axes.
Enfin – quelque chose de moins intuitif mais qui va ouvrir
beaucoup de perspectives –, nous pouvons aussi considérer
des repères en mouvement les uns par rapport aux autres.
Nous pouvons parler de votre référentiel et de mon référen-
tiel. Cela nous amène à un point important : en plus de ses
axes et de son origine, à un référentiel peut être associé un
observateur. Celui-ci utilisera les bâtons de 1 mètre et les
horloges de son référentiel pour faire des mesures.
Nous avons tendance à considérer qu’il y a bien sûr un
référentiel de base qui ne bouge pas dans l’espace, et que
les autres bougent. Par exemple la cafétéria "évidemment"
ne bougeait pas. Mais nous allons devoir abandonner cette
idée qu’il y a un référentiel plus fondamental que les autres.
En fait, pour chacun d’entre nous, il y a simplement notre
référentiel et les autres référentiels. Si au lieu de la cafété-
ria, nous étions dans la voiture-restaurant d’un train, celle-
ci serait alors le référentiel qui ne bouge pas pour nous,
tout simplement car c’est le nôtre. C’est pourquoi je parle-
rai désormais de mon référentiel et de votre référentiel. Ce
ne seront pas nécessairement les mêmes. Et en dépit des
apparences il n’y en aura pas un plus fixe que l’autre.
Imaginez que vous soyez assis dans une salle de classe,
sur un siège de la première rangée face à l’estrade. La salle
est remplie d’horloges et de bâtons de 1 mètre permet-
tant de mesurer la distance entre n’importe quelle paire
de points. C’est votre référentiel. À tous les événements qui
ont lieu dans la salle sont assignées une position et une date
par vos bâtons de 1 mètre et vos horloges.
Je suis aussi dans la salle, sur l’estrade, mais au lieu
de rester immobile par rapport aux murs de la salle je me
déplace. Je peux aller et venir de gauche à droite et de

4
droite à gauche devant vous. Je transporte avec moi mon
propre référentiel avec ses bâtons de 1 mètre et ses horloges
au repos pour moi.
À chaque instant, je suis au centre de mon propre sys-
tème de coordonnées spatiales, et vous êtes au centre du
vôtre. Clairement nos deux systèmes de coordonnées ne sont
pas les mêmes. À un événement dans l’espace-temps – par
exemple une ampoule qui s’allume quelque part, ou moi
qui me gratte le nez à un moment précis – vous assignez
certaines coordonnées x, y, z et t. Et au même événement
j’assigne d’autres coordonnées x0 , y 0 , z 0 et t0 . C’est la consé-
quence du fait que je bouge par rapport à vous. En parti-
culier si je me déplace le long de votre axe des x, et qu’il
est aligné avec mon propre axe des x0 , vos coordonnées x
et mes coordonnées x0 des événements ne seront pas les
mêmes. Par exemple je dirai toujours que mon nez est à la
coordonnée x0 = 12, 5, signifiant qu’il est à 12,5 centimètres
du centre de ma tête, tandis que vous ne direz pas que sa
coordonnée est x = 12, 5 ; vous direz que mon nez bouge et
que sa coordonnée x change avec le temps.
Je peux me gratter le nez au temps t0 = 2, signifiant
que l’horloge qui se trouve au bout de mon nez, parmi les
horloges de mon système, indique 2 secondes après le début
de la leçon au moment où je fais cela. Vous pourriez être
tenté de penser que l’horloge de votre système, devant la-
quelle passe mon nez quand je le gratte, marque aussi t = 2.
Mais c’est précisément là que la théorie de la relativité res-
treinte s’éloigne de la physique newtonienne. L’hypothèse
que toutes les horloges de tous les référentiels puissent être
synchronisées semble intuitivement évidente. Pourtant elle
est contradictoire avec l’hypothèse d’Einstein de la rela-
tivité du mouvement et de l’universalité de la vitesse de
lumière avec la valeur c = 3 × 108 mètres par seconde.

5
Nous allons bientôt examiner plus en détail comment,
et à quelle condition, les horloges à différents endroits dans
différents référentiels peuvent être synchronisées. Pour l’ins-
tant considérons qu’à n’importe quel instant toutes les hor-
loges de votre système marquent le même temps t. Et consi-
dérons que cela est vrai aussi dans mon système, où toutes
les horloges marquent le même temps t0 . Enfin faisons l’hy-
pothèse que t = t0 . Cela veut dire que tous les événements
– qui, rappelez-vous, sont intrinsèques et n’ont rien à voir
avec les référentiels – sont repérés avec la même date dans
les deux référentiels. En d’autres termes, nous suivons tem-
porairement Newton et admettons qu’il existe un temps
universel qui est exactement le même pour vous et pour
moi, et qu’il n’y a pas d’ambiguïté résultant de notre mou-
vement l’un par rapport à l’autre.

1.2 Référentiels inertiels (ou galiléens)


Les lois de la physique seraient très difficiles à énoncer sans
un système de coordonnées pour repérer les événements
qui se déroulent 2 . Nous utiliserons souvent le terme label-
liser au lieu de repérer pour insister sur le fait qu’il s’agit
d’une nomenclature plus ou moins artificielle, comme des
étiquettes sur une collection de peluches sur une étagère.
Les coordonnées sont simplement des labels, utiles pour
nommer, repérer, savoir de quoi on parle.
Il est vrai que les coordonnées habituelles sont des labels
construits à l’aide de considérations géométriques simples :
par exemple dans le plan depuis n’importe quel point on

2. Ici le mot événement est utilisé non plus dans son sens strict
de point (x, y, z, t) dans l’espace-temps, mais dans son acception
courante de chose qui se passe.

6
trace deux droites parallèles aux axes et ça nous donne
les coordonnées du point. Ça restera vrai en relativité res-
treinte où tous les référentiels ont des structures géomé-
triques simples linéaires. Mais ça n’est pas une nécessité.
En géométrie sphérique ce n’est plus le cas, ni en relativité
générale. Un système de labels doit juste être une bijection
entre des points d’un espace et des noms – avec lesquels
si possible on peut faire des calculs. Rappelez-vous, enfant,
quand vous vous demandiez peut-être comment on connais-
sait le nom des étoiles.
Comme nous l’avons vu, on peut construire plusieurs
systèmes de coordonnées et donc avoir plusieurs descrip-
tions différentes des mêmes événements. Ce que le concept
de relativité veut dire, pour Galilée et Newton comme pour
Einstein, est que les lois gouvernant ces événements sont
les mêmes dans tous les référentiels inertiels. Un référen-
tiel est dit inertiel, ou encore galiléen, si les particules sur
lesquelles aucune force externe ne s’exerce se déplacent en
ligne droite avec une vélocité uniforme quand on les re-
père avec les coordonnées spatiales et temporelle de ce ré-
férentiel. Il est évident que tous les référentiels ne sont pas
inertiels. Supposez que votre référentiel soit inertiel de telle
sorte qu’une particule, lancée à travers la pièce, se déplace
avec une vélocité uniforme quand on la mesure avec vos bâ-
tons de mesure et vos horloges 3 . Si je marche en faisant des
allers et retours sur l’estrade, la particule m’apparaîtra en
accélération lorsque je fais demi-tour. Mais quand je marche
en ligne droite à vitesse constante je verrai alors moi aussi
la particule se déplacer avec une vélocité uniforme. Ce que
nous pouvons dire d’une manière générale est que deux ré-
férentiels, s’ils sont chacun inertiel, ne peuvent se déplacer

3. On laisse de côté la gravitation qui sera traitée dans le cours


suivant sur la relativité générale.

7
l’un par rapport à l’autre autrement qu’avec un mouvement
uniforme de translation.
Les référentiels galiléens sont indistinguables du point
de vue des lois de la nature. Par exemple les lois de la
mécanique newtonienne, F = ma et la loi de l’attraction
gravitationnelle, ont exactement la même expression dans
tous les référentiels galiléens.
J’aime bien illustrer les repères galiléens de la manière
suivante. Supposez que je sois un jongleur accompli. J’ai dû
apprendre quelques lois pour savoir jongler, par exemple
que si je lance une balle verticalement vers le haut elle
retombera au même point d’où elle est partie. Imaginons
que j’aie appris à jongler sur un quai de gare en atten-
dant le train. Quand le train arrive et s’arrête en gare, je
monte dans le train et commence immédiatement à jongler
sans problème. Mais dès que le train se remet en route, les
lois que j’ai apprises ne marchent plus. Pendant un certain
temps les balles suivent des trajectoires bizarres, retombant
ailleurs que là où je les attends. Cependant, dès que train
atteint une vélocité uniforme, les lois du jonglage marchent
de nouveau. Si je suis dans un wagon de train sans fenêtre
et que mon repère est galiléen (c’est-à-dire que je peux jon-
gler), je ne peux absolument pas dire si le train est à l’arrêt
ou en marche en ligne droite à vitesse constante. Il faut
naturellement que la voie soit parfaitement lisse et droite
et qu’aucune vibration de roulement ne soit perceptible.
Rares sont ceux d’entre nous qui se sont trouvés dans un
wagon sans fenêtre, mais nous avons tous fait l’expérience
assis dans un train peu avant son départ de voir soudain le
train de la voie d’à côté se mettre en branle puis de réali-
ser qu’en fait c’était le nôtre qui venait de démarrer. Cela
suppose bien sûr qu’on n’aie ressenti aucun à-coup lié à sa
mise en mouvement, car en réalité nous avons forcément

8
subi une accélération.
Le principe de la relativité énonce que toutes les lois
de la physique ont des expressions identiques dans tous les
repères galiléens, car comme on vient de le voir rien ne les
distingue. Ce principe n’a pas été inventé par Einstein 4 ; il
existait avant lui et est généralement attribué à Galilée 5 .
Newton 6 ne l’a pas mentionné explicitement mais l’aurait
certainement reconnu. Alors qu’ajouta Einstein pour que
la relativité soit attachée à son nom ? Après les travaux de
Lorentz 7 , FitzGerald 8 , Poincaré 9 et quelques autres à la
fin du XIXe siècle qui s’efforcèrent de réconcilier la phy-
sique newtonienne avec le fait que la vitesse de la lumière
était toujours la même, il clarifia radicalement la situation
en énonçant que la vitesse de la lumière était une loi de
la physique et qu’en tant que telle elle devait être la même
dans tous les référentiels galiléens. Cela conduisit à un bou-
leversement de la notion de temps et d’espace qui est l’objet
de la première partie de ce livre : la théorie de la relati-
vité restreinte. Après la relativité restreinte, il appliqua un
principe comparable d’identification de deux phénomènes –
l’équivalence entre la force d’inertie liée à l’accélération et
un certain type de forces gravitationnelles – qui le condui-
sit à la théorie de la relativité générale qui n’est pas traitée
dans ce livre.
Comme nous l’avons vu la vitesse de lumière a la valeur
approximative c = 3 × 108 mètres par seconde. Mesurée en
mile par seconde, une unité parfois utilisée dans le monde
anglo-saxon, elle est d’environ 186 000, et mesurée en année-

4. Albert Einstein (1879-1955), physicien d’origine allemande.


5. Galileo Galilei (1564-1642), physicien et astronome italien.
6. Isaac Newton (1642-1727), mathématicien et physicien anglais.
7. Hendrik Lorentz (1853-1928), physicien néerlandais.
8. George FitzGerald (1851-1901), physicien irlandais.
9. Henri Poincaré (1854-1912), mathématicien français.

9
lumière par an elle est exactement de 1. Mais une fois que
des unités ont été choisies, la loi expliquée par Einstein
énonce que la vitesse de lumière est la même pour tous les
observateurs.
Quand vous combinez ces deux idées – que les lois de
la physique ont la même expression dans tous les référen-
tiels galiléens, et que c’est une loi de la physique que la
lumière se déplace avec une vélocité fixe –, vous parvenez à
la conclusion que la vitesse de la lumière doit être la même
dans tous les référentiels galiléens ou inertiels. C’est une
conclusion vraiment déconcertante. Elle conduisit certains
physiciens à rejeter totalement la relativité restreinte. Dans
les sections qui suivent, nous allons suivre la logique d’Ein-
stein et découvrir les unes après les autres les conséquences
de sa nouvelle loi.

1.2.1 Référentiels newtoniens


Dans cette section, je vais expliquer comment, avant la re-
lativité d’Einstein, Newton aurait décrit la relation entre
différents référentiels, et les conclusions qu’il en aurait ti-
rées sur le mouvement des rayons lumineux. Le postulat de
base de Newton était qu’il existait un temps universel, le
même dans tous les référentiels. En d’autres termes le même
événement, par exemple une ampoule qui s’allume quelque
part à un moment donné, pouvait avoir des coordonnées
spatiales différentes selon le référentiel utilisé, mais il avait
la même date dans tous les référentiels.
Commençons par ignorer les dimensions spatiales y et
z, qui ne rajoutent rien aux explications qui vont suivre,
et focalisons-nous sur la dimension spatiale x. Nous allons
prétendre que le monde n’a qu’une seule dimension spatiale

10
et que tous les observateurs peuvent se déplacer librement le
long de cette dimension, mais ne peuvent pas en sortir. Vous
pouvez penser à cette dimension comme ayant une forme
quelconque (sauf une boucle), mais la notion de forme d’un
espace à une dimension le plonge implicitement dans un
espace avec plus de dimensions 10 – ce que nous ne voulons
pas faire. Le plus simple est d’y penser comme à une droite.
Le monde a une seconde dimension, temporelle celle-ci, qui
est le temps t. La convention habituelle est de représenter
ce monde avec sa dimension spatiale horizontalement et sa
dimension temporelle verticalement, figure 1.1.

Figure 1.1 : Référentiels newtoniens.

Les axes horizontaux et verticaux sur la figure servent à


repérer la position et la date de n’importe quel événement
dans votre référentiel – le référentiel au repos par rapport

10. Ce n’est plus vrai pour un espace à deux dimensions ou plus,


qui peut avoir une forme intrinsèque autre qu’un plan ou un espace
euclidien plus vaste.

11
à la salle de classe. (Je vais arbitrairement appeler votre
référentiel le référentiel au repos, et le mien le référentiel en
mouvement.) Nous allons faire l’hypothèse que dans votre
référentiel la lumière se déplace avec sa vitesse standard c.
Un diagramme comme celui de la figure 1.1 est appelé
un diagramme d’espace-temps ou encore un diagramme de
Minkowski 11 . Vous pouvez y penser comme à une carte du
monde – une carte qui représente non seulement tous les
points du monde mais aussi à toutes les dates possibles. Si
un rayon lumineux est émis depuis l’origine vers la droite
sur l’axe spatial, sa trajectoire sur le diagramme sera don-
née par l’équation
x = ct

De même un rayon émis vers la gauche aura l’équation

x = −ct

Une vélocité négative veut simplement dire un mouvement


vers la gauche. Dans les différentes figures qui suivent je
vais aussi représenter mon propre référentiel se déplaçant
vers la droite avec une vitesse v (qui aura donc une valeur
positive). Comme exercice, vous pourrez étudier les chan-
gements dans les raisonnements et calculs ci-après si v a
une valeur négative.
Dans la figure 1.1, le rayon lumineux se déplaçant vers
la droite est la ligne pointillée. Si les unités pour les axes
étaient des mètres et des secondes, le rayon lumineux ap-
paraîtrait presque horizontal, car il se déplace de 3 × 108
11. D’après Hermann Minkowski (1864-1909), mathématicien alle-
mand qui contribua à la mathématisation de la théorie de la relativité
restreinte. Parfois dans le diagramme de Minkowski, l’axe vertical ré-
père non pas t mais ct. Mais cela ne change rien, tout particulièrement
quand les unités sont telles que c = 1.

12
mètres vers la droite chaque fois qu’il se déplace de une
seconde vers le haut sur l’axe vertical. Mais la valeur nu-
mérique de c dépend entièrement des unités choisies. C’est
pourquoi, il est commode d’utiliser d’autres unités pour la
vitesse de la lumière – des unités avec lesquelles on voit
mieux que le rayon lumineux a une certaine pente. Par la
suite nous utiliserons généralement des diagrammes où le
rayon lumineux vers la droite sera la diagonale à 45° car ça
donnera lieu à des propriétés géométriques simples. Mais ce
sera quand le temps ne sera plus universel...
Où êtes-vous sur le diagramme ? Au temps t = 0 vous
êtes à l’origine. Puis à mesure que le temps s’écoule vous
ne vous déplacez pas spatialement, mais vous suivez néan-
moins dans l’espace-temps une trajectoire : c’est la droite
verticale dont l’équation est x = 0. De même n’importe quel
point spatial fixe dans votre référentiel a pour trajectoire
une droite verticale. Et n’importe quel point qui se déplace
à vitesse constante dans votre référentiel a pour trajectoire
une droite inclinée. Exercice : si elle était plus inclinée que
la droite du rayon lumineux qu’est-ce que cela voudrait dire
sur sa vitesse ?
Ceci nous amène à mon référentiel que j’ai appelé le ré-
férentiel en mouvement. Mettons qu’au temps t = 0 nous
étions, vous et moi, au même point spatial. L’origine spa-
tiale de mon référentiel – c’est-à-dire moi-même – a une
trajectoire dans votre référentiel qui est la ligne pleine in-
clinée. Si mon référentiel ne bougeait pas par rapport au
vôtre, la droite serait verticale. Ce serait la trajectoire de
mon point origine dans l’espace-temps – ainsi que du vôtre
– dans votre référentiel. Et si je me déplaçais vers la gauche,
la trajectoire de mon point origine irait vers la gauche en
montant à mesure que le temps s’écoule.
Nous allons à présent introduire pour les événements

13
dans l’espace-temps des coordonnées dans mon référentiel.
Elles seront notées x0 et t0 . Ainsi un événement quelconque
de l’espace-temps (c’est-à-dire simplement un point quel-
conque du diagramme de Minkowski) aura des coordonnées
(x, t) dans le référentiel au repos, et (x0 , t0 ) dans le réfé-
rentiel en mouvement.
Personnellement, comme je suis en permanence au centre
spatial de mon propre référentiel, ma position satisfait tou-
jours x0 = 0. Et t0 évolue comme le temps qui passe. Quant
à vous, vous décrivez mon mouvement par

x = vt

ou encore
x − vt = 0

où v est la vitesse avec laquelle vous me voyez me déplacer.


Maintenant que nous avons vu quelques trajectoires par-
ticulières (un rayon lumineux, votre origine spatiale, mon
origine spatiale), la question générale est : comment les co-
ordonnées (x0 , t0 ) et (x, t) de n’importe quel événement
sont-elles liées entre elles ? Selon Newton, les relations sont
simples. Ce sont
t0 = t (1.1)
x0 = x − vt (1.2)

La première équation est l’expression de l’hypothèse de


Newton qu’il existe un temps universel, le même pour tous
les observateurs. La seconde montre comment, pour un évé-
nement quelconque, on passe de sa coordonnée spatiale dans
votre référentiel à sa coordonnée spatiale dans le mien. Par
exemple, x0 = 0 est équivalent à x − vt = 0.
Les équations 1.1 et 1.2 sont les équations de la transfor-
mation de Newton des coordonnées entre deux référentiels

14
inertiels. Si vous savez où et quand un événement s’est pro-
duit, repéré par votre système de coordonnées, alors vous
pouvez dire où et quand il a eu lieu repéré par le mien.
Comme on l’a répété maintes fois, il est important de com-
prendre qu’il s’agit du même événement, au même point de
l’espace-temps. Simplement il a des coordonnées spatiales
et temporelles différentes – c’est-à-dire des labels différents
– dans des systèmes de coordonnées différents. Pour l’ins-
tant t = t0 , mais, vous l’avez compris, ça ne va pas durer.
Pouvons-nous inverser les relations, c’est-à-dire expri-
mer (x, t) en fonction de (x0 , t0 ) ? Bien sûr ! Nous vous
laissons le soin de le faire. Vous devez arriver à

t = t0 (1.3)

x = x0 + vt0 (1.4)
ce qui est la même chose que les équations 1.1 et 1.2 où les
deux repères ont été inversés et, logiquement, la vitesse v
est devenue −v.
Maintenant intéressons-nous au rayon lumineux sur la
figure 1.1. Par hypothèse, il se déplace le long de la trajec-
toire x = ct dans votre référentiel. Comment est-ce que je
le décris dans mon référentiel ? Eh bien, utilisons les équa-
tions 1.3 et 1.4 et réécrivons x = ct avec leur aide. Nous
obtenons
x0 + vt0 = ct0
ou de manière équivalente

x0 = (c − v)t0

Ce n’est pas surprenant, mais c’est ennuyeux. Cela dit que


vu par moi le rayon lumineux va moins vite, ce qui semble
naturel puisque je me déplace moi-même dans sa direction.

15
Mais c’est en contradiction avec la loi d’Einstein selon la-
quelle la vitesse de la lumière, étant une propriété de la
nature, doit être la même dans tous les référentiels gali-
léens. Si Einstein a raison, il y a quelque chose qui cloche
sérieusement. Newton et Einstein ne peuvent pas tous les
deux avoir raison. La vitesse de la lumière ne peut pas être
une constante universelle s’il existe un temps universel.
Avant de résoudre cette contradiction avec une décision
très hardie, que vous devinez déjà, regardons ce qui se passe
avec un rayon lumineux émis depuis l’origine vers la gauche.
Dans votre référentiel, sa trajectoire a l’équation

x = −ct

Et il est facile de calculer, avec la transformation de New-


ton, que dans mon référentiel cela devient

x0 = −(c + v)t

En d’autres termes, si je bouge vers la droite, le rayon lu-


mineux qui va dans la même direction va un peu moins vite
que la vitesse de la lumière, et celui émis vers la gauche va
un peu plus vite que c. C’est ce que Newton et Galilée au-
raient dit. C’est ce que tout le monde disait jusque vers la
fin du XIXe siècle quand on commença à mesurer la vitesse
de la lumière avec une très grande précision et on trouva
qu’elle était toujours la même quel que soit le référentiel
inertiel dans lequel on se trouvait.
La seule façon de surmonter cette difficulté était de re-
connaître qu’il y avait quelque chose d’incorrect dans la
transformation de Newton exprimée par les équations 1.1
et 1.2. Les meilleurs physiciens et mathématiciens de la
fin du XIXe siècle essayèrent de les sauver sans abandon-
ner t = t0 et approchèrent remarquablement de la solu-
tion. Mais, comme ils n’étaient pas prêts à renoncer au

16
temps universel, leurs calculs et surtout leurs explications
n’avaient pas la clarté limpide qu’apporta Einstein et que
nous allons à présent voir.

1.2.2 Référentiels de la relativité


Avant d’établir nos nouvelles équations de transformation
des coordonnées, examinons une des hypothèses clé de New-
ton. L’hypothèse la plus menacée, et celle qui est en réalité
fausse, est que la simultanéité veut dire la même chose dans
tous les référentiels – que si nous démarrons avec toutes
vos horloges synchronisées avec toutes les miennes, et que
je commence à me déplacer, mes horloges vont rester syn-
chronisées avec les vôtres. Nous allons bientôt nous rendre
compte que l’équation

t = t0

n’est pas la relation correcte entre mon temps et le vôtre.


Toute l’idée de simultanéité est dépendante du référentiel :
deux événements peuvent être simultanés dans l’un mais
pas dans l’autre.

Synchronisation de nos horloges


Voici ce que je voudrais que vous imaginiez. Nous sommes
dans une salle de classe. Vous êtes un étudiant assis dans la
rangée de devant, où sont assis d’autres étudiants tous écou-
tant attentivement. Chaque étudiant a une horloge. Vous
inspectez soigneusement ces horloges et vous vous assurez
qu’elles marquent toutes la même heure et battent la même
seconde.

17
Je suis sur l’estrade, pour l’instant immobile par rap-
port à vous. J’ai une collection d’horloges dans mon propre
référentiel qui sont disposées le long de mon axe spatial de
manière similaire aux vôtres. Chacune de vos horloges a
exactement une homologue en face d’elle dans mon référen-
tiel, et vice versa. Je me suis assuré que mes horloges sont
synchronisées entre elles, et aussi avec les vôtres. Puis, avec
toutes mes horloges m’accompagnant, je commence à me
déplacer relativement à vous et vos horloges. Tandis que
chacune de mes horloges passe devant chacune des vôtres,
nous regardons si les vôtres et les miennes marquent tou-
jours la même heure, et si ce n’est pas le cas, quel décalage
montrent-elles. Le décalage peut dépendre de la position de
chaque horloge sur sa rangée.
Bien sûr, nous pourrions nous poser des questions si-
milaires concernant nos bâtons de 1 mètre, par exemple :
"pendant que je déplace devant vous, mes bâtons ont-ils
toujours 1 mètre de long quand ils sont mesurés avec vos
coordonnées ?"
C’est ici qu’Einstein fit son grand saut conceptuel. Il se
rendit compte que nous devions faire beaucoup plus atten-
tion aux détails dans notre façon de définir les longueurs, les
temps et la simultanéité. Nous devons préciser comment ex-
périmentalement procéder pour synchroniser deux horloges.
Le postulat qu’il conserva est que la vitesse de la lumière
est la même dans tous les référentiels inertiels. Cela le força
à abandonner le postulat de Newton qu’il existe un temps
universel. À la place, il découvrit que "la simultanéité est
relative". Nous allons suivre sa logique.
Que voulons-nous dire exactement quand nous disons
que deux horloges, A et B, sont synchronisées ? Si les deux
horloges sont à un moment donné au même endroit, il est
facile de voir si elles marquent la même heure ou pas. Mais

18
si elles sont à des endroits différents, même si elles sont
toutes les deux fixes dans un référentiel donné, vérifier leur
synchronicité demande un peu de réflexion. Le problème
est que la lumière met un certain temps – très court certes,
mais non nul – pour aller de A à B.
L’astuce est d’introduire une troisième horloge C à mi-
chemin entre A et B. Pour être bien clair, imaginons que
les trois horloges sont celles de trois étudiants assis dans
la rangée de devant. L’horloge A est avec l’étudiant à l’ex-
trémité gauche de la rangée, l’horloge B avec l’étudiant à
l’extrémité droite, et l’horloge C avec l’étudiante au centre
de la rangée. On a vérifié avec soin que la distance entre A
et C est exactement la même que la distance entre C et B.
Au moment précis où l’horloge A marque midi, elle en-
voie un flash vers C. De même quand B marque midi, elle
envoie aussi un flash vers C. Bien sûr les deux rayons lumi-
neux vont chacun mettre un peu de temps pour atteindre
le centre, mais comme la vélocité de la lumière des flashes
est la même, et les distances qu’ils doivent parcourir sont
les mêmes, ils doivent mettre le même temps pour arriver à
C. Un observateur dans le référentiel au repos dira que A et
B sont synchronisées si et seulement si les deux flashes at-
teignent C en même temps. Et s’ils n’arrivent pas en même
temps, l’étudiante-observatrice en C au milieu de la rangée
conclura que A et B ne sont pas synchronisées. Elle pourra
envoyer un message à A ou à B avec des instructions sur la
façon de se remettre à l’heure.
Supposons que les horloges A et B soient synchronisées
dans votre référentiel – le référentiel de la salle de classe,
appelé aussi référentiel au repos. Que se passe-t-il dans mon
référentiel en mouvement ? Mettons que je me déplace vers
la droite, et que je passe au point C exactement à midi.
C’est le moment où les deux flashes sont émis. Mais les

19
rayons lumineux n’arrivent pas en C à midi ; ils arrivent
un peu plus tard. À ce moment-là je me serai déplacé vers
la droite. Donc je recevrai le rayon lumineux venant de la
droite un peu avant celui venant de la gauche. J’en conclurai
que vos horloges ne sont pas synchronisées.
Manifestement deux événements synchronisés pour vous
peuvent ne pas l’être pour moi. Deux événements, en des
endroits différents, qui ont la même date t dans votre ré-
férentiel, et sont ainsi synchronisés pour vous, ne le sont
pas pour moi. Ou du moins c’est ce que les deux postulats
d’Einstein nous forcent à conclure.

Unités et dimensions
Faisons une pause pour présenter les deux systèmes d’unités
que nous allons utiliser dans ce livre. Chaque système sera
adapté aux fonctions qui lui sont assignées. Et il sera facile
de passer de l’un à l’autre.
Le premier système utilise les unités familières du sys-
tème SI : les mètres, les secondes, etc. Nous les appellerons
les unités courantes ou conventionnelles. Ces unités sont
excellentes pour décrire le monde ordinaire dans lequel les
vélocités sont bien plus petites que celle de la lumière. Une
vélocité de 1 dans ces unités signifie un mètre par seconde,
ce qui est plusieurs ordres de magnitude plus petit que c.
Le second système est basé sur la vitesse de la lumière.
Dans ce système, les unités de longueur et de temps sont
définies de telle sorte que cela donne à la vitesse de la lu-
mière la valeur 1. L’unité de temps pourra être la seconde
et l’unité de longueur la distance parcourue par la lumière
en une seconde. Ou bien l’unité de temps pourra être l’an-
née, et l’unité de longueur l’année-lumière, c’est-à-dire la

20
distance – mesurée dans notre référentiel – parcourue par
la lumière en une année – c’est environ un quart de la dis-
tance qui nous sépare d’Alpha du Centaure, l’étoile la plus
proche dans la Voie lactée 12 . Dans les deux cas la vitesse
de la lumière aura alors la valeur 1.
Nous utiliserons généralement pour l’unité de temps la
seconde, et pour l’unité de longueur la seconde-lumière. Et
nous les appellerons les unités relativistes. Elles facilitent
les calculs et soulignent les symétries dans certaines équa-
tions. Nous avons déjà vu que les unités conventionnelles ne
sont pas pratiques pour les diagrammes d’espace-temps. Les
unités relativistes en revanche sont parfaitement adaptées
à cette représentation.
Dans les diagrammes d’espace-temps, comme par exem-
ple la figure 1.2 un peu plus loin, les axes temporel et spa-
tial seront calibrés avec ces unités. Ainsi la trajectoire d’un
rayon lumineux émis vers la droite sur l’axe des x depuis
l’origine sera représentée par la diagonale à 45°. Il nous ar-
rivera même de dire que les deux axes sont tous les deux
calibrés en seconde, voulant dire par là que l’axe vertical
est en seconde, et l’axe horizontal en seconde-lumière.
Savoir passer aisément d’un système à l’autre nous ren-
dra beaucoup de services. Le principe directeur est que
les expressions mathématiques doivent être cohérentes du
point de vue des dimensions. Par exemple une énergie ob-
tenue au terme d’un calcul devra avoir pour dimension des
kg x m2 / s2 ou quelque chose d’équivalent. Une équa-
tion où les valeurs numériques n’importent pas mais qui
exprime une contrainte sur des dimensions – qui doivent
12. Pour avoir une idée concrète de la distance jusqu’à Alpha du
Centaure, considérez sept fois la distance Terre-Soleil et... multipliez-
la par 40 000. C’est notre plus proche voisine. L’univers est beaucoup
plus vaste ! On ne sait pas s’il est infini ou pas. Il pourrait être une
3-sphère, comme la surface de la Terre est une 2-sphère.

21
être les mêmes de part et d’autre du signe égal – s’appelle
une équation aux dimensions.
Quand la vitesse de la lumière sera présente dans une
équation sous la forme invisible d’un 1 en facteur, il ne
faudra pas oublier que ce 1 a la dimension d’une longueur
divisée par un temps. C’est la raison pour laquelle nous
avons inclus cette petite section sur les unités : nous ma-
nipulerons beaucoup d’équations où c n’apparaît pas tout
simplement car il est égal à 1.
Sur un plan pratique, si on a une équation en unités
relativistes faisant intervenir une vitesse v, et qu’on veut la
transformer en une équation en unités conventionnelles où
c apparaît explicitement, il suffira de voir notre équation
comme une équation aux dimensions et de les corriger à
l’aide du facteur c. Souvent il suffira de remplacer v par
v/c, quelque fois par v/c2 , etc.
Cela nous conduira parfois à dire qu’une vitesse v en
unités relativistes est un nombre sans dimension, voulant
dire par là que v/c ou v/1 est un nombre sans dimension.

Les deux systèmes de coordonnées


Revenons à nos deux référentiels, le vôtre dit au repos, et
le mien en mouvement. Cette fois-ci nous allons être très
précautionneux dans la façon d’utiliser le mot synchrone
dans le référentiel en mouvement.
Dans le référentiel au repos, les choses sont finalement
très simples : deux points, c’est-à-dire deux événements,
sont synchrones s’ils sont au même niveau horizontal sur
le diagramme d’espace-temps. Les deux points ont la même
coordonnée temporelle t, et donc la ligne droite qui les joint
est parallèle à l’axe des x. C’est ce que l’on voit dans le dia-

22
gramme de Minkowski et cela n’aurait posé aucun problème
à Newton.
Mais qu’en est-il dans le référentiel en mouvement ?
Nous allons voir dans un instant que dans le référentiel en
mouvement, le point
x = 0, t = 0
n’est pas synchrone avec les autres points de l’axe des x,
mais qu’il est synchrone avec un ensemble entièrement dif-
férent de points. En fait, la surface 13 entière des points
synchrones pour moi avec l’origine (qui par convention est
la même dans les deux référentiels) est une autre droite.
Comment pouvons-nous la dessiner dans le diagramme de
Minkowski, où les axes x et t repèrent les coordonnées dans
le référentiel au repos ? Nous allons utiliser la même pro-
cédure qui a servi dans la section "synchronisation de nos
horloges" plus haut. Elle est maintenant illustrée par la fi-
gure 1.2.
Dessiner un diagramme de Minkowski est généralement
la meilleure façon de comprendre un problème en relativité.
Le dessin est toujours le même : la coordonnée spatiale x
dans le repère au repos est l’axe horizontal, et la coordonnée
temporelle t dans le repère au repos est l’axe vertical. Insis-
tons sur le fait que ce sont les axes repérant les coordonnées
dans le référentiel dit stationnaire ou au repos, c’est-à-dire
votre référentiel puisque vous ne bougez pas par rapport à
lui. Une ligne droite ou courbe qui représente la trajectoire
d’un observateur en mouvement dans votre référentiel est
appelée une ligne d’univers.
13. En mathématiques, quand dans un espace à n dimensions on
considère un sous-espace à (n − 1) dimensions, plan ou pas, on parle
de surface ou de variété. Ici l’espace-temps a 2 dimensions, x et t,
donc une "surface" est en réalité une ligne, droite ou courbe. Mais les
auteurs conservent le mot surface.

23
Avec les axes x et t en place, les choses suivantes à
dessiner sont les rayons lumineux émis depuis l’origine vers
la droite et vers la gauche. Comme nous le savons déjà, celui
vers la droite a l’équation x = ct et celui vers la gauche
x = −ct. Et comme c = 1 dans nos unités, ce sont les deux
diagonales à 45° et −45° passant par l’origine. Notez qu’un
rayon émis du point spatial x au temps t vers la droite
sera aussi la demi-droite inclinée à 45° depuis l’événement
(x, t), et le rayon émis vers la gauche sera la demi-droite
inclinée à −45°. Ainsi le segment allant de l’événement b à
l’événement a sur la figure 1.2 est la trajectoire d’un rayon
lumineux émis vers la gauche depuis l’événement b.

Synchronicité dans le référentiel en mouvement


Sur la figure 1.2, nous allons considérer trois observateurs
fixes dans le référentiel en mouvement : Lenny, Mary et
Seymour. Nous avons déjà vu Lenny : c’est l’observateur
en mouvement que nous avons déjà représenté sur la figure
1.1. Il est positionné à l’origine spatiale du référentiel en
mouvement, se déplaçant vers la droite pour vous. Sa ligne
d’univers, c’est-à-dire sa trajectoire, est la droite d’équation
x = vt, ou de manière équivalente x0 = 0. Au temps t = 0,
il passe par l’origine du référentiel au repos qui est aussi
celle du référentiel en mouvement.
À une unité spatiale, repérée avec la coordonnée x, de-
vant Lenny se trouve Mary. Sa trajectoire a l’équation
x = vt + 1
Au temps t = 0, sur le diagramme Mary était simplement
à la position (x = 1, t = 0). Cela veut dire par définition
qu’elle est à une unité de longueur de Lenny, mesurée dans
le référentiel au repos.

24
Et à deux unités de longueur se trouve Seymour. Sa
trajectoire a l’équation
x = vt + 2
Au temps t = 0, il était lui aussi sur l’axe des x, à la
position (x = 2, t = 0). Nous allons voir que pour eux, ils
n’ont pas franchi ces trois points sur l’axe des x à la même
date t0 dans leur référentiel. Mais pour l’instant continuons
à construire ce qu’est un ensemble de points (au sens d’évé-
nements) synchrones pour eux.

Figure 1.2 : Détermination de la synchronicité dans le référentiel


en mouvement.

Nos trois observateurs dans le référentiel en mouvement


ont chacun une horloge avec soi – cela va de soi. Quand

25
l’horloge de Lenny marque midi c’est le moment où il passe
par (x = 0, t = 0). Nous avons par convention décidé que
c’est aussi (x0 = 0, t0 = 0). À ce moment-là Lenny envoie
un rayon lumineux vers Mary. C’est la droite x = ct sur la
figure. Elle croise la trajectoire de Mary au point a. C’est-
à-dire que le rayon lumineux émis par Lenny atteint Mary
en cet événement. (On se rappelle qu’événement veut dire
point sur le diagramme de Minkowski.)
Nous voulons que Seymour envoie aussi un rayon lumi-
neux, vers la gauche, vers Mary, de telle sorte qu’il l’atteigne
en même temps que celui de Lenny. Alors nous dirons que
les deux rayons ont été émis en même temps, c’est-à-dire
au même temps t0 , du point de vue du référentiel en mou-
vement. C’est en effet ainsi que l’on a défini – avec le plus
grand soin – la synchronicité. Le rayon émis par Seymour
doit donc arriver en a. Il doit quitter Seymour en un point b
de sa ligne d’univers, et comme c’est un rayon lumineux al-
lant vers la gauche, sa trajectoire, qui est le segment (a, b),
est inclinée à −45°.
Nous avons maintenant tout ce qu’il nous faut pour cal-
culer les coordonnées des événements a et b dans le référen-
tiel au repos. Et nous savons que les points origine et b sont
synchrones dans le référentiel en mouvement, c’est-à-dire
ont la même date. Ce qui veut dire qu’on sait déjà qu’en b,
on a t0 = 0.

L’axe spatial x0
Trouver, dans le référentiel au repos, les coordonnées du
point b est un exercice de géométrie analytique élémentaire.
Résolvons-le en deux étapes. On va commencer par déter-
miner les coordonnées de a, puis on trouvera celles de b.

26
Le point a est à l’intersection des droites d’équations

x = ct

et
x = vt + 1
Utilisons les unités relativistes dans lesquelles c = 1. Alors
ce sont plus simplement les droites d’équations

x=t (1.5)

et x = vt + 1. Donc la coordonnée t du point a satisfait

t = vt + 1

Cela donne
1
ta = (1.6)
1−v

Par conséquent, d’après l’équation 1.5, on a aussi


1
xa =
1−v

Voilà le point a réglé. Passons à b.

La droite passant par a et b a une pente de −45°, donc tous


les points sur elle satisfont l’équation

x + t = constante

Le point a nous donne immédiatement la constante. C’est


2
constante =
1−v

27
Les coordonnées du point b satisfont donc
2
x+t= (1.7)
1−v

et aussi, car b est sur la trajectoire de Seymour,

x = vt + 2

En remplaçant x par son expression en fonction de t, l’équa-


tion 1.7 devient
2
vt + 2 + t =
1−v
ou
2
t(1 + v) = −2
1−v

2 2(1 − v)
= −
1−v 1−v
2v
=
1−v

D’où, après encore un peu d’algèbre, laissée à la lectrice ou


au lecteur, pour la coordonnée spatiale,
2v
tb =
1 − v2
(1.8)
2
xb =
1 − v2

Tout d’abord, notons le point important suivant : tb n’est


pas égal à zéro. En d’autres termes, l’événement b qui est

28
synchrone avec l’événement origine dans le référentiel en
mouvement, ne l’est pas avec l’événement origine dans le
référentiel au repos. Les deux origines correspondent néan-
moins, par convention, à un seul est même événement.
Ensuite considérons la ligne droite passant par l’origine
et par b, figure 1.3. Sa pente est donnée par tb /xb . Les
équations 1.8 montrent que sa valeur est v, soit exactement
l’inverse de la pente de la trajectoire de Lenny.
Par ailleurs, cette droite passant par l’origine et par b,
d’équation
t = vx (1.9)

est tout simplement l’ensemble des points tels que t0 = 0,


c’est-à-dire l’axe des x0 . En effet nous avons choisi Mary et
Seymour respectivement avec les trajectoires x = vt + 1 et
x = vt + 2, mais en prenant x = vt + 1λ et x = vt + 2λ,
et en faisant varier λ on obtiendrait n’importe quel point
aligné avec b et l’origine.
Voilà la symétrie dans les diagrammes de Minkowski,
qu’on obtient en prenant c = 1, dont nous avons parlé plus
haut. Les axes x0 = 0, appelé aussi l’axe t0 (c’est-à-dire
la trajectoire de l’origine spatiale du référentiel en mouve-
ment) et t0 = 0, appelé aussi l’axe x0 (c’est-à-dire les évé-
nements synchrones avec l’événement x0 = 0, t0 = 0 dans
le référentiel en mouvement) sont deux droites symétriques
par rapport à la diagonale à 45°, qui se trouve être aussi la
trajectoire d’un rayon lumineux émis vers la droite depuis
l’origine.
Dans nos raisonnements et figures, nous avons choisi
une vitesse v positive pour le mouvement de Lenny dans le
référentiel au repos. Si vous avions pris une vélocité néga-
tive, nous aurions dû modifier légèrement les émissions de
rayons lumineux et redessiner les diagrammes, ou simple-

29
ment prendre leur vue dans un miroir.
La figure 1.3 montre notre diagramme d’espace-temps
avec les axes x0 et t0 représentés. La droite t = vx (ou ce qui
serait une surface voire même un espace à trois dimensions
si nous avions une ou deux coordonnées spatiales supplé-
mentaires) a donc la propriété importante que toutes les
horloges du référentiel en mouvement y marquent t0 = 0.
C’est l’axe x0 .
Et la trajectoire de Lenny est la droite telle que x0 reste
égal à zéro, car Lenny est en permanence au centre du ré-
férentiel en mouvement. C’est l’axe t0 .

Figure 1.3 : Référentiels fixe et en mouvement de la relativité


restreinte. Les axes x0 (c’est-à-dire t0 = 0) et t0 (c’est-à-dire x0 =
0) sont ceux du référentiel en mouvement.

L’axe x0 est appelé une surface de simultanéité dans le ré-

30
férentiel en mouvement. Il joue le même rôle que l’axe des
x dans le repère au repos. L’axe des x correspond à tous
les événement dont la date est t = 0. Tous les événements
dont la date t est une autre valeur fixe forment une ligne
horizontale au dessus de l’axe des x. De même tous les évé-
nements de date t0 = 0 forment l’axe x0 , et tous les événe-
ments synchrones avec une autre date t0 dans le référentiel
en mouvement forment une droite parallèle à l’axe x0 .
Jusqu’ici nous avons travaillé avec des unités relativistes
dans lesquelles la vitesse de la lumière était c = 1. Nous
sommes à un bon endroit dans la leçon pour voir comment
nos premières équations, faisant intervenir la vitesse v du
référentiel en mouvement par rapport à celui au repos, se
transforment quand on travaille avec les unités convention-
nelles et que c devient une valeur autre que 1. Comme nous
l’avons dit, le procédé consiste à regarder nos équations
comme des équations aux dimensions. Ainsi l’équation 1.9,
t = vx, n’est pas cohérente du point de vue des dimen-
sions. En effet elle exprime une égalité entre un temps et
une longueur au carré divisée par un temps. Pour restaurer
la cohérence il faut multiplier par exemple le côté droit par
une puissance appropriée de c. Le facteur correct est 1/c2 :
v
t= 2 x (1.10)
c

ou de manière équivalente
v 
ct = x
c

Certains auteurs dessinent les diagrammes de Minkowski


avec ct en ordonnée plutôt que t. Ils utilisent cependant
toujours x en abscisse.

31
Une fois de plus, il faut souligner qu’avec les unités
conventionnelles l’axe x0 d’équation 1.10 se confondrait pra-
tiquement avec l’axe des x. Dans la représentation avec ct
et x – que nous n’utilisons pas dans ce livre – x0 serait
aussi presque le même que x sauf pour des vitesses v non
négligeables par rapport à c.
Par ailleurs, dans le repère (x, t), l’axe x0 ne serait plus
le symétrique de l’axe t0 par rapport au rayon lumineux,
car le rayon lumineux lui-même serait presque plat.
Repassons temporairement en unités relativistes. Le fait,
quand v/c est petit (c’est-à-dire v est petit puisque c = 1),
que l’axe des x0 est presque le même que l’axe des x veut
simplement dire qu’à des vitesses négligeables par rapport
à c, les surfaces de simultanéité dans les deux référentiels
sont essentiellement les mêmes, ce qu’elles sont exactement
en mécanique newtonienne.
Cela illustre le fait que la description d’Einstein de l’es-
pace-temps se ramène à la description de Newton si la vi-
tesse relative des référentiels l’un par rapport à l’autre est
beaucoup plus petite que la vitesse de la lumière. C’est un
point important : la relativité einsteinienne ne bouleverse
pas la mécanique newtonienne. La correction est négligeable
quand v/c est petit. Seulement à grande vitesse de l’ordre
au minimum de 30 000 km/s – ce qui est extrêmement ra-
pide ! – commence-t-on à devoir tenir compte des correc-
tions relativistes.
Nous pouvons retourner à présent à nos bonnes vieilles
unités relativistes, avec c = 1, qui simplifient les équations.
Et simplifions aussi notre diagramme en éliminant tout ce
qui nous a servi à étudier la synchronicité dans le référentiel
en mouvement, et en ne conservant que ce dont nous aurons
besoin dans la suite.

32
Figure 1.4 : Référentiels fixe et en mouvement de la relativité
restreinte. Schéma simplifié.

La droite en pointillé d’équation x = ct, ou plus simplement


x = t, représente la trajectoire d’un rayon lumineux émis
depuis l’origine vers la droite. Elle fait un angle de 45° avec
l’axe des x. C’est la bissectrice de l’angle formé par les axes
x et t. C’est aussi la bissectrice de l’angle formé par les
axes x0 et t0 , car le premier a l’équation t = vx et le second
l’équation x = vt.
Nous avons découvert deux choses intéressantes. Pre-
mièrement, si la vitesse de la lumière est réellement la même
dans tous les référentiels, et vous utilisez les rayons lumi-
neux pour synchroniser les horloges, alors une paire d’évé-
nements qui sont synchrones dans un référentiel ne le sont
pas dans l’autre, si les deux référentiels ont une vitesse rela-

33
tive l’un par rapport à l’autre. Deuxièmement, nous avons
découvert ce que la synchronicité veut en réalité dire dans
le référentiel en mouvement. Dans le diagramme de Min-
kowski, qui est fondamentalement attaché à un repère –
celui que nous avons appelé "au repos" – les lignes d’évé-
nements synchrones dans le repère en mouvement ne sont
pas des lignes horizontales. Ce sont les droites de pente v.
Nous avons déterminé les directions des axes x0 et t0 dans le
référentiel en mouvement de Lenny. Plus tard, nous allons
déterminer comment marquer les unités sur ces axes.

Espace-temps
Faisons une pause pour voir où nous en sommes. Newton
considérait l’espace et le temps comme deux concepts en-
tièrement distincts. Pour lui, il y avait un espace, c’était
notre espace repéré avec nos trois dimensions habituelles, et
il y avait un temps universel, le même pour tout le monde.
Mais des représentations comme les figures 1.3 et 1.4 ré-
vèlent quelque chose que Newton ne pouvait pas connaître.
C’est qu’en passant d’un référentiel inertiel à un autre les
coordonnées spatiales et temporelles se mêlent en quelque
sorte. Par exemple, sur la figure 1.3 le point origine et le
point b représentent deux événements ayant la même date
t0 = 0 dans le référentiel en mouvement. Mais dans le ré-
férentiel au repos le point b n’est non seulement pas à la
même position spatiale que l’origine, mais pas à la même
date non plus.
Trois ans après le premier article d’Einstein sur la rela-
tivité restreinte – un des quatre articles remarquables sur
différents domaines de la physique qu’Einstein publia en
1905 – Hermann Minkowski compléta la révolution initiée

34
par son ancien élève au Polytechnicum de Zurich. Dans une
allocution lors de la 80e Assemblée des savants et médecins
allemands, à Cologne en 1908, Minkowski déclara :

Désormais l’espace en lui-même et le temps en lui-même


sont destinés à s’évanouir comme des ombres, et seule
pourra prétendre à une existence indépendante une es-
pèce d’union de l’un et de l’autre.

Cette union est un espace à quatre dimensions, dénotées


généralement x, y, z et t dans le référentiel qu’on a sé-
lectionné. On l’appelle l’espace-temps. Certains l’appellent
l’espace de Minkowski. Minkowski l’appelait l’univers.
Il choisit d’appeler les points de l’espace-temps des évé-
nements. Un événement, dans un référentiel, a quatre co-
ordonnées, x, y, z et t. En appelant un point un événe-
ment Minkowski ne voulait pas dire qu’il s’y "passait" né-
cessairement quelque chose. En cela, la terminologie qu’il
a introduite s’écarte légèrement de l’acception courante du
mot événement. Il dénomma les trajectoires, qu’elles soient
droites ou courbes, des objets dans la représentation qu’il
construisit, des lignes d’univers. Par exemple la ligne x0 = 0
est la ligne d’univers de Lenny.
Ce changement de perspective depuis l’espace et le temps
séparés vers un espace-temps unique était une évolution ra-
dicale en 1908 14 , mais aujourd’hui les diagrammes d’espace-
temps sont aussi familiers pour les physiciens que la paume
de leur main.

14. Quand Minkowski a géométrisé l’espace-temps de la relativité


restreinte (voir Section 1.5.1), Einstein fut d’abord sceptique sur l’uti-
lité de mathématiser ainsi une théorie qui pour lui était essentiellement
physique. Cependant, quelques années plus tard, après s’être colleté
avec le calcul et la géométrie des tenseurs nécessaires pour la relativité
générale, il reconnut que cette mathématisation était très utile.

35
Les événements de l’espace-temps sont des objets intrin-
sèques de la nature, sans lien avec un quelconque référentiel
– de même qu’un point de l’univers n’a aucun lien avec un
quelconque repère 15 .
Un diagramme de Minkowski est une sorte de carte de
l’espace-temps. Chaque événement de l’espace-temps est re-
présenté comme un point sur cette carte, qui est une page
de livre ou de document. Nous avons vu que la technique
pour construire le diagramme est de choisir arbitrairement
un référentiel galiléen dans l’espace-temps. Il devient le ré-
férentiel dit fixe. Il fournit les axes horizontaux et verticaux
du diagramme et sert à positionner les événements sur la
feuille.
Les événements (ou plus précisément les points repré-
sentant les événements) sont alors rangés dans le diagramme
de telle sorte que deux événements de même position spa-
tiale soient sur une droite verticale, et deux événements
synchrones dans le référentiel, soient sur une droite hori-
zontale. L’image dans le diagramme du référentiel fixe peut
être vue comme un carrelage orthogonal.
Il se trouve que les lignes de positions fixes ou les lignes
d’événements synchrones dans un autre référentiel galiléen
représentées dans ce premier référentiel sont aussi très sim-
ples. Elles produisent un carrelage en perspective. Si nous
avions pris un autre référentiel plus compliqué ce ne se-
rait plus le cas. Nous aurions seulement, attaché à chaque
point représentant un événement, deux coordonnées, une
spatiale et une temporelle, et les lignes de même temps ou
de même position, sur le diagramme, pourraient ne plus être

15. Nous laissons de côté ici la question philosophique de savoir si


la géométrie de l’univers est intrinsèque ou bien est une conception
que notre esprit construit en organisant nos perceptions.

36
des droites. On rencontrera cette situation dans la théorie
de la relativité générale où le passage d’un référentiel à un
autre sera plus compliqué qu’ici.
Il y a une différence importante, cependant, entre une
carte géographique ordinaire et un diagramme de Minkowski.
Une carte ordinaire reproduit à échelle réduite la géométrie
de la région qu’elle représente (au moins tant que celle-ci
est proche d’un plan). Mais nous ne sommes pas habitués
à penser à la géométrie de l’espace-temps – d’autant moins
que la notion de simultanéité y dépend du référentiel. Aussi
la géométrie d’un diagramme de Minkowski est au premier
abord déconcertante, car on n’y voit pas clairement le mo-
dèle réduit d’un espace-temps réel avec lequel nous serions
familiers.
Enfin une erreur fréquente des néophytes, résultant de
l’idée erronée que le diagramme de Minkowski serait l’espace-
temps et ses référentiels en plus petits, est de penser que la
représentation du référentiel mobile en quelque sorte bouge
elle-même dans le diagramme de Minkowski – ce qui n’est
absolument pas le cas.

Transformation de Lorentz
Un événement, autrement dit un point de l’espace-temps,
peut être labellisé – étiqueté si vous préférez – par ses co-
ordonnées dans le référentiel au repos, mais aussi par ses
coordonnées dans le référentiel en mouvement. Il s’agit de
deux descriptions du même événement. Et dire qu’un des
référentiels est au repos et l’autre en mouvement est arbi-
traire. On pourrait les inverser, ou les considérer comme
tous les deux en mouvement par rapport à un troisième,
etc.

37
La question qui vient immédiatement à l’esprit est :
comment passe-t-on d’une description à l’autre ? En d’autres
termes, quelle est la transformation de coordonnées qui per-
met de passer des coordonnées t, x, y, z dans le référentiel
au repos aux coordonnées t0 , x0 , y 0 , z 0 dans le référentiel en
mouvement ?
Une des hypothèses d’Einstein est que l’espace-temps
est le même partout, comme un plan est le même en tout
point. Cette identité de forme de l’espace-temps où qu’on le
considère est ce qu’on appelle en mathématiques une symé-
trie. Voir le chapitre 7, Symétries et lois de conservation,
du Volume 1, pour réviser plus précisément la notion de
symétrie dans un espace.
Nous avons vu qu’on peut utiliser n’importe quel ré-
férentiel galiléen pour énoncer les lois de la physique et
qu’elles doivent avoir des expressions identiques avec les
coordonnées x, y, z et t, et avec les coordonnées x0 , y 0 , z 0 et
t0 , tout simplement car deux référentiels galiléens sont in-
distinguables du point de vue de la physique. Vous pouvez
considérez cela comme une observation expérimentale (cf.
le wagon sans fenêtre) ou comme un postulat.
Cela a des implications mathématiques sur les trans-
formations permettant d’aller d’un système de coordonnées
à l’autre. Par exemple, dans la section sur les référentiels
newtoniens, nous avons rencontré les équations 1.1 et 1.2
reproduites ci-dessous

t0 = t
(1.11)
x0 = x − vt

permettant de passer des coordonnées dans un référentiel au


coordonnées dans un autre. Ce sont des équations linéaires.
Elles ne contiennent que des monômes à la puissance un des

38
coordonnées. Maintenant que le temps n’est plus univer-
sel entre deux référentiels, elles ne vont pas survivre telles
quelles. En particulier on ne va plus avoir simplement t0 = t.
Mais on aura toujours x0 = 0 quand x = vt.
Il n’existe qu’une seule façon de modifier l’équation x0 =
x − vt de telle sorte qu’elle reste linéaire en x et t, et qu’on
ait toujours x0 = 0 quand x − vt = 0. C’est de multiplier le
terme de droite par un facteur dépendant seulement de la
vélocité :

x0 = (x − vt)f (v) (1.12)

Pour l’instant la fonction f (v) peut être n’importe quelle


fonction. Mais Einstein avait un autre tour dans sa manche.
Il argua de la symétrie entre le passage

(x, t) → (x0 , t0 )
et le passage

(x0 , t0 ) → (x, t)

Rien en physique n’exige que le mouvement dans un sens


soit représenté par +v et dans l’autre sens par −v. Donc,
dans l’équation 1.12, le coefficient correcteur f (v) ne doit
dépendre en réalité que de la magnitude de la vélocité c’est-
à-dire seulement de la vitesse (considérée comme il est d’us-
age sans signe) Nous notons cette vitesse v, pour marquer
qu’on parle de la valeur absolue de la vélocité. Donc l’équa-
tion 1.12 est marginalement corrigée en

x0 = (x − vt)f (v) (1.13)

39
Qu’en est-il de t0 ? Nous allons raisonner de la même
façon que nous l’avons fait pour x0 . Nous savons que t0 = 0
chaque fois que t = vx. Sans plus de décorticage on voit
qu’on a simplement interverti la coordonnée spatiale et la
coordonnée temporelle. Donc a a aussi

t0 = (t − vx)g(v) (1.14)

où g est une autre fonction dépendant seulement de v.


Notre tâche suivante est de montrer que f et g sont les
mêmes. Pour l’instant nous avons simplement les transfor-
mations qu’on vient de calculer et qu’on peut réécrire en
une seule double équation
x0 = (x − vt)f (v)
(1.15)
t0 = (t − vx)g(v)

si l’on veut insister sur le fait qu’il s’agit d’une transforma-


tion des coordonnées.
Considérons un rayon lumineux émis depuis l’origine
et suivi dans les deux référentiels. Appliquons le principe
d’Einstein que la vitesse de la lumière est la même dans les
deux référentiels. La trajectoire du rayon lumineux a l’équa-
tion x = t dans le référentiel au repos. C’est une droite de
pente 1, car c’est la trajectoire de quelque chose qui va à la
vitesse de la lumière. Elle doit aussi avoir, pour les mêmes
raisons, l’équation x0 = t0 dans le référentiel en mouvement.
Fixant x = t dans les équations 1.15 et imposant que x0 doit
alors être égal à t0 , implique que

f (v) = g(v)

Ainsi le fait que la vitesse de la lumière soit la même dans


tous les référentiels galiléens – car c’est une loi de la nature

40
et que les référentiels galiléens sont indistinguables du point
de vue des lois de la nature – implique que f = g. Les
équations 1.15 se simplifient en

x0 = (x − vt)f (v)
(1.16)
t0 = (t − vx)f (v)

Il reste à déterminer la fonction f . Pour ce faire Einstein


utilisa un dernier ingrédient. En substance, il demanda :
"Qui peut affirmer que son propre référentiel est bien celui
au repos et l’autre celui en mouvement ?" En fait chaque
observateur est au repos par rapport à son propre référentiel
et voit l’autre en mouvement. Un observateur voit l’autre
se mouvoir avec la vélocité v et l’autre voit le premier se
mouvoir avec la vélocité −v. Comme le second observateur
peut aussi appliquer le jeu d’équations 1.16, en utilisant la
vélocité avec laquelle il voit le premier se mouvoir, il écrira
quant à lui

x = (x0 + vt0 )f (v)


(1.17)
t = (t0 + vx0 )f (v)

Nous voilà arrivés à deux jeux d’équations reliant (x, t) et


(x0 , t0 ) : le jeu d’équations 1.17 et le jeu d’équations 1.16.
Sont-ils compatibles entre eux ? Après tout, nous aurions
pu aussi obtenir les expressions pour x et t en fonction de
x0 et t0 en résolvant pour x et t le système 1.16.
Vérifions la compatibilité. Bien sûr, cela imposera des
contraintes sur f . C’est ainsi qu’on va la déterminer.
Si nous prenons les expressions de x0 et t0 données par les
équations 1.16 et les introduisons dans les équations 1.17,
qu’obtient-on ? Nous obtenons x en termes de x et t, et t

41
en termes de x et t. Regarder l’expression de x en termes
de x et t suffit. Nous obtenons
x = (x0 + vt0 )f (v)

= (x − vt)f 2 (v) + v(t − vx)f 2 (v)

= xf 2 (v) − v 2 xf 2 (v)

= xf 2 (v)(1 − v 2 )

Cela ne peut être vrai que si

f 2 (v)(1 − v 2 ) = 1

ou encore
1
f 2 (v) =
1 − v2
soit
1
f (v) = √ (1.18)
1 − v2

Nous allons voir dans un instant pourquoi f ne peut pas


être la racine négative. Retournant au jeu d’équations 1.16,
nous pouvons à présent l’écrire

x − vt
x0 = √ (1.19)
1 − v2

t − vx
t0 = √ (1.20)
1 − v2

Pourquoi on ne pouvait pas prendre la racine négative


de (1 − v 2 ) ? Parce que quand v = 0 on veut retomber sur
nos pieds avec x0 = x et non pas x0 = −x.

42
Observez que les équations 1.19 et 1.20 ont la même
forme sauf que les rôles de x et t sont intervertis. Le numé-
rateur dans 1.19 est x−vt, tandis que dans 1.20 √ c’est t−vx.
Et dans les deux cas on divise par le facteur 1 − v 2 .
Nous sommes parvenus aux fameuses équations de Lo-
rentz permettant de passer des coordonnées (x, t) dans
le référentiel au repos aux coordonnées (x0 , t0 ) dans le ré-
férentiel en mouvement. Elles sont la conséquence du fait
qu’on veuille que la vitesse de la lumière ait la même valeur
1 dans tous les référentiels inertiels. Nous verrons un peu
plus loin où réintroduire le facteur c quand on travaille en
unités conventionnelles.
Nous avons essentiellement suivi la démonstration d’Ein-
stein dans son papier de 1905 pour établir les équations de
Lorentz. Je ne l’ai pas relu depuis plus d’un demi-siècle,
mais il m’avait fait à l’époque une très forte impression qui
dure encore.
Vous vous demandez peut-être pourquoi les équations
1.19 et 1.20 portent le nom d’équations de Lorentz. La sec-
tion suivante y répond.

1.2.3 Aparté historique


Einstein ne fut pas le premier à découvrir les équations 1.19
et 1.20. L’honneur en revient au physicien néerlandais Hen-
drik Lorentz. Lorentz et d’autres mêmes avant lui – notam-
ment George FitzGerald – avaient spéculé sur le fait que la
théorie de l’électromagnétisme de Maxwell pour rester co-
hérente exigeait que les objets en mouvement se contractent
dans la direction de leur déplacement, un phénomène que
nous appelons aujourd’hui contraction de Lorentz. Dès 1900
Lorentz avait écrit les équations de la transformation qui

43
porte son nom et qui étaient motivées par cette contraction
des objets en mouvement. Mais les vues des prédécesseurs
d’Einstein étaient différentes des siennes. D’une certaine
manière elles restaient agrippées au passé plutôt que tour-
nées vers l’avenir. Lorentz et FitzGerald imaginaient que
l’interaction entre l’éther stationnaire et les atomes en mou-
vement de toute la matière ordinaire causaient une com-
pression de cette matière dans la direction du mouvement.
En première approximation la pression contractait toute
matière avec un coefficient uniforme si bien que l’effet était
équivalent à une transformation des coordonnées.
Quelques jours avant la publication de l’article d’Ein-
stein, le grand mathématicien français Henri Poincaré pu-
blia dans les Comptes Rendus de l’Académie des sciences
un article dans lequel il parvenait aux équations de Lorentz
à partir de l’exigence initiale que les équations de Maxwell
conservent la même forme dans tous les référentiels iner-
tiels 16 .
Mais aucun de ces travaux n’avait la clarté, la simplicité
et la généralité du raisonnement d’Einstein.

1.2.4 Retour aux équations


Si nous connaissons les coordonnées d’un événement dans le
référentiel au repos, les équations 1.19 et 1.20 nous donnent
les coordonnées du même événement dans le référentiel en
mouvement. Peut-on aller dans l’autre sens ? C’est-à-dire,
peut-on calculer les coordonnées dans le référentiel au repos
à partir des coordonnées dans le référentiel en mouvement ?
16. On trouvera un récapitulatif historique et une présentation dé-
taillée des travaux de Poincaré en relativité dans la conférence don-
née en 2012 par Thibault Damour dont le texte est ici : http:
//www.ihes.fr/~vanhove/Slides/damour-IHES-novembre2012.pdf

44
La réponse est oui. Et pour cela, il y a deux façons possibles
de faire. Nous pouvons résoudre les équations 1.19 et 1.20
pour exprimer (x, t) en fonction de (x0 , t0 ). Mais il y a une
méthode plus simple. Et si la théorie est cohérente, les deux
méthodes doivent bien sûr produire le même résultat.
Il suffit que nous réalisions qu’il y a une symétrie entre
le référentiel au repos et celui en mouvement. C’est un argu-
ment déjà utilisé par Einstein : aucun observateur ne peut
dire "mon référentiel est bien celui au repos dans l’absolu,
et c’est l’autre qui bouge". Donc pour calculer (x, t) en
fonction de (x0 , t0 ) il suffit d’intervertir les deux jeux de
coordonnées dans les équations 1.19 et 1.20, sans oublier de
changer v et −v. Nous obtenons

x0 + vt0
x= √ (1.21)
1 − v2

t0 + vx0
t= √ (1.22)
1 − v2

En unités conventionnelles
Que deviennent les équations si nous travaillons avec des
unités conventionnelles dans lesquelles c n’est pas égal à 1 ?
Nous pourrions naturellement refaire tous nos calculs en
prenant bien soin de toujours inclure c là où il faut. Il n’y
a en effet rien de magique à la disparition de c en unités
relativistes ; c’est simplement que c’est un facteur égal à
1 à différents endroits des équations. Mais là aussi il y a
plus simple. Nous l’avons déjà dit : il suffit de nous assurer
que nos équations soient cohérentes du point de vue des
dimensions, c’est-à-dire des unités physiques.

45
Ainsi l’expression x − vt ne nécessite pas de correction,
car elle est cohérente en dimension. En effet x et vt sont
toutes les deux des longueurs, en mètres ou en années-
lumière selon les unités avec lesquelles on travaille. En re-
vanche l’expression t−vx n’est pas cohérente en dimension,
car t est un temps, et vx est une longueur au carré divisée
par un temps. Il n’y a qu’une seule façon de corriger l’ex-
pression afin qu’elle soit cohérente en dimension ; c’est de
remplacer t − vx par
v
t − 2x
c

Maintenant les deux termes de l’expression sont des temps.


Et si nous travaillons dans des unités où c = 1 elle se ramène
naturellement à t − vx. √
De même le facteur 1 − v 2 qui apparaît aux dénomi-
nateurs n’est pas cohérent en dimension. Il faut remplacer
v par v/c, qui devient alors une grandeur sans dimension
qu’on peut sans problème soustraire à 1. Avec ces modifi-
cations la transformation de Lorentz prend sa forme tradi-
tionnelle
x − vt
x0 = p (1.23)
1 − (v/c)2

t − vx/c2
t0 = p (1.24)
1 − (v/c)2

Notez que quand v est petite comparée à la vitesse de la


lumière, (v/c)2 est encore beaucoup plus petit. Par exemple,
si v/c = 10% alors (v/c)2 = 1%. Si v/c = 10−5 (ce qui fait
quand même 3 kilomètres par seconde), alors p(v/c) est
2

vraiment un nombre très petit, et l’expression 1 − (v/c)2


au dénominateur est très proche de 1. Dans ce cas, avec une

46
très bonne approximation, on peut écrire

x0 = x − vt

C’est la bonne vieille transformation de Newton de la coor-


donnée spatiale. On l’a apprise à l’école primaire et révisée
au collège : supposez que vous et une autre voiture partiez
ensemble d’un point origine. L’autre voiture roule à 130
km/h, tandis que vous la suivez à seulement 90 km/h. Au
bout d’une heure, la voiture devant vous aura parcouru 130
km, mais elle sera seulement alors 40 km devant vous.
Tournons-nous vers la transformation de la coordonnée
temporelle. Et prenons pour v une vitesse déjà très rapide
de 10 km/s. Alors
v 10 × 103
= = 1, 1 × 10−13
c2 9 × 1016

Là encore avec une très bonne approximation, sauf à des


distances de milliards de kilomètres, la seconde équation
de la transformation de Lorentz redevient l’équation new-
tonienne
t0 = t

Et si la vitesse v est moindre, c’est encore plus vrai.


En résumé, pour des référentiels en déplacement l’un
par rapport à l’autre à une vitesse faible comparée à la vi-
tesse de la lumière, la transformation de Lorentz se ramène
à la transformation de Newton par laquelle nous avions
commencé ce chapitre, section 1.2.1. Seulement quand le
ratio v/c dépasse 10% ou 20%, la correction relativiste de-
vient importante, voire énorme pour des vitesses appro-
chant celles de la lumière.

47
Un peu de terminologie :
- le ratio v/c s’appelle parfois la vitesse réduite et est
dénoté β
- le facteur 1/ 1 − (v/c)2 s’appelle le facteur de Lo-
p

rentz et est dénoté γ


- l’inverse du facteur Lorentz, c’est-à-dire 1 − (v/c)2 ,
p

est dénoté α et s’appelle aussi le facteur de contrac-


tion, pour des raisons que nous allons bientôt voir.

Les autres axes spatiaux


Les équations 1,19 et 1.20, ou de manière équivalente en
unités conventionnelles les équations 1.23 et 1.24, sont les
équations de la transformation de Lorentz. Qu’arrive-t-il
aux autres dimensions spatiales que nous avons ignorées
jusqu’ici ? Rappelez-vous que, si l’on reste dans des considé-
rations seulement spatiales, l’origine du référentiel en mou-
vement se déplace le long de l’axe des x de votre repère. S’il
n’y a qu’une seule dimension spatiale les deux axes spatiaux
sont l’un sur l’autre, dans le sens que quand je marche le
long de la rangée du premier rang ma direction de déplace-
ment est la même que la direction de la rangée.
Mais attention, la manipulation du diagramme de Min-
kowski est plus subtile qu’il n’y paraît. Dans cette repré-
sentation, les référentiels n’ont effectivement qu’une seule
dimension spatiale, mais il y a aussi l’axe du temps t du ré-
férentiel au repos. Alors on a vu que ce qu’on a appelé l’axe
x0 , c’est-à-dire l’ensemble des points synchrones avec (0, 0)
dans le référentiel en mouvement, ne se confond pas avec
l’axe des x sur le diagramme. De même l’axe du temps t0 ,
c’est-à-dire la ligne d’univers de Lenny, ne se confond pas
avec l’axe du temps t.

48
Prenons à présent aussi en compte les axes y et z de
votre référentiel. Le mien a maintenant aussi trois dimen-
sions spatiales. Je me déplace toujours le long de votre axe
des x, et mon repère spatial est simplement en translation
– je ne fais pas de rotation ou de cabriole. Comment les
coordonnées y et z se transforment-elles dans mon référen-
tiel ? Est-ce qu’elles restent les mêmes ou bien, comme x,
changent-elles ?
Réfléchissons comme un physicien. Cela permet souvent
de trouver la réponse à une question sans avoir besoin de
faire des calculs compliqués. L’article d’Einstein de 1905
mentionné plus haut est un modèle du genre, c’est-à-dire
un modèle de raisonnement physique court-circuitant beau-
coup de mathématiques 17 . Qu’est-ce que signifie y ? Sup-
posez que je me déplace le long de l’axe des x et que vous
soyez assis immobile sur l’axe des x. Vous allongez votre
bras dans la direction y, et moi aussi. Supposez encore que
quand nous sommes tous les deux immobiles nos bras aient
la même longueur. Maintenant que je me déplace, quand je
passe devant vous mon bras va-t-il être plus long ou plus
court que le vôtre ?
Par la symétrie de la situation, il est clair que nos bras
vont encore avoir la même longueur, car il n’y pas de raison
que l’un devienne plus court que l’autre. Par conséquent,
le reste de la transformation de Lorentz doit être y 0 = y
et z 0 = z. En d’autres termes, les choses intéressantes se
passent seulement dans le plan (x, t), où le mouvement
relatif est le long de l’axe de x. Les coordonnées x et t se
mêlent selon les équations qu’on a vues pour donner x0 et
t0 . Les autres coordonnées y et z restent passives.

17. Un autre exemple est le calcul de la forme d’une bulle de savon


partiellement gonflée au bout d’un tube de section circulaire dans
lequel on souffle de l’air. Montrer que la bulle est une partie de sphère.

49
Pour mémoire, écrivons les quatre équations de la trans-
formation de Lorentz complète, avec les unités convention-
nelles (donc c apparaît). Les coordonnées sans le signe prime
sont celles dans le référentiel au repos. Les coordonnées avec
le signe prime sont celles dans le référentiel en mouvement :
x − vt
x0 = p (1.25)
1 − (v/c)2

t − vx/c2
t0 = p (1.26)
1 − (v/c)2

y0 = y (1.27)

z0 = z (1.28)

1.2.5 Rien ne va plus vite que la lumière


Un coup d’œil aux équations 1.25 et 1.26 montre que quelque
chose de bizarre se passe si la vitesse relative v des deux
référentiels est supérieure à c. Dans ce cas 1 − (v/c)2 de-
vient négatif, et sa racine carrée devient imaginaire. Cela
n’a clairement pas de sens. Les bâtons de 1 mètre et les hor-
loges peuvent seulement mesurer des coordonnées à valeurs
réelles.
La solution d’Einstein à ce paradoxe est d’introduire un
nouveau postulat : aucun système matériel ne peut aller
plus vite que la vitesse de la lumière. Plus précisément,
aucun système matériel ne peut se déplacer plus rapidement
que la lumière relativement à un autre système matériel par
lequel il peut être observé.

50
Ainsi nous n’avons pas besoin de considérer une vitesse
v d’un référentiel par rapport à un autre plus grande que c.
Ce principe est l’une des pierres angulaires de la physique
moderne. Il est formulé en général comme ceci : aucun si-
gnal ne peut aller plus vite que la lumière. Mais comme les
signaux sont composés d’éléments matériels – ne serait-ce
qu’un photon – signal ou système matériel ici sont la même
chose.
Un caveat s’impose cependant : nous verrons dans le Vo-
lume 5 à venir sur la cosmologie 18 que l’univers est en ex-
pansion. Deux points quelconques de l’univers, même quand
rien d’autre ne se passe, ont leur distance D(t) qui s’accroît
selon l’équation
Ḋ(t)
= H(t)
D(t)
où H(t) est la constante de Hubble (elle est constante dans
l’espace, mais pas nécessairement dans le temps). Alors des
points éloignés de l’univers peuvent s’éloigner l’un de l’autre
à une vitesse supérieure à la vitesse de la lumière. Mais ils
ne peuvent pas être considérés comme transportant avec
eux deux référentiels pouvant faire mutuellement des ob-
servations l’un sur l’autre.

1.3 Transformation de Lorentz générale


Les quatre équations 1.25 à 1.28 nous rappellent que nous
n’avons considéré que la variante la plus simple de transfor-
mation de Lorentz : celle correspondant à un référentiel en
mouvement de translation le long de l’axe x du repère au
repos, et où l’axe x0 du repère en mouvement (mais pas tel

18. Les notes de cours en anglais sur la cosmologie sont disponibles


à https://www.lapasserelle.com/cosmology.

51
que représenté dans le diagramme de Minkowski) se super-
pose avec l’axe x, comme quand Lenny se déplace le long
de la première rangée dans la salle de classe, qui est l’axe
des x et des x0 , et les autres autres axes, de Lenny et de la
salle, restent parallèles respectivement.
Un tel mouvement de translation le long de l’un des axes
à la fois du repère au repos et du repère en mouvement est
simple. Mais nous ne nous trouvons pas toujours dans une
situation aussi simple. Même quand les axes sont parallèles
deux à deux, la translation peut se dérouler dans une di-
rection différente d’un axe. Les deux référentiels peuvent
aussi avoir subi une rotation l’un par rapport à l’autre.
Que deviennent alors les équations de la transformation de
Lorentz ? Un peu de géométrie des déplacements dans l’es-
pace vient à la rescousse pour déterminer comment passer
de (t, x, y, z) à (t0 , x0 , y 0 , z 0 ).
Tout d’abord dans le cas de deux repère avec des axes
parallèles respectivement, mais en translation le long d’une
direction autre que l’un de leurs axes, il est aisé de faire un
changement de repère, sur chacun d’eux, pour être ramené
au cas où x et x0 coïncident spatialement.
Dans le cas où les axes des deux repères ne sont pas pa-
rallèles deux à deux, la transformation de Lorentz générale
est toujours équivalente à :
1. Une première rotation dans l’espace du repère en
mouvement pour l’aligner avec le repère fixe.
2. Une transformation de Lorentz avec des formules si-
milaires aux équations 1.25 à 1.28.
3. Une deuxième rotation dans l’espace pour restaurer
l’orientation initiale du repère mobile.

Tant que vous vous assurez que votre théorie est invariante
par rapport à la transformation de Lorentz simple (équa-

52
tions 1.25 à 1.28) et par rapport aux rotations, elle sera
invariante par rapport à n’importe quelle transformation
de Lorentz.
Un point de terminologie : les transformations de Lo-
rentz correspondant à des déplacements d’un repère par
rapport à un autre s’appellent parfois en anglais des boosts
(poussées). Par exemple, la transformation de Lorentz des
équations 1.25 à 1.28 est un boost le long de l’axe des x.

1.4 Contraction des longueurs et dilata-


tion du temps
Nous avons fait le plus difficile. À partir des idées de base
de la relativité restreinte, avec lesquelles nous nous sommes
familiarisés, nous sommes finalement parvenus aux équa-
tions fondamentales qui en découlent : la transformation de
Lorentz.

Figure 1.5 : Contraction des longueurs.

53
Nous avons à présent tous les outils nécessaires pour étu-
dier les deux résultats contre-intuitifs les plus célèbres de la
relativité restreinte : la contraction des longueurs et le dila-
tation du temps. Comme à l’habitude, si nous progressons
pas à pas, ils sont faciles à comprendre.
Quand vous arrivez à un résultat qui vous laisse per-
plexe, le mieux est de dessiner un diagramme d’espace-
temps. Ne dérangez pas un de vos amis physiciens, ne m’en-
voyez pas un courriel – dessiner un diagramme.

Contraction des longueurs


Voici l’expérience de pensée que nous allons faire. Vous êtes
assis dans le référentiel au repos – la rangée de devant de la
salle de classe, ou bien le long de la voie de chemin de fer
si vous préférez les illustrations ferroviaires. Vous avez un
bâton de 1 mètre avec vous et je passe devant vous, me dé-
plaçant vers la droite. Tandis que j’avance, je me demande :
quelle est la longueur de votre bâton ?
Bien sûr ma question est relativement à mes bâtons de
1 mètre. Mais je dois faire très attention à ce que je veux
dire par là. En particulier, si je ne suis pas soigneux je
risque de mesurer les extrémités de votre bâton à des dates
différentes. Souvenez-vous que des événements synchrones
dans votre référentiel ne le sont pas dans le mien.
Je veux mesurer la distance entre les deux extrémités
de votre bâton à deux dates synchrones pour moi. Pour-
quoi je veux faire ça ? Parce que c’est ce que je veux dire
par longueur de votre bâton dans mon référentiel. C’est la
définition de la longueur de votre bâton dans mon référen-
tiel.
La figure 1.5 est un diagramme d’espace-temps permet-

54
tant de mesurer votre bâton dans votre référentiel ainsi que
dans le mien. Dans votre référentiel, votre bâton est le seg-
ment OQ le long de l’axe des x, qui est la surface 19 de
simultanéité avec t = 0 dans votre référentiel. Le bâton de
1 mètre est au repos, et les lignes d’univers de ses extrémités
sont les deux droites verticales x = 0 et x = 1.
Dans mon référentiel en mouvement, les deux extrémités
du bâton au même temps t0 = 0 sont les événements O et P .
Vous pouvez dire si vous voulez que le bâton est représenté
par le segment OP , mais rappelez-vous que le bâton bouge
pour moi. Repérer ses deux extrémités aux mêmes dates
pour moi, cependant, est parfaitement bien défini.
Je veux connaître les coordonnées spatiales de O et de
P dans mon référentiel. La coordonnées spatiale de O est
très simple, c’est la même dans les deux référentiels, c’est
x0 = x = 0. Pour calculer la coordonnées spatiale x0 de
P , nous allons utiliser notre nouvel outil très puissant : la
transformation de Lorentz.
Notons que P est à l’intersection des droites x = 1 et
t0 = 0. Nous travaillons pour simplifier en unités relati-
vistes. L’équation 1.20 de la transformation de Lorentz in-
dique que t0 = 0 est équivalent à t = vx. En remplaçant
donc t par vx dans l’équation 1.20 on obtient

x − v2x
x0 = √
1 − v2

soit p
x0 = x 1 − v2

19. Rappelez-vous qu’on parle de "surface" bien qu’ici ce soit une


ligne unidimensionnelle car si on tenait compte des coordonnées spa-
tiales y et z serait un espace avec plus de dimensions.

55
C’est la relation entre x et x0 sur la droite de temps syn-
chrones à 0 dans mon référentiel. C’est-à-dire sur ce qu’on
a appelé mon axe des x0 . Pour x par 1, cela donne
p
x0 = 1 − v 2

Voilà notre premier résultat sur les paradoxes de la relati-


vité restreinte ! L’observateur en mouvement découvre qu’à
un instant donné – ce qui veut dire le long d’une surface
de simultanéité pour lui, par exemple t0 = 0 – les deux ex-
trémités de votre bâton de 1√mètre sont, pour lui, séparées
seulement par la distance 1 − v 2 . Le bâton de 1 mètre
pour vous, au repos dans votre référentiel, lui apparaît plus
court.
Cela peut sembler une contradiction que le même bâton
ait deux longueurs différentes dans votre référentiel et dans
le mien. Notez, cependant, que les deux observateurs que
nous sommes ne parlons pas de la même chose. Dans le
référentiel au repos, nous parlons de la distance entre les
événements O et Q, mesurée à l’aide d’un bâton de 1 mètre
du référentiel au repos. On trouve naturellement 1. Dans
le référentiel en mouvement, nous parlons de la distance
entre les événements O et P , mesurée à l’aide d’un de mes
bâtons de 1 mètre. Les événements P et Q ne sont pas les
mêmes événements dans l’espace-temps, il n’y a donc pas
de contradiction à trouver que OP est plus court dans mes
coordonnées spatiales que OQ dans les vôtres.
Notez aussi qu’il semble qu’il soit plus facile de conce-
voir deux événements au temps t = 0 dans le référentiel au
repos, que deux événements au temps t0 = 0 dans le référen-
tiel en mouvement. Mais c’est une illusion d’optique. Pour
moi c’est le temps t0 = 0 qui est plus facile à concevoir.
Et si vous avez l’impression que je dois faire des manipu-

56
lations compliquées pour mesurer la distance entre deux
événements de même temps t0 , la même chose est en réalité
vraie pour vous avec deux événements de même temps t :
vous devez aussi faire des manips de synchronicité.
Ce qui est vrai en revanche est que le bâton que nous
avons considéré était au repos dans votre référentiel, mais
pas dans le mien. La situation n’était pas symétrique. Cela
nous conduit naturellement à l’idée du calcul opposé. Il est
laissé comme exercice au lecteur ou à la lectrice.

Exercice 1.1 : On considère un bâton fixe dans


le référentiel en mouvement, de longueur 1
entre ses deux extrémités. Mesurez la distance
qui les séparent dans le référentiel au repos.

Conseil : N’oubliez pas de commencer par dessiner un


diagramme.

Pour vous aider, si nécessaire, voici le début de la solution.


Pensez au bâton en mouvement, c’est-à-dire fixe dans mon
référentiel. Il est observé par quelqu’un dans le référentiel
au repos. La figure 1.6 illustre la situation. Si le bâton a
la longueur 1 dans son référentiel au repos – c’est-à-dire
le mien, qui est en mouvement –, et que son extrémité de
droite passe à un moment donné par l’événement Q, que
savons-nous de sa ligne d’univers ? Est-ce x = 1 ? Non !
Le bâton fait 1 mètre dans le référentiel en mouvement, ce
qui veut dire que son extrémité au temps t0 = 0 est à la
position x0 = 1. L’observateur au repos voit bien le bâton
comme ayant la longueur OQ car ce sont les événements
par lesquels passent ses deux extrémités au même temps

57
t = 0. Mais la coordonnée x de Q n’est pas 1. C’est une
certaine valeur qu’on peut calculer avec la transformation
de Lorentz.

Figure 1.6 : Exercice sur la contraction des longueurs.

Quand vous faites le calcul, vous devez tomber sur x =



1 − v 2 . C’est-à-dire que √
le bâton est encore une fois rac-
courci par le facteur α = 1 − v 2 qui s’appelle, comme on
l’a dit, le facteur de contraction.
En résumé les bâtons en mouvement apparaissent rac-
courcis aux yeux d’un observateur dans le référentiel fixe,
et les bâtons au repos apparaissent raccourcis aux yeux
d’un observateur dans le référentiel mobile. Il n’y a pas
de contradiction. Encore une fois, les deux observateurs
parlent de choses différentes. L’observateur au repos parle
de distances mesurées en des temps synchrones pour lui.
De même fait l’observateur en mouvement. Mais les événe-
ments synchrones dans un référentiel ne le sont pas dans

58
l’autre, donc les observateurs ne font pas des mesures sur
les mêmes événements. Notez enfin que "faire des mesures
spatiales sur des événements" veut a priori dire "au même
moment" dans son référentiel.

Dilatation du temps
La dilatation du temps est un autre paradoxe qui s’analyse
de la même manière. Supposons que j’aie une montre bra-
celet – c’est donc une horloge en mouvement par rapport
au référentiel au repos. Sa ligne d’univers est simplement
ma ligne d’univers x0 = 0, figure 1.7.

Figure 1.7 : Dilatation du temps.

59
Voici la question que nous nous posons : quand ma montre
marque t0 = 1 dans mon référentiel et que je suis à un cer-
tain événement, quel est le temps de cet événement dans
votre référentiel ? Soit dit en passant, ma montre est excel-
lente, très précise, d’une célèbre marque suisse. Si vous ne
me croyez pas, je l’ai achetée à un horloger qui les vendait
en plein vent au marché 15 euros pièce. Je veux savoir si la
montre de bazar que j’aperçois à votre poignet marque la
même heure quand nous passons par le même événement –
c’est-à-dire le même point sur le diagramme de Minkowski.
La ligne horizontale en pointillé sur la figure est une
surface que vous appelez synchrone. Nous avons besoin de
deux choses pour calculer la valeur t dans votre référentiel.
Tout d’abord, ma montre se déplace sur la droite x0 = 0,
c’est-à-dire mon axe t0 . Et nous savons aussi que t0 = 1 à
l’événement qui nous intéresse. Utilisons une fois de plus la
transformation de Lorentz, l’équation 1.22 cette fois-ci :

t0 + vx0
t= √
1 − v2

On remplace x0 par 0, et t0 par 1, et on obtient


1
t= √
1 − v2

Comme le dénominateur est plus petit que 1, le temps t est


plus grand que 1. En d’autres termes, l’intervalle de temps
entre l’origine et l’événement où nous regardons tous les
deux nos montres est plus grand dans votre référentiel que
dans le mien. Soyons précis : quand je dis que "vous regar-
dez votre montre" je veux dire que vous regardez l’horloge
de votre référentiel qui se trouve au même point spatial que
moi quand ma montre bracelet marque 1. Souvenez-vous

60
que votre référentiel est rempli d’horloges au repos, toutes
synchronisées afin que vous sachiez l’heure n’importe où –
comme on a de nos jours des pendulettes un peu partout
chez soi, et que c’est un pensum de changer d’heure deux
fois par an. Mon référentiel aussi a des horloges partout,
mais là je ne faisais que regarder l’heure à mon poignet 20 .
En somme le temps s’écoule plus rapidement pour l’ob-
servateur au repos que pour celui en mouvement. Pour ce
dernier les secondes sont en quelque sorte dilatées.

Le paradoxe des jumeaux


La dilatation temporelle est à l’origine du célèbre paradoxe
des jumeaux. On considère deux jumeaux, l’un au repos,
appelons-le Castor, et l’autre en mouvement, appelons-le
Pollux. Ils étaient tous les deux au même événement (0, 0)
lors de leur naissance. Castor reste à l’origine de son réfé-
rentiel au repos. Sa ligne d’univers est la droite verticale
x = 0. Pollux quant à lui se déplace avec la vélocité v,
comme on l’a vu à maintes reprises. La chose nouvelle est
que quand Pollux atteint le temps t0 = 1, il fait demi-tour
et revient avec la vélocité −v vers Castor, figure 1.8.

20. Voici une façon simple de concevoir la dilatation du temps, qui


est certainement paradoxale mais néanmoins un phénomène très réel :
considérez une particule qui arrive sur Terre émise par le Soleil et qui
a voyagé à une vitesse proche de celle de la lumière. Vue par nous elle
a mis environ 8 mn pour venir. Cependant de nombreuses particules
émises par le Soleil ont des durées de vie extrêmement brèves mesu-
rées en microsecondes. Alors la particule qui se désintègre au bout de
mettons deux microsecondes a pu voyager pendant 8 mn ? Oui, à sa
montre bracelet la particule n’a vu passer qu’un très bref instant et
ne s’est pas encore désintégrée. Tandis que dans notre référentiel elle
est partie il y a environ 8 mn.

61
Figure 1.8 : Paradoxe des jumeaux.

Au moment où Pollux fait demi-tour, son temps est√t0 = 1,


mais mesuré dans le référentiel de Castor c’est t = 1/ 1 − v 2 .
Quand il rejoint de nouveau Castor, comme les deux par-
ties de son voyage sont en sens inverse l’une de l’autre mais
que ça ne change rien au terme v 2 , à sa montre Pollux a le
temps t0 = 2. Mais Castor le voit revenir au temps
2
t= √
1 − v2

En d’autres termes, étant donné que les horloges biologiques


sont des horloges comme les autres, quand ils se retrouvent

62
les jumeaux n’ont plus le même âge ! Celui qui a voyagé est
revenu un peu plus jeune que celui qui est resté au repos.
Ce phénomène laisse souvent les gens perplexes. Pollux
revient plus jeune que Castor dans le référentiel de Cas-
tor. Est-ce à dire que Castor, quand les deux frères se re-
trouvent, est vu comme plus jeune que Pollux dans le ré-
férentiel de Pollux ? La réponse est non. Observez en efjet
qu’on ne peut pas renverser le raisonnement. Du point de
vue du jumeaux voyageur, son frère n’est pas plus jeune
quand ils se retrouvent. Pourquoi ne peut-on pas renverser
le raisonnement ? Parce que le référentiel de Pollux n’est
pas un référentiel inertiel, en tout cas pas au moment où il
fait demi-tour. Il subit alors une forte accélération.
Voici un exercice pour approfondir notre compréhension
du paradoxe.

Exercice 1.2 : Dans la figure 1.8, Pollux non


seulement change de direction, mais ce faisant
passe d’un référentiel inertiel de vélocité v à un
référentiel inertiel de vélocité −v.
a) Utiliser la transformation de Lorentz pour
montrer que tant que Pollux n’a pas fait
demi-tour, la relation entre les jumeaux
est symétrique. Chaque jumeau voit son
frère vieillir moins vite que lui-même.
b) Utiliser les diagrammes d’espace-temps
pour montrer que le changement abrupt
de référentiel inertiel par le jumeau voya-
geur bouleverse aussi sa notion de simul-
tanéité. Dans le nouveau référentiel de
Pollux, après le demi-tour, Castor prend
un soudain coup de vieux.

63
Une autre source de confusion vient tout simplement de
la géométrie. Sur la figure 1.7, rappelez-vous que la du-
rée, dans le référentiel en mouvement, de l’événement O
à l’événement (x0 = 0, t0 = 1) est plus courte que celle,
dans le référentiel au repos, de l’événement O à l’événe-
ment (x = 0, √ t), où t est relié à t par la ligne pointillée.
0

On a t = t / 1 − v .
0 2

Si on se fiait naïvement aux longueurs des segments


sur le dessin, il semblerait que la première durée soit plus
longue que la seconde. Mais c’est parce que les longueurs ou
les durées en théorie de la relativité ne correspondent pas
simplement aux longueurs des segments sur le diagramme
de Minkowski. Le diagramme peut nous induire en erreur
si nous l’utilisons sans précaution.
En fait, ces différents puzzles vont nous conduire à l’une
des notions centrales de la théorie de la relativité, le concept
d’invariant 21 . Nous discuterons en détail de ce concept
dans la section 1.5.

La Coccinelle et la Limousine
Tournons-nous vers un autre paradoxe appelé parfois aux
États-Unis Le Polonais dans la grange (les Belges l’appel-
leraient Le Français dans la grange), mais que les Polonais
préfèrent appeler La Coccinelle et la Limousine.

21. Einstein a dit plus tard qu’il aurait préféré le nom de théorie
de l’invariance à celui de théorie de la relativité. Ce dernier nom s’est
néanmoins imposé peu à peu à la suite du postulat qu’Einstein a
appelé le principe de relativité qui dit que les lois de la nature doivent
avoir la même expression dans tous les référentiels galiléens, car le
mouvement d’un référentiel est seulement relatif. Près de trois siècles
plus tôt Galilée l’exprimait à sa manière en disant : "tal movimento
è come se non fosse", un tel mouvement est comme s’il n’était pas.

64
La voiture de Art est une Volskwagen coccinelle. Elle fait
4,3 mètres de long. Les dimensions du garage de Art per-
mettent juste de l’y garer.

Lenny possède une limousine allongée de 8,6 mètres de long.


Art s’apprête à partir en vacances, et à louer sa maison à
Lenny, mais avant de partir les deux amis veulent vérifier
que la voiture de Lenny rentrera bien dans le garage. Lenny
est sceptique, mais Art a un plan. Il dit à Lenny de reculer
suffisamment puis d’enfoncer le champignon pour accélérer
comme un dingue. Si Lenny parvient à ce que la limo at-
teigne 87% de la vitesse de la lumière avant d’entrer dans
le garage, ça ira. Ils essaient.

Art regarde depuis le trottoir tandis que Lenny recule, puis


passe en marche avant et appuie sur l’accélérateur. Le comp-
teur monte à 90% de la vitesse de la lumière, et Lenny en a
encore sous le pied. Soudain il lève les yeux vers le garage :
« Bon Dieu ! Le garage fonce vers moi à toute vitesse, et il
est deux fois plus petit que sa taille originale ! Je ne vais
jamais rentrer ! »

Art : « Mais si, mais si, Lenny, ça va rentrer, lui crie Art.
D’après mes calculs, dans le référentiel du garage ta voiture
fait un peu moins de 4 mètres. Pas de souci. »

Lenny : « Oh, Art, j’espère que tu ne t’es pas trompé. »

La figure 1.9 est un diagramme d’espace-temps sur lequel


on a représenté le garage de Art (région claire verticale car
on s’est placé pour le dessin dans le référentiel du garage)

65
et la limousine de Lenny (région foncée inclinée car la limo
se déplace à vitesse constante).

Figure 1.9 : Diagramme d’espace-temps de la rentrée d’une li-


mousine dans un garage étriqué.

L’avant de la limo entre dans le garage à l’événement a et


en sort (en supposant que Art a laissé la porte du fond
ouverte) un peu au dessus de l’événement c. L’arrière de la
limo entre à b et sort à d. Examinons le segment bc. Il fait
partie d’une surface de simultanéité du référentiel au repos
du garage, et comme on peut le constater toute la limo
est contenue dans le garage à ce moment-là. C’est bien ce

66
qu’affirme Art : dans son référentiel la limousine peut tenir
dans le garage.
Mais regardons maintenant la situation du point de vue
de Lenny. Le segment be est une surface de simultanéité
de Lenny. (Il a une pente symétrique de celles des lignes
d’univers de la limo de Lenny par rapport à la diagonale à
45°.) On constate que la limo déborde largement des limites
du garage. Lenny a raison de se faire du souci : dans son
référentiel sa voiture ne tient pas dans le garage.
La figure montre bien quel est le problème. Dire que la
limousine tient dans le garage veut dire qu’on peut faire
rentrer simultanément l’avant et l’arrière de la voiture dans
le garage. C’est le mot simultanément qui est important.
Simultanément pour qui ? Pour Art, ou pour Lenny ? Dire
que la voiture est entrée dans le garage a simplement un
sens différent selon le référentiel. Il n’y a pas de contradic-
tion à dire qu’à une certaine date t du point de vue de Art
la limo était totalement dans le garage – et qu’à aucune
date t0 du point de vue de Lenny la limo était totalement
dans le garage.
Presque tous les paradoxes de la relativité restreinte se
résolvent de manière évidente quand on énonce avec soin ce
qu’ils disent 22 . Prêtez attention à l’usage implicite du mot
simultanément. C’est généralement là que ce trouve la faille
dans le raisonnement – simultanément pour qui ?

22. Cela est vrai dans beaucoup de domaines. Par exemple en théo-
rie des probabilités, les paradoxes proviennent souvent du fait qu’on a
implicitement changé en cours de route l’expérience aléatoire dont on
parle. Par exemple le paradoxe de Monty Hall, qui mystifiait tant le
mathématicien Paul Erdös (1913 - 1996), s’explique ainsi en quelques
lignes.

67
1.5 L’univers de Minkowski
L’un des outils les plus puissants dans la boîte à outil du
physicien – comme dans celle du mathématicien – est le
concept d’invariant. Comme son nom l’indique un inva-
riant est une quantité qui ne change pas quand beaucoup de
choses changent autour d’elle. Par exemple, quand un même
espace peut être décrit de deux manières différentes, avec
des repères qui collent des étiquettes différentes aux mêmes
points, c’est une quantité qui a la même valeur calculée dans
les deux repères 23 . Ce n’est pas le cas des coordonnées des
points d’un espace vectoriel, ou des composantes des vec-
teurs ou des tenseurs. Ici on va regarder certains aspects de
l’espace-temps qui prennent la même valeur dans tous les
référentiels galiléens.
Pour bien comprendre l’idée, commençons par un exem-
ple issu de la géométrie euclidienne. On considère un plan
muni d’un premier repère cartésien attribuant des coordon-
nées (x, y) aux points, et d’un deuxième repère cartésien
attribuant les coordonnées (x0 , y 0 ) aux mêmes points. Les
deux repères ont la même origine, et les axes du deuxième
ont simplement été obtenus par une rotation d’un angle θ
dans le sens positif des axes du premier. Il n’y a pas d’axe
du temps dans cet exemple, et pas d’observateur en mou-
vement. C’est juste de la géométrie euclidienne ordinaire
telle qu’on l’a apprise au collège et au lycée. Le figure 1.10
représente le plan avec ses deux repères cartésiens.

23. Plus généralement, en mathématiques, une quantité calculée à


partir des éléments d’un espace est dite invariante par une transfor-
mation de l’espace quand sa valeur calculée à partir des transformés
des éléments ne change pas. Par exemple on a appris au lycée en géo-
métrie que les birapports sont invariants par projection centrale. La
théorie des invariants a été développée par David Hilbert (1862-1943).

68
Figure 1.10 : Plan euclidien muni de deux repères cartésiens.

Considérons un point P arbitrairement choisi dans le plan.


Les deux systèmes n’assignent pas les mêmes coordonnées
au point P . La transformation qui permet de passer de
(x, y) à (x0 , y 0 ), si l’on se rappelle la trigonométrie de
lycée, est
x0 = x cos θ + y sin θ
(1.29)
y 0 = −x sin θ + y cos θ

Les coordonnées d’un point ne sont donc pas invariantes


par changement de repère.
Il y a cependant une quantité qui reste la même que
nous la calculions à l’aide du premier repère ou du second :
c’est la distance de P à l’origine.
Notez qu’on peut aussi voir le changement de repère
comme une transformation du plan vers lui-même et consta-
ter que c’est une isométrie, en ce sens qu’elle préserve les

69
distances définies à l’aide du théorème de Pythagore. Mais
restons avec l’idée plus naturelle en physique que les points
ne bougent pas, seulement leurs coordonnées.
La distance OP estp définie comme x2 + y 2 . On sait
p

qu’elle est la même que x02 + y 02 . Le lecteur ou la lectrice


sont invités à le vérifier pour s’exercer à travailler avec une
transformation de coordonnées.
C’est vrai aussi du carré de la distance. On a donc tou-
jours
x2 + y 2 = x02 + y 02

Nous disons que x2 + y 2 est une quantité invariante par la


transformation 1.29.

La question qui vient à l’esprit est : y a-t-il une quan-


tité analogue dans l’espace-temps qui soit invariante par
la transformation de Lorentz ?
On considère maintenant un point P dans le diagramme
de Minkowski – ce qu’on a appelé un événement – de coor-
données (x, t) dans le référentiel au repos, et de coordon-
nées (x0 , t0 ) dans le référentiel en mouvement. Quelle est la
relation entre (x0 , t0 ) et (x, t) ? C’est la transformation de
Lorentz donnée par exemple par les équations 1.19 et 1.20,
reproduites ci-dessous
x − vt
x0 = √
1 − v2
t − vx
t0 = √
1 − v2

Pensez-y comme au pendant, dans le diagramme de Min-


kowski de la relativité restreinte, du jeu d’équations 1.29
dans le plan euclidien ordinaire.

70
Qu’est-ce qui pourrait être invariant ? Voyons si t02 +
x02 = t2 + x2 . Un peu d’algèbre donne pour le côté gauche

t2 + v 2 x2 − 2vtx x2 + v 2 t2 − 2vtx
+
1 − v2 1 − v2

Est-ce égal à t2 + x2 ? Non, c’est impossible. Une chose


saute immédiatement aux yeux : si les termes en tx ont le
même signe, ils ne peuvent pas s’annuler. Et t02 + x02 ne
peut pas être égal à t2 + x2 puisque ce dernier ne contient
pas de terme croisé.
Mais si au lieu d’additionner nous soustrayons x02 à t02
les termes en tx vont disparaître. Voyons ce qu’on trouve.
En poussant les équations on obtient

t2 + v 2 x2 − 2vtx x2 + v 2 t2 − 2vtx
t02 − x02 = −
1 − v2 1 − v2
2 2 2
t −x +v x −v t 2 2 2
=
1 − v2
(t − x )(1 − v 2 )
2 2
=
1 − v2
= t − x2
2

Super ! Nous avons découvert quelque chose d’important :


il y a une quantité invariante. Dans la transformation de
Lorentz, la combinaison t02 moins x02 reste la même que
t 2 − x2 .
C’est presque comme le théorème de Pythagore, c’est-
à-dire une sorte de distance à l’origine dans le diagramme
de Minkowski. Cette quantité est dénotée

τ 2 = t 2 − x2 (1.30)

et elle est invariante par la transformée de Lorentz. C’est-

71
à-dire qu’on a aussi
τ 2 = t02 − x02

La racine carrée de τ 2 porte un nom en théorie de la re-


lativité : c’est le temps propre de l’événement P . D’autres
auteurs utilisent la racine carrée de x2 − t2 , et l’appellent
parfois la distance propre. Mais dans ce livre nous utilise-
rons le temps propre.
Le point important à retenir est la notion d’invariant.
−−→ −−→
Les composantes d’un vecteur OP ou d’un déplacement P Q
dans l’espace-temps ne sont pas des invariants. Elles dé-
pendent du référentiel utilisé. Ce qui est invariant – c’est-
à-dire sur la valeur de quoi tout le monde s’accorde – est
τ 2 (ou de manière équivalente τ ).
La raison pour ce nom de "temps propre" deviendra
claire dans la section 1.6. Mais regardons d’abord ce que
devient l’invariance quand on considère aussi les dimensions
spatiales y et z.

Généralisation à 3 dimensions spatiales


Dans le diagramme de Minkowski on ne considère qu’une
seule dimension spatiale, l’axe des x. Mais la transforma-
tion de Lorentz la plus générale tient compte aussi des di-
mensions y et z. Rappelez-vous que la forme générale est
donnée par les équations 1.25 à 1.28 que nous reproduisons
ci-dessous quand on utilise des unités relativistes (c’est-à-
dire avec c = 1)
x − vt
x0 = √
1 − v2
t − vx
t0 = √
1 − v2

72
y0 = y

z0 = z

Ce sont les équations quand les axes spatiaux sont parallèles


deux à deux et que le référentiel en mouvement glisse le long
de l’axe des x – ce qu’on appelé un boost le long de l’axe
des x.
Comme je l’ai expliqué dans la section 1.3 quand le ré-
férentiel en mouvement a été tourné et se déplace le long
d’une direction quelconque, on peut voir la transformation
de Lorentz la plus générale comme une première rotation
purement spatiale, suivie d’une transformation de Lorentz
avec les équations d’un boost, puis une seconde rotation
purement spatiale. Comme les rotations purement spatiales
ne changent pas x2 + y 2 + z 2 et n’affectent pas le temps,
une quantité invariante par les équations de Lorentz d’un
boost sera invariante par n’importe quelle transformation
de Lorentz générale.
Quand on considère l’espace avec trois dimensions spa-
tiales plus une quatrième dimension du temps, le temps
propre n’est plus défini par l’équation 1.30 mais par l’équa-
tion plus générale suivante

τ 2 = t 2 − x2 − y 2 − z 2 (1.31)

Il est laissé au lecteur ou à la lectrice le soin de vérifier que


le temps propre ne change pas dans un boost le long de l’axe
des x, et donc dans aucune transformation de Lorentz.

73
1.5.1 Cône de lumière de Minkowski
L’invariance du temps propre τ est un fait important. Je
ne sais pas si Einstein en était conscient quand il écrivit
son article fondateur, mais pour préparer cette section j’ai
rouvert mon vieil exemplaire ayant beaucoup servi, dans
l’édition Dover, du livre qu’Einstein publia en 1916 sur la
théorie de relativité restreinte et générale et dans lequel se
trouve reproduit son article de 1905 (le prix sur la couver-
ture de mon exemplaire était $1.50). Je n’ai trouvé dans
l’article de 1905 aucune mention de l’équation 1.31 ou de
l’idée d’espace-temps 24 .

Figure 1.11 : Cône de lumière de Minkowski.

24. Le livre est disponible en français : Albert Einstein, La théorie


de la relativité restreinte et générale, Dunod, Paris, 1999. L’article de
1905 ne mentionnait pas l’espace-temps ni la notion de temps propre,
mais le livre de 1916 les mentionne et les utilise tous les deux.

74
C’est Minkowski qui a le premier compris que l’invariance
du temps propre, avec son étrange signe moins entre t2 et
x2 , formerait la base d’une géométrie entièrement nouvelle :
la géométrie de l’espace-temps – ou encore espace de Min-
kowski. Le crédit pour avoir complété en 1908 la révolution
de la relativité restreinte, initiée par Einstein trois ans plus
tôt, revient à Minkowski. C’est à lui que nous devons le
concept de temps comme quatrième dimension d’un espace-
temps à quatre dimensions 25 .
Suivant Minkowski, considérons la trajectoire d’un rayon
lumineux émis depuis l’origine. Imaginons un flash lumi-
neux – un événement consistant en une lampe qui s’allume
très brièvement et s’éteint à nouveau – envoyé depuis l’ori-
gine et se propageant dans toutes les directions. Après une
période de temps t il aura voyagé sur une distance ct. Nous
pouvons décrire ce rayon par l’équation

x2 + y 2 + z 2 = c2 t2 (1."é)

C’est l’équation d’un cône dans l’espace-temps. On peut


le visualiser en trois dimensions (représenté sur la page en
deux dimensions) si nous nous limitons à deux coordon-
nées spatiales x et y, plus la dimension temporelle t, figure
1.11. Minkowski n’a pas lui-même dessiné le cône, mais il
l’a décrit en détail.
En géométrie un cône complet a deux parties comme
un diabolo. La partie supérieure du cône de la figure 1.11
s’appelle le cône de lumière futur. Et la partie inférieure, le
cône de lumière passé.
Dans la suite du texte nous retournons à l’espace-temps

25. L’article fondamental de Minkowski sur la relativité restreinte


est disponible sur le site : http://www.minkowskiinstitute.org/
mip/MinkowskiFreemiumMIP2012.pdf chapitre 2.

75
avec seulement deux dimensions, une spatiale et une tem-
porelle, mais suivant l’usage nous parlerons parfois quand
même de cône pour le lieu d’équation x2 = c2 t2 .

1.5.2 Signification physique du temps


propre
Pour chaque événement de l’espace-temps, la quantité in-
variante τ 2 – c’est-à-dire qui ne dépend pas du référentiel
inertiel, pourvu qu’ils aient la même origine (0, 0) – n’est
pas seulement une abstraction mathématique ; elle a une
signification physique et expérimentale.

Figure 1.12 : Temps propre.

Considérons les deux référentiels habituels fixe et mobile,


et aussi dans le diagramme de Minkowski l’événement D
situé sur la ligne d’univers de l’origine du référentiel en

76
mouvement, figure 1.12. C’est-à-dire, plus simplement, que
Lenny en se déplaçant à vélocité constante passera par
l’événement D.
La ligne d’univers de Lenny est aussi son axe t0 . C’est
l’axe du temps qui passe dans son référentiel. Dans celui-ci,
Lenny reste à la coordonnée spatiale x0 = 0, et le temps t0
est par définition le temps qu’il lit à sa montre-bracelet. On
se rappelle qu’il repère le temps d’un événement quelconque
avec sa collection d’horloges synchrones.
La quantité τ 2 , calculable en chaque événement de l’espa-
ce-temps, a la même valeur dans les deux référentiels. Pour
n’importe quel événement de coordonnées (x, t) et (x0 , t0 )
dans l’espace-temps on a

t2 − x2 = t02 − x02 = τ 2

(Il n’est pas nécessaire d’introduire une variable τ 0 .) Donc


en particulier au point D, où x0 = 0, on a

t2 − x2 = t02 = τ 2

et donc
t0 = τ

En d’autres termes, pour n’importe quel événement par le-


quel passe Lenny à un moment donné, le temps propre de
cet événement est tout simplement le temps que Lenny lit
à sa montre. Cela mérite que l’on insiste :

Une personne partie de l’origine au temps 0 et se déplaçant


dans l’espace à vélocité constante perçoit toujours comme
temps, à sa montre, le temps propre des événements par
lesquels elle passe.

77
Pour terminer cette section sur le temps propre, don-
2
nons son équation en unités conventionnelles : τ 2 = t2 − xc2 .

1.5.3 Intervalles d’espace-temps


Nous venons de voir que le terme temps propre a un sens
physique et quantitatif. J’ai aussi mentionné plus haut,
pour x2 − t2 , le terme de distance propre (au carré) à l’ori-
gine. Ce n’est rien d’autre que l’opposé de τ 2 . C’est donc
aussi un invariant, et n’introduit pas d’idée nouvelle.
Dorénavant nous allons utiliser le terme plus précis d’in-
tervalle d’espace-temps pour la quantité ∆s, définie ci-après,
entre deux événements. Elle sera en général considérée dans
sa version au carré (∆s)2 , et pour alléger les notations nous
la noterons sans parenthèses.
On considère deux événements P et Q de coordonnées
respectives (t1 , x1 , y1 , z1 ) et (t2 , x2 , y2 , z2 ). On définit
∆t comme t2 −t1 , ∆x comme x2 −x1 , etc.. Alors l’intervalle
d’espace-temps ∆s entre P et Q est défini par

∆s2 = −∆t2 + (∆x2 + ∆y 2 + ∆z 2 )

Ainsi l’intervalle d’espace-temps, noté simplement s, entre


l’origine et l’événement (t, x, y, z) a pour carré

s2 = −t2 + (x2 + y 2 + z 2 )

En d’autres termes, s2 n’est rien d’autre que −τ 2 . Les nota-


tions dans la littérature scientifique de la relativité ne sont
malheureusement pas totalement fixées, et certains auteurs
dénotent s2 ce que nous dénotons τ 2 . Mais nos notations
(s pour une distance et τ pour un temps – sans oublier que

78
la vitesse de la lumière, égale à 1 en unités relativistes, est
présente implicitement selon les formules en multiplicateur
de t, ou en diviseur des coordonnées spatiales), qui sont les
plus courantes, sont aussi les plus naturelles.

Jusqu’à présent la différence entre les concepts τ 2 et s2 a


été mince (un simple changement de signe), mais elle va
bientôt devenir importante.

1.5.4 Intervalles de type temps, de type


espace, et de type lumière
Parmi les nombreuses idées géométriques introduites par
Minkowski en théorie de la relativité il y a, entre les paires
d’événements, les concepts de séparation de type temps, de
type espace et de type lumière. La classification repose sur
le signe de l’invariant

∆τ 2 = ∆t2 − (∆x2 + ∆y 2 + ∆z 2 )
ou de son alter ego

∆s2 = −∆t2 + (∆x2 + ∆y 2 + ∆z 2 )

Nous allons utiliser ce dernier. Et pour commencer regar-


dons simplement l’intervalle (au carré) entre l’origine O et
un événement P quelconque de coordonnées (t, x, y, z).
Nous regardons
s2 = −t2 + (x2 + y 2 + z 2 )

Cette valeur s2 peut être négative, positive ou nulle. Alors


nous dirons que l’intervalle d’espace-temps entre O et P est
respectivement

79
a) de type temps si s2 < 0,
b) de type espace si s2 > 0,
c) de type lumière si s2 = 0.

Pour nourrir notre intuition sur ces catégories, pensons à un


signal lumineux partant d’Alpha du Centaure au temps 0
dans le référentiel galiléen fixe par rapport à nous 26 . Il met
à peu près 4 ans pour nous atteindre. Dans cet exemple, le
référentiel est fixe par rapport à nous (ou nous par rapport
à lui, si l’on préfère), mais l’origine est placée à l’étoile,
et nous considérons le cône de lumière futur du flash émis
depuis l’étoile. Reportez-vous à la figure 1.11 : Alpha du
Centaure est à l’origine et nous regardons le cône supérieur.
Quand le rayon lumineux nous atteint c’est un événement
positionné quelque part dans le diagramme d’espace temps.
En fait il est sur le cône puisque c’est un rayon lumineux.
Et il est à la hauteur t = 4 ans puisque c’est le temps qu’il
a mis, de notre point de vue, pour venir.
Pour les lectrices ou lecteurs qui aiment bien anticiper
ce qui va venir, voici un petit exercice.

Exercice 1.3 : Quel est le temps propre du rayon


lumineux quand il nous atteint ? En d’autres
termes, imaginez un être à califourchon sur
le photon émis par Alpha du Centaure, qui
regarde sa montre bracelet au départ t0 = 0, et à
l’arrivée. Quel temps t0 voit-il alors à sa montre ?

Conseil : Utilisez l’invariance de τ .

26. La Terre n’offre pas tout à fait un référentiel galiléen – c’est


pourquoi on lance les fusées Ariane depuis Kourou près de l’équateur
– mais c’est une bonne approximation.

80
On trouve encore t0 = 0 ! Le temps en quelque sorte ne
s’écoule pas quand on voyage sur un rayon lumineux. On
avait déjà commencé à le comprendre avec les particules
de durée de vie très courte, mesurées en microsecondes,
émises par le Soleil et qui mettent néanmoins 8 mn pour
nous atteindre.
Passons maintenant à la classification des intervalles
d’espace-temps.

Intervalle de type temps

Considérons tout d’abord un événement P à l’intérieur du


cône de la figure 1.11, peu importe si on regarde la par-
tie supérieure ou inférieure. C’est un événement tel que sa
coordonnée spatiale est en valeur absolue plus grande que
sa distance géométrique (racine carrée de x2 + y 2 + z 2 ) à
l’origine. En d’autres termes

−t2 + (x2 + y 2 + z 2 ) < 0

L’intervalle entre O et P est dit de type temps. On dit aussi


parfois que l’événement P lui-même est de type temps re-
lativement à l’origine. Tous les événements de l’axe t, c’est-
à-dire la ligne d’univers de l’origine, sont bien sûr, et c’est
heureux, de type temps.
Si un événement sur Terre se passe à une date t supé-
rieure à 4 ans par rapport à l’émission du rayon lumineux
depuis Alpha du Centaure, il est de type temps relative-
ment au flash. Les événements de ce type ont lieu trop tard
pour être éclairés par le rayon ; il sera déjà passé.
Plus généralement deux événements ont une sépara-
tion ou forment un intervalle de type temps si dans le dia-

81
gramme de Minkowski la pente du segment qui les joint a
plus de 45°.
Il faut noter la propriété importante suivante : être de
type temps (ou de type espace ou de type lumière – nous
allons le voir dans un instant) est une caractéristique in-
variante dans un changement de référentiel inertiel, c’est-
à-dire dans une transformation de Lorentz. En effet le seg-
ment joignant les deux événements reste plus pentu que la
bissectrice indépendamment du référentiel.

Intervalle de type espace

Les événements de type espace (relativement à l’origine)


sont ceux à l’extérieur du cône. Leurs coordonnées satisfont
l’équation
−t2 + (x2 + y 2 + z 2 ) > 0

Pour ces événements la distance géométrique à l’origine est


plus grande que la distance temporelle.
Les événements de type espace sont trop loin, à leur
date t, pour que le rayon lumineux puisse les atteindre. Et
un quelconque événement se déroulant sur Terre plus tôt
que 4 ans après le départ du rayon lumineux de l’étoile ne
pas être affecté par l’événement qui créa le flash.
Plus généralement deux événements ont une séparation
ou forment un intervalle de type espace si dans le dia-
gramme de Minkowski la pente du segment qui les joint
a moins de 45°.
À nouveau, c’est une caractéristique qui ne dépend pas
du référentiel.

82
Intervalle de type lumière

Finalement il y a les événement sur le cône. Leurs coordon-


nées satisfont

−t2 + (x2 + y 2 + z 2 ) = 0

Ce sont ceux que le rayon lumineux émis depuis l’étoile


peuvent atteindre. Ils sont dits de type lumière. Une per-
sonne située à un événement de type lumière relativement
à l’origine verra le flash de lumière.

1.6 Perspective historique


Einstein

Les gens se demandent souvent si l’affirmation d’Einstein


selon laquelle "la vitesse c de la lumière est une loi de la
physique" était basée sur des considérations théoriques ou
bien sur des résultats expérimentaux – en particulier l’ex-
périence de Michelson-Morley. Bien sûr on ne peut pas être
certain de la réponse. Personne ne sait réellement ce qu’il
y a dans l’esprit de quelqu’un d’autre. Einstein lui-même a
toujours dit qu’il n’avait pas entendu parler du résultat de
Michelson et Morley quand il écrivit son article de 1905. Je
pense qu’il y a toutes les raisons de le croire.
Einstein démarra ses réflexions en considérant que les
équations de Maxwell étaient des lois de la physique. Il sa-
vait qu’elles produisaient des solutions ondulatoires dans
l’espace et le temps se déplaçant à la vitesse de la lumière –
au sens qu’un pic de sinusoïde se déplace avec la vitesse c.
À l’âge de seize ans, en 1895, il se demandait déjà ce que

83
verrait quelqu’un qui se déplacerait le long d’un rayon lumi-
neux avec la même vitesse. La réponse "évidente" est qu’il
verrait un champ électrique et un champ magnétique tous
les deux statiques avec une forme ondulatoire immobile. Il
sentait que cela ne pouvait pas être vrai – car ce n’était
pas une solution des équations de Maxwell. Ces équations
disent que la lumière se déplace avec la vitesse c.
En langage moderne nous expliquerions le raisonnement
d’Einstein un peu différemment. Nous dirions que les équa-
tions de Maxwell présentent une symétrie – une collection
de transformations des coordonnées telle que les équations
ont la même forme dans tous les référentiels. Si vous pre-
niez les équations de Maxwell, qui contiennent les coordon-
nées spatiale et temporelle, x et t, et appliquiez les bonnes
vieilles lois de changement galiléennes,
x0 = x − vt
t0 = t
vous trouveriez que les équations de Maxwell revêtent une
nouvelle forme dans les coordonnées avec des primes.
Cependant, si vous appliquez une transformation de
Lorentz aux coordonnées dans les équations de Maxwell,
ces équations avec les nouvelles coordonnées ont exacte-
ment la même forme qu’avec les anciennes. En langage mo-
derne, l’accomplissement remarquable d’Einstein fut de re-
connaître que la symétrie des équations de Maxwell n’était
pas les transformations de Galilée (qu’on appelle aussi les
transformations de Newton) mais les transformations de
Lorentz. Il ramassa tout cela en un seul principe. Dans un
sens, il n’avait même pas besoin de connaître les équations
de Maxwell (bien que, bien sûr, il les connût). Tout ce qu’il
avait besoin de savoir était que les équations de Maxwell
sont des lois de la physique, et que ces lois imposent que la

84
lumière ait une certaine vélocité. À partir de là, il pouvait
travailler avec seulement des rayons lumineux.

Lorentz

Lorentz connaissait l’expérience de Michelson-Morley. Il par-


vint quelques années avant Einstein au jeu d’équations qui
portent le nom de transformation de Lorentz, mais il les
interpréta différemment 27 . Il considérait qu’elles représen-
taient un effet sur les objets en mouvement causé par l’ether.
À cause d’une sorte de pression exercée par l’ether sur les
objets en mouvement, comme l’eau sur la proue d’un navire
qui avance, les objets se contractaient et donc raccourcis-
saient.
Était-il dans l’erreur ? J’imagine qu’on peut dire qu’en
un certain sens il ne l’était pas. Mais il n’avait certaine-
ment pas la vision d’Einstein d’une symétrie – la symétrie
que l’espace et le temps doivent avoir afin qu’ils s’accordent
avec le principe de relativité et celui que la vélocité de la
lumière est la même dans tous les référentiels galiléens. Per-
sonne ne prétendrait que Lorentz avait fait ce qu’a fait Ein-
stein – Lorentz lui-même ne l’a jamais prétendu. En outre
Lorentz pensait que ses équations n’étaient pas exactes mais
seulement une première approximation. Un objet se dépla-
çant à travers un fluide est effectivement raccourci et en
première approximation la contraction de Lorentz mesure
correctement cette contraction. Lorentz était convaincu que

27. Poincaré parvint aussi aux équations de Lorentz et montra lui-


même, peu avant l’article d’Einstein, qu’elles étaient une symétrie
pour les équations de Maxwell. Mais il refusa d’en déduire qu’il fal-
lait abandonner le temps universel et s’en tint à une interprétation
compliquée.

85
le résultat de l’expérience de Michelson et Morley n’était
pas parfaitement exact. Il pensait qu’il devait y avoir des
termes en v/c à des puissances supérieures dans sa transfor-
mation, et que les techniques expérimentales deviendraient
suffisamment précises pour détecter des différences dans la
vitesse de la lumière selon le référentiel. C’est Einstein qui
déclara que la vitesse de la lumière était en réalité une loi
de la physique et donc la même dans tous les référentiels
galiléens car ils sont par nature indistinguables.

Minkowski

La contribution essentielle de Minkowski n’est pas tant d’a-


voir proposé son diagramme, que d’avoir insisté sur le fait
que l’invariant t2 −x2 était comparable dans l’espace-temps
à la distance ordinaire au carré dans l’espace euclidien. Il
engendre une géométrie qui n’est pas euclidienne, ni même
riemannienne 28 , mais qui n’est pas incohérente et qui est
très puissante pour se représenter les phénomènes relati-
vistes et l’électrodynamique.
Dans cette géométrie, la "distance" entre deux événe-
ments peut être nulle (∆t2 − ∆x2 = 0) sans qu’ils ne coïn-
cident. Tous les événements sur la trajectoire d’un rayon
lumineux émis depuis l’origine, dans toutes les directions,
ont le même temps propre (égal à zéro). C’est le cône de
lumière de Minkowski.
Cette géométrie, appelée géométrie de Minkowski, est
fondamentale aussi en théorie de la relativité générale, qui
à de nombreux égards est une théorie de la géométrie min-

28. En simplifiant, la géométrie riemannienne est la géométrie sur


une surface en caoutchouc non plane. Elle reste localement eucli-
dienne.

86
kowskienne de l’univers, affectée en chaque point cependant
par la répartition des énergies et impulsions.
Minkowski étant mort d’une crise d’appendicite en 1909,
en pleine possession de ses moyens intellectuels à l’âge de 44
ans, il n’a pas pu participer à l’élaboration de la théorie de
la relativité générale 29 . Il émit sur son lit de mort l’espoir
que ses contributions qui avaient été beaucoup critiquées
pour leur mathématisation et abstraction à outrance selon
certains, dont Einstein, s’avéreraient utiles. Son vœu fut
exaucé. Elles jouèrent effectivement un rôle déterminant.
Car autant on pouvait développer la relativité restreinte
sans connaître la géométrie minkowskienne ni le calcul ten-
soriel, autant c’est impossible pour la relativité générale. Et
nous les utiliserons nous-même beaucoup dans le présent
volume sur la relativité restreinte et l’électromagnétisme.
Par la suite les équations fondatrices de la théorie de la
relativité générale, reliant courbure de l’univers et réparti-
tion des énergies et impulsions, ont été trouvées indépen-
damment par Einstein et par Hilbert à la fin de 1915.

Nous en avons fini avec les idées et concepts de base de


la relativité restreinte. Si vous consacrez le temps néces-
saire pour bien assimiler tout ce qui a été présenté dans
ce premier chapitre copieux, le reste du livre sera facile –
relativement bien sûr.

29. Hermann Minkowski était le plus proche ami de David Hilbert.


La biographie de ce dernier par Constance Reid, Hilbert, Springer-
Verlag, New York, 1996, contient de nombreux aperçus aussi sur la
vie de Minkowski.

87

Vous aimerez peut-être aussi