Logique Que Et Paradoxes
Logique Que Et Paradoxes
Logique Que Et Paradoxes
informatique
et paradoxes
par Jean-Paul Delahaye
POUR LA
[SCIENCE
(DIFFUSIONBELINJ
1
8, rue Férou 75006 Paris
Le code de la propriété intellectuelle autorise
[O] DANGER
PHoToCoPlllAGE
TUE LE LIVRE
.<lescopies ou reproductions strictement
réservées à l'usage privé du copiste e t non
destinées à une utilisation collective* (article
L, 122-5) ; il autorise également les courtes
citations effectuées dans un but d'exemple et
d'illustration.
E n revanche, *toute r e p r é s e n t a t i o n ou
reproduction intégrale ou partielle, sans le consentement de l'auteur ou de ses
ayants droit ou ayants cause, est illiciten (article L. 122-4).
Cette représentation ou reproduction, par quelque procédé que ce soit, sans
autorisation de l'éditeur ou du Centre français de l'exploitation du droit de
copie (3, rue Hautefeuille, 75006 Paris), constituerait donc une contrefaçon
sanctionnée par les articles 425 et suivants du Code pénal.
Préface
Calculabilité et machines de Turing
L'indécidabilité en mathématiques et en physique
Gode1
Machines, prédictions et fin du monde
Le désordre total existe-t-il?
La cryptographie quantique
Chaînage avant et déduction logique
Vote inconscient
Complexités
Thermodynamique et informatique théorique
L'inférence inductive
Les virus
L'altruisme récompensé
L'altruisme perfectionné
Algorithmes et preuves probabilistes
IP=PSPACE
Les automates
Les hyperensembles
Longueur d'une démonstration
Le réalisme en mathématiques et en physique
Bibliographie
Préface
Q
u'est-ce qu'une méthode de calcul? Jusque Alors qu'ils exploraient la nature du calcul,
dans les années 1930, les mathématiciens les logiciens découvrirent la notion d'énoncé indé-
l'ignoraient. La faculté étonnante des cidable, encore nommé énoncé indécidable de
mathématiques à transformer leurs Godel. Kurt Godel, en 1931, démontra le premier
méthodes et leurs techniques en objets d'études théorème important à leur sujet : ce sont des
mathématiques les rapproche de la philosophie énoncés impossibles à démontrer, ainsi que leur
et est souvent l'occasion d'introduire de nouveaux négation. Eindécidabilité d'un énoncé est tou-
concepts et de formuler de nouveaux résultats. jours relative à un système de démonstrations
Cette faculté dr(autoréflexivité» permet, par (OU système formel) ; elle ne doit pas être confon-
exemple, d'étudier des objets qui sont eux-mêmes due avec l'indécidabilité d'un problème qui, elle,
les théories mathématiques. La partie des est absolue. Nous verrons les liens entre ces deux
mathématiques qui se consacre à ce travail est la notions.
logique mathématique ; parmi ses notions, il y a
celles d'algorithme, de fonction calculable, de De l'algorithme à l'indécidabilité
décidabilité des problèmes et des énoncés.
Grâce aux travaux des logiciens, les mathé- La notion informelle d'algorithme est
maticiens savent précisément ce qu'est une ancienne : une recette de cuisine, un jeu d'ins-
méthode de calcul ; ils savent assez précisément tructions pour réaliser un tricot, un procédé élé-
quels problèmes ces méthodes peuvent traiter et, mentaire pour additionner deux nombres sont
mieux encore, ils savent que certains problèmes des algorithmes (le mot vient du nom d'un mathé-
n'auront jamais de solution. maticien persan du Ixe siècle, Al Khwarizmi).
Ces problèmes pour lesquels on démontre Tels des Monsieur Jourdain, les mathémati-
qu'il n'existe aucune méthode de résolution sont ciens recherchaient et élaboraient des algo-
appelés problèmes (<indécidables».Dans les rithmes bien avant que le concept ne soit bien
années 1930, les premiers exemples de tels pro- défini. Au début du siècle, encore, ils ne soup-
blèmes semblaient artificiels, mais on a rapide- tonnaient pas que l'on pourrait préciser la
ment découvert que des problèmes simples sont notion. Le dixième problème de David Hilbert,
de ce type. Notamment, en informatique, de nom- formulé avec 23 autres lors du Congrès interna-
breuses questions naturelles sont indécidables. tional des mathématiciens, à Paris, en 1900, se
Est-il utile de savoir qu'un problème est réfère implicitement à la notion d'algorithme.
indécidable? Certainement : si un problème est Hilbert demandait que l'on recherche une
indécidable, il ne faut plus perdre son temps à en méthode générale indiquant quelles équations
chercher une solution, et il est préférable de diophantiennes ont des solutions (dans ces
chercher un problème dérivé du premier mais équations, les coefficients sont des nombres
plus simple, dont on doit ensuite déterminer la e n t i e r s , e t l'on cherche des solutions e n
décidabilité. nombres entiers). Il aurait sans doute aimé
CALCULABILITE ET MACHINES DE TURING 9
s a v o i r q u e ce pro- m e n t a u problème de
blème e s t indéci- l'existence d'algorith-
dable, comme cela fut mes, et non a u problème
démontré par J u r i de leur efficacité, qui est
Vladimirovic Matj a- également le sujet de tra-
sevich e n 1 9 7 0 . vaux nombreux.
Le travail d'iden-
tification et de formu- Problèmes simples,
l a t i o n d e l a notion décidables ou non
d'algorithme fut effec-
tué en plusieurs Avant de préciser ce
étapes, entre 1931 et aue les mathématiciens
1936, p a r Alonzo entendent par «méthode
Church, Stephen de calcul», ou calgo-
Kleene, Alan Turing rithmen. considérons
et Godel. Ils introdui- q u e l q u e s problèmes
sirent plusieurs clas- simples décidables ou
ses de fonctions, dont indécidables. Soient tout
ils m o n t r è r e n t e n - d'abord deux nombres
suite qu'elles coïnci- entiers m et n supérieurs
daient, et qui se révé- à 1 ; m est-il un multiple
lèrent ê t r e l a classe de n? On sait que 12 est
des fonctions calcu- u n multiple de 2, par
lables : une fonction exemple, et que 16 n'est
e s t calculable s'il pas un multiple de 5. On
existe une façon de la sait même comment s'v
décrire qui permette prendre pour déterminer
effectivement d'en les cas où m est u n mul-
calculer t o u t e s les tiple de n : il suffit de (1)
valeurs. La définition faire la division de m par
précise de la notion de n ; (2) regarder le reste
fonction calculable obtenu, r ; (3) s i r est nul,
fixe celle d'algo- alors m est u n multiple
rithme. 1. CERTAINS PROBLÈMESDE PAVAGE DU PLAN par de n, et si r n'est pas nul,
Depuis les années des polygones sont indécidables. Quand on se donne les m n'est pas u n multiple
1930, on a étudié l a deux polygones du haut de la figure, on peut paver le plan. de n .
Dans ce cas précis, on trouve facilement un pavage. La
décidabilité de nom- méthode qui permet de résoudre le problème dans ce cas Ce procédé général
breux problèmes, e t est-elle généralisable? R. Berger a démontré en 1966 que et systématique consti-
non : le problème est indécidable. Déjà, pour les trois tue un algorithme infor-
l'on a parfois découvert formes du milieu de la figure, il faut un peu d'inventivité
que d e s problèmes pour démontrer qu'un pavage du plan sans recouvrement mel de décision pour le
d'apparence simple ni espace vide est impossible. L'indécidabilité du pro- problème des multiples.
blème du pavage signifie que, pour traiter de nouvelles C'est u n procédé d'une
étaient indécidables ; situations, le mathématicien sera inévitablement amené
i n v e r s e m e n t on a à inventer de nouvelles méthodes de raisonnement : sûreté absolue, efficace
trouvé des algorithmes jamais aucun procédé général mécanique ne réussira à pour tous les couples m
englober tous les cas possibles. En revanche, pour un e t n , et qui donne tou-
à des problèmes qui polyomino, composé de carrés adjacents, on sait que la
étaient jusqu'alors res- question du pavage est décidable :il existe un algorithme jours la bonne réponse :
tés ouverts. Chaque qui, lorsqu'on lui donne un polyomino, indique correcte- le problème d e s m u l -
ment s'il est possible de paver le plan en l'utilisant sans le t i ~ l e se s t décidable.
année, des dizaines de faire tourner. La frontière entre le décidable et l'indéci-
tels résultats sont éta- dable passe entre cette forme simplifiée du problème du Dans l'exemple con-
blis dans de nombreux pavage et la version générale. L'indécidabilité du pro- sidéré, m et n sont deux
blème des pavages du plan est liée à l'existence de pavés
domaines des mathé- qui ne peuvent recouvrir le plan que non périodique- nombres e n t i e r s quel-
matiques ; le mouve- ment. Un pavage non périodique d'un nouveau type a été conques, supérieurs à 1.
ment n'est pas prêt de découvert en 1994 par Charles Radin, de l'université du On n e cherche Das à
Texas : contrairement à tous les pavages connus jusqu'à
cesser... Ici nous nous présent, le pavage de Radin oblige les pavés à effectuer résoudre u n problème
intéresserons seule- des rotations selon une infinité d'angles différents. unique, mais une classe
10 LOGIQUE, INFORIMATIQUE ET PARADOXES
infinie de problèmes : l'usage des lettres m et n mentaire et sans la faire tourner? Cette fois, le
Dermet de résumer dans la seule auestion «m est- problème est si simple qu'on imagine un algo-
il un multiple de n?),toutes les questions : «2 est- rithme qui traite le problème ; sa formulation
il un multiple de 2 ? ~((3 , est-il un multiple de 2?», précise et s a programmation effectives sont
((3est-il un multiple de 3? <(,~4 est-il un multiple pénibles, mais faisables. Le sous-problème du
de 2?», etc. pavage sans rotation par un unique polyomino
D'autres problèmes simples sont également est décidable.
décidables. Ainsi on sait déterminer si un nombre L'intérêt de la notion de décidabilité tient
est premier, on sait déterminer la ne décimale du dans ce qu'elle permet de cerner ce qui est fai-
nombre ~ ion. sait vérifier si un nombre est racine sable. Quand on connaît un algorithme pour
A z
d'une équation ... Les énoncés sont simples, et les résoudre u n problème, on le généralise ; à
problèmes sont décidables. l'inverse, quand on sait un problème indécidable,
Passons maintenant au problème d'énoncé à on cherche à restreindre le problème initial à des
peine plus complexe : soient F I , F2, F3, ...,F, une sous-problèmes décidables.
liste de polygones (voir la figure 1) ;peut-on paver
le plan sans recouvrement ni espace vide avec des
exemplaires de F1, F2, ..., Fn? Robert Berger a Les machines de Turing
démontré en 1966 aue ce ~ r o b l è m eest indéci- Comment les mathématiciens ont-ils réussi
dable : aucun algorithme ne permet, par un calcul à formuler la définition de ~ r o c é d éde calcul?
fini, d'établir, pour tout ensemble de formes poly- Nous avons vu que plusieurs approches sépa-
gonales, si oui ou non on peut paver le plan de la rées ont convergé ; aussi nous limiterons-nous à
façon indiquée. Dire que le problème est indéci- l'une d'entre elles : celles des «machines de
dable est plus fort que dire que l'on ne sait pas Turing».
résoudre le problème, ce qui marquerait simple- Le concept de machine de Turing, dû au
ment notre ignorance. mathématicien britannique Alan ~ u r i n gest , à la
L'indécidabilité résulte-t-elle du fait que les fois simple et puissant. C'est même le plus simple
listes de formes géométriques pavantes sont trop des mécanismes universels de calcul que l'on
nombreuses? On est intuitivement conduit à puisse envisager. Qu'il soit simple, cela apparaî-
considérer des sous-problèmes du problème ini- tra dans la définition ; qu'il soit universel, c'est-à-
tial. Ainsi on pourrait limiter les formes pavantes dire qu'il permette effectivement de programmer
à des carrés juxtaposés, ce que l'on nomme encore tout algorithme, cela constitue ce qu'on appelle la
des polyominos. Comme il existe beaucoup moins thèse de Church-Turing, qui est universellement
de polyominos que de formes géométriques quel- acceptée, car on n'a jamais trouvé d'algorithme
conques, le nouveau problème est plus simple que qu'on ne puisse programmer s u r machine de
le problème ini- Turing.
tial. Pourtant les u n e machine
logiciens démon- de Turing est un
trent, à nouveau, mécanisme idéal,
que le pavage par destiné à effec-
des polyominos tuer des calculs,
est indécidable. tels que celui de
Faudrait-il la somme n + 2 ou
r e s t r e i n d r e les 3 n , quand on
formes à u n e fournit la valeur
seule? On consi- de n. Pour effec-
dère u n e forme tuer ses calculs,
élémentaire com- la machine de Tu-
posée de carrés r i n g utilise u n
~ u x t a p o s é s ; 2. UNE MACHINE DE TURING est un mécanisme qui possède un r u b a n illimité,
peut-on paver le nombre fini d'états intérieurs et qui, selon l'état où il se trouve et selon composé de cases
ce qu'il lit sur le ruban,efface la case du ruban qui est sous sa tête de lec-
plan recOu- ture-écriture,y écrit un symbole et se déplace vers lagauche ou vers la jointives, et une
v r e m e n t n i es- droite. Le programme de la machine est une suite finie d'instructions t ê t e de lecture-
pace vide avec du type : =Sijesuisdansl'état E3 et si je lis un O surle ruban, alors je le écriture, avec
remplace par un 1, je me déplace d'une case vers la droite et je passe
des dans l'état Eo :en abrégé. on note une telle instruction ( E s O + EQ 1 D ) . laquelle lit,
de la forme 616- Tout calcul <eut être egékuté par une machine de Thring." efface ou écrit sur
CALCULABILITÉ ET MACHINES DE TURING 11
ÉCRIRE O, ÉCRIRE 1,
DÉPLACEMENT À DROITE DÉPLACEMENT À DROITE
3. LAMACHINE DE TURING qui calcule la fonction f(n) = tiale n = 3. Partie de l'état E l , la machine passe dans l'état
n + 2 peut être représentée par un graphe (en haut) qui E g dès qu'elle rencontre un 1. Puis elle parcourt les n
résume la liste des instructions. Chaque instruction, cases portant des 1, en restant dans l'état E2 et, dès
déterminée par un état et par une valeur lue sur la bande, qu'elle trouve un O, elle le remplace par un 1,passe dans
est représentée par une flèche joignant l'état de départ à l'état E3, remplace encore le O suivant par un 1, passe
l'état d'arrivée, avec des indications d'écriture et de dans l'état Eg et s'arrête. Le bilan de ce travail est que
déplacement. En bas, on a indiqué le détail des états suc- deux 1supplementaires ont été ajoutés. Lesn symboles 1
cessifs de la machine et de son ruban pour la donnée ini- sont devenus n + 2 symboles 1.
12 LOGIQUE, INFORMATIQ LX ET PARADOXES
le ruban. Cette tête se déplace conformément aux instruction se code facilement : (El O + E2 1 D).
instructions de la machine. Généralement on précise l'état initial avant un
La machine qui calcule 3n, par exemple, calcul, et l'on impose que chaque jeu de conditions
comporte un ruban où l'on écrit initialement le ne détermine qu'un fonctionnement de l a
nombre n. Une fois le calcul terminé, on y lit le machine.
nombre 3n. Pour une autre machine, telle celle Un exemple? Considérons la machine de
qui détermine le pavage du plan par des poly- Turing dont les deux instructions sont : (El O +
ominos, on écrirait sous une forme codée les E l 0 D ) et (El 1 +E2 O D). Cette machine, chaque
données géométriques du problème, e t on fois qu'on la place sur un ruban ne comportant
devrait lire, à l'arrêt de la machine, la réponse que des O et des 1, se déplace vers la droite jusqu'à
«oui»OU «non». ce qu'elle trouve un 1,qu'elle transforme en O, et
Une machine possède plusieurs états qui, s'arrête.
avec les données lues sur la bande, définissent le L'importance du concept de machine de
fonctionnement ultérieur : lecture, déplacement Turing tient en ce que le type de calculs qu'elle
de la tête, écriture, etc. Décrire une machine de effectue est absolument général. Pour tout algo-
Turing, c'est décrire comment l'état de l a rithme, il existe une machine de Turing qui exé-
machine évolue et quels sont les déplacements de cute les mêmes opérations que l'algorithme. La
la tête. Une instruction est, par exemple : «Sije démonstration de l'équivalence est souvent
suis dans l'état E l et que je lis le symbole O sur le longue et pénible, mais facile pour les logiciens ;
ruban, alors je passe dans l'état E2, j'écris 1et je après un demi-siècle de succès dans ces démons-
me déplace d'une case vers la droite)).Une telle trations, on ne doute plus que la notion d'algo-
1 O
h
ECRIRE 2, ÉCRIRE 3,
DEPLACEMENT DÉPLACEMENT DÉPLACEMENT
A DROITE À DROITE À GAUCHE DÉPLACEMENT
ÉCRIRE 3, À GAUCHE
\
3 11
i
1 ÉCRIRE 2,
DÉPLACEMENT A DROITE
,
DÉPLACEMENT
À GAUCHE
+
O
\ ÉCRIRE 1,
ÉCRIRE O, / DÉPLACEMENT À DROITE
DÉPLACEMENT À DROITE
ÉCRIRE 1,
DÉPLACEMENTÀ DROITE
L
'informatique est si proche de la logique que croire vraiment, sans doute) de se faire remplacer
la découverte de l'indécidabilité y a eu des par des machines ou, plutôt, par des algorithmes.
conséquences importantes. Le théorème de Malheureusement de nombreux résultats d'indé-
Rice, notamment, a constitué une étape dans cidabilité suggèrent qu'ils auront toujours besoin
l'exploration du monde indécidable. Démontré en de travailler.
1953, ce théorème est d'une puissance telle qu'il Depuis le début du siècle, la méthode axioma-
permet de résoudre, encore aujourd'hui, de nom- tique s'est imposée, et toute question mathéma-
breuses questions naturelles que l'on se pose en tique peut s'exprimer sous la forme : telle pro-
programmation. Il stipule que toute propriété qui priété résulte-t-elle de tel système d'axiomes? Par
n'est ni toujours vraie ni toujours fausse et qui exemple, le grand théorème de Fermat, démontré
porte sur la fonction que calcule une machine de il y a peu par Andrew Wiles, de Cambridge, est le
Turing (voir le chapitre précédent) est indécidable. suivant : il n'existe aucun nombre entier positif r
Par exemple, le problème de savoir si une supérieur à 2 tel que l'équation nr + mr=prait une
machine de Turing calcule une fonction f(n) non solution en nombres entiers non nuls ;les axiomes
nulle fixée est indécidable. Ainsi le problème de de Peano de l'arithmétique (qui permettent, entre
savoir si une machine de Turing calcule la fonc- autres choses, les raisonnements par récurrence),
tion f(n) = 3 n est indécidable : on connaît cer- avec les méthodes générales de raisonnement
taines machines qui calculent cette fonction et fixées par la logique, définissent un système de
l'on connaît d'autres machines qui ne la calculent démonstration qui est suffisant pour presque
pas, mais il n'existe pas d'algorithme qui, pour toutes les questions d'arithmétique. Existe-t-il
toute machine donnée, indique si elle calcule la une démonstration, dans ce système, qui établisse
fonction f(n) = 3n. le théorème de Fermat?
Appliqué a u problème de la programmation Ce problème appartient à la même famille
en informatique, le théorème de Rice permet aue celui de la démontrabilité dans l'arithmé-
d'obtenir l'indécidabilité des problèmes suivants. tique de Peano : une formule arithmétique étant
Deux programmes informatiques calculent-ils la donnée, peut-on la démontrer dans le système
même chose (problème de l'équivalence des pro- formel de l'arithmétique de Peano?
grammes)? U n programme informatique On sait justement depuis Alonzo Church, en
contient-il un morceau de code qui ne sert jamais 1936, que ce dernier problème est indécidable :
(problème du morceau de code inutile)? Un pro- aucun algorithme n'indique, pour toute formule
gramme utilisera-t-il un périphérique particu- donnée, si oui ou non elle est démontrable dans le
lier, tel que l'imprimante (problème de l'utilisa- système formel de l'arithmétique de Peano.
tion d'une ressource)? Pour la plupart des systèmes de démonstra-
En logique, aussi, le théorème de Rice a des tions puissants, de tels résultats d'indécidabilité
applications. Les mathématiciens sont réputés ont été démontrés. Cependant, pour des théories
économes de leur peine et envisagent (sans y particulièrement simples, des algorithmes ont
16 LOGIQUE, INFORIMATIQ CE ET PARADOXES
été proposés : c'est le cas, par exemple, pour principaux. Soit on utilise une technique comme
l'arithmétique sans multiplication ;en 1930, Moj- celle que nous avons considérée dans le chapitre
zesz Presburger a trouvé un algorithme général précédent (argument diagonal), soit on se fonde
qui, pour chaque formule de l'arithmétique ne fai- sur un problème démontré indécidable et on
sant pas intervenir le symbole de la multiplica- montre que, si le problème considéré était déci-
tion, indique en un temps fini si oui ou non la for- dable, alors le problème montré indécidable
mule est démontrable. Des résultats plus précis serait décidable. Cette seconde méthode est la
sur la complexité des algorithmes de décision, plus rapide ; pour qu'elle soit facilement utili-
quand ils existent, ont également été démontrés sable, on a besoin de problèmes aussi simples que
en 1974 pour l'arithmétique sans multiplication. possible dont l'indécidabilité soit établie.
Il n'est pas absurde de dire que l'indécidabilité Le problème de la correspondance de Post,
établit la nécessité des mathématiciens. étudié en 1946, est parmi les plus simples qui
soient indécidables. Son énoncé ne fait intervenir
que des notions évidentes.
Le problème de Post Considérons deux listes de mots (ml, m2,
Les méthodes utilisées pour établir que des m3, ...,mp) et (ni, 122, ...,n ) Peut-on juxtaposer
problèmes sont indécidables sont de deux types des mots de la première lis?e.de telle f a ~ o n que le
mot obtenu soit le même qu'en juxtaposant de la
même façon les mots de la seconde liste? Considé-
rons, par exemple, la liste (au, bb, abb) et la liste
(aab, ba, b). On peut mettre les deux listes en cor-
respondance en écrivant aa, bb, aa, abb ou aab,
ba, aab, b. Donc, pour ces deux listes particu-
lières, la réponse au problème de Post est ((oui)).
En revanche, pour les listes (aab, a) et (aa, baa),
le problème de Post n'a pas de solution (pouvez-
vous le démontrer?). Bien qu'apparemment très
simple, le problème de Post est indécidable :
aucun algorithme n'indique, pour chaque jeu de
données possible, si oui ou non il existe une mise
en correspondance analogue à celle du premier
exemple. Ce résultat d'indécidabilité est un outil
essentiel en algèbre et en théorie des langages.
Nous avons déjà indiqué que le théorème de
Rice permettait de démontrer l'indécidabjlité de
l'utilité d'une partie de programme. A titre
d'exemple, nous allons montrer qu'à partir du
problème de Post, on peut facilement retrouver ce
résultat. Il s'agit d'un raisonnement typique.
Supposons que nous disposions d'un algo-
rithmeA qui, pour tout programme P, indique en
un temps fini si oui ou non chaque morceau de
code est utile. Soit la sous-famille des pro-
grammes de la forme :
Programme P dépendant de (ml, m2, mg, ..., mp)
1. LA RÈGLEDE RÉÉCRITURE de la distributivité per- et de (m'l, mt2, ..., m i ) .
met de remplacer, dans une formule mathématique, Pour n variant de 1à l'infini :
l'expression ( X + Y) x Z parX x Z + Y x Z (en haut).A partir rechercher parmi les pn tentatives possibles
de l'expression ((a + b) x c + d) x e, on peut appliquer cette
règle de réécriture trois fois, afin d'obtenir successive- s'il y a une correspondance de Post utilisant n
m e n t : ( ( a x c + b x c ) t d ) x e , p u i s ( ~ a x c + b x c ) x e + d x e ) ,mots
puis ((a x c x e + b x c x e) + d x e).Cette règle de réécriture si oui, imprimer «oui,,.
s'arrête toujours : à partir d'un certain moment, on ne
peut plus l'appliquer. D'autres règles, en revanche, peu- L'algorithme A, appliqué au programme P et
vent s'appliquer indéfiniment. Max Dauchet, du Labora- à la partie du programme .si oui imprimer "oui".,
toire d'informatique fondamentale de Lille, a démontré
en 1988 que le problème de l'arrêt d'une règle de réécri- indique si le problème de correspondance de Post
ture est un problème indécidable. associé aux paramètres de P admet ou non une
solution. Cela résulte de ce que la dernière ligne nombre fini d'opérations, si cette équation pos-
de P est utile si et seulement si, pour les para- sède des solutions en nombres entiers?
mètres de P, le problème de correspondance de Cet énoncé mérite plusieurs remarques. Tout
Post admet une solution. Disposer de l'algo- d'abord, on nomme équation diophantienne une
rithme A permettrait donc de résoudre le pro- équation de la forme P = O, où P est un polynôme
blème de Post. Comme ce problème est indéci- à coefficients entiers. Ainsi x2 + y2 - 1= O est une
dable, l'hypothèse initiale e s t fausse : équation diophantienne à deux inconnues x et y.
l'algorithme A n'existe pas. Autrement dit, il Elle possède deux solutions entières qui sont :x = 1,
n'existe aucun algorithme indiquant si une partie y = O et x = O, y = 1(on ne s'intéresse qu'aux solu-
de code est vraiment utile dans un programme. tions entières positives, mais la prise en considé-
ration des solutions entières négatives ne change
pas les résultats que nous allons examiner).
Le dixième problème de Hilbert L'équation diophantienne x2 - 991y2 - 1 = O pos-
Dans le cas de l'utilité des morceaux de code, sède des solutions, mais celles-ci sont beaucoup
la méthode qui nous a conduit à la démonstration moins faciles à trouver que précédemment : la
d'indécidabilité est simple. A propos du problème plus petite est x = 379 516 400 906 811 930 638
de Hilbert, le raisonnement est plus complexe. Ce 014 896 080 ety = 12 055 735 790 331 359 447 442
problème fut posé par David Hilbert lors du 538 767.
Congrès international des mathématiciens, à Dans son énoncé, Hilbert mentionne un «pro-
Paris, en 1900. L'énoncé était le suivant : soit une cédé qui détermine par un nombre fini d'opéra-
équation diophantienne (à coefficients entiers) ; tions~.Aujourd'hui nous comprenons qu'il signi-
peut-on trouver un procédé qui détermine, par un fiait un algorithme ou, puisque c'est équivalent,
2. DANS LE JEU DE LA VIE, inventé par John Conway, le reste sauf si eile possède moins de deux cases voisines
deux règles s'appliquent :une case vide àun instant le reste occupées, ou plus de trois. La configuration nommée glis-
à l'instant suivant sauf si elle possède exactement trois voi- seur, représentée sur la première figure, se reproduit iden-
sines pleines (les cases voisines sont celies qui sont adja- tique à elle-même en quatre générations, mais décalée
centespar les côtés ou par les coins) ;une case déjà occupée d'une case vers le bas et d'une case vers la droite.
3. UNE CONFIGURATION même simple comme celle configuration, bien q u e commandée p a r d e s règles
qui est représentée e n h a u t à gauche peut avoir une déterministes e t connues, constitue u n problème indé-
évolution complexe. L'évolution à long t e r m e d'une cidable.
18 LOGIQUE, INFORMATIQ C E ET PARALIOXES
une machine de Turing. Traduit sous la forme l'on distingue deux familles de problèmes : celle
que nous avons utilisée jusqu'à présent, l'énoncé où l'on faitvarier le degré des équations considé-
du dixième problème de Hilbert devient la ques- rées, et celle où l'on fait varier le nombre des
tion de la décidabilité des équations diophan- inconnues.
tiennes : soit P un polynôme à coefficientsentiers, Nous allons considérer ces deux sous-familles
l'équation P = O possède-t-elle des solutions? du problème général des équations diophan-
Hilbert p r e s s e n t a i t peut-être q u e son tiennes. en indiauant les meilleurs résultats
dixième problème n'avait pas de solution : ((Par- connus aujourd'hui sur ces questions.
fois il arrive que l'on recherche une solution sous La première famille est composée du pro-
des hypothèses insatisfaites ou inappropriées en blème des équations diophantiennes de degré
un certain sens, et on se trouve donc incapable inférieur à 2, du problème des équations diophan-
d'atteindre son but. Naît alors l'objectif de prou- tiennes de degré inférieur à 3, du problème des
ver l'impossibilité de la solution sous les hypo- équations de degré inférieur à 4...On sait que le
thèses données et dans le sens envisagé. De telles problème des équations diophantiennes de degré
preuves d'impossibilité ont été déjà obtenues par inférieur à 2 est décidable. De même., le ~roblème
A
les anciens, comme l'irrationalité de la racine de 2. des équations diophantiennes est décidable pour
Dans les mathématiques modernes, la question celles de degré inférieur à 3. On sait aussi que le
de l'impossibilité de certaines questions a joué un problème des équations diophantiennes de degré
rôle clef. C'est ainsi que nous avons acquis la inférieur à 5 est indécidable. En revanche, on
connaissance que de vieux et difficiles problèmes, ignore le statut des équations diophantiennes de
comme prouver l'axiome des parallèles, la qua- degré inférieur à 4. Pour le degré, la frontière
drature du cercle, ou résoudre des équations du passe entre 3 et 5.
cinquième degré par radicaux, n'ont pas de solu- Considérons maintenant le nombre des
tion dans le sens envisagé initialement.)) L'his- inconnues. La deuxième sous-famille est compo-
toire se répéta pour les équations diophan- sée : du problème des équations diophantiennes à
tiennes. moins de deux inconnues, du problème des équa-
Le problème de la décidabilité du dixième tions diophantiennes à moins de trois inconnues,
problème de Hilbert est particulièrement intéres- etc. La frontière, dans ce cas, est moins bien
sant, car il concerne une question purement connue que dans le cas du degré. On sait que le
arithmétique. D'une certaine façon, le concept de problème à une inconnue est décidable, et qu'il
décidabilité est mis à l'épreuve par ce problème. est indécidable à neuf inconnues. On ignore où est
Si les mathématiciens avaient échoué dans leur la frontière, entre 1 et 9, et chaque progrès n'est
désir de savoir si le dixième problème de Hilbert obtenu qu'au prix d'un effort considérable.
est ou non décidable, le concept de la décidabilité
aurait sans doute été jugé inefficace.
L'indécidabilité des règles de réécriture
Le problème résista jusqu'en 1970, où il fut
définitivement résolu par Yuri Matijasevic, alors Nous avons vu pourquoi il était utile de
à l'Institut mathématique de Steklov, à Lenin- démontrer l'indécidabilité d'un problème ou, au
grad, et la solution a été conforme à ce que l'on contraire, d'observer qu'il était décidable ; toute-
prévoyait : il n'existe aucun algorithme qui fois une autre utilisation des concepts est pos-
indique, pour chaque équation diophantienne, si sible : établir qu'un mécanisme de calcul est assez
elle a ou non des solutions. Ce résultat, en même puissant pour simuler tout algorithme. En infor-
temps que la solution d'un problème ancien, est matique, ce problème se rencontre fréquemment,
particulièrement important, car il marque la et l'on sait que des langages classiques de pro-
maturité des techniques de démonstration en grammation (Fortran, Pascal, Basic,Lisp, Prolog)
théorie de la décidabilité. permettent effectivement d'exprimer tout algo-
rithme de calcul. On démontre cela en program-
Par où passe la frontière? mant des simulations de machines de Turing
dans chacun de ces langages, ce qui est générale-
Aussitôt, on chercha à affiner ce résultat ment facile, même dans le langage particulier
d'indécidabilité et à préciser la frontière entre le qu'est Prolog.
décidable et l'indécidable dans cette zone des En revanche, un résultat récent de cette
mathématiques. La complexité d'une équation nature, concernant les règles de réécriture, a sur-
diophantienne peut se mesurer par son degré et pris les informaticiens. Une règle de réécriture
par le nombre de ses inconnues. D'où vient que est un moyen de transformer une expression
EINDÉCIDABILITÉ EN MATHÉMATIQ D'ES ET EN PHYSIQUE 19
algébrique en une autre. Nous avons tous appris, briques sont complexes. D'autres règles s'appli-
par exemple, que l'expression algébrique x(y + z) quent un nombre infini de fois : par exemple, la
peut se transformer en xy + xz. Ce type de réécri- règle qui transforme x + y en y + x, car une fois la
ture s'applique dans de nombreux cas, parfois règle appliquée, rien n'interdit de la réutiliser :
plusieurs fois de suite quand les expressions algé- x + y donne y + x, qui donne x + y , etc.
4. LE LANCE-GLISSEURSest une configuration qui crée d'étudiants réuni autour de R. Gosper (MIT) ;ce groupe a
un glisseur toutes les 15 générations. Sur la figure, on gagné le prix de 15 dollars offert en 1970 par J. Conway à
voit deux de ces glisseurs qui s'en vont vers le bas à qui trouverait une configuration du Jeu de la vie dont le
droite. Le lance-glisseur a été découvert par un groupe nombre d e particules augmenterait indéfiniment.
5. TROIS TYPES DE RAISONS s'allient pour empêcher la mécanique classique (au milieu), les physiciens ont égale-
prévision du futur. La mécanique quantique est à l'origine ment observé que la prévision des phénomènes est impos-
d'une imprécidibilité fondamentale : par exemple, dans le sible :pour prévoir le comportement d'une boule de billard,
monde physique (à gauche), on ne peut prévoir à la fois la par exemple, il faudrait connaître avec une précision infi-
position et la vitesse d'une particule ;de ce fait, on ne peut nie l'angle de la queue, l'impulsion communiquéeà la boule,
pas connaître le futur d'un système simple composé d'une etc. Enfin, même dans les univers simplifiésà l'extrême tels
seule particule, et, a fortiori, celui de systèmes complexes que celui du Jeu de la vie (à droite), la prévision est impos-
tels que les êtres vivants. Dans l'univers simplifié de la sible en raison de l'indécidabilité mathématique.
20 LOGIQUE, INFORMATIQUE ET PARADOXES
Le type de calcul que constitue l'application de physique. En effet, on construit facilement une
telles règles ne semble pas très puissant et, si l'on machine de Turing ou un mécanisme ayant la
savait qu'en prenant suffisamment de règles de puissance de telles machines. L'indécidabilité du
réécriture, on pouvait simuler n'importe quel algo- problème de l'arrêt prend alors un sens nouveau,
rithme, ce n'est que très récemment que M. Lipton concernant la prévisibilité en physique : même
et M. Snyder ont établi, d'abord, que trois règles quand on connaît parfaitement un système phy-
.
étaient suffisantes :, m i s M. Dershowitz. en 1987. sique et toutes les lois qui le régissent, même si,
montra que deux règles suffisaient. Enfin, en de plus, ce système ne répond qu'à des lois déter-
1988, M. Dauchet, a montré qu'une seule règle de ministes, il se peut que son comportement à long
réécriture permettait de simuler tout algorithme terme ne soit pas prévisible. Même dans un uni-
imaginable. vers simplifié, non quantique, qu'on connaîtrait
Ce résultat implique l'indécidabilité de parfaitement, l'avenir continuerait de nous
l'arrêt d'une règle de réécriture, c'est-à-dire échapper.
l'indécidabilité du problème suivant : étant don- Pour illustrer cette idée, considérons le
nées une règle de réécriture et une expression célèbre Jeu de la vie, inventé dans les années
algébrique, peut-on appliquer indéfiniment la 1970 par John Conway, de Cambridge, et qui se
règle de réécriture à l'expression symbolique? En déroule dans un univers extrêmement simple
effet, puisque tout algorithme peut être simulé pour lequel la non prévisibilité du système a été
par une règle de réécriture, si on savait décider démontrée.
l'arrêt d'une règle de réécriture, on saurait déci- L'espace du Jeu de la vie est un plan illimité
der de l'arrêt d'un algorithme, ce qui, nous l'avons sur lequel une grille est dessinée. Un seul type de
vu, est impossible. «particule élémentaire)) existe; leur comporte-
ment suit une loi déterministe particulièrement
L'indécidabilité simple. Si, à un instant t , une case est occupée par
et la prédiction en physique une particule et qu'elle possède plus de trois voi-
sins, alors, à l'instant t + 1,la particule disparaît
Certains des résultats présentés dans cet par étouffement ;de même, si elle a moins de deux
article peuvent être interprétés d'un point de vue voisins, elle meurt par isolement. En outre,
auand une case vide com~orteexactement trois
voisins, une nouvelle particule naît.
FORMULES DÉMONTRABLES
Ce jeu a été l'objet de nombreuses chroniques
de récréations mathématiques tant il est fasci-
nant. On prétend même que les écrans graphiques
des ordinateurs ont été inventés pour permettre
aux fanatiques de ce jeu de visualiser leurs trou-
vailles : des configurations qui se déplacent, des
configurations qui lancent des objets, etc.
Mois après mois, l'étude de l'univers du Jeu de
la vie se développa et, finalement, le nombre des
résultats accumulés permit d'établir qu'aussi
simple que soit ce modèle d'univers, il était malgré
tout l'objet d'indécidabilité. En 1982, J. Conway,
E. Berkelamps et R. Guy ont même montré que,
comme les règles de réécriture, le Jeu de la vie est
6. LE THÉORÈME DE GODEL indique que les énoncés
un moyen universel de calcul.
démontrables dans un svstème formel ne peuvent iamais Le problème le plus simple que l'on puisse se
n'être que des énoncés Gais d'arithmétiqu6et être ious les poser, à propos du Jeu de la vie est : une configu-
énoncés vrais d'arithmétique. Les indécidables de Gode1
d'un système formel sont les formules qui, bien que vraies, ration finie étant donnée, finit-elle par dispa-
ne sont pas démontrablesdans le système en question. Ces raître ou, au contraire, persiste-t-elle indéfini-
indécidablesdépendent du système formelque l'on utilise. ment? Un tel problème est indécidable : aucun
Sur cette figure, on a envisagé les énoncés démontrables
avec trois svstèmes formels. certains énoncés démon- algorithme ne Pourra Jamais être assez général
trables dan; un premier système formel 1 ne sont pas pour mener à bien l'analyse du destin final de
démontrablesdanslesgstèmeformel2,etcertainsénoncés toute configuration initiale du Jeu de la vie.
démontrables dans le système 2 ne sont pas démontrables
dans le s~stème1.Le système formel 3 est d u s ~uissantaue Notre monde physique est bien plus complexe
les de& autres, car-il a moins d9indé&dablesq u ' e k que celui du Jeu de la vie : on peut d'ailleurs simu-
LWDECIDABILITÉ EN MATHEMATIQ UES ET EN PHYSIQUE 21
celle qui démontre que .(P est vrai pour la donnée de Post, qui ne peut être résolu, il existe une équa-
d» ou celle qui démontre que (9
est faux pour la tion diophantienne dont on ne peut ni démontrer
donnée d*. L'hypothèse que tous les énoncés qu'elle possède des solutions, n i démontrer
concernant P sont démontrables dans le système qu'elle n'en possède pas, une configuration du Jeu
S signifie simplement que, quelle que soit la don- de la vie dont il est impossible d'établir si elle est
née d, l'algorithme décrit s'arrêtera avec la bonne éternelle ou non, etc.
réponse. On aurait donc un algorithme pour le Ces énoncés d'existence d'indécidables de
problème P, ce qui est en contradiction avec Gode1 à propos de problèmes variés peuvent être
l'hypothèse que P est indécidable. Donc, parmi les renforcés, et l'ont été de bien des façons. D'abord,
énoncés vrais associés au problème P , il y en a un on établit facilement qu'à chaque problème indé-
au moins aui est vrai et non démontrable dans le cidable correspond non pas un, mais une infinité
système de démonstrations S . d'indécidables de Godel. Ensuite on connaît,
Remarquons que notre raisonnement établit grâce à Gregory Chaitin, des Laboratoires de
l'existence d'un indécidable de Gode1 relative- recherche IBM de Yorktown Heights, des pro-
ment à S, mais ne le construit pas explicitement, blèmes «si indécidables))que tous les énoncés qui
contrairement à la démonstration originale de leur correspondent sont des indécidables de
Godel. Godel, sauf un nombre fini d'entre eux.
Grâce à notre raisonnement, nous sommes Ainsi, apparues à l'occasion de problèmes de
certains que, pour tout système de démonstrations logique mathématique, les notions de calculabi-
S , il existe un énoncé de la forme «la machine de lité et de décidabilité ont progressivement touché
Turing ne s'arrête pas* ou de la forme «lamachine un grand nombre de disciplines, y compris en
de Turing s'arrête» qui est vrai mais indémon- dehors des mathématiques. Il n'est pas excessif
trable dans le système S (en fait, dans les systèmes de dire que, par leurs implications concrètes (en
de démonstrations intéressants, on peut préciser informatique, notamment), mathématiques et
que c'est un énoncé de la forme «la machine de philosophiques, ces notions sont parmi les plus
Turing ne s'arrête pas» qui est indémontrable). importantes qui aient été mises au jour, au cours
De même, comme conséquence de notre résul- du siècle, à l'égal de celles qui ont été élaborées en
tat, on obtient que, dans tout système de démons- relativité, en mécanique quantique et en biologie
trations, il existe un problème de correspondance moléculaire.
E n 1941,Kurt Gode1mettait au point son inter- sonnelles, qu'il écrivait dans un langage sténo-
prétation constructive de l'arithmétique qu'il graphique aujourd'hui abandonné, donnera
présenta au cours d'une conférence à luniversité accès à cette p a r t i e de son travail, quasi
Yale. L'article correspondant ne fut publié qu'en inaccessible jusqu'alors.
1958, en allemand, dans la revue Dialectica ; on Avant d'exposer le sens de son résultat de
désigne ce travail de Godel sous le nom d'interpré- 1941, rappelons ses trois autres énoncés princi-
tation Dialectica. Cette patience modeste tranche paux, qui bouleversèrent profondément et dura-
avec la précipitation actuelle ; aujourd'hui tout blement la logique mathématique et, au-delà, la
résultat, important ou non, est publié quelques philosophie des sciences.
semaines après sa mise Le premier travail
au point. de Gode1 fut s a thèse,
Kurt Gode1est né en approuvée le 6 juillet
1906 à Brno, en Tchéco- 1929 par Hahn et Furt-
slovaquie, e t il étudia wangler, mathémati-
essentiellement à Vien- cien et cousin du célèbre
ne, en Autriche. Après chef d'orchestre. Dans
33 années passées en cette thèse, il répondait
Europe, Gode1 s'installa à une question posée
définitivement à Prince- p a r Hilbert e t Acker-
ton, aux Etats-Unis ; il man : «Ce que l'on peut
obtint un poste à l'lnsti- établir en logique par le
tute for Advanced Stu- moyen de raisonne-
dies, où Einstein t r a - ments codifiés, par ex-
vailla jusqu'à la fin de sa emple dans le système
vie. formel des Principia
Gode1 est reconnu Mathematica de Russel
comme le plus g r a n d et Whitehead, donne-t-
logicien du XXe siècle. Il il complètement tout ce
a assez peu publié, mais qui est vrai en logique?»
des résultats de premier La réponse positive de
ordre. Bien que son Gode1 constitue ce que
œuvre scientifique soit l'on appelle le théorème
peut-être comparable à de complétude du calcul
celle d'Albert Einstein, des prédicats du pre-
avec qui il eut de nom- mier ordre. Le résultat
breuses conversations, est étonnant, parce qu'il
Gode1 e s t assez mal Kurt Gode1 et Albert Einstein à Princeton. signifie que la notion de
connu. Cela est dû en vérité logique peut être
grande partie à sa personnalité réservée : il ne ramenée à de la syntaxe, et puissant parce qu'il
chercha jamais, comme Einstein ou Freud, à implique notamment que tout système logique
populariser ses résultats par des livres ou des non contradictoire possède un modèle, autre-
conférences, ment dit que cohérence et existence sont deux
Le travail de 1941 constitue la dernière des notions qui coïncident en calcul des prédicats du
grandes découvertes logiques de Godel, car premier ordre.
ensuite il s'occupe pendant quelques années de Pour comprendre le sens du théorème, exa-
physique relativiste, puis jusqu'à sa mort, le 14 minons un exemple de ((vérité logique* dont
janvier 1978, de philosophie des mathéma- Gode1 établit la prouvabilité. La formule ((si,
tiques. On évalue encore mal aujourd'hui pour tout x et tout y, x est en relation avec y,
l'ampleur de son travail et de sa réflexion en phi- alors, pour tout z, z est en relation avecz»est une
losophie. Entreprise en 1986, la publication de évidence, cela quel que soit le domaine d'objets
tous ses travaux et d'une partie de ses notes per- que l'on prenne pour faire varier x, y et z, et
24 LOGIQUE, INFORIMATIQUE ET PARADOXES
quelle que soit la relation que l'on envisage. La tion, et qu'en conséquence on peut les utiliser
formule indiquée est une vérité de la logique. Ce sans hésitation. Ces axiomes «douteux» sont
que nous dit le théorème de complétude de Gode1 l'axiome du choix selon lequel «à chaque fois
est que cette vérité est démontrable élémentai- qu'un ensemble d'ensembles est donné, on peut
rement par les règles de calcul mises au point constituer un ensemble nouveau en choisissant
par les logiciens et donc que ces règles de calcul un élément dans chacun de ces ensembles)), et
sont complètes (ce que les logiciens pressen- l'axiome d u continu, appelé hypothèse du
taient, mais que Gode1 fut le premier à établir). continu, qui indique qu'«il n'y a que deux sortes
Gode1 démontra son deuxième résultat de sous-ensembles infinis de l'ensemble des
important (composé de deux théorèmes d'incom- nombres réels :ceux qu'on peut mettre en corres-
plétude) peu de temps après, en 1930. C'est le pondance élément par élément avec les nombres
plus connu de ses résultats et sans doute celui réels, et ceux qu'on peut mettre en correspon-
dont les implications philosophiques sont les dance élément par élément avec les nombres
plus nombreuses : il e n t r a î n e notamment entiers.))
l'impossibilité de ramener les mathématiques Bien que très intéressant, ce troisième tra-
de l'infini aux mathématiques du fini. David Hil- vail de Gode1 ne résolut pas toutes les questions
bert avait espéré que cela serait possible et il qu'on se posait sur l'axiome du choix et de l'hypo-
s'était même donné pour objectif, dans son thèse du continu. En effet. on aurait bien voulu
((Programmede Hilbert)),de le démontrer. Le savoir si ces axiomes sont indépendants des
premier théorème d'incomplétude de Gode1 autres axiomes de la théorie des ensembles,
indique toute formalisation de l'arithmétique et autrement dit si, de plus, leurs négations intro-
des théories plus puissantes que l'arithmétique, duisent des contradictions.
telle la théorie des ensembles est nécessaire- Gode1travailla longuement sur ce problème,
ment incorrecte ou incomplète, c'est-à-dire que il établit même le résultat recherché Dour
nécessairement ou bien elle permet de démon- l'axiome du choix, mais, insatisfait, il aban-
trer des résultats faux, ou bien elle ne donne pas donna son travail sur les axiomes de la théorie
les moyens de prouver tous les théorèmes. Si l'on des ensembles, sans publier son résultat supplé-
ne s'intéresse qu'aux théorie ne permettant que mentaire s u r l'axiome du choix. C'est Paul
la démonstration de résultats vrais, on peut Cohen qui, en 1963, réussit à montrer l'indépen-
énoncer le résultat de Gode1 par : toute formali- dance des deux axiomes, donnant quelques
sation de l'arithmétique est incomplète. regrets à Gode1d'avoir renoncé trop rapidement.
Le second théorème d'incomplétude énonce Le quatrième et dernier des travaux princi-
que, parmi les formules vraies de l'arithmétique paux de logique mathématique de Godel, qui fut
non démontrables dans u n système formel présenté il y a 50 ans, porte sur les principes non
donné, il y en a une dont le sens est très simple, finitaires qu'on est obligé d'adopter (d'après le
celle qui affirme que le système formel en ques- second théorème d'incomplétude), en plus des
tion est non contradictoire. Le second théorème simples mathématiques du fini, pour établir la
d'incomplétude de Gode1 indique donc que non-contradiction de l'arithmétique.
jamais une théorie intéressante ne pourra D'après les carnets de Godel, la démonstra-
démontrer d'elle-même qu'elle ne conduit pas à tion du résultat principal lui serait apparue le
une contradiction. ler janvier 1941. Dans ce travail, Gode1 propose
Ainsi, les deux théorèmes d'incomplétude une méthode permettant d'associer à chaque for-
ont un sens négatif, tandis que le résultat de mule de l'arithmétique une formule d'un lan-
complétude de 1929, lui, a un sens positif. On gage plus riche «immédiatement intelligible), et
peut résumer ces résultats en disant que la dont la non-contradiction est intuitive. La non-
logique peut se ramener à de la syntaxe, mais contradiction de cet a u t r e système formel
que l'arithmétique, et toute théorie plus puis- entraînant celle de l'arithmétique, on obtient
sante, ne pourra jamais être ramenée à de la une confirmation intuitive de la validité de
syntaxe. l'arithmétique élémentaire.
Le troisième grand travail de Gode1 en Bien que Gode1 fût motivé dans ce travail
logique mathématique date de 1938 et porte sur par des considérations métamathématiques, le
les axiomes de la théorie des ensembles. Il principe qu'il introduisit est aujourd'hui utilisé
indique que les axiomes adouteux))de la théorie lors de la conception de langages informatiques
des ensembles n'introduisent pas de contradic- fondés sur la méthode de «programmation par
les preuves».Dans de tels langages, on considère cidables simples concernant l e s nombres
que la meilleure façon d'obtenir des programmes entiers, dont la vérité ne peut être établie que
fiables est de les obtenir automatiauement à dans des systèmes formels de h a u t niveau.
partir d'une démonstration mathématique. Le réalisme de Gode1 le conduisit notam-
En 1979, les Japonais Goto et Sato ont uti- ment à affirmer que l'hypothèse du continu est
lisé le svstème de Gode1 afin d'extraire des mo- vraie ou fausse, même si nous n'avons pas encore
grammes à partir de preuves, et si l'on préfere trouvé le moyen de proposer les axiomes natu-
aujourd'hui d'autres systèmes que celui proposé rels qui permettent d'en décider. Ce réalisme
en 1941. on ne eut s'em~êcherd'admirer ce tra- extrême dont Gode1 dit lui-même qu'il l'aida à
vail. ~ o d e lmoiivé
, par des considérations sur les établir ses résultats fondamentaux s'oppose aux
fondements des mathématiques, introduit une conceptions intuitionnistes et constructivistes
technique qui est au cœur des recherches infor- en philosophie des mathématiques, lesquelles
matiques actuelles. semblent pourtant donner une vision plus rai-
Gode1 prit comme principe fondamental de sonnable de l'activité mathématique. Tout
sa philosophie cette interaction de l'abstrait le récemment, la philosophe logicienne Penelope
plus pur et du concret le plus immédiat :il fut un Maddy s'est appuyée sur les résultats établis
réaliste en philosophie des mathématiques. Il depuis le résultat de Cohen de 1963 en théorie
défendit l'idée que les objets mathématiques ne des ensembles et a remis en valeur la philoso-
sont pas seulement des fictions du langage ou de phie réaliste des mathématiques, dans une éla-
simples configurations mentales, mais qu'ils boration nouvelle des arguments qui doit beau-
existent indépendamment de nous, et que la coup à celle soutenue par Godel.
connaissance de leur univers le plus abstrait Cinquante ans après son dernier grand tra-
n'est pas sans conséquence sur les objets mathé- vail en logique mathématique, Gode1 est tou-
matiques les plus simples. Le logicien américain jours d'actualité. La profondeur de ses résultats,
Harvey Friedman a produit, depuis une ving- de ses écrits déjà publiés et de ses notes person-
taine d'années, un faisceau de résultats allant nelles bientôt disponibles l'y maintiendront
dans ce sens, notamment des propositions indé- longtemps.
- -
Écrire à l'écran ((Quecrois-tu que je vais choi- dans la minute qui vient, mais aussi son compor-
sir?),. tement à l'infini. Un ordinateur non isolé qui dis-
Lire la réponse, la mettre dans la variable R, pose de mémoires de plus en plus volumineuses à
Si R = «Le whisky,, alors écrire «Je choisis le sa demande - comme une machine de Turing - est
jus d'orange», simulable comme précédemment et donc est pré-
Si R = «Lejus d'orange))alors écrire «jechoisis visible pour la minute qui vient, mais n'est pas
le whiskvm.
u r
prévisible à l'infini. On ne peut pas, par exemple,
Écrire «Tu vois que je suis libre». déterminer par analyse de son état initial et de ses
Je maintiens, que malgré sa banalité, le para- programmes s'il va s'arrêter ou non : c'est la
doxe de l'apéritif est intéressant, car, de la façon fameuse indécidabilité de l'arrêt. Par ailleurs, un
la plus élémentaire qui soit, il montre que, dans ordinateur connecté à un réseau est imprévisible
certaines situations simples et sans mystères, pour l a raison toute simple qu'il peut faire
une partie d'un système ne peut prédire un évé- dépendre son comportement futur des informa-
nement futur du système, et cela même si le sys- tions qu'il échangera par le réseau.
tème global est fini, déterministe et n'est consti- Gardons à l'esprit les deux évidences que
t u é que d'un petit nombre de composants nous venons de voir, car elles nous serviront de
mécaniques. repère quand, plus loin, la tête nous tournera:
Si celui qui fait la prédiction n'est pas obligé (a) pour des raisons immédiates et n'ayant rien à
de la divulguer, il n'y a plus de paradoxe. C'est voir avec le libre arbitre, la prédiction est parfois
donc l'appartenance du prédicteur au système et impossible ; (b) il y a des cas non triviaux où la
l'obligation d'énoncer sa prédiction qui engen- prédiction est possible, comme celui du comporte-
drent ici la difficulté. ment des ordinateurs isolés.
N'oublions pas que, à l'inverse, la prédiction
est possible dans certains cas assez complexes : L'intelligence artificielle mise en doute?
un ordinateur isolé est toujours prévisible. Pour
connaître le résultat de son calcul lorsau'on le La deuxième situation où l a prédiction
fera fonctionner, il suffit de connaître son état ini- entraîne des difficultés graves est connue sous le
tial détaillé et de disposer d'une machine ana- nom de paradoxe de Newcomb. Il fut inventé par
logue qu'on placera dans le même état initial et à le physicien William Newcomb vers 1960 et a été
qui on fera réaliser le même calcul. Tout est par- l'objet de discussions acharnées depuis.
faitement fixé à l'instant du début du calcul de Une fée vous dit :
l'ordinateur et, tout étant parfaitement détermi- (1)Je ne me trompe jamais dans mes prédic-
niste dans l'exécution des programmes, il en tions ;
résulte qu'aucune incertitude n'entache leur (2) Voici une boîte rouge et une boîte bleue ;
déroulement, même compliqué. Notons d'ailleurs (3) Tu pourras ouvrir soit la boîte bleue, soit
que l'un des buts principaux des constructeurs et les deux boîtes (la boîte rouge et la boîte bleue), et
des concepteurs d'ordinateurs est d'éviter tout t u prendras le contenu des boîtes ouvertes ;
indéterminisme, ce qui parfois n'est obtenu (en (4) Dans la boîte rouge, je mettrai 100 F ;
particulier pour les mémoires vives) qu'en utili- (5) Avant de remplir la boîte bleue, je ferai
sant des techniques spéciales - comme les codes une prédiction (queje ne te communiquerai pas):
correcteurs d'erreurs - qui détectent et corrigent si je prédis que tu prendras la boîte bleue toute
tout écart au déterminisme strict. seule, je mettrai 1000 F dedans ; si je prédis que
Par nature donc, le résultat du calcul d'un t u prendras les deux boîtes, je ne mettrai rien
ordinateur isolé peut toujours être simulé, soit dans la boîte bleue.
sur une autre machine identique - ce qui sim- Que faut-il faire? Ouvrir les deux boîtes,
plifie le travail -, soit - et en informatique c'est comme les règles nous y autorisent, ou se conten-
une opération courante - sur une machine diffé- ter d'ouvrir uniquement la bleue?
rente qui imitera - on dit parfois qui émulera - La plupart des gens à qui l'on pose le problème
la première. disent qu'il vaut mieux n'ouvrir que la boîte bleue,
Dans l'énoncé ci-dessus, il est essentiel de seule. En effet, cela rapportera 1000 F - si les pré-
préciser «isolé».En effet, un ordinateur isolé ne dictions de la fée sont toujours justes -, alors que
peut prendre qu'un nombre fini d'états différents prendre les deux boîtes -toujours si les prédictions
- c'est un automate d'états finis - et donc il en de la fée sont justes - ne rapportera que 100 F.
arrive nécessairement à tourner en rond, ce qui Mais certaines personnes font un autre rai-
rend prévisible non seulement son comportement sonnement. Elles disent : ((Aumoment où je fais
MACHINES, PREDICTIOiW ET FIN DU MONDE 29
mon choix, les boîtes sont remplies ; donc, à cet Dans le oaradoxe de Newcomb avec ordina-
instant, je choisis entre prendre le contenu de la teur, nous utilisons l'hypothèse qu'il est pro-
boîte bleue uniquement, ou prendre le contenu de grammé pour raisonner sur le problème comme
la boîte bleue et de la boîte rouge. Je ne veux pas nous le faisons nous-mêmes. La contradiction
me priver du contenu de la boîte rouge que je sais obtenue nous oblige à reconnaître que, cette fois,
être de 100 F! J e dois donc ouvrir les deux boîtes.,) c'est l'hypothèse d'une programmation possible
Pour renforcer l'hésitation entre les deux rai- aui est à reieter. Nous devons donc conclure du
sonnements, on peut imaginer qu'un arbitre Paradoxe de Newcomb avec ordinateur que
contrôle le jeu : il a connaissance de la prédiction jamais nous n'arriverons à programmer des
de la fée et il vérifie qu'à l'instant où le joueur machines oour au'elles raisonnent comme nous.
choisit, la fée ne change pas le contenu des boîtes. ~iendrioni-nousL1à une preuve de l'absurdité du
Cela rend difficile le renoncement au contenu de projet de l'intelligence artificielle qui prétend
100 F de la boîte rouge que préconise le premier réaliser des machines avant des ca~acitésd'intel-
raisonnement. ligence équivalentes à celles des humains?
Deux raisonnements qui semblent justifiés Je sais que beaucoup de gens doutent de la fai-
conduisent à deux conclusions opposées. L'une des sabilité du projet de l'intelligence artificielle, mais
hypothèses de départ doit être absurde. C'est sans il me semble absurde de croire qu'on peut prouver
doute l'hypothèse concernant la prédiction. Donc, aussi simplement que cela, et par avance, l'échec
le paradoxe de Newcomb montre que la prédiction de ce programme de recherche, dont les résultats
des choix humains est impossible, même quand actuels sont loin d'être négligeables. Il y a donc
celui qui fait les prédictions ne les annonce pas. quelque chose qui ne va pas dans ce queje viens de
J e trouve cela raconter, et même
étrange, car, com- si je ne sais pas
me dans le para- quoi précisément,
doxe de l'apéritif, je ne crois pas que
on pourrait faire le paradoxe de
intervenir un ordi- Newcomb avec
nateur. Supposons ordinateur dé-
en effet que nous montre l'impossi-
ayons programmé bilité de l'intelli-
un ordinateur pour gence artificielle.
raisonner comme Personne
nous venons de le aujourd'hui n'a
faire. L a conclu- réussi à formuler
sion que nous clairement la ou
avons obtenue con- les erreurs dans
cernant l'imprévi- les raisonnements
sibilité du compor- autour d u para-
tement h u m a i n doxe de Newcomb,
s'appliquerait à et le vertige dont
notre ordinateur. on est saisi quand
Nous aurions donc on cherche à ap-
une démonstration profondir le pro-
que le comporte- blème n'a d'égal
ment des ordina- que la conviction
teurs est imprévi- l ~ o G'CHAT~ SOIT ~ ~ ~ ~ ~ ~très forte
E que~rien ~ ~
sible, ce qui est SUR LE BUREAU, LA FENÊTRE SUR LE BUREAU, LA FENETRE ne peut en être tiré
incompatible avec ÉTANT OUVERTE : 0,001 ÉTANT OUVERTE : 0,l concernant le
la remarque faite SACHANT QUE LE CHAT EST JR LE BUREAU. QUELLE EST LA monde réel, ni, en
plus h a u t q u e le particulier, con-
c o m p o r t e m e n t 2. Je sais qu'une fois sur deux j'oublie de fermer la fenêtre de la cuisine cernant le projet
d'un ordinateur et qu'alors, une fois sur 10, le chat de la voisine vient s'installer sur la de l'intelligence
isolé est toujours table de mon bureau. Lorsqueje ferme la fenêtre,le chat n'est presque artificielle: il y a
jamais sur mon bureau, en fait moins d'une fois sur 1 000. Je vois le chat
prévisible. La con- sur mon bureau. Ne dois-je pas en conclure que, très probablement,la une inadéquation
tradiction est grave. fenêtre est ouverte? La formule de Bayes justifie un tel raisonnement. évidente entre les
30 LOGIQUE, INFORMATIQCE ET PARADOXES
moyens utilisés - qui ne portent sur aucun fait siques de l'univers ne s'expliquent bien qu'en uti-
réel - et les conclusions qu'on prétend obtenir lisant ce principe.
concernant la liberté humaine ou l'intelligence
artificielle. Identifier exactement l'entourloupette L'argument de l'Apocalypse
n'est pas facile, mais il est certain qu'il y en a une!
Les lecteurs intéressés pourront se reporter au Précisons que ce que j'appellerai le paradoxe
livre de W. Poundstone (Les labyrinthes de la rai- de Leslie (appelé aussi argument de l'Apocalypse)
son, 1988,éditions Belfond)où le paradoxe de New- provoque une réaction violente et immédiate de
comb est longuement et finement discuté. rejet de pratiquement toute personne à qui on
l'explique. Cette réaction est due à la conclusion
du raisonnement. Il est étrange que ce soit la
Le philosophe que personne ne croit conclusion qui gêne, plus que le raisonnement
La troisième difficulté que je souhaite évo- lui-même! Car celui-ci semble être correct dans
quer concernant la prédiction a été récemment bien des situations similaires et serait sans doute
avancée par John Leslie, un philosophe spécialisé considéré comme banal s'il ne nous touchait pas
dans l'étude des problèmes de cosmologie et qui de si près, comme nous allons le voir.
s'est aussi particulièrement intéressé au principe Pour introduire le raisonnement de Leslie,
anthropique. Ce principe, qui est l'objet encore considérons d'abord l'histoire du chat de la voisine :
aujourd'hui de nombreuses discussions entre < J eme lève une nuit d'été en me demandant
astrophysiciens, affirme que : ((Lorsquenous si je n'ai pas oublié de fermer la fenêtre de la cui-
réfléchissons à notre situation dans l'univers, sine. Je sais que cela m'arrive un jour sur deux. Je
nous ne devons pas nous étonner de nous trouver sais aussi que, lorsque j'oublie de fermer la
quelque part où la vie et l'intelligence sont pos- fenêtre, le chat de la voisine vient s'installer sur
sibles, puisque, si elles ne l'étaient pas, nous ne mon bureau dans 10 pour cent des cas. J'évalue
serions pas là pour le remarquer!» ou, sous forme aussi que la probabilité pour que le chat de la voi-
succincte : «Un observateur doit s'attendre à se sine soit sur mon bureau lorsque la fenêtre est
trouver là où les observateurs sont possibles.» Il fermée est très faible, disons 0'1 pour cent.
s'agit d'une évidence, mais, comme nous allons le J'allume la lumière du bureau, je ne sais pas si la
voir plus loin, de l'évidence à l'absurde le chemin fenêtre de la cuisine est ouverte, mais je vois le
est parfois court! Certaines caractéristiques phy- chat de la voisine sur mon bureau. N'ai-je pas une
bonne raison maintenant de croire que la fenêtre
de la cuisine est ouverte?))
La formule de Bayes Tout le monde s'accorde à croire que oui, car
Dans notre exemple, il y a deux théories (ou c'est un principe de bon sens que de dire : entre
hypothèses) en compétition : la théorie A = "La fenêtre deux théories également probables, je dois préfé-
est ouverte" et la théorie B = "La fenêtre est fermée". rer celle qui rend ordinaires mes observations, à
La probabilité a priori de la théorie A est PA = 0,5et la celle qui fait de mes observations des faits excep-
probabilité a priori de B est aussi PB = 0,5.On sait par
ailleurs que lorsque A est vraie, la probabilité que le
tionnels. En théorie des probabilités, cela est par-
chat soit sur le bureau est de QA = 0,l et que lorsque faitement démontrable et résulte de ce au'on
c'est 6,elle est de QB = 0,001.La formule de Bayes appelle la formule de Bayes. Un calcul préciLavec
indique que la probabilité Ph que "La fenêtre est cette formule indiquerait ici qu'après avoir
ouverte" soit vraie lorsqu'on sait que le chat est sur le observé le chat, je dois considérer qu'il y a 99,Ol
bureau (probabilité a posteriord est : pour cent de chances pour que j'aie laissé la
PA= (PAQR)/(PAQA + PBQB). fenêtre de la cuisine ouverte. En résumé: le fait de
Bien sûr, la probabilité Pb que ce soit B qui soit
vraie lorsqu'on sait que le chat est sur le bureau est :
voir le chat fait passer la probabilité que la
PB= PeQ$(PAQA + PBQB). fenêtre soit ouverte de 50 pour cent à 99'01 pour
Ici, on obtient : cent. Plus généralement, l'observation du chat
PA= 0,5x 0,1/(0,5 x 0,l+ 0,5X 0,0001)= 0,9901= augmente la probabilité de l'hypothèse que la
99 pour cent. fenêtre est ouverte, quelle que soit l'évaluation
Dans le cas de l'Apocalypse, le calcul donne : initiale de cette probabilité.
PA = 0,Ol x 0,1/(0,01 x 0,l)+ (0,99x 0,001) Considérons maintenant deux hypothèses
0,502512= 50,25pour cent.
Dans le paradoxe des bébés, le calcul donne :
complémentaires que nous appellerons Théorie A
PA = 0,Olx 1/(0,01x 1 + 0,99 x 1/70)= 0,4142= et Théorie B :
41,42pour cent. - Théorie A : l'humanité disparaîtra avant
2150.
MACHINES, PREDICTIOlVS ET FIN DU MONDE 31
est très peu probable qu'il ait trouvé un contre Le deuxième point qui me fait espérer que le
argument orignal que John Leslie n'ait pas déjà raisonnement de Leslie est inacceptable est ce
décortiqué, car, comme je le disais plus haut, que j'appelle le paradoxe des bébés.
l'article détaillé du philosophe publié dans la Imaginons que les données suivantes sont
prestigieuse revue Mind (vol. 101, no 403, juillet exactes (elles ne le sont pas précisément pour la
1992, pp. 521-540) donne des réponses assez France, mais sont assez proches des données
bonnes - à mon sens - à toutes les critiques élé- réelles).
mentaires. Si, malgré tout, des lecteurs pensent - 1 pour cent des bébés meurent dans leur
disposer d'arguments clairs contre le raisonne- première année de vie.
ment de Leslie, je leur suggère d'entrer en contact - Pour les 99 pour cent qui passent leur pre-
directement avec lui pour les lui expliquer. Son mier anniversaire, la durée de vie moyenne est de
adresse, qu'il m'a autorisé à publier, est : Dépar- 70 ans.
tement de philosophie, Université de Guelph, En copiant Leslie et en imaginant que je suis
Guelph, Ontario, NlG2W1, Canada. Il parle le un bébé de moins de 1an, je peux alors faire le rai-
français et se fera un plaisir de répondre comme il sonnement suivant :
a répondu aux longues lettres que je lui ai «Lefait que je sois dans ma première année de
envoyées. John Leslie prépare aussi un livre où il vie est ordinaire si je suis un humain qui n'atteint
traitera plus généralement de toutes les facons pas son premier anniversaire ; en revanche, être
rationnelles d'aborder les questions liées à la fin dans ma première année de vie est pour moi quelque
du monde en philosophie et en astrophysique. chose d'exceptionnel si je suis un humain dont la
John Leslie note qu'il y a un lien entre son rai- durée de vie est de 70 ans, car je n'ai qu'une chance
sonnement et le principe anthropique, car la sur 70 d'être dans ma première année. Si je suis un
forme généralisée du principe qu'«Un observa- bébé dans sa première année de vie, je dois donc
teur doit s'attendre à se trouver là où les observa- revoir à la hausse le 1pour cent de chances (de mal-
teurs sont possibles))est qu'«Un observateur doit chances!) que les statistiques m'attribuent de ne pas
s'attendre à se trouver là où les observateurs sont connaître mon premier anniversaire. La formule de
le plus probables)),ce qui est la base de l'argu- Bayes me dit précisément que prendre en compte le
ment de l'Apocalypse. John Leslie y voit la confir- fait queje suis dans ma première année, en calculant
mation qu'il faut prendre au sérieux son argu- comme Leslie, transforme le 1 pour cent en 41,42
ment de l'Apocalypse. DOW cent. Je dois donc craindre sérieusement de ne
Dans u n article tout récent de la célèbre jamais souffler ma première bougie..
revue Nature, l'astrophysicien Richard Gott III, La conclusion du raisonnement est résolu-
de l'université de Princeton, donne une présenta- ment absurde, car si 1 pour cent des bébés meu-
tion assez différente, mais convergente de l'argu- rent dans leur première année et que je suis un
ment de l'Apocalypse (qu'il relie au principe bébé dans ma première année de vie, j'atteindrai
copernicien : ((sans raison particulière, c'est une mon premier anniversaire dans 99 pour cent des
erreur de croire que nous occupons une position cas. Une réévaluation à la hausse du 1pour cent
privilégiée dans l'univers,)). en 41,42 pour cent n'est pas justifiée. John Leslie,
J e ne veux pas entrer dans le détail des cri- à qui j'ai soumis le paradoxe des bébés, m'a pro-
tiques qui ont été opposées à Leslie et de celles posé la réponse suivante. Pour lui, il est exact que,
- prévisibles - qui vont l'être à l'article de R. Gott. dans le cas des bébés. il n'v" a Das de réévaluation à
L
Je me contenterai de deux remarques. opérer de 1pour cent'à 41,42 pour cent. Mais, pour
les risques d'Apocalypse prochaine, dit-il, les
Qu'en pensent les bébés? choses sont différentes. car la ~robabilitédont
nous partons dans le raisonnement résulte d'une
La première remarque, qui est analogue à celle évaluation subjective des risques que court
faite pour le paradoxe de Newcomb, c'est qu'il y a l'humanité auiourd'hui : nous sommes donc en
une disproportion grave entre les moyens mis en droit de modifier cette évaluation approximative
œuvre dans le raisonnement - moyens dérisoires qui, contrairement au cas des bébés, n'est pas le
n'invoquant aucun fait matériel nouveau - et la produit d'études statistiques objectives.
conclusion obtenue qui, elle, concerne notre avenir Je laisse les lecteurs évaluer si cette réponse
proche et qui, concrètement, signifie que les risques est satisfaisante, et je m'excuse auprès d'eux
nucléaires, les risques dus à la pollution ou aux épi- d'avoir peut-être jeté le trouble dans leur esprit
démies doivent être pris plus au sérieux qu'ils ne le en exposant des paradoxes dont je connais le pou-
sont lorsqu'on ne fait pas le raisonnement. voir obsessionnel.
Le désordre total existe-t-il?
Ê
tre ordonné est difficile, chacun le sait recommence alors la même substitution, ce qui
bien. Plus étonnant, être vraiment désor- donne 01101001, puis 0110100110010110, etc.
donné est aussi très difficile... Examinons Vous constatez - ce que je trouve assez mer-
un exemple. veilleux, vu la simplicité du procédé - que jamais
Monsieur Hasard chaque matin prend du il n'y a trois fois de suite la même séquence dans
café ou du thé et, comme il désire ne pas prendre la suite infinie que l'on obtient {uoir sur la figure 2
toujours la même chose, il oscille régulièrement : une démonstration de cette propriété).
café, thé, café, thé, café, thé, etc. Mais cette oscil- Le fait que cette suite ne répète jamais trois
lation l'ennuie aussi! Il décide donc de ne jamais fois consécutivement la même séquence permet-il
répéter la même séquence, en particulier de ne de dire qu'elle est vraiment désordonnée? Non, et
jamais répéter deux fois de suite, café, thé. Bien Monsieur Hasard se trompe gravement s'il le
sûr, c'est impossible : s'il ne veut jamais répéter croit. En effet, la définition en quelques lignes qui
deux séquences identiques consécutivement, en a été donnée montre que la suite de Thue-
alors, après un jour as7eccafé, il doit boire du thé Morse n'est pas du tout désordonnée. De plus, on
et, après un jour avec thé, il doit boire du café, ce peut la définir encore plus simplement en 22 mots
qui au quatrième jour le conduit obligatoirement par : ((lenième élément est un O si et seulement si
à la répétition de la paire café-thé. Très bien, se le nombre de 1 dans l'écriture binaire de n est
dit-il,puisque ne jamais boire deux fois de suite la pair)).
même chose est impossible, je me contenterai de Nous nous trouvons dans une situation désa-
ne jamais répéter trois fois de suite la même gréable, qui apparait souvent quand on cherche
séquence, e t ainsi je me comporterai de la une définition de la notion de suite aléatoire :
manière la plus désordonnée possible. imposer la condition .jamais deux fois de suite la
même séquence. est trop fort, car aucune suite de
O et de 1ne vérifie cette condition ; et, à l'opposé,
La suite de Thue-Morse imposer «jamais trois fois de suite la même
Est-ce faisable, et Monsieur Hasard a-t-il rai- séquence. est trop faible, car des suites très régu-
son de croire que cela lui évitera l'ennui? Autre- lières et parfaitement prévisibles comme la suite
ment dit, existe-t-il des suites de O et de 1ne com- de Thue-Morse satisfont cette condition. Subrep-
portant jamais trois fois consécutivement la ticement, nous ajoutons une contrainte nouvelle
même séquence? Si oui, peut-on les considérer à la notion de désordre : nous souhaitons que les
comme totalement désordonnées? suites ne soient pas «prévisibles».Nous revien-
La réponse - oui à la première question, non drons sur ce point.
à la seconde - est donnée par ce qu'on appelle la Pour avancer, réfléchissons à ce que nous
suite de Thue-Morse. Pour obtenir cette suite, on recherchons. Nous voudrions trouver une condi-
commence par 01, puis on remplace chaque O par tion simple qui, lorsqu'elle est vérifiée par une
01 et chaque 1 par 10, ce qui donne O110 ; on suite de O et de 1,permette d'affirmer qu'il s'agit
34 LOGIQUE, INFORMATIQ CE ET PARADOXES
d'une suite totalement désordonnée - autrement désordre absolu? Bien sûr que non : la suite alter-
dit, aléatoire - et, bien sûr, nous voudrions que la née que nous avons évoquée : 010101010101...,
condition ne soit pas trop forte, c'est-à-dire qu'il très ordonnée, car elle ne comporte que les paires
existe des suites répondant à cette condition. 01. ou 10, vérifie cette propriété.
E t si l'on imposait, en plus, que les fréquences
limites d'apparition de 00, de 10, de 01 et de 11
Fréquences limites soient toutes égales à 1/4? Cela reste insuffisant,
La théorie classique des probabilités s'est car par exemple 1100110011001100 ... vérifie à la
révélée i m p u i s s a n t e , car elle ne permet pas fois l a condition s u r les 112 e t les 114. Soyons
d'affirmer qu'une suite donnée est aléatoire ou encore plus exigeants : imposons simultanément
ordonnée (la suite 01010101... peut parfaitement que les fréquences limites d'apparition de toutes
résulter d'une suite de lancers d'une pièce, avec O les séquences de 1 élément soient 112, de 2 élé-
pour pile e t 1pour face >.Toutefois, l a théorie clas- ments soient 114, de 3 éléments soient 1/8, etc.
sique des probabilités établit que certaines pro- Appelons une telle suite une suite normale en
priétés sont vérifiées avec une probabilité 1, et base 2. Avons-nous une définition satisfaisante
cela va nous guider. En particulier une suite pro- des suites aléatoires?
duite par les lancers successifs d'une pièce de Dans une telle suite, on ne retrouve jamais
monnaie non truquée vérifie, avec une probabi- indéfiniment l a même séquence autrement dit, la
lité 1, qu'il y a, à l'infini, autant de 1que de O. Plus suite n'est jamais périodique à partir d'un certain
précisément, une telle suite vérifie, avec une pro- rang comme la suite 0110001010101010 .... C'est
babilité 1 ce qu'on appelle l a loi des g r a n d s bon signe. Est-ce suffisant? Deux questions se
nombres : la fréquence limite des 1 est 112, ainsi posent : existe-t-il de telles suites? Peuvent-elles
que celle des 0. Est-ce suffisant pour définir le être considérées comme vraiment quelconques?
1. La recherche d'une bonne définition des suites désordonnées est un long cheminement.
LE DESORDRE TOTAL EXISTE-TIL? 35
obtenues à partir des nombres de Champer- ner par une infinité de O», ou (.être le développe-
nowne et de Liouville, ce qui est bien ce qu'on sou- ment d'un nombre rationnel. (qui équivaut, nous
haite. Elle permet aussi de ne pas considérer l'avons déjà dit, à la propriété me pas être pério-
comme aléatoires les constantes mathématiques dique à partir d'un certain moment.) sont des
rt et e, ce qui, à bien y réfléchir, est naturel aussi, propriétés exceptionnelles. car une proportion
puisque ce sont des nombres parfaitement prévi- infiniment faible de suites de O et de 1les véri-
sibles que l'on sait calculer et qui ne sont donc fient. Comme ce sont aussi des propriétés réelle-
pas quelconques du tout! On peut aussi montrer ment testables, cela signifie que, par définition,
- c'est un peu plus difficile - que la définition de une suite aléatoire, au sens de Martin-Lof, ne se
von Mises et Church n'est pas exagérément res- terminera pas par une infinité de O et ne sera pas
trictive et que de nombreuses suites répondent à périodique à partir d'un certain rang. Les résul-
cette définition. Un exemple d'une telle suite est tats d'E. Borel en théorie des probabilités mon-
le nombre R de Chaitin (voir La figure 5). trent que m e pas satisfaire la loi des grands
On a cru, un moment, que c'était la définition nombres. est aussi une propriété exceptionnelle,
attendue de suite aléatoire. Malheureusement de même que m e pas satisfaire la loi du loga-
encore, un résultat assez délicat -mais sans appel - rithme itérén (qui a été la cause du rejet de la pro-
condamna la définition de von Mises et Church. position de von Mises et Church). Comme ce sont
Le mathématicien français J. Ville prouva l'exis- aussi des propriétés réellement testables, les
tence d'une suite (trop compliquée pour être défi- suites aléatoires, au sens de Martin-Lof, satisfe-
nie ici) aléatoire, au sens de von Mises et Church, ront par définition à la loi des grands nombres et
ayant la propriété suivante : pour tout n , le à la loi du logarithme itéré.
nombre de 1dans les n premiers chiffres binaires Pour comprendre ce que signifie «être une
de la suite est supérieur au nombre de O. Cette propriété réellement testable)),considérons les 30
propriété, qui est contraire à ce qu'on attend d'une premiers chiffres binaires d'une suite infinie :
suite aléatoire (car elle contredit en particulier ce 110011110011000011000011110011.
qu'on appelle la loi du logarithme itéré, qui Nous remarquons que les «1»vont deux par
impose non seulement la loi des grands nombres, deux, ainsi que les «O),(dit autrement : le chiffre
mais aussi des contraintes sur l'écart entre le binaire de rang 2n est le même que le chiffre
nombre de 1et le nombre de O), empêche de consi- binaire de rang 2n - 1).Cela est peu ordinaire, et
dérer que la suite de Ville est aléatoire, alors que donc si nous avions à prendre la décision d'accep-
la définition de von Mises et Church conduirait à ter ou de refuser cette suite comme suite aléa-
la considérer comme aléatoire. La définition de toire, nous la refuserions : elle est louche! Une
von Mises et Church n'est pas acceptable :elle per-
mettrait de dire aléatoires des suites qu'il n'est
pas naturel d'appeler ainsi!
1 Nombre normal en base 10
La fréquence limite des "O" est 1/10
Enfin la bonne définition! La fréquence limite des "1" est 1/10
...
La bonne solution, dont certains mathémati- La fréquence limite des "9" est 1/10
ciens avaient fini par douter qu'elle puisse exis- La fréquence limite des "00"est 1/100
ter, fiit proposée, en 1965, par le jeune mathéma- La fréquence limite des "01"est 1/100
ticien suédois P. Martin-Lof. Elle est un peu La fréquence limite des "02"est 11100
compliquée, mais il vaut la peine de faire l'effort ...
La fréquence limite des "000"est 1/1000
nécessaire pour la comprendre, puisque, cette ...
fois, la définition est satisfaisante. ...
L'idée est de dire qu'une suite aléatoire ne Tout nombre normal en base 10 est irrationnel et
doit vérifier aucune propriété exceptionnelle semble devoir être désordonné, mais le nombre de
qu'on peut réellement tester. Pour rendre précise Champernowne O,lZ3456789iOll1213... est normal
cette idée, il faut définir (a)ce qui signifie pro- en base 10.
priété exceptionnelle ; ibl ce qu'est une propriété
3. Les nombres normaux en base 10 (ou en base 2) sem-
réellement testable. blent devoir être quelconque et ressembler au résultat
Une propriété exceptionnelle d'une suite est d'un tirage aléatoire équitable. Le nombre de Champer-
une propriété que seule une infime partie -on dit nowne montre encore que ce n'est qu'une illusion, car,
bien que très régulier, il est normal. L'idée de dire qu'une
un ensemble de mesure nulle -de l'ensemble des suite est aléatoire si elle est la suite des chiffres binaires
suites de O et de 1vérifie. La propriété «se termi- d'un nombre normal est donc mauvaise.
38 LOGIQUE, INFORMATIQLT ET PARADOXES
propriété réellement testable est simplement une de Kolmogorov supérieure ou égale à 1000 000 (il
propriété comme *les NO,)et les « l n vont deux par en existe) est totalement incom~ressible: aucun
deux*, qu'on peut tester par programme avec une moyen ne permet de la décrire sous forme
précision de plus en plus grande en fonction du condensée.
nombre de chiffres dont on dispose. La condition Cette notion de com~ressionissue de la théo-
que le test soit définissable par programme est rie de la complexité de Kolmogorov permet de
très importante : si on ne l'imposait pas, alors prouver le résultat suivant, qui confirme que la
toute suite particulière s vérifierait la propriété définition de Martin-Lof est la bonne : une suite
exceptionnelle «être égal à s),,et il n'y aurait donc infinie de O et de 1 est aléatoire, au sens de Mar-
aucune suite aléatoire. La réussite de la défini- tin-Lof, si et seulement elle est incompressible,
tion de Martin-Lof provient de ce qu'elle associe c'est-à-dire si e t seulement s'il existe une
une condition ~rovenantde la théorie des ~ r o b a - constante c telle que, pour tout n, la complexité de
bilités («nesatisfaire aucune propriété exception- Kolmogorof des n premiers chiffres binaires de la
nelle*) à une condition d'effectivité qui tempère la suite est supérieure à n - c.
première condition, indispensable pour avoir une Aléatoire est donc, dans ce sens, équivalent à
définition non vide. incompressible. Ce n'est pas inattendu. Ce qui
La définition de Martin-Lof, qui est parfaite l'est plus peut-être, c'est qu'il ait fallu attendre
sur le plan mathématique, mais un peu dure à ava- les années 1970 pour le découvrir, ce qu'on doit
ler (nous n'avons d'ailleurs pas explicité la défini- indépendamment au mathématicien allemand
tion complète de propriété réellement testable), a C.P. Schnorr, au mathématicien russe L. Levin
été clarifiée, une dizaine d'années plus tard, grâce (aujourd'hui aux Etats-Unis) et au mathémati-
à la théorie de la complexité de Kolmogorov. cien américain G. Chaitin.
Les propriétés des suites aléatoires au sens
La complexité de Kolmogorov de Martin-Lof sont remarquables ; en voici
quelques-unes.
Cette théorie définit la complexité d'un objet La suite des chiffres binaires d'une telle suite
fini (par exemple, une suite finie de O et de 1)par infinie ne peut pas être définie par u n pro-
la taille du plus petit programme d'ordinateur gramme. Si elle pouvait l'être, on utiliserait le
qui permet d'imprimer l'objet en question. La programme qui la définit pour obtenir une ver-
complexité de Kolmogorov d'une suite de un mil- sion com~resséede ses chiffres binaires. Cette
lion de «1»est très faible, car il existe des pro- propriété a deux conséquences remarquables.
grammes très courts comme «pour i = 1jusqu'à D'abord, la suite des chiffres binaires de 7c ou des
1000 000 ;imprimer 1; fin.),qui impriment cette constantes usuelles des mathématiques qu'on
suite. La suite du premier million de chiffres du sait calculer par algorithmes (par exemple, à par-
développement binaire de x possède une com- tir de leurs développements en série) ne sont pas
plexité de Kolmogorov plus importante, car le aléatoires dans le sens absolu de Martin-Lof.
plus court programme qui l'imprime comporte Ensuite, puisque qu'un programme ne peut
plusieurs lignes (on ne le connaît pas vraiment, jamais produire de suites aléatoires, les fonctions
mais sa longueur, qui dépasse probablement random des langages de programmation, engen-
100, est bien inférieure à un million). Les pro- drées p a r programmes, ne peuvent qu'être
grammes courts qui permettent d'imprimer des im~arfaitementaléatoires.
objets longs peuvent être vus comme des ver- La suite des chiffres binaires d'une suite aléa-
sions comprimées de ces objets. A l'opposé, une toire est toujours normale et définit toujours un
suite de longueur 1000 000 qui a une complexité nombre transcendant.
La suite des chiffres binaires d'une suite
aléatoire est imprévisible : quand on parie à
Nombre de Liouville l'aide d'un programme sur le n + 1-ième chiffre
binaire d'une suite aléatoire en connaissant seu-
L = 0,1010010000001000...
lement les n premiers chiffres binaires, on
n'obtient en moyenne pas mieux que si l'on
4. Liouville montra que le nombre décrit ci-dessus est un pariait au hasard. Cette propriété d'imprévisibi-
nombre transcendant, c'est-à-direqu'il ne vérifie aucune lité confirme l'idée intuitive qu'on ne gagne pas
équation polynomiale à coefficients entiers. Comme c'est contre le hasard, et qui, sous des formes diffé-
un nombre très régulier, on en déduit que l'idée de dire
qu'une suite est aléatoire si elle est la suite des chiffres rentes, avait déjà été mathématisée par la théo-
d'un nombre transcendant est encore une mauvaise idée. rie des martingales.
LE DESORDRE TOTAL EXISTE-T-IL? 39
PROGRAMME 1 : 01000101010100010101000111
PROGRAMME 2 : 100101010101001011010101001000101010111
PROGRAMME 3 : 0101001001011001011010101010010010100101010010111
PROGRAMME 4 : 00100101101010010100101010111
PROGRAMME 5 : 010101001010011010110111
PROGRAMME 6 : 01001010010100100111
'1"""
NOMBRE DE CHAlTlN
EGAL A LA PROBABlLlTE
QU UN PROGRAMME TIRE
AU HASARD S'ARRÊTE
5 . À chaque ordinateur on peut associer un nombre programmes qui conduisent l'ordinateur dans une
oméga de Chaitin R : pour cela, on tire un programme au boucle infinie. Le nombre R est la probabilité que l'ordi-
hasard par des lancers successifs d'une pièce de monnaie nateur s'arrête, c'est-à-direla somme infinie de tous les
qui déterminent une suite de chiffres binaires corres- termes 2-10n~eUr(prJ,où Pr est un programme qui s'arrête.
pondant à un programme, et l'on fait fonctionner l'ordi- Ce nombre est mathématiquement défini, mais n'est pas
nateur avec ce programme. Le plus souvent, le pro- calculable :pourle calculer il faudrait savoir reconnaître
gramme provoque un arrêt immédiat, mais il existe des les programmes qui ne s'arrêtent pas, tâche impossible.
La suite des chiffres binaires d'une suite aléa- lui fournit un programme écrit chiffre binaire par
toire, ainsi que toutes les suites infinies qu'on chiffre binaire à l'aide de tirages successifs d'une
peut en extraire par programme satisfont la loi pièce de monnaie (voir la figure 5).A chaque ordi-
des grands nombres : les suites aléatoires de Mar- nateur est ainsi associé un nombre aléatoire par-
tin-Lof sont donc aléatoires, au sens de von Mises fait: mais qui échappe à tout jamais à notre pou-
et Church (la définition qu'ils proposaient était voir d'investigation (car sa définition ne permet
donc simplement trop faible). Das de le calculer. à cause de l'indécidabilité de
Bien! Mais quelles consignes doit-on donner à i'arrêt d'un programme).
Monsieur Hasard pour la suite de ses petits déjeu- Le seul conseil qu'on puisse finalement don-
ners? Nous n'avons Dour l'instant défini aucune ner à Monsieur Hasard pour «organiser))ses
suite précise qui soit aléatoire, au sens de Martin- petits déjeuners, c'est de prendre une pièce de
Lof. En existe-t-il réellement? Oui, et en fait monnaie et de l'utiliser pour déterminer à pile ou
presque toutes les suites de O et de 1 sont aléa- face, chaque matin, s'il doit prendre du café ou du
toires, au sens de Martin-Lof. On est donc dans thé. Puisque toutes les suites, sauf une infime
une situation paradoxale : presque toutes les minorité sont aléatoires au sens de Martin-Lof :
suites sont aléatoires. au sens de Martin-Lof mais en procédant ainsi, il sera presque sûr d'éviter
on ne peut en définir aucune par algorithme. Elles toute monotonie.
sont partout, mais on ne peut jamais les toucher! Tout cela pour en arriver là, me direz-vous!
Attention, les mathématiques sont subtiles! Oui, e t c'est bien là l'un des inconvénients
#Ne pas pouvoir définir par programme des majeurs de la théorie des suites aléatoires de
suites aléatoires de Martin-Lof» ne signifie pas Martin-Lof. Elle est très belle. merveilleuse
me pas pouvoir en définir dans l'abstrait.. G. Chai- même, elle semble fondamentale et apporte un
tin a proposé un moyen mathématique de définir éclaircissement essentiel à bien des questions ;
ce qu'il appelle le nombre oméga. La suite des aussi intéresse-t-elle de plus en plus de monde, y
chiffres de ce nombre est aléatoire, au sens de compris les physiciens, mais sa gravissime inef-
Martin-Lof Le nombre oméga est - par définition - fectivité rend difficile, et presque impossible,
la probabilité de l'arrêt d'un ordinateur lorsqu'on toute utilisation pratique de ses résultats.
-X-we*r -
La cryptographie quantique
A u début des années 1970, Stephen Wies- mentation des communications par voies hert-
ner, aujourd'hui employé de la Société zienne et téléphonique, et la généralisation des
informatique Thinking Machines à Cam- réseaux informatiques qui ont créé des besoins
bridge, dans le Massachusetts, proposa d'utiliser nouveaux. La possibilité de faire exécuter des cal-
la mécanique quantique pour coder des billets de culs complexes par les ordinateurs a facilité l'uti-
banque dont l'infalsifiabilité serait garantie par lisation des algorithmes de codages les plus éla-
le principe d'incertitude d'Heisenberg. Son rap- borés, et, parallèlement, fragilisé la presque
port de recherche, qui ne fut publié que dix ans totalité des méthodes utilisées auparavant. Les
plus tard, proposait aussi d'utiliser la mécanique .
informaticiens ont ~ r o ~ o des
L
s é idées nouvelles
quantique pour entremêler deux messages d'une comme les fonctions à sens unique : à partir de x,
facon telle qu'on ne puisse en lire qu'un, et qu'en le calcul de f(x) est facile, mais, à partir de f(x), il
le lisant. on rende l'autre illisible (ce aui est utile
. A
est très difficile de calculer x (le codage est facile.
c,
dans certains protocoles d'échanges de données le décodage impossible pour qui n'a pas la clef).
informatiques). Des centaines d'articles ont été publiés, plusieurs
Charles Bennett, du Centre de recherche IBM conférences annuelles réunissent les chercheurs
de Yorktown Heights, aux Etats-Unis, et Gilles du domaine, et un journal international spécia-
Brassard, de l'université de Montréal, s'inspirè- lisé a même été créé. Cependant aucun système
rent des idées de S. Wiesner, pour concevoir, au de cryptographie mathématique n'a été démon-
début des années 1980, un système de distribu- tré incassable en dehors du système one-timepad
tion de clefs secrètes dont la sûreté repose aussi - inventé en 1917 par Gilbert Vernam - qui est
sur la mécanique quantique. Ce système est présenté sur la figure 1.
arrivé à maturité : les expériences menées actuel-
lement à Yorktown H e i ~ h t sont effectivement
u
Les systèmes violables et one-timepad
permis la transmission quantiquement garantie
de clefs secrètes de plusieurs milliers de bits Tous les systèmes de codages secrets fondés
entre deux t oints distants ... de 32 centimètres. sur les mathématiques sont dangereux (à l'excep-
Plus récemment, on a réussi une telle transmis- tion de one-timepad),pour trois raisons.
sion sur plusieurs kilomètres. La première est qu'on les justifie à l'aide
La mécanique quantique semble résister à d'arguments de difficulté dans le pire cas, ou dans
toutes les mises à l'épreuve qu'on lui fait subir et le cas moyen ;or, quand je transmets un message
donc, dans l'avenir, les méthodes de cryptogra- codé, j'aimerais avoir une garantie de confiden-
phie quantique devraient jouer un rôle impor- tialité pour «l'envoi précis que je fais
tant. Cela d'autant plus que les méthodes de aujourd'hui*. J e ne peux pas me satisfaire de
cryptographie fondées uniquement sur des idées l'affirmation qu'en moyenne le type de code que
mathématiaues restent toutes incertaines. j'utilise est difficile à casser, et encore moins de
La cryptographie s'est considérablement l'affirmation que le type de code que j'utilise est
développée ces dernières années, de par l'aug- difficile à casser pour certaines clefs ressemblant
CRYPTOGRAPHIE QUANTIQUE 41
à celle que j'utilise! Certains systèmes qu'on a les énoncés mathématiques qui pourraient certi-
crus bons sont maintenant déconseillés, parce fier en général les codages sont trop difficiles
que l'on a découvert des cas facilement cassables. pour être démontrés. Cela peut étonner, mais
Dans les systèmes fondés sur les nombres pre- c'est ainsi : les spécialistes croient vraie telle
miers, comme le célèbre et très prisé RSA, baptisé conjecture qui établit la difficulté du décryptage
du nom de ses auteurs Rivest-Shamir-Adleman, de telle méthode (par exemple la factorisation des
on donne des consignes aux utilisateurs pour nombres entiers pour le RSA), mais personne ne
choisir les nombres premiers servant à engendrer sait démontrer ces conjectures. Tous les systèmes
les clefs de codage : les consignes données connus, sauf one-timepad reposent ainsi sur une
aujourd'hui sont plus strictes que celles d'hier, et conjecture non démontrée.
il est à craindre qu'elles le soient moins que celles Une troisième raison pour que nous nous
qu'on donnera demain! Un résultat mathéma- méfiions des méthodes de cryptographie mathé-
tique indique d'ailleurs qu'il est impossible de se matique est d'un autre ordre : rien n'interdit de
prémunir, à l'aide de clefs courtes, contre un déco- penser que certains services secrets savent des
deur ayant une capacité de calcul non limitée. choses qu'ils gardent pour eux, et donc une
La seconde raison de la fragilité des systèmes confiance aveugle en l'état de l'art apparent en
de cryptographie mathématique est que, même cryptographie pourrait être trompeuse. Contrai-
VERSION EN BASE 2
MESSAGE À CODER A 0 0 1 0 1 1 0 0 1 0 1 1 0 1 0
CLEF DE CODAGE B 0 1 1 1 0 1 1 0 1 1 1 0 0 1 0
MESSAGE CODÉ C = A +B 0 1 0 1 1 0 1 0 0 1 0 1 0 0 0
VERSION EN BASE 26
MESSAGE À CODER A B R A C A D A B
NUblERO DES LETTRES A 1 2 1 8 1 3 ! 4 1 2
CLEF DE CODAGE Y V O N J Z P H A
CLEF DE CODAGE
TRADUITE EN NOMBRES B 25 23 15 14 10 26 16 8 1
MESSAGE CODÉ C = A + B 26 25 7 15 13 1 20 9 3
TRADUCTION EN LETTRES Z Y G O M A T I C
1. One-time pad, ou code de Vernam, utilise une clef de de one-timepad à la condition de ne jamais utiliser deux
codage aussi longue que le message à coder. Une version fois la même clef de codage et d'utiliser des clefs aléa-
en base 2 de ce code est utilisée en informatique. La ver- toires. Pour l'utiliser sans risque, il faut faire parvenir la
sion en base 26 permet de coder facilement à la main un clef de codage à son partenaire : c'est le problème de la
texte en prenant un texte aléatoire comme clef de codage. distribution des clefs, problème que la mécanique quan-
On possède une garantie mathématique d'inviolabilité tique permet de traiter.
rement aux autres domaines des mathéma- ce qui est suffisant : on n'utilisera pas une clef
tiques, il est possible que des résultats impor- dont on saura qu'elle a été espionnée.
tants aient été obtenus et soient tenus secrets à Ce système, imaginé par Ch. Bennett et
cause de leur intérêt stratégique. Le bon sens G. Brassard en 1984 à partir des travaux de
souffle que c'est un vrai problème, et un vrai S. Wiener de 1970, et redécouvert par Wiedeman
risque de la cryptographie mathématique. quelques années plus tard, utilise des photons
Reste donc la seule méthode dont l'inviolabi- polarisés sur lesquels nous nous arrêterons un
lité a été vraiment mouvée : le one-time ad. peu. Dans ce système, l'information est contenue
C'est une méthode cfe codage élémentaire ?voir dans la polarisation du photon.
la figure 1) qui possède la propriété suivante : si Un photon polarisé est un objet quantique,
vous disposez d'une clef secrète aussi longue que donc étrange : on peut l'imaginer comme une
le message que vous voulez coder et si vous n'uti- boîte contenant une information cachée et possé-
lisez jamais plus cette clef secrète, quiconque ne dant deux modes d'ouverture : si vous choisissez
connaît pas la clef est dans l'impossibilité de la bonne ouverture, vous entrez en possession de
décoder votre message. La raison de cette pro- cette information ; si vous choisissez la mauvaise,
priété se comprend aisément : le message à s7ous n'apprenez rien et, de plus, en ouvrant la
coder peut être transformé en un message quel- mauvaise porte, vous avez détruit l'information
conque selon la clef que vous utilisez ; selon la que l'autre porte vous aurait permis d'obtenir.
clef, le mot ARTICHAUT peut aussi bien donner J'ai conçu un objet de physique classique qui
ABRACALIAB ou ZYGOMATIC ou tout autre mot de possède cette propriété des photons polarisés (la
neuf lettres. En l'absence de la clef, il est donc seule nécessaire en cryptographie quantique). Ce
totalement impossible de décoder un message modèle physique, décrit sur la figure 3, illustre la
utilisant le one-time pad ; c'est pourquoi il fut propriété du photon polarisé qui permet la cryp-
utilisé pour le ((téléphone rouge. entre Moscou tographie quantique. Toutefois le modèle méca-
et Washington. Son inconvénient est que le nique ne fonctionne que si l'on utilise normale-
récepteur et l'émetteur doivent avoir chacun ment les boîtes, c'est-à-dire si l'on ne cherche ni à
une copie de la clef et que cette copie est évidem- les détruire, ni à les radiographier ; avec des pho-
ment longue si l'on veut transmettre de longs tons quantiques, toute tricherie est impossible,
messages. car elle contredirait les principes fondamentaux
Pour le téléphone rouge, on dit que des de la mécanique quantique.
bandes magnétiques, soigneusement escortées, Venons-en aux photons polarisés eux-mêmes
transitaient régulièrement par avion entre du modèle de Ch. Bennett et G. Brassard.
Washington et Moscou. Finalement la difficulté Lorsqu'on fait passer un photon à travers un filtre
de l'utilisation de one-time pad provient de la dif- polarisant d'orientation a, le photon est polarisé
ficulté de la distribution des clefs. Comme une selon la direction a, car le champ électrique associé
clef peut être une suite aléatoire de O et de 1,le au photon n'est plus quelconque, mais parallèle à
problème est ramené au problème de l'achemine- l'axe a. Si ensuite on le fait passer dans un filtre
ment d'une suite aléatoire de O et de 1 entre un polarisant de même orientation, le photon tra-
émetteur et un récepteur, sans qu'elle puisse être verse certainement, ce que l'on constate en plaçant
interceptée par l'adversaire. un détecteur derrière le deuxième filtre. Lorsqu'on
Si l'on dispose d'un canal de communication fait passer un photon à travers un filtre d'orienta-
protégé de tout espionnage - par exemple la tion a, puis à travers un filtre d'orientation a + 90"
valise diplomatique -le problème est réglé. Mais le photon est absorbé par le second filtre.
comment être certain qu'une valise diplomatique Qu'arrive-t-il quand vous interceptez un pho-
n'est pas ouverte et son contenu microfilmé, ou ton polarisé d'un angle a avec un filtre orienté d'un
les bandes magnétiques qu'elle contient reco- angle a + 45"? Une fois sur deux, le photon passe,
piées? On connaît des cas! une fois sur deux, il ne passe pas. Et si, au lieu
d'intercepter un photon-~olariséd'un a n d e a. il
u >
3. Dispositif mécanique dont les propriétés sont celles d'un photon polarisé.
44 LOGIQUE, INFORMATIQ CE ET PARADOXES
est impossible de revenir en arrière : l'information polarisés pour transmettre une clef sans risque,
est perdue car le photon a été, soit absorbé par votre entre un émetteur et un récepteur.
filtre, soit polarisé par votre filtre. Imaginons
maintenant que je vous envoie un photon polarisé
en vous disant :«S'il est polarisé d'un angle a ou a +
Le codage du message
45")cela signifie OUI, s'il est polarisé selon un angle L'émetteur code une suite aléatoire de OUI et
a + 90" ou a + 135",cela veut dire NON.» Comment de NON selon le système précédent, où a et a + 45"
pouvez-vous orienter votre filtre pour savoir si je représentent OUI, et où a + 90" et a + 135" repré-
vous ai transmis OUI ou NON? sentent NON. 11 émet des ho tons à intervalles
Première configuration : vous choisissez de réguliers. L'émetteur choisit a u hasard et au
lire la polarisation avec un filtre orienté selon a. même rythme, pour chaque photon, de coder rec-
Si j'ai codé mon message avec a pour OUI et a + tilignement ou transversalement, et garde en
90" pour NON (polarisations rectilignes), vous mémoire les choix de codage qu'il a faits. Le
décodez alors correctement mon message : si le récepteur décode au hasard selon a ou a + 45", et
photon passe, c'est que j'ai codé OUI, et s'il ne donc, une fois sur deux en moyenne, retrouve ce
passe pas, c'est que j'ai codé NON. Mais, sij'ai codé que l'émetteur a codé, et une fois sur deux trouve
avec a + 45" ou a + 135" (~olarisationstransver- quelque chose qui ne correspond à rien. Ensuite
sales), vous lirez une réponse aléatoire qui ne l'émetteur (par un autre canal qui n'a pas besoin
signifiera rien, et vous aurez perdu tout espoir de d'être confidentiel, mais qui doit être infalsi-
savoir ce que je voulais vous transmettre. fiable, comme, par exemple, une onde radio)
Seconde configuration : vous choisissez de indique, photon par photon, quand le codage était
lire le photon avec un filtre orienté selon a + 45". rectiligne ou transversal. Le récepteur sait main-
Si j'ai codé mon message avec a + 45" pour OUI et tenant quels bits reçus sont corrects et ceux qui
a + 135"pour NON, vous allez retrouver l'informa- ne signifient rien. Il transmet à l'émetteur la liste
tion, sinon, comme précédemment, vous trouve- des numéros des bits qu'il a correctement déco-
rez quelque chose qui ne signifiera rien. dés, par exemple il lui indique qu'il a bien codé les
Si vous utilisez maintenant un filtre orienté à bits de numéro 1 3 4 6 9 10 12 13 16, etc. Mainte-
a + 90°, vous êtes ramené au cas a (en échangeant nant l'émetteur et le récepteur possèdent une
les OUI et les NON) ; si vous utilisez un angle a + liste de bits communs que l'émetteur utilise pour
135", vous êtes ramené au cas a + 45", et si vous envoyer un message (sur un canal infalsifiable)
utilisez un autre angle, vous êtes dans une situa- selon one-time pad, c'est-à-dire avec une certi-
tion mixte, qui n'est pas meilleure. tude parfaite de confidentialité.
Au bout du compte, seules les deux premières Avant cela, il s e r a i t souhaitable qu'ils
configurations sont utiles, et c'est seulement s'assurent que leur transmission de bits n'a pas
lorsque je vous dirai si j'ai codé mon message rec- été interceptée. C'est tout à fait possible : ils
tilignement (c'est-à-dire avec a ou a + 90") ou vont accepter de sacrifier quelques-uns de leurs
transversalement (c'est-à-dire a + 45" ou a + bits communs en échangeant non seulement le
135") que vous saurez si ce que vous avez trouvé numéro des bits, mais aussi la nature du mes-
correspond à mon message. Si vous découvrez sage (OUI ou N O N ) . L'émetteur indique par
que vous vous êtes trompé en choisissant de déco- exemple que le bit numéro 1 est OUI, que le bit
der rectilignement ou transversalement, vous ne numéro 6 est OUI, le bit numéro 13 est NON, etc.
pourrez pas revenir en arrière :vous aurez perdu Si le récepteur n'a pas précisément cette liste,
l'information OUI ou NON. c'est que leurs photons ont été interceptés. En
C'est ce que je mentionnais plus haut ; un effet, si un espion a épié la ligne et a tenté de
photon polarisé peut être comparé à une boîte lire les photons polarisés et de les déchiffrer, il
contenant une information OUI ou NON et com- n'a pu, dans la première phase que les lire au
portant deux modes d'ouverture : si vous utilisez hasard comme le récepteur. Donc, une fois sur
le bon, vous obtenez la bonne information : sinon, deux, il n'a pas choisi le bon axe de lecture, et
vous trouvez quelque chose qui ne signifie rien, donc une fois sur deux, il a renvoyé un photon
et, en plus, vous détruisez irrémédiablement polarisé mal imité, et donc, une fois sur quatre,
l'information que contenait la boîte. Remarquons le photon retransmis par l'espion n'est pas celui
aussi que, si vous avez choisi le mauvais mode que l'émetteur et le récepteur connaissent.
d'ouverture, rien ne vous le signale. Même quand l'espion n'a pas lu selon le bon axe,
Voyons maintenant comment Ch. Bennett et il peut avoir de la chance et réémettre un pho-
G. Brassard ont proposé d'utiliser ces photons ton conforme à ce que l'émetteur connaît, donc
CRYPTOGRAPHIE QUANTIQUE 46
c'est seulement une fois sur quatre qu'il se fait mesure soient imparfaits complique encore un
repérer. peu le protocole, mais, à l'aide de résultats
Avec le système considéré, tout espion sur la mathématiques établis par Jean-Marc Robert,
ligne est inévitablement repéré. Si c'est le cas, de l'université de Montréal, Ch. Bennett et
bien sûr l'émetteur n'utilisera pas la clef trans- G. Brassard, aidés de François Bessette, Louis
mise pour coder selon one-timepad. L'émetteur et Salvail et John Smolin ont résolu ces difficultés
le récepteur tenteront une seconde transmission et effectivement réalisé en 1991 des expériences
de bits, et c'est seulement lorsqu'ils seront cer- de transmission de clefs secrètes fondées sur la
tains de ne pas avoir été espionnés que l'émetteur mécanique quantique.
transmettra son message secret avec one-time Le principe même du système interdit que les
pad, en utilisant les bits connus par eux seuls. trains d'ondes soient amplifiés pour être envoyés
dans une fibre optique, ou que la fibre optique uti-
lisée puisse contenir des répéteurs qui lisent le
Les difficultés pratiques signal e t le r é é m e t t e n t : de tels répéteurs
Si le principe de Ch. Bennett et G. Brassard brouilleraient le message d'une manière irrémé-
n'est pas très compliqué, sa mise en œuvre pra- diable, comme le ferait un espion. Les propriétés
tique est plus délicate, pour de multiples raisons. des fibres optiques connues aujourd'hui limitent
D'abord il faut envoyer des photons un par un. Si l'utilisation de la technique de G. Brassard et
l'émetteur envoie non plus un, mais un groupe de Ch. Bennett à des transmissions de quelques
photons identiques, l'espion peut en intercepter kilomètres au plus. Pour réussir mieux, il faudra
un, laisser passer le reste du paquet, et alors il encore progresser dans la qualité des fibres
sera impossible de le repérer. Pour envoyer un optiques ou alors utiliser des canaux de transmis-
seul photon à la fois, la technique consiste à sion sous vide et totalement rectilignes (ce qui
émettre des trains d'ondes très faibles dont la n'est pas absurde dans l'espace).
probabilité qu'ils contiennent un photon est infé- L'idée de Ch. Bennett et G. Brassard est
rieure à 1,par exemple 1/10. Cela complique un sûre, mais présente des difficultés de mise en
peu le protocole décrit plus haut, mais le principe œuvre. D'autres idées, en particulier l'idée origi-
fonctionne encore. Le fait que les appareils de nale de S. Wiesner pour les billets de banque
1 2 3 4 5 6 7 8 9 1 0 1 1
MESSAGE À CODER NON OUI NON NON NON OUI OUI NON OUI OUI OUI
SUITE DE D!RECTION
DE POLARISATION
9 T T T R T R T R R T
R POUR RECTILIGNE
T POUR TRANSVERSALE
ANGLES DE POLARISATIONS
RETENUS POU L ENVOI
SUITE DE DIRECTIONS
DE LECTURE
POUR LE DECODAGE
RÉSULTATS DES MESURES
OUI OUI NONNON OUI OUI OUI NON OUI OUI NON
DURECEPTEUR
BITS COMMUNS
CORRESPONDANT
AUX MÊMES CHOIX
DE DIRECTION
-
4. L'émetteur choisit une suite aléatoire de OUI OUNON, et toire. L'émetteur indique, par un canal infalsifiable
choisit aussi une suite aléatoire de directions de polari- (comme une onde radio), les axes de polarisation qu'il a
sation (soit rectiligne R, soit transversale T).Cela déter- utilisés. Le récepteur sait alors quels sont les bits qu'il a
mine les angles de polarisation des photons qu'il envoie en commun avec l'émetteur. Il en indique les numéros à
avec la règle [OUI RI + O", [OUI Tl + 45", [NON RI + 90°, l'émetteur :2 4 6 7 8 10. De plus, s'ils acceptent de sacrifier
[NON Tl + 135'. Le receveur décode au hasard transversa- quelques bits, l'émetteur et le receveur peuvent savoir
lement ou rectilignement les photons reçus et retraduit s'ils ont été épiés, et donc s'ils peuvent se servir des bits
son résultat en une suite de OUI ou de NON. Lorsqu'il a en commun qui restent pour en faire une clef de codage
choisi le même axe de décodage que l'émetteur, il a trouvé de one-time pad. La mécanique quantique garantit par-
la bonne information, sinon il a trouvé un résultat aléa- faitement le procédé.
46 LOGIQUE, INFORM4TIQCE ET PAIlilDOXES
infalsifiables, relèvent carrément de la science- deux miroirs parfaits. C'est à cause de cela qu'il
fiction, et c'est à cause de cela que le scepticisme s'agit de science-fiction : aujourd'hui nous ne
a longtemps prévalu sur les applications de la savons même pas conserver un photon polarisé
cryptographie quantique. Détaillons quand pendant une seconde.
même l'idée de Wiesner : elle est amusante, et Un billet infalsifiable comporte un numéro
nous en savons assez sur les photons polarisés. apparent qui l'identifie et un numéro caché dans
les 20 photons polarisés. La banque garde, asso-
cié à chaque numéro apparent du billet, le
Les billets infalsifiables de S. Wiesner numéro caché et en plus, le système qui a été uti-
D'abord les billets infalsifiables doivent com- lisé pour coder le numéro caché dans les photons
porter un mécanisme permettant le stockage de polarisés. Elle sait, par exemple, que, pour le
photons polarisés, disons 20, par exemple entre billet numéro 1 3 2 4 2 5 , le numéro caché est
ONONNOONOO R R l l T R T R m R
OONOOOOONN R T T R T R T R m R
NNOOONONOO R T T R T R T R m R
5. Dans chaque billet, des photons polarisés sont conser- tilignement les photons du billet qu'il essaie de copier.
vés (entre des miroirs parfaits par exemple). La banque Une fois sur deux, il ne choisit pas le bon axe (et détruit
sait que le billet no 132423 porte, codée dans les photons alors définitivement l'information codée dans le photon),
polarisés, u n e s u i t e de O U I e t de NON comme, p a r ce qui rend impossible la fabrication d'un billet iden-
exemple, [OUI NON OUI NON NON OC1 OUI NON OUI OUI] en tique au modèle. La banque, pour s'assurer qu'un billet
utilisant les axes de polarisation [RR T T TR TR T T T RI est authentique, lit selon les axes de polarisation qu'elle
et donc que les photons sont polarisés selon les angles connaît et s'aperçoit immédiatement qu'un billet est
donnés par la règle [ O U RI i O", [OUI Tl + 45" [NON RI 3 faux, ou même qu'on a tenté de l'imiter. Bien sûr le sys-
90°,[NON Tl + 135'. Si un faussaire veut imiter un billet, il tème n'est fiable que si la table de correspondance entre
essaie de lire la suite de O U et NON codée dans les pho- numéros de billets, suites de OUI ou de NON, et suites de R
tons, mais comme il ne sait pas quels axes de polarisation et de T, est maintenue parfaitement secrète, ce qui n'est
ont été utilisés, il lit au hasard transversalement ou rec- peut-être pas une chose facile.
CKYPTOGRrlPHIE QUANTIQUE 47
254364 et que le premier photon a été polarisé nant que, si vous avez correctement deviné son
rectilignement, le second transversalement, etc. choix, vous avez gagné. et que sinon vous avez
Lorsque la banque veut savoir si un billet est perdu. Vous lui transmettez alors votre choix.
authentique, elle lit les photons du billet selon le Lorsque vous indiquez votre choix à votre adver-
système qu'elle seule connaît, et vérifie qu'ils saire, s'il vous dit qu'il a gagné, vous ne pouvez
codent bien le numéro caché. Si nécessaire, elle pas lui faire confiance, mais, grâce aux photons
recrée alors les mêmes photons pour reconstituer qu'il a envoyés, vous vérifiez qu'il a choisi pile ou
le billet. face : votre adversaire vous indique maintenant
Un faussaire qui voudrait imiter un billet va s'il avait choisi de polariser son envoi rectiligne-
tenter de lire les photons polarisés, mais, comme m e n t ou t r a n s \ - e r s a l e m e n t , e t pour vous
il ignore l'orientation de polarisation, il va se convaincre qu'il ne triche pas, il vous indique la
tromper une fois sur deux, et donc ne réussira pas suite de bits qu'il a codée. Vous vérifiez qu'il ne
à accéder a u numéro secret du billet (sauf avec ment pas en comparant les bits qu'il vous donne
une probabilité de (3141"" 0,0032). 11 sera donc avec ceux que (une fois sur deux) vous avez déco-
dans l'impossibilité de faire un faux billet. Bien dés selon le bon axe de codage. Le fait que vous
sûr, pour que le système marche, il ne faut pas tombiez bien s u r les bits qu'il vous annonce
que la banque mette en circulation plusieurs prouve que ce n'est pas après avoir connu votre
exemplaires du même billet. Il faut aussi que la choix qu'il a fait le sien. mais bien avant et que
banque réussisse à garder secrète la table des donc il n'y a pas tricherie de sa part.
numéros e t systèmes de codage utilisée pour Ce système n'est pas aussi sûr que les précé-
chaque billet. dents. En fait, il n'est sûr qu'à la condition de sup-
Les billets quantiques infalsifiables sont poser qu'il est impossible de garder un photon
aujourd'hui de la science-fiction, mais si on réus- polarisé un long moment, et donc ce système de
sissait à concevoir l'analogue électronique des tirage à pile ou face suppose une hypothèse de
petites boîtes que j'ai décrites dans la figure 3, on développement technologique qui est exactement
pourrait tout à fait utiliser le système de S. Wies- opposée à celle faite pour les billets infalsifiables
ner pour fabriquer des cartes à puce totalement de S. Wiesner : il ne faut pas savoir mettre en
infalsifiables. J e pense que c'est possible. réserve u n photon polarisé.
La fragilité du système. lorsqu'on sait garder
en réserve des photons, est due à la possibilité
Le tirage à pile ou face, à distance dont dispose l'émetteur de produire ce qu'on
Mentionnons encore. parmi les idées de la appelle des photons corrélés. Deux photons corré-
cryptographie quantique. une solution proposée lés sont deux photons négatifs l'un de l'autre : si,
pour le tirage à pile ou face à distance. en mesurant le premier transversalement on
Il s'agit d'un problème classique en crypto- trouve OUI alors on trouvera NON pour le second,
graphie dont des solutions mathématiques ont et de même rectilignement. Ces photons corrélés
été proposées, et elles sont, bien sûr, sujettes aux ontjoué un rôle très important dans la discussion
remarques que je faisais dans l'introduction. des principes de la mécanique quantique et sont
ITousvoulez faire un tirage à pile ou face avec au centre de ce qu'on appelle le paradoxe d'Ein-
quelqu'un qui est loin de vous, et qui n'a pas plus stein-Podolsky-Rosen.
confiance en vous que vous n'avez confiance en Si l'émetteur vous fait parvenir des photons
lui. Comment vous y prendre pour que ni lui ni provenant de paires corrélées, en gardant en
vous ne puissiez tricher? Le protocole suivant. réserve pour lui l'autre élément de chaque paire.
proposé par G. Brassard et Ch. Bennett, résout le alors il peut tricher. En effet. il peut prétendre qu'il
problème. a choisi pile (c'est-à-dire polarisation rectiligne)
Votre adversaire choisit pile ou face ; il code après que vous lui avez indiqué votre choix. face par
alors, soit rectilignement s'il a choisi pile, soit exemple. Lorsque vous le testez en lui demandant
transversalement s'il a choisi face, une suite de de vous prouver qu'il connaît bien la polarisation
100 bits dans des photons polarisés, qu'il vous rectiligne des photons qui vous sont parvenus, il
envoie (toujours avec le même système. CY. et a + utilise les photons qu'il a gardés en réserve pour
45"représentent O r 1 et a + 90" et a + 135"repré- faire la réponse que vous attendez. En fait il n'avait
sentent NON). De votre côté, vous décodez a u rien choisi avant de vous envoyer les 100 photons,
hasard, rectilignement la moitié des bits qu'il c'est seulement après votre choix de pile ou face
vous a transmis, et transversalement l'autre moi- qu'il a fait le sien. et ce sont les photons en réserve
tié. Vous choisissez alors pile ou face en conve- qui lui permettent de prétendre le contraire.
48 LOGIQUE, LVFORMATIQ L'E ET PARADOXES
Récemment Claude Crépeau, de l'École nor- de boîtes corrélées n'est pas possible (toujours
male supérieure de la rue d'Ulm à Paris, et G. Bras- sous l'hypothèse qu'on ne détruit pas les boîtes et
sard ont proposé d'autres méthodes de tirage à pile qu'on ne les radiographie pas) et aucune tricherie
ou face fondées sur la mécanique quantique, qui analogue à celle des photons corrélés n'est donc
ne peuvent pas être victimes de cette tricherie. envisageable. Une autre méthode plus simple,
Une de leurs idées est de trouver des primitives fondée uniquement sur l'hypothèse que le cour-
élémentaires comme <<l'engagementd'un bit), rier postal est régulier et prend un certain délai,
(l'équivalent de mettre une pièce sur une table et est facile à imaginer : le même jour, votre adver-
de la cacher avec la main) et à partir de ces primi- saire et vous, vous postez une lettre à l'autre avec
tives de définir des protocoles réalisant des opé- écrit dessus O U ou NON. Vous avez convenu
rations plus complexes comme le tirage à pile ou auparavant que, lorsque vous recevrez les lettres,
face, ou les mélanges de signaux dont nous par- si les deux messages sont identiques (tous les
lions tout au début. deux OUI ou tous les deux NON), vous avez gagné ;
Les progrès dans ces décompositions et dans sinon, c'est lui qui a gagné. Là non plus aucune
la réalisation quantique des primitives permet- tricherie n'est possible si les postes fonctionnent
tent d'espérer très prochainement des applica- régulièrement.
tions réelles autres que la distribution de clefs Cette dernière méthode de tirage à pile ou
secrètes. En particulier, certains protocoles face à distance peut d'ailleurs s'adapter à deux
d'identification, qui présentent un intérêt même utilisateurs assez éloignés l'un de l'autre qui, au
si on ne sait pas faire voyager des photons polari- lieu d'utiliser comme je le proposais tout de suite
sés sur plus de quelques centimètres, sont sur le le délai de la poste, utiliseraient le délai de trans-
point d'être réalisés. mission d'un signal lumineux d'un point à un
Il est quand même amusant de penser que les autre. Cette fois-ci, à la condition d'être certain
petites boîtes de la figure 2 peuvent servir aussi à qu'aucun compère ne puisse se placer sur le trajet
un tirage à pile ou face à distance, par courrier. Il des signaux lumineux pour les truquer, on
suffit en effet d'utiliser la méthode de Ch. Ben- obtient un système de tirage à pile ou face à dis-
nett et G. Brassard : l'émetteur vous envoie 100 tance non plus garanti par la mécanique quan-
boîtes par la poste, etc. Cependant la production tique, mais par la relativité restreinte!
Chaînage avant et déductions logiques
P as besoin de connaître la logique pour rai- On ne peut pas faire plus naturel et éléinen-
sonner correctement! Si je vous dis que, taire : on appelle cette progression le chaînage
dans une classe, <(lesélèves qui sont musi- avant, parce qu'on enchaîne toujours dans le
ciens aiment tous les mathématiaues : les élèves
x z
même sens, de la gauche vers la droite, les règles
grands et bruns sont musiciens ; ceux qui ne por- mises à notre disposition par l'énoncé. Chaque
tent pas de lunettes sont tous bruns ;Armand est étape du raisonnement, qui s'appelle une infé-
grand et ne porte pas de lunettes», vous en dédui- rence, consiste à prendre une règle dont chaque
rez rapidement qu'Armand aime les mathéma- prémisse e s t vérifiée p a r l'état présent des
tiques. La structure du raisonnement est la sui- connaissances, puis à ajouter. à l'état des connais-
vante : vous dis~osezde certaines connaissances sances, la partie droite de la règle. Ce principe
concernant Armand, la base de faits, qu'on repré- logique, appelé modus ponens, était déjà connu
sente par : (grand, non lunettes], et vous savez de des stoïciens. Rien de plus mécanique que cette
plus que : augmentation régulière des connaissances par
(1)Si musicien alors aime les mathématiques, utilisation des règles de gauche à droite dès que
(2) Sigrand et brun alors musicien, c'est possible. Il a été démontré que lorsque plus
(3) Si non lunettes alors brun, a u c u n e règle n e p e u t ê t r e utilisée, alors
L'utilisation de ces règles accroît vos connais- l'ensemble des connaissances atteint ne dépend
sances sur Armand : la règle 13) vous fait passer à pas des choix faits lorsque plusieurs règles
la nouvelle base de faits {grand, non lunettes, étaient utilisables concurremment : le chaînage
brun), la règle (21 à {grand, non lunettes, brun, avant ne dépend pas de l'ordre des règles.
musicien), la règle (1) à {grand, non lunettes, Les spécialistes des systèmes experts (logi-
brun, musicien, aime les mathématiques]. ciels tentant d'égaler les capacités des experts
1. Un exemple simple de chaînage avant utilisé dans le syllogisme :djocrate est mortel».
50 LOGIQUE, INFORMATIQCE ET P M O X E S
BASE DE FAITS
dans des domaines spécialisés) raffolent de cette choses l'une : ou bien il ne porte pas de lunettes
méthode de raisonnement, car elle est facile à pro- et alors il est dans la même situation qu'Armand
grammer et permet un très grand nombre d'infé- {grand,non lunettes) dont nous avons vu que,
rences par seconde : plusieurs centaines, voire nécessairement, il aimait les mathématiques,
plusieurs milliers. Certains systèmes experts uti- ou bien il porte des lunettes et alors il est musi-
lisent uniquement ce mode de déduction. cien d'après (4) et donc aime les mathématiques
Une question vient immédiatement à l'esprit : d'après (1). Par un raisonnement logique qui
le chaînage avant est-il complet? Toutes les consé- bien s û r peut être refait avec les méthodes
quences logiques qu'on peut tirer des règles et des logiques que nous évoquions plus haut, nous
connaissances de départ sont-elles trouvées par le venons de prouver que Bernard aime les mathé-
chaînage avant? La réponse est oui si vous n'utili- matiques. Le chaînage avant trouve-t-il cela?
sez pas de négation dans la base de faits et dans Non, car, à partir de {grand)et des quatre règles,
les règles ; elle est n o n dans le cas contraire. rien ne peut être déduit par chaînage avant :
Nous ne décrirons pas ici les méthodes aucune règle n'a (grand))pour seule prémisse, le
logiques générales utilisées pour trouver les chaînage avant ne produit ici aucune inférence.
conséquences d'un ensemble de formules. Ces Le chaînage avant est donc incomplet : il ne
méthodes sont aujourd'hui parfaitement connues trouve pas tout ce que la logique voudrait.
et formalisées, et tous les mathématiciens les
acceptent ; elles régissent l'utilisation des parti-
cules logiques et, ou, implique, équivalent, non, et
Gravité de l'incomplétude
constituent le calcul des propositions ;elles ont été On pourrait croire que, prenant conscience de
élaborées sous leur forme moderne au mesiècle l'incomplétude du chaînage avant, les concep-
par Boole, Peirce, Schroder, Morgan et Frege. teurs de systèmes experts rendus dans le com-
Le résultat de complétude du chaînage avant merce, ou bien interdisent la négation, ou bien
e s t u n r é s u l t a t que tout le monde devrait proposent un mode de raisonnement plus subtil
connaître, son importance en intelligence artifi- que le chaînage avant. Aussi étonnant que cela
cielle est immense, même si parfois ses utilisa- puisse paraître, ce n'est pas le cas, et je connais de
teurs ignorent les limitations de l'énoncé : il faut nombreux logiciels (vendus parfois très cher) qui
que la négation ne soit utilisée, ni dans les règles, utilisent le chaînage avant comme algorithme de
ni dans les connaissances de départ (la base de déduction avec des bases de règles pouvant com-
faits). porter des négations ; or les notices d'utilisation
Pour prouver que le chaînage avant n'est pas n'avertissent pas les acheteurs qu'ils risquent de
complet si l'on utilise des négations, il suffit de ne pas obtenir ce que la logique usuelle fait
donner un exemple de situation faisant appa- attendre. J'ai même eu connaissance d'un sys-
raître l'insuffisance du chaînage avant. tème expert testé dans un centre de recherche
Reprenons la situation précédente en ajou- nucléaire qui utilisait une sorte de chaînage
tant la règle : (4) Si lunettes alors musicien, et avant dont aucune preuve de complétude n'avait
considérons la base de fait associée à Bernard, été donnée. Ce n'est pas grave, vous répliquera-t-
dont nous savons simplement qu'il est grand. on peut-être, puisque (nous allons le voir plus
Aime-t-il les mathématiques? Oui, car de deux loin) rien d'incorrect ne peut être déduit avec un
CH~NAGE
AVAYT ET DEDCCTIONS LOGIQUES 51
.
30-JTION TROP RESTR Y E SO---ION NON SATISFAISAh-E -?I.GS CALCLS PREA-AB-ES " 0 - P ChAQUE hOUVELLE
O\ A BESOIN DES NEGAT OhS C E n E -0GIQUE NE C0RRESPOF.D F.1A S POJR CHAQUE NO,\ E - - I 3ASE 3E FAITS. LALGORITb'.'f
3. Pour pallier l'incomplétude du chaînage avant, quatre logique, compiler la base de règles, abandonner le chaî-
méthodes existent :ne pas utiliser lanégation, changer la nage avant. La troisième méthode semble meilleure.
52 LOGIQUE, INFORMATIQrE ET PARADOXES
généraliser autant que possible le théorème de être vraie ou fausse. mais au'elle ~ e uaussi
t être
complétude à des situations autorisant quelques indéterminée (ou inconnue). Les premières
négations (ce qui est possible). Malheureusement études sur cette logique remontent aux travaux
les bases de règles pour lesquelles le chaînage du mathématicien Lukasiewicz dans les années
avant est complet sont trop peu nombreuses, et ne 1920, et c'est une version particulière de cette
constituent pas un langage d'expression des logique, identifiée à Lille en 1987, qui a été adap-
connaissances aui satisfasse les besoins de l'intel- tée au chaînage avant : dans cette version de la
ligence artificielle. Tant pis pour la première idée, logique trivaluée, le chaînage avant est correct et
voyons la seconde : changer la logique. complet : même pour les règles avec négations, il
Remarquons d'abord que le chaînage avant, trouve exactement ce que cette logique attend
pour des bases de règles (avec ou sans négations). qu'il trouve. Sans entrer dans les détails, indi-
ne déduit jamais rien de faux. Il est peut-être quons que, pour cette logique, à cause de lavaleur
incomplet, mais toujours correct. C'est facile à inconnue, il n'est pas toujours vrai que «A ou non
démontrer : une étape élémentaire de chaînage AD; c'est ce qui explique que le raisonnement fait
avant consiste à prendre des propositions élé- pour montrer que Bernard aimait les mathéma-
mentaires connues vraies, par exemple «A»,mon tiques, ne peut pas être fait en logique à trois
B D ,«CD,à prendre une règle connue vraie, par valeurs. La logique à trois valeurs ne permet pas
exemple «SiA et non B et C alors non D. et à en de déduire autant de choses d'un ensemble donné
conclure mon Dn.Cette opération est logique- de connaissances que la logique usuelle à deux
ment irréprochable, et jamais rien de faux ne valeurs, et cette impuissance fait que ses déduc-
~ e uêtre
t inféré de son utilisation. tions correspondent exactement à ce que calcule
De nombreux concepteurs de systèmes le chaînage avant qui, lui aussi, déduit moins que
experts et de logiciels d'intelligence artificielle, la logique usuelle.
en se fondant sur cette évidence de correction du Bien que mathématiquement satisfaisante,
chaînage avant, et sur la simplicité qu'il y a à et justifiant a posteriori le point de vue pragma-
comprendre les enchaînements qu'il fait, procla- tique en intelligence artificielle, cette solution
ment le principe suivant : leur système n'utilisera laisse un goût amer : certes on peut défendre sur
que le chaînage avant et c'est à celui qui écrit les des bases intuitives cette logique trivaluée (et
règles du système expert de se débrouiller pour donc l'utilisation du chaînage avant même pour
-qm ce qui doit être déduit le soit. C'est ce qu'on des bases de règles avec négations), on peut lui
appelle parfois le point de vue pragmatique en trouver toutes sortes d'ex~licationsau'on décla-
intelligence artificielle : tant pis pour la logique, rera naturelles, il n'en reste pas moins que la
ce sont les algorithmes qui priment. Ses défen- logique de tous les jours est la bonne logique à
seurs se disent qu'il n'est pas grave que de la règle : deux valeurs (par opposition, les autres sont par-
Lorsqu'il pleut il n'y a pas de soleil, et de la propo- fois appelées logiques exotiques). Certaines utili-
sition :Aujourd'hui il y a du soleil, leur système sations de la logique à trois valeurs en mécanique
ne déduise pas comme tout le monde : quantique n'ont jamais réussi, pour les mêmes
Aujourd'hui il ne pleutpas. Ils considèrent que la raisons, à faire l'unanimité. C'est une bien piètre
base de règles doit être écrite autrement. C'est à consolation que de savoir que, lorsque de «Si A
l'utilisateur de s'adapter pour que le chaînage alors B et non Bn le chaînage avant ne déduit pas
avant fasse ce au'il faut! non A, cette absence de conclusion est bien
N'y a-t-il pas une façon d'éviter cette concep- conforme à une certaine logique étrange! Ne
tion u n peu n a v r a n t e d'un monde où c'est . .
serait-il Das d u s satisfaisant de dire : avant de
l'homme qui se soumet aux calculs des machines, faire le chaînage avant, ajoutons la règle «S'i non
plutôt que l'inverse? N'y a-t-il pas, en cherchant B alors non A»? Telle est l'idée de la troisième
bien, un sens logique à ce que donne le chaînage méthode.
avant, et qui soit tel qu'on puisse dire que le chaî-
nage avant est correct et complet vis-à-vis de ce La compilation logique
sens logique?
Dans celle-ci, on garde donc le chaînage et la
Le vrai, le faux et ... logique usuelle, mais on essaie d'ajouter ou de
changer les règles pour que les déductions du
La réponse est oui, et elle a été obtenue en uti- chaînage avant n'oublient rien. Ph. Mathieu a
lisant la logique à trois valeurs. Cette logique étudié cette idée dans le détail. Il a appelé compi-
considère qu'une proposition peut non seulement lation logique les méthodes qu'il a développées et
C H ~ N A G EAVANT ET D É D ~ C T I O N LOGIQUES
S 53
dont il a démontré qu'elles étaient satisfaisantes. Dans la seconde phase, on applique le prin-
Pour cela il a utilisé un résultat que C.T. Lee, de cipe de résolution de Robinson. Ce principe
l'université de Berkeley, avait établi en 1967 indique que de deux règles comme «A ou B., mon
dans sa thèse sur les transformations de for- A ou Cou non D»(l'une doit comporterxet l'autre
mules, e t qui avait été oublié jusqu'à ce que non X ) , on peut déduire (iB ou C ou non D »(on
R. Demolombe, du Centre d'Etude e t de réunit les deux règles en enlevant le «X»et le mon
Recherche de Toulouse, l'exhume récemment à XD). Le principe de Robinson est appliqué jusqu'à
l'occasion de ses travaux sur les bases de données. ce qu'il ne donne plus de règles nouvelles. Comme
L'expression compilation logique a été utilisée cette phase peut faire croître énormément le
parce que, de la même facon qu'un compilateur de nombre de règles, des méthodes fondées sur
langages transforme un programme source !en d'autres principes que la résolution de Robinson
Pascal, e n Basic, ont été étudiées par
etc.) e n u n code Ph. Mathieu. Nous
rapidement exécu- verrons plus loin
table, la compila- qu'il y a une raison
tion logique trans- théorique très pro-
forme un ensemble fonde à cette phase
de règles en un au- F F F F d'accroissement.
tre ensemble de rè- Dans l a troi-
gles s u r lequel le sième phase, cer-
chaînage avant Si A alors B taines règles inu-
peut travailler très tiles sont enlevées.
rapidement e t de Cette hase de sim-
manière complète. plification com-
Parmi les différents pense le plus sou-
systèmes de compi- vent les effets de la
lation logique pro- seconde phase et
posés par Ph. Ma- ramène à un nom-
thieu, le plus simple bre de règles proche
H
utilise le principe de du nombre initial.
A non A Dans l a qua-
la résolution de
Robinson découvert trième phase, les
en 1965, et qui sert règles sont réécrites
par ailleurs de fon- en utilisant la mé-
dement au langage thode des variantes :
de programmation par exemple, «A ou
Prolog. B ou non C» donne
La compilation les trois règles
logique par résolu- variantes «Si non A
tion procède e n et non B alors non
q u a t r e phases. C n , .Si C et non B
Dans l a pre- LA LAMPE EST ALLUMÉE : INCONNU alorsA»,«SinonA et
mière phase, on C alors B». Cette
change simple- troisième phase fait
La logique trivaluée considère qu'un énoncé peut êtreVRAI,FAUX à nouveau croître le
ment les notations 4. ou INCONNU. Le et se définit très naturellement:VRAIet VRAI donne
en faisant dispa- VRAI ; VRAI et INCONNU donne WCOhW ;FAUX et INCONNU donne nombre de formules,
r a î t r e le symbole F A ï i i , etc. Le implique peut se définir de plusieurs façons diffé- mais modérément.
d'implication. On rentes, mais pour obtenir la complétude du chaînage avant, il faut
le définir par: SiA alorsB est toujoursVRA1,sauf siA estVRAI et que
L a base de rè-
réécrit par exemple B n'est pas VRAI, auquel cas siA alorsB est FAUX. Ce implique parti- gles finale peut ne
la règle «Si A et B culier,qui permet d'obtenir la complétude du chaînage avant, a été plus comporter cer-
proposé en 1987. Bien que donnant effectivement satisfaction du
alors C» en «non A point de vue théorique, la logique trivaluée possède certaines pro- t a i n e s des règles
OU non B ou CD,ce priétés gênantes et antinaturelles. Par exemple A ou non A n'est initiales. C'est le
qui n'utilise que pas toujours VRAI. On considère en général que les logiques cas lorsque la com-
modales, temporelles ou même intuitionnistes sont mieux adap-
des principes logi- tées pour traiter des situations où certaines connaissances sont pilation simplifie
ques connus. évolutives. les bases de règles
54 LOGIQUE, INFORMATIQUE ET PARADOXES
(ce qui se produit quand des règles sont redon- Beaucoup, et on les connaît depuis longtemps.
dantes). Si, pour des soucis de lisibilité de la C'est la quatrième méthode pour traiter l'incom-
base de règles, on tient absolument à ce que les plétude du chaînage avant. Nous allons décrire
règles initiales soient toujours présentes, on les l'un de ces algorithmes de remplacement et expli-
garde. quer pourquoi on n'a guère envie de l'utiliser.
Les résultats démontrés par Ph. Mathieu éta- Pour cela, nous avons besoin d'un petit
blissent que le chaînage avant appliqué à la base résultat logique dont vous vous convaincrez
de règles compilée est complet : toute proposition aisément de la vérité : le fait élémentaire «aime
élémentaire qui résulte, par les moyens généraux les mathématiques), résulte des règles et des
de la logique usuelle, d'une base de règles et d'une connaissances de base sur Armand, si, et seule-
base de faits, sera trouvée par le chaînage avant ment si, l a formule du calcul propositionnel
appliqué à la base compilée et à la base de faits obtenue en regroupant toutes les règles, toutes
(qui ne change pas). les connaissances sur Armand, et le fait élémen-
Dans l'exemple à quatre règles que nous taire mon aime les mathématiques)), est contra-
avons envisagé tout à l'heure, la compilation dictoire. Comme, pour savoir si une formule est
logique donne cinq nouvelles règles : contradictoire, il suffit d'écrire s a table de
(5) Si non musicien alors non lunettes, vérité, et que tout ce travail peut être confié à un
(6) Sigrand alors musicien, programme, nous avons un algorithme qui peut
(7) Si non musicien alors non grand, remplacer le chaînage a v a n t e t dont nous
(8) Si non aime les mathématiques alors non sommes certains cette fois qu'il est entièrement
musicien, satisfaisant : pour chaque fait élémentaire
(9)Si non brun alors lunettes. auquel on s'intéresse, on teste (par table de
La compilation logique indique aussi que la vérité) si ajouter sa négation à la base de règles
règle (2) est devenue inutile, ce qu'on voit directe- donne un ensemble contradictoire.
ment, car si «Sigrand alors musicien)),il est cer-
tain que «Si grand et brun alors musicien)>.On Calculer des milliards d'années?
remarque aussi que l'inférence que le chaînage
avant oubliait concernant Bernard peut mainte- Malheureusement il y a un hic, qui naît, non
nant être faite (en une seule étape) grâce à la pas de l a difficulté des calculs, mais de leur
règle (6). nombre. Lorsqu'on fait une table de vérité pour
une formule comportant n propositions élémen-
taires, cette table comporte 2n lignes. Pour n égal
Le MOUDdans les conclusions à 20, cela fait déjà plus d'un million de lignes.
Un des avantages de la méthode de Ph. Ma- Pour des ensembles de règles utilisant 200 propo-
thieu (outre qu'elle concilie logique classique et sitions de base, ce qui n'est pas rare en matière de
chaînage avant) est qu'elle résout aussi le pro- systèmes experts, on obtient une table de vérité
blème des ou dans la partie conclusion des règles qu'aucune machine, même si elle travaillait plu-
(à droite), qu'on ne peut pas s'autoriser à écrire sieurs milliards d'années et occupait tout le sys-
directement quand on utilise directement le chaî- tème solaire, ne pourrait jamais calculer (on n'est
nage avant. En effet la première phase de la com- jamais assez fort pour ce calcul).On dit que l'algo-
pilation logique peut être appliquée même s'il y a rithme que nous avons proposé pour remplacer le
des ou en conclusion de règles. En fait, moyen- chaînage avant est exponentiel en fonction de la
nant une généralisation facile de la première taille des données. Nous avons déjà indiqué que le
phase, la compilation logique peut transformer chaînage avant calcule toujours en temps polyno-
n'importe quel ensemble de formules du calcul mial en fonction de la taille des données.
propositionnel en un ensemble de règles pour Très bien, mais peut-être y a-t-il des algo-
lequel le chaînage avant est complet. rithmes complets (ce que n'est pas le chaînage
Les méthodes de Ph. Mathieu présentent avant) qui ne soient pas exponentiels comme
l'inconvénient de faire parfois croître la taille des celui utilisant les tables de vérité? La réponse est :
bases de règles, c'est pourquoi on peut souhaiter nul n'en connaît, et l'on a de bonnes raisons de
traiter l'incomplétude du chaînage avant en le croire qu'il n'en existe pas. En effet, le problème
remplaçant par un algorithme qui déduise lui- du calcul des conséquences élémentaires d'un
même tout ce qu'il faut, sans qu'on ait à transfor- ensemble de règles est équivalent au problème de
mer la base de règles. Existe-t-il de tels algo- la satisfiabilité d'une expression booléenne, et ce
rithmes? problème a été démontré NP-complet par Cook en
C H ~ N A G EAVAIL'T ET DÉDVCTIONSLOGIQUES 55
1971. Donnons quelques explications. Le signe P l'on réussit à trouver un algorithme polynomial
désigne la classe des problèmes qui peuvent être pour l'un d'eux alors P = NP, et si l'on réussit à
résolus en temps polynomial en fonction de la démontrer pour l'un d'eux qu'il ne peut pas être
taille des données. Le problème de divisibilité traité en temps polynomial alors P + N P : toute la
d'un entier par un autre, par exemple, est de type difficulté de l a conjecture P + N P se trouve
P. Le sigle N P désigne la classe des problèmes, concentrée sur chacun d'eux. Il semble très peu
qu'on ne peut généralement pas résoudre en un probable que P = NP ; aussi à chaque fois qu'on
temps polynomial, mais dont on peut vérifier la prouve qu'un problème est NP-complet, on consi-
solution e n temps polynomial lorsqu'on l a dère que cela signifie qu'il n'existe pas d'algo-
connaît. Bien que de très nombreux efforts aient rithme polynomial pour le résoudre.
été faits, personne n'a réussi à prouver Aussi est-il très vraisemblable qu'aucun algo-
aujourd'hui que P # NP. En revanche, on a trouvé rithme complet pouvant remplacer le chaînage
des problèmes, qu'on appelle NP-complets, qui avant n'est polynomial. On a donc le choix entre
sont représentatifs de tous les problèmes NP : si des algorithmes sujets à l'incomplétude comme le
BASE DE FAITS
Si A alors B
Si B alors non C
Si A et D alors non C
Si B et E alors D
Si non C alors D
ALGORITHME
DE COMPILATION LOGIQUE
PARFOIS LONG
1
Si A alors B
Si B alors non C
Si non C alors D
5 . Transformer la base de règles permet de remédier à vant : un énoncé élémentaire (de la formeXou nonX) est
l'incomplétude du chaînage avant. C'est l'idée de la corn- conséquencede la base de règles et de la base de faits, si et
pilation logique. Les résultats obtenus sur la compilation seulement si le chaînage avant, appliqué à la base de
logique montrent qu'elle est satisfaisantedans le sens sui- règles compilée et à la base de faits (inchangée),le trouve.
56 LOGIQUE, INFORMATIQUE ET PARADOXES
SIA alors B et
A 6 C non C Si A alors B Si B alors C Si 6 alors C et
A et non C
V V V F V V F
V V F V V F F 1
V F V F F V F
V I F I F ] v F v F
F V F V V F F
F F V F V V F
F F F V V V F
6. Pour savoir si de A i B et B + C etA on peut déduire C, non C) est vrai, ce qui signifie que cette formule est contra-
une méthode classique et mécanique consiste à écrire la dictoire, et donc que C est conséquence logique deA + B,
table de vérité de la formule : (A iB etB + C etA et non C). B i C et A. En envisageant successivement tous les faits
Il y a huit cas à envisager, carA peut prendre les valeurs V élémentaires, cette méthode donne un algorithme pour
ou F, de même queB et C (2 x 2 x 2 = 8). Pour chaque cas, on calculer l'ensemble des conséquences élémentaires d'une
calcule la valeur de vérité de non C, deA +B (quin'est faux base de règles, et cet algorithme, contrairement au chaî-
que lorsqueA est vrai et que B est faux), de B + Cet de la nage avant, est complet. Malheureusement, pour une for-
conjonction des quatre formulesA, non C,A +B, B +C, qui mule ayant n propositions atomiques, chaque table com-
est vraie lorsque chaque formule est vraie. On constate porte 2" lignes, ce qui est rédhibitoire pour des valeurs de
qu'il n'existe aucun cas pour lequel 01 +B et B + C etA et n supérieures à 40.
O
ublier est chose facile pour l'ordinateur ; Voici d'abord la solution utilisant une pièce
pour nous, c'est parfois impossible. Un de monnaie qu'on lance plusieurs fois. Pour com-
programme peut faire un calcul, en mettre mencer, vous lancez quatre fois de suite la pièce
le résultat dans une mémoire M, puis oublier ce (non truquée bien s û r ! ) et vous calculez le
calcul par la seule utilisation de l'instruction nombre entre O et 15, dont l'écriture binaire est
d'affectation «M := 0)).Vous, vous ne pouvez pas donnée par les quatre résultats des lancés, en
faire l'équivalent de ce «M := O». Essayez, par interprétant face comme O et pile comme 1. Si le
exemple, d'oublier votre date de naissance! Une nombre obtenu est O ou dépasse 11,vous ne tenez
prescription amusante d'un médecin psychana- pas compte du résultat et s70usrecommencez,
lyste intimait au malade de faire trois fois le tour autant de fois que nécessaire. Exemple : les
de son pâté de maison sans penser au mot (&lé- quatre premiers lancés donnent PPFP, c'est-à-
phant».
A l'inverse, déterminer un nombre au hasard
est une chose que nous pouvons faire facilement,
soit à l'aide des objets physiques qui nous entou-
rent, soit mentalement, comme nous le verrons
plus loin. Pour les ordinateurs, ce n'est pas si
simple et, pour la plupart d'entre eux, cela est
même totalement impossible.
Peut-on tirer des conclusions philosophiques
de ces aptitudes opposées des cerveaux humains
et des ordinateurs face au hasard et à l'oubli? Je
pense que ce serait hasardeux et j'oublierai de le
faire dans ce chapitre. Ce que je souhaite ici, c'est ON OBTIENT, PAR EXEMPLE. PPFP
illustrer, par une série de problèmes, que ces apti-
tudes peuvent, chez l'un comme chez l'autre, être
e
EN ASSOCIANT 1 À PILE ET O À FACE,
obtenues au moins partiellement à l'aide d'algo- ON CALCULE LE NOMBRE ENTRE O ET 15
rithmes spéciaux. DONT L'ÉCRITURE BINAIRE CORRESPOND
AUX 4 LANCÉS
Le premier problème porte sur le tirage au
PPFP- 1101- 13
sort équitable. Sous sa forme générale, c'est le
suivant : vous voulez choisir un nombre entier au
hasard, équitablement, entre 1et n. ~Equitable-
Q
SI LE NOMBRE OBTENU EST O OU PLUS
ment» signifie que vous voulez que la probabilité GRAND QUE 11, ON RECOMMENCE
UNE SÉRIE DE LANCÉS, SINON ON RETIENT
de choisir chacun des nombres soit la même, c'est- LE NOMBRE TROUVÉ.
à-dire lln. Comment vous y prendre? Nous traite-
rons le cas n = 11,les généralisations étant évi- 1. Choix aléatoire équitable, avec une pièce de monnaie,
dentes. d'un nombre entre 1 et 11.
58 LOGIQUE, INFORMATIQCE ET PARADOXES
dire [110112 = 13. Il faut recommencer. Les qu'une pièce de monnaie et garantissant que le
quatre lancés suivants donnent PFFP, c'est-à- choix sera fait équitablement en un temps fini
dire [100112 = 9. Donc, 9 est choisi. déterminé à l'avance.
Cette méthode est correcte, car elle aboutit, La méthode décrite s'adapte bien sûr si, au
en un temps fini (non connu à l'avance), à un lieu de disposer d'une pièce de monnaie, vous
choix, et ce choix est équitable. Pour montrer que disposez d'un dé (il faut calculer en base 6 et non
ce choix est équitable, on remarque que la procé- plus en base 2). Avec un dé, une erreur à ne sur-
dure fait jouer un rôle symétrique à chacun des tout pas commettre, et que mentionne tout pro-
nombres de 1à 11, et donc chacun a exactement fesseur de mathématiques dans son premier
une chance sur 11d'être obtenu à l'issue de la pro- cours de probabilités, est de croire que, pour
cédure. choisir u n nombre au hasard équitablement
L'inconvénient de cette méthode est que, avec entre 2 et 12, il suffit de lancer le dé deux fois de
une probabilité de 5/16, vous devrez faire plus suite e t d'additionner les r é s u l t a t s . Cette
d'une série de quatre lancés (plus généralement, méthode donne 1/36 de chance d'avoir 2 ou 12,
avec une probabilité de (5116)'" vous devrez procé- 2/36 d'avoir 3 ou 11(car 3 peut provenir de 1 + 2
der à plus de m séries de quatre lancés). Eviter cet ou de 2 + 1, et 11de 5 + 6 ou de 6 + 5), 3/36 d'avoir
inconvénient n'est pas si facile que cela et, par 4 ou 10, 4/36 d'avoir 5 ou 9, 5136 d'avoir 6 ou 8,
exemple, décider que le nombre O fera choisir 1, 6/36 d'avoir 7.
que 12 fera choisir 2, que 13 fera choisir 3, que 14 Si vous n'avez à votre disposition ni pièce de
fera choisir 4 et que 15 fera choisir 5 est une mau- monnaie ni dé, vous pouvez ouvrir un gros livre
vaise idée, car on ne préserve pas l'équité du tirage : au hasard et regarder le chiffre des dizaines du
1, 2, 3, 4 et 5 ont chacun une probabilité de 2/16 numéro de page (attention : le chiffre des unités
d'être choisis, alors que les autres nombres 6,7,8, ne convient pas, car il est toujours pair à gauche
..., I l n'ont qu'une chance sur 16 d'être retenus. et impair à droite). Les calculs se font alors en
Le nombre (5116)"' diminue très vite quand base 10, ce qui est assez pratique.
nz augmente et donc, concrètement, vous ne
ferez j a m a i s de t i r a g e s prolongés avec l a
Tirages au sort mentaux
méthode que je propose. Sauf pour des valeurs et tirages au sort pondérés
particulières de n (comme 2. 4, 8, ..., 2 p ) , je ne
crois pas qu'il existe des protocoles n'utilisant La méthode de la pièce de monnaie suggère
une idée pour le t,irage au sort mental (qui vous
sera bien utile si, un jour, vous êtes prisonnier,
les mains attachées dans le dos et que vous vou-
O lez choisir au hasard, équitablement, entre les
ON TIRE NCOUPLES (X, Y) DE NOMBRES sept méthodes d'évasion que vous avez imagi-
ENTRE O ET 1, PAR EXEMPLE EN
CHOISISSANT ÉQUITABLEMENT 2 N FOIS nées). Penser à u n mot moyennement long,
UN NOMBRE ENTRE 1 ET 100 000, ET EN chaussure p a r exemple, comptez alors son
LE DIVISANT PAR 100 000 nombre de lettres : si ce nombre est pair, vous
avez obtenu u n O ; s'il est impair, vous avez
obtenu un 1. Vous recommencez comme avec la
ON COMPTE LE NOMBRE M DE COUPLES pièce de monnaie de tout à l'heure. A moins que
TELS QUE x2 +y2 c 1. LE QUOTIENT MIN vous n'ayez la faculté de voir immédiatement le
EST UNE APPROXIMATION DE d4,CAR IL
EST À PEU PRÈS ÉGAL AU QUOTIENT DE
nombre de lettres d'un mot. et à la condition de
L'AIRE DU QUART DU DISQUE DE RAYON 1 ne pas tricher avec vous-mêmes, cette procédure
PAR L' AIRE DU CARRE DE CÔTÉ 1. mentale permet le tirage équitable d'un nombre
entre 1et n.
Comment vous y prendre maintenant si vous
voulez faire un tirage pondéré à la place d'un
tirage équitable, comme par exemple choisir avec
des probabilités proportionnelles à leur âge entre
les deux charmantes personnes susceptibles
d'aller au cinéma ce soir avec vous. Rien de plus
simple : à la première, qui a 24 ans, vous associez
2. Calcul de TC par une méthode de tirage au sort de type les nombres 1,2, ...,24 ; à la seconde, qui a 27 ans,
Monte-Carlo. vous associez les 27 nombres suivants : 25,26. . . . ,
VOTE INCONSCIENT 59
51. Vous choisissez ensuite équitablement un toire fourni est différent, mais parfaitement
nombre a u hasard entre 1 et 51, par une des déterminé. La semence peut bien sûr être chan-
méthodes expliquées plus haut. Si le nombre gée, ou même demandée à l'utilisateur du pro-
choisi est un des nombres associés à la première gramme quand c'est nécessaire. Ce qu'il faut
personne, c'est elle que vous inviterez ; sinon, savoir, c'est qu'à chaque fois que vous faites appel
c'est l'autre. Bien sûr, il est nécessaire que vous à la fonction random, le nombre obtenu dépend
vous entraîniez à l'avance si vous voulez éviter de la semence et du nombre d'appels précédents.
d'avoir l'air hésitant au moment du choix en utili- Cette méthode est pratique, car si vous exécu-
sant la méthode mentale! tez votre programme plusieurs fois, vous
Venons-en maintenant aux ordinateurs. Les obtiendrez la même suite exactement de nombres
langages de programmation offrent presque tou- ((aléatoires».Mais cette méthode possède aussi
jours une instruction qui est censée produire un plusieurs inconvénients. Le premier est que vous
nombre aléatoire à chaque fois que vous l'appe- ne pouvez pas faire un vrai tirage au sort, puisque
lez. Cette fonction se nomme le plus souvent ran- les résultats obtenus dépendent de la semence de
d o m (parfois elle se note rnd). Pour simplifier, façon parfaitement déterministe. Même si vous
nous ne considérerons que des fonctions ren- ne connaissez pas la fonction utilisée pour calcu-
voyant un O ou un 1.Ce que nous avons expliqué ler les nombres «aléatoires),,cette fonction est
plus haut a d'ailleurs montré qu'avec une telle fixée une fois pour toutes, et il n'y a donc en réa-
fonction, on peut toujours se débrouiller. La
difficulté pour ceux qui conçoivent les langages
de programmation et cherchent à programmer
une telle fonction random provient de ce que,
dans un ordinateur, rien ne marche au hasard.
Tout est parfaitement déterministe lorsque
l'ordinateur fonctionne bien et donc, sans contact
avec l'extérieur, l'ordinateur ne peut pas produire PLIER LES BULLETINS DE VOTE
de nombres aléatoires : c'est pour cela que les ET LES M E T R E DANS UN CHAPEAU
méthodes utilisées créent souvent des difficultés
aux programmeurs.
Voici quelques-unes des idées qui sont utili-
sées. On peut lier l'ordinateur à un système phy-
sique (classique ou quantique) qui fasse des
tirages au sort, mais cette méthode est rarement
retenue, car trop lente. La lecture d'une table où
sont stockés des nombres aléatoires est parfois
choisie. Elle présente bien sûr l'inconvénient de
TIRER UN BULLETIN SANS LE DÉPLIER
coûter cher en mémoire. Son utilisation est donc
réservée aux situations où l'on veut avoir une
garantie très forte sur l'aspect aléatoire des
digits utilisés, ce qui est le cas en cryptographie,
mais pas en calcul numérique, où les méthodes,
dites de Monte-Carlo, utilisent des tirages au
sort uniquement pour répartir à peu près unifor-
mément des points dans un espace (voir La
figure 2).
Certaines méthodes utilisent l'horloge VOTER AVEC LE BULLETIN RETENU
interne, mais le plus souvent, aujourd'hui, la
méthode retenue pour la conception des langages
informatiques consiste à programmer les fonc-
tions random avec leemence,).Au lieu d'écrire
liR := random. pour obtenir un nombre aléatoire,
vous écrivez : *R := random (13425)»,et le résul-
tat que vous obtenez est calculé à partir de la
semence : 13425. La deuxième fois que vous faites
appel à «R := random(13425b, le nombre aléa- 3. Le vote inconscient équitable.
60 LOGIQUE, INFORMATIQrE ET PARADOXES
lité aucun tirage au sort. Le deuxième inconvé- Les avantages du vote au hasard
nient est que les fonctions utilisées pour engen-
drer du hasard ne sont jamais des fonctions don- L'un de mes amis, fatigué de voter de la
nant des suites aléatoires au sens mathématique manière habituelle, m'avait expliqué son point de
du terme, pour la simple raison que les suites vue : ((Je souhaite soutenir le régime démocra-
aléatoires a u sens mathématique du terme - tique dans lequel nous vivons, donc je veux voter.
qu'on appelle suites aléatoires de Martin-Lof, car En revanche, je n'ai pas vraiment d'opinions arrê-
introduites par le mathématicien suédois P. Mar- tées sur les différents partis et candidats entre
tin-Lof en 1965 (~>oir le chapitre 4) - ne peuvent lesquels je dois choisir, sauf à propos de certains
pas être engendrées par des algorithmes détermi- que j'élimine, car ils défendent des idées opposées
nistes, et donc ne peuvent pas être produites à à la démocratie. Je souhaite donc voter au hasard,
l'intérieur d'un ordinateur usuel. pour l'un des candidats démocrates. Toutefois, je
En particulier, l'idée d'utiliser les digits du préférerais ne pas savoir pour qui je vote..
développement infini de K en base 2 est une très Il s'agit d'un problème d'oubli. Mon ami sou-
mauvaise idée : même si on n'a pas trouvé de pro- haite voter au hasard pour un candidat démo-
priétés statistiques singularisant n par rapport à crate, mais ne veut pas savoir pour qui. J e lui ai
une suite obtenue par une authentique série de répondu : .Avant chaque élection, l a mairie
lancés de pièce de monnaie, le seul fait que la t'envoi? les bulletins de vote des différents candi-
suite des digits de K soit calculable par ordinateur dats. Elimine ceux qui te déplaisent, plie les
exclut cette suite de digits de l'ensemble des autres, mets-les dans un chapeau, mélange, choi-
suites aléatoires au sens de P. Martin-Lof. Il se sis au hasard l'un des bulletins pliés, mets-le
trouve qu'aujourd'hui on ne sait pratiquement dans ta poche, déchire ou brûle les autres et va
rien démontrer concernant la suite de digits de K voter avec le bulletin qui est dans ta poche sans le
et qu'en particulier on n'a même pas réussi à éta- regarder* (voir la figure 3).
blir mathématiquement que la proportion de O Mon ami semblait très satisfait. En effet, le
est la même que la proportion de 1,ce qui semble protocole de vote proposé assure à la fois l'équité
pourtant bien le cas quand on étudie les trois mil- entre les candidats retenus et l'impossibilité pour
liards de digits dont on dispose aujourd'hui. lui de savoir pour qui il vote, ce qu'il désirait. Un
Les algorithmes utilisés en pratique pour tel protocole de vote «inconscient équitable* est
programmer les fonctions random sont plus ou amusant, car il permet de voter contre quelques-
moins mauvais, et les recherches se poursuivent uns e t non plus seulement pour quelqu'un,
pour générer des suites pseudo-aléatoires satis- comme avec la méthode habituelle. En effet, sta-
faisantes pour la majorité des besoins pratiques. tistiquement, en procédant selon la méthode
Des tests statistiques sont utilisés pour éliminer décrite, on vote à parts égales - les probabilistes
les fonctions vraiment trop mauvaises, mais, en diraient «avec une espérance mathématique
général, il faut rester méfiant, car beaucoup de égale* - pour tous les candidats non éliminés, ce
mauvaises fonctions sont encore utilisées :je me qui n'est p a s le cas lorsqu'on s'abstient ou
souviens d'un BASIC dont la fonction random lorsqu'on vote blanc ou nul. En un certain sens
était tellement mauvaise qu'un programme qui donc, ce mode de vote élargit l'éventail des choix
aurait dû afficher une répartition uniforme de qu'offre une élection. S'il était plus connu, il y
points sur l'écran donnait en fait un réseau de aurait peut-être un peu moins d'abstentions.
bandes obliques!
Tous les tests statistiques utilisés pour sélec- Le problème
tionner les bonnes fonctions random ne peuvent du vote inconscient pondéré
rien contre le fait que, par définition du hasard
mathématique absolu, il est impossible à un ordi- Malheureusement, mon ami est exigeant et,
nateur sans mécanisme physique particulier d'en après avoir utilisé le protocole de vote inconscient
produire. L'esprit humain, dont nous avons vu équitable aux dernières élections, il m'a expliqué
plus haut qu'il peut (lentement) en produire, que ce que je lui avais indiqué ne lui convenait
semble donc en cela supérieur à un ordinateur. pas vraiment.
Cependant, comme nous allons le voir à propos «Imagine, me dit-il, que beaucoup de gens
d'un problème de vote, la possibilité d'oubli volon- fassent comme moi ; imagine même que tout le
taire, qui, elle, ne présente aucune difficulté à monde fasse comme moi. Que va-t-il se passer?
une machine, fait parfois cruellement défaut à Les candidats les plus farfelus auront à peu près
l'esprit humain. autant de voix que les autres. J e ne le souhaite
I'OTE INCONSCIENT 61
JE PRÉPARE8 PAPIERS
(4 + 3 + l ) , DONT UN
MARQUE D'UNE ETOILE
ET 4 PAPIERS
SUPPLEMENTAIRES
JE COMPLÈTE
LES ENVELOPPES
AVEC LES 4 PAPIERS
QUI RESTENT
ET QUE J'AI PLIÉS.
CHAQUE ENVELOPPE
CONTIENT UN BULLETIN
ET 4 PAPIERS PLIÉS
JE METS
LES 3 ENVELOPPES
DANS LE CHAPEAU,
JE MELANGE
JE DÉPLIE
LES PAPIERS
MAIS PAS
4. Vote inconscient pondéré LES BULLETINS
avec un seul bulletin par
candidat :laprocédure avec
papiers, enveloppes et cha- JE VOTE AVEC
peau. On veut choisir l'un LE BULLETIN QUI EST
des trois candidatsz Y ouZ
au hasard, avec une pondé- DANS LA MÊME
ration de 4 , 3 , 1 . On ne veut ENVELOPPE QUE
pas connaître le choix fait ; LE PAPIER PORTANT
on ne dispose que d'un bul- UNE ÉTOILE
letin par candidat.
62 LOGIQUE, INFOR-MATIQrE ET PARADOXES
JE PRENDS 2 ÉPINGLES
DONT LA TETE EST AIMANTEE -.
ET TROIS AUTRES
DONT LA TETE EST AIMANTEE +
JE MELANGE ET JE CHOISIS
UNE ÉPINGLE AU HASARD
fait - e t t u vas voter avec ce bulletin, sans le vote élargissent encore l'éventail des possibilités
déplier.. offertes par une élection, et il semblerait donc que
maintenant les abstentionnistes n'aient plus
d'excuse!
L'impossibilité de l'oubli
J e pensais lui avoir fourni une méthode qui Deux petits problèmes
éviterait qu'il aille grossir les rangs des absten-
tionnistes. Mon protocole devait lui permettre de Voici deux problèmes liés.
voter sans savoir pour qui, avec pondération et en Problème 1. Trouver une procédure permettant
ne disposant que d'un bulletin par candidat. Mal- de faire un choix aléatoire entre deux éventuali-
heureusement mon ami n'a pas été satisfait, et il tés A et B, avec des probabilités respectives pour
est revenu me voir en me disant : «Je n'arrive pas A et pour B proportionnelles aux nombres irra-
à ne pas suivre les bulletins quand le programme tionnels n et e. Remarque : on ne veut pas que les
me donne ses instructions de permutation, et probabilités soient approximativement propor-
donc je sais pour qui il me demande de voter. Ta tionnelles à n et e , mais qu'elles soient exacte-
procédure ne marche pas!. ment proportionnelles à n et e, et bien sûr la pro-
Un robot programmable qui effectuerait, cédure doit se terminer.
sans qu'on le regarde, un choix aléatoire pondéré Problème 2. Trouver une procédure de vote per-
serait une solution, mais aujourd'hui on n'en mettant, avec un seul bulletin par candidat, de
trouve pas si facilement, et donc je lui ai suggéré choisir inconsciemment entre deux candidats A
de faire faire l'opération de mélange par une et B avec des probabilités proportionnelles aux
autre personne qui ne connaîtrait pas l'ordre de deux nombres irrationnels n et e.
départ des bulletins et qui, à la fin du mélange. Les solutions de ces problèmes sont :
lui donnerait le bulletin avec lequel voter. Il m'a
répondu que la personne en question pourrait
très bien suivre des yeux les bulletins et donc qu'à
eux deux, il leur serait tout à fait possible de Procédure de vote inconscient
déduire pour qui il vote. .Certes, en utilisant une avec pondérations irrationnelles
tierce personne, me dit-il, il m'est impossible à et un seul bulletin par candidat
moi seul de savoir pour qui je vote, et il est impos- On veut voter sans savoir pour qui, après avoir fait
sible à l'autre personne seule de le savoir aussi, un choix aléatoire entre les deux candidats A et 13,les
mais les informations que nous pouvons posséder probabilités de choisir A et B étant respectivement
proportionnelles aux deux nombres K et e. On ne
chacun de notre côté suffisent à retrouver le can- dispose que d'un bulletin par candidat.
didat pour qui je vote et que je veux ignorer.))
L'imperfection était réelle. O
Faire un programme qui donne, une par une, les
Persuadé que ce problème du «vote incons- décimales successives de d ( e + TC) = 0,536119...
cient pondéré avec un seul bulletin par candidat>, 1
devait posséder une solution simple, j'en ai parlé Utiliser une procédure de vote inconscient pondéré,
autour de moi. J'ai bien fini, de mon côté, par trou- avec une pondération de 5 pour A, de 4 = 9 - 5 pour B
ver une solution n'utilisant, en plus des bulletins, et de 1 pour un candidat fictif C dont le bulletin est dis-
que des enveloppes, des petits papiers et un cha- cernable des deux autres.
peau pour effectuer des tirages a u sort, mais elle (5 est la première décimale de n/(e/+K)).
était assez compliquée et moins bonne que celle Si le bulletin déterminé par la procédure n'est pas le
bulletin de C,alors aller voter avec le bulletin choisi.
que m'a proposée Luc Dauchet, le fils d'un col- Sinon :
lègue (cette solution est décrite à la figure 4).
2
Une a u t r e solution utilisant des épingles Utiliser une procédure de vote inconscient pondéré,
aimantées a été imaginée par Philippe Boulanger -
avec une pondération de 3 pour A, de 6 = 9 3 pour B
luoir l a figure 5). Elle ne nécessite que des et de 1 pour un cand~datfictif C dont le bulletin est
épingles et u n aimant, mais ne permet que le discernable des deux autres.
choix pondéré entre deux candidats (une généra- (3 est la deuxième décimale de d ( e + n)).
lisation est possible pour ncandidats, que le lec- Si le bulletin déterminé par la procédure n'est pas le
teur pourra rechercher). A la place d'épingles bulletin C, alors aller voter avec le bulletin choisi.
Sinon :
aimantées, on pourrait utiliser des verres polari-
sés. Une autre solution n'utilise que de la corde et 3
etc.
de la ficelle (voir la figure 6). Ces protocoles de
Complexités
nisée moyenne (un plan n'est pas très compliqué1 ne nécessite aucun calcul. car il n'a aucune r é a - -
et une complexité aléatoire assez grande. larité, et l'on ne peut donc rien faire de mieux que
La complexité aléatoire est bien identifiée le copier, élément par élément, dans le pro:
depuis 1965, grâce aux travaux de Solomonoff,G. gramme chargé d'en donner la description. A
Chaitin et Kolmogorof : c'est ce qu'on appelle la l'inverse, un objet fortement organisé contient en
complexité de Chaitin-Kolmogorof, et elle est lui la trace d'un processus d'élaboration, de
définie, nous l'avons vu, par la taille du plus petit réflexion ou d'évolution qui correspond à une
programme (algorithme) pour un ordinateur de forme de calcul. Définir la complexité organisée
référence (appelé machine universelle) capable d'un obiet se ramène donc au ~roblèmede la défi-
de décrire complètement l'objet auquel on s'inté- nition de son contenu en calcul. En informatique
resse. Ce programme minimal associé à un objet théorique, les travaux sur les algorithmes pren-
va être important pour la suite. nent bien en compte les temps de calcul, mais ces
études s'attachent surtout aux comportements
asymptotiques des algorithmes, alors qu'ici nous
Contenu en calcul
n'avons affaire qu'à des objets finis ou qu'on
Restait donc à identifier la complexité organi- ramène à des objets finis en fixant un niveau de
sée. L'idée de C. Bennett est de rattacher la com- précision.
~ l e x i t éorganisée au temm de calcul au'il faut Pour définir le contenu en calcul d'un objet
Our produire une description. Un objet aléatoire (c'est-à-dire sa complexité organisée), C. Bennett
10 GOTO 140
20 IF AUTO > 528 THEN 189
30 DRAW LlNE 4,9 TO 8.8
40 IF ClRLE SQUARE THEN END
50 FOR 1 + 1 T 0 76
601=1+1
70 0 0 F FROM 23 T 0 32
80 IF PALINDROME GOTO CHAITN
90 IF FRACT
130DOlT06
140 ON ERROR FORGET T
156 GO T 0 144
10 GOTO 140
20 IF AUTO > 528THEN 189
30 DRAW LlNE 4.9 TO 8 8
40 IF ClRLE SQUARE THEN EhD
50FORl + 1 T 0 7 6
601=l+l
70 DO F FROM 23 T 0 32
80 IF PALINDROME GOTO CHATIY
90 IF FRACT
130DOlTO6
140 ON ERROR FORGET T
l 5 6 G O T 0 144
END
GOTO 140
IF AUTO r 528 THEN 189
DRAW LlNE4,9TO 8 8
001T06
ON ERROR FORGET IT
EN0
TEMPS DE CALCUL
PROGRAMME DU PROGRAMME
MINIMAL MINIMAL
bien connue des programmeurs : ils savent tous tionne rapidement, en fait aussi vite que le pro-
que le programme le plus rapide pour obtenir les gramme «imprimer ". ..")>.
20 premières décimales de n est le programme Comme deuxième exemple, prenons un litre
<<imprimer "3,14159 26535 89793 23846"~. de gaz. C'est un objet qui possède une très grande
complexité aléatoire. Les molécules du gaz sont
réparties a u hasard : on ne peut rien faire de
Le temps de calcul
mieux pour décrire le litre de gaz qu'utiliser un
du plus court programme programme du type .imprimer y..."». La com-
La définition naturelle du temps minimal de plexité organisée est très faible. A nouveau, les
calcul d'un objet n'a donc pas de sens et ne mesure définitions mathématiaues s'accordent avec nos
rien du tout. C'est cet obstacle que C. Bennett a attentes, car la complexité de Chaitin-Kolmogo-
surmonté en faisant référence a u programme rof de l'objet est grande (le programme minimal,
minimal en taille associé à un objet. Sa définition, qui est «imprimer "...">),est long) et sa profondeur
qu'il ne faut pas confondre avec celle proposée logique est faible (le programme minimal n'a pas
juste au-dessus, est, répétons-le, que le contenu de calculs à faire).
en calcul d'un objet, ou profondeur logique, est <<le Pour l'instant, nous n'avons rencontré que
temps de calcul du programme minimal». Cer- des objets de petite profondeur logique. Ce n'est
68 LOGIQUE, INFOR.VIATIQrE ET PARADOXES
pas le cas des 100 000 premières décimales de IT ; males den ont bien une faible complexité de Chai-
elles constituent un objet qui, bien qu'en appa- tin-Kolmogorof et une grande profondeur
rence peu organisé, l'est en fait énormément, logique. La complexité d'un objet fractal est en
puisque justement c'est IT! On sait écrire des pro- fait du même type. Ce n'est pas une complexité
grammes relativement courts, capables d'engen- aléatoire car - et c'est ce qui fait leur charme - la
drer ces 100 000 décimales (et donc, contraire- plupart des objets fractals peuvent être engen-
ment au cas où l'on s'intéresse uniquement à 20 drés par des programmes courts. En revanche, de
décimales de TC, ce n'est plus le programme longs calculs sont nécessaires pour les représen-
<<imprimer"..."» qui est le plus court). Ces pro- ter, comme n: : une fractale est un objet complexe,
grammes courts doivent calculer longtemps, et car profond.
donc la profondeur logique est grande. Conformé- Comme dernier exemple, considérons un dra-
ment à notre attente, les 100 000 premières déci- gon chinois ou n'importe quel être vivant. Sa com-
3. La présence de profondeur logique dans un objet non quelconque. Le message de la figure c, qui contient une
terrestre (par exemple, un signal astronomique venu faible complexité de Chaitin-Kolmogorofet une certaine
d'une étoile lointaine) serait la meilleure preuve de son profondeur logique, serait certainement interprété
origine vivante ou même intelligente. La présence comme preuve, ou au moins comme indice, d'une pré-
d'ordre simple (faible complexité de Chaitin-Kolmogorof sence intelligente. A la recherche du temps perdu com-
et faible profondeur logique), caractéristique du mes- porte (figure à) encore plus de profondeur logique, et si
sage de la figure a,pourrait être attribuée à un phéno- nous arrivions à identifier quelque chose de ce genre (ce
mène physique périodique : l'ordre simple n'atteste pas qui ne serait sans doute pas évident), nous ne douterions
la vie ou l'intelligence. Le désordre complet (forte com- pas une seconde d'être en présence d'intelligence (en
plexité de Chaitin-Kolmogorof, faible profondeur fait, s'il s'agissait vraiment de l'œuvre de Proust, nous en
logique) lui non plus ne peut être considéré comme un déduirions même qu'il s'agit d'une intelligence facé-
signe de vie ou d'intelligence. La suite de la figure b est tieuse!).
plexité aléatoire est grande, car, par exemple, la nett de tout objet (autrement dit, que la profon-
répartition des poils sur la peau du dragon ne suit deur est indécidable en général). Ce n'est peut-
pas un motif parfaitement régulier. Sa profon- être pas surprenant, car on comprend bien que,
deur logique elle aussi est grande, car on pourrait face à un objet profond (pensons aux décimales de
(en théorie) décrire le dragon en donnant son .x entre la 100 OOOe et la 200 OOOe),il soit difficile
génome (!) et en demandant au programme de de trancher entre les explications .c'est un objet
simuler le processus de développement, ce qui de grande complexité aléatoire* ou ((c'estun objet
prendrait beaucoup de temps. Le dragon est un de petite complexité aléatoire mais profond),,
objet complexe aussi bien en complexité aléatoire pour trancher, il faut avoir identifié en quoi la
qu'en complexité organisée. complexité est organisée. Ce qui est profond peut
Les développements mathématiques que C. avoir l'apparence de l'aléatoire. Le travail de la
Bennett a donnés à ses idées sont intéressants recherche scientifique est sans doute justement
sous plusieurs aspects. D'abord il a montré que, l'identification de la complexité organisée, là où
moyennant une bonne définition des ordinateurs apparemment ne se trouve que de la complexité
de référence, la définition qu'il propose ne dépend aléatoire.
pratiquement pas de l'ordinateur choisi : sa Les résultats de C. Bennett montrent aussi
notion est donc bien absolue. Le fait qu'elle se que l'apparition lente de la complexité organi-
réfère à des mécanismes universels de calcul sée ne contredit aucunement la seconde loi de la
n'est pas considéré comme gênant depuis qu'on a t h e r m o d y n a m i q u e q u i , elle, vise plutôt
identifié en physique de nombreux modèles uni- l'accroissement de la complexité aléatoire. Le
versels de calcul en mécanique classique (calcula- fait que la complexité organisée se développe
teurs à balles de billard, par exemple) ou quan- est simplement le signe que dans le monde phy-
tique, et même en chimie. sique se déroule un processus analogue à un
calcul, ce qui n'est absolument pas choquant :
les mouvements mécaniques, les interactions
Loi de croissance lente chimiques, les processus de sélection sont bien
Ensuite C. Bennett a montré que la notion de des sortes de calculs. L'augmentation de la com-
profondeur logique vérifie ce qu'il appelle une loi plexité organisée est compatible avec la ther-
de croissance lente : l'augmentation de la profon- modynamique, et cela se prouve s a n s avoir
deur ne peut être que très lente ; ou encore : il n'y recours à des pirouettes, comme c'est le cas
a qu'une très faible probabilité pour que, dans un quand on confond complexité aléatoire et com-
court processus dynamique, un objet profond plexité organisée.
apparaisse spontanément. Cela confirme bien Un autre problème est de savoir si les lois du
que, face à un objet profond, on doit considérer monde physique entraînent obligatoirement un
que son origine probable ne peut être qu'un long accroissement de la complexité organisée. Ce
calcul : un objet profond porte réellement en lui la n'est pas parce qu'une sorte de calcul se déroule
trace d'une longue évolution. dans le monde physique, qu'un autre calcul plus
Plus malheureuses sont les conséquences des rapide n'est pas possible ou que les résultats de ce
résultats d'indécidabilité de Gode1(toujours eux!) calcul ne peuvent pas être détruits (auquel cas,
qui, comme dans le cas de la complexité de Chai- bien sûr, aucune croissance de profondeur logique
tin-Kolmogorof,montrent que calculer avec certi- n'a lieu). Le fait que notre monde physique auto-
tude la profondeur logique d'un objet est une rise de longs calculs ne prouve donc pas que cette
tâche d'une extrême difficulté qui sera parfois augmentation soit inévitable. C. Bennett tra-
impraticable. G. Chaitin a montré, en utilisant le vaille sur ces questions, en particulier à l'aide de
paradoxe de Berry (qui évoque l'impossible «plus la théorie des réseaux d'automates cellulaires. Ce
petit nombre définissable en moins de 11mots))), qui est véritablement nouveau, c'est que mainte-
que la détermination effective de la complexité de nant que les bons concepts mathématiques sem-
Kolmogorof était indécidable en général. La défi- blent identifiés, la question de l'apparition de
nition de l a ~ r o f o n d e u rde C . Bennett., a u i complexité organisée possède un sens mathéma-
A
s'appuie sur la complexité de Kolmogorof, est tique qui, peut-être un jour, permettra de prouver
<contaminée»,et on montre qu'aucun algorithme que quelque chose comme la vie devait apparaître
général ne peut calculer la profondeur de C. Ben- sur Terre.
Thermodynamique
et informatique théorique
Une nouvelle définition de léntropie physique.
de la mesure en mécanique quantique, qui est rème de logique considéré comme négatif et donc
diffèrent et reste entier. sans aucun espoir d'application prend ici un sens
Il faut aussi que la compression sans efface- physique intéressant : le théorème d'incomplé-
ment des données ne réduise pas l'entropie : là tude de Godel. En effet, le problème de la déter-
encore, ce sont des conclusions que les travaux mination exacte de la complexité algorithmique
sur les ordinateurs réversibles avaient proposées d'un objet est un problème logique le plus sou-
il y a quelques années. Ce point est très impor- vent indécidable (pour être précis : sauf dans un
tant. car il confère un sens ~ r é c iàs certaines assi- nombre fini de cas). ainsi aue Chaitin l'a démon-
milations faites parfois entre .(entropiephysique)) tré en généralisant le premier théorème d'incom-
et ((désordre))à partir de considérations combina- plétude de Godel. Le calcul du terme algorith-
toires. En effet, idéalement, quand un système mique de l'entropie physique s e r a , sauf
est parfaitement connu, c'est-à-dire quand son exception, hors de portée de toute analyse et de
entropie statistique est réduite à zéro, il ne reste tout raisonnement mathématique formalisé. La
que son entropie algorithmique, qui mesure la variable ((entropie physique), est donc inacces-
simplicité du système : ((simple),signifie ici «des- sible, non pour des raisons liées à l'indétermina-
criptible par un programme d'ordinateur court». tion en mécanique quantique, pas plus que pour
Ordre, désordre, simplicité et complexité ne des raisons liées à l'impossibilité de mesures
sont plus des termes vagues ; ils ont pris un sens infiniment précises, mais à cause de l'indécidabi-
précis, tiré de l'informatique théorique. La grande lité logique de certaines propositions. Rassu-
différence avec certaines considérations plus rons-nous : si le calcul exact de l'entropie phy-
anciennes sur l'ordre et le désordre tirées de la sique est impossible, il existe de nombreuses
théorie de l'information de Cl. Shannon est au'ici méthodes pour approcher la complexité algorith-
les termes «simple>), (complexe)),etc. peuvent être mique. Le théorème d'incomplétude de Gode1 ne
appliqués individuellement aux objets, et non devrait donc pas trop gêner les physiciens.
plus seulement à des ensembles statistiques Allons encore un peu plus loin sur ce problème
d'objets. Les deux points de vue ne se contredisent de la mesure exacte du terme algorithmique de
d'ailleurs pas ; le nouveau complète et précise l'entropie physique telle qu'elle est proposée par
l'ancien. W. Zurek démontre même l'éauation de W. Zurek. Maintenant c'est l'intelligence " de
Sackur-Tetrode concernant l'évolution de l'entro- l'observateur qui doit être prise en compte. Plus
pie d'un gaz monoatomique à partir de considéra- un observateur est intelligent, plus il sera capable
tions sur la complexité algorithmique. de com~rimerles données au'il aura tirées des
On a, souvent et à juste titre, reproché aux mesures faites et, donc, plus importante sera la
théories physiques de l'entropie d'être subjecti- quantité de travail qu'il sera en mesure d'extraire
vistes. L'entropie est-elle devenue pour autant un du système physique observé.
concept objectif? Oui et non. Oui, car le concept, Dans le cas d'un système en équilibre, le
dans le cas de systèmes en équilibre, ne dépend meilleur codage possible de l'enregistrement des
plus de l'observateur pour peu que l'ordinateur mesures permet en moyenne de maintenir
servant à déterminer la complexité algorith- constante l'entropie physique, et c'est donc une
mique soit toujours le même et qu'une échelle de forme du théorème de la voie sans bruit de Shan-
discrétisation du monde physique soit convenue non (ce théorème indique ce que peuvent faire, en
une fois pour toutes (éventuellement par des moyenne, les meilleurs codages) qui garantit la
considérations liées à la mécanique quantique). validité de la seconde loi de la thermodynamique.
Non, car un changement de ces conventions de Dans le cas d'un système loin de l'équilibre,
référence change l'entropie physique. Toutefois, il est possible de coder (c'est-à-dire de compri-
même si l'objectivation n'est pas totale, le progrès mer) l'enregistrement des mesures : à la condi-
est net. L'entropie statistique était un concept tion de bien identifier les rémilarités
" du svstème
fortement subjectif (car dépendant d'une mesure étudié, un opérateur peut faire diminuer l'entro-
de probabilités) ; l'entropie algorithmique est un pie physique. Citons W. Zurek : «Heureusement
concept faiblement subjectif (intersubjectif), que nous habitons un monde loin de l'équilibre :
puisqu'elle ne dépend plus que du choix de cer- il est payant de faire des mesures. En un certain
taines conventions de référence. sens, les aptitudes intellectuelles d'un opéra-
Un autre aspect de cette rencontre vaut la teur sont essentielles pour son succès d a n s
peine d'être mentionné, celui qui fait qu'un théo- l'extraction de travail utile..
L'inférence inductive
C
ertains tests d'intelligence se présentent d'un nombre fini de valeurs, on peut trouver une
sous la forme d'énoncés du type : «Qu'est-ce infinité de fonctions conformes à ces valeurs.
qui vient logiquement après la suite de Pour que la question devienne intéressante nous
nombres : 3, 5, 7, 11, 13? Vous êtes censés recon- prendrons en compte deux autres éléments. Le
naître la suite des nombres premiers impairs et premier est que nous faisons des hypothèses res-
vous devez répondre 17,19,23,29.Il ne serait pas trictives s u r f : nous sommes prêts à admettre
absurde de répondre 15, 17, 19,21 en prétextant que f appartient à une certaine classe de fonc-
avoir reconnu la suite des nombres impairs qui ne tions qui n'est pas la classe générale de toutes les
sont pas des carrés, mais on considère que cette fonctions. Le second élément est que nous vou-
réponse est plus compliquée, et on la compte fausse! lons que le procédé qui nous fasse reconnaître f
Notre but ne sera pas de critiquer ceux qui soit précis, qu'il définisse une méthode que nous
concoivent ces tests et des préjugés qui les ani- pourrons suivre pour rechercher f, et dont nous
ment, ni de se moquer de ceux qui prétendent pourrons prouver qu'elle fonctionne correcte-
faire des programmes .géniaux» pour résoudre ce ment. E n résumé, nous recherchons pour quelles
genre d'exercice. En revanche, nous allons exami- classes de fonctions il est possible de concevoir
ner comment l'informatique théorique traite ce une méthode qui, à partir de données finies sur
genre de situation. dans le domaine de recherche
u
une fonction f de la classe retenue, conduise à
appelé l'inférence inductive. reconnaître f.
Depuis plus d'une vingtaine d'années, les
informaticiens théoriciens se sont emparés du Induction de polynômes
problème de l'induction : les résultats qu'ils ont
obtenus, assez extraordinaires, méritent d'être Donnons u n exemple : si F est la classe de
mieux connus. car ils donnent des indications toutes les fonctions polynomiales de degré infé-
précises s u r l'acquisition de la connaissance. rieur ou égal à 3, comment pouvons-nous identi-
Comment le scientifique peut-il, avec des don- fier une fonction f de la classe F à partir de la
nées en nombre limité, concevoir des lois? Quand connaissance des valeurs flO), fll), fl2), fl3), f(4),
il tente de telles inductions, quelles règles sont- fl5)? Ce problème est résolu sous le nom d'inter-
elles légitimes ou souhaitables? polation polynomiale, et vous en connaissez la
Voici l'un des modèles les plus simples propo- solution : on écrit que fh) = ax3+ bx2 + cx + d, on
sés par les théoriciens : le ((monde»que nous cher- remplace ensuite x par 0, 1, 2, 3,4, 5 ; on obtient
chons à connaître est une fonction f de nombres un système de 6 équations à 4 inconnues que l'on
entiers, et dont les valeurs sont aussi entières ; résout, ce qui donne a, b, c, d, c'est-à-dire f. Quatre
les expériences que nous faisons donnent des équations sont d'ailleurs suffisantes dans ce cas,
valeurs de f. Par exemple, sachant que fll)= 1, puisqu'il n'y a que quatre inconnues ; les données
fl2) = 4, fl3) = 9, il faut deviner f. supplémentaires ne servent qu'à vérifier que
Tel que, le problème n'a guère plus de sens l'hypothèse sur le degré n'est pas contredite. Ce
que celui des tests d'intelligence, car, à partir procédé nous assure qu'il existe une méthode
74 LOGIQUE, INFOR.K-1TIQrE ET PARADOXES
d'inférence inductive pour la famille des poly- On dit que cette méthode d'inférence induc-
nômes de degré inférieur ou égal à 3. tive réalise-une identification à la limite : en
Il existe aussi une méthode d'inférence induc- l'appliquant à une fonction polynôme dont on
tive pour la classe de toutes les fonctions poly- prend connaissance des valeurs petit à petit, on
nômes sans limitation de degré. La voici. Elle pro- ne peut pas savoir à partir de quelle étape on a
cède par étapes : à l'étape 0, vous utilisez f l O ) et trouvé la fonction qu'on cherche, mais on est cer-
vous cherchez u n polynôme de degré O ( u n e tain qu'arrive un moment où les propositions
constante) qui soit con~patibleavec f>(O) : à d'identification se stabilisent s u r le bon poly-
l'étape 1,vous utilisez uniquement f(0) et fi 1)et nôme.
vous cherchez un polynôn~ede degré 1compatible Le parallèle avec la pratique de la physique
avec f(0) et Al); ...: à l'étape n , vous utilisez les est évident : les physiciens sont prêts à abandon-
donnéesflO),f(l),...,fin) et vous cherchez un poly- ner la théorie qu'ils soutiennent si trop d'argu-
nôme d'interpolation de degré n compatible avec ments s'opposent à son maintien, mais ils espè-
f ( O ) , fil),..., f(n), etc. Si f est vraiment un poly- rent que, s'il y a une théorie ultime, ils finiront
nôme, alors, à partir de l'étape n (égal à son degré) par la trouver. Peut-être d'ailleurs l'ont-ils déjà
vous trouverez toujours le même polynôme et ce trouvée et ne le savent-ils pas, mais ils espèrent
sera le bon alors que leurs méthodes d'induction sont suffi-
samment bonnes pour qu'il ne soit plus néces-
saire d'en changer : en un mot, les physiciens
espèrent que leurs techniques d'induction consti-
Identification tuent une méthode d'identification à la limite.
des fonctions polynômes Revenons à nos polynômes : peut-on faire
0 Sachant que (O) = -1, calculer le polynôme de mieux? Autrement dit. peut-on trouver des
degré O qui donne -1 pour x = 0. familles de fonctions plus grandes que celle des
On trouve le polynôme P(x) = -1. polynômes e t pour lesquelles i l existe u n e
méthode d'identification à la limite? Chercher
1 Sachant que (0) = -1 et f(1) = 4, calculer le des familles, identifiables à la limite, qui soient
polynôme de degré 1 qui donne -1 pour x = O et 4 pour les plus grandes possibles est intéressant, car
x = 1.
cela revient à chercher des méthodes d'induction
P(x)= ax+ b
x=Oa.O+b=-1
faisant le moins d'hypothèses restrictives sur le
x = 1 a.1 + b = 4 monde dont elles tentent de reconnaître les lois.
doncb=-1 e t a = 5 . La réponse est O r I , et c'est l'un des résultats de
On trouve le polynôme P(x) = 5x - 1. base de la théorie de l'inférence inductive qui a
été énoncé et démontré par Mark Gold en 1965.
2 Sachant que 40) = -1, 41) = 4 (2) = 17, calculer le
poly-nôme de degré 2 qui donne -1 pour x = 0, 4 pour
x = 1,17 o u r x = 2 L'identification par énumération
%
P(x) = a + b x + c
Avant d'expliquer le résultat général de
x = O a.02 + b.0 + c = -1
x = i a.12+b.i + c = 4 M. Gold, donnons-en une conséquence intéres-
x = 2 a.22 + b.2 + c = 17 sante : la famille des (<fonctionsprimitives récur-
doncc=-1, b = 1 , a = 4 sives. que nous allons définir est identifiable à la
On trouve le polynôme P(x) = 4x2 + x - 1. limite. La famille des fonctions primitives récur-
sives, qui joue un rôle important en logique, est la
3À partir de fl0) = -1, (1) = 4, Y2) = 17, (3) = 38,
famille de toutes les fonctions ( à variables
calculer le polynôme de degré 3 qui donne -1 pour x =
0,4 pour x = 1, 17pour x = 2,38 pour x = 3. entières et à valeurs entières) dont on peut don-
~ ( x ) = a g +b 2 + c x + d.. ner une définition en utilisant des fonctions
d o n c a = O , b = 4 , c = 1, d=-1 constantes, des additions, des multiplications,
On trouve le polynôme P(x) = 0.2 + 4 2 + x - i = 4x2 des projections (au couple ix,y),on associe x),des
+x-1. compositions de fonctions, et des définitions par
récurrence. Cette famille contient tous les poly-
4 Etc. nômes, mais aussi bien d'autres fonctions comme
1. Pour identifier une fonction f(d dont on sait seulement la fonction f(n) = n-ième nombre premier. La fonc-
qu'elle est polynomiale (de la formef(x) = anxn + tion qui, à un entier associe son plus petit divi-
...
+ ), on suit l'algorithme indiqué. A partir d'un certain seur premier, est aussi primitive récursive luorr
moment, on trouve toujours le même polynôme, qui est
donc le bon. La méthode identifie le polynôme à la limite. la figure 3), ainsi que toutes les fonctions suscep-
LXYFEREYCE INDUCTIVE 75
tibles d'intervenir dans un test d'intelligence, et On est donc amené à ne s'intéresser qu'aux
en particulier les deux fonctions évoquées plus méthodes d'induction programmables par ordi-
haut : wz-ième nombre premier impair» et wz- nateur. Une telle exigence, si on l'adopte, peut
ième nombre impair non-carré.. être vue soit comme une exigence de clarté (si une
Le fait que l'ensemble des fonctions primi- méthode inductive est claire. on doit pouvoir en
tives récursives soit identifiable à la limite simi-
u
faire u n programme). soit plus simplement
fie donc qu'il existe une méthode générale qui comme une exigence d'applicabilité (pour qu'un
résout tous les tests d'intelligence du type envi- robot ou un ordinateur applique la méthode, il
sagé plus haut, non pas en devinant le terme sui- faut qu'on la traduise en un programme). On peut
vant, mais en devinant à partir d'un certain discuter à l'infini pour savoir si les méthodes que
moment l'idée qu'a eu l'inventeur du test. Le pro- le cerveau humain utilise pour faire de l'induc-
cédé se trompera peut-être au début, mais, à par- tion sont effectivement restreintes aux méthodes
tir d'une certaine étape, il fournira l a bonne programmables ou non. Nous ne le ferons pas ici :
réponse et ne se trompera plus jamais ensuite. libre à chacun de penser que les résultats concer-
Le résultat concernant la classe des fonctions nant les méthodes inductives programmables ne
primitives récursives, que nous noterons PR, est concernent que les robots et les ordinateurs, ou
beaucoup plus puissant que celui concernant les nous concernent, nous, humains.
fonctions polynômes. et pourtant sa démonstra- Le résultat de M. Gold indiqué plus h a u t
tion reste élémentaire, car elle repose sur le fait doit être reformulé pour prendre en compte la
au'il existe une facon d'énumérer les fonctions de question de l a calculabilité. Il devient alors :
PR. pro, p r l ... pr,, ... selon la longueur des pro- pour tout ensemble E de fonctions énumérable
grammes qui les définissent (uoir la figure 2). par programme f ~fi, ... f, ... (c'est-à-dire tel
La méthode d'identification à la limite propo- qu'il existe un programme qui pour tout n et tout
sée par M. Gold pour PR est la suivante : à l'étape m calcule fn(m)), il existe une méthode program-
O,lorsquef(O) est connu, on recherche la première mable d'identification à l a limite de E.
fonction de la liste pro p r l ... Prn ... qui prend la L'ensemble des fonctions polynômes est énumé-
valeurf(0) en O; à l'étape 1,lorsqueflO) etf(1) sont rable par programme, et bien que cela soit moins
connus, on recherche la première fonction de la évident, l'ensemble des fonctions primitives
listeprOprl ...prn ... qui prend les valeurs f(O)en récursives aussi. Il en résulte que la classe très
O et fil)en 1, etc.. A chaque fois que cette méthode générale des fonctions primitives récursives est
est utilisée avec une fonction f de la classe PR. elle identifiable p a r programme. ce qui est assez
se stabilise, a u bout d'un cértain temps, sur la remarquable.
bonne fonction f. La question suivante vient immédiatement à
Cette idée d'énumération étant introduite. il l'esprit : existe-t-il des classes de fonctions qui ne
est facile de comprendre l'énoncé du résultat s o n t p a s é n u m é r a b l e s p a r programme? La
général de Gold : pour toute famille énumérable
de fonctions (c'est-à-dire numérotée fo fi f2 . . .), il
existe une méthode d'identification à la limite qui
est la méthode de l'identification par énuméra- ldentification
tion. Notons que le résultat général de Gold ne par énumération de Gold
vaut que pour les fonctions définies pour tout 0 Rechercher parmi les fonctions po, p l , p2, p3 .
entier n. p, .. la première fonction qui coïncide avec f en 0 .
1 Rechercher parmi les fonctions PO, p l , p2, p3, ...,
p, ... la première fonction qui coincide avec f en O et
Programmation des inférences
Pour aller plus loin, il faut maintenant se
poser des questions de calculabilité. On sait que
toute fonction mathématique n'est pas calculable
par ordinateur ; la fonction qui, à toute formule
d'arithmétique élémentaire: associe 1 si elle est
2. La méthode d'identification par énumération de Gold
vraie et O sinon, n'est pas calculable par ordina- permet d'identifier à la limite toute fonction g d'une
teur. Donc, l'existence abstraite d'une fonction ...,
classe P qu'on sait énumérer po, p l , p2, p3? py ...En
mathématique pour résoudre u n problème ne effet, lorsque la fonction qu'on cherche a identi ier est
signifie pas qu'on peut la mettre en œuvre sur dans lalistepo,pl,p~,pg, ...,pn ...,la méthode de Gold finit
par tomber dessus et, une fois tombée dessus, la méthode
machine. reste toujours sur la bonne fonction.
76 LOGIQUE, INFORMATIQPE ET PARADOXES
réponse est OUI et il y a une classe particulière- nombres réels ne peut pas être mis en correspon-
ment simple de fonctions qui n'est pas énumé- dance bijective avec N.
rable par programme : la classe des fonctions pro- En fait, Gold a aussi montré, dans son article
grammables partout définies de N dans N que de 1965,que P n'est pas identifiable à la limite par
nous noterons P (et qu'on appelle aussi : classe une méthode programmable (ce raisonnement est
des fonctions récursives totales). expliqué à la figure 4).P n'est donc ni énumérable
Cette classe de fonctions est plus grande que par programme, ni identifiable à la limite par
la classe des fonctions primitives récursives, qui programme.
est elle-même plus grande que la classe des fonc-
tions polynômes ;c'est le même raisonnement qui Pas d'algorithme d'induction absolu
montre que la classe des fonctions program-
mables P est plus grande que la classe des fonc- En matière d'induction, quel que soit l'algo-
tions primitives récursives PR, et qui montre que rithme qu'on utilise, ce n'est jamais le meilleur
la classe des fonctions programmables n'est pas possible. En effet, toute fonction programmable f
énumérable par programme : il s'agit d'une ver- appartient à une classe énumérable par pro-
sion du fameux raisonnement diagonal introduit gramme et donc, pour tout f ,il existe une méthode
par Cantor pour établir que l'ensemble des d'identification à la limite programmable qui
identifief. Si un algorithme plus puissant que tout
autre d'identification à la limite existait, il devrait
La classe très générale des donc identifier P dans sa totalité, et comme P n'est
pas identifiable à la limite par programme cela
fonctions primitives récursives signifie qu'il n'y a pas d'algorithme d'identifica-
est énumerable par programme tion à la limite plus puissant que tout autre.
La leçon est claire : lorsque vous cherchez une
A Exemple de programme montrant que la fonction méthode d'induction programmable, selon les
qui, à n, associe son plus petit diviseur premier est pri- hypothèses que vous adoptez, vous êtes en
mitive récursive : mesure d'identifier telle catégorie de fonctions ou
entrer n;
bool := 1;
telle autre, mais jamais vous ne pouvez vous
pour i := 2 à n faire [ défaire des hypothèses choisies : aucun pro-
pour j := 1 à n faire [ gramme d'induction n'est meilleur que tout
si [i'j = n et bool = 11 alors [bool := O, p := 411; autre, il est inutile, dans cette théorie, de recher-
imprimer ("le plus petit diviseur de" n "est" p) cher un algorithme d'induction absolu.
B Principe de l'énumération des f
récursives Universalité
1 Énumérer, par ordre alphab ro- de l'identification par énumération?
grammes de longueur 1 (s'il y en a
Même s'il n'y a pas de programme inductif
2 Énumérer, par ordre alphab ro-
grammes de longueur 2 (s'il y en général, l a question se pose quand même de
3 Énumérer, par ordre alphab ro-
savoir si le principe d'identification par énuméra-
grammes de longueur 3 (s'il y en a tion de Gold est universel. Autrement dit : toute
4 Etc. classe de fonctions identifiable à la limite l'est-
elle Dar la méthode d'identification de Gold en
3. La classe des fonctions mimitives récursives est la choisissant bien l'énumération de fonctions? La
classe de toutes les fonction's qu'on peut définir avec des réponse est NON si on impose aux méthodes
additions, des multiplications,des projections (à (x, y) on recherchées d'être programmables et elle est OC1
associe x), des compositions de fonctions et des récur-
rences. On démontre que c'est aussi la classe de toutes les si on n'impose rien.
fonctions qu'on peut décrire dans un langage de pro- Le OUI peut être vu comme signifiant que,
grammation comportant les fonctions d'addition et de pour un esprit dont les capacités dépasseraient
multiplication, les instructions d'entrées-sorties,entrer,
imprimer, l'instruction d'affectation a := b, l'instruction celles d'une machine, rechercher une bonne
... ... ...
[si alors 1, l'instruction [pour i : = pàq faire 1, mais ne méthode d'induction est éauivalent à rechercher
...
comportant pas l'instruction [go to 1. Avec un tel lan-
une bonne énumération des fonctions possibles
gage, il est impossible d'écrire un programme qui boucle
sans jamais s'arrêter. Grâce à cette caractérisation de la décrivant le monde : faire de l'induction, c'est
famille des fonctions primitives récursives en termes de classer! L'invraisemblance de cette conce~tion
programme, on peut énumérer toutes ces fonctions et
appliquer la méthode d'identification par énumération trop simple du problème de l'induction peut être
de Gold. vue comme un argument en faveur de l'idée que le
LLWERE-VCE INDUCTNE 77
6. On peut montrer que, lorsqu'on fait de l'induction, vaise. C'est le cas aussi de la norme de falsifiabilité maxi-
s'imposer certains principes restreint le pouvoir de male, qui impose de ne proposer que des théories géné-
l'induction. La norme de conformité qui impose de ne rales, c'est-à-dire définies partout. Ici donc les résultats
proposer que des théories qui rendent compte de toutes de la théorie de l'inférence inductive retrouvent et préci-
les expériences (y compris celles qu'on n'arrive pas à sent les règles de bon sens. Dans d'autres cas, les résul-
refaire et qui semblent anormales) a été prouvée mau- tats mathématiques sont plus étonnants.
possible à une méthode respectant la norme de inutilement longues (par exemple, qui ne dépas-
monotonie de «ne pas trop se mouiller» en faisant sent pas le double de la théorie équivalente la
peu de prédictions, mais, au fur et à mesure des plus courte) est restrictif: que s'interdire de chan-
expériences, elle ne doit pas revenir en arrière ger de théories plus de n fois est restrictif (ce n'est
sur ce qu'elle a prédit auparavant» : les fonctions pas étonnant) ; qu'en revanche tolérer que la
proposées doivent être de plus en plus définies. théorie proposée se trompe une fois (ou plusieurs
On comprend bien que, là encore, s'imposer le res- fois i augmente le pouvoir des méthodes induc-
pect absolu de cette norme diminue le pouvoir tives ; que prendre en compte des méthodes
inductif. Cela a été prouvé en 1991, ainsi que inductives probabilistes ne donne bien souvent
d'autres résultats plus forts du même type, par pas grand-chose d'intéressant, etc.
Klaus Jantke, de l'université de Leipzig, en Alle- Bien que la portée de tous ces résultats soit dif-
magne. Les nombreuses études en cours sur le ficile à évaluer à cause du modèle aui n'est. bien
raisonnement non monotone -raisonnement per- sûi; qu'une grossière caricature de la situation
mettant de revenir en arrière lorsque de nou- d'un chercheur scientifique. il n'en reste pas moins
velles informations deviennent disponibles - y que ces théorèmes parfois très surprenants consti-
trouvent une justification nouvelle. tuent des enseignements que la philosophie des
La norme d'élimination définitive impose de sciences doit prendre en compte. L'intelligence
m e jamais revenir à une fonction qu'on a aban- artificielle, qui s'intéresse à l'apprentissage, et
donnée précédemment,> et. contrairement aux donc à l'induction, est aussi un lieu d'application
précédentes, n'est pas restrictive : se l'imposer ne privilégié de ces recherches. Si elle n'a pas pour
diminue pas le pouvoir des méthodes inductives. I'instant pu tirer grand-chose des résultats des
De nombreux autres résultats de cette nature théoriciens de l'induction. cela est dû, là encore, à
ont été proposés par les théoriciens de l'inférence la trop grande simplicité des modèles étudiés et
inductive (voir, par exemple, le livre Systems that cela explique pourquoi de nouveaux modèles et de
learn de D. Osherson, M. Stob et S. Weinstein, nouvelles idées sont aujourd'hui explorés (voir
MIT Press, 1986).En particulier, on découvre que Théorie de l'apprentissage, par Stéphane Bouche-
ne chercher que des théories qui ne soient pas ron, éditions Hermès, 1992).
Les virus
S
i le disque de votre ordinateur s'efface sou-
dainement en affichant u n message Troie. Le nom Cheval de Troie s'inspire de
m o q u e u r ou - moins cruel, m a i s t r è s l'antique ruse décrite par Homère dans l'lliade :
pénible pour les nerfs - si vous devez périodi- c'est un programme qui en cache un autre et qui,
quement taper &hocolate chipx en réponse au à vos dépens, exécute des opérations que vous ne
m e s s a g e ~ G i m m ecookie,) p o u r q u e v o t r e soupçonnez pas. Un célèbre exemple est celui du
machine continue à fonctionner (il s'agit de progamme d'évaluation des risques de contami-
l'effet produit par le Cookie Monster qui sévit nation par le SIDA qui fut envoyé de la banlieue de
dans le monde des ordinateurs compatibles PC), Londres sous la forme d'une disquette à plus de
c'est que vos programmes sont contaminés par 10 000 personnes du monde de l'informatique et
un virus informatique. de la médecine. Lorsque vous lanciez le pro-
Qu'est-ce qu'un virus informatique? Quels en gramme, celui-ci vous interrogeait sur votre com-
sont les différents types? Comment se répandent- portement, dans le but fallacieux de calculer vos
ils? Que recherchent ceux qui les mettent a u risques d'attraper le SIDA, mais, a u bout de
point? L'analogie avec la biologie est-elle justi- quelque temps, à votre insu. il cryptait votre
fiée? Nous aborderons ces questions en insistant disque dur et le rendait inutilisable. Plus tard
particulièrement sur la dernière, qui ouvre des apparaissait à l'écran un message vous enjoi-
perspectives aussi délicates que passionnantes. gnant de faire parvenir un chèque pour les droits
du programme, en échange duquel vous deviez
recevoir un code qui reconstituerait votre disque
Vermine, Cheval de Troie, lapin, d u r dans son é t a t initial. La disauette était
ver et virus accompagnée d'une mise en garde explicite sur
les dangers qu'on encourrait à utiliser le pro-
La faune des maladies informatiques est gramme s a n s e n acquitter les droits, mais,
riche : même si l'on simplifie souvent en n'utili- comme peu de gens prennent le temps de lire les
sant que le mot virus, une terminologie plus pré- documents accompagnant les logiciels (surtout
cise existe. s'ils sont envoyés gratuitement), de nombreuses
«Vermine»est le mot recommandé en francais personnes furent piégées.
pour désigner toute erreur de programmation, Un Cheval de Troie fonctionne souvent à
mais il est moins utilisé que les mots équivalents l'aide d'une bombe logique, c'est-à-dire qu'il n'exé-
«bug, ou «bogue),(au masculin ou a u féminin, cute sa tâche nuisible que lorsque quelque chose
comme on veut!). Les verbes associés sont «d ever-
' de particulier se produit dans l'ordinateur : dépas-
miner., .débugger)>,«déboguer». sement d'une date, effacement du nom de Mon-
Plus qu'aux erreurs, nous nous intéresserons sieur X de la liste des employés de la Société Y, etc.
principalement aux programmes nuisibles créés Un Cheval de Troie n'est iamais le résultat
délibérément par des programmeurs et dont un d'une erreur de programmation. En revanche, il
LES VIRUS 81
peut se produire que, par erreur, un program- États-unis et partout dans le monde. Ayant repéré
meur crée un programme qui se dédouble dans la certaines faiblesses de ce réseau. il concut un ver
mémoire de l'ordinateur et provoque l'exécution autoreproducteur qui déjouait tous les systèmes
du nouveau programme, qui bien sûr alors se protecteurs, et il ne résista pas à la tentation d'en
dédouble, etc. On appelle de tels programmes des faire l'essai. L'essai fUt concluant! Le ver s'insinua
lapins. On en a signalé, dès les années 1960, sur dans plusieurs milliers d'ordinateurs - on parle de
les ordinateurs de la gamme UNIVAC 1108. 6 000 - et entraîna des dégâts qu'on a évalués à
Lorsqu'un <<lapin» est présent, il envahit toute la ~ r è de
s cent millions de dollars : machines rendues
mémoire de l'ordinateur et ralentit ou interrompt indisponibles, secteurs de réseaux coupés, heures
son fonctionnement. supplémentaires de travail pour réparer et
Quand un tel programme autoreproducteur a remettre en marche. etc. R. Morris fut assez vite
la capacité de circuler d a n s u n r é s e a u , on identifié, car il ne cherchait pas vraiment à se
l'appelle un ver (<(worm.).Ce terme fut introduit cacher, et il aida lui-même à maîtriser le monstre
dans le roman de science-fiction S u r l'onde de au'il avait créé et ((lâchédans la nature». Un an
choc, de John Brunner, publié en 1975 (et en 1977 &rès, des copies actives du ver de novembre 1988
en version française aux éditions Robert Laffont), étaient encore détectées.
avant qu'aucun ver n'ait vraiment engendré de Lors de l'audience où il comparut pour son
graves problèmes. Bien sûr, il n'est pas très com- forfait, on demanda à Morris s'il aurait pu modi-
mode de concevoir des vers, car les réseaux infor- fier son ver pour qu'en plus de se répandre il
matiques comportent de nombreux dispositifs de efface les mémoires des ordinateurs contaminés
protection qui interdisent leur circulation. Les et les mette gravement hors d'usage. 11répondit
vers sont donc des productions volontaires dues à que cela aurait été très facile, car son ver accé-
des programmeurs de très bon niveau. Les dait aux niveaux les plus profonds des machines
meilleures protections semblent pouvoir être qu'il infectait (ces niveaux sont habituellement
contournées, et la preuve en fut donnée par une &servés aux techniciens spécialisés, appelés
extraordinaire affaire qui s'est déroulée en ingénieurs systèmes, qui gèrent les centres de
novembre 1988et a fait trembler toute la commu- calcul). On imagine alors la catastrophe qui en
nauté informatique. aurait résulté. Notons que le roman de John
Brunner évoqué plus haut était le roman favori
de R. Morris.
Un étudiant doué Le ver est une entité autoreproductrice qui se
Robert Morris, fils d'un expert en sécurité répand partout où elle peut dans les mémoires
informatique, étudiant de l'université Cornell, des ordinateurs d'un réseau. Un ver est donc une
n'avait apparemment aucune intention mal- sorte de parasite qui exploite le milieu artificiel
veillante, mais il connaissait très bien le réseau des réseaux informatiques, comme certaines bac-
Internet (par des cours particuliers donnés par son téries aui vivent dans les réseaux de canalisa-
père?), qui relie de nombreux centres de calcul aux tions d'eau des villes ou comme certains insectes
1. Un lapin est un programme qui se duplique lui-même de sa fonction spécifique, exécute une tâche cachée,
et envahit progressivement toute la mémoire de l'ordi- par exemple effacer un fichier au hasard (c). Un virus
nateur (a).Un ver fait de même mais, à l'aide des est un morceau de programme s'insérant dans d'autres
réseaux d'ordinateurs, passe d'un ordinateur à l'autre programmes qui, de proche en proche, propageront
( b ) . Un cheval de Troie est un programme qui, en plus l'épidémie.
82 LOGIQUE, INFORMATIQCE ET PARADOXES
qui vivent dans les silos de céréales et en prélè- Les motivations des créateurs de virus, de
vent parfois des volumes importants. Le rôle des vers et autres monstres informatiques sont le
ingénieurs informaticiens est de maintenir sté- plus souvent la provocation, le défi et le jeu. On
riles les réseaux informatiques, et ils réussissent peut comparer ces programmeurs aux dessina-
plutôt bien : il est assez rare aujourd'hui que des teurs de tags des murs de nos villes, qui utilisent
s7ersy circulent. leur temps, voire leur intelligence, dans un but
inutile, pour la simple jouissance d'exister par
l'intermédiaire de créations nuisibles (ou laides) :
Les virus informatiques
un de ces programmeurs portait un bonnet avec
s'insèrent dans les programmes l'inscription «Hackito ergo sum» (<<je pirate donc
La différence entre un ver et un virus est que je suis»).On a envie de leur dire : «Si vous êtes si
le virus informatique n'est pas u n programme malin, créez un logiciel qui vous rendra célèbre et
complet autonome : ce n'est qu'un bout de pro- riche.» En fait, les programmeurs de virus ne sont
gramme, généralement court (quelques centaines pas si malins que cela, et il est maintes fois arrivé
de caractères), qui s'insère dans les programmes qu'à la suite d'une erreur de conception ou de pro-
(appelés alors programmes contaminés). Quand grammation un virus qui aurait dû être inoffensif
on exécute les programmes contaminés, la conta- soit dangereux, traniformant ainsi une farce
mination diffuse sans nécessairement nuire gra- anodine en une i n ~ a s i o ndestructrice.
vement a u bon fonctionnement du programme
contaminé ou de l'ordinateur concerné.
Le virus passe inaperçu, car il ne fonctionne
L'épée et le bouclier
que lorsque vous lancez u n programme conta- Pour protéger les ordinateurs des virus
miné. Et, bien sûr, il se transmet lorsque vous dévastateurs, une industrie logicielle spécialisée
copiez u n programme contaminé s u r une dis- s'est développée. Elle propose des logiciels antivi-
quette et que vous la donnez à un ami. On a même rus chargés d'éviter les infections et pouvant
vu des éditeurs de logiciels vendre, sans le savoir, même <<soigner» les ordinateurs «malades>);ces
des programmes contaminés. logiciels portent des noms évocateurs : Désinfec-
Les virus sont nuisibles, car ils ralentissent tant, Antitoxin, Virus Rescue, PC-Cillin, etc. On a
les ordinateurs qu'ils infectent et dont ils occu- suspecté les fabricants d'antivirus de créer de
pent l'espace mémoire. Plus grave, ils sont parfois nouveaux virus, de facon à avoir de bons argu-
conçus pour produire des effets nuisibles spé- ments de vente, mais personne n'a apporté d'élé-
ciaux. Aujourd'hui, on a recensé plus de 2 000 ments sérieux pour attester cette hypothèse. En
virus différents qui concernent principalement revanche, les vents de panique, souvent liés à des
les micro-ordinateurs. Les ruses développées par dates «fatidiques»(les vendredis 13 sont particu-
les créateurs de virus se sont complexifiées, et lièrement craints) profitent à cette industrie.
l'on ne peut jamais être certain qu'un ordinateur Dans la lutte qui oppose les fabricants de pro-
n'en héberge pas un ou plusieurs. grammes antivirus et les programmeurs de virus,
Citons quelques exemples d'actions nuisibles l'escalade des armes en est arrivée à u n point
que peuvent exécuter des virus. Le virus n-cir étonnant.
( p l u s précisément l a souche A, q u i semble Pour lutter contre les vers et les virus, on a très
aujourd'hui «éradiquéen) utilisait le générateur tôt eu l'idée d'utiliser des vers antivers et des virus
de son des ordinateurs Macintosh et lui faisait antivirus. Ainsi la souche A du virus n-uir sur
prononcer «don7tpanic), (<,pasde panique))).Le Macintosh (évoquée plus haut, et qui disait ((Don't
virus Score sur Macintosh était destiné à endom- panicn) était dangereuse, car elle effaçait des
mager des applications de la Société EDS. On fichiers au hasard : on créa donc une variante - la
soupçonne u n employé mécontent d'en ê t r e souche B, qui se substitue à la soucheA et qui n'a
l'inventeur. Un virus spécialement attaché a u pas d'effet nuisible (autre que de se répandre).
logiciel de création de tableaux numériques Cette souche B , qu'il n'est pas rare aujourd'hui de
Lotus 1-2-3 modifiait légèrement et sournoise- rencontrer, s'est extraordinairement diffusée, au
ment certaines valeurs des tableaux. Plus dolosif, point d'ailleurs que notre laboratoire fut victime
on cite le cas d'une infection qui perturbait le d'une épidémie générale de n-uir-B en 1989.
fonctionnement de logiciels d'aide a u diagnostic L'ancienne version a, semble-t-il, totalement dis-
médical. D'autres virus engendrent des mouve- paru, si bien que les collectionneurs de virus
ments fous des têtes d'écriture des disques durs comme mon ami Philippe Devienne ne réussissent
jusqu'à les mettre hors service. pas à en avoir d'exemplaires (un bon conseil :n'uti-
84 LOGIQUE, INFORMATIQUE ET PARADOXES
Cette signature est un point faible des virus, que ce logiciel sait identifier. Bien sûr, ces logi-
et c'est elle que nombre de logiciels antivirus ciels doivent être mis à jour pour tenir compte des
exploitent. Ces programmes antivirus connais- nouveaux virus. C'est pourquoi, lorsque vous
s e n t les signatures des virus identifiés e t , achetez un tel logiciel antivirus, vous êtes en
lorsqu'une disquette est insérée dans l'ordina- général automatiquement abonné au service des
teur, ils vérifient qu'aucun programme de la dis- mises à jour.
quette ne porte une signature connue par eux. On La méthode est très efficace contre tout virus
<<vaccine» ainsi l'ordinateur contre tous les virus identifié et elle a arrêté les épidémies les plus
graves ; elle est parfois complétée par des sys-
tèmes de réparation : quand un virus est repéré,
le logiciel antivirus, selon les cas, vous conseille
VIRUS AVEC COMPRESSION de détruire le programme infecté (car il ne sait
pas le soigner),ou vous propose de le réparer, soit
A. INFECTION D'UN NOUVEAU PROGRAMME en inactivant le virus - qui reste présent, mais
cesse de se répandre et d'avoir des effets nui-
sibles -, soit en reconstituant le programme tel
1 COMPRESSION qu'il était avant l'infection.
Des virus polymorphes sont récemment
apparus : ils mutent à mesure de la contamina-
1 INSERTION DU VIRUS tion, en changeant de temps en temps de signa-
ture, ce qui accroît la difficulté de la détection. On
a aussi évoqué l'existence de virus sexués qui
vont par paire et ne produisent un effet nuisible
B. STRUCTURE DU VIRUS que s'ils sont présents simultanément dans un
ordinateur. Cette stratégie, qui retarde le déclen-
RECHERCHE D'UN COMPRESSION
PROGRAMME NON DU PROGRAMME
chement de l'attaque, donne le temps à chaque
élément de la paire de se diffuser indépendam-
ment, sans qu'il se passe rien en apparence.
On n'a pas fini d'entendre parler des virus
informatiques, car aucune méthode infaillible ne
peut les identifier tous : cette affirmation n'est pas
INSERTION 1 gratuite, elle résulte d'un théorème mathématique
DU VIRUS dû à Fred Cohen (voir L'encadré de l a page 85).
PRODUCTION
La terminologie virus informatique est-ellejus-
tifiée par une réelle analogie entre ce qui se passe
en informatique et dans le monde biologique?
Notre description des vers et des virus justi-
fient le langage utilisé. Les mots infection, épidé-
mie, soin, guérison, éradication, souche, muta-
tion, vaccin, empruntés au vocabulaire médical,
sont employés sans qu'il y ait besoin de justifica-
tions, tant le parallèle saute aux yeux :les ordina-
teurs sont bien «rendus malades. par des dérègle-
ments internes, susceptibles de se transmettre si
l'on ne prend pas de mesures appropriées.
3. Dans la lutte qui oppose programmeurs de virus et pro-
grammeurs de logiciels antivirus, les ruses sont deve-
nues complexes. Les virus avec compression en sont un Virus biologiques
exemple. Ce type de virus, pour éviter d'allonger le pro-
gramme qu'il infecte (ce qui le rendrait repérable), se Cette analogie entre les maladies des ordina-
ménage de la place en compressant le programme teurs et celles du monde biologique semble même
infecté. Il se charge aussi de la décompressionlorsque le pouvoir être précisée, à cause du parallèle évi-
programme infecté doit fonctionner (car, s'il l'empêchait
de fonctionner, il se ferait repérer). Les logiciels antivi- dent entre les programmes dans la mémoire de
rus qui, auparavant, vérifiaient que la longueur totale l'ordinateur codés avec des O et des 1,et l'informa-
des programmes ne changeait pas, ont dû être perfec-
tionnés : ils associent maintenant des sommes de tion génétique, codée sous la forme d'une chaîne
contrôle qui ne doivent pas changer. de quatre caractères A, C, G, T (les nucléotides, ou
LES VIRUS 85
sition, mais elle réussit à exploiter les méca- Si ces séquences transposables ne sont là que
nismes biochimiques de la cellule à son profit parce qu'elles ont la propriété de se recopier et
pour se disséminer. Le génome du chimpanzé qu'elles n'ont aucune fonction particulière dans
comporte trois fois moins de séquences ALU et les mécanismes biochimiques d'une cellule, alors
deux fois moins de séquences L1 : cela suggère elles sont les équivalents biologiques de ce qu'on
que l'invasion de notre génome par ces séquences appelle à tort les virus informatiques et qu'on
transposables est assez récente et se poursuit devrait donc appeler séquences transposables de
encore maintenant. programme.
On le voit, les séquences transposables sem-
blent se multiplier dans le génome en exploitant
l'usine biochimique de la cellule exactement Rien n'est simple
comme un virus informatique se multiplie sur le Mais, comme souvent en biologie, tout se com-
disque de votre ordinateur, détournant à son pro- plique : on n'est pas certain du tout que les
fit le système d'exploitation de l'ordinateur. séquences transposables comme ALU ou L1 ne
jouent aucun rôle et soient donc de purs parasites.
L'exemple des séquences transposables porteuses
de gènes conférant aux bactéries la résistance à
des antibiotiques montre déjà que certaines
séquences transposables ont une utilité.
La question de savoir si certaines séquences
transposables sont vraiment des parasites - donc
l'équivalent exact des virus informatiques - est le
sujet d'un débat encore ouvert aujourd'hui. Que
des parties du génome puissent n'être là que parce
qu'elles ont la propriété de se dupliquer est une
idée à la fois séduisante et gênante. Des discus-
sions contradictoires sur ce thème animent donc
depuis une quinzaine d'années les biologistes.
L'idée est séduisante, car, après tout, le
monde biologique est rempli de parasites, et, à
partir du moment où un parasite n'est pas trop
agressif, on peut tout à fait imaginer qu'il s'ins-
talle définitivement dans son hôte involontaire.
Les séquences transposables (du moins certaines
d'entre elles) peuvent donc être des séquences
parasites qui «vivent),dans le génome, parce
qu'elles ne lui nuisent pas trop, et que celui-ci,
n'ayant pas de moyen de les éliminer, s'en accom-
mode. Une autre raison d'accepter l'idée des
séquences parasites est que la taille des génomes
n'est Das directement liée à la comdexité des
êtres vivants auxquels ils appartiennent. Cer-
taines plantes possèdent un génome 100 fois plus
long que le génome humain. On évalue que la
partie du génome humain qui code pour des pro-
téines est inférieure à cinq pour cent du génome
4. Von Neumann a prouvé qu'on pouvait concevoir des entier, le reste n'ayant pas d'utilité bien établie
ordinateursautoreproducteurs:il en aconstruit un dans
un univers mathématique simplifié, montrant ainsi qu'il aujourd'hui.
n'y avait aucune impossibilité logique à l'existence Toutefois, l'hypothèse de séquences para-
d'ordinateurs autoreproducteurs.On peut imaginer que, sites dans le génome est en même temps une idée
dans l'avenir, nous saurons construire de tels ordina-
teurs autoreproducteurs.On pourra alors assister à des gênante. Elle contredit le principe darwinien que
infections analogues à celles des virus biologiques : des tout est ajusté au mieux dans le monde du vivant :
micro-robots mobiles, en insérant leurs propres pro- la sélection naturelle aurait sans doute éliminé
grammes, pourront détourner la machinerie des ordina-
teurs autoreproducteurs à leur profit pour que ceux-ci les organismes dont le génome se laisse envahir
produisent d'autres micro-robotsmobiles. par des séquences parasites qui consomment une
LES VIRUS 87
certaine énergie, des composés chimiques, et du fonctionnelle du génome,>.Comme pour les para-
temps lors, de la duplication des chromosomes. sites animaux, qui finissent parfois par vivre en
Une autre raison empêche de considérer les symbiose avec leur victime, au point même dans
séquences ALU ou LI, ou autres séquences répéti- certains cas de former un seul être avec lui (on
tives du génome, comme des séquences parasites : envisage une telle explication pour l'origine des
on envisage aujourd'hui qu'elles remplissent cer- cellules à noyaux, qui seraient le résultat de sym-
taines fonctions. Chez les plantes, il semble bioses successives e n t r e organismes plus
qu'elles interviennent dans le brassage génétique simples), il semble raisonnable aujourd'hui de
qui (comme la sexualité) permet une adaptation parier que la plupart des séquences transpo-
en réponse à des changements brusques de l'envi- sables participent au fonctionnement général de
ronnement. On a constaté des salves de transpo- la cellule - même si, à l'origine, elles furent de
sitions chez certaines plantes, en réponse à des purs parasites.
stress intenses comme l'exposition à des rayons X On le voit donc, la conclusion est loin d'être
ou gamma, ou lors d'infections bactériennes. On définitive et si un parallèle peut être défendu
envisage aussi que la séquence ALU pourrait globalement entre les phénomènes d'infection
jouer un rôle dans les mécanismes des recombi- des programmes e t les m a l a d i e s d e s ê t r e s
n a i s o n s (échanges de b r i n s e n t r e ADK de vivants, ce parallèle ne s'étend pas facilement
séquences similaires) qui se produisent avec une dans le détail.
efficacité déconcertante et inexpliquée. Après tout, ce n'est peut-être pas étonnant,
La nature laisse rarement inutilisé un maté- puisque les programmes et les ordinateurs sont
riel dont elle dispose et donc, même si à u n des objets produits intentionnellement p a r
moment donné il y a eu des séquences parasites. l'esprit de l'homme sur une échelle de temps très
il est vraisemblable qu'elles ont été intégrées courte, alors que les êtres vivants ont pour ori-
dans les mécanismes généraux de fonctionne- gine l'évolution et la sélection naturelle, qui se
ment des cellules et qu'aujourd'hui elles y partici- sont déroulées pendant des milliards d'années et
pent utilement. Philippe Herbomel, de l'Institut sont donc le résultat d'un processus non inten-
Pasteur, à Paris, défend l'idée que les séquences tionnel très long - l'horloger aveugle, comme
transposables ont leur place dans d a cohérence l'appelle Richard Dawkins.
L'altruisme récompensé ?
Des simulations informatiques montrent qu'il v a u t mieux être bon que méchant,
indulgent q u e rancunier, réactif qu'insensible.
partie numéro n sont faits simultanément. Urie jamais battre par personne, mais à quel prix!
stratégie est donc une règle qui permet de déter- Notons quand même qu'on rencontre des gens qui
miner, en fonction du passé, et éventuellement à semblent croire que ne jamais se faire battre est
l'aide de tirages au sort, s'il faut coopérer ou tra- une bonne stratégie : jamais ils ne prennent le
hir à l'étape n. Bien sûr, lors de la première étape, risque de perdre quoi que ce soit et, lorsqu7ilspeu-
une stratégie doit s'appliquer sans aucune infor- vent faire une vacherie, ils n'y manquent pas. Il
mation sur l'entité adverse. ne faut pas confondre deux objectifs différents :
Dans la règle du jeu, il n'est pas possible de <<faire de bons scores))et (<battretout le monde» ;
renoncer à jouer une partie. et le nombre de par- ceux qui jouent la stratégie MÉCHANTE se trom-
ties dans une confrontation n'est pas connu à pent en croyant jouer une stratégie qui donne de
l'avance. Si ce n'était pas le cas, on tomberait bons scores : ils battent tout le monde. mais
dans une situation où un autre paradoxe, appelé obtiennent de mauvais scores!
paradoxe de la surprise (ou du pendu) s'applique- Maintenant, si par meilleure stratégie on
rait : «Sije sais qu'il y a exactement dix parties à entend une stratépie " L
aui fasse le meilleur score
jouer, d'après le raisonnement vu tout à l'heure, à possible face à toute autre stratégie, alors main-
la dixième, j'ai intérêt à trahir, ainsi que mon tenent la réponse est non : il n'y a pas de meilleure
adversaire. En fait. notre intérêt individuel est stratégie. Supposons qu'il y ait une meilleure
patent ;c'est donc comme s'il n'y avait pas de par- stratégie dans ce sens-là, alors nécessairement
tie numéro 10. Mais alors. c'est la partie numéro elle doit trahir au premier coup, car, confrontée à
9 qui est la .vraie)) dernière partie, et donc nous la stratégie MÉCHANTE,c'est ce qu'il faut faire, et
devons trahir à la partie numéro 9, etc.. si on ne trahit pas dès le premier coup, on ne peut
Lorsqu'une confrontation a eu lieu, on peut pas rattraper le handicap du premier coup ; mais
mesurer le score des deux adversaires en addi- si cette stratégie trahit au premier coup, alors
tionnant les résultats de chaque partie. Sur une face à RANCUNIERE, elle ne fait pas le meilleur
confrontation de 1 000 parties avec les coeffi- résultat possible, puisqu'elle fait moins bien que
cients T = 5, D = O, C = 3 , P = 1,le gain maximum la stratégie GENTILLE et que là encore le handi-
est de 5 000 et le gain minimum de O, et c'est effec- cap est irrattrapable, car RAXCUNIERE par défi-
tivement ce qu'obtiennent respectivement les nition ne pardonne jamais. En clair, une stratégie
stratégies MÉCHANTE et GENTILLE quand elles sera bonne, face à certaines et mauvaise face à
s'opposent, car leur confrontation donne [t,cl [t,cl d'autres, et cela est inévitable, car on ne peut pas
[t,CI...,ce qui rapporte T = 5 à la première et D = O savoir à l'avance à aui on a affaire.
à la seconde pour chaque partie. Deux stratégies On mesure encore mieux la difficulté de com-
GENTILLE l'une contre l'autre obtiennent 3 000, parer dans l'absolu les stratégies en remarquant
deux MÉCHANTE l'une contre l'autre doivent se qu'il existe des triplets de stratégies tels que : la 1
contenter du score de 1000 chacune. bat la 2, la 2 bat la 3, la 3 bat la 1.Voici un exemple
d'un tel triplet non transitif :
PÉRIODIQUE-~IÉCHANTE : je joue périodique-
Meilleures stratégies ? ment : trahir, trahir, coopérer, trahir, trahir,
Maintenant que les règles sont clarifiées, la coopérer, etc.
question posée est : y a-t-il une meilleure straté- PÉRIODIQUE-GENTILLE : je joue périodique-
gie? Tout dépend de ce qu'on entend par meilleure ment : coopérer, coopérer. trahir, coopérer, coopé-
stratégie. rer, trahir, etc.
Tout d'abord. si par meilleure stratégie, on MAJORITÉ-MOU :je compte le nombre de tra-
entend une stratégie qui n'obtient jamais, dans hisons de l'autre et le nombre de coopérations, et
une confrontation, un score plus faible que celui je joue ce que l'autre a choisi en majorité ; au pre-
de son adversaire, alors la réponse est oui, la stra- mier coup, ou lorsqu'il y a le même nombre de
tégie MÉCHANTE est la meilleure. Dans chaque coopérations que de trahisons, je coopère.
partie, elle obtient au moins a u t a n t que son En exploitant la même idée, on construit des
adversaire, et donc, au total, elle obtient au moins ensembles de ce genre avecN stratégies au lieu de 3.
autant que son adversaire. Toutefois, être la De même, il existe des hiérarchies infinies de straté-
meilleure en ce sens-là n'est pas très intéressant, gies SI, S2,S3, ..., Sn. ..., avec S2 plus fort que S I ,
car, à moins de trouver beaucoup de stratégies S 3 plus fort que S 2 , etc. En voici un exemple :
naives, on risque de faire de petits scores en STRATÉGIESn :je joue périodiquement : tra-
moyenne, en particulier contre RANCUNIERE et hir 12" - 1)fois, puis coopérer une fois, puis trahir
DONNANT-DONKAKT. MECHANTE ne se fera (2" - 1)fois, puis coopérer une fois, etc.
1 GENTILLE 7 PERIODIQUE GENTILLE
JE COOPERE TOUJOURS JE JOUE COOPERER COOPERER TRAHIR
COOPERER COOPERER TRAHIR.
COOPERER COOPERER TRAHIR, ETC
.' 3 LUNATIQUE
JE TRAHIS UNE FOIS SUR DEUX
AU HASARD
9 MEFANTE
JE TRAHIS A L A PREMIERE PARTIE
PUlS JE JOUE CE QU'A JOUE MON
ADVERSAIRE A LA PARTIE PRECEDENTE
4 DONNANT-DONNANT
JE COOPERE A LA l e PARTIE JE JOUE CE QUE LADVERSAIRE A JOUE
PUlS JE JOUE CE QU A JOUE EN MAJORTE EN CAS D'EGALITE,
LAUTRE A LA PARTE PRECEDENTE ET A LA PREMIERE PARTIE, JE TRAHIS
11 SONDEUR,:
5 RANCUNIERE AUX 3 PREMIERES PARTIES JE JOUE
JE COOPERE MAIS DES QUE TRAHIR COOPÉRER COOPÉRER. SI, AUX
MON ADVERSAIRE A TRAHI PARTIES 2 ET 3. L'ADVERSAIRE A
JE TRAHIS TOUJOURS COOPERE, JE TRAHIS TOUJOURS,
SINON JE JOUE DONNANT-DONNANT
6 PERIODIQUE MECHANTE 12 DONNANT-DONNANT-DUR :
JE JOUE TRAHIR TRAHIR COOPERER JE COOPERE, SAUF
TRAHIR TRAHIR COOPERER SI MON ADVERSAIRE A TRAHI
TRAHIR TRAHIR COOPERER ETC LORS DE L'UNE DES DEUX PARTIES
PRECEDENTES
2. DOUZE STRATÉGIES
POSSIBLES parmi une
infinité. On a représenté
sur le tableau du bas les
résultats de 1 000 confron-
tations un contre un. Par
exemple, la confrontation
de ~ ~ É C H A N Tcontre
E DON-
NANT-DONNANT donne la
suite de parties [t, cl [t,tl [t, ~.PÉRIODIQUE-
...,
t ] [t, t ] [t,tl, c'est-à-dire 5 GENTILLE
+ 999 x 1 = 1 004 pour
MÉCHANTE, e t O + 999 x 1
pour DONNANT-DONNANT.
Dans une partie [t, cl, celui
qui a t r a h i gagne cinq
points, e t celui qui a
coopéré (et s'est donc fait
rouler) gagne O point ; dans
une partie [c, cl, chaque
joueur gagne trois points
e t , dans l a p a r t i e tt, t l ,
chaque joueur gagne un
point.
92 LOGIQUE, INFORMATIQGE ET PARADOXES
Même s'il n'y a donc pas de stratégie meilleure confrontations deux par deux ne permettent pas
dans l'absolu, il est évident que toutes les straté- de distinguer ce qu'est une bonne stratégie d'une
gies ne se valent pas : certaines sont visiblement mauvaise, organisons une confrontation générali-
trop gentilles, d'autres semblent trop suscep- sée : prenons un ensemble de stratégies et faisons
tibles, d'autres trop peu réactives, etc. Puisque les combattre chacune d'elles contre toutes les
autres. En mesurant les scores cumulés de cha-
cune, nous classons les stratégies en fonction de
leurs scores cumulés. Bien sûr, il faut faire cette
Scores dans une confrontation simulation avec un ordinateur. Sur les figures 2
généralisée avec des combats et 3, on a indiqué les résultats de telles confronta-
de 1 000 parties tions. Ils ont été obtenus par un programme de
Ph. Mathieu - écrit en C - et que nous pouvons
Classement et scores faire parvenir aux lecteurs intéressés.
dans une confrontation généralisée Le résultat dépend de l'ensemble des straté-
des 12 stratégies gies qui se sont affrontées : une stratégie bonne
dans un certain «environnement»peut être mau-
DONNANT-DONNANT (30 8901, MAJORITÉ-MOU (30 5271, vaise dans un autre environnement : sur la figure
RANCUNIÈRE (28 045), SONDEUR (27 5071, PÉRIODIQUE- 3, nous avons indiqué le classement obtenu par les
GENTILLE (27 320), DONNAKT-DONNANT-DUR (27 3091, stratégies lorsqu70nfait varier l'environnement
GENTILLE (25 506), LUNATIQUE (24 336), MÉFIANTE (22 (c'est-à-dire l'ensemble des stratégies opposées).
925), MAJORITÉ-DUR (22 0661, MECHANTE (22 0221, PÉRIO-
DIQUE-MÉCHANTE (2 1 210). Le succès du DONNANT-DONNANT
***
Classement et scores La stratégie DONNANT-DONNANT ne gagne
dans une confrontation généralisée pas toujours. Cependant, elle est toujours très
quand on enlève RANCUNIÈRE bien placée. Est-ce un hasard? Non, et en fait c'est
là le résultat fondamental découvert par R. Axel-
rod. Celui-ci a organisé une série de concours en
DONNANT-DONNANT (27 897), MAJORITÉ-MOU (27 4291,
demandant à différents scientifiques de disci-
PÉRIODIQUE-GENTILLE (27 0021, SONDEUR (26 571), DON-
plines variées de lui proposer des stratégies, qu'il
NANT-DONNANT-DUR (24 293), LUNATIQUE (24 1861, GEN- a fait combattre les unes contre les autres. R. Axel-
TILLE (22 4911, MÉFIANTE (21 924), MÉCHANTE (21 004~, rod a alors compris les qualités extraordinaires de
MAJORITÉ-DUR (20 9231, PERIODIQUE-MÉCHANTE (20 DONNANT-DONNANT, qui lui avait été proposée
505). par Anatol Rapoport, professeur de psychologie à
*** l'université de Toronto, et auteur d'un livre sur le
dilemme des prisonniers.
Classement et scores Les résultats de R. Axelrod, dans la mesure
dans une confrontation généralisée où ils mettent en jeu de nombreuses stratégies
quand on enlève très différentes et dont certaines sont très élabo-
PÉRIODIQUE-GENTILLE rées, constituent presque une preuve de la supé-
riorité de DONNANT-DONNANT sur toute autre
MAJORITÉ-MOU (28 883), DONNAIT-DONNANT (28 3241, stratégie, lors de confrontations généralisées. Le
SONDEUR (25 113), RANCUNIÈRE (25 3521, DONNANT- résultat est remarquable et assez inattendu, car
DONNANT-DUR (23 9991, GENTILLE (23 507), MAJORITÉ- il montre que les plus élaborées des stratégies ne
DUR (20 5131, MÉFIANTE (20 2531, LUNATIQUE (19 0201, peuvent rien contre la réactivité et la simplicité
MÉCHANTE (18 3851, PERIODIQUE-MÉCHANTE (17 881) de DONNANT-DONNANT. 11 montre aussi qu'être
méchant dans un tel jeu n'est pas une bonne idée,
3. LES SCORES CUMULÉSde la figure 2 montrent que
contrairement à ce que suggère le dilemme
DONNANT-DONNANT arrive en tête dans une confronta- simple des prisonniers. Dans un concours pre-
tion généralisée des 12 stratégies. Lorsqu'on change n a n t en compte 63 stratégies, R. Axelrod a
l'environnement,par exemple en supprimantune straté- constaté que le classement des méchantes (celles
gie (il y a 12 façons de le faire) et en organisant une
confrontation généralisée entre les 11 stratégies res- à qui il arrive de trahir en premier) était presque
tantes, DONNANT-DONNAhT arrive en tête 10 fois sur 12. toujours mauvais, alors que celui des gentilles
Les deux fois où DONNANT-DONNANT n'est pas en tête,
c'est MAJORITÉ-MOU qui gagne. DONNANT-DONNANT est (qui ne trahissent jamais en premier) était
meilleure en moyenne. presque toujours bon : même dans un environne-
ment d'égoïsme général, sans autorité supérieure de DONNANT-DONNANT, que vous établirez sans
de contrôle, il est plus payant de prendre le risque peine, est que jamais vous ne pouvez le battre de
de coopérer que de profiter de ceux qui vous font plus de 5 points, quelles que soient la longueur de
confiance. la confrontation et les ruses que vous employez.
Le succès de DONNANT-DONNANT confirme La morale (car c'en est bien une!) du succès de
aussi magnifiquement ce que nous mentionnions DONNANT-DONNANT est : fa) il vaut mieux être
précédemment sur les stratégies qui ne perdent gentil que méchant ; (b) il est nécessaire d'être
jamais contre aucune autre. En effet, dans une réactif: ne pas réagir aux trahisons de l'autre ne
confrontation avec une autre stratégie, DON- peut que l'encourager à recommencer ; (c) il faut
NANT-DONNANT ne gagne jamais! Au mieux, elle pardonner rapidement : perdre définitivement
fait un score égal à celui de l'adversaire, mais, en confiance en son adversaire dès qu'il a trahi
aucune circonstance elle ne peut le dépasser. (comme le fait RANCUNIERE) empêche l'installa-
DONNANT-DONNANT oblige l'autre à coopérer, tion de toute coopération ultérieure et est donc
parce que toute différence de score dans une nuisible ; (dl il ne sert à rien de trop ruser, car la
confrontation se paie par une baisse des deux clarté du comportement est ce qui est le plus sus-
scores : face à DONNANT-DONNANT, vous avez le ceptible de conduire à une coopération mutuelle
choix entre coopérer - ce qui est bon pour vous prolongée et profitable.
deux -, ou essayer de duper l'adversaire - ce qui Que se passe-t-il lorsqu'on modifie la durée
est mauvais pour vous deux. Une autre propriété des confrontations ou lorsqu'on modifie les coeffi-
4. POUR TESTER la robustesse de DONNANT-DONNANT, gies. On s'arrange pour que l'effectif total reste 1 200. De
on a simulé un processus d'évolution d'une population génération en génération, les effectifs évoluent jusqu'au
de 1 200 stratégies. Au départ, on prend 100 stratégies de moment où il ne reste plus que des stratégies qui coopè-
chacun des 12 types décrits à la figure 1. Une confronta- rent tout le temps entre elles : la coopération s'est instal-
tion généralisée entre les 1200 stratégies est simulée. Le lée. A partir de là, toutes les stratégies obtiennent le
score de chaque stratégie est calculé, ce qui détermine même score :il y a donc une stabilisation des effectifs. A
les nouveaux effectifs pour chacun des 12 types de straté- la stabilisation, DOW.kNT-DONNANT est en tête.
94 LOGIQUE, INFORJIATIQL'E ET PARALIOXES
ONNANT-DONNANT -DUR
5. ON UTILISE LE MÊME PRINCIPE que pour la figure 4, que des gentils, l'évolution des effectifs se pousuit aléatoi-
mais, à chaque génération, on .'tue. au hasard 50 straté- rement :il se produit un phénomène de dérive. Le schéma
gies parmi les 1 200, comme pourraient le faire des acci- représente une telle dérive se terminant par la victoire
dents aléatoires. Comme précédemment, les méchants de X~JORITÉ-MOU.D'autres simulations donnent DON-
disparaissent assez rapidement, mais lorsqu'il ne reste NAYT-DONNANT comme vainqueur.
1000 1 O00
800 LL 800
600 600 NANT-DONNANT
400 400
200 200
n O
6. ON CONSIDÈRE UNE POPULATION de 1 000 straté- DONSANT ne sont pas assez nombreuses pour envahir les
gies, composée de 50 DONNANT-DONNANT et de 950 MECHANTE. En revanche, si, au départ, on place 100 DON-
BIÉCHANTE, qu'on fait évoluer comme à la figure 4 (sauf NANT-DONNANT et 900 I~IÉcK.~sTE, alors les &CHANTE se
que les confrontations sont de dix parties). Les DONNAn'T- font envahir.
individus qui meurent (d'accident!). On voit alors - La stratégie MECHANTE ne peut pas être
apparaître des dérives : certaines stratégies qui envahie par une stratégie isolée (comme il pour-
n'ont pas de chances disparaissent (victimes plus rait en apparaître une par mutation dans une
que d'autres des accidents), d'autres au contraire population composée uniquement de MÉCHANTEI.
accroissent leurs effectifs,profitant des trous lais- On dit que la stratégie ilIECH,hVTE est collective-
sés par les malchanceuses. Un peu de calcul de ment stable.
probabilités montre d'ailleurs que, si l'on intro- - En revanche. un bloc de plusieurs straté-
duit un aléa de ce type, alors, au bout d'un temps gies DONNANT-DONNANT apparaissant brusque-
fini, une seule stratégie reste en course (et ce n'est ment peut envahir une population composée uni-
pas toujours DONNANT-DONNANT).Une évolution quement de MÉCHANTE luozr la figure 6).
de ce type est illustrée sur la figure 5. - Une stratégie réactive (c'est-à-dire qui
répond assez vite à toute trahison) est toujours
collectivement stable, et en particulier DON-
La coopération s'impose
NAUT-DONNANT est collectivement stable.
Ces simulations, qui reproduisent les résul- -Une stratégie gentille - qui coopère en pre-
tats de R. Axelrod. doivent lu tôt être considé- mier - doit réagir à la première trahison de
rées comme des exiériences 'de calcul d'équilibre l'autre pour être collectivement stable.
écologique que comme des expériences de simula- - Si une stratégie est gentille et collective-
tion de l'évolution. car aucune nouvelle stratégie u
ment stable, alors elle ne peut pas être envahie,
ne peut apparaître : l'aspect créatif de l'évolution même par un bloc.
par variation-sélection n'est pas modélisé ici. Ces résultats mettent en évidence une dissy-
Malgré tout, la confirmation que la coopération métrie entre la stratégie hIECJ3ANTE et les straté-
apparaît et s'impose, est remarquable, et fournit gies du type DONNANT-DONNANT (réactive et
une nouvelle façon de comprendre pourquoi des gentille) : elles sont toutes collectivement stables,
individus peuvent se mettre à coopérer tout en mais seules celles du type DONNANT-DONNANT
poursuivant des buts parfaitement égoïstes et ne se laissent pas envahir par des blocs d'enne-
sans qu'aucune autorité supérieure les y force. mis. Pour les coefficients choisis et des confronta-
Les techniques d'algorithmes génétiques ont per- tions de dix parties, on montre que, si plus de 1/17
mis des simulations d'évolution avec mutations de DONNANT-DONNANT apparaît soudain dans
et crossing-over,elles confirment la robustesse de une population composée uniquement de
DONNANT-DONNANT (voir Pour la Science, sep- LIÉCHANTE, alors cette population se fera com-
tembre 1992, pp. 44-51 et 101-103). plètement envahir. En revanche, si le bloc de
Une étude mathématiaue de la manière dont DONNANT-DONNANT qui apparaît est plus petit, il
une stratégie en envahit une autre dans une évo- sera détruit (voir la figure 6). Pour des confronta-
lution donne les résultats suivants, qui vérifient tions de 1 000 parties, le 1/17 devient 111997.
et éclairent les simulations précédentes (ces R. Axelrod aidé de W.D. Hamilton, professeur
résultats, qui ne sont valables que lorsque le de biologie évolutive à l'Université d'Am Arbor, a
nombre de ~ a r t i e dans
s chaaue confrontation est appliqué les analyses tirées de ses simulations
assez grand, sont démontrés dans le livre de R. informatiques et de ses résultats mathématiques
Axelrod). à la théorie de l'évolution. Les cas de coopération
96 LOGIQUE, INFORIMATIQL'E ET PARADOXES
entre individus ou entre espèces posent des pro- tages sélectifs dans le monde biologique, ce qui
blèmes délicats aux théoriciens de l'évolution. et est contraire à l'idée parfois soutenue que l'appa-
il est clair que les mécanismes mis à jour par rition de l'intelligence et la complexification des
R. Axelrod aident à comprendre ce qui se passe ou êtres vivants sont purement fortuites. DONNANT-
ce qui s'est passé lors de la constitution des asso- DONNANT est une stratégie simple qui ne néces-
ciations coopératives stables observées dans le site pas d'intelligence pour être appliquée contre
monde biologique. une entité à la fois. En revanche, un être faisant
de multiples rencontres doit pouvoir identifier à
qui il a affaire pour poursuivre simultanément
Complexité et intelligence avec de nombreuses entités différentes les par-
En effet, la conclusion : ((dansun environne- ties de dilemme itéré des prisonniers, et cela sup-
ment d'égoïsme sans autorité supérieure, la pose chez lui un développement avancé de ces
coopération peut s'installer durablement* reste capacités cognitives, autrement dit cela suppose
vraie, même si les entités ne sont pas intelli- chez lui de la complexité et de l'intelligence.
gentes: chez les êtres microscopiques inférieurs, Dans le même ordre d'idée, une variante
les stratégies peuvent très bien être program- amusante du jeu du dilemme itéré des prison-
mées par réflexe et ne résulter que de méca- niers a été envisagée par R. Axelrod, dans
nismes physiques et chimiques élémentaires. laquelle les entités qui s'opposent peuvent
Pour que la coopération s'instaure, il suffit qu'il y appliquer différentes stratégies selon une
ait continuité dans les confrontations : les parties maraue au'elles identifient sur les entités avec
L 1
doivent durer assez longtemps, les mêmes entités lesquelles elles sont confrontées. Imaginons, par
restant face à face pendant des durées suffi- exemple, qu'il y ait deux marques possiblesA et
santes. Cette condition de continuité dans les B et que les A jouent la stratégie MÉCHAKTE
confrontations peut ê t r e obtenue p a r des avec les B et la stratégie DONNANT-DONNANT
contraintes physiques ou topographiques ; en avec les A, alors qu'à l'inverse les B jouent la
particulier, on observe fréquemment des phéno- stratégie MÉCHANTE avec les A et la stratégie
mènes coopératifs chez les individus des espèces DONNANT-DONNANT avec les B. 11 se passera
territoriales qui sont à même d'avoir des confron- alors le phénomène suivant : les A coopéreront
tations prolongées. En revanche, pour que des entre eux, les B coopéreront entre eux, mais, à
entités mobiles puissent mener des parties pro- chaque fois qu'un A rencontrera u n B, ils se
longées du dilemme itéré des prisonniers, il leur déchireront. Pire, si un A décidait de jouer la
faut de bonnes capacités d'identification. Si elles stratégie DONNANT-DONNANT avec tout le
les possèdent, elles peuvent alors mener simulta- monde, il le paierait très cher, car les B, refusant
nément plusieurs confrontations conduisant à de coopérer, l'exploiteraient.
des coopérations ou à des trahisons selon les par- Un tel univers constitué par les deux groupes
tenaires rencontrés, ce qui permet aux phéno- de A et de B serait donc le lieu d'un conflit perma-
mènes évolutifs simulés précédemment de se nent et im~ossibleà faire cesser. Aucun n'est lus
dérouler rapidement, produisant l'élimination méchant que l'autre, mais chaque interaction des
des entités non coopérantes et la multiplication A avec les B confirme les uns et les autres dans le
des autres. préjugé que «seuls ceux de mon camp sont bons et
Cette dernière remarque autorise d'ailleurs à que les autres sont méchants.. Ce genre de situa-
dire que la complexité et l'intelligence favorisent tion ne rappelle-t-il pas ce qui se passe ici ou là
la coopération ; elles constituent donc des avan- dans le monde?
L'altruisme perfectionné
F
aut-il renoncer aux bénéfices de possibles cas, qu'on notera [t, cl, le gain pour la tribuA qui
coopérations futures parce que votre parte- a trahi (trahison notée t ) est de T = 5, et pour la
naire vient de vous jouer un mauvais tour? tribu B qui s'est fait duper D = O (une pièce de
Faut-il attendre qu'il ait exploité deux fois votre gibier a été perdue à cause de l'interruption pré-
gentillesse avant de réagir? Au contraire, après maturée de la chasse). Si les A coopèrent et si les
une réprimande ou un dédommagement, n'est-il B trahissent, cas [c, t ] ,bien sûr les gains de
pas plus intéressant de renouer? chaque tribu sont inversés. Les jours où les deux
Ces questions semblent trop générales, car tribus cherchent à trahir simultanément, parties
les réponses dépendent du contexte. Cependant notées [t, tl, il en résulte une bagarre qui nuit à la
ces questions peuvent être rendues claires et pré- chasse, en conséquence de quoi chaque tribu est
cises et donner lieu à des expérimentations infor- punie et ne gagne que P = 1. En résumé : [c, cl
matiques. Leurs résultats inattendus consti- donne 3 et 3 ; [t, cl donne 5 et O ; [c, t] donne O et 5 ;
tuent des enseignements dont on est tenté de et [t,tl donne 1 et 1.
croire qu'ils pourraient être pris en compte par Déterminer comment, jour après jour, il faut
les humains et, plus encore, par les nations. se comporter avec son partenaire, en fonction de
Dans un article du mois de novembre 1992 de ce qu'il a fait dans le passé constitue le dilemme
Pour la Science, nous avions proposé aux lecteurs itéré des prisonniers. Des expérimentations infor-
un jeu sur ce thème. Ce jeu a mis à notre disposi- matiques, dont les premières furent réalisées il y
tion un ensemble varié de comportements pos- a une dizaine d'années par Robert Axelrod, de
sibles pour étudier la coopération et la récipro- l'université du Michigan, permettent d'étudier
cité. Cela nous a permis d'explorer une variante ce dilemme. Ces expérimentations, qui font inter-
du dilemme itéré des prisonniers dont voici les venir de nombreuses idées différentes, montrent
règles. qu'une très bonne stratégie est celle appelée TIT-
FOR-TAT ou D O K N A N T - D O N N A N T ; quand
j'applique DONNANT-DONKANT, à la première
Le dilemme itéré des prisonniers partie je coopère ; ensuite, je fais ce que l'autre a
Dans une savane éloignée vivent proches fait à la partie précédente : s'il a trahi à la partie
l'une de l'autre deux tribus de chasseurs, les A et n , je trahis à la partie n + 1. s'il a coopéré à la par-
.
les B. C h a a u e "iour, elles vont à l a chasse tie n , je coopère à la partie n + 1.
ensemble et peuvent donc coopérer toute la jour- Les résultats rapportés dans le chapitre 11
née?auquel cas elles ramènent en tout six pièces montrent que les stratégies qui réussissent ont tou-
de gibier qu'elles se partagent. Une telle journée jours les propriétés suivantes : elles sont gentilles
est notée [c, cl où la lettre c indique la coopération ; - c'est-à-dire ne prennent jamais l'initiative de la
le gain est, pour chaque tribu, C = 3. Il se peut que trahison- et elles sont réactives -c'est-à-dire adap-
la tribu A choisisse d'exploiter la tribu B, par tent leur comportement à celui de l'adversaire.
exemple en lui subtilisant du gibier et en se sau- La situation modélisée par le dilemme est
vant, ce qui écourte la journée de chasse. Dans ces typique des problèmes de coopérations entre enti-
98 LOGIQUE, INFOR.i.i.4TIQCE ET PARADOXES
Il est parfois utile de renoncer Certains lecteurs ont aussi discuté le fait que
le renoncement soit définitif. Cette règle est bien
Certains lecteurs ont soutenu que la variante sûr simplificatrice, mais c'est elle aussi qui rend
proposée ne présentait pas d'intérêt, car, d'après le problème intéressant. En effet, si l'on acceptait
eux, celui qui gagnerait n'utiliserait pas l'oppor- que le renoncement soit temporaire, alors nous
tunité de renoncer, et donc le jeu-concours se
aurions un jeu où, à chaque étape, nous pourrions
ramenait au problème classique du dilemme itéré
choisir trois options. Pourquoi pas quatre options,
des prisonniers dans lequel le renoncement n'est
ou même encore plus? De tels jeux ont déjà été
pas autorisé. étudiés et rien de très clair n'a été obtenu. La dis-
Il nous semble pourtant tout à fait évident symétrie que nous avions retenue entre l'option
que renoncer est utile dans certains cas, comme renoncer et les autres était délibérée, et c'est
lorsqu'on se trouve face à quelqu'un qui trahit parce qu'il nous semblait qu'elle préservait bien
sans arrêt (stratégie proposée par deux lecteurs) : la structure du dilemme classique, en la générali-
il vaut mieux gagner deux points par partie - ce sant légèrement, que nous étions persuadés
que donne le renoncement -, que gagner un point qu'elle conduirait à des résultats intéressants, ce
par partie - ce qui est le mieux qu'on puisse faire
qui s'est révélé vrai.
face à celui qui trahit toujours si l'on ne renonce Nous avons reçu 104 propositions de straté-
pas. Les résultats obtenus ont confirmé que le gies provenant de France en majorité, mais aussi
renoncement était utile. du Canada, du Burundi, et d'autres pays étran-
D'abord, si l'on reprend les 12 stratégies de
gers. Certaines, neuf, malheureusement, n'ont
l'article de novembre en y ajoutant DONNANT- pas pu être programmées, car elles étaient incom-
DONNANT-AVEC-SEUIL, c'est ce dernier qui gagne.
plètes ou parce que, malgré nos efforts, nous
Il est donc meilleur que DORNmT-DONNANT sim- n'avons pas réussi à les comprendre.
plement, parce qu'il diffère de lui en renonçant Une proposition a dû être écartée pour un
parfois. Ensuite la meilleure des stratégies du motif un peu spécial. Un de nos collègues, Eric
concours n'utilisant pas le renoncement est clas- Wegrzynowski, nous a proposé une stratégie par-
sée 16e.
posé u n e stratégie qu'il suggérait d'appeler Nous nous sommes d'ailleurs demandé si ce
JÉSUS : j e coopère toujours ; lorsqu'on me trahit nombre étonnant de stratégies presque iden-
une fois, je continue à coopérer - je tends l'autre tiques et peu susceptibles de gagner ne résultait
joue ; mais si on me trahit une deuxième fois, je pas d'une subtile tentative de tricherie : ces stra-
renonce. Son classement est 4ge. tégies favorisent peut-être une autre stratégie, et
Une dizaine de stratégies semblent chercher à ont peut-être été envoyées par des compères.
faire renoncer leur adversaire en trahissant plu- Bien que certaines stratégies tirent profit de la
sieurs fois dans les premiers coups. Elles sont présence de ces incompréhensibles stratégies.
toutes classées dans les dernières et nous nous nous pensons qu'il n'y a pas eu tricherie et, en
sommes demandés si certains des lecteurs tout cas, que cela ne change pas le gagnant. En
n'avaient pas essayé d'élaborer la plus mauvaise effet, la stratégie gagnante est robuste : dans une
stratégie possible! Il semble prévisible que trahir confrontation où les stratégies suspectes sont
plusieurs fois a u début ne peut que donner des retirées, elle gagne encore.
résultats catastrophiques, puisque cela compromet Il n e fait aucun doute par ailleurs que ce
l'instauration d'un régime stabilisé de coopérations genre de tricherie est possible. E n effet, nous
réciproques. De telles stratégies ne pourraient être avons fait l'expérience suivante : nous avons
bonnes que dans un environnement de gentilles- ajouté aux stratégies des lecteurs une stratégie
non-réactives qu'elles réussiraient à exploiter. AIAITRE, e t neuf exemplaires d'une stratégie
ESCLAVE destinée à favoriser MAITRE et dont Cette stratégie synthétise plusieurs prin-
l'idée est de trahir très souvent au départ pour cipes élémentaires : - elle ne prend jamais l'ini-
décourager toutes les stratégies, sauf MAITREqui tiative de la trahison, c'est une gentille ; - elle
seule tire profit de ESCLAVE. renonce si elle obtient de trop mauvais résultats ;
MAITRE : je joue DONNAKT-DONNANT sauf si - elle est réactive (c'est une sorte de DONNANT-
l'adversaire a joué consécutivement une fois DONNANT) : elle entre dans une période de puni-
coopérer, 50 fois trahir, puis une fois coopérer, tion lorsqu'elle est t r a h i e en dehors de ses
auquel cas je trahis toujours. périodes de punition ; - elle est de plus en plus
ESCLAVE : je joue une fois coopérer, puis 50 sévère : sa première période de punition consiste
fois trahir, puis toujours coopérer. en une trahison, sa deuxième, en 1+ 2 trahisons,
Face à ESCLAVE, la plupart des stratégies se etc. ; - elle tente de calmer son adversaire après
découragent et renoncent avant le coup 50, obte- une période de punition en coopérant deux fois de
nant donc environ 2 000 points dans une partie de suite ; -elle est compréhensive : elle ne tient pas
1000 coups. De son côté, PILAITRE, qui, en quelque compte des réactions de son adversaire pendant
sorte, reconnaît ESCLAVE, obtient contre elle 3 + O les périodes de punition (nous allons voir qu'en
+ 49 x 1+ 949 x 5 = 4 797, ce qui constitue donc un réalité c'est un défaut).
avantage substantiel. Bien que la stratégie LA-DEUXIEME : je joue successivement cinq
PIMITRE ne soit pas très astucieuse (et en particu- coups de chacune des stratégies DONNANT-DON-
lier ne renonce jamais), le panel obtenu en ajou- NANT, GENTILLE (toujours coopérer), RANCU-
tant MAITRE et ses neuf ESCLAVES aux 95 straté- NIERE (toujours trahir dès que l'autre a trahi),
gies des lecteurs est suffisamment faussé, en PÉRIODIQUE-GENTILLE (jouer périodiquement
faveur de MAITRE, pour qu'il gagne. Les ESCLAVE coopérer-, coopérer, trahir). J e calcule le score
qui se sont sacrifiés, eux, sont classés 92esur 105. moyen obtenu par les quatre derniers coups de
Sans ses esclaves, X M T R E est classée 50e. chaque série. ($) Si la meilleure moyenne est infé-
Cela illustre qu'on peut fabriquer des milieux rieure à 1,5,j7abandonne ; sinon je joue 12 coups
artificiels ajustés à certaines stratégies, et c'est de la meilleure. Sur la base des 12 derniers coups,
pour cela que nous avions interdit aux joueurs de je réévalue alors le score moyen de la stratégie
proposer plus d'une stratégie. jouée. Je retourne en (8).
Certains lecteurs ont baptisé leurs stratégies Cette stratégie prend l'initiative de trahir
de noms amusants : Soupe-au-lait-boudeur, - quand elle joue PÉRIODIQUE-GENTILLE- et donc
Caractérielle, Le thérapeute, Faut-pas-pousser, c'est une méchante, ce qui semble un désavan-
Donnant-donnant-pas-masochiste,Jésus, Don- tage. Son système de test et de choix est très astu-
nant-donnant-pas-poire, Donnant-donnant- cieux et compense ce risque pris en trahissant.
mauvais-perdant, Trois-partout-j'arrête, LA-TROISIEME : à l a première partie, je
Traître-mou, Holocauste III, Euclide, Contre- coopère et je suis calme. Lorsque je suis calme, je
pied, Optimiste-prudente... Certains noms de joue DONNANT-DONNANT, mais si mon adver-
concurrents ont aussi des consonances allusives. saire trahit, je m'énerve. Si je suis énervé et qu'il
Peut-être s'agit-il de pseudonymes? coopère, je coopère et redeviens calme, mais s'il
me trahit, je le trahis et deviens furieux. Lorsque
je suis furieux, je trahis toujours, sauf s'il trahit
Les trois meilleures 12 fois de suite, auquel cas je regarde s'il a trahi
Venons-en aux gagnants. Nous allons décrire plus souvent qu'il n'a coopéré. Si c'est le cas, je
les trois stratégies de tête, car elles obtiennent renonce, sinon je coopère, et je redeviens seule-
des résultats assez proches et utilisent toutes des ment énervé.
idées intéressantes. L'idée de cette stratégie est un peu plus diffi-
LA-MEILLEURE : je coopère au premier coup ; cile à comprendre. Cependant : -elle est gentille ;
tous les 20 coups, j'évalue mon score et si, en - elle est réactive, et même très sensible, car
moyenne, il est inférieur à 1,5, je renonce ; à elle s'énerve et devient furieuse facilement ;
chaque fois que l'autre me trahit, si je ne suis pas - lorsqu'elle est furieuse, elle tente d'exploiter
déjà dans une phase de punition, je rentre dans l'autre au maximum en trahissant toujours ; si
une phase de punition. Si N est le nombre de fois l'autre ne se laisse pas faire - ce qu'elle considère
où l'adversaire a trahi depuis le début du jeu en établi quand il a trahi 12 fois de suite -, alors elle
dehors des phases de punition, alors cette phase lui donne une dernière chance de coopération s'il
de punition comporte (1+ 2 + ... + N)= N(N + 1112 n'a pas été trop méchant dans le passé et, sinon,
trahisons, suivies de deux coopérations. elle renonce.
On constate que ce ne sont pas des stratégies de DONNANT-DONNANTet à la variété de ces per-
très simples qui gagnent. En revanche, les prin- fectionnements, comme il n'y en a pas quand il
cipes à la base de leur conception sont compré- s'agit des êtres vivants.
hensibles et ne recourent qu'à des considérations Etablir cette thèse dans l'absolu est sans
de bon sens. Le fait que ce soient trois stratégies doute très difficile, mais nous avons fait un pre-
assez différentes qui arrivent en tête prouve à mier pas en concevant plusieurs stratégies qui
notre avis que, comme cela se passe dans le auraient gagné si elles avaient joué. Envoici trois
monde vivant, plusieurs schémas d'organisation exemples :
différents sont viables. D'ailleurs la comparaison
avec le monde vivant peut être prolongée : - cer-
tains principes doivent absolument être respec-
tés : pour un être vivant, il faut réussir à tirer de LA MEILLEURE STRATÉGIE
l'énergie de son environnement, et disposer d'un
mode de reproduction efficace ; pour une straté- (A) JE COOPERE AU PREMIER COUP
(6)TOUS LES 20 COUPS J'EVALUE
gie, il faut être réactive et savoir renoncer ;- cer- MON SCORE ET SI EN MOYENNE,
taines idées sont mauvaises : chez les êtres IL EST INFÉRIEUR A I ,5 JE RENONCE
vivants, il n'y a pas de mammiferes à cinq pattes, (C)A CHAQUE FOIS QUE L'AUTRE
ME TRAHIT SI JE NE SUIS PAS DEJA
ni d'animaux ayant des roues à essieux ; chez les DANS UNE PHASE DE PUNITION,
stratégies, être méchant ou renoncer trop vite se JE RENTRE DANS UNE PHASE
révèle mauvais ; - certaines combinaisons de DE PUNITION SI MON ADVERSAIRE
principes de bon sens s'accordent bien ensemble, M'A TRAHI N FOIS (EN DEHORS
DES PHASES DE PUNITION) LA PHASE
d'autres non, et il n'est pas simple de deviner les- DE PUNITION DURE N ( N + 1)/2
quelles sans expérimentation. TRAHISONS ET EST SUIVIE DE DEUX
Une étude du classement montre que l'utili- COOPERATIONS
sation de la seule idée du SECIL (au-delà duquel
on renonce) ou du DONNANT-DONNANT ne suffi- 3. Les idées utilisées pour concevoir cette stratégie, qui
sait pas pour être dans les 40 premiers. En est la gagnante, sont toutes assez naturelles :renoncer si
revanche, la combinaison des deux idées (voir le les résultats sont insuffisants, réagir de plus en plus fort,
etc. C'est l'accumulation de plusieurs bonnes idées qui
DONNANT-DONNAUT-AVEC-SEUIL)imaginée par fait de cette version perfectionnée du DONNANT-DONNANT
de nombreux lecteurs donne, selon les para- la meilleure de toutes celles proposées par les lecteurs.
mètres retenus dans cette combinaison, un clas-
sement entre 7eet 47e.
Insistons sur l'intérêt du renoncement et de la
gentillesse. Parmi les 40 premières, seules deux
n'utilisent pas le renoncement (la 16" et la 37" et (A) JE JOUE SUCCESSIVEMENT 5 COUPS
seule une prend l'initiative de trahir (la 2"). DOïï- DE CHACUNE DES STRATÉGIES
NmT-DONNANT est classée 50e.Si, aux stratégies DONNANT-DONNANT, GENTILLE
des lecteurs, on ajoute les 12 de l'article de (TOUJOURS COOPÉRER). RANCUNIERE
(TOUJOURS TRAHIR DÈS QUE L'AUTRE
novembre (dont aucune ne renonce). .
., Deu de chan- A TRAHI), PERIODIOUEGENTILLE
gements en résultent et la meilleure des 12 straté- (JOUER ~ÉRIODIQUEMENTCOOPÉRER,
gies - qui est RANCUNIERE - est classée 4Se. COOPERER. TRAHIR).
(6) JE CALCULE LE SCORE MOYEN
La stratégie la plus compliquée en longueur OBTENU PAR LES 4 DERNIERS COUPS
de programme arrive 64e. Malgré cela, la règle DE CHAQUE SÉRIE.
qu'il faut être simple pour gagner ne semble pas (&)SI LA MEILLEURE MOYENNE
vérifiée : les trois premières stratégies utilisent EST INFERIEURE À 1.5, J'ABANDONNE.
SINON JE JOUE 12 COUPS
presque les 100 mots maximum que nous avions DE LA MEILLEURE SUR LA BASE
autorisés pour ceux qui ne programmaient pas DES 12 DERNIERS COUPS,
eux-mêmes leur stratégie. Aucune stratégie aussi JE REEVALUE ALORS LE SCORE MOYEN
simple que DONNmT-DONNmT n'est bien placée. DE LA STRATEGIEJOUÉE.
- -
JE RETOURNE EN (&).
Ces expériences montrent que - contraire-
ment à ce que les premières expérimentations sur
le dilemme itéré sans renoncement établissaient - 4. Le principe utilisé ici est très intéressant et original.
la stratégie D O N i ï m T - D O N N ~ Test susceptible L'idée est de faire un essai avec quatre stratégies simples,
d'étudier les résultats obtenus et de jouer la meilleure,
d'être perfectionnée. Vraisemblablement, il n'y a sauf si rien de bien n'a été obtenu, auquel cas on renonce
pas de limites aux perfectionnements possibles à jouer. Cette stratégie a obtenu la seconde place.
104 LOGIQUE, INFORII.ATIQL-E ET PARADOXES
donc environ 3 chances sur 100 que l'autobus soit sécurité informatique - de nombres premiers
celui du lycée mixte, et 97 chances sur 100 qu'il industriels.
soit celui du collège de garçons. Il est amusant de remarquer que l'article si
La version mathématique du problème, appli- important de R. Solovay et V. Strassen, qui intro-
quée, non a u sexe des occupants d'un autobus, duisait en 1977 la notion d'énoncé mathématique
mais à la primalité d'un nombre est la suivante. probablement vrai, illustre l'autre cause d'incer-
Imaginons que nous ayons établi qu'une cer- titude qui règne s u r le prétendu absolu des
taine fonction f(n, m) de deux variables n et m mathématiques. En effet, leur court article de
possède la propriété suivante. S i n est un nombre deux pages de 1977 comporte u n e e r r e u r de
premier, alors f(n, m) = OUI pour tout entier m démonstration. Cette erreur, signalée par le
compris entre 1et n - 1.Si n n'est pas premier - mathématicien Allan Borodin, obligea Solovay et
c'est-à-dire est le produit de deux entiers plus Strassen à publier, 11 mois plus tard, u n additif
grand que 1- alors fin, mi = NON pour la moitié de quelques lignes.
a u moins des entiers m entre 1 e t n - 1. Les Le problème de fond reste posé : en quoi le fait
nombres m pour lesquels fln, m) = NON sont des d'effectuer 20 tests et d'obtenir 20 fois OUI consti-
témoins de la non-primalité de n : si n est pre- tue-t-il une preuve? Ce qui donne un sens à ce
mier, il n'y a aucun témoin ; si n n'est pas pre- type de résultat - et fixe donc le sens de l'expres-
mier, u n entier sur deux au moins (parmi ceux sion preuve probabiliste -, c'est la notion d'algo-
compris entre 1et n - 1)est un témoin de la non- r i t h m e probabiliste à risque d'erreur borné
primalité de n. ( a p p e l é p a r f o i s algorithme d'Atlantic City).
Imaginons maintenant
que, pour 20 valeurs différentes
de m, choisies a u hasard entre 1
et n - 1,nous calculions fln, ml,
et que 20 fois nous ayons trouvé
fin, m) = OUI. S i n n'est pas pre-
mier, à chaque essai d'un cer-
tain nombre m, nous avons une
chance sur deux de tomber sur
u n témoin de non-primalité.
Donc si n n'est pas premier, au
bout de 20 essais, nous n'avons
qu'une chance sur 220 = 1 048
576 de n'être jamais tombés sur
u n témoin de non-primalité.
1/220valant à peu près 111 000
000, il semble naturel de dire
dans un tel cas que n est pre-
mier avec une probabilité de
99,9999 pour cent. En 1977, R.
Solovay et V. Strassen proposè-
rent une telle fonction fln, mi.
Notons a u s s i q u e l e s
- L AUTOBUS EST CELUI
DU COLLEGE DE GARÇONS
AVEC UNE PROBABlLlTE
nombres ((presque sûrement SUPERIEURE A I - 1 1 2 ~
premiers» qu'on trouve ainsi
jouent u n rôle essentiel dans
certains protocoles de crypto- - L'AUTOBUS EST CELUI
DU COLLÈGE MIXTE
graphie (comme le code RSA de
Rivest, Shamir et Adleman),
où on les utilise comme s'ils
étaient «vraiment premiers)). 1. On désire déterminer si l'autobus est celui du collège de garçons ou celui du
On parle parfois de nombres lycée mixte. Dans l'autobus du lycée mixte, on sait qu'un élève sur deux est une
moralement premiers ou - en fille. Si un passager féminin descend de l'autobus, alors on est sûr que l'auto-
référence à l e u r utilisation bus est celui du lycée mixte. La descente des cinq passagers masculins indique
que c'est l'autobus de l'école des garçons avec une probabilité qui est supé-
d a n s d e s a p p l i c a t i o n s à l a rieure à 1 - 112j.
ALGORITHMES ET PRELVES PROBABILISTES 107
.
inférieur à 111 000. On choisit
dix nombres m a u hasard entre
1et n - 1et l'on calcule f(n, m).
Deux cas sont possibles : (a) un
ou plusieurs des nombres m est
qu'on doive accepter l'idée que la notion de preuve donc, tout ce qui est démontrable par une preuve
mathématique dans son sens classique - large- probabiliste, peut aussi l'être par une preuve non
ment étudiée par les logiciens depuis un siècle - probabiliste classique. Il suffit, pour le démon-
ne recouvre pas toutes les notions possibles et rai- trer, de recenser tous les résultats possibles de
sonnables de preuve mathématique. l'algorithme probabiliste. Dans notre exemple
initial, si je note le sexe de tous les passagers de
l'autobus, je sais si l'autobus est celui du collège
Inutilité, dans l'absolu, de garçons ou celui du lycée mixte.
des preuves probabilistes Le malheur est que l'algorithme déterministe
La première question qui se pose toutefois est : qu'on obtient à partir de l'algorithme probabiliste
peut-on se passer des algorithmes probabilistes? est beaucoup moins rapide que l'ancien, et donc la
Autrement dit : tout problème oui-non ( p a r preuve non probabiliste aussi. Cela montre que,
exemple Q(n) : «n est-il premier?»), qui peut être si les notions d'algorithme probabiliste et de
résolu par u n algorithme probabiliste avec un preuve probabiliste ont un intérêt, cela ne peut
risque d'erreur inférieur à un nombre donné, être que dans le cadre d'une théorie qui tient
peut-il être résolu avec un algorithme détermi- compte de la complexité des calculs et de la lon-
niste (n'utilisant donc pas de tirage à pile ou face) gueur des démonstrations.
et donnant le résultat sans risque d'erreur?
La réponse, OUI, a été démontrée en 1956 par Complexité des calculs
K. de Leeuw, E. Moore, C. Shannon et N. Shapiro :
si l'on ne tient compte que de la possibilité dans Illustrons cette idée sur les nombres pre-
l'absolu de résoudre un problème de type OUI- miers. Déterminer si un nombre est premier est
EOX par algorithme, il est possible de se passer en principe facile : il suffit de faire toutes les divi-
complètement des algorithmes probabilistes, et sions par les nombres compris entre 2 et n - 1. On
~ e u at m é l i o r e r l'algo-
TÉMOINS DE NON-PRIMALITÉ DE G.L. MILLER hthme en ne considérant
SOlT N UN NOMBRE ENTIER IMPAIR. ON CHERCHE À DÉTERMINERSI N EST PREMIER. aue les nombres entre 2 et
(LA NOTATION (PMOD N) = /SIGNIFIE QUE P - I EST DIVISIBLE PAR N. la racine carrée de n (en
EXEMPLE : ( 1 3 MOD 5) = 3). effet, les diviseurs d'un
1. ON ÉCRIT N - 1 SOUS LA FORME U . ~ ~ A V EUIMPAIR.
C POUR CELA, ON DIVISE N - 1 nombre vont toujours par
PAR 2 JUSQUATOMBER SUR UN NOMBRE IMPAIR. deux /pq = n), e t donc si
EXEMPLE : N = 45, N - 1 = 44 = 2.2.1 1 . DONC U = I l ET K = 2 . l'un e s t plus g r a n d q u e
2. SOlT M U N ENTIER COMPRIS ENTRE 1 ET N - 1 . ON POSE : racine carrée de n. l'autre
F(N,M) = OUI SI [ { M UMOD N) = 2 1. est plus petit, et donc fina-
OU S'IL EXISTE UN NOMBRE /COMPRIS ENTRE 1 ET K - 1
TEL QUE : {MU 2' MOD N) = - i l ,
lement, si n n'est pas pre-
F(N,M) = NON SINON. mier, il possède u n divi-
M EST ALORS UN TÉMOIN DE NON-PRIMALITÉ DE N. seur inférieur ou égal à la
racine carrée de n).
Si n est un nombre de
m chiffres, tester s a pri-
ALGORITHME PROBABILISTE POUR SAVOIR, AVEC UN RISQUE D'ERREUR malité par divisions suc-
INFÉRIEUR À 111 000 000, SI UN NOMBRE N EST PREMIER
cessives nécessite environ
1. CHOISIR ALÉATOIREMENT20 NOMBRES rn ENTRE 1 ET n - 1 ET CALCULER f(n,rn) n, c'est-à-dire, approxima-
POUR CHACUN D'EUX : tivement. 10m divisions.
2. SI f(n,rn) = NON UNE FOIS OU PLUS (C'ESTADIRE SI L'UN DES m EST UN TÉMOIN Avec l'amélioration résul-
DE NON-PRIMALITÉ POUR n), ALORS RÉPONDRE : tant de notre remarque, il
N EST CERTAINEMENT COMPOSÉ ne faut plus que 10m12,soit
environ (3,16)mdivisions,
3. SI f(n,rn) = OUI POUR LES 2 0 NOMBRES CHOISIS, ALORS RÉPONDRE :
ce qui correspond encore à
N EST PREMIER une croissance exDonen-
tielle du temps decalcul
3. En 1976, G.L. Miller a démontré les propriétés suivantes : fa) si n est premier, alors en fonction du nombre m
il n'y a aucun témoin de non-primalité;(b) sin n'est pas premier, alors plus de la moi- de chiffres de n.
tié des entiers entre 1 et n - 1 sont des témoins de non-primalité.Il en résulte que
l'algorithme défini ne se trompe jamais lorsqu'il déclare qu'un entier n'est pas pre- En pratique, dès qu'un
mier, et qu'il se trompe au plus une fois sur 1 000 000 environ (220)pour n premier. nombre est grand, on ne
ALGORITHMES ET PRE LTJES PROBABILISTES 109
BPP (ce sont les initiales de Bounded-away-error- cas, en temps polynomial ne le considérera pas
Probabilistic-Poly-nomial-Time, ce qu'on peut comme sûr. Pour lui, garantir qu'un problème
traduire par : E n temps polynomial, avec unepro- n'est pas dans P n'est pas suffisant, ce qui l'inté-
babilité d'erreur bornée). La figure 4 présente un resse, ce sont les problèmes qui ne sont pas dans
algorithme assez simple pour la primalité, qui, BPP (au moins).
aussi bien lorsqu'il répond OUI que lorsqu'il
répond NON, prend le risque de se tromper. Cet La classe R
algorithme montre que le problème de la prima-
lité est dans la classe BPP. En fait, l'algorithme déduit des idées de Solo-
La classe B P P est donc la classe des pro- vay et Strassen et bien d'autres découverts
blèmes OUI-NON traitables en temps raisonnable depuis ne sont susceptibles de se tromper que
lorsqu'on accepte un certain risque probabiliste dans un sens (ce qui n'est pas exigé dans la défini-
d'erreur. On considère aujourd'hui que c'est cette tion de BPP). Ils peuvent à la rigueur déclarer
classe-là, plutôt que la classe P, qui constitue la premier un nombre qui ne l'est pas (lorsqu'ils ne
classe des problèmes traitables efficacement. En trouvent pas de témoin de non-primalité alors
effet, si, pour un mathématicien intégriste, un qu'il y en a), mais ils ne déclareront jamais com-
entier ne peut pas être premier à 99,9999 pour posé u n nombre premier (puisque, dès qu'un
cent, et donc si, pour lui, être traitable efficace- témoin de non-primalité apparaît, on sait de
ment signifie être dans P , un agent secret qui sait façon certaine que n n'est paS premier). On dit
que son code peut être décrypté par un algo- que le problème «n est-il composé?» est dans la
rithme probabiliste, dans 99,9999 pour cent des classe R ou, ce qui revient au même, que le pro-
blème wz est-il mernier?),
est dans l a cla-sse C O - R .
Récemment L. Adle-
m a n et M. Huang, du
département de Compu-
ter Science de l'université
de Californie du Sud. ont
ONTE-CARLO
progressé dans la résolu-
tion du problème de la pri-
malité. Ils ont prouvé qu'il
existait u n algorithme
probabiliste polynomial
du même genre que celui
de Solovay e t Strassen,
mais qui, lui, ne pouvait
P : CLASSE DES PROBLÈMESQUI PEUVENT ÊTRE RESOLUS PAR UN ALGORITHME pas se tromper en décla-
DÉTERMINISTE TRAVAILLANT EN TEMPS POLYNOMIAL. r a n t non premier u n
BPP : CLASSE DES PROBLÈMES QUI PEUVENT ÊTRE RÉSOLUS PAR UN ALGORITHME nombre premier. Autre-
PROBABILISTE TRAVAILLANT EN TEMPS POLYNOMIAL ET AVEC UN RISQUE ment dit, «n est-il pre-
D'ERREUR AUSSI PETIT QUE L'ON VEUT. mier?), est non seulement
R : CLASSE DES PROBLÈMES QUI PEUVENT ÊTRE RESOLUS PAR UN ALGORITHME
d a n s C O - R ,mais a u s s i
PROBABILISTE QUI NE SE TROMPE PAS QUAND IL RÉPOND NON. ET QUI SE TROMPE d a n s R . L'algorithme
AU PLUS UNE FOlS SUR DEUX QUAND IL RÉPOND OUI. d'Adleman et Huang four-
nit des témoins de mima-
CO-R : CLASSE DES PROBLÈMESQUI PEUVENT ÊTRE RÉSOLUS PAR UN ALGORITHME
PROBABILISTE QUI NE SE TROMPE PAS QUAND IL RÉPOND OUI, ET QUI SE TROMPE lité en temps polynomial,
AU PLUS UNE FOlS SUR DEUX QUAND IL RÉPOND NON. comme l'algorithme de
Solovav et Strassen four-
ZPP = R n CO-R : CLASSE DES PROBLÈMES QUI PEUVENT ÊTRE RESOLUS PAR UN
ALGORITHME PROBABILISTE QUI TRAVAILLE EN TEMPS MOYEN POLYNOMIAL
nissait des témoins de
ET QUI NE SE TROMPE JAMAIS. non-primalité en temps
polynomial.
5. On a successivement réussi à montrer que le problème de la primalité était dans E n faisant tourner
BPP, co-R, R, ZPP, mais on ne sait pas franchirle dernier pas et montrer qu'il est dans simultanément les deux
P. On pense qu'il est effectivement dans P, car G. Miller a établi que cela résultait de
l'hypothèse généralisée de Riemann qu'on conjecture depuis longtemps et que beau- algorithmes de Solovay et
coup de mathématiciens croient vraie. Strassen et d'Adleman et
ALGORITHMES ET PRELT'ES PROBABILISTES 11 1
Huang jusqu'à ce que l'on sache de façon certaine moyenne en ne les faisant travailler que lorsqu'ils
que n est premier ou de façon certaine qu'il est n'ont rien d'autre à faire (la nuit, par exemple).
composé, on obtient un algorithme très intéres- On obtient ainsi en quelques jours des temps de
sant sur le plan théorique. Cet algorithme fournit calcul équivalents à plusieurs mois ou années. En
pour tout n de m chiffres, en un temps moyen poly- 1989, cette technique permit à A. Lenstra et M.
nomial (malheureusement en m l o 0 ). ., soit un Manasse, avec 400 machines, de factoriser un
témoin de primalité, soit un témoin de non-prima- entier difficile - ne possédant pas de petits diri-
lité, et donc donne un résultat sans risque d'erreur seurs - de plus de 100 chiffres. François Morain,
sur la nature de n en un temps polynomial moyen. qui utilise aussi cette technique de distribution
Cet algorithme ne prouve pas que N n est-il pre- du travail, a réussi tout récemment à prouver la
mier?» est dans la classe P à cause du mot moven primalité de nombres de 1500 chiffres décimaux
et du fait que c'est un algorithme qui utiliseYdes et c'est lui qui aujourd'hui détient le plus perfor-
tirages aléatoires pour fonctionner. On n'est pas mant des algorithmes de preuve de primalité
loin d'avoir montré que le problème de la primalité tous-usages.
est dans P, mais on n'y est pas tout à fait. Le plus grand e n t i e r premier connu
En établissant que le problème de la prima- aujourd'hui est 2756839- 1, qui possède 227 832
lité était dans l'intersection de R et de co-R, on chiffres. Il a été prouvé premier par Slowinski et
s'est donc approché très près de P, même si le der- Gage en mars 1992, après 19 heures de calculs
nier pas à franchir semble difficile. Cependant d'un ordinateur Cray II, par une méthode spé-
Gary Miller, il y a déjà plus de 15 ans, a démontré ciale qui ne peut s'appliquer qu'à certains types
que, moyennant une conjecture d'arithmétique d'entiers : ce n'est pas une méthode tous-usages.
ancienne et célèbre (pour être précis, la conjec- Savoir qu'un nombre n'est pas premier ne
ture de Riemann généralisée aux L-fonctions de suffit pas pour le factoriser. D'autres méthodes
Dirichlet), le problème de la primalité est dans P. sont nécessaires, et aujourd'hui la taille limite
En fait, il a même proposé un algorithme déter- pour factoriser les entiers difficiles est de 120
ministe (qui est une variante de celui décrit à la chiffres à peu près. Un entier difficile de 116
figure 3) pour la primalité, qui est sans doute chiffres a récemment été factorisé. Heureuse-
polynomial, mais dont on ne sait prouver qu'il est ment que la factorisation est plus difficile que la
polynomial qu'en utilisant la conjecture de Rie- détermination de la primalité, car de nombreuses
mann généralisée. méthodes de cryptographie, comme le RSA évo-
On est donc dans une situation étrange qué plus haut, sont fondées sur la difficulté de la
concernant la primalité. On a presque réussi de factorisation. Les progrès inattendus, faits à pro-
deux façons différentes à montrer que c'était un pos des tests de primalité, montrent cependant
problème de P : (a) en prouvant que c'est un pro- qu'il n'est pas impossible que tous les codes fon-
blème traitable sans risque d'erreur en temps dés sur la difficulté de la factorisation des entiers
polynomial moyen par algorithmes probabilistes ; de taille inférieure à 200 chiffres soient prochai-
(b) en proposant un algorithme déterministe, qui nement cassés.
est sans doute polynomial, mais sans qu'on sache
le démontrer. Utilité des a l g o r i t h m e s probabilistes
Les nombreux travaux faits en arithmétique
Les records
n'interdisent pas de penser que le détour par les
Ces résultats, ainsi que d'autres dus à C. Pome- algorithmes probabilistes pour les tests de pri-
rance, R. Rumely, H. Cohen, H. et A. Lenstra, per- malité est inutile - ce sera le cas si l'on démontre
mettent de prouver la primalité de nombres l'hypothèse de Riemann généralisée - et n'inter-
entiers de plus en plus longs. Récemment, une disent pas non plus de croire à l'inutilité des
méthode fondée sur les courbes elliptiques due à algorithmes probabilistes pour les problèmes
A. Atkin et F. Morain, de 1'INRIA-Rocquencourt,a O ~ I - N O N- ce-sera le cas si on réussit à montrer
conduit ce dernier à écrire un programme qui fut que P = BPP.
le premier à prouver (sans risque d'erreur) la pri- Pour les ~roblèmesOU-NON. on ne sait donc
malité de n'importe quel nombre premier de 1000 pas aujourd'hui si autoriser des algorithmes pro-
chiffres ou moins (on parle de méthode tous- babilistes fait vraiment gagner quoi que ce soit,
usages). Pour ce type d'exploit, une technique fré- ne serait-ce que sur le plan de l'efficacité. En
quemment utilisée est de distribuer le travail revanche, ce n'est plus le cas lorsqu'on s'intéresse
e n t r e plusieurs ordinateurs de puissance à des algorithmes divers, sortant du cadre OLI-
112 LOGIQUE, INFORMATIQL'E ET PARADOXES
NON. On a en effet réussi à prouver complètement ont été prouvés théoriquement irremplaçables
que les algorithmes probabilistes font mieux que dans plusieurs domaines. Quant à la notion de
les algorithmes déterministes dans trois cas au preuve probabiliste, remarquons pour terminer
moins : à propos d'induction et d'identification à que, si le monde est infini, les mathématiciens
la limite (voir le chapitre 9) ; à propos d'algo- ont raison de dire qu'on peut toujours s'en passer.
rithmes de communication et de coopération En revanche, si le monde est fini - ce que la cos-
entre ordinateurs : et à propos d'ordinateurs mologie n'exclut pas - alors nous risquons un jour
ayant des caractéristiques limitatives (comme, de trouver des énoncés mathématiques dont les
par exemple, ce qu'on appelle les machines de seules preuves qui nous soient accessibles soient
Turing à un seul ruban). des preuves avec un risque d'erreur probabiliste :
En conclusion, on peut donc dire que, même si les preuves exactes de ces énoncés ne peuvent
certaines des questions théoriques les plus être matériellement présentes dans l'univers
simples e n apparence r e s t e n t non résolues trop petit, alors que les preuves probabilistes
concernant les algorithmes probabilistes, ces der- seraient, elles, suffisamment courtes pour y trou-
niers sont concrètement utiles en arithmétique et ver place.
IP = PSPACE
U n pas important vers la compréhension des classes de complexité.
Le vérifieur permute donc le nom des nœuds complexité des algorithmes sont d'approche
de l'un des graphes G1 ou G2, sans dire au prou- plus facile qu'on ne le croyait. La réputation de
veur lequel il modifie (voir la figure), et il obtient difficulté de la discipline résultait des nombreux
un graphe G qu'il transmet au prouveur en lui exemples de problèmes simples (du moins par
demandant si G provient de G 1 ou de G2. Si le leur énoncé) qui ne sont pas résolus. On ignore
prouveur n'est pas un imposteur et si les deux notamment si P = NP, c'est-à-dire si l'ensemble
graphes ne sont pas isomorphes, il peut recon- des problèmes dont on peut trouver une solution
naître de quel graphe provient le graphe G, et il en un temps polynomial (P) est confondu avec
transmet sa réponse au vérifieur. Naturelle- l'ensemble des problèmes dont on peut vérifier
ment un tricheur pourrait répondre au hasard la solution en un temps polynomial (NP).
et tomber sur la bonne réponse, mais si l'opéra- La méthode de A. Shamir est simple et du
tion est répétée, la probabilité de trouver la même type que toutes les démonstrations fausses
bonne réponse à tous les coups en choisissant au (il y en a eu des dizaines) de P = NP : A. Shamir a
hasard devient de plus en plus faible : elle n'est choisi un problème représentatif de la classe
déjà plus que d'une chance sur 1 024 pour dix PSPACE (le problème des formules booléennes
essais, de une sur un million après 20 essais. quantifiées) et il a montré qu'il appartenait à la
Inattendu, le lien qui vient d'être établi classe IP, en proposant un protocole analogue à
entre ((transmissible avec fiabilité sans calcul)) celui que nous avons examiné pour le non-iso-
et (<résolvablesans trop de mémoire», établit morphisme de graphes. La .(représentativité»du
aussi que certains résultats de la théorie de la cas choisi est telle qu'elle implique que tous les
r.:I
Un vérifieur demande à un
Drouveur de lui montrer auil
C
G2
parce que les graphes G1 et
G2 ne sont Das isomor~hes.
sait avec certitude que 'les Un imposte;r qui vo;drait
deux graphes G1 et G2 ne convaincre le vérifieur que
sont pas isomorhes : même si deux graphes isomorphes ne
l'on déforme continûment les le sont pas ne peut donner la
arêtes, on ne peut pas super- bonne réponse qu'au hasard,
poser les deux graphes. Le une fois sur deux, et il ne peut
vérifieur choisit au hasard un donc induire en erreur le véri-
des deux graphes et change phe G1, défini par les arêtes ae, ac, eb, ed, fieur qu'avec une probabilité
les noms des nœuds : par dc, bc, est remplacé par le graphe G, défini de 112", après n essais suc-
exemple, il choisit le graphe par les arêtes N l N 3 , N l N 2 , N5N1, N5N4, cessifs du type précédent. Le
G1 et remplace a par N5, b N2N4, N3N4. Le prouveur, dont on suppose vérifieur acquiert ainsi une
par N3, c par N4, d par N2, e qu'il peut faire tous les calculs qu'il veut, quasi-certitude que les gra-
par N I . II transmet au prou- reconnaît si G provient de G1 ou de G2 et phes ne sont pas isomorphes
veur la définition du graphe G transmet sa réponse au vérifieur. Le prou- sans jamais avoir fait de longs
qu'il a obtenue : l'ancien gra- veur ne peut faire cette identification que calculs.
problèmes de PSPACE sont dans IP. Comme on raient aux variantes, et donneraient le même
savait déjà que IP est inclus dans PSPACE, les résultat pour toutes les variantes, ce qui n'est
deux ensembles sont identiques. pas le cas. On a même parfois pensé que la réso-
Le fait qu'une technique simple ait résolu la lution du problème P = NP par les techniques
question IP = PSPACE remet en cause certaines mathématiques habituelles était impossible.
analyses des questions IP = PSPACE ou P = NP : D'autre part, on a déduit du résultat sur les
on supposait que, confronté à de telles équa- variantes que, très vraisemblablement, la
tions, il pouvait ê t r e utile d'étudier des classe P était distincte de la classe NP.
«variantes»,obtenues par adjonction aux algo- Malheureusement des résultats exacte-
r i t h m e s d'une base de données infinie ment semblables à ceux obtenus Dour P = NP
(l'«oracle»),où s e r t codées, au moyen de chiffres ont été obtenus sur les variantes du problème
binaires O et 1, par exemple des informations IP = PSPACE avant que A. Shamir ne le résolve :
s u r d'autres algorithmes. On a étudié des variantes donnant l'égalité, variantes donnant
variantes de l'équation P = NP dont l'oracle est l'inégalité, résultat d'inégalité pour la quasi-
tel que l'équation est vérifiée ; pour d'autres totalité des variantes. Or c'est l'égalité qui a
variantes de la même équation, c'est-à-dire pour finalement été démontrée! Tout ce qu'on avait
des problèmes dotés d'autres oracles, l'inéqua- supposé à partir de l'étude des variantes était
tion p # NP est démontrable. Mieux encore, on a faux.
établi que la quasi-totalité des variantes véri- Le résultat de A. Shamir remet les pendules
fient P # NP. à l'heure. Il vient dire aux informaticiens théori-
On en a hâtivement tiré deux conclusions. ciens : «Ne renoncez pas trop vite et oubliez les
D'une part, on a cru que les techniques à utiliser mauvais arguments que vous utilisiez pour vous
pour résoudre P = NP ne pouvaient pas être convaincre que le problème P = NP est trop diffi-
simples, car si elles l'étaient, elles s'applique- cile. Au travail!»
Les automates
L a théorie des automates cellulaires est un le processus décrit, on obtient une nouvelle géné-
domaine merveilleux dont le Jeu de la vie, ration. Le terme automate désigne ainsi à la fois
fondé sur l'automate de Conway, est un cas le mécanisme de calcul associé à une .case,) et
particulier qui est loin d'être épuisé ; grâce aux cette case, sur laquelle il opère, en fonction de
travaux du chercheur finlandais Jarkko Kari, l'état des cases environnantes. L'ensemble des
l'étude des automates a notablement progressé. automates est un réseau.
Le domaine des automates est d'une simpli- Un automate très simple est l'automate
cité trompeuse : avec des règles de calcul enfan- Déplacement Est : chaque case peut avoir deux
tines, les processus qui leur sont associés peuvent états, O et 1(vide ou plein) : l'automate regarde
égaler n'importe quel ordinateur, c'est-à-dire l'état de la case voisine Ouest, s'en souvient et
effectuer les mêmes opérations que lui. Plus loin, agit en le prenant pour nouvel état de la case. Un
nous expliciterons cette idée, mais, pour l'instant, réseau d'automates Déplacement Est sur un plan
réfléchissons une seconde sur ce qu'est calculer. a pour effet, d'une génération à l'autre, de dépla-
Calculer, c'est regarder, se souvenir et agir. cer d'une case vers l'Est le motif initial.
Quand on fait une multiplication sur un papier, Le plus célèbre des automates est l'automate
on regarde les nombres qu'on doit multiplier, on de Conway, découvert par John Conway en 1970.
s'en souvient ( a u moins partiellement pour Il est connu dans le monde entier à cause du Jeu
chaque étape du calcul), on se remémore les de la vie, qui avait atteint une telle popularité, à
tables de multiplication et on écrit. Au cours de la l'époque, qu'on avait évalué à plusieurs millions
multiplication, on doit aussi se souvenir de de dollars le temps de calcul ((emprunté»par les
l'endroit précis où l'on en est arrivé et, s'il y en a, fanatiques du jeu aux ordinateurs de leur entre-
des retenues. Le mécanisme le plus élémentaire prise pour explorer l'univers étonnant de ce jeu.
de calcul conçu par les mathématiciens est l'auto- L'évolution des automates de Conway sur un
mate fini. L'automate fini procède, lui aussi, selon plan ressemble à celle d'une population de bacté-
le principe : regarder, se souvenir et agir. ries. L'automate de Conway possède deux états, O
L'automate regarde les automates autour de ou 1, aussi appelés ((étatmort» et «état vivant),.
lui - on suppose que des automates identiques D'une génération à l'autre, u n automate de
sont placés sur les cases d'un damier -, se sou- Conway regarde dans les huit cases voisines les
vient de l'état dans lequel il est (il ne possède plus proches de lui : s'il est mort et si trois voisins
qu'un nombre fini d'états, et c'est de là qu'il tire exactement sont vivants, alors il passe dans l'état
son qualificatif de (dini),)et change d'état en res- vivant (naissance) ; s'il est vivant et si deux ou
pectant des conventions invariables qui le carac- trois voisins exactement sont vivants, il le reste à
térisent ; ces conventions sont assimilables à un la génération suivante (survie). Dans tous les
programme. Ce changement porte sur toutes les autres cas, l'automate se retrouve dans l'état
cases du damier et détermine une nouvelle géné- mort, décès par isolement ou par étouffement
ration d'états des cases. En appliquant à nouveau (voir la figure 2).
LES AUTOMATES Il7
Notre but n'est pas de décrire le monde du autre automate, l'automate inverse, qui permette
Jeu de la vie de Conway, mais nous l'utiliserons de revenir en arrière?
pour illustrer les résultats récents de J. Kari. Lorsqu'un damier est recouvert d'automates
identiques, chacun dans un certain état, onvisua-
lise la configuration en représentant chaque état
Automate inverse
par une couleur ou un jeton. On obtient alors un
Posons-nous d'abord le problème suivant : si dessin, et le passage d'une génération à la sui-
un automate fait un certain travail, existe-t-il un vante, par application des règles définissant
2. L'automate de Conway, qui définit le Jeu delavie, pos- n'existe pas d'automate inverse de l'automate de
sède deux états O et 1, appelés aussi état mort et état Conway, car deux configurations distinctes peuvent don-
vivant, et représentés comme sur le dessin précédent. S'il ner la même configuration. L'évolution du quatramino T
est mort et que trois de ses huit voisins sont vivants, il se fait en 11étapes, après quoi il y a oscillation. La géné-
devient vivant à la génération suivante ;s'il est vivant et ration 9 donne la génération 10, mais la génération 11
que deux ou trois de ses huit voisins sont vivants, il reste donne aussi la génération 10, donc l'automate de Conway
vivant. Dans tous les autres cas, il prend l'état mort. Il n'a pas d'automate inverse.
1.L'automate Déplacement Est possède deux états O et 1, prend pour lui-même.Le résultat est, bien sûr, que le des-
représentés, l'un par une case blanche, l'autre par un sin se déplace d'une case vers l'Est. Cet automate possède
disque rouge. D'une génération à l'autre, chaque auto- un automate inverse, qui est l'automate Déplacement
mate du réseau regarde l'état de son voisin Ouest et le Ouest.
118 LOGIQUE, INFORMATIQrE ET PARADOXES
l'automate, modifie le dessin. Si un automate pos- automate inversible n'utilisant que ses huit voi-
sède un automate inverse, on pourra revenir en sins immédiats et dont l'automate inverse utilise
arrière. L'automate Déplacement Est déplace le des voisins à plus de 1 000 cases de distance. En
dessin d'une case vers l'Est. 11 ~ossèdeun auto- effet, si les voisins à moins de 1000 cases de dis-
mate inverse qui, bien sûr, est l'automate Dépla- tance suffisaient toujours pour inverser un auto-
cement Ouest. Nous allons voir, que au contraire, mate n'utilisant aue les huit voisins immédiats.
l'automate de Conway ne possède pas d'automate on pourrait écrire un programme qui détermine-
inverse. En effet, si un automate possède un auto- rait si un automate est inversible, en essayant
mate inverse, deux dessins différents se transfor- tous les automates dont les voisins utiles sont à
ment toujours en deux dessins différents (mais, moins de 1000 cases de distance. Ce programme
ce qui est moins évident, c'est que cette condition, contredirait le théorème de J. Kari.
d ' a ~ r è su n r é s u l t a t de 1971 démontré Dar Cette difficulté pour inverser un automate
D. Richardson, est aussi une condition suffisante suggère que l'on peut utiliser les réseaux d'auto-
pour qu'existe cet automate inverse) ; or, dans le mates pour concevoir des systèmes de cryptogra-
Jeu de la vie, deux configurations différentes, les phie à clef révélée, c'est-à-dire dont la méthode de
générations 9 et 11de la figure 2, se transforment codage est publique, sans que la méthode de déco-
en une même configuration, la génération 10. dage le soit. L'idée proposée par le chercheur fin-
L'automate Déplacement Est est inversible, landais consiste à utiliser un automate inversible
l'automate de Conway ne l'est pas. Est-il facile de que l'on rend public, en gardant pour soi l'auto-
savoir si u n automate ~ o s s è d eu n automate mate inverse. La personne qui veut vous faire
inverse? La réponse à ce problème a été donnée parvenir un message codé procède de la façon sui-
récemment par J. Kari : déterminer si un auto- vante : elle commence par traduire son message
mate possède un automate inverse est un pro- en une configuration. Pour cela elle peut dessiner
blème indécidable. Aussi, quelle que soit votre les lettres composant le texte du message en noir-
ingéniosité, jamais vous ne réussirez à écrire un cissant des cases du damier support du réseau
programme d'ordinateur qui, prenant pour don- d'automates. Ensuite, cette personne fait fonc-
nées un automate quelconque, fait un calcul et, tionner le réseau d'automates pendant, par
sans se tromper, indique, au bout d'un temps fini, exemple, 100 générations. La clef de codage est
si l'automate est inversible ou non. Vous pourrez publique : tout le monde peut envoyer des mes-
peut-être écrire u n programme q u i s a u r a sages. La personne vous transmet alors la nou-
répondre correctement pour certains automates, velle confipuration obtenue. sans avoir à la
u
mais jamais vous n'en écrirez un qui répondra cacher puisque vous êtes seul à pouvoir la déchif-
correctement pour tous. frer. Pour décoder le message, vous n'avez qu'à
utiliser l'automate inverse, que vous êtes seul à
connaître, pendant 100 générations. La diffi-
Réseaux cryptographiques culté, prouvée par J. Kari, du calcul de l'automate
Parmi les conséquences intéressantes du inverse d'un automate donné vous assure que
résultat de J. Kari, il y en a une qui concerne le personne ne pourra facilement déchiffrer les mes-
voisinage utile des automates inverses. Le voisi- sages qu'on vous fera parvenir : n'importe qui
nage utile d'un automate est l'ensemble des cases peut coder, vous seul pouvez décoder.
que l'automate consulte pour changer d'état. Je ne crois pas que la technique suggérée par
L'automate Déplacement Est ne consulte qu'une J. Kari ait déià été utilisée. mais l'idée me semble
case : l a case Ouest. L'automate de Conway bonne, d'autant que des circuits spécialisés ont
consulte les huit cases voisines. On ne limite pas été conçus pour simuler très efficacement les cal-
les cases pouvant servir à un automate à celles culs d'un réseau d'automates, permettant donc de
placées juste autour et, par exemple, on peut défi- crypter e t de décrypter très rapidement des
nir l'automate Double déplacement E s t qui images, et pourquoi pas des films ou des émis-
consultera l'état de la case située deux cases à sions de télévision? Comme touiours dans les svs-
l'Ouest et le prendra pour nouvel état. tèmes de cryptographie à clef révélée, le risque
Le résultat précis de J. Kari est en fait plus subsiste que, par hasard, quelqu'un réussisse à
fort que la version énoncée plus haut. Il énonce : inverser votre automate. Le résultat de J. Kari
savoir si un automate n'utilisant que les huit voi- signifie que le problème général du décodage est
sins est inversible est un problème indécidable. difficile, il n'interdit pas que certains automates
Sous cette forme, ce résultat entraîne que, pour inversibles puissent être inversés par chance (ou
tout entier n (par exemple 1 OOO), il existe un malchance, selon le côté où l'on se trouve!).
LES AUTOMATES 119
3. Le glisseur (a) est une configuration du Jeu de la vie qui s'échappe. Le lance-glisseurs prouve qu'il existe des
qui, en quatre générations, se déplace d'une case le long configurations finies du Jeu de la vie dont la croissance
d'une diagonale. Le lance-glisseurs (b) est une configura- ne s'arrête jamais. On sait disposer 13 glisseurs (c) qui
tion qui, toutes les 30 générations, produit un glisseur donnent, après quelques générations, unlance-glisseurs.
120 LOGIQUE, INFORMATIQL-E ET PARADOXES
4. Première étape du codage d'une image réalisée par un (E+O*+ x) ;(E+O+*i ) ; (EtOx+ -,x) ;(E+O*+ ) ;(ExO*
automate inversible (programme AUTOGEN de Philippe + +) ; (ExO++ *) ;ExOx i +) ; (Ex0 i *) ;(EO* + +) ;(EO+
Mathieu, du Laboratoire d'informatique fondamentale i :@) ; (E Ox + +) ;(E O i *) ; + est sur fond vert, * sur fond
de Lille). L'automate inversible utilisé ici est simple (trop brun et x sur fond violet. Après une dizaine d'étapes, le
sans doute pour assurer l'inviolabilité de la clef). Il est message est incompréhensible. Ce codage pourrait ser-
défini par 16 règles du genre : si case Est* et case Ouest*, vir à coder des images, notamment dans des systèmes à
alors prendre l'état x, ce que nous notons par (E*O* x). clef révélée. Cette idée a été récemment exploitée par
Les autres règles sont (EWt + ; (E*Ox x) ;(E*O+ ) ; A. Gutowitz.
Nous ne démontrerons pas le résultat de J. Kari lement tout savoir à leur sujet : rien n'est plus
(NDLR: merci, la preuve occupe 23 pages!), mais faux, et l'on sait, depuis les années 1960, que le
sa méthode est particulièrement astucieuse et monde des automates est riche en phénomènes
elle utilise deux résultats intermédiaires inté- complexes. Le premier résultat de ce type date de
ressants par eux-mêmes. Le premier est u n plus de 25 ans et est dû au grand mathématicien
résultat de 1966, dû à R. Berger, de l'université von Neumann qui s'intéressait au problème des
de Harvard, et qui énonce l'indécidabilité du pro- machines autoreproductrices, c'est-à-dire sus-
blème du pavage : savoir si un ensemble donné de ceptibles de produire des copies exactes d'elles-
modèles de pavés (triangles, rectangles, étoiles, mêmes. Von Neumann cherchait une règle agis-
etc.) peut recouvrir le plan (bien sûr, sans che- sant sur des automates où une configuration
vauchement ni espace vide) est u n problème donnée pourrait se reproduire après un certain
indécidable. nombre de générations. Les motivations de von
J. Kari montre que, si l'on savait reconnaître Neumann étaient philosophiques : il voulait
par programme quels sont les automates inver- prouver que l'idée d'une machine pouvant créer
sibles, on pourrait alors reconnaître par pro- des copies exactes d'elle-même n'était pas logi-
gramme quels sont les ensembles de pavés quement contradictoire et ne nécessitait rien
pouvant recouvrir le plan, ce qui, selon le résultat d'autre que des mécanismes de calculs élémen-
de R. Berger, est impossible. Pour appliquer cette taires comme ceux qu'utilisent les automates. 11
technique de réduction d'un problème à un autre, résolut son problème en définissant un automate
technique classique dans le domaine de l'indéci- à 29 états et une configuration de plus de 200 000
dabilité, J. Kari utilise un second résultat, lui automates qui se dupliquait en plusieurs mil-
encore lié à des pavages du plan. Il montre qu'un liers de générations. Bien sûi; il ne constata pas
ensemble particulier de pavés, qu'il a lui-même expérimentalement que s a configuration se
inventé et sur lequel sont dessinés des bouts de dupliquait, mais le démontra mathématique-
chemins, possède l'extraordinaire propriété sui- ment : sa preuve occupe plus de 100 pages et ne
vante : on peut en recouvrir le plan et, à chaque fut publiée qu'en 1966, après sa mort, par Arthur
fois qu'on réalise un tel recouvrement, les bouts Burks.
de chemins dessinés sur les pavés forment une La preuve de von Neumann a été refaite et
route qui passe par tous les pavés. Ce chemin tor- simplifiée par J. Conway pour le Jeu de la vie,
tueux constitue d'ailleurs le prototype d'une c'est-à-dire pour un automate à deux états ayant
courbe, dont la limite, quand les pavés devien- un voisinage utile de huit cases. La première
nent infiniment petits, appelée courbe de Peano, étape de cette nouvelle preuve d'existence de
est une courbe fractale. configurations autoreproductrices consiste à
construire une configuration qui est un modèle
d'ordinateur universel, c'est-à-dire capable de
simuler tout calcul réalisable par un ordinateur.
L'indécidabilité de certains problèmes élé- La configuration ordinateur universel du Jeu de
mentaires concernant les automates est surpre- la vie, par exemple, est capable de calculer la
nante ; les mécanismes sont si simples qu'on suite des nombres memiers : associé à une confi-
croit, dans un premier temps, qu'on pourra faci- guration de glisseurs jouant le rôle d'un
LES AUTOMATES 121
5 . La démonstration de
l'indécidabilité de la ré-
versibilité des automates
utilise un résultat remar-
quable d û à R. Berger :
savoir si un ensemble de
pavés donné peut recou-
v r i r le plan est indéci-
dable. On dit qu'un en-
semble de pavés est non
périodique s'il est pos-
sible d'en recouvrir le
plan, mais si aucune mé-
thode pour en recouvrir le
plan ne donne un dessin
périodique (celui formé
p a r un pavage d'hexa-
gones réguliers, par exem-
ple). C'est la découverte,
qui surprit tout le monde,
d'ensem-blesde pavés non
périodiques, comme celui
don-né en exemple sur la
figure (qui est dû à R. Ro-
binson), qui a permis la
démonstration de l'indé-
cidabilité du problème du
pavage. Le premier en-
semble de pavés non pé-
riodique, trouvé en 1966,
comportait 20 426 pavés
au lieu des six de l'exem-
ple donné en haut. R. Pen-
rose trouva des ensembles
non périodiques de deux
pavés en 1974, dont un
exemple est indiqué sur la
figure du bas, avec la for-
me de deux pavés.
122 LOGIQUE, INFORMATIQUE ET PARADOXES
6. La collision de deux glisseurs donne des résultats très pentamino (d),pFr exemple, ne se stabilise qu'après 1103
variés. Ils peuvent se détruire mutuellement (a) ;ils peu- générations. Grace à la configuration ordinateur trou-
vent donner des configurations stables (6) et (c). Il est vée par J. Conway, on sait que le destin ultime (mort ou
très difficile de prévoir si une configuration donnée du persistance indéfinie) d'une configuration du Jeu de la
Jeu de la vie finit par disparaître, car parfois les généra- vie est indécidable, c'est-à-direne peut être calculé svsté-
tions durent très-longtemps avant de se s t a b i l h - . Le matiquement par un programme. -
7. Cette configuration n'a pas de prédécesseur : c'est J. Kari a montré que savoir si oui ou non un automate
une configuration Jardin d'Éden pour le Jeu de la vie. possède une configuration Jardin d'Eden est encore un
Le vérifier nécessite un nombre de calculs faramineux. problème indécidable.
LES AUTOMATES 123
DEUX CONFIGURATIONS
QUI DONNENT LE MÊME RÉSULTAT
S. Sans expliciter aucun exemple de J a r d i n d'Éden, on 2'5n-2)2= 225n2-20n+4confïgurations possibles dans le carré
peut parfois prouver qu'il en existe. Pour le Jeu de la vie, ...
5n - 2 x 5n - 2, et donc, si 24,999999957004337 nZest infé-
le raisonnement est le suivant. Nous allons montrer que, rieur à 25n2- 20n + 4, alors il n'y aura pas un nombre assez
pour n assez grand, il existe au moins une configuration grand de parents possibles pour les configurations du
sans parent de taille 5n - 2 sur 5n - 2. Il suffit pour cela carré (5n - 2 ) x (5n - 2). Un petit calcul montre que cela se
d'étudier la partie d'un éventuel parent dans le carré 5n produit pour n = 465 163 200, et donc il existe une configu-
x 5n. Si une des composantes 5 x 5 d'un éventuel parent ration Jardin d'Éden utilisant moins de 2 325 816 0002 cel-
est vide, on peut la remplacer par la même composante lules! L'intérêt de ce raisonnement, dont l'idée est due à
avec une cellule vivante en son centre, car cela ne chan- E. Moore, est qu'il se généralise facilement et permet
gera pas la génération suivante. Nous devons donc envi- d'établir que si un automate a deux configurations finies
sager uniquement (225 - l)nZ= 224,999999957004337... n2 des 225"'
distinctes donnant le même résultat, alors il existe une
configurations possibles dans le carré 5n x 5n. Mais il y a configuration Jardin d'Eden pour cet automate.
a réussi à construire un automate inversible com- temps fini si une configuration du Jeu de la vie
putationnellement universel fondé sur une sorte finit par s'éteindre ou pas. Ici il ne faut pas faire
de jeu de billard. l'erreur de croire que le programme qui simule le
La configuration ordinateur universel du Jeu de la vie répond à la question (et contredit
Jeu de la vie, en plus de mener à une configura- l'énoncé précédent), car le programme qui
tion autoreproductrice, a permis de démontrer le simule ce jeu ne donne jamais de réponse quand
premier résultat élémentaire d'indécidabilité vous lui fournissez une configuration qui ne
dans le monde des automates du plan. On part s'éteint pas (voir la figure 6).
du célèbre r é s u l t a t , d û a u mathématicien
anglais Alan Turing en 1936, selon lequel aucun Attracteur et indécidabilité
programme, aussi élaboré soit-il, ne réussira
jamais à distinguer les programmes qui s'arrê- Un a u t r e problème i n t é r e s s a n t s u r les
tent de ceux qui ne s'arrêtent pas (ce qui serait réseaux d:automates est celui de l'existence de
pourtant bien utile pour éviter d'écrire des pro- Jardin d'Eden. Une configuration Jardin d'Eden
grammes qui bouclent) : l'arrêt d'un programme est une configuration qui ne peut être le résultat
est indécidable. Grâce à la configuration ordina- d'aucune configuration antérieure ; si un auto-
t e u r universel, qui peut simuler t o u t pro- mate est inversible, il ne possède pas de jardin
gramme, on déduit, pour le Jeu de la vie, que, d'Eden, car, bien sûr, toute configuration a un
savoir si oui ou non une configuration du Jeu de prédécesseur obtenu en appliquant l'automate
la vie finit par se stabiliser, est indécidable. Par inverse. On a prouvé que le Jeu de la vie possède
réduction au problème précédent (obtenu grâce à des jardins d'Eden, mais il a été plus difficile d'en
un système d'autodestruction de l'ordinateur trouver un. Après de longs calculs informatiques,
universel), on montre que savoir si une configu- Roger Banks a trouvé une configuration Jardin
ration du Jeu de la vie finit par s'éteindre com- d'Eden pour le Jeu de la vie.
plètement est aussi indécidable. En d'autres Peut-on savoir si un automate possède des
termes, quel que soit votre génie de program- configurations Jardin d'Eden? Là encore, une
meur, vous ne réussirez jamais à écrire un pro- réponse négative a été donnée par J. Kari en 1990 :
gramme d'ordinateur qui puisse vous dire en l a question e s t indécidable. Vous pourrez
124 LOGIQUE, INFOR,IIATIQLF ET PARADOXES
Les hyperensembles
Comme cela est arrivé à la notion de nombre, celle dénsemble a été étendue.
L
'histoire des mathématiques incite à se
moquer du bon sens. Ainsi les nombres
négatifs parurent impossibles : comment Alors que la théorie des ensembles du mathé-
retirer cinq pommes d'un tas de trois pommes maticien allemand Georg Cantor commençait à
seulement? Puis, à l'apogée de la Grèce antique, s'imposer, le philosophe britannique Bertrand
l'idée des nombres comme \ 2, qui ne sont pas des Russell trouva en 1903 une contradiction évi-
rapports entre deux nombres entiers, sembla si dente, que l'on nomme aujourd'hui l'antinomie de
invraisemblable qu'une secte en conserva le Russell et qui résulte de l'utilisation sans restric-
secret. L'effort qu'il fallut s'imposer pour accepter tion de l a notion d'ensembles. Considérons
ces nombres a laissé des traces dans le langage : l'ensemble E des ensembles qui ne sont pas des
on les nomme irrationnels, comme s'il fallait être éléments d'eux-mêmes. L'ensemble E est-il un
fou pour y croire. De même, les nombres com- élément de lui-même? S'il l'était, il devrait véri-
plexes, introduits plus récemment, ont été fier la propriété caractéristique de ses éléments
d'abord nommés nombres impossibles e t , et donc ne serait pas un élément de lui-même, ce
aujourd'hui encore, on nomme imaginaires ceux qui serait contradictoire. S'il ne l'était pas, il véri-
qui sont racines d'un nombre négatif. fierait la propriété caractéristique de ses élé-
Pourtant l'introduction osée de nouveaux ments et donc serait un élément de lui-même, ce
nombres n'a jamais produit de catastrophe et, qui serait encore contradictoire.
au contraire, a enrichi les mathématiques. L'antinomie de Russell ébranla si gravement
S'opposant à l'intuition et au bon sens, l'histoire le mathématicien Richard Dedekind qu'il cessa
milite en faveur de telles introductions. C'est quelque temps de publier ses travaux sur la théo-
précisément ce que proposent les logiciens John rie des nombres : il les jugeait compromis par le
Barwise, de l'université de l'Indiana, et Peter paradoxe de Russell. Le philosophe allemand
Aczel, de l'université de Manchester, à la suite Gottlob Frege prit connaissance de l'antinomie de
des travaux du second sur ce que l'on nomme Russell alors qu'il mettait la dernière main à son
aujourd'hui les hyperensembles (on verra qu'on ouvrage fondamental sur les fondements de
les nomme également
" ensembles antifondés). l'arithmétique par la théorie des ensembles ; une
L'extension de la notion d'ensemble ainsi propo- postface y exprime son désarroi : .Un scientifique
sée ressemble à toutes celles qui ont été évo- eut difficilement être confronté à une situation
quées : les hyperensembles apparaissent dérai- plus désagréable que celle de voir les bases de son
sonnables. travail disparaître au moment précis où ce travail
Pourtant les nouveaux ensembles sont utiles est achevé. J'ai été mis dans cette position par
dans plusieurs secteurs des mathématiques, une lettre de Bertrand Russell, alors que le livre
notamment en logique, et en informatique où ils était quasiment sous presse.))Le mathématicien
constituent des outils puissants de modélisation. francais Henri Poincaré., aui avait contribué à la
En comprendre l'origine nécessite un petit retour propagation de la théorie des ensembles, consi-
en arrière. déra qu'elle devait être abandonnée.
LES HYPERENSEMBLES 127
Un autre paradoxe nous aidera à saisir la fois plus petit que l'ensemble de ses parties,
nature des difficultés de la théorie des ensembles : puisque tel est le résultat de Cantor, et plus gros,
ce paradoxe de l'ensemble de tous les ensembles, puisqu'il contient tous les ensembles, par défini-
apparemment connu de Cantor dès 1899, est tion (voir la figure 2).
fondé sur un théorème général démontré par
Cantor, qui stipule que l'ensemble des parties (ou
La théorie classique des ensembles
sous-ensembles) d'un ensemble E est toujours
plus gros que l'ensemble E lui-même. Pour La résolution des paradoxes ensemblistes
l'ensemble E composé des éléments 1, 2, 3, par donna lieu à de nombreux travaux, dont ceux de
exemple (on note cet ensemble (1, 2, 31), Russell lui-même sur la théorie des types. La
l'ensembledesparties de E est 10, (1},{2},
(31,{1,2], solution qui est adoptée aujourd'hui par les
(1,31, (2, 31, (1, 2, 311. L'ensemble de tous les mathématiciens (qui ne tolèrent pas les contra-
ensembles (on admet temporairement qu'il est dictions) provient d'une formulation de la théorie
légitime de considérer un tel ensemble) devrait des ensembles proposée par Ernst Zermelo en
contenir l'ensemble de ses parties : il serait à la 1908, puis complétée dans les années 1920 par
1. Lagalerie d'Estampes, de Maurits Escher, représente bien l'hyperensemble Q, dont l'unique élément est Q lui-même.
128 LOGIQUE, INFOR4iilTIQ CE ET PARADOXES
dantes d'ensembles icoir la figure 5) tels que ... L'axiome de fondation sert à ne pas avoir trop
appartient à Xn + 1 appartient à X n , appartient d'ensembles ;c'est un axiome d'interdiction, et on
à ... appartient àX2' appartient àX1, appartient aimerait que la restriction qu'il opère soit telle
à Xo. que la définition du concept d'ensemble soit fixée
Cet axiome évite notamment l'existence d'un de façon unique. Cependant une des consé-
ensemble X q u i a p p a r t i e n n e à X ( s i u n t e l quences du théorème d'incomplétude de Gode1
ensemble existait, il pourrait figurer dans une est que tel n'est pas le cas : la définition des
chaîne descendante où tous les Xn seraient égaux ensembles donnée par la théorie ZFC n'est pas
à X). Ainsi avec l'axiome de fondation, les assez restrictive pour qu'on soit certain que toute
ensembles qui appartiennent à eux-mêmes, à propriété formulable des ensembles soit vraie ou
l'origine de l'antinomie de Russell, sont exclus. fausse dans ZFC. Si l'axiome de fondation visait
On conjure donc, une seconde fois, ce paradoxe. à donner une définition totalement réc ci se de la
Pourquoi ce nouvel axiome, alors que la doc- notion d'ensemble. il a échoué.
trine de limitation de la taille avait déià éliminé Il semble donc inutile : il prévient certains
les paradoxes? L'utilisation de l'axiome de fonda- paradoxes, mais réduit insuffisamment l'onto-
tion ressemble u n peu à la méthode qui consiste à logie de la théorie des ensembles et ne se substi-
pendre un noyé pour être certain qu'il ne revien- tue pas à la doctrine de limitation de la taille.
d r a pas à l a vie. Notons aussi que, même si Son i n u t i l i t é contre les contradictions e s t
l'axiome d e fondation évite le ~ a r a d o x ede d'ailleurs démontrée mathématiquement : von
l'ensemble de tous les ensembles, il n'élimine pas Neumann a établi aue. si l a théorie des
d'autres paradoxes et ne peut remplacer la doc- ensembles sans l'axiome de fondation est sans
trine de limitation de la taille. contradiction, alors celle qui inclut cet axiome
Ce qui e s t encore plus étrange, c'est que l'est aussi.
l'axiome de fondation n'est jamais utilisé par les Le pas franchi par P. Aczel, et indépendam-
mathématiciens. Ils e m ~ l o i e n tous
t les autres ment par M. Forti et F.Honsell. de l'université de
axiomes, m a i s se p a s s e n t de celui-là. On a Pise, consiste à augmenter l'ontologie a u maxi-
l'impression qu'il satisfait seulement les logi- mum, a u lieu de chercher à la minimiser. Accep-
ciens qui, grâce à lui, démontrent que tout tons l'idée que certains ensembles appartiennent
ensemble est le résultat d'une construction pro- à eux-mêmes, comme on accepte l'idée que des
gressive à partir de l'ensemble vide et contrôlent nombres ont un carré négatif, et imposons par un
ainsi l'«ontologie»,c'est-à-dire la quantité d'objets axiome spécial qu'il en existe de toutes les sortes
susceptibles d'exister. imaginables.
3. En théorie classique des ensembles tous les ensembles peuvent être construits hiérarchiquement à partir de
l'ensemble vide 0.Notamment, les nombres naturels O , 1 , 2 , 3 ont la définition ensembliste indiquée ici.
130 LOGIQUE, INFORMATIQ CE ET PARADOXES
phrase ((Je mens)) peut être représentée par wise et J . Perry qui, il y a dix ans, bouleversa le
l'hyperensemble M =(faux,{ M ) }(aucun ensemble domaine de l a sémantique du langage naturel ;
M ne pourrait figurer dans une telle relation). elle transpose la doctrine de la limitation de la
Nous ne pouvons décrire ici en détail la solution taille du domaine des ensembles vers le domaine
proposée ; l'idée est d'établir que, dans toute de la sémantique.
phrase, il existe un paramètre de situation qui ne Récemment le mathématicien belge Luc Lis-
peut se référer à la totalité du monde. Leur ana- mont a proposé une application de la théorie des
lyse est liée à la théorie des situations de J. Bar- hyperensembles à la théorie des jeux à informa-
croire qu'un résultat peut être long à démontrer trations, et c'est là un exemple de l'effet négatif et
dans tout système formel. Voyons pourquoi. aveuglant d'une position philosophique trop
réductionniste.
Système formel ad hoc Les m a t h é m a t i c i e n s e n g é n é r a l s o n t
d'accord pour retenir et faire jouer un rôle privi-
Dans la présentation des systèmes formels, légié à certains systèmes formels particuliers.
on distingue les axiomes (qui sont les connais- Nous n'allons pas ici tenter de faire la liste de
sances de base à partir desquelles on démarre les ces systèmes m a t u r e l s ) ) : le système formel
démonstrations) et les règles d'inférence, qui usuel de la théorie des ensembles - qui est très
décrivent les manipulations syntaxiques autori- puissant - peut servir de référence. Sauf men-
sées pour avancer pas à pas dans une démonstra- tion contraire, lorsque nous parlerons de lon-
tion /voir l'exemple de système formel de la figure 1). gueur d'une démonstration, il s e r a sous-
Soit un système formel donné (parses axiomes et entendu que nous nous référons à la longueur de
ses règles d'inférence) et soit un théorème T qui cette démonstration dans le système formel
s'y démontre avec une démonstration d'une lon- usuel de la théorie des ensembles auquel nous
gueur de un million de symboles par exemple. ne touchons plus.
Soit maintenant le système formel obtenu en pre- Un premier résultat repose encore sur une
nant les mêmes règles d'inférence et les mêmes idée mathématiquement simple : pour tout entier
axiomes, auxquels on ajoute T lui-même comme ( p a r exemple 1001, il existe u n e n t i e r ( p a r
axiome. 11 est identique en tout point a u précé- exemple 1000 000) tel que tous les théorèmes du
dent, mais possède l'axiome T en plus. Ce nou- système formel de la théorie des ensembles de
veau système est non contradictoire si le premier longueur inférieure à 100 possèdent une démons-
l'était (car on a ajouté un axiome qui était démon- tration de longueur inférieure à 1000 000. Sous
trable dans le premier). Dans ce nouveau sys- forme générale : pour tout n , il existe un nombre
tème, la démonstration de T est très courte, elle a $(ni tel que tous les théorèmes dont l'énoncé est
le même nombre de symboles que
T : puisque T est u n axiome, l a
démonstration de T consiste juste
en l'écriture de T! Puis-je faire vérifier
L'ordinateur peut-il traiter
Aussi bête qu'il soit, ce petit mes démonstrations
mes conjectures?
par l'ordinateur?
raisonnement est fondamental : il
montre qu'un théorème n'a pas
une preuve longue dans tout sys-
tème formel.
De notre remarque qu'on peut
toujours considérer un théorème
comme u n axiome, on pourrait
conclure que tout est terminé et
que nous avons montré que l a
recherche d'une notion satisfai-
sante de longueur de démonstra-
tion est absurde. Oui ..., sauf si on
accepte de privilégier certains sys-
tèmes formels auxquels on se réfé-
rera de manière constante et dont
on r e f u s e r a d e compléter les
axiomes p a r n'importe quoi.
Un formaliste extrême accep-
tera difficilement de franchir ce
pas, car, pour lui, tous les systèmes 2. Vérifier des démonstrationsest toujours faisable par ordinateur, même
si, en pratique, cela n'est pas très facile. En revanche, lorsqu'un système
formels se valent et aucun ne doit formel est assez puissant (comme le sont ceux qu'utilisent les mathémati-
donc être privilégié. Un formaliste ciens), alors le théorème de Church nous dit qu'aucun algorithme ne peut,
extrême ne peut donc sans doute pour toute formule, indiquer si c'est un théorème ou non. Indépendamment
de toute considération sur les limites techniques des ordinateurs, on peut
pas donner un sens aux donc dire que jamais on ne réussira à construire des ordinateurs pouvant
tions sur la longueur des démons- se substituer totalement aux mathématiciens.
136 LOGIQUE, INFORMATIQUE ETPARADOXES
de longueur inférieure à n possèdent une plus grand nombres 1(1),1(2),...,l@). C'est lui que
démonstration de longueur inférieure à 4(n). nous prenons pour Uni. Une courte réflexion
En effet, fixons la valeur de n et soient T(lj, montre qu'il convient.
T ( 2 ) ,..., T(p) les théorèmes de la théorie des C'est une bien belle démonstration, mais elle
ensembles dont l'énoncé est de taille inférieure à laisse un peu insatisfait, car si elle montre que $ln)
n. Ces théorèmes sont en nombre fini, car, avec un peut être défini, elle ne donne pas la moindre idée
nombre fini n de symboles, on ne peut écrire sur sa nature en fonction de n. Peut-on être plus
qu'un nombre fini de formules de longueur infé- précis? Ce @(n)est-il égal à Ion? Ce serait bien pra-
rieure à n (notons ici que les mathématiciens uti- tique, car, pour démontrer un théorème de lon-
lisent un peu plus de symboles que le langage gueur n, on saurait qu'il est inutile d'en chercher
écrit usuel, mais ils n'en utilisent qu'un nombre des démonstrations plus longues que 10n. Ce
fini et, de toute facon, le système formel de la nombre @(n)est-il égal à 2"? Son utilisation serait
théorie des ensembles aui nous sert de référence déjà plus difficile. Ce @in)est-il égal à 1 OOOn'?
ne nécessite pas plus d'une centaine de sym-
boles). Désignons par l(1) la longueur de la plus
Une fonction pire que tout
courte démonstration de T ( 1. ),: de même. dési-
gnons par L(2) la longueur de la plus courte La réponse est que 6in) est encore bien pire
démonstration de T ( 2 ) ,etc., jusqu'à L@). Soit le que tout cela ... et que tout ce que vous pouvez
imaginer. En effet, quelle que soit la fonction que
vous définirez avec des puissances, des facto-
LE PROBLÈMEDU CALCUL DE LA FONCTION O(n) rielles et tout ce qu'il vous plaira (pourvu que
vous soyez précis et décriviez bien un moyen de
n2 AUGMENTE PLUS RAPIDEMENT QUE n calcul de @(n),cette fonction sera insuffisante.
zn AUGMENTE PLUS RAPIDEMENT QUE 2 Ainsi la fonction U n ) converge vers l'infini
u
nn AUGMENTE PLUS RAPIDEMENT QUE 2" plus vite que toutes les fonctions calculables par
n algorithme. Dit autrement : toute fonction ten-
dant vers l'infini. définissable à l'aide d'un
( n NIVEAUX D'EXPOSANTS)
nnnn . AUGMENTE ENCORE PLUS programme d'ordinateur, est plus petite que 4(n)
f(n) = n pour certaines valeurs de n. Il en résulte immé-
RAPIDEMENT,
fini diatement que la fonction $in) n'est pas calcu-
f(fl) ('f(n) NIVEAUX D'EXPOSANTS)
lable par programme.
g(n) = f(n)'(") AUGMENTE ENCORE PLUS La démonstration de cette affirmation sur la
RAPIDEMENT, nature de @(n)repose sur un résultat de la théorie
de la démonstration dû à Church, qui l'a établi en
s(ni' (gin) NIVEAUX D'EXPOSANTS)
1936, en même temps que le mathématicien
k(n) = g(n)g(n) AUGMENTE ENCORE PLUS anglais Turing (coir le chapitre 2). Ce résultat
RAPIDEMENT, n'est pas sans rapport avec le théorème de Godel,
..... mais ne doit pas être confondu avec lui. Le théo-
Q(n) AUGMENTE PLUS RAPIDEMENT QUE TOUTES rème de Church est : il n'existe pas d'algorithme
LES FONCTIONS DONT ON PEUT DONNER qui, pour tout énoncé de la théorie des ensembles,
UNE METHODE EFFECTIVE DE CALCUL indique s'il s'agit d'un théorème ou pas. Le théo-
3. Il existe une fonction o(n) qui a la propriété suivante :
rème original de Church ne concernait pas la théo-
si un théorème est démontrable dans la théorie des rie des ensembles, mais il s'y adapte facilement.
ensembles et s'écrit avec moins de n symboles, alors il Nous ne démontrerons pas le théorème de
possède une démonstration de moins de $(n) symboles.
Connaître cette fonction permettrait (en théorie) de Church, trop compliqué ; en revanche, la démons-
répondre mécaniquement à des questions comme -le tration de son corollaire concernant @(n)est d'une
grand théorème de Fermat est-il démontrable en théorie clarté cristalline : nous ne résistons pas au plaisir
des ensembles?,,.Il suffirait, en effet, de mesurerprécisé-
ment la longueur de l'énoncé du théorème de Fermat (par de l'indiquer (les lecteurs ennuyés de ces démons-
exemple 100),puis de rechercher,parmi la liste finie des trations peuvent passer au paragraphe suivant).
démonstrationsde longueur inférieure à $(100),s'il y en a Supposons qu'il existe une fonction g(n) calcu-
une qui démontre le théorème de Fermat. Malheureuse-
ment cette fonction p(n) n'est pas calculable :aucun pro- lable par algorithme qui ne soit jamais plus petite
gramme d'ordinateur n'en donne les valeurs. De plus, que @(n). Alors, en u t i l i s a n t g ( n ) , je peux
o(n) est plus rapidement croissante que n'importe quelle construire un algorithme qui m'indiquera, pour
fonction calculable et, donc, même si on arrivait à la
connaître pour certaines valeurs de n, il serait impos- chaque formule F de la théorie des ensembles, si
sible de l'utiliser en pratique. c'est u n théorème ou pas de cette théorie (ce
LONGUErR DES DE-VONSTRATIONS 137
pour avoir une notion bien définie de longueur de énoncés indécidables de Godel, il y a toujours une
démonstration, nous continuons à prendre la codification et qu'accepter l'énoncé affirmant la
théorie des ensembles comme svstème formel de non-contradiction de S nécessite d'en accepter le
référence, c'est que nous as70nsde bonnes raisons sens, mais nécessite aussi d'accepter que la tra-
de croire à sa non-contradiction. Il y a a u moins duction a u sein même de S de l'affirmation de
deux arguments possibles : (1) jamais, en l'utili- non-contradiction est correctement menée, ce qui
sant, nous n'avons trouvé de contradiction, (21 il ne va pas de soi, car cette traduction est compli-
est fondé sur des idées intuitives qui apparais- quée. D'autres arguments, qui donnent des rôles
sent apriori non contradictoires. Si nous avons de particuliers à certains systèmes formels et
bonnes raisons de croire à la non-contradiction de conduisent donc à les faire apparaître comme des
la théorie des ensembles. autant utiliser comme systèmes absolus dont on ne doit pas chercher à
système formel de référence un système qui com- s'échapper et sur lesquels on peut s'appuyer pour
porte l'affirmation de cette non-contradiction. formuler u n e définition de l a longueur des
Mais alors, d'après le résultat de A. Ehrenfeucht démonstrations, ont aussi été proposés récem-
et J. Mycielski, la longueur de certaines démons- ment par deux logiciens américains : S. Fefer-
trations sera réduite d'un facteur aussi grand man, de YUniversjté de Stanford, et S. Simpson,
qu'on le veut. Et donc, la notion de longueur d'une de l'université d'Etat de Pennsylvanie. L'affaire
démonstration n'a pas vraiment de sens absolu. n'est donc pas réglée, et seuls des progrès en
L'association du théorème d'incomplétude logique mathématique et dans l'interprétation
de Gode1 et des résultats de A. Ehrenfeucht et philosophique des résultats d'incomplétude per-
J. Mycielski nous a ramenés à la situation que mettront d'aller plus loin.
nous décrivions après notre première remarque : Le problème de la longueur des démonstra-
aucun système formel naturel ne peut être choisi tions est très loin d'être réglé pour une autre rai-
pour déterminer une notion de longueur de son plus anecdotique, mais amusante à mention-
preuve. Dès qu'on en tient un qu'on croit satisfai- ner. En effet, une situation étrange persiste à
sant, tout de suite un autre encore meilleur se propos de l'article de Gode1 de 1936,dans lequel il
présente à l'esprit, dans lequel certaines démons- énonça pour la première fois des résultats de
trations sont considérablement écourtées. speed up. Cet article était uniquement un résumé ;
Beaucoup de logiciens aujourd'hui sont prêts il ne contenait aucune démonstration, et Gode1
à en conclure qu'il n'y a aucune notion intrin- n'a jamais publié de démonstration des affirma-
sèque et absolue de longueur de démonstration. tions de cet article. Certaines d'entre elles ont été
J e considère cela comme très gênant, car alors démontrées depuis, mais. un des résultats de
toutes les remarques que naturellement les Godel dit que, lokqu'on mesure la longueur d'une
mathématiciens font entre eux. sur la difficulté démonstration par son nombre de lignes (sans
des théorèmes, ne seraient qu'illusions et non- tenir compte de la longueur des lignes), il y a
sens. C'est dur à admettre. speed up entre la logique d'ordre n et celle d'ordre
Une solution consiste peut-être à regarder les n + 1 (la logique d'ordre 1 est une logique où les
indécidables de Godel comme des énoncés parti- variables ne peuvent désigner que les objets de
culiers (y compris ceux affirmant la non-contra- base ; la logique d'ordre 2 est une logique où cer-
diction du système qu'on utilise) et à ne pas leur taines variables euv vent désigner des ensembles
u
attribuer la même évidence intuitive qu'aux d'objets de base, etc.). Pour n supérieur à 1,per-
autres énoncés mathématiques choisis comme sonne aujourd'hui n'a réussi à redémontrer le
axiomes, e t donc à ne pas considérer comme résultat de Godel. En fait, les spécialistes doutent
allant de soi le système S' dès qu'on a accepté S. un peu que Gode1 ait réellement découvert une
En un mot, il faut résister à la tentation d'ajouter démonstration complète de ce qu'il affirmait. On
des énoncés de non-contradiction. Le logicien phi- est donc dans une situation analogue à celle qui
losophe D. Isaacson, de l'université d'Oxford, a régnait concernant le grand théorème de Fermat.
récemment défendu ce type d'arguments à propos .
Cette situation montre bien aue. même si l'on
z
Les tenants du réalisme abstrait, disciples quantique. Si la mécanique quantique est cor-
d'Einstein et de Louis de Broglie, hésitent à affir- recte et complète (si elle décrit toute la réalité),
mer la possibilité de compréhension du monde alors il faut accepter un indéterminisme fonda-
physique par l'homme, mais au fond ils croient en mental (et pas seulement subjectif). Si la méca-
cette possibilité. Malheureusement, aussi impré- nique quantique est correcte, alors la loi de sépa-
cise que soit sa définition, le réalisme abstrait est rabilité forte, affirmant que tout dans l'univers
aussi bousculé par les résultats de la mécanique est localisé et qu'aucun rapport instantané n'est
hi7
1.P h i l o s o p h i e s du j o u r e t de la nuit.
142 LOGIQUE, INFOR.IIATIQL'E ET PARAL)OXES
que ce qu'on avait imaginé jusqu'à présent : des demande, pour chaque valeur de ce paramètre, si
classes entières d'énoncés possédant un sens très l'équation a un nombre fini ou infini de solutions.
simple (relatif au degré de complexité de suites Or un système formel ne peut traiter qu'un
finies de zéro ou de un, ou relatif au nombre de nombre fini de cas, et ce nombre est approximati-
solutions d'équations élémentaires) échappent vement égal au nombre de symboles nécessaires
inévitablement au pouvoir de tout formalisme. à le décrire : aucun système d'axiomes ne fait
Chaitin, en 1987, a par exemple construit une donc mieux que l'énumération bête d'un nombre
équation ne faisant intervenir que des nombres fini de cas, tout le reste demeurant inconnu, tout
entiers qui met au défi tout système formel : cette le reste étant indécidable. Chaitin a aussi démon-
équation inclut u n p a r a m è t r e n e t l'on se tré que les énoncés de la forme d'objet S peut être
6. LE THÉORÈMEDE LOWENHEIM-SKOLEM de la théo- ait quelque chose à atteindre. En théorie des ensembles,
rie des modèles (une branche de la logique mathéma- le théorème de Lowenheim-Skolementraîne qu'il existe
tique) entraîne que même si on connaît toutes les phrases des modèles dénombrables des axiomes de la théorie des
vraies qu'on peut énoncer à propos du monde, alors il ensembles, et bien que cela ne conduise à aucune contra-
existe d'autres mondes différents vérifiant les mêmes diction à l'intérieur de la théorie des ensembles, c'est un
phrases (et donc semblables en apparence). Cette impos- résultat qui fait douter de la réalité authentique des
sibilité de principe d'atteindre le vrai monde, est, bien ensembles non dénombrables, et donc de la réalité du
sûr, très grave pour un réaliste, car elle fait doumr qu'il y monde des ensembles.
148 LOGIQUE, INE'ORMATIQ C% ET PARADOXES
décrit en n symboles et ne peut pas être décrit en l'hypothèse du continu, et divers autres axiomes
moins de n symboles,, sont tous des indécidables rendent cette inconnaissabilité encore plus grave
de Godel, sauf un nombre fini d'entre eux. Autre- et énigmatique.
ment dit aucun système d'axiomes ne traitera
bien le problème des descriptions minimales. L'axiome du choix
Cette première mise en cause du réalisme
mathématique est aggravée par une série de Présentons le problème à propos de l'axiome
résultats en théorie des modèles (les premiers du choix. Cet axiome indique qu'à chaque fois
datent de 1915) qui énoncent que si un système qu'un ensemble E d'ensembles non vides est
d'axiomes du calcul des prédicats possède un donné, on peut choisir un élément dans chacun
modèle (c'est-à-dire une structure satisfaisant d'eux et les regrouper en un nouvel ensemble
tous les axiomes) alors il en a plusieurs, et ces dont l'axiome affirme l'existence. Enoncé sous
modèles ne sont pas tous isomorphes (c'est-à- cette forme, cet axiome semble évident, c'est-à-
dire semblables) d a n s les cas intéressants dire qu'il semble devoir ê t r e vérifié parce
comme l'arithmétique et la théorie formalisée qu'intuitivement nous pensons ê t r e les
des ensembles. Ces modèles non standard - dont ensembles. Or cet axiome a aussi des consé-
l'existence est à la base de l'analyse non stan- quences qui s'opposent à l'intuition, comme par
dard, laquelle fournit une théorie rigoureuse des exemple qu'il est possible de trouver un bon ordre
infinitésimaux, chers aux physiciens - sont par- pour l'ensemble des nombres réels (un ordre dif-
ticulièrement troublants pour le réalisme du férent de l'ordre usuel tel que toute partie non
continu e t pour le réalisme des ensembles. vide possède un plus petit élément). Ce bon ordre
puisqu'ils impliquent que la notion de dénom- personne ne l'a jamais trouvé et on sait, grâce à
brabilité n'est pas absolue et que si la théorie des d'autres résultats de logique, qu'on ne peut en
ensembles est cohérente, alors elle possède des démontrer l'existence sans utiliser l'axiome du
modèles dénombrables (paradoxe de Skolem),ce choix. Nous nous trouvons dans la situation sui-
qui est contraire à toute intuition. Dans un vante : l'axiome du choix nous indique qu'un cer-
modèle dénombrable de l a théorie des tain objet existe, mais cet objet par nature n'est
ensembles, les nombres réels sont «extérieure- pas constructible.
ment dénombrables))et intérieurement non Faut-il admettre l'axiome du choix ou faut-il
dénombrables ... La situation est pour le moins ne pas l'admettre? En langage réaliste : les
inconfortable. Le philosophe américain H. Put- ensembles véritables vérifient-ils l'axiome du
nam, à la suite de W. Quine, considère que les choix ou ne le vérifient-ils pas? Le problème est
questions posées par ces théorèmes de la théorie devenu encore plus gênant depuis qu'il a été éta-
des modèles sont parmi les plus importants de la bli que si la théorie des ensembles sans axiome du
philosophie du X X ~siècle. choix est non contradictoire (ce que tout le monde
La question des axiomes de la théorie des croit) alors il en est de même de la théorie des
ensembles pose des problèmes encore plus graves ensembles avec l'axiome du choix et de la théorie
au réalisme. La théorie des ensembles joue en des ensembles avec la négation de l'axiome du
effet un rôle tout à fait particulier en philosophie choix. Autrement dit, du point de vue logique de
des mathématiques : les ensembles sont des la cohérence, tout est également possible concer-
briques élémentaires et les opérations de base nant cet axiome : il y ((autantde chances» que les
qu'on peut faire avec elles permettent d'assem- ((véritables ensembles), le satisfassent, ou qu'ils
bler toutes les structures qu'on souhaite. Finale- ne le satisfassent pas. Le réel, là aussi, serait
ment la version actuelle du réalisme platonicien sous-déterminé, et tout choix concernant cet
se limite bien souvent à la croyance en une exis- axiome apparaît arbitraire et surdéterminant.
tence véritable des ensembles et tout argument Ces difficultés techniques peuvent laisser
contre le réalisme ensembliste est, à la lumière indifférent, mais ce n'est pas le cas de ce qu'on
des mathématiques contemporaines, un argu- appelle le problème de l'accès. Alors qu'en phy-
ment général contre le réalisme mathématique. sique entre deux théories concurrentes, l'expé-
Qu'il soit impossible de trouver un système for- rience nous permet - i n fine - de choisir, en
mel exprimant complètement les propriétés de mathématiques, mis à part les très rares situa-
l'univers des ensembles, cela résulte du théorème tions où une théorie se trouve être contradictoire,
de Godel. Une certaine inconnaissabilité irréduc- on se demande ce qui doit déterminer nos choix.
tible touche donc déjà la théorie des ensembles. Soutenir comme le fait K. Gode1 que notre intui-
Mais les problèmes posés par l'axiome du choix, tion est ce moyen ultime qui nous donne accès à la
LE RÉALISME E N MATHEMATIQCES ET EN PHYSIQUE 149
crise, celle-ci ne faisant sans doute pas exception, lifions de réalisme de principe ou de .réalisme
étend les domaines de validité (la mécanique lointain». Leur position consiste à dire que, par
newtonienne fait toujours tenir les ponts et les principe, il ne peut y avoir de pensée scientifique
démonstrations de Pythagore sont toujours sans réalisme, tout en admettant qu'il y a de véri-
justes) et ne permet pas le retour des vieilles tables problèmes. Ils refusent de s'enfermer dans
superstitions... une doctrine étroite et refusent aussi de dire que
Reconnaissons-le, rares sont les scientifiques tout est remis en cause. Ils reconnaissent le pro-
qui renoncent ainsi à la science : plus prudents et blème, admettent son importance et savent que
taciturnes, ils sont plutôt portés vers l'attitude de les solutions simples ne sont plus possibles. C'est
l'autruche et ils disent : «En fait toutes ces his- l ' a t t i t u d e des physiciens qui essayent de
toires ne sont pas très importantes. Rares sont les construire un nouveau réalisme, aujourd'hui plu-
zones du savoir scientifique qui sont gênées par tôt flou, plus négatif qu'affirmatif. L'inconnaissa-
les problèmes du réalisme ou, plus précisément, bilité de principe ne peut pas être exclue, c'est
qui n'arrivent pas à le concilier avec la prétention peut-être en l'admettant que nous construirons la
de complétude. La biologie n'a aucun problème de meilleure position rationnelle, et en mathéma-
réalisme, la chimie non plus, ni la paléontologie, tiques au moins, il faut considérer qu'elle est défi-
ni même l'astrophysique et la cosmologie, ni la nitivement établie. Le réel est nécessaire, mais il
plupart des branches de la physique. Si la méca- semble aussi nécessaire qu'il soit inconnaissable.
nique quantique est plus fondamentale, les diffi- Des quatre réactions possibles face aux diffi-
cultés qu'elle éprouve aujourd'hui à s'accorder cultés du réalisme, la dernière nous semble la
avec le réalisme (qui partout ailleurs fonctionne si meilleure, e t si le choix doit se faire entre le
bien) nous montrent que c'est elle qui est étrange. monde réduit des calculs, celui des fantasmes des
En mathématiques, là encore, le réalisme ne pose nouveaux irrationalistes, celui de l'incohérente
un problème que dans de petites zones peu impor- autruche, et celui du réel ((inconnaissablepar
tantes qui ne semblent pas s'étendre. Alors ces- nature., étonné et peut-être déqus, nous optons
sons de nous intéresser à ces questions stériles et pour le dernier car nous n'arrivons pas à imagi-
avançons. A l'avenir, quand des choses que nous ner le pays de Tlon dont les habitants nous dit
ne voyons pas auront surgi, ces problèmes très J. L. Borges «affirment que l'opération de comp-
localisés se résoudront d'eux-mêmes.. ter modifie les quantités et les convertit d'indéfi-
Il s'agit d'une attitude délibérée : on veut évi- nies en définies», où, lorsque %deuxpersonnes
ter la «maladie» et on cherche à en nier l'impor- cherchent un crayon perdu ; la première le trouve
tance pour retourner travailler, l'âme tranquille, et ne dit rien ; la seconde trouve un deuxième
aux «vrais problèmes,). Certains, e t nous en crayon, non moins réel mais plus conforme à son
sommes, ne réussissent pas à oublier les difficul- attente» et où (classique est l'exemple d'un seuil
tés entrevues et ne veulent pas renoncer à la réa- qui subsista tant qu'un mendiant s'y rendit et
lité : ils adoptent alors une attitude que nous qua- qu'on perdit de vue à la mort de celui-ci».
Bibliographie
Chapitres 1 et 2
Calculabilité et indécidabilité
J.-M. AUTEBERT, Calculabilité et décidabilité : S. FERFERMAN, Kurt Godel : Conviction and
une introduction, éditions Masson, 1992. Caution, in Philosophia Naturalis, vol. 21, no 2-4,
J . BARWISE, Handbook of Mathematical pp. 546-562,1984.
Logic, in Studies in Logic, n-O, North-Holland K. GODEL,Collected Works :volume 1, Publi-
Publishing Company, 1977. cations 1929-1936 ; volume II, Publications 1936-
R. BERGER,The Undecidability of the 1974, 1990. sous la direction de S. Feferman,
Domino Problem, in Memoirs Amer. Math. Soc., J.W. Dawson, S.C. Kleene, G.H. Moore, R.M. Solo-
no 66, pp. 1-72,1966. vay et J. van Heijenoort, Oxford University Press,
G.J. CHAITIN,Information, Randomness and 1986.
Incompleteness :Papers on Algorithmic Informa- R.GO~EL,Historyof the Gode1Family, in Godel
tion Theory, World Scientific, 1987. Remenbered, sous la direction de P. Weingartner et
R. CORIet D. LASCAR, Logique Mathématique, L. Schmetterer, Bibliopolis, pp. 11-27,1987.
deux tomes, éditions Masson, 1993. P.J. COHEN,Set Theory and the Continuum
M. DAUCHET, Termination of Rewriting is Hypothesis, Benjamin, 1966.
Undecidable in the One-Rule Case, MCFS, Sprin- P. MADDY, Realism in Mathematics, Claren-
ger-Verlag, L.N.C.S. 324, pp. 262-268, 1988. don Press, 1990.
M. DAVIS,Hilbert2 Tenth Problem is Unsol- H. WANG,From Mathematics to Philosophy,
cable, inAmerican Mathematical Monthly, vol. 80, Routledge and Kegan Paul, 1974.
pp. 233-269,1973. H. WANG,Reflections on Kurt Godel, MIT
J.-P. DELAHAYE, Information, complexité et Press. 1988. Traduction française :Réflexions sur
hasard, éditions Hermès, 1994. Kurt Godel, éditions Armand Colin, 1990.
M.J. FISHERet M.O. RABIN,Super Exponen- H. WOODIN,Large Cardinal Axioms a n d
tial Complexity of Presburger's Arithmetic, in Independence: The Continuum Problem Reuisi-
SIAM-AMS Proceedzngs, vol. 7, pp. 27-41? 1974. ted, in Mathematicial Intelligencer, vol. 16, no 3,
R. HERKENé d . , The Universal T u r i n g pp. 31-35,1994.
Machine, A Half-Century Suruey, Oxford Univer-
sity Press, 1988. Chapitre 3
H. ROGERS, Theory of Recursive Function and Machines, prédictions et fin du monde
Effective Computability, McGraw-Hill, 1967.
A. SALOMAA, Computation a n d Automata, E. AKIN,The Spiteful Computer :A Determi-
Cambridge University Press, 1985. Traduction nism Paradox, in The Mathematical Intelligencer,
française : Introduction à l'informatique théo- vol. 14, no 2, pp. 45-47,1992 ;vol. 15, no 2, pp. 3-5,
rique :calculabilité et complexité, éditions 1993.
Armand Colin, 1989. J.D. BARROW et F.J. TIPLER,The Anthropic
A.M. TURING,On Computable Numbers, uith Cosmological Principle, Oxford University Press,
a n Application to the Entscheidungsproblem, in 1988.
Proceeding of the London Mathematical Society, J. LESLIE,Uniuerses. Routledge, 1989.
vol. 42, pp. 230-265, 1936-1937 ; vol. 43, pp. 544- J. LESLIE,Time and the Anthropic Principle, in
546,1937. Mind, vol. 101, no 403, pp. 521-540, juillet 1992.
P.,WOLPER,Introduction à la calculabilité, J. LESLIE,The End of the World, Routledge,
InterEditions, 1991. 1995.
154 LOGIQUE, INFORMATIQCE ET PARAûOXES
05/92 (Fachbereich Mathematik und Informatik of Cooperation, inscience, vol. 211, no27, pp. 1390-
Technische Hochschule Leipzig), 1992. 1396,1981.
D. OSHERSON, L a rationalité et l'enquête R. AXELROD et D. DION,The FurtherEvolution
scientifique, i n I n t r o d u c t i o n a u x sciences of Cooperation, in Science, vol. 242, no 9, pp. 1385-
cognitives, Andler ( é d i t e u r ) , éditions Folio 1390,1988.
Essais, pp. 291-310, 1992. R. BOYDet J.P. LORBERBAUM, No Pure Stra-
D. OSHERSON, M. STROB et S. WEINSTEIN, Sys- tegy is Evolutionarily Stable in the Repeated Pri-
tems that Learn, MIT Press, 1986. sonerS Dilemma Game, in Nature, vol. 327, no 7,
L. PITT,Probabilistic Inductive Inference, in pp. 58-59, 1987.
J of the Association for Computing Machinery, J.-P. DELAHAYE et P. MATHIEU, Expériences
vol. 36, no 2, pp. 383-433, 1989. sur le dilemme itéré des prisonniers, Rapports de
R. WIEHAGEN,A Thesis in Inductive Inference, Recherche du Laboratoire d'Informatique Fonda-
i n Nonmonotonic a n d Inductive Logic, Dix, mentale de Lille, no 233, juin 1992 et no 229, mai
Jantke. Schmitt (éditeurs). Lecture Notes in Arti- 1993.
ficial ~ i t e l l i ~ e n cspringhr-Vedag,
e, pp. 184-207, P. MOLANDER, The Optimal Level of Generosity
1991. in a Selfish, Uncertain Environment, i n J. of
ConflictResolution, s7ol. 29, no4, pp. 611-618,1985.
Chapitre 10 M. NOWAK et K. S I G ~ ~ UTit
N DFor
, Tat in Hete-
Les virus rogeneous Populations, in Nature, vol. 355, no 16,
J. BRUNNER, The Shockwave Rider, Harper pp. 250-253,1992.
and Row Publisher, New York 1975. Traduction M. NOWAK et K. S I G ~ N DOscillations
, in the
francaise :Sur l'onde de choc, éditions Robert Laf- Evolution of Reciprocity, in J Theo. Biology, vol.
font, 1977. 137, pp. 21-26,1989.
F.COHEN,Computational Aspects of Compu- M. NOWAK, Stochastic Strategies in the Priso-
ter Viruses, in Computer and Security, vol. 8, no 4, ner's Dilemma, in Theoretical Population Bio.,
1989. vol. 38, pp. 93-112,1990,
W.F. DOOLITTLE et C. SAPIEKZA, Selfish Genes, W. POUNDSTONE, Prisoner's Dilemma, Oxford
the Phenotype Paradigm and Genome Evolution, University Press, 1993.
in Nature, vol. 284, pp. 601-603,1980.
D. FERBRACHE, A Pathology of Computer Chapitre 13
Viruses, Springer-Verlag, 1992 Algorithmes et preuves probabilistes
P. HERBOMEL, Voyage a u cœur de l'ADN, in L.M. ADLEMAN et M.A. H ~ A K G
Primality
, Tes-
Science et Vie, numéro hors-série, pp. 42-50, sep- ting a n d Abelian Varieties Over Finite Fields,
tembre 1993. Springer-Verlag, 1992.
W.-H. LI et D. GRAER,Molecular Evolution, D. JOHNSON,A Catalog of Complexity Classes,
Sinauer Associates Inc. Publishers, 1991. in Handbook of Theoretical Computer Science,
L.E. ORGELet F.H. CRICK,Selfish DNA : the van Leeuven (éditeur), Elsevier Science Publi-
Ultimate Parasite, in Nature, vol. 284, pp. 604- shers, pp. 67-161,1990.
607,1980. A.N. KOLMOGOROV et V.A. USPENSKII, Algo-
I.J. RENNIE, Parasites et écolution, in Pour La rithms a n d Randomness, in SIAM Theory Pro-
Science, pp. 69-77, avril 1992. bab. Appl., vol. 32, pp. 389-412, 1987.
R. SLADE,Guide to Computer Viruses, Sprin- A.K. LENSTRA et H.W LENSTRA, Jr.,Algorithm
ger-Verlag, 1994. in Number Theory, in Handbook of Theoretical
E.H. SPAFFORD, Computer Viruses -A Form of Computer Science, van Leeuven (éditeur), Else-
Artificial Life, in Artificial Life II, SFI Studies in vier Science Publishers, pp. 67- 161,1990.
the Science of Complexity X, Langton, Taylor, Far- G.L. MILLER, Riemann%Hypothesis and Tests
mer, Rasmussen (éditeurs), Addison Wesley, pp. for Primality, i n e7. of Computer a n d System
727-745,1991. Sciences, vol. 13, pp. 300-317, 1976.
F. MORAIN, Courbes elliptiques et tests depri-
Chapitres 11 et 12 malité, Thèse Université de Lyon 1,1990.
L'altruisme récompensé et perfectionné R. RIVEST,Cryptography, in Handbook of Theo-
R. AXELROD, Donnant donnant :Théorie du retical Computer Science, van Leeuven (éditeur),
comportement coopératif, éditions Odile Jacob, Elsevier Science Publishers, pp. 719-755, 1990.
1992. G. ROBIN,Algorithmique et cryptographie,
R. AXELROD et W. D. HAMILTON,The Evolution éditions Ellipse, 1991.
BIBLIOGRAPHIE 157
Chapitre 16 Chapitre 17
Longueur d'une démonstration Le réalisme en mathématiques
S. BUSS,O n Godel's Theorems o n Length of et en physique
Proofs, N u m b e r ofLines and Speed u p forArith- J . B A R W I S EH , a n d b o o k of M a t h e m a t i c a l
metics, in J. o f Symbolic Logic, vol. 59, no3 , pp. Logic, in Studies i n Logic 80, North-Holland Pub.
737-756,1994. Company, 1977.
A. EHRENFECCHT et J. MYCIELSKI, Abbrecia- P. BENACERRAF et H . PUTNAM,Philosophy of
ting Proofs by Adding New Axioms, in Bulletin o f Mathematics : Selected Readings, Cambridge
the American Mathematical Society, vol. 77, n o 3 , University Press, 1983.
pp. 366-367,1971. G. CHAITIN, Information, Randomness and
K. GODEL,Collected Works : volume 1, Publi- Incompletness :Papers on Algorithmic Informa-
cations 1929-1936, sous la direction de S. Fefer- tion Theory, World Scientific, 1988.
m a n , J.W. Dawson, S.C. Kleene, G.H. Moore, R.M. P.J. DAVIS et R. HERSH,L'Univers mathéma-
Solovay et J. v a n Heijenoort, Oxford University tique, éditions Gauthier-Villars, 1982.
Press, 1986. J.-P. DELAHAYE,Information, complexité et
D. ISAACSON, Arithmetical Truth and Hidden hasard, éditions Hermès, 1994.
Higher-Order Concepts, i n Logic Colloquium B. ~ ' E S P A G N ALe T , réel voilé. Analyse des
1985, Paris Logic G r o u p ( é d i t e u r ) , E l s e v i e r concepts q u a n t i q u e s , éditions Fayard, 1994.
Science Publisher, pp. 147-169,1987. D. HOFSTADTER, Godel EscherBach, les brins
D. ISAACSON, Some Considerations o n Arith- d'une guirlande éternelle, InterEditions, 1985.
metical Truth and the w-rule, i n Prool) Logic and A. KANAMORI, The Higher Infinite, Springer-
Formalization, Detlefsen (éditeur), Routledge, Verlag, 1994.
1991. H . PUTNAM,Model and Reality, in The J of
R.J. PARIKH,Some Results o n the Length o f Symbolic Logic, vol. 45, no3 , pp. 464-482, 1980 ;
Proofs, i n Transaction of the American Mathema- i n P h i l o s o p h y of M a t h e m a t i c s : S e l e c t e d
tical Society, vol. 177, pp. 29-36, 1973. Readings, Benacerraf, Putnam (éditeurs), Cam-
D. RUELLE,Hasard et chaos, éditions Odile bridge University Press, 1983.
Jacob, 1991. T. '~'YMOCZKO, New Directions i n the Philoso-
C . S M O R Y N S KTI ,h e Varieties of Arboreal phy o f Mathematics, Birkauser, 1986.
Experience, in Mathematical Intelligencer, vol. 4 , H. WANG,From Mathematics to Philosophy,
pp. 182-189,1982. Routledge and Kegan Paul, 1974.
R . STATMAN,B o u n d for Proof-Search a n d J.C. W E B B M , echanism, Mentalism, and
Speed-up i n the Predicate Calculus, in Annals Metamathematics : A n Essay on Finitism, Reidel,
of Mathematical Logic, vol. 1 5 , pp. 225-287, 1980.
1978. H. W O O D I NLarge , Cardinal Axioms and
A.N. W H I T E H E AeDt R. RUSSELL,Principia Independence : The Continuum Problem Reuisi-
Mathematica, Cambridge University Press, ted, in Mathematical Intelligencer, vol. 16, no 3 ,
1910. pp. 31-35,1994.
l
Références des illustrations ~
Couverture :Mind Sights, par Robert N . Shepart, burg, O Éditions Herscher, Berlin, art libre sur le
Freeman and Company, New York. P. 34 : O Col- M u r . P. 127 : M . C . Escher Foundation, Baarn,
lection Viollet. P. 83 : Photo Hermann Walden- Holland.
l
Imprimé en France par I.M.E. - 25110 Baume-Ies-Dames
Dépôt légal : Seprembre 1995
No édition : 1894-01 - N o impression : 10290