18 | MERCREDI 21 AOÛT 2019
0123
H
ors du monde de la recherche
scientifique, ce titre demeure
parfaitement inconnu. Sans dou
te même ces cinq lettres curieu
sement accolées conserventelles leur mys
tère aux yeux de nombre de médecins,
biologistes, chimistes, archéologues. Mais in
terrogez un mathématicien, un physicien ou
un chercheur en informatique : jeune, il vous
dira qu’arXiv (prononcer « arkaïv », comme
une archive en anglais) constitue sa lecture
quotidienne, le principal lien entre son labo
ratoire et le reste de sa communauté, une évi
dence ; expérimenté, il confiera que le site a
changé sa vie. Ainsi David Elbaz, astrophysi
cien au Commissariat à l’énergie atomique :
« Le site a complètement bouleversé la prati
que des chercheurs dans mon domaine.
Quand j’ai commencé, on passait notre temps
à la bibliothèque à feuilleter les revues qui
venaient de sortir, en cherchant ce qui nous
concernait. Aujourd’hui, quand les articles
sortent, on les a déjà lus sur arXiv. »
Heureux chercheurs de ces disciplines! Au
cours du dernier demisiècle, ils ont connu
pas moins de quatre révolutions. Deux d’en
tre elles ont frappé la société dans son en
semble : l’ordinateur et le World Wide Web,
qui vient de fêter ses trente ans. La troisième,
nettement moins célèbre, réalisée au tour
nant des années 1970 et 1980, a consisté en la
création d’un logiciel de composition des do
cuments techniques, équations comprises,
TeX. « Avec ce langage, son créateur, Donald
Knuth, nous a donné le contrôle sur notre ma
tière première et la capacité d’échanger sans
dépendre d’un imprimeur et sans perte d’infor
mation, souligne Paul Ginsparg, professeur
de physique à l’université Cornell, aux Etats
Unis. Un génie méconnu du grand public. Et
celui sans qui je n’aurais rien pu faire. »
Or c’est à l’homme qui décerne ces lauriers
que l’on doit la dernière révolution : arXiv.
C’est lui qui a conçu et réalisé, entre 1990 et
1991, puis qui a administré le premier site de
dépôt et de consultation d’articles scientifi
ques avant leur publication, ce que les cher
cheurs nomment des preprints. Aujourd’hui
encore, si une équipe de dix personnes et une
armée de 200 modérateurs font tourner la
machine surpuissante, qui avale plusieurs
milliers de nouveaux documents chaque se
maine, lui continue de veiller sur son bébé et
d’arbitrer les conflits. « Je suis enseignant et
chercheur en physique des particules, et j’exerce
encore ces deux activités à temps plein, précise
Paul Ginsparg. Mais cette affaire aura quand
même occupé une bonne partie de ma vie. »
UNE ARCHIVE CRÉÉE EN VACANCES
Difficile, en rencontrant le phénomène, de
croire que l’essentiel de sa carrière est der
rière lui. Certes, sa barbe blanchie et sa ti
gnasse grise sur un front dégarni trahissent
un peu son âge, 63 ans. Mais pour le reste, son
débit imprévisible, ses yeux rougis comme
son apparence vestimentaire figurent plutôt
l’adolescent attardé, tendance geek. Jean et
basket, polo bordeaux, il vous accueille dans
son bureau transparent du Bill and Melinda
Gates Hall, avec un grand sourire, une pince à
vélo oubliée sur sa cheville droite. Il est
11 heures. En ce début du mois de juin, les étu
diants ont déjà déserté l’université Cornell
dans l’Etat de New York, mais les chercheurs
sont à pied d’œuvre. Lorsque, six heures plus
tard, il vous raccompagne à l’arrêt d’autobus,
puis repart au sprint – « je n’ai pas encore
poussé mon rythme cardiaque aujourd’hui »,
atil averti –, la pince à vélo n’a pas bougé.
Entretemps, Paul Ginsparg a fait défiler
l’histoire, en promettant de la raconter « un
peu différemment, sinon [il va s]’ennuyer ».
Celle d’un gamin passionné de sciences, d’un
lycéen de « la première génération à avoir
connu l’ordinateur au lycée », d’un étudiant
avide dont les camarades de classe, à Harvard,
se nomment Bill Gates ou Steve Ballmer.
Comme les premiers patrons de Microsoft,
sans doute, il peut détailler chacune des ma
chines sur lesquelles il a pianoté, les proces
seurs qui les activaient, les mémoires qui les
soutenaient. Mais lui a choisi de s’enivrer
avec les particules et les hautes énergies.
Son liquide favori : la théorie des cordes, une
des grandes tentatives d’unifier la relativité
générale et la mécanique quantique.
En cette fin des années 1980, la littérature
est florissante dans cette communauté. Et la
culture locale favorise le partage. « On s’est
toujours envoyé nos articles avant leur publi
cation afin de profiter des réactions des collè
gues, rappelle Paul Ginsparg. D’abord par la
poste, puis par mails. Jadis, les preprints re
çus étaient rangés sur des rayons, près de la
machine à café ou de la photocopieuse, en
attendant la parution. Puis dans la mémoire
de nos ordinateurs. Mais ce système était
profondément inégalitaire : si vous étiez
comme moi à Harvard, vous aviez accès à
tout. Mais si vous vous trouviez au bas de la
chaîne alimentaire, vous restiez affamé,
privé de nourriture fraîche. »
En 1991, le jeune Paul Ginsparg vient de
quitter Harvard pour le laboratoire national
de Los Alamos, au NouveauMexique, où,
pour la première fois, il dispose de son ordi
nateur personnel. Lors d’un séminaire d’été,
une collègue se plaint. « Elle n’arrivait pas à
stocker tous les preprints dans sa machine. Je
lui ai dit qu’il faudrait faire une archive cen
tralisée avec accès à tous. Et pendant mes
vacances, en Italie, j’en ai écrit les détails. »
Lancée en août, l’archive a été dimension
née pour recevoir une centaine d’articles par
an, conservés quelques mois en attendant
leur publication. « Fin décembre, nous en
avions déjà 300, et 1 200 au bout d’un an, se
souvient Ginsparg. Il faut dire que, dès le
deuxième jour, Ed Witten a posté un preprint. »
Figure de proue de la théorie des cordes, pro
fesseur de physique à Princeton et Médaille
Fields de mathématiques, Witten jouit d’une
aura considérable. Et ne rate rien des nou
veautés qui apparaissent sur les « rayons ».
L’histoire de Lubos Motl, un étudiant en maî
trise de physique de l’université Charles, de
Prague, est entrée dans la légende du site. Le
jeune homme a 22 ans lorsqu’il y dépose,
en 1996, un article qui propose un nouveau
mode de description de la théorie des cordes.
Quelques jours plus tard, il reçoit les compli
ments d’Ed Witten – il croira d’abord à un
canular. Ils seront suivis d’une offre d’accueil
ISABEL ESPANOL
REPÈRES
Création 1991
Fondateur
Paul Ginsparg
Directeur
Greg Morrisett
Propriétaire
université Cornell
de l’université Rutgers, aux EtatsUnis, qui
s’apprêtait justement à publier sur le sujet.
Si Edward Witten a joué les bonnes fées au
dessus du berceau d’arXiv, son messie se
nomme Grigori Perelman. Nous sommes dé
sormais en 2002. Le site a suivi son concep
teur, de Los Alamos à Cornell. Après les théo
riciens des particules, la plupart des disci
plines de la physique l’ont adopté, puis
rapidement le monde des mathématiques.
« Nous avions lancé la section maths en 1998
et ça avait très vite trouvé une masse critique,
se souvient Greg Kuperberg, professeur à
l’université de Californie, à Davis, et respon
sable des modérateurs de la discipline. Mais
l’affaire Perelman a été une déflagration. »
L’INFORMATIQUE CÈDE À SES SIRÈNES
Le 11 novembre, le jeune mathématicien
russe dépose sur le site une démonstration de
la conjecture de Poincaré. Formulée par le gé
nie français en 1904, cette assertion de topo
logie algébrique a résisté à près d’un siècle de
recherche. L’Institut de mathématiques Clay
en a fait un des « sept problèmes du millé
naire », avec 1 million de dollars à la clé. « Son
article ne faisait que 38 pages, rien pour un
problème de cette ampleur, se souvient Kuper
berg, j’avoue avoir été sceptique. » La commu
nauté doute? Perelman poste deux autres ar
ticles dans les mois suivants, consent à faire
quelques conférences aux EtatsUnis. Puis il
rentre en Russie, refuse le million de dollars
et la médaille Fields, qui lui est attribuée
en 2006, et se mure chez sa mère, dans le si
lence. « Aucun de ses papiers n’a été publié. Les
revues ont dû se contenter des articles de vérifi
cation des collègues », savoure Paul Ginsparg.
Depuis lors, arXiv n’a cessé de croître. Après
la physique et les mathématiques, l’informa
tique a cédé à ses sirènes, affolant du même
coup les compteurs. En 2018, pas moins de
150 000 articles ont été déposés sur ses pages
d’une simplicité visuelle monacale. L’équipe
s’engage à publier la proposition dans la jour
née, après un simple « examen sanitaire ».
Les modérateurs, assistés d’un algorithme
d’intelligence artificielle, vérifient donc « que
l’auteur est bien un chercheur, que le contenu
est bien scientifique, qu’il n’est pas directement
plagié et qu’il est cohérent », résume Ginsparg.
« Et nous sommes plus laxistes que vigilants »,
assuretil. Environ 1 % de rejet. Ce qui n’a pas
empêché, en 2002, le créationniste Robert
Gentry d’intenter un procès (perdu) après le
refus d’un de ses textes. Ou plus récemment
le physicien suisse Nicolas Gisin de dénon
cer la censure d’un article sur la relativité
générale proposé par ses étudiants.
Pas de validation par les pairs, pas de ligne
éditoriale ni de classement : « ArXiv n’est pas
une revue, insiste Greg Morrisett, doyen du
département d’informatique de Cornell, qui
abrite désormais le site et lui cherche des
sponsors. Il ne faut pas être gourmand et ten
ter de tout faire. » A la vérité, pourtant, tout un
mouvement éditorial est né dans son giron.
Harold Varmus, Prix Nobel de médecine et
patron des Instituts de la santé américains
(NIH) entre 1993 et 1999, se souvient encore
du « choc » ressenti en découvrant ce « fantas
tique instrument ». « J’ai tout de suite pensé
qu’on pouvait bouleverser notre modèle de pu
blication, mauvais pour la dissémination des
connaissances, affreusement coûteux pour les
grandes institutions et totalement injuste
pour les petites », précisetil. En 1999, il lance
donc PubMed Central, une bibliothèque nu
mérique d’accès libre aux articles de biologie
et médecine. Puis, devant le succès mitigé de
l’opération, il crée, en 2003, avec deux autres
scientifiques, un éditeur de revues à accès
ouvert, PLoS (Public Library of Science).
Avec ses sept revues et sa base de plus de
200 000 articles, PLoS constitue désormais
un acteur majeur de l’édition scientifique. Et
l’open access est l’enjeu central du moment.
Tous les grands groupes ont lancé des revues
ouvertes : les coûts d’édition reposent non
plus sur les lecteurs, mais sur les auteurs qui
payent pour publier. Les publications classi
ques sont passées au modèle hybride, propo
sant donc aux chercheurs de payer pour of
frir leur article à la lecture des nonabonnés.
« Ils gagnent sur les deux tableaux, un scan
dale », soupire Harold Varmus. Changer inté
gralement de système? L’Union européenne
le souhaite. Elle a adopté un programme
(plan S) qui prévoit d’imposer à toute équipe
bénéficiant de fonds européens la publica
tion dans une revue ouverte, à dater de 2021.
De nouveaux services numériques propo
sent d’aller encore plus loin. « Eliminer les re
vues », déclare crânement l’éditeur Vitek
Tracz, qui en a lancé puis revendu plusieurs.
Compagnon de route d’Harold Varmus dans
l’aventure PubMedCentral, il vient de lancer
une plateforme baptisée F1000, qui promet
aux scientifiques diffusion, révision et nota
tion de leurs articles pour un coût infiniment
moindre et en un temps largement réduit.
D’autres projets se mettent en place.
Quant aux preprints, ils ont fait de nou
veaux adeptes. La biologie et la médecine,
longtemps rétives, de peur de perdre la pater
nité de leurs inventions, s’y sont converties.
BioRxiv a trouvé une vitesse de croisière.
MedRxiv a pris son envol, comme du reste
ChemRxiv, dans une discipline, la chimie,
pourtant travaillée par la culture du secret,
brevet oblige, ou encore PsyArXiv. Le tout
sous le regard bienveillant du grand ancien.
La success story serait parfaite sans deux
soucis. D’abord, trouver de l’argent pour
moderniser le site et stabiliser la structure,
qui fonctionne aujourd’hui avec moins de
1 million de dollars de budget. Le doyen
Greg Morrisett cherche donc 20 millions de
dollars pour instaurer un fonds de dotation.
Et préparer l’aprèsGinsparg. Personne n’ose
trop en parler, tant le physicien personna
lise l’aventure. Lui pourtant n’élude pas.
« J’ai l’impression d’avoir fait un enfant, de
l’avoir envoyé à l’université, et de le voir tou
jours assis dans le canapé du salon. » Il sourit :
« Mon rêve de vie, ce n’est pas faire l’assistance
sept jours sur sept d’un site informatique. C’est
de vivre libre, marcher dans l’Himalaya, assis
ter à des conférences, chercher à résoudre des
problèmes de maths ou de physique. » Difficile
d’être un père comblé.
nathaniel herzberg
FIN
« arXiv », la boîte aux lettres scientifique
à l’origine d’une révolution éditoriale
SOUS L’EMPIRE DES REVUES 6 | 6 Actrice centrale de la recherche, l’édition scientifique traverse aujourd’hui
des turbulences. Cette semaine, à la découverte de l’archive numérique pionnière de l’« open access »
L’ÉTÉ DES SCIENCES