RENDEZ-VOUS
LE MONDE·SCIENCE & MÉDECINE
MERCREDI 23 OCTOBRE 2019 | 7
Les « agrégats » de maladies,
un défi épidémiologique en France
TRIBUNE - Pour le professeur Viel, l’identification et l’interprétation des surnombres de malades sur
un territoire donné doivent se fonder sur une surveillance sanitaire rigoureuse, trop souvent défaillante
L
es « agrégats » de maladies sont
régulièrement convoqués sur la
scène médiatique, dès qu’une
exposition environnementale, identi
fiée ou non, est supposée menacer la
santé de la population. Objets de
nombreuses interprétations, ils susci
tent incompréhension et controverse.
Mais comment identifieton ces agré
gats? Que nous apprennentils? Sous
quelles conditions?
Les « agrégats », ces grands incom
pris Un agrégat est généralement, et
abusivement, considéré comme un
regroupement inhabituel de cas d’une
même maladie, pour une zone géogra
phique et une période de temps don
nées. Mais, raisonner à partir des cas,
c’est oublier l’absolue nécessité d’un
dénominateur (la population exposée)
pour calculer des fréquences de mala
die, seules à même d’autoriser des com
paraisons et d’éclairer les décisions.
Stricto sensu, un agrégat est la conjonc
tion de deux proximités : une proximité
géographique et une proximité de va
leurs. En d’autres termes, il constitue le
regroupement inattendu de fréquences
proches dans des zones voisines.
Oublions d’emblée l’examen visuel
d’une carte à la recherche d’un regrou
pement, car l’œil identifie toujours un
contraste (c’est même sa raison d’exis
ter). On ne s’appesantira pas plus sur la
méthode statistique à utiliser (il en
existe des dizaines), même si les débats
d’experts ne sont pas près de s’éteindre.
C’est que l’essentiel réside en amont, au
cours d’une étape largement ignorée : le
processus d’identification des cas.
L’égalité territoriale d’identification
des cas Pour espérer mettre en évi
dence un éventuel contraste spatial,
chaque individu atteint de la maladie
considérée doit avoir la même probabi
lité d’être notifié, quel que soit son lieu
de résidence. Cela suppose donc un
système de surveillance pérenne et ex
haustif. Mais un tel enregistrement
peut ne pas exister dans la région étu
diée (pour rappel, les registres de can
cers de l’adulte ne couvrent qu’environ
22 % de la population française). Auquel
cas, toute mise en place d’une enquête
pour « confirmer » de premiers soup
çons d’agrégat est vaine. Elle est inévi
tablement biaisée car, dans un effet
boule de neige, les résidents locaux
sont plus enclins à rapporter des cas
supplémentaires, renforçant à tort la
vraisemblance de l’agrégat suspecté. Il
y a là rupture du principe d’égalité terri
toriale. Cette situation délicate prévaut
en LoireAtlantique, faute de registre
des malformations pour authentifier
un agrégat de « bébés sans bras ».
D’où un principe de base simple :
l’identification des cas doit précéder la
désignation de l’agrégat (approche a
priori), et non l’inverse (approche a
posteriori). Il est respecté lorsqu’un
registre de la maladie considérée
existe, en gardant toutefois à l’esprit
que, dès les premiers signaux, la situa
tion se fige. Les nouvelles notifications
« spontanées » qui ne manquent ja
mais d’accompagner la médiatisation
doivent être écartées de la caractérisa
tion de l’agrégat, car elles heurtent le
principe de l’égalité territoriale d’iden
tification. Pour la même raison, on
évite d’inclure des cas survenus avant
la mise en place du registre (d’où les
réserves émises à propos de cinq « bé
bés sans bras » nés avant 2011, année de
création du registre des malformations
dans l’Ain). Une telle configuration
favorable se retrouve dans l’Eure, où la
confirmation d’un agrégat suspecté de
cancers pédiatriques peut s’appuyer
sur des bases solides, grâce au registre
national des cancers de l’enfant.
Les enseignements des agrégats On a
tout entendu à leur sujet... Que les
agrégats étaient toujours dus à une
pollution des milieux ou, à l’inverse,
qu’ils n’avaient jamais permis d’identi
fier la moindre cause environnemen
tale. Et pourtant ils sont utiles pour
peu qu’on respecte quelques principes
dans une démarche intégrative.
On a donc compris qu’un système de
surveillance sanitaire digne de ce nom
constituait un préalable, faute de quoi
la caractérisation des agrégats était
vouée à de perpétuelles arguties. En
suite, il n’y a aucune justification théo
rique à ne rechercher que des agrégats
« à fréquence augmentée ». Les agrégats
« à fréquence diminuée » méritent tout
autant une tentative d’explication, et
contribuent dans une approche équili
brée à décrisper les points de vue (ils
peuvent même témoigner d’un défaut
local du système d’enregistrement,
remettant en cause tout contraste
spatial observé dans la région). Enfin,
on évite tout redécoupage d’un agrégat
identifié, inévitablement fallacieux car
conduit a posteriori. On se retient par
exemple de prendre un compas pour
tracer sur la carte un cercle incorpo
rant un cas localisé à quelques kilomè
tres de l’agrégat authentifié.
En tant que tel, un agrégat ne permet
pas d’identifier une cause. Une fois les
étapes précédentes franchies se pose
la question de la suite éventuelle à
donner (prélèvements environne
mentaux, conduite d’une enquête épi
démiologique comparative, etc.). A cet
égard, il est grand temps d’impliquer
les patients, les habitants, les élus
locaux et les associations environne
mentalistes dans une approche de
coconstruction. Et cela, le plus tôt pos
sible, et non lors d’une restitution des
résultats, passive et toujours trop tar
dive au vu des attentes. On a bien lancé
une telle démarche volontariste en
faveur d’une meilleure écoute des
usagers du système de santé grâce à la
loi Kouchner de 2002 !
CARTE
BLANCHE
Par NOZHA BOUJEMAA
L
e développement de l’intelligence
artificielle (IA) est assez ironique : il
faut beaucoup d’efforts manuels et
parfois ad hoc pour la construction de mo
dèles prédictifs précis. Une technologie qui
se veut entièrement dans l’automatisation
de tâches humaines implique en effet plu
sieurs étapes fastidieuses : annotation et
étiquetage des données d’apprentissage,
qui nécessitent parfois un travail humain
colossal ; exploration et sélection de don
nées représentatives ; sélection de modè
les ; réglages des paramètres du modèle en
plus des phases de tests et de générali
sation. Le cheminement à travers toute la
chaîne de développement est complexe,
même pour les spécialistes et les experts en
sciences des données. Dans de nombreux
contextes industriels, la mise sur le marché
d’une solution fondée sur des modèles
prédictifs est assez longue.
Cette impasse est en train de disparaître
avec l’émergence de l’autoapprentissage
(AutoML, ou Automated Machine Learning),
qui consiste à automatiser la recherche de
l’architecture optimale d’un réseau de neuro
nes. La maturité technologique de l’IA permet
aujourd’hui de mettre au point des architec
tures de réseaux de neurones profonds plus
efficacement que ne le feraient les experts
humains, par exemple en reconnaissance
d’objets et en vision par ordinateur.
Se passer de certaines expertises
Double ironie : on va pouvoir se passer en
partie de certaines expertises en sciences
des données et les automatiser. Dans le
contexte d’AutoML, les ingénieurs vont
pouvoir se consacrer à des phases plus criti
ques qui ont davantage besoin de l’intelli
gence humaine, comme l’analyse de situa
tions de métiers complexes et les questions
commerciales, au lieu de se perdre dans le
processus fastidieux de construction de la
solution. En réalité, cette démarche va aider
les développeurs non spécialistes des
données à réaliser des solutions d’IA plus
facilement. Les scientifiques spécialisés
vont, eux, pouvoir effectuer un travail com
plexe plus rapidement, grâce à la technolo
gie AutoML, qui pourrait bien placer l’IA au
cœur de l’essor des entreprises.
AutoML est une tendance qui va fon
damentalement changer le paysage des
solutions fondées sur l’apprentissage par
machine. Elle se concentre sur deux as
pects : l’acquisition de données et la prédic
tion. Toutes les étapes qui se déroulent en
tre ces deux phases seront prises en charge
par les processus d’AutoML. Les utilisateurs
apportent leur propre jeu de données, iden
tifient les catégories et appuient sur un
bouton pour générer un modèle parfaite
ment entraîné et optimisé, prêt à prédire.
Ces approches d’AutoML vont faciliter la
démocratisation de l’IA au service du plus
grand nombre.
Divers acteurs industriels se préparent à
livrer des services d’AutoML, qu’il s’agisse de
géants comme Google, Amazon, Baidu, Uber
ou Microsoft, des platesformes en open
source (Autosklearn, AutoKeras, Ludwig),
ou des startup en IA, telles que Dataiku,
Prevision.io, H20.io et RapidMiner. Quelques
sociétés, comme DataRobot, se spécialisent
dans ce domaine, des fournisseurs de logi
ciels d’entreprise, comme Tibco, proposent
des fonctionnalités AutoML.
Le succès de l’autoapprentissage a amené
les chercheurs à explorer l’efficacité de ces
approches dans d’autres domaines, comme
pour les modèles génératifs contradictoires
(GAN), particulièrement efficaces pour en
gendrer des images réalistes. Le résultat
d’une recherche commune entre l’univer
sité du Texas et le laboratoire joint MITIBM
Watson combinant l’AutoML et les GAN a
montré que les performances dépassent
celles des experts humains. Nous obser
vons la naissance d’une nouvelle branche
de l’IA, nommée « AutoGAN ».
L’intelligence
artificielle en voie
d’automatisation
¶
Jean-François Viel, épidémiologiste,
professeur des universités-praticien
hospitalier Inserm-Irset, CHU, Rennes
UN AGRÉGAT EST
LA CONJONCTION
DE DEUX PROXIMITÉS :
UNE PROXIMITÉ
GÉOGRAPHIQUE
ET UNE PROXIMITÉ
DE VALEURS
Le supplément « Science & médecine » publie chaque semaine une tribune libre. Si vous souhaitez soumettre un texte, prière de l’adresser à [email protected]
Le ruthénium, auxiliaire de police nucléaire
ATOMES, PORTRAITS DE FAMILLE (6/9) - Parmi les éléments du tableau périodique créé par Dmitri Mendeleïev,
il y a 150 ans, le ruthénium est peu connu. Pourtant, ce catalyseur fait régulièrement l’actualité
A
près la riche chimie des fluors et
du phosphore, faisons un grand
bond dans le tableau périodique
des éléments dans une région a priori
plus calme, le royaume des métaux de
transition. Au milieu, sur la 44e case, se
trouve un élément peu connu, le ruthé
nium. Avec ses 44 électrons (et 44 pro
tons), il se place juste sous le fer mais est
considéré comme appartenant aussi à la
famille du platine, un catalyseur bien
connu. Ces propriétés catalytiques ont
d’ailleurs recueilli un prix Nobel de chi
mie, attribué à Bob Grubbs en 2005.
Dans la croûte terrestre, le ruthénium
est rare, mais il fait parfois l’actualité.
Comme en octobre 2017, où des centaines
de détecteurs de particules radioactives
s’agitent en Europe, signalant le passage
inédit d’un nuage de particules d’oxyde
de ruthénium dit 106, car son noyau pos
sède 44 protons et 62 neutrons (au lieu de
54, 55 ou 56 pour certaines formes dites
stables). « On n’avait pas vu ça depuis l’ac
cident de Tchernobyl en 1986 », explique
Olivier Masson, chercheur à l’Institut de
radioprotection et de sûreté nucléaire, et
coordinateur du réseau de surveillance
Ring of Five mobilisant des chercheurs
d’une vingtaine de pays.
Au-dessus de La Seyne-sur-Mer
En France, le 3 octobre 2017, le nuage est
passé audessus de La SeynesurMer, un
million de fois moins chargé en ruthé
nium que celui de Tchernobyl. Sans dan
ger. D’autant que le ruthénium est peu
mobile dans le sol et qu’il n’est pas essen
tiel aux plantes, 99 % restant dans les
racines. Dans le corps, en cas d’ingestion
directe, il s’élimine en sept heures.
Il n’empêche qu’il convenait de savoir
d’où provenait ce radionucléide artificiel,
marqueur d’une anomalie nucléaire. Oli
vier Masson et soixantehuit coauteurs
ont publié, ce 26 juillet, dans les PNAS
américaines le résultat d’une palpitante
enquête de « légiste » du nucléaire. L’ori
gine géographique qu’ils déterminent
se trouve être la Russie. Ironie de l’his
toire, ruthénium signifie en latin « rela
tif à la Russie », car ce métal fut identifié
pour la première fois par des chimistes
allemands, au XIXe siècle, dans un gise
ment de Sibérie.
La localisation est en fait plus précise :
l’incident a eu lieu entre le 25 septembre,
18 heures (temps universel), et le 26 sep
tembre (midi) 2017 sur un site hélas bien
connu des spécialistes du nucléaire,
l’usine de retraitement de Maïak, dans
le sud de la Russie, en bordure ouest de
la Sibérie. En septembre 1957, y a eu lieu
ce qui est considéré comme le troisième
plus grave accident nucléaire, après
Fukushima et Tchernobyl, conduisant à
l’évacuation de 10 000 personnes.
Pour identifier cette origine, les cher
cheurs ont exploré plusieurs pistes.
Certains ont pensé à un incident lors
de la production de sources radioactives
au ruthénium 106 utilisées pour des
radiothérapies. Mais, pour atteindre les
niveaux d’activité détectés en Europe, il
aurait fallu que 25 millions d’appareils
explosent en même temps...
Cela auraitil pu venir de la chute in
contrôlée d’un satellite, embarquant
une source radioactive? L’hypothèse a
été exclue à cause d’une propriété du
ruthénium. Ce dernier possède un
autre isotope à 44 protons et 59 neu
trons, produits aussi dans les réactions
nucléaires, mais qui se désintègre en
39 jours, contre près d’un an à son
cousin le ruthénium 106. Or, du ruthé
nium 103 a aussi été détecté, preuve
d’une source très jeune, incompatible
avec un moteur de satellite.
Il restait donc à faire tourner les mo
dèles de météo à l’envers, pour remon
ter les vents jusqu’à la source, jusqu’à
Maïak. L’analyse des diverses formes de
ruthénium a aussi permis d’imaginer
une explosion ou un incendie, alors
que les ingénieurs travaillaient sur un
combustible de centrale nucléaire assez
récent, dont ils cherchaient à extraire
de l’ensemble des produits de fission
un élément très actif, le cérium. Celuici
devait servir à une expérience interna
tionale, SOX, en Italie, pour percer le
mystère d’une particule, le neutrino.
L’Italie n’a donc rien reçu, si ce n’est
quelques becquerels de ruthénium
début octobre 2017.
david larousserie
Ru
44
Ruthénium
101,07
Numéro
atomique
(nombre
de protons)
Symbole
chimique
Nom
de l’élément
Masse
atomique
Demi-barre de ruthénium
très pur (99,99 %).
HEINRICH PNIOK/CC BY-SA 4.0
Nozha Boujemaa
Directrice science et innovation
chez Median Technologies