Le Monde - 18.09.2019

(Ron) #1

4 |


ÉVÉNEMENT
LE MONDE·SCIENCE & MÉDECINE
MERCREDI 18 SEPTEMBRE 2019

Numérique

Main basse

sur les données

Ces partages de données numériques avec les
chercheurs, annoncés aux yeux de tous et don­
nant la possibilité, le cas échéant, de tirer la
sonnette d’alarme en cas de non­respect de l’en­
gagement, vont­ils permettre aux mondes aca­
démique et numérique de trouver un terrain
d’entente? Jusqu’à présent, ces données ont
généré des relations complexes et peu transpa­
rentes entre les sociétés qui les captent et les
scientifiques intéressés.
Côté entreprise, la majeure partie des données
privées, sources potentielles de profit, sont gar­
dées pour une exploitation économique. Certai­
nes portes d’accès informatique (API) ouvertes à
tous ont permis, un certain temps, à des cher­
cheurs d’obtenir des jeux de données. Par
ailleurs, des négociations au coup par coup ont
été menées par certains scientifiques ou labora­
toires pour des requêtes précises. La préserva­
tion de la vie privée des utilisateurs est un argu­
ment souvent avancé pour justifier cet accès li­
mité, ce qui n’a pas empêché ces données d’être
au centre du modèle économique de Facebook.
Une enquête pénale, ouverte par le parquet de
New York en mars et révélée par le New York
Times, s’intéresse aux partenariats conclus par
Facebook et 150 entreprises, dont Amazon et
Apple, concernant un partage de données d’uti­
lisateurs. Facebook a depuis été rattrapé par un
autre scandale : Business Insider du 7 août décrit
une captation sans autorisation de millions
d’informations d’utilisateurs d’Instagram par
un partenaire publicitaire, Hyp3r.

Implication sans consentement
Dans le monde académique, cette manne nou­
velle d’informations a créé chez certains un véri­
table engouement. « Avec parfois de la naïveté, re­
connaît le président­directeur général du CNRS,
Antoine Petit. En tant que scientifique, si de nou­
velles techniques ou de nouvelles données permet­
tent de faire avancer la connaissance, vous pou­
vez être tenté de faire passer cela avant les consé­
quences éventuelles. » De fait, deux utilisations
massives et controversées de données ont, ces
dernières années, impliqué le monde académi­
que. En 2014, deux chercheurs de Cornell et un
psycholinguiste de Facebook ont publié une re­

cherche engageant, sans leur consentement ex­
plicite, 689 003 usagers du réseau social : en cati­
mini, tous les messages positifs ou négatifs de
leurs « murs » avaient été supprimés pour voir
comment ce tri affectait leur humeur. L’univer­
sité de Cornell, critiquée après la publication
scientifique (« Experimental évidence of massi­
ve­scale emotional contagion through social
networks », PNAS, 2 juin 2014), a expliqué avoir
accepté la recherche car l’échantillon de données
était déjà constitué par Facebook. Entre 2014 et
2015, c’est un chercheur de l’université de Cam­
bridge, Aleksandr Kogan, qui, sous couvert d’une
étude scientifique, a lancé le quiz « thisisyourdi­
gitallife », qui a permis in fine à la société d’in­
fluence Cambridge Analytica d’aspirer les profils
de dizaines de millions d’utilisateurs.

Exploitation économique
Au fil des années, les données étant devenues
une source de convoitise extrême, leur accès
pour le monde académique s’est peu à peu
réduit. Cette exploitation économique, dans un
vase de plus en plus clos, d’informations per­
sonnelles d’utilisateurs pose de nouvelles ques­
tions. « Les plates­formes ont un impact impor­
tant sur nos vies, mais la compréhension de leur
fonctionnement est assez limitée, principale­
ment à cause de l’accès réduit à leurs données »,
note Yves­Alexandre de Montjoye.
Captation et analyse de données se sont, ces
dix dernières années, intensifiées sans que les ci­
toyens en aient pleinement conscience : qu’une
personne poste une image sur un réseau social
avec son smartphone, interroge son assistant
personnel à domicile, mesure son rythme car­
diaque avec une montre connectée ou travaille
avec des collègues sur des documents partagés,
elle enrichit des bases où sont répertoriés et ana­
lysés mots, images, localisation, horaire, etc. « Il y
a beaucoup de données disponibles, ce qui n’était
pas le cas encore récemment, et ces masses d’in­
formations sont désormais traitées par des ordi­
nateurs plus puissants, des capacités de calculs
plus importantes et des algorithmes plus perfor­
mants », résume Antoine Petit.
Ces progrès scientifiques et technologiques ont
accentué le rapport de force entre ceux qui
détiennent cette masse d’informations et les
autres. « Le vrai pouvoir est de rassembler énor­
mément de données, ce qu’ont bien compris les

grandes plates­formes numériques, qu’elles soient
américaines ou asiatiques », poursuit l’informati­
cien, qui de 2014 à 2018 a dirigé l’Inria. « La plus­
value du chercheur va être de faire des corréla­
tions, de rapprocher des données, qui a priori
n’avaient pas grand­chose à dire, les unes des
autres pour obtenir des résultats intéressants. De
fait, posséder les données, c’est détenir une forme
de puissance extrêmement importante. »
Une simple lecture des cours de Bourse suffit à
vérifier cette assertion : parmi les dix entrepri­
ses mondiales ayant le plus de valeur aux yeux
des marchés financiers, six d’entre elles (les
américaines Amazon, Apple, Alphabet­Google,
Facebook, et les chinoises Alibaba et Tencent)
possèdent des collections massives de données
numériques. « Ces types d’acteurs collectent dé­
sormais des interactions sociales avec une gra­
nularité extrêmement fine sur des millions d’uti­
lisateurs », explique David Chavalarias, direc­
teur de recherche au Centre d’analyse et de
mathématique sociales. « Ils peuvent tout à la
fois connaître chacun de leurs utilisateurs dans le
détail et cerner des dynamiques sociales globa­
les. Cette connaissance est monnayée au sein de
leurs régies publicitaires. »

De nouveaux équilibres de pouvoir
Sans que cela soit forcément perceptible, ces
nouveaux équilibres de pouvoir ont une in­
fluence sur la recherche autour des données. Les
chercheurs qui s’y frottent sont désormais dans
des situations salariales, de liberté d’action et
même de paroles très différentes.
Pour faire parler les informations captées chez
leurs utilisateurs, les entreprises numériques
ont, ces dernières années, recruté massivement,
mondialement et au prix fort des scientifiques,
notamment des informaticiens, statisticiens et
mathématiciens. Certains chercheurs académi­
ques en France se sont vu proposer des salaires
de 5 à 10 fois supérieurs à ceux du secteur public.
Ces recrutements influent, de fait, sur la na­
ture même des recherches menées. « Ces socié­
tés offrent un bon environnement avec un cer­
tain degré de liberté, mais celui­ci s’accompagne
aussi d’incitations pour orienter les thèmes de
recherche », remarque Stéphane Mallat, profes­
seur au Collège de France, titulaire de la chaire
Sciences des données. « Il est clair que poser une

LES CHERCHEURS ASPIRÉS PAR LES GAFA


U


n seul regard sur le site
Internet du laboratoire
Sequel permet de saisir
l’ampleur du problème : le centre de
recherche spécialisé en apprentis­
sage par renforcement (un type
d’intelligence artificielle) est en
sous­effectif. Ce lieu, dépendant de
l’Inria, de l’université de Lille et du
CNRS, n’a plus que trois chercheurs
« permanents », pour dix actuelle­
ment « en disponibilité » ou « en
détachement ». Six des absents ont
été recrutés ces dernières années
par Google et Facebook aux Etats­
Unis, au Royaume­Uni et en France.
« Nous venons de connaître, en
quelque sorte, une hémorragie »,
reconnaît l’informaticien Philippe
Preux, cofondateur de Sequel. « Dès
la fondation du laboratoire, en 2006,
nous avons eu la chance de recruter
d’excellents informaticiens, statisti­
ciens ou mathématiciens de France,
mais aussi de l’étranger, attirés par la

réputation internationale d’un des
cofondateurs, Rémi Munos. » Ce der­
nier, polytechnicien et titulaire d’un
DEA en sciences cognitives à
l’EHESS, fait partie des chercheurs
actuellement « en détachement ». Il
dirige, depuis son ouverture,
en 2018, le laboratoire de recherche
en intelligence artificielle Deep­
Mind (Google) à Paris.

Des salaires bas en France
« En quelques années, la recherche
en apprentissage automatique s’est
globalement privatisée dans le
monde occidental », constate Phi­
lippe Preux. « Des laboratoires aux
Etats­Unis, aux Canada, au Royau­
me­Uni ou en Italie viennent de
connaître la même expérience que la
nôtre. » Avec cependant, précise le
mathématicien Stéphane Mallat,
une spécificité bien française :
« Cette aspiration mondiale de cher­
cheurs est particulièrement intense

dans notre pays, parce que le diffé­
rentiel entre les salaires publics et
ceux offerts par ces sociétés est plus
important qu’ailleurs, par exemple
en Allemagne ou aux Etats­Unis. Les
salaires dans le monde de l’enseigne­
ment et de la recherche sont bas en
France, et ces plates­formes peuvent
proposer des rémunérations de 5 à
10 fois supérieures. »
Ces dernières années, poursuit le
professeur au Collège de France, ti­
tulaire de la chaire Sciences des don­
nées, « les GAFA se sont installés à
Paris et ont fortement embauché, ce
qui est une bonne chose. Mais ce vo­
lume d’embauches a été tel que cela a
en partie déplumé l’université et les
écoles d’ingénieurs. La situation se
pose différemment aux Etats­Unis,
où ces sociétés payent des impôts et
contribuent donc aux universités
américaines ». A Lille, Philippe Preux
mesure au quotidien le déséquilibre
créé. « Ces départs massifs ont engen­

dré un problème majeur, il n’y a plus
grand monde à la faculté pour ensei­
gner, ni pour encadrer des thèses, rôle
qui incombe, dans le système fran­
çais, à un chercheur académique »,
constate­t­il.
Les plates­formes sont­elles allées
trop loin dans leur recrutement, au
risque d’assécher le vivier? « Il semble
qu’il y ait une prise de conscience »,
commente Philippe Preux, notant
ces derniers mois une approche
plus collaborative du secteur privé :
« Le premier thésard financé par
Facebook est arrivé cet été, deux
autres financés par Google vont arri­
ver en automne », précise­t­il. Dans
son rapport sur l’intelligence artifi­
cielle, publié en mars 2018, le mathé­
maticien (et député LRM) Cédric Vil­
lani avait recommandé de doubler
les salaires des jeunes chercheurs et
enseignants pour tenter d’endiguer
cette fuite des cerveaux.
l. be.

▶ S U I T E D E L A P R E M I È R E PAG E

DEUX CHERCHEURS AVAIENT,
EN 2014, SUPPRIMÉ
EN CATIMINI TOUS
LES MESSAGES POSITIFS
OU NÉGATIFS DES « MURS »
DE 689 003 USAGERS
DE FACEBOOK POUR VOIR
COMMENT CE TRI AFFECTAIT
LEUR HUMEUR
Free download pdf