4 |
ÉVÉNEMENT
LE MONDE·SCIENCE & MÉDECINE
MERCREDI 18 SEPTEMBRE 2019
Numérique
Main basse
sur les données
Ces partages de données numériques avec les
chercheurs, annoncés aux yeux de tous et don
nant la possibilité, le cas échéant, de tirer la
sonnette d’alarme en cas de nonrespect de l’en
gagement, vontils permettre aux mondes aca
démique et numérique de trouver un terrain
d’entente? Jusqu’à présent, ces données ont
généré des relations complexes et peu transpa
rentes entre les sociétés qui les captent et les
scientifiques intéressés.
Côté entreprise, la majeure partie des données
privées, sources potentielles de profit, sont gar
dées pour une exploitation économique. Certai
nes portes d’accès informatique (API) ouvertes à
tous ont permis, un certain temps, à des cher
cheurs d’obtenir des jeux de données. Par
ailleurs, des négociations au coup par coup ont
été menées par certains scientifiques ou labora
toires pour des requêtes précises. La préserva
tion de la vie privée des utilisateurs est un argu
ment souvent avancé pour justifier cet accès li
mité, ce qui n’a pas empêché ces données d’être
au centre du modèle économique de Facebook.
Une enquête pénale, ouverte par le parquet de
New York en mars et révélée par le New York
Times, s’intéresse aux partenariats conclus par
Facebook et 150 entreprises, dont Amazon et
Apple, concernant un partage de données d’uti
lisateurs. Facebook a depuis été rattrapé par un
autre scandale : Business Insider du 7 août décrit
une captation sans autorisation de millions
d’informations d’utilisateurs d’Instagram par
un partenaire publicitaire, Hyp3r.
Implication sans consentement
Dans le monde académique, cette manne nou
velle d’informations a créé chez certains un véri
table engouement. « Avec parfois de la naïveté, re
connaît le présidentdirecteur général du CNRS,
Antoine Petit. En tant que scientifique, si de nou
velles techniques ou de nouvelles données permet
tent de faire avancer la connaissance, vous pou
vez être tenté de faire passer cela avant les consé
quences éventuelles. » De fait, deux utilisations
massives et controversées de données ont, ces
dernières années, impliqué le monde académi
que. En 2014, deux chercheurs de Cornell et un
psycholinguiste de Facebook ont publié une re
cherche engageant, sans leur consentement ex
plicite, 689 003 usagers du réseau social : en cati
mini, tous les messages positifs ou négatifs de
leurs « murs » avaient été supprimés pour voir
comment ce tri affectait leur humeur. L’univer
sité de Cornell, critiquée après la publication
scientifique (« Experimental évidence of massi
vescale emotional contagion through social
networks », PNAS, 2 juin 2014), a expliqué avoir
accepté la recherche car l’échantillon de données
était déjà constitué par Facebook. Entre 2014 et
2015, c’est un chercheur de l’université de Cam
bridge, Aleksandr Kogan, qui, sous couvert d’une
étude scientifique, a lancé le quiz « thisisyourdi
gitallife », qui a permis in fine à la société d’in
fluence Cambridge Analytica d’aspirer les profils
de dizaines de millions d’utilisateurs.
Exploitation économique
Au fil des années, les données étant devenues
une source de convoitise extrême, leur accès
pour le monde académique s’est peu à peu
réduit. Cette exploitation économique, dans un
vase de plus en plus clos, d’informations per
sonnelles d’utilisateurs pose de nouvelles ques
tions. « Les platesformes ont un impact impor
tant sur nos vies, mais la compréhension de leur
fonctionnement est assez limitée, principale
ment à cause de l’accès réduit à leurs données »,
note YvesAlexandre de Montjoye.
Captation et analyse de données se sont, ces
dix dernières années, intensifiées sans que les ci
toyens en aient pleinement conscience : qu’une
personne poste une image sur un réseau social
avec son smartphone, interroge son assistant
personnel à domicile, mesure son rythme car
diaque avec une montre connectée ou travaille
avec des collègues sur des documents partagés,
elle enrichit des bases où sont répertoriés et ana
lysés mots, images, localisation, horaire, etc. « Il y
a beaucoup de données disponibles, ce qui n’était
pas le cas encore récemment, et ces masses d’in
formations sont désormais traitées par des ordi
nateurs plus puissants, des capacités de calculs
plus importantes et des algorithmes plus perfor
mants », résume Antoine Petit.
Ces progrès scientifiques et technologiques ont
accentué le rapport de force entre ceux qui
détiennent cette masse d’informations et les
autres. « Le vrai pouvoir est de rassembler énor
mément de données, ce qu’ont bien compris les
grandes platesformes numériques, qu’elles soient
américaines ou asiatiques », poursuit l’informati
cien, qui de 2014 à 2018 a dirigé l’Inria. « La plus
value du chercheur va être de faire des corréla
tions, de rapprocher des données, qui a priori
n’avaient pas grandchose à dire, les unes des
autres pour obtenir des résultats intéressants. De
fait, posséder les données, c’est détenir une forme
de puissance extrêmement importante. »
Une simple lecture des cours de Bourse suffit à
vérifier cette assertion : parmi les dix entrepri
ses mondiales ayant le plus de valeur aux yeux
des marchés financiers, six d’entre elles (les
américaines Amazon, Apple, AlphabetGoogle,
Facebook, et les chinoises Alibaba et Tencent)
possèdent des collections massives de données
numériques. « Ces types d’acteurs collectent dé
sormais des interactions sociales avec une gra
nularité extrêmement fine sur des millions d’uti
lisateurs », explique David Chavalarias, direc
teur de recherche au Centre d’analyse et de
mathématique sociales. « Ils peuvent tout à la
fois connaître chacun de leurs utilisateurs dans le
détail et cerner des dynamiques sociales globa
les. Cette connaissance est monnayée au sein de
leurs régies publicitaires. »
De nouveaux équilibres de pouvoir
Sans que cela soit forcément perceptible, ces
nouveaux équilibres de pouvoir ont une in
fluence sur la recherche autour des données. Les
chercheurs qui s’y frottent sont désormais dans
des situations salariales, de liberté d’action et
même de paroles très différentes.
Pour faire parler les informations captées chez
leurs utilisateurs, les entreprises numériques
ont, ces dernières années, recruté massivement,
mondialement et au prix fort des scientifiques,
notamment des informaticiens, statisticiens et
mathématiciens. Certains chercheurs académi
ques en France se sont vu proposer des salaires
de 5 à 10 fois supérieurs à ceux du secteur public.
Ces recrutements influent, de fait, sur la na
ture même des recherches menées. « Ces socié
tés offrent un bon environnement avec un cer
tain degré de liberté, mais celuici s’accompagne
aussi d’incitations pour orienter les thèmes de
recherche », remarque Stéphane Mallat, profes
seur au Collège de France, titulaire de la chaire
Sciences des données. « Il est clair que poser une
LES CHERCHEURS ASPIRÉS PAR LES GAFA
U
n seul regard sur le site
Internet du laboratoire
Sequel permet de saisir
l’ampleur du problème : le centre de
recherche spécialisé en apprentis
sage par renforcement (un type
d’intelligence artificielle) est en
souseffectif. Ce lieu, dépendant de
l’Inria, de l’université de Lille et du
CNRS, n’a plus que trois chercheurs
« permanents », pour dix actuelle
ment « en disponibilité » ou « en
détachement ». Six des absents ont
été recrutés ces dernières années
par Google et Facebook aux Etats
Unis, au RoyaumeUni et en France.
« Nous venons de connaître, en
quelque sorte, une hémorragie »,
reconnaît l’informaticien Philippe
Preux, cofondateur de Sequel. « Dès
la fondation du laboratoire, en 2006,
nous avons eu la chance de recruter
d’excellents informaticiens, statisti
ciens ou mathématiciens de France,
mais aussi de l’étranger, attirés par la
réputation internationale d’un des
cofondateurs, Rémi Munos. » Ce der
nier, polytechnicien et titulaire d’un
DEA en sciences cognitives à
l’EHESS, fait partie des chercheurs
actuellement « en détachement ». Il
dirige, depuis son ouverture,
en 2018, le laboratoire de recherche
en intelligence artificielle Deep
Mind (Google) à Paris.
Des salaires bas en France
« En quelques années, la recherche
en apprentissage automatique s’est
globalement privatisée dans le
monde occidental », constate Phi
lippe Preux. « Des laboratoires aux
EtatsUnis, aux Canada, au Royau
meUni ou en Italie viennent de
connaître la même expérience que la
nôtre. » Avec cependant, précise le
mathématicien Stéphane Mallat,
une spécificité bien française :
« Cette aspiration mondiale de cher
cheurs est particulièrement intense
dans notre pays, parce que le diffé
rentiel entre les salaires publics et
ceux offerts par ces sociétés est plus
important qu’ailleurs, par exemple
en Allemagne ou aux EtatsUnis. Les
salaires dans le monde de l’enseigne
ment et de la recherche sont bas en
France, et ces platesformes peuvent
proposer des rémunérations de 5 à
10 fois supérieures. »
Ces dernières années, poursuit le
professeur au Collège de France, ti
tulaire de la chaire Sciences des don
nées, « les GAFA se sont installés à
Paris et ont fortement embauché, ce
qui est une bonne chose. Mais ce vo
lume d’embauches a été tel que cela a
en partie déplumé l’université et les
écoles d’ingénieurs. La situation se
pose différemment aux EtatsUnis,
où ces sociétés payent des impôts et
contribuent donc aux universités
américaines ». A Lille, Philippe Preux
mesure au quotidien le déséquilibre
créé. « Ces départs massifs ont engen
dré un problème majeur, il n’y a plus
grand monde à la faculté pour ensei
gner, ni pour encadrer des thèses, rôle
qui incombe, dans le système fran
çais, à un chercheur académique »,
constatetil.
Les platesformes sontelles allées
trop loin dans leur recrutement, au
risque d’assécher le vivier? « Il semble
qu’il y ait une prise de conscience »,
commente Philippe Preux, notant
ces derniers mois une approche
plus collaborative du secteur privé :
« Le premier thésard financé par
Facebook est arrivé cet été, deux
autres financés par Google vont arri
ver en automne », précisetil. Dans
son rapport sur l’intelligence artifi
cielle, publié en mars 2018, le mathé
maticien (et député LRM) Cédric Vil
lani avait recommandé de doubler
les salaires des jeunes chercheurs et
enseignants pour tenter d’endiguer
cette fuite des cerveaux.
l. be.
▶ S U I T E D E L A P R E M I È R E PAG E
DEUX CHERCHEURS AVAIENT,
EN 2014, SUPPRIMÉ
EN CATIMINI TOUS
LES MESSAGES POSITIFS
OU NÉGATIFS DES « MURS »
DE 689 003 USAGERS
DE FACEBOOK POUR VOIR
COMMENT CE TRI AFFECTAIT
LEUR HUMEUR