Kacper Pempel / REUTERS

Au royaume des données, le « data scientist » (« scientifique des données ») est roi. C’est le principal enseignement du deuxième baromètre LinkedIn pour Le Monde Campus.

Le réseau social professionnel a scruté les données de ses 14 millions de membres français pour faire émerger les métiers les plus recherchés par les recruteurs et les profils les plus représentés sur sa plateforme.

Déjà décrété « métier le plus sexy du XXIe siècle » par la Harvard Business Review en 2012, ces « scientifiques » qui, à partir de grands volumes de données, créent de la « connaissance » sont devenus indispensables à la transformation numérique des entreprises. Leurs compétences se situent à l’intersection de celles des mathématiciens, des informaticiens et des statistiques, dont ils sont les héritiers.

« C’est une tendance de fond qui existe depuis déjà trois ans et qui a vocation à perdurer. Le secteur pharmaceutique et la finance de marché étaient les premiers à exprimer une forte demande. Désormais ce sont tous les secteurs industriels qui sont concernés », assure Fabienne Arata, directrice générale de LinkedIn France.

Cet emballement est confirmé par l’Institut Mines Télécom (IMT) qui interroge chaque année 80 entreprises du secteur des télécommunications sur leurs prévisions de recrutement. « Le métier est en tension partout, de la banque-assurance à l’audit-conseil, en passant par les grands groupes industriels classiques », confirme Bertrand Bonte, le directeur des formations de l’IMT.

Modélisation de l’épidémie d’Ebola

La rareté de ces profils fait aussi monter leur salaire. Les data scientists peuvent gagner, en début de carrière, entre 45 000 et 55 000 euros annuels, nettement au-dessus de la rémunération moyenne des ingénieurs en sortie d’école (environ 35 000 euros).

Si le principe de l’analyse de données est loin d’être nouveau – « les plus anciennes traces de données remontent aux tablettes d’argiles sumériennes », rappelle Serge Abiteboul, chercheur à l’Institut national de recherche en informatique et en automatique (Inria), et professeur d’informatique à l’Ecole normale supérieure (ENS) de Cachan, « c’est la puissance de calcul des ordinateurs qui a changé l’échelle de l’analyse de données ».

« C’est sûr que data scientist, est plus vendeur que statisticien », sourit Basile Calderan, formé en mathématiques appliquées à l’université Pierre-et-Marie-Curie et en data science à l’université Paris-Saclay.

Il se souvient de la « mode » du big data à l’université. « Nous avions tous entendu parler de ce métier qui faisait le buzz dans la presse », raconte le jeune homme, qui une fois diplômé a « refusé cinq ou six propositions d’emploi en trois mois ». Après un stage à Orange Labs, où il travaillait sur la modélisation de l’épidémie d’Ebola, il est aujourd’hui en contrat à durée indéterminée (CDI) dans le secteur des assurances.

Pour former ces spécialistes des statistiques, des mathématiques appliquées et de l’informatique, les grandes écoles et les universités ont dû adapter ou renouveler leur offre. « Nous avons créé un nouveau master en 2013 pour soulager celui en intelligence artificielle. Trois ans plus tard, la data science est la spécialité la plus demandée », précise Ludovic Denoyer, professeur de machine learning (apprentissage automatique) à l’université Pierre-et-Marie-Curie et coresponsable du master de data science.

Néanmoins, « les moyens des universités ne sont pas en adéquation avec l’augmentation des besoins. Les formations ne peuvent pas grossir aussi vite que les demandes et la sélection y devient drastique », ajoute l’enseignant-chercheur. A la rentrée 2016, 330 candidats ont postulé pour seulement 45 places en M2. Cet engouement n’est pas sans rappeler celui des étudiants en mathématiques financières au début des années 2000.

Potentiel d’emploi « énorme »

A peine formés, les jeunes diplômés sont rapidement repérés par les entreprises. « Un de mes étudiants qui postulait pour un stage de fin d’année m’a demandé si c’était possible de le faire en CDI ! », se rappelle Erwan Le Pennec, responsable du parcours « data sciences » du M2 en mathématiques et applications de l’université Paris-Saclay.

« Il est difficile de prévoir quand le marché se resserrera, cela dépendra de la pénétration de ces technologies. Pour l’instant le potentiel d’emploi est énorme », juge-t-il.

En plus des compétences techniques, les recruteurs français cherchent des qualités humaines. « Les entreprises veulent des data scientists curieux qui pourront identifier les signaux faibles dans des grandes masses de données. Ils cherchent aussi des gens qui peuvent raconter une histoire, traduire des chiffres en une langue compréhensible par tous », précise Fabienne Arata.

Quant aux jeunes doctorants ou docteurs, ils sont tentés de rejoindre les grandes firmes américaines. « De très nombreux universitaires du domaine sont partis durant les dernières années. Je pense pouvoir citer au moins une vingtaine de noms – ce qui est très loin d’être négligeable sur une communauté qui ne doit pas dépasser la centaine », souligne Ludovic Denoyer. Les raisons sont multiples : manque de perspectives dans les emplois académiques, salaires élevés offerts par les entreprises outre-Atlantique, effet boule de neige et croyance au principe du « c’est là-bas que ça se passe ».

La ruée des étudiants vers l’or noir du XXIe siècle que sont les données numériques engendre de nouveaux questionnements : les data scientists ont entre leurs mains des outils très puissants dont les applications dépassent l’univers des salles de marchés. Aux Etats-Unis, ils écrivent le modèle mathématique qui décidera du montant de l’assurance automobile, du prêt-étudiant qui sera octroyé ou non pour payer les frais d’inscriptions à l’université, ou qui prédira les lieux des crimes à venir.

Cathy O’Neil, professeur de mathématiques à l’Institut de technologie du Massachusetts (MIT) et auteur d’un livre intitulé Weapons of math destruction (Crown, New-York, 2016) met en garde contre les nouvelles dérives de la modélisation mathématique. Elle propose qu’à l’image du serment d’Hippocrate des médecins, les data scientists « prêtent serment ». Jean-Gabriel Ganascia, professeur à l’UPMC, chercheur en intelligence artificielle, estime a minima qu’« il faut ouvrir la formation des scientifiques aux questions d’éthique qui seront au centre des politiques industrielles dans les années à venir ».