Des données des réseaux sociaux utilisées par le fisc : pourquoi ce n’est pas si simple
Des données des réseaux sociaux utilisées par le fisc : pourquoi ce n’est pas si simple
Par Damien Leloup
Le ministre de l’économie, Gérald Darmanin, a annoncé que les services du fisc allaient pouvoir utiliser dès 2019 les données de Facebook.
Le ministre des finances, Gérald Darmanin, veut exploiter les données issues des réseaux sociaux pour repérer les fraudeurs. / Daniel Riffet / Photononstop / Daniel Riffet / Photononstop
Les services de lutte contre la fraude fiscale vont pouvoir, à partir du début 2019 et dans le cadre d’une « expérimentation », surveiller les contenus publiés par les Français sur les réseaux sociaux pour trouver les contribuables dont le niveau de vie ne correspond pas à leurs revenus déclarés. C’est, en substance, ce qu’a annoncé le ministre de l’économie Gérald Darmanin, dans un entretien diffusé, dimanche 11 novembre, dans l’émission Capital de M6.
Mais cette annonce soulève de nombreuses questions. Qui regardera précisément quels contenus, et dans quel contexte et dans quel but ? « Il y aura la permissivité de constater que si vous vous faites prendre en photo (…) de nombreuses fois, avec une voiture de luxe alors que vous n’avez pas les moyens de le faire, peut-être que c’est votre cousin ou votre copine qui vous l’a prêtée, ou peut-être pas », a expliqué Gérald Darmanin. Les réseaux sociaux seraient donc utilisés pour détecter les cas dans lesquels un contribuable semblerait avoir un train de vie très au-dessus de ses revenus déclarés.
Deux cas de figure très différents
En pratique, les réseaux sociaux font déjà partie des sources utilisées par les agents de l’administration fiscale. Tous les contenus (messages, photos…) publiés en public sur Facebook, Twitter ou Instagram peuvent logiquement être consultés par les enquêteurs du fisc, et servir à déclencher une enquête – rien dans la loi ne s’y oppose. Les messages publiés sur les réseaux sociaux sont, de la même manière, souvent utilisés par les enquêteurs des compagnies d’assurances, ou encore dans le cadre des contrôles de l’Assurance-maladie.
Mais ce qu’a évoqué M. Darmanin va bien au-delà de la simple consultation des comptes Facebook ou Instagram de particuliers par les agents du fisc. Dans un discours prononcé le 13 septembre, lors d’une journée de conférences intitulée « Lutter contre la fraude : la fin des tabous », le ministre évoquait déjà d’une utilisation bien plus large des données issues des réseaux sociaux. « Nous sommes prêts à aller encore plus loin, en assumant d’exploiter aussi la masse des données ouvertes, disponibles publiquement, et que les administrations ne se sont pas encore risquées à traiter jusqu’à ce jour, à la fois, car il s’agit de données sensibles, protégées juridiquement, et parce que leur traitement requiert des outils particulièrement avancés », disait-il. Les données issues des réseaux sociaux « peuvent nous révéler beaucoup de choses sur ce qu’on appelle la fraude à la résidence ou sur des transactions économiques illicites ou frauduleuses ».
A quoi faisait-il référence exactement ? Il se trouve que les enquêteurs du fisc utilisent, depuis deux ans, des recoupements de vastes banques de données pour cibler leurs contrôles – mais qui excluent, pour l’instant, les données issues des réseaux sociaux.
Un décret de 2014 avait, en effet, autorisé l’administration à regrouper, dans un outil baptisé « ciblage de la fraude et valorisation des requêtes » (CFVR), les informations issues de très nombreux fichiers : adresses, numéros SIREN et SIRET, numéro TVAI, dates de création et de cessation d’entreprises, régime d’imposition… Ce grand fichier est utilisé pour établir des listes de particuliers et d’entreprises pouvant mériter un contrôle. Pour ce faire, la Direction générale des finances publiques (DGFIP) utilise un algorithme d’apprentissage automatisé, nourri par 20 années d’historiques des contrôles du fisc – soit environ un million de contrôles.
« [L’algorithme] va comparer les personnes sur lesquelles on a trouvé des redressements, et celles qui ont été contrôlées mais où il n’y a pas eu de fraude, et regarder les caractéristiques qui distinguent les fraudeurs des non-fraudeurs. Ce profil-type va nous permettre de cibler les contrôles à réaliser », expliquait en juillet Philippe Schall, responsable de la cellule analyse de données au service du contrôle fiscal, au micro de France Inter.
Des données complexes à intégrer
C’est à cet outil que M. Darmanin souhaite pouvoir ajouter des données publiques issues des réseaux sociaux. Mais si ces données peuvent effectivement être utiles, par exemple pour montrer qu’un résident fiscal Belge ou Suisse passe en réalité la quasi-totalité de son temps en France, l’intégration de ces données est loin d’être triviale. Contrairement à toutes les autres données utilisées par l’algorithme de la DGFIP, ces informations ne correspondent à aucun « historique » de contrôle, ce qui rendrait leur utilisation complexe, et nécessiterait vraisemblablement de longs développements. La date d’une première expérimentation « début 2019 », annoncée par M. Darmanin, semble donc pour le moins optimiste. A Bercy, on rappelle toutefois que la DGFIP travaille déjà avec « de très grandes quantités de données, certaines ayant de l’antériorité, d’autres non », et que les premiers résultats de cette expérimentation sont intéressants.
Surtout, l’intégration de données personnelles supplémentaires dans un fichier déjà très complet poserait d’importantes questions de vie privée. La Commission nationale de l’informatique et des libertés (CNIL) avait déjà tiqué sur certains aspects du décret créant le CFVR, tout en le validant. Dans sa délibération, publiée en 2017, la CNIL mettait en garde le gouvernement, rappelant que « si la lutte contre la fraude fiscale est un objectif à valeur constitutionnelle, la commission estime toutefois, au regard du nombre de personnes concernées et des techniques mises en œuvre, que des garanties appropriées doivent être prévues. »
Début septembre, M. Darmanin affirmait que des discussions sur ce dossier allaient rapidement être lancées avec la CNIL. Si le cabinet du ministre a affirmé à France Info que le projet ne consisterait pas à « scanner 60 millions de Français », la CNIL pourrait, elle, considérer que l’analyse automatisée de très nombreux profils de Français pose des problèmes importants.
Dans tous les cas, l’analyse d’un agent humain restera indispensable, à la fois légalement et pour des raisons d’efficacité. L’algorithme actuellement expérimenté par la DGFIP dispose par exemple d’importantes archives pour mieux cibler les contrôles sur l’impôt de solidarité sur la fortune… qui a été supprimé par le gouvernement. Mais n’a encore aucune donnée permettant de mieux cibler le nouvel impôt sur la fortune immobilière.