En France, la révolution des données immobilières est en marche
En France, la révolution des données immobilières est en marche
Par Jérôme Porier
Sous l’impulsion de l’État et d’une poignée d’acteurs privés, des avancées ont été faites. Mais les écueils restent nombreux : des segments du marché ne sont pas couverts et les données immobilières restent trop hétérogènes pour être comparées.
« En France, la production des données immobilières repose sur seulement une dizaine d’acteurs », résume la chercheuse et consultante Claire Juillard. / John Lamb/GO Premium / Photononstop
La révolution numérique est en marche sur le marché immobilier : les données sont de plus en plus nombreuses et accessibles. Sur les marchés du logement, les références de prix et de loyers constituent les données les plus stratégiques. Telles sont les principaux enseignements d’une étude réalisée entre mars 2018 et mai 2019 par la chercheuse et consultante Claire Juillard avec le soutien d’Iread (immobilier recherche études analyses data), du Laboratoire d’initiatives foncières et territoriales innovantes (Lifti), du Plan urbanisme construction architecture (Puca) et d’Urbanics.
« En France, la production de ces données repose sur seulement une dizaine d’acteurs », résume Mme Juillard. Des opérateurs locaux s’y ajoutent en tant que chaînons de réseaux nationaux, à l’instar des observatoires des loyers instaurés en 2014 par la loi pour l’accès au logement et un urbanisme rénové (ALUR) et des prix dans le neuf de la Fédération des promoteurs immobiliers (FPI), première organisation de la profession.
Autre constat : en France, aucun producteur ne couvre tous les segments du marché immobilier. C’est pourquoi l’information est disponible, mais éclatée. Par ailleurs, certains segments importants du marché restent mal renseignés, comme l’investissement locatif (entre un tiers et deux/tiers des ventes au détail dans le neuf chaque année), du diffus (140 000 maisons par an) et du marché de particuliers à particuliers (jusqu’à 40 % des transactions).
La plupart des producteurs de références de prix et de loyers existent depuis vingt à cinquante ans. La fin des années 2000 a confirmé leur position dominante, mais cette période a aussi marqué un tournant avec la création de Meilleursagents en 2008, le premier « pur » acteur venu du numérique.
« Le modèle de cette plateforme d’intermédiation située entre agents immobiliers et particuliers consiste à offrir de l’information gratuite aux seconds et à facturer aux premiers leur visibilité sur la toile », décrypte Mme Juillard. L’information produite est fine, - les prix sont estimés jusqu’à l’immeuble -, et consultable gratuitement en ligne. En seulement onze ans, Meilleursagents est ainsi devenu un acteur incontournable du marché immobilier.
En 2009, l’association LPI (Les Prix immobiliers) est venue compléter le paysage. Elle regroupe une dizaine d’acteurs de références du marché immobilier (Seloger, BNP Paribas Immobilier, Sogeprom, Crédit Mutuel, Crédit logement, Crédit logement…). L’association publie chaque mois le baromètre LPI-SeLoger des prix immobiliers. Seloger est avec Leboncoin le leader en France du marché de l’intermédiation immobilière à destination des particuliers (petites annonces).
Fondé en 2014, venu du numérique, Yanport (« Yet another portal ») est le dernier acteur à avoir émergé sur le marché immobilier. Cette plateforme agrège l’offre de logement et l’adresse aux agents immobiliers dans une optique de veille concurrentielle. Sa spécificité tient à la méthode employée pour recueillir l’information : le « scraping » (extraction des données) des annonces immobilières publiées par la quasi-totalité des portails. Elle tient aussi à l’application développée pour partager les données en temps réel.
Le rôle central de la puissance publique
Les années 2010 ont également été marquées par trois initiatives déterminantes de la puissance publique : la formation du réseau des observatoires locaux de loyers et l’ouverture immédiate de leurs données ; l’ouverture de nombreuses données notariales ; l’ouverture progressive à tous de la base de données « Demandes de valeurs foncières » (DVF) par la direction générale des Finances publiques, qui offre depuis juillet 2011 un accès à la quasi-totalité des transactions enregistrées en France. Cette ouverture des données publiques a favorisé l’émergence de start-up sur le secteur immobilier.
Le numérique conforte un autre registre que celui de la référence de prix et de loyers : l’estimation automatique, voire la prédiction. « Mais les données qu’il introduit sur le marché ne se substituent pas à l’offre existante, elles la complètent », précise Claire Juillard. Surtout, elles sont le fruit d’un travail d’agrégation des données de prix et de loyers existantes et de nombreuses autres données de sources diverses, notamment publiques. Les estimations ne puisent donc pas à de nouvelles sources de prix et de loyers, elles s’ancrent plutôt dans un renouveau méthodologique qui rappelle qu’avec le numérique, la valeur des données se révèle surtout dans les rapprochements et les croisements possibles.
Quant aux sources utilisées, elles continuent de provenir de seulement trois fournisseurs : les notaires (actes de vente authentiques), les agences immobilières (annonces et transactions signées) et les promoteurs immobiliers (réservations et ventes conclues). Tous les producteurs de données empruntent la voie de la dématérialisation pour remonter l’information à partir de ces trois mêmes fournisseurs, mais beaucoup conservent une part de travail « à la main ». Par exemple, les méthodes d’enquête restent centrales dans les dispositifs de production des données. Le branchement des producteurs aux systèmes d’information de leurs sources est encore rare.
Depuis qu’elles ont migré sur Interneteules, les petites annonces représentent véritablement une source de données nouvelle. Mais elles sont hétérogènes et souvent peu précises dans le descriptif des biens et leur localisation. C’est pourquoi leur exploitation est compliquée. Les données partagées ont beau reproduire les mêmes catégories (neuf et ancien, appartements et les maisons, nombre de pièces, époque de construction…), elles sont difficilement comparables.
Par ailleurs, la plupart des informations sont accessibles à l’échelle de la commune mais sur des champs différents. Les agrégats de niveaux supérieurs ou inférieurs ne sont ni disponibles systématiquement, ni homogènes. La périodicité varie également. Enfin, les prix et les loyers sont exprimés tantôt en médiane, tantôt en moyenne ; au m2 et/ou à l’unité. Bref, l’ensemble reste difficile à appréhender. Autant de difficultés qui limitent la portée de la révolution numérique dans l’immobilier.
Enfin, l’exhaustivité n’est pas une fin en soi. Même à l’échelle des ventes et des locations, plus la data est « big », moins elle est « smart ». A partir d’un certain seuil, la quantité induit une perte de qualité. C’est pourquoi la représentativité peut même lui être préférée. Tout l’enjeu est de fonder la donnée construite sur une information maîtrisée. « Ce qui suppose une expertise fine de l’immobilier. En forçant le trait, on pourrait même dire qu’aujourd’hui, mieux vaut encore être un bon connaisseur du marché qu’un bon « data scientist » », résume Mme Juillard.