Le big data, outil de prédiction des best-sellers
Le big data, outil de prédiction des best-sellers
LE MONDE ECONOMIE
Aux Etats-Unis, quatre chercheurs ont travaillé de concert pour mettre en équation les paramètres qui forgent la réussite commerciale d’un livre.
Les romans et les biographies se situent dans le peloton de tête de la liste des livres les plus vendus publiée par le « New York Times ». / TIMOTHY A. CLARY/AFP
Des kyrielles de statistiques et de formules mathématiques pour permettre aux éditeurs américains de savoir quel sera le prochain best-seller parmi les plus de mille nouveaux ouvrages publiés chaque année aux Etats-Unis…
Quatre chercheurs – Burcu Yucesoy, Xindi Wang, Junming Huang et Albert-Laszlo Barabasi – ont travaillé de concert au Centre de recherche des systèmes complexes du département de physique de l’université Northeastern de Boston (Massachusetts) pour mettre en équation les paramètres qui forgent la réussite commerciale d’un livre.
Dans un article publié le 6 avril dans la revue EPJ Data Science (groupe Springer) et consacré à l’analyse du succès des livres à la lumière des méga-données, ils ont tout d’abord relevé des facteurs saisonniers. La logique cartésienne n’est pas mise en défaut : plus on a de temps libre, plus on lit, et il se vend effectivement plus d’ouvrages pendant les vacances.
Modèle statistique
Les romans, qu’ils soient écrits par un homme ou par une femme, trouvent davantage d’acquéreurs que la non-fiction. Les romans et les biographies se situent ainsi dans le peloton de tête de la liste des livres les plus vendus publiée par le New York Times. Celle-ci a été décortiquée, semaine après semaine, depuis que ses données sont numérisées (2008).
Les chercheurs ont mis au point un modèle statistique permettant de prévoir qui fera partie de la poignée d’auteurs capables de rester en tête de la liste des best-sellers. Ils publient plusieurs équations pour calculer la courbe prévisionnelle des ventes d’un livre et même le nombre total d’exemplaires qu’un romancier vendra au cours de sa vie… Ils se fondent sur les résultats des dix premières semaines de mise en place d’un livre, au moment précis du pic, avant que la courbe s’inverse.
Mais ils tiennent aussi compte d’autres paramètres comme l’aptitude à répondre au goût du lecteur, la reconnaissance de l’auteur, son style, la couverture du livre et les efforts marketing de l’éditeur. Sans oublier l’« attachement préférentiel » (les recommandations des proches, des libraires, des critiques…) ou le « délai de vieillissement » attendu du livre. Du marketing scientifique destiné à atténuer les risques pour les éditeurs. A cette aune, rien ne dit que Henry David Thoreau, John Dos Passos ou Willliam Burroughs auraient été publiés.