Trois copains, un génie, de la musique et des SMS : aux origines de Shazam
Trois copains, un génie, de la musique et des SMS : aux origines de Shazam
Par Pauline Croquet
Avant de devenir une application phare des smartphones, Shazam était un service de reconnaissance musicale par SMS. Une manipulation simple pour l’utilisateur qui a nécessité des trésors de science pour sa mise en œuvre.
Shazam a été fondée en 1999. / THOMAS WHITE / REUTERS
Lorsqu’en juillet 2008 Apple lance son Appstore, qui permet de télécharger des fonctionnalités sur iPhone notamment, une application tient le haut du pavé. Shazam, c’est son nom, épate rapidement ses utilisateurs. Gratuite, elle permet de reconnaître une chanson diffusée à la radio, dans un bar, n’importe où. Il suffit d’enregistrer le son quelques secondes pour qu’elle retrouve le titre qu’ils avaient sur le bout de la langue, qui aurait peut-être fini par les obséder plusieurs heures durant. A l’époque, cela ressemble à un petit tour de magie pour l’usager – ce qui amènera les fondateurs à baptiser leur invention avec cette expression voisine d’abracadabra.
Shazam est l’une des premières applications non développées par les constructeurs de mobiles à laisser entrevoir tout le potentiel d’un smartphone, à l’époque où celui-ci en était à ses balbutiements. Aujourd’hui, l’entreprise, dont le rachat par Apple a été annoncé lundi 11 décembre, revendique 1 milliard de téléchargements et plusieurs centaines de millions d’utilisateurs actifs.
Séances de brainstorming
Mais Shazam n’est pas née avec l’iPhone. D’abord un service de détection musicale par SMS, elle a été fondée en 1999 par trois amis diplômés en commerce de Stanford et Berkeley, et passionnés de technologies. Cette année-là, Chris Barton et Dhiraj Mukherjee, qui se sont rencontrés aux Etats-Unis, vivent à Londres pour le travail – le premier comme stagiaire chez Microsoft, le second en tant que consultant chez Viant – et deviennent inséparables. Ils convainquent un camarade belge de Berkeley, Philip Inghelbrecht, de s’associer à eux s’ils trouvent une bonne idée d’entreprise.
Pendant l’été 1999, l’Américain Chris Barton se creuse la tête pour trouver un bon concept. « En fait, Dhiraj et moi planifiions même des séances de brainstorming dans les cafés le week-end, où nous faisions littéralement la liste des nombreuses idées de business et discutions de leur faisabilité, rapporte M. Barton en 2015 à The Startup, une communauté d’entrepreneurs dans les technologies. A l’époque, la bulle Internet était à son apogée. Il semblait qu’il y avait énormément de possibilités pour une entreprise débutante de prospérer. »
Puis vient l’idée : les trois amis décident de mettre au point un logiciel de reconnaissance de chansons qui fonctionnerait quels que soient le support de l’écoute et la qualité du son. Un concept inspiré par le propre comportement de Chris Barton, qui écrivait sur des bouts de papiers des playlists de chansons entendues dans les cafés ou dans des soirées.
Défi technologique de taille
Mais cette idée séduisante représente alors un sacré défi. Le marché de la musique en ligne est inexistant. iTunes ne verra le jour qu’en 2001, Spotify en 2006, et pour l’heure le gros des fichiers de musique sur Internet provient d’offres illégales. Autre gageure pour le trio d’apprentis entrepreneurs : trouver une personne qui pourra mettre au point cette technologie, ce dont aucun d’eux n’est capable. Après des recherches sur le Web, ils dressent une liste d’une trentaine d’universitaires spécialistes en son et en acoustique. Sur les conseils d’une éminence en la matière, Julius Smith, enseignant de Stanford qui a participé à la conception des synthétiseurs Yamaha, ils s’adressent au numéro un de leur liste : Avery Wang, un ingénieur diplômé de Stanford.
A force de persuasion, Avery Wang accepte de s’associer à eux, et de relever un défi technologique de taille : mettre au point un système de reconnaissance musicale qui prenne en compte n’importe quel moment d’une chanson, quels que soient le support de l’enregistrement et le bruit d’ambiance dans lequel il est capturé. Certaines entreprises proposaient déjà à l’époque des systèmes de détection de ce type, mais uniquement basés sur les playlists qui leur étaient transmises par des radios.
« On a craqué le code ! »
Au bout de plusieurs mois de recherches, alors qu’il allait jeter l’éponge, M. Wang parvient à mettre au point un système de comparaison par empreinte acoustique. Il s’agit de traduire chaque chanson en « spectrogramme, c’est-à-dire un diagramme en 3D défini par le temps, la fréquence et l’amplitude », comme l’explique le magazine Science et Vie. Ce qui permet de comparer l’empreinte d’une chanson même captée dans le brouhaha avec les empreintes présentes dans la base de données. Les premiers essais menés sur des enregistrements pris dans des pubs bruyants de Londres se révèlent concluants. En juin 2000, Chris Barton, alors en vacances en Croatie, reçoit un appel d’Avery Wang : « On a craqué le code ! »
Au lieu de s’abriter dans la Silicon Valley, Shazam préfère s’installer sous le crachin de Londres. « Pour le mode de vie », reconnaît Chris Barton, mais surtout « parce que le marché du mobile était plus avancé en Europe et au Japon. Apple et Google n’avaient pas encore commencé à se tourner vers le mobile, et Nokia était tout puissant », explique le premier PDG de Shazam à The Startup.
Shazam lance son service au Royaume-Uni en 2002. Pour 1 demi-livre sterling, les détenteurs d’un téléphone mobile peuvent composer le 25-80 et enregistrer quinze secondes de musique. Ils reçoivent par retour de SMS le titre de la chanson. « Une époque où le téléphone le plus populaire était le Nokia 3310. Il n’y avait pas d’“apps”, pas de téléchargements, pas de vidéos. Les seules choses que faisaient les gens étaient de s’envoyer des SMS et d’installer des sonneries », rappelle souvent Chris Barton dans ses conférences. Shazam commence à créer une base de données inédite d’empreintes de 1,7 million de chansons. « Aujourd’hui, il y en a plus de 30 millions », précisent les créateurs.
Popularité en hausse
Les fondateurs ont également passé une année à convaincre les opérateurs mobiles britanniques de les autoriser à employer le numéro de téléphone 25-80, « qui correspond à la ligne verticale formée par les chiffres au centre du clavier d’un téléphone » et dont ils pensaient qu’elle était convoitée pour sa simplicité à retenir.
« Les opérateurs mobiles européens étaient plus avancés et proposaient des “SMS Premium” comme mécanisme de paiement mobile accessible à des tiers, tels que les entreprises de sonneries. Les SMS Premium n’étaient pas disponibles chez les opérateurs mobiles américains. Si Shazam avait été lancé aux Etats-Unis, nous n’aurions eu aucun moyen de générer des revenus », confie Chris Barton à The Startup.
Lorsque Shazam devient gratuit pour ses utilisateurs sur iOS et Android en 2008, l’application engendre des recettes en affichant des publicités sur sa page d’accueil. Elle perçoit aussi des commissions en redirigeant ses utilisateurs vers des plates-formes de téléchargement légal ou de streaming. Mais sa santé économique ne tient toujours qu’à un fil, bien que sa popularité soit en hausse.
Les fondateurs de Shazam observeront de loin le rachat de leur projet par Apple. Aujourd’hui, seul Avery Wang continue d’y officier comme directeur scientifique. Chris Barton a depuis intégré Google, Dhiraj Mukherjee a rejoint une banque d’investissement en Angleterre et Philip Inghelbrecht collabore avec plusieurs start-up.