Internet Archive a fêté ses 20 ans en 2016. / MORGANE TUAL / « LE MONDE »

Les règles de Wikipédia sont claires : quand un contributeur ajoute des informations dans l’encyclopédie, il doit citer ses sources et fournir un lien hypertexte renvoyant vers elles. Or, plus de dix-sept ans après sa création, nombreux sont les liens « cassés ». Ils renvoient vers des pages Web disparues, ce qui rend l’identification des sources difficiles pour les internautes dans de nombreuses entrées de Wikipédia.

Afin de remédier à ce problème, Internet Archive, une fondation qui tente d’archiver le Web depuis plus de 20 ans, a annoncé lundi 1er octobre avoir contribué à réparer 9 millions de liens cassés sur Wikipédia. Elle a pour cela utilisé un logiciel (un « bot ») permettant de détecter automatiquement les liens cassés, et les remplacer par un lien renvoyant vers la page Web archivée.

Ce logiciel a ainsi permis de réparer environ 6 millions de liens. Les contributeurs de Wikipédia ont quant à eux réparé manuellement 3 millions de liens, renvoyant vers les pages sauvegardées par Internet Archive. La fondation a prévu de continuer ce travail, avec pour objectif de gagner en rapidité pour remplacer les liens cassés.