La fondation Wikimedia et Jigsaw, l’incubateur d’Alphabet (maison-mère de Google), ont publié le 7 février les résultats d’une étude menée l’an passé. Son objectif était de « mieux comprendre la nature et l’impact du harcèlement », afin de développer des « solutions techniques » efficaces permettant de le limiter.

Pour ce faire, ce sont pas moins de 100 000 commentaires publiés en 2015 sur Wikipedia qui ont été analysés par des humains. Ces derniers ont dû en extraire les propos haineux, avant de les classer en trois catégories : les attaques personnelles (« tu crains »), celles visant un tiers (« il craint »), et celles indirectes (« quelqu’un a dit que Bob craignait »).

Grâce à ce qui est décrit comme « la plus grande base de données publique » sur le sujet, un algorithme a été mis au point. Il serait, selon Jigsaw, plus efficace que trois humains combinés pour détecter le harcèlement. Moins coûteux aussi...

Un tiers des harceleurs ne sont pas anonymes

L’outil ne serait toutefois pas encore parfaitement au point. Il ne détecterait ainsi pas les menaces, et ne vaudrait que pour les contenus postés en anglais. Mais il pourrait, au moins dans un premier temps, servir d’appui aux modérateurs, qui chaque jour, doivent analyser environ 24 000 contenus sur Wikipedia.

L’intérêt de l’étude réside aussi dans les quelques chiffres qui concernent les auteurs de commentaires haineux. L’on apprend par exemple que les utilisateurs anonymes sont en moyenne six fois plus susceptibles d’en être. Pour autant, un tiers des attaques personnelles répertoriées restent attribuées à des contributeurs fréquents du site, qui pourraient être reconnus par leur pseudonyme, ou parfois même, leurs nom et prénom qui apparaissent publiquement.

Autre chiffre : 9 % des mille et quelque commentaires insultants seraient le fait de seulement 34 utilisateurs. Un chiffre qui incite Jigsaw à considérer que « des progrès significatifs pourraient être faits en modérant un nombre relativement faible de harceleurs fréquents ». Reste à établir ensuite des sanctions concrètes... Pour l’heure, seulement 18 % des attaques personnelles seraient suivies d’un avertissement ou blocage de l’utilisateur en cause. Lorsque ce dernier a été l’auteur de quatre attaques ou plus, le ratio passe à tout juste 60 %.