Aux Etats-Unis, les bases de données génétiques permettent d’identifier de nombreux anonymes
Aux Etats-Unis, les bases de données génétiques permettent d’identifier de nombreux anonymes
Une étude parue dans « Science » montre que les services d’analyse d’ADN grand public, utilisés pour des recherches généalogiques, présentent un risque majeur pour la vie privée.
Ils s’appellent 23andMe ou Ancestry, pour ne citer que les deux plus grands. Depuis quelques années, ces sociétés privées proposent aux Américains d’analyser leur ADN. Les clients envoient, par courrier, un prélèvement buccal, et reçoivent ensuite une analyse complète de leur génome, pour un coût d’environ 150 euros. Ces informations sont notamment prisées des personnes essayant de reconstruire leur arbre généalogique. De nombreux clients publient ensuite, de manière anonyme, ces données sur des bases de données publiques, comme GEDmatch, qui leur propose de trouver des liens génétiques avec d’autres personnes – là encore, un outil utile pour les généalogistes.
Mais une fois accumulées, les données génétiques, comme toutes les autres, attaquent le respect de l’anonymat de nombreux individus. Une étude publiée dans Science le 11 octobre, et analysée par le magazine Wired, montre qu’il y a, désormais, suffisamment de données génétiques disponibles dans GEDmatch pour permettre de mettre des noms, avec un taux de réussite important, sur des échantillons ADN de personnes qui n’ont, pourtant, jamais utilisé les services de 23andMe ou d’Ancestry.
Recherches en ligne et comparaisons
Selon les chercheurs, 60 % des Américains ayant des ancêtres européens peuvent ainsi être identifiés précisément à partir d’une méthode de recherche, même s’ils n’ont pas envoyé leur ADN. Le recoupement de diverses informations et la comparaison d’un échantillon d’ADN avec des bases de données ADN déjà existantes conduisent à pouvoir trouver l’identité précise de la personne, dont est issu l’échantillon. Ce genre de technique par déduction avait été utilisé pour identifier le tueur en série présumé dit « Golden State Killer », en 2017, en Californie.
Pour cela, la méthode de recherche déroulée par l’étude parue dans Science a lieu en deux étapes. Dans un premier temps, la comparaison de l’ADN d’une personne avec ceux présents dans les bases de données permet d’obtenir une liste de personnes qui font potentiellement partie de sa famille élargie, ou de ses ancêtres. Ensuite, des recherches en ligne classiques permettent d’éliminer des profils, en se basant sur le lieu ou la date de naissance de la personne qu’on cherche à identifier, ou encore sur la proximité génétique des profils, pour identifier de proches parents de la cible, et ainsi en déduire son identité.
La technique utilisée, démontrée par l’étude, se fonde sur des Américains ayant des ancêtres européens, car la très grande majorité des personnes ayant utilisé ces services sont blancs. De tels profils liés à des « ancêtres européens » ont permis aux chercheurs d’obtenir une masse critique de données facilitant l’analyse de leurs profils génétiques.