Когато прословутият „Убиец на Голдън Стейт“ - известен с поредица от изнасилвания и убийства в Калифорния през 70-те и 80-те години на миналия век - беше хванат миналия април, това предизвика колективна въздишка на облекчение. Но начинът, по който властите откриха убиеца - използвайки данни от уебсайт за генеалогия - остави хората с неспокойни чувства относно силата на генетичното тестване.
Това е така, защото убиецът на Голдън Стейт беше убит от ДНК, когато полицията съпостави пробите с тази на третия му братовчед, който беше качил генетични данни в генеалогична база данни. Оттогава дебатът се върти около етиката на използването на генеалогични уебсайтове за подпомагане на съдебно-медицинските разследвания.
И сега, ново проучване демонстрира колко широко разпространени са тези сайтове за генеалогия в действителност. Изследователите откриха, че около 60 процента от хората в база данни от над 1,2 милиона души могат да бъдат съпоставени с поне още един човек в базата данни, който е трети братовчед или още по-близка връзка.
Всъщност генетичната база данни трябва да покрие само 2 процента от целевата популация, за да намери поне мач на трети братовчед на почти всеки човек, пише в проучването, публикувано вчера (11 октомври) в списанието Science.
Групата анализира данни от 1,28 милиона анонимни хора на уебсайт за генеалогия, наречен My Heritage. (Водещият автор на изследването Янив Ерлих е главният научен ръководител на уебсайта.) Сравнявайки в ДНК на хората сегментите, идентифицирани по произход (IBD), сървърът може да намери дори далечни роднини като втори или трети братовчеди. Колкото по-голямо е количеството IBD, споделено между двама души, толкова по-близка е връзката им.
Изследователите се насочиха към споделени сегменти на IBD, които ще отговарят на втори, трети или четвърти братовчеди. Те открили, че 60 процента от търсенията им връщат мач - повечето са трети братовчед или по-близък. След това изследователите извършиха подобно, но по-малко търсене в GEDmatch (базата данни, която беше използвана за улавяне на Golden State Killer) и откриха, че 76 процента от техните 30 случайни търсения съвпадат с трети братовчед или по-близо.
Освен това те откриха, че най-лесно се свързват хора със северноевропейско потекло. Около 75 процента от хората в базата данни са от Северна Европа и има 30 процента по-голяма вероятност да имат мач, отколкото индивиди с генетичен произход от Африка на юг от Сахара.
Екипът установява, че след като тези роднини са намерени, самоличността на анонимния човек може лесно да се установи чрез проучване на семейни родове и демографска информация, като например възрастта на лицето или къде живее. Те показаха това, като откриха самоличността на анонимна жена, след като намериха нейни далечни роднини.
Всъщност между април и август тази година поне 13 студени случая в САЩ (включително този на убиеца на Голдън Стейт) бяха решени от подобни издирвания, сочи проучването. Това, което ги прави толкова мощни, е, че докато криминалистичните търсения в база данни - които са строго регулирани - могат да намерят само близки роднини до първа или втора степен, търсенията в генетични бази данни могат да намерят по-далечни.
„Докато създателите на политики и широката общественост може да подкрепят подобрените криминалистични възможности за разрешаване на престъпления, той разчита на бази данни и услуги, които са отворени за всички“, написаха авторите. „По този начин същата техника би могла да бъде използвана и за вредни цели, като повторно идентифициране на изследователските субекти от техните генетични данни.“
Изследователите предлагат да се създадат политики за защита на генетичните данни на хората. Те също така препоръчват сайтовете за генология да започнат да защитават сурови файлове с генетични данни със защитен цифров подпис, за да затруднят достъпа до тези данни.