Jak bioinformatici pomáhají hledat příbuzné

čtvrtek, 17. duben 2025 05:25

Genetická genealogie – hledání příbuzných pomocí analýzy DNA – je stále oblíbenější disciplína. Díky vzájemné spolupráci Kriminalistického ústavu a Matfyzu UK vzniká výzkumná platforma, která vedle dalších cílů poslouží i pro vývoj bioinformatických nástrojů pro forenzní genetickou genealogii.

Před téměř dvaceti lety vznikl na Kriminalistickém ústavu projekt Genetika a příjmení, jehož cílem bylo shromáždit reprezentativní vzorek české mužské populace pro účely populačně genetických studií Y-haplotypů.

VVN05089wProjekt postupně přinesl řadu zajímavých výsledků, nicméně původní veřejně dostupné databáze Y-haplotypů již nebylo možné z různých důvodů využívat. „Proto padlo rozhodnutí vytvořit vlastní databázi s webovým rozhraním, které bude splňovat soudobé požadavky jak na přívětivé uživatelské prostředí, tak na přísnou ochranu osobních údajů, “ říká Michaela Nekardová z Kriminalistického ústavu.

„Projekt nás okamžitě zaujal – na první pohled může vypadat velmi jednoduše, ale z pohledu informatika je zřejmé, že takový systém vyžaduje skutečně komplexní řešení,“ vzpomíná na začátek spolupráce v roce 2020 bioinformatik David Hoksza z MFF UK. Vývoj nové databáze se tak stal jedním z projektů v rámci předmětu Týmový softwarový projekt, ve kterém čtyř až šestičlenné skupiny studentů a studentek devět měsíců pracují na reálných softwarových výzvách.

Komplexnější než se zdá

„Nová výzkumná databáze DNA profilů ukázkově kombinuje různé znalosti a přístupy ze softwarového a datového inženýrství a bioinformatiky,“ komentuje David Hoksza. Studenti tak v rámci projektu museli řešit například samotný sběr a zabezpečení dat, bioinformatickou analýzu, vizualizaci výsledků, ale například i možnost zpřístupnění anonymizovaných dat pro další výzkumy.

Výstupem bude uživatelský web, kam zájemci mohou nahrát svůj Y-STR profil a získat seznam DNA shod s dalšími muži v databázi. Na webu je pro uživatele dostupná například i mapa distribuce Y-haploskupin a příjmení, fylogenetický strom. Administrátoři mají k dispozici rozšířené rozhraní pro správu systému, které umožňuje vytvářet uživatelské účty, prohlížet a editovat data uživatelů a vytvářet exporty dat pro spolupracující třetí strany. Velký důraz byl kladen na zabezpečení citlivých genetických dat a možné budoucí aktualizace a rozšiřování. „Od začátku o nové databázi přemýšlíme jako o modulárním systému,“ dodává Michaela Nekardová.

VVN05250w

Chromozom Y se dědí podobně jako příjmení v mužské linii, a proto lze hledat vztahy pouze mezi otcovskými liniemi. Genetická genealogie ale pracuje s dalšími typy genetických profilů, primárně testováním autozomální DNA, což umožňuje najít DNA shody ze všech rodičovských linií. Vzájemným porovnáním a doplněním rodokmenů lze pak dohledat společné předky až šest generací do minulosti. Klíčovým faktorem procesu je IBD algoritmus (identical by descent), který umožňuje najít shodné úseky DNA, společné dvěma nebo více lidem. Jedním z cílů spolupráce s MFF UK je tento algoritmus vyvinout i pro výzkumnou databázi DNA profilů.

Dvě povedené bakalářky

Na výsledky týmového softwarového projektu navázaly i dvě bakalářské práce. Ta první se zaměřila na zmapování systému forenzní genetické genealogie z pohledu bioinformatiky. „Vznikla skutečně komplexní analýza procesů forenzní genetické genealogie včetně přehledu typů analýz, ale například i komerčně dostupných nástrojů, která má sloužit jako manuál pro programátory,“ chválí Nekardová. Druhá bakalářská práce se zaměřila na možnosti správy a vizualizace populačních genetických dat. Výstupem je tabulkové zobrazení, které forenzní genetici mohou využívat pro efektivnější vizualizaci a práci s DNA profily.

VVN04866wV USA bylo od roku 2018, kdy se tam forenzní genetická genealogie začala široce používat, vyřešeno více než tisíc vražd starých i několik desetiletí. V Evropské unii musí členské státy nejdříve přijmout příslušné legislativní změny, ve většině zemí zatím probíhají jen pilotní studie identifikace neznámých ostatků nebo hledání pachatelů vražd. „Jen v Česku je od devadesátých let zhruba 500 nevyřešených vražd a u třetiny nejsou identifikovány ostatky,“ líčí Michaela Nekardová.

Genetickou genealogii využívá také mnoho lidí narozených z darovaných vajíček či spermií pro hledání biologických rodičů a sourozenců. České zákony totiž nařizují bezvýhradnou anonymitu a zdravotnická zařízení nemohou poskytovat informace, které by vedly k identifikaci dárců nebo příjemců. A někteří dárci nebo potomci touží poznat své příbuzné, a pátrají „na vlastní pěst“.

Kriminalistický ústav ve spolupráci s Matfyzem jednoznačně plánuje pokračovat. „Ačkoliv má Kriminalistický ústav statut vědecko-výzkumné instituce, věda a výzkum představují spíše okrajovou část jeho činnosti, a proto se neobejde bez těsné spolupráce s akademickou sférou. Kriminalistický ústav vlastní bioinformatiky nemá,“ sdílí Michaela Nekardová. Konkrétně plánují především vylepšovat a rozšiřovat současné možnosti databáze.

Ing. Michaela Nekardová, Ph. D. 
Působí jako vědecká spolupracovnice Policie ČR. Je hlavní autorkou projektu Implementace forenzní genetické genealogie a forenzní genomiky do kriminalistické praxe PČR a řešitelkou souvisejícího projektu bezpečnostního výzkumu Ministerstva vnitra na Kriminalistickém ústavu
doc. RNDr. David Hoksza, Ph. D. 
Na Katedře softwarového inženýrství MFF UK je zodpovědný za bakalářský a magisterský program Bioinformatika, na kterém se rovnocenně podílí PřF UK a MFF UK. Zároveň je garantem doktorského studijního programu Bioinformatika a výpočetní biologie
Autor: Pavla Hubálková
Foto: Veronika Vachule Nehasilová

Sdílejte článek: