Manta vytváří mapy datových toků

pondělí, 28. duben 2025 07:18

Banky nebo pojišťovny pracují s obrovským množstvím dat. Na jejich základě sestavují byznys plány, pracují s klienty nebo se jimi vykazují regulátorům. Proto potřebují, aby při toku dat v systému nedocházelo k jejich deformacím a aby se dalo zjistit, na základě čeho výsledná data získaly. A to umí Manta. U vývoje softwaru této firmy stál Lukáš Hermann, absolvent Matfyzu. Už několik let navíc ve společnosti nabírají zkušenosti i studující MFF UK, kteří s ní spolupracují na výzkumu a vývoji, jak za fakultu podotýká Pavel Parízek. A schopnosti Manty jsou natolik unikátní, že ji v roce 2023 koupila společnost IBM.

VS1 0566
Pavel Parízek a Lukáš Hermann spolupracují dlouhodobě propojují svět akademie a byznysu (zleva).

Čím přesně se Manta zabývá?

LH: Manta vznikla v roce 2016 jako spin-off z firmy Profinit, která spolupracuje s Matfyzem. Začali jsme jako malý tým asi deseti lidí, postupně jsme se ale zvětšovali až na zhruba 200 lidí. Dlouhodobě jsme spolupracovali s IBM, která náš produkt integrovala do svých řešení, až nás nakonec i jako firmu koupila. Teď produkt dále rozvíjíme pod názvem IBM Manta Data Lineage. Zabýváme se datovými toky. Ve velkých organizacích je spousta dat, která přicházejí z různých systémů, například od klientů. Firmy z nich pak sestavují různé reporty, na základě kterých se rozhodují o další činnosti. Cesta od zdroje k reportu může u velkých organizací obsahovat třeba až sto kroků, během nichž mohou vznikat chyby. Systém se vyvíjí, někdo v něm udělá nějakou změnu, která nechtěně ovlivní i něco někde dál, nebo přijdou špatná data z prvního zdrojového systému a propíšou se až do reportů. Také se může stát, že přijde regulátor a požaduje informaci, jak organizace k datům přišla. Náš produkt umí ukázat, jak se data po cestě až po finální report transformují. Manažer si tak může najít svůj report a uvidí celou cestu dat a jejich transformaci – navíc v uživatelsky příjemném prostředí.

A jak takové mapy datových toků sestavujete?

LH: Na tom spolupracujeme i s Matfyzem. Snažíme se všem programům, které data transformují a které jsou vytvářeny v různých programovacích jazycích, vlastně porozumět. Program čte data, transformuje je a výsledek pak zase někam ukládá, s tím pak pracuje další program. My se snažíme udělat syntaktickou a sémantickou analýzu zdrojového kódu a automatizovaně pochopit, co kód dělá s daty, a na základě toho vytvořit mapu.

Že je váš produkt jedinečný, ukázal i projevený zájem společností IBM.

LH: Na trh jsme vstoupili ve chvíli, kdy se různé firmy pokoušely o syntaktické analýzy, ale žádný z produktů nešel do hloubky. My chtěli pokrýt celý systém, zásadní je pro nás přesnost. A to byla naše výhoda. Nakonec jsme začali spolupracovat s dalšími firmami na trhu, které se sice snažily vyvinout svá řešení, ale nakonec uznaly, že ho nemají tak dobré jako my.

VS1 0523Jak vzniklo spojení Manty a Matfyzu?

LH: V prvé řadě musím říct, že v oboru jsem začal pracovat díky svému studiu. Manta ke spolupráci s MFF UK přistoupila v momentě, kdy jsme si uvědomili, že bychom se potřebovali dostat k analýze toků objektově orientovaných jazyků, jako jsou Java či Python, což je velmi komplikované. Proto jsme se spojili s docentem Pavlem Parízkem s tím, že by to mohlo být zajímavé téma. Roku 2018 jsme uzavřeli dohodu o spolupráci. Univerzita přinášela výzkum a my jsme do toho zase vnášeli požadavky, co naši zákazníci reálně potřebují.

Kdo jsou typově vaši klienti?

LH: Jsou to ty největší firmy na světě, protože pracují s nejvíce daty; tedy jde o banky, pojišťovny, telekomunikační operátory nebo zdravotnické firmy. Našimi klienty ale byla třeba i fotbalová liga nebo policie. Český trh je pro nás velmi malý, rychle jsme proto začali náš produkt nabízet ve Spojených státech, kde jsme získali největší objem zakázek.

Když studující Matfyzu projeví zájem o toto téma, jak se mohou zapojit?

PP: Konkrétní zadání pro studentské práce většinou přichází od firmy. Já to pak rozhlásím na škole a zájemce propojím s Lukášem. Uzavře se smlouva a pro IBM pak studenti či studentky pracují na částečný úvazek – vyvíjejí software. Já pak pomáhám z výzkumného pohledu a s konzultací těžších problémů. Společně se bavíme o tom, co funguje a co zlepšit. Naši studenti to mohou dělat v rámci bakalářské nebo diplomové práce, splní si tím své studijní povinnosti a zároveň je to pro ně i zajímavá pracovní výzva.

Kolik studentů dosud prošlo projektem?

PP: Postupně se zapojilo už dvacet studentů Matfyzu, většina z nich formou diplomky.
LH: Někteří ze studentů ve firmě po absolvování zůstali, protože je zaujalo to, co děláme. Je tu možnost vyzkoušet si reálné pracovní prostředí. Mladí lidé pak vidí, že softwarový vývoj není jen o psaní kódu a vymýšlení algoritmu, ale též o testování a přemýšlení nad kvalitou.

Vnímáte nyní s tím, jak firmy napříč obory zapojují více do své činnosti umělou inteligenci (AI), že roste poptávka i po vašich službách?

LH: Možná to není úplně vidět navenek, ale IBM je jedna z firem, která se umělou inteligencí zabývá z pohledu firemních zákazníků, kteří na rozdíl od retailových musí řešit, odkud berou data. To je jeden z problémů AI, neboť si prozkoumává internet a netrápí se tak úplně s autorskými právy, což si ale firmy nemůžou dovolit. IBM se proto věnuje tomu, aby modely, které vytváří, vycházely z ověřených zdrojů. Firmy posléze vědí, že je můžou použít. Firmy zároveň potřebují rozumět tomu, co AI dělá, protože pak nemůžou říct regulátorovi, že data „vypadla z umělé inteligence“ a že neví, jak se k nim dobrala. To, aby data od ní byla transparentní, je také jedno z témat, které chceme prozkoumávat s Matfyzem.

PP: Studenti nechtějí dělat výzkum „do šuplíku“, chtějí dělat něco, co má reálný dopad. Proto je spolupráce zajímá. Je to výhodné nastavení jak pro MFF UK a studující, tak pro firmu.

LH: Pavel ještě nezmínil, že i z takového našeho společného výzkumu vznikají klasické vědecké studie i články a že dosažené výsledky prezentujeme na špičkových vědeckých konferencích. Z praxe do vědy přinášíme soubory výzkumných problémů, na nichž můžeme stavět, zkoumat je a posouvat obor dál. Ideálně se tím propojuje akademie a byznys.

RNDr. Lukáš Hermann
VS1 0647Je absolventem oborů Programování a Softwarové systémy na Matematicko-fyzikální fakultě UK. Zabývá se datovými toky. Byl jedním z prvních vývojářů startupu Manta, který vznikl v roce 2016 oddělením od mateřské firmy Profinit. Vývoj softwaru tehdy podpořila Technologická agentura ČR. Dnes je Lukáš Hermann manažerem vývojářů produktu IBM Manta Data Lineage. Dlouhodobě spolupracuje s MFF UK.
doc. RNDr. Pavel Parízek, Ph. D.
VS1 0672Vystudoval Matematicko-fyzikální fakultu UK. Dnes působí na Katedře distribuovaných a spolehlivých systémů MFF UK. Zabývá se vývojem metod a nástrojů pro analýzu, ověřování a odstraňování chybovosti programů. Kromě spolupráce s IBM je kupříkladu zapojený ve výzkumném týmu projektu Advanced Analysis and Verification for Advanced Software financovaném Grantovou agenturou ČR.
Autor:
Foto: Vladimír Šigut

Sdílejte článek: