Před lety se svými spolupracovníky učili robota psát divadelní hru, nyní se Rudolf Rosa snaží naučit umělou inteligenci k sepsání poezie. Povídali jsme si nejen o projektu se širokým záběrem AI v kontextu ale i o tom, zda může být umělá inteligence „dobrý sluha ale zlý pán“.
K čemu je vlastně dobré, aby AI uměla skládat básně?
Interdisciplinární projekt EduPo má důležitý didaktický rozměr – hlavním cílem je vytvořit vzdělávací aplikaci, která by se dala využívat ve výuce českého jazyka na základních a středních školách. Básně starších autorů dnes těžko mohou oslovit mladou generaci a naše aplikace dokáže jejich díla převést na aktuální témata, co dnešní žáky zajímají. Ovšem v Erbenově stylu, například. Celá výuka o poezii by tak mohla být kreativnější a otevřenější.
Máme za sebou první rok spolupráce s Ústavem pro českou literaturu Akademie věd, další dva roky nás ještě čekají. Naším úkolem za ÚFAL je trénovat jazykové modely, aby generovaly poezii, vytváříme nástroje na analýzu poezie. Máme prototyp, který dle zadání zvládne generovat báseň. Zaměřili jsme se na základní aspekty, aby se vše správně rýmovalo, byly tam správné přízvuky – věci, které klasické jazykové modely neumí.
A nebudou výstupy také především o násilí a sexu, jako když jste učili robota psát divadelní hru?
Zatím to vypadá, že ne (směje se). Při psaní divadelní hry jsme měli k dispozici GPT2, což byla tehdy dostupná špička, ale byl natrénovaný takřka na vše, co se objevilo na internetu. Neměl žádné filtrování, čili se jednalo o spíše takovou esenci toho, o čem se na internetu píše nejčastěji, proto byl výsledkem sex a násilí, což je pro lidi evidentně nejvíc atraktivní. Dnes už se ukazuje, že se systém těmto tématům vyhýbá, dnešní modely už jsou totiž vyfiltrované na to, co ve výstupu nechceme.
A jak se na projekt EduPo dívají sami autoři poezie?
Se současnou českou básnickou komunitou jsme v kontaktu a je pro nás důležité se s nimi bavit. Naším záměrem není připravit je o práci, ale naopak poezii obohatit a zpřístupnit ji širšímu publiku. Věříme, že když se ten projekt povede, tak vzbudí o poezii větší zájem. Rádi bychom uspořádali veřejný workshop nebo setkání, kam chceme právě zástupce básnického světa pozvat. A doufáme, že mezi nimi najdeme lidi, kteří by s námi chtěli aktivně spolupracovat.
To by mohl do budoucna vzniknout i nějaký poetry battle mezi počítačem a člověkem.
Ano, to bychom rádi. Zatím je ale trochu problém v tom, že automatickým systémům přece jen generování výstupu nějakou dobu trvá. Takže i kdybychom rádi ideálně nějakou živou improvizovanou show, tak člověk bude vždy rychlejší. Zatímco současný improvizační básník zvládne cokoliv vychrlit během půl vteřiny, systémům chvilku trvá, než něco zprocesuje a vygeneruje... Čili platí, že to chceme zkusit, ale uvidíme, jestli to bude vlastně zábavné, zda ta zpoždění nebudou pro publikum příliš otravná a celý ten formát to nakonec nerozbije.
Už jste robota naučili psát divadelní hru v projektu THEaiTRE. Jak daleko jsme ale od toho, že bude umělá inteligence schopna vymyslet originální text na vlastní téma?
Všechny systémy se učí z dat, která jim poskytneme, čili se snaží napodobovat to, co se naučily. Někdy až velmi přímočaře, kdy prostě jen „vykrádají“ trénovací data z jiných zdrojů a dávají to na výstup. Dnešní systémy už zvládnou tvořit nové věci, které jsou inspirované tím, na čem se učily, ale jsou jiné. Nicméně nemohou se v principu posunout nějakým novým směrem. Spíš je to vždy takové jako remixování, průměrování toho, co viděly, pohybují se v prostoru věcí, na kterých se učily. To znamená, že mohou novým způsobem kombinovat věci, které viděly, ale v podstatě se snaží napodobovat. Nejsou schopni se vydat nějakým zcela novým směrem resp naše poznání je takové, že nevíme, jak bychom je donutili k tomu, aby se to nepodobalo už známým datům, ale aby přišly už s něčím opravdu originálním.
Proto se mimojiné snažíme přijít na to, jak s modelem manipulovat tak, aby dokázal být kreativnější. Jazykový model je stará myšlenka z 50. let a dlouho byl problém, aby udržel jednu větu pohromadě, to platilo například ještě před deseti lety. S GPT2 už byly jednotlivé věty dobré, jakžtakž to drželo pohromadě i na úrovni jednoho odstavce, ale v delším textu už se návaznost začala tak nějak rozsypávat…
Dnes už model GPT4 udrží kontext na několika stranách a zvládne generovat smysluplnější a logičtější texty, lépe navazující. Nicméně v případě psaní her či scénářů stále pozorujeme, že ty výstupy jsou tak nějak nudné, nezajímavé. Zvlášť na nějakém delším textu, kde očekáváme nějakou dynamiku a že se něco zajímavého stane, tak jazykové modely se snaží být stále uhlazené, kultivované a nijak dramatické. Což je vhodné například u věcného článku do novin, ovšem u divadelních her je to spíše kontraproduktivní.
Tehdy jste měli ambici, že by robot psal i divadelní scénáře.
My se snažili o klasickou divadelní hru a zjistili jsme, kam až to jde dotáhnout. Dnes by to bylo s novými nástroji o něco lepší, ale stále by to asi nebylo až tak strhující. Takže mi vlastně připadají úspěšnější projekty v rámci experimentálního divadla. Nejběžnější způsob bývá takový, že jeden z herců má v uchu sluchátko, do kterého dostává vygenerované repliky pro danou chvíli. Tudíž místo aby hrál za sebe, tak je jakousi loutkou ovládanou nějakým systémem. A ostatní herci kolem si s tím musejí nějak poradit a improvizovat tak, aby to dávalo smysl. Tohle vidím jako zajímavé, zábavné, a použitelné.
Možná je AI dobrý pomocník pro začínající scénáristy, kteří si řeknou systému o pomoc ve chvíli, kdy si neví rady.
V tomto směru rozvíjíme spolupráci s Městskou knihovnou v Praze a už máme za sebou dva ročníky literární soutěže, kdy autoři aktivně využívají umělou inteligenci při psaní povídek. První ročník nesl název Přicházejí z-AI-mavé časy na téma scifi nebo horor, a druhý ročník se jmenoval Z-AI-mavý zločin a tam jsme po autorech chtěli detektivku. Nechali jsme čistě na autorech, v jakém rozsahu AI zapojí, ale ať nám každý poté dodá jakýsi report, jakým percentuálním podílem na tom pracovali sami.
Poprvé jsme obdrželi asi 70 povídek, a z větší části byl autorem člověk. Druhé téma mělo okolo třiceti účastníků a zvítězila povídka Michaely Liegertové, proděkanky Přírodovědecké fakulty Univerzity Jana Evangelisty Purkyně v Ústí nad Labem, která nám přiznala, že se na psaní podílela jen z jednoho procenta. Pracovala prý tak, že se systému postupně ptala, jak by měla vypadat ideální povídka, která vyhraje soutěž tohoto typu, a jak by to napsal profesionální spisovatel. A když dostala určité rady, tak to zase přetočila a řekla: tady máš rady, jak napsat skvělou povídku, tak se jimi řiď a povídku napiš. A na konci ještě systém potrápila znovu se zadáním, aby povídku vyhodnotil podle nějakých kritérií a našel, které věci tam nejsou dobře a zase to vylepšil. Její vklad tak byl především v tom, že ovládala ten systém a v podstatě byla na úrovni jakéhosi manažera začínajícího spisovatele a postupně systém tlačila k tomu, aby vytvořil něco kvalitního.
To je údajně nejpodstatnější část práce se systémy AI - umět se správně ptát, dávat správné příkazy.
Často se říká, že systémy časem nahradí programátory, protože bude stačit jenom říct co chci a ono mi to tu věc vygeneruje. A my rádi říkáme: to je ale typicky největší problém, když máme něco vytvořit - aby nám zadávající zvládl přesně říct, co vlastně doopravdy chce. Tahle část je velmi důležitá. Některé věci nemusím umět sám udělat, pokud zvládnu dobře a přesně říct, co vlastně chci. A ten systém to třeba zvládne, nebo taky ne.
Je třeba neustále zkoušet sám sebe zdokonalovat v tom, jak správně říct, co chci. Ty systémy se postupně vyvíjí, to znamená, nejde nutně o to naučit se nějaká specifická slova, která používat v komunikaci se systémem, ale podstatnější je, aby se člověk naučil, jak detailně a přesně popsat, co chce. Pak je šance, že přesně to dostanu.
A dostat mohu opravdu cokoliv, včetně falešného obsahu, tzv. deepfake. Už před pár lety začala AI úspěšně generovat obrázky a dnes poměrně dobře zvládá i videa.
Na deepfake prozatím nemáme žádnou dobrou technologickou odpověď. Je to takový boj ve zbrojení – cokoliv na jedné straně zvládnu generovat, tak se mohu na straně druhé snažit detekovat, filtrovat, přistřihávat…. Cesta je spíše ve vzdělávání a informování – přijmout fakt, že v dnešní době je možné generovat realistické obrázky a videa, na kterých může být cokoliv. A zapojit více kritické myšlení.
Vlastně jsem překvapený, že deepfake ještě není až tak masivně rozšířeno, jak by už díky současným technologiím mohlo být. Už pár let se odborníci bojí toho, že bude internet zahlcen falešným obsahem natolik, že v tom obrovském šumu se skutečná informace ztratí. Zatím se to děje pomaleji, než jsme se všichni obávali.
Oblíbený leitmotiv scifi filmů nebo literatury je, že roboti ovládnou a zotročí lidstvo.
Scifi příběhy nás roky krmí představou, že budoucnost je nějaká dystopie, ve které se inteligentní stroje najednou rozhodnou zničit lidstvo. A pokud tuto vizi lidé opravdu přijmou jako nejpravděpodobnější scénář, tak tu máme problém. Jistě, každá technologie se může vymknout kontrole a lidstvo má za sebou spoustu případů, kdy jsme něco vyvinuli a pak teprve zjistili, že to možná to není až tak růžové, jaderné zbraně například. I když využití jaderné energetiky je samozřejmě užitečné.
Musíme se naučit rozlišit, na co je využití umělé inteligence vhodné, a na co nikoliv, a podle toho se společensky domluvit na tom, jakým způsobem tyto nástroje budeme používat. Já v nějaké smysluplné spolupráci mezi lidmi a technologiemi obecně jednoznačně vidím budoucnost. Nástroje AI jsou na některé věci zjevně lepší než lidé: na rychlé zpracování obrovského množství dat, hledání nějakých pravidelností, zastanou činnosti, které jsou opakující. Jde o to naučit se vše využívat správně a účelně. V EduPo například nyní diskutujeme, které věci má náš systém dělat automaticky a kde je přínosnější, aby se zapojili žáci ve škole, a my je k tomu jen nasměrovali.
To je další otázka pro budoucnost: když za nás stroje budou dělat řadu věcí, nepřipraví se lidstvo postupně o tvůrčí myšlení a schopnost improvizace?
To jistě hrozí, stačí se na spoustu věcí podívat do minulosti. Před zhruba 200 lety si většina lidí uměla sama doma vypěstovat jídlo, pak ho sklidit zpracovat. Dnes většina populace tak nějak tuší, že se nějaké části rostlin dají do země, a když se to zaleje, tak z toho možná něco vyroste. Jsou to vědomosti, které jsme ještě úplně neztratili ale kompetence v mnoha dovednostech už nám chybí. Výzkumy dokazují, že je pro lidi podstatné dělat nějakou mechanickou práci rukama, že to prostě rozvíjí mozek a další části těla způsobem, který je potřebný. Když najednou všechno jen ťukáme na obrazovce počítače, tak nám to škodí.
Svět se rychle mění a řešíme to i v diskusi s Národním pedagogickým institutem - co dnes lidi vlastně učit? Pro málokterou práci platí, že ji budu moci dělat 50 let v kuse úplně stejným způsobem. Věci a postupy se poměrně velmi rychle proměňují, a chtě nechtě musíme přijmout, že je potřeba sledovat, jak se svět vyvíjí a postupně se učit dělat věci novým způsobem a být flexibilní. Málokterá profese vymizí úplně, ale člověk, který zvládne dobrým způsobem používat nástroje, které se dnes nabízejí, tak bude tu práci dělat kvalitněji a rychleji. A člověk, který zvládne udělat lepší práci v kratším čase, bude logicky na trhu práce poptávanější.
Jaká byla vlastně vaše cesta k programování?
Ještě na střední škole jsem dlouho neměl jasno, jak pokračovat. Máma má v Kladně jazykovou školu, táta je elektrikář, takže jsem z jazykového prostředí, ale měl jsem blízko i k technickým věcem. A tak mi v nějakou chvíli přišel Matfyz jako dobrý nápad, jen jsem nevěděl, zda chci dělat matematiku nebo informatiku, protože k programování jsem se na střední moc nedostal. Programovat jsem se učil až v prváku informatiky. Na magistru jsem si pak vybral počítačovou lingvistiku jako specializaci a ukázalo se, že to byla dobrá volba.
Strojovým překladům se na světě zabývají statisíce lidí, protože je to vděčné téma a také je lehké najít sponzory. To se u poezie příliš očekávat nedá. Nicméně mě baví hledat tyhle menší obory, kde toho tolik není. Protože je tam i prostor být v něčem zajímavý, ne že budu už pětadvacátý v něčem, čemu se věnuje mainstream.
A jaké jsou vaše ambice dál do budoucna?
Mě hodně baví jádro toho, čemu se chceme věnovat v projektu AI v kontextu, to znamená, co se stalo s tím, čemu se dnes říká umělá inteligence. Dlouho to byl spíš technický obor, řešilo se, jak stroje naučit dělat nějaké úlohy. Na začátku ale ty věci byly spíš takové směšné a nekvalitní. Dnes už máme většinu technických otázek vyřešených a najednou zjišťujeme, že nyní potřebujeme velmi aktivně spolupracovat s jinými obory. To má podle mě velký smysl a je to velmi potřeba, je to takový můj, řekněme dlouhodobý program.
Existuje Turingův test, kterým rozpoznáváme, jestli se nějaký systém chová inteligentně. A systémy se na to časem vyladily tak, že jsou schopny inteligentní konverzace. Jenže například pohled teologů je takový, že člověk je definován i jinými věcmi - z pohledu křesťanské teologie třeba schopností milovat jiného člověka. A to je něco, na co se rozhodně Turingův test nezaměřuje a ani nevíme, jak bychom to u systémů testovali. S nějakým systémem si sice popovídáte, ale jemu vůbec nezáleží na tom, jestli jste spokojený. Jemu nezáleží na ničem. On je trénovaný na to, aby mi hezky odpověděl, ne k tomu, abych z té odpovědi byl šťastný, aby mě to nějak posunulo dál. To jsou cíle, které nevíme, jak definovat, jak měřit, ale zjevně na ně začínáme v praxi narážet a má smysl koukat do jiných oborů, a nějak to vzájemně propojovat.
Co konkrétně vás umělá inteligence naučila?
Rozhodně například dovednost, jak dobře formulovat to, co chci. Spousta lidí z technických oborů mívá problém pracovat se současnými nástroji, protože velmi přesně formulují zadání, které však není vždy úplně dobře srozumitelné, protože nástroje jsou trénované na běžném jazyku. To znamená, když zvládnu věc formulovat tak, aby byla srozumitelná běžnému člověku, tak je zároveň větší šance, že bude srozumitelná i pro nástroj, který používám.
Další věc je, že nejsem úplně graficky zdatný, a i když jsem pro prezentaci měl konkrétní představu obrázků, neuměl jsem je vytvořit. Dnes svou grafickou představu prezentace dokážu předat systému, a najednou mohu snadno obdržet přijatelný výsledek. Tohle je třeba něco, co se učím, a rozhodně to rozvíjí moji kreativitu.
Mgr. Rudolf Rosa, Ph. D. |
Absolvent MFF UK – programování a matematická lingvistika, z které má i doktorát. Téměř deset let učil angličtinu na kladenské jazykovce, od února 2011 působí jako vědecký pracovník v Ústavu Formální a Aplikované Lingvistiky MFF UK. Věnuje se především počítačové lingvistice, generování literárních textů, jazykovým modelům, a obecně životu s umělou inteligencí. Patří do skupiny odborníků zabývajících se umělou inteligencí v kontextu různých oborů – AI v kontextu. Ve spolupráci se Švandovým divadlem uvedli první celovečerní divadelní hru na světě, jejíž scénář z 90 % napsala AI. V Didaktikonu pořádají přednášky a workshopy na téma umělé inteligence. |