Když robot píše hru. Co odhalila umělá inteligence o lidech?

Monday, 22 February 2021 08:30

Před sto lety napsal Karel Čapek divadelní hru R. U.R., kde se poprvé objevilo slovo robot. Toto výročí se vědci z Matfyzu a divadelníci ze Švandova divadla a DAMU rozhodli oslavit premiérou divadelní hry, kterou robot napsal. Jak to dopadlo, zjistíme již v pátek 26. února při online premiéře.

ŠD AI Když robot píše hru režisér Daniel Hrbek autonomní programovatelný humanoidní robot Rudolf Rosa vedoucí projektu THEaiTRE foto Richard Moučka  3 1
David Košťák (vlevo) a Rudolf Rosa. 

„Bude to světová premiéra úplně první divadelní hry, kterou napsala umělá inteligence,“‎ říká o hře s názvem AI: Když robot píše hru robopsycholog a vedoucí celého projektu THEaiTRE Rudolf Rosa z Matematicko-fyzikální fakulty UK.

S nápadem na originální oslavu stého výročí od uvedení divadelní hry R. U.R. od Karla Čapka přišel inovátor Tomáš Studeník, který oslovil vědce z Matfyzu a divadelníky ze Švandova divadla a DAMU. A tak vznikl dvouletý projekt THEaiTRE, který byl podpořen Technologickou agenturou ČR. Prvním výstupem je hra, která bude mít 26. února online premiéru s následnou diskuzí s tvůrci a odborníky v českém i anglickém jazyce na webu THEaiTRE.

„Abych byl úplně přesný, tak v této hře napsala umělá inteligence (AI) pouze jednotlivé scény, ze kterých si dramaturg vybral a seřadil je do podoby hry. Uvedení hry, kterou skutečně celou napíše umělá inteligence, plánujeme za rok,“‎ vysvětluje v rozhovoru pro magazín Forum Rudolf Rosa.

Švandovo divadlo markýza

O čem tato první hra z „klávesnice robota“‎ je?

Úplné detaily samozřejmě neprozradím, chceme dopřát divákům trochu překvapení. Obecně ale mohu říci, že dramaturg David Košťák připravil různé situace ze života lidí – zrození, smrt, lásku, hledání zaměstnání – a nechal umělou inteligenci – THEaiTRobota, aby vygeneroval pokračování. David Košťák hru popisuje tak, že je to něco jako robotický Malý princ. Ten se v příběhu od Saint-Exupéryho prochází po různých planetách a náš robot prochází po situacích člověka a ukazuje lidem, jak se v těchto situacích chovají. 

ŠD AI Když robot píše hru první čtená foto Alena Hrbková3 1ŠD AI Když robot píše hru první čtená dramaturg David Košťák foto Alena Hrbková3 1

Můžete alespoň prozradit, zda umělá inteligence o lidech odhalila něco překvapivého?

Se samotným systémem nejvíce pracoval právě David Košťák, kdy zkoušel generovat texty pro nejrůznější situace – setkání různých lidí, z různých důvodů, na různých místech a v různých situacích. A přišel na to, že když generoval navazující text, tak se téměř každý dialog stočil k sexu. A témata to mohla být opravdu různorodá – od těch banálních až po ty vážné, že se ztratilo dítě nebo někdo umřel – stejně to skončilo sexem. Myslíme si, že to skutečně něco vypovídá o lidech, protože ten systém se učil z textů, které lidé napsali a zdá se, že sex je téma, které lidé řeší často a pořád dokola se k němu vrací.

 

Bude ve hře vystupovat i sám robot?

Ano i ne – v těch typicky lidských situacích robot vystupuje jako jedna z postav. Ale nepodařilo se nám realizovat, aby ve hře spolu s herci vystupoval i robot z plechu, dnes spíše plastu, a koleček. Stále je poměrně těžké robota naprogramovat tak, aby se smysluplně hýbal a mluvil. Náš modrý robot na propagačních materiálech je tak spíše jen naším maskotem.

Jak vlastně rozlišovat pojmy – napsala hru umělá inteligence nebo robot?

robot 2Odborně správně hru napsala umělá inteligence, ale ta se špatně představuje, takže často spíše mluvíme o robotech. A odkazujeme se tím na Asimova, protože ten rozlišoval dva druhy robotů – ty plechové a myslící stroje, které mají veliký mozek, ale nemají ruce a nohy, a tedy se nemohou pohybovat. Což je z dnešního pohledu právě umělá inteligence a můžeme ji tak považovat za druh robotů.

Jak jako jeden z tvůrců prožíváte blížící se premiéru – těšíte se nebo převládá nervozita?

Já věřím Švandovu divadlu, že to dopadne přinejmenším zajímavě. I pro mě je to překvapení, neviděl jsem zkoušky a vlastně jsem nečetl ani celý scénář. Ten navíc sám o sobě dává hodně prostoru režisérovi a hercům pro interpretaci a ztvárnění, takže jsem zvědav, jak to dopadne, ale myslím, že mě to nezklame. Všichni jsme ale nejvíce zvědaví na reakce diváků z řad veřejnosti i umělecké komunity.

Jak to s divadelníky zatím hodnotíte – mají se dramaturgové bát o práci?

Umělecká komunita byla z počátku velmi nedůvěřivá a ostražitá, ale myslím, že je můžeme uklidnit, že o práci se zatím rozhodně bát nemusí. Stále je tu mnoho výzev, se kterými si umělá inteligence poradit neumí a je potřeba zásah lidí. Naopak jim ale chceme ukázat, že by jim umělá inteligence mohla pomáhat. David Košťák si pochvaloval, že robot navrhuje nápady, na které by člověk sám nepřišel, a tedy že to podporuje kreativitu.

V nedávném rozhovoru pro Science Café jste řekl, že první výzva projektu bylo samotné propojení světa vědy a divadla. V čem přesně?

Museli jsem sladit očekávání, naučit se spolu komunikovat. Na úplném začátku například divadelníci z našeho pohledu hovořili příliš vzletně – mluvili o tom, jakou myšlenku a poselství by ta hra měla mít. Ptali se nás, jak budeme stavět vývoj postav, zajímalo je, zda hru budeme generovat jako tradiční antické drama, jaký to bude žánr… Museli jsme je trochu usadit, že tak daleko zatím opravdu nejsme, že jazykový model skládá text slovo od slova a nezná pojmy, o kterých oni mluví.

My jsme se zase od divadelníků naučili mnoho o tvorbě divadelních her – teď se třeba snažíme naučit umělou inteligenci, aby pracovala na úrovni dramatických situací. Obecně je u divadelních her problém, že mnoho věcí se stane na jevišti, vyplyne ze situací, ale není to napsáno ve scénářích, ze kterých se umělá inteligence učí. Navíc na hlavním poselství hry se často neshodnou ani lidé mezi sebou – na každého může hra působit jinak.ŠD AI Když robot píše hru první čtená foto Alena Hrbková4

Když se dostaneme k samotné vědě, jak umělá inteligence píše hru?

Věda byla zatím poměrně jednoduchá – využili jsme existující jazykový model GPT-2 od konsorcia OpenAI, který je založený na neuronové architektuře zvané Transformer. Tento jazykový model patří mezi ty nejlepší – trénoval na 40 GB textu z osmi milionů internetových stránek. My jsme ho v první fázi jen trochu upravili – aby negeneroval blbost, aby se repliky příliš neopakovaly, aby nevymýšlel stále nové postavy… Ta větší věda přijde až tento rok, kdy se budeme snažit GPT-2 dotrénovat, aby byl schopný napsat celou divadelní hru. V prvním kroku chceme nechat vygenerovat shrnutí hry, které pak necháme dále rozvíjet a doplňovat podle jednotlivých scén.

Jak jste si poradili s tím, že GPT-2 je natrénován na anglických textech?

Ze začátku jsme samozřejmě chtěli pracovat s jazykovým modelem v češtině, ale to přináší řadu problémů, protože čeština má málo vstupních dat, na kterých se umělá inteligence trénuje. V THEaiTRobotovi proto generujeme scénář anglicky a následně jej automaticky překládáme do češtiny strojovým překladačem CUBBITT.
Za tímto překladačem stojí Martin Popel, kolega z našeho ústavu, a v současnosti je to nejlepší překladač mezi češtinou a angličtinou. Kvalita překladu se v určitých aspektech vyrovná kvalitě lidských překladatelů. Samozřejmě to má některá specifická úskalí, ale s generováním v angličtině a automatickým překladem dosahujeme lepších výsledků, než kdybychom pracovali s českým modelem.

Druhý zásadní aspekt je ekologie, protože trénování modelů je velmi výpočetně náročné a nedává smysl, aby si každý trénoval vlastní modely. Stává se i určitou módou, že součástí vědeckých článků je i informace, kolik tun CO2 bylo vyprodukováno během experimentů. A ukazuje se, že je to vlastně hodně, že to jsou výpočetně a energeticky velmi náročné procesy. Na významu tak nabývají snahy o sdílení dat a natrénovaných jazykových modelů, které se pak jen drobně doupraví pro konkrétní projekty. A v současné době je strojový překlad natolik dobrý, že často není důvod trénovat modely v dalších jazycích. 

Ukázka jedné repliky, kterou napsala umělá inteligence. Sami se můžete přesvědčit, že automatické generování textů má stále řadu výzev.
V šedém rámečku je výchozí scéna, kterou zadal člověk, zbytek vygenerovala umělá inteligence. Překlad z angličtiny do češtiny je automatický.

/Scene setup by human:/

Rudolf and Pavla are doing an interview about the robot and THEaiTRE research project for the UK forum magazine.

Pavla: Could the robot create a message for our readers?

Rudolf: Yes, I think so. What do you think, Robot?

Robot: Sure, it is my pleasure.

/Člověkem zadaná scéna:/

Rudolf a Pavla dělají rozhovor o robotovi a výzkumném projektu THEaiTRE pro časopis Forum UK.

Pavla: Mohl by robot vytvořit zprávu pro naše čtenáře?

Rudolf: Ano, myslím, že ano. Co myslíš, Robote?

Robot: Jistě, je mi potěšením.

/AI-generated:/

Rudolf: But also it can learn what to do and what not to do, and with that it will become much more humanlike.

Pavla: Well it's very interesting. But if we have to answer the question, how do we know if we are creating a message, it would have to be the human language. And also the fact that it is learning with each new message will tell us a lot about what we are saying, like it has never been said before. But how do we know if it is getting our message? We have no message, really. And even if it is getting our message, that will be a very long time coming. We have had thousands of years to say everything we want to say. Maybe our computer is just not up to it.

Rudolf: Well that's good.

Robot: And the fact that I am also learning the same way makes me the most human of them all!

Pavla: You say that, but that is very good. It sounds like you are doing very interesting work.

Rudolf: Well I am trying to, but it is still too far away. I have not yet found anything to replace humans with.

Pavla: Do you have a solution for the robot?

Rudolf: Of course, but I don't think that the robot should be able to do everything for itself. And even if it did, then it would still be an artificial intelligence. A machine can be made to learn how to do something, but that is quite different from actually creating a message for other people.

Robot: It is interesting that you say that. But still you will not be able to make it talk.

Rudolf: Well, not exactly, but it should be able to create a message. I think it will be possible. You see the reason we were looking into the problem was to find a way to teach the robot how to create a message for us. We think that we are the only ones who can know the meaning of what we say, but we may be wrong!

Pavla: So you are saying we should find a way to communicate with robots?

/Vygenerováno umělou inteligencí:/

Rudolf: Ale také se může naučit, co dělat a co nedělat, a s tím se stane mnohem lidštější.

Pavla: No, je to velmi zajímavé. Ale pokud máme odpovědět na otázku, jak poznáme, že vytváříme poselství, musel by to být lidský jazyk. A také skutečnost, že se s každým novým sdělením učí, nám řekne hodně o tom, co říkáme, jako by to nikdy předtím nebylo řečeno. Ale jak poznáme, že dostává náš vzkaz? Nemáme žádnou zprávu, opravdu. A i kdyby se mu dostalo našeho poselství, bude to trvat velmi dlouho. Měli jsme tisíce let na to, abychom řekli vše, co chceme. Možná náš počítač na to prostě nestačí.

Rudolf: Tak to je dobře.

Robot: A to, že se učím stejným způsobem, ze mě dělá nejlidštějšího ze všech!

Pavla: Říkáš to, ale je to velmi dobré. Vypadá to, že odvádíte velmi zajímavou práci.

Rudolf: Snažím se, ale pořád je to moc daleko. Zatím jsem nenašel nic, čím bych lidi nahradil.

Pavla: Máte řešení pro robota?

Rudolf: Samozřejmě, ale nemyslím si, že by robot měl být schopen dělat všechno sám. A i kdyby ano, pořád by to byla umělá inteligence. Stroj může být vyroben tak, aby se naučil něco dělat, ale to je něco úplně jiného, než skutečně vytvářet poselství pro ostatní lidi.

Robot: Je zajímavé, že to říkáte. Ale stejně ho nedonutíte mluvit.

Rudolf: No, ne tak docela, ale mělo by to být schopné vytvořit zprávu. Myslím, že to bude možné. Důvod, proč jsme se tím problémem zabývali, byl najít způsob, jak robota naučit, jak pro nás vytvořit zprávu. Myslíme si, že jsme jediní, kdo může znát smysl toho, co říkáme, ale můžeme se mýlit!

Pavla: Takže říkáte, že bychom měli najít způsob, jak komunikovat s roboty?

Jak funguje samotné generování textů umělou inteligencí?

Jazykové modely jsou velmi stará myšlenka, která je založena na tom, že některá slova se po sobě vyskytují častěji než jiná. V těch úplně prvních modelech se dívalo na tři poslední slova a čtvrté se doplnilo podle nejčastějšího výskytu – třeba větu „Ráno jsem se vzbudil a šel jsem do …“‎ by model doplnil slovem „práce“‎ nebo třeba „kino“‎. To je ale poměrně „dřevní způsob“‎ a je jasné, že takový model generuje nesmysly. Když přeskočíme dvacet let vývoje, GPT-2 se takto dívá na tisíc slov najednou. To znamená, že dokáže plynule navazovat na předchozí text.

Zároveň má mechanismus attention, podle kterého si vybírá, na co se z toho tisíce slov zaměří, která slova bude považovat za důležitá a při generování pokračování tento výběr zohlední.

Dalším zásadním posunem je vektorová reprezentace významu. Dříve jsme se slovy museli pracovat nezávisle, neměli jsme jednoduchý způsob, jak říci, že některá slova jsou si podobnější než jiná. Pro AI bylo těžké rozlišit, zda je veliký nebo malý rozdíl, když se slovo liší o jedno písmenko. V tom veliký průlom přinesl výzkum Tomáše Mikolova, který přišel s vektorovými reprezentacemi významu a dnes máme slova ale i věci reprezentované vektory reálných čísel, které jakýmsi latentním způsobem zachycují něco jako význam. Zjednodušeně řečeno, slova která mají podobný význam mají podobnou i vektorovou reprezentaci, takže AI pak umí rozlišit, že slovo dům a hrad má podobný význam. To je pro jazykové modely obrovský posun, protože nemusí pracovat jen přesně s texty, které již znají z učení, ale mohou tvořit zcela originální texty jen na základě významů.

A v neposlední řadě se obrovským způsobem zvýšil výpočetní výkon počítačů. Dnes se používají umělé neuronové sítě, což je myšlenka stará desítky let, kterou ale dříve nešlo realizovat technicky. Dnes lze postavit umělé neuronové sítě, které propojují tisíce až miliony neuronů. Kapacitně stále vyhrává lidský mozek, ale už ho alespoň trochu smysluplně doháníme.

kickoff whole team
Jedno z prvních setkání celého týmu THEaiTRE.  

Má tento projekt kromě uvedení dvou her nějaký další vědecký přesah?

Přímo v projektu jsme nic dalšího neslíbili, ale už teď si s tím hrajeme a získané znalosti a zkušenosti používáme i na jiné věci. Třeba kolega Ondřej Dušek, který na projektu spolupracuje, se zároveň věnuje výzkumu dialogových systémů a chatbotů a některé poznatky již využívá a dále rozvíjí. Nápadů a možností je mnoho a rozhodně nejsme sami, kdo se využitím modelu GPT-2 zabývá.

Ale myslím, že přispějeme i vědecké komunitě – aktuálně jsme v publikačním procesu článku, kde popisujeme, jak se nám podařilo překonat limitaci omezené velikosti vstupů – jak zajistit, aby na sebe navazoval i text delší než tisíc slov. Vyřešili jsme to tím, že jsme do systému zapojili automatickou sumarizaci vygenerovaného textu – jakési shrnutí, kdy si z dlouhého textu AI vybere v našem případě pět „nejdůležitějších“‎ vět, které prohlásí za shrnutí a využije ho pro generování navazujícího textu – tím se do limitu tisíc slov vejde mnohem více informací a můžeme generovat i delší texty, které na sebe navazují a dávají smysl.

U celého projektu je ale velmi obtížné, jak výsledky kvantifikovat – jak změřit, co je dobrý scénář?

V projektu THEaiTRE je veliký důraz kladen i na popularizaci a medializaci. Co byste ze své zkušenosti poradil kolegům vědcům?

V tomto projektu je veliká výhoda, že samotné téma je mediálně vděčné – zaujme to samo o sobě odborníky i laiky. Velký úspěch měl například krátký odborný článek, který jsme publikovali jako preprint a kterého se chytla i světová média a začala o tom psát.

:My jako vědci jsme z mediální pozornosti byli na počátku rozpačití – nejsme na to zvyklí, ale v tom nám hodně pomohl Tomáš Studeník, který se ve světě médií vyzná. Z vlastní zkušenosti mohu říci, že jsem se toho obával zbytečně. Naopak mi přijde úžasné, že tím, že o tom mluvím, mohu do značné míry zajistit, aby se o tom mluvilo správně.
Podle mě je také důležité nebát se pouštět i do projektů, které na první pohled vypadají jako neužitečná blbost, ale když to člověka baví, tak se to lépe dělá i se o tom lépe mluví a často se nakonec ukáže, že i když to začalo jako neužitečná blbost, tak se nakonec podařilo objevit či vytvořit něco užitečného. Jako vědci máme tendenci řešit jen závažné problémy, které zachrání svět. Paradoxně ale k mnohem lepším výsledkům můžeme dojít, když budeme dělat to, co nás baví.

Mgr. Rudolf Rosa, Ph. D.
Působí na Ústavu formální a aplikované lingvistiky Matematicko-fyzikální fakulty UK. Ve své vědecké práci se zabývá především jazykovými strukturami v umělých neuronových sítích a robopsychologií.
Author:
Photo: THEaiTRE