Petr Plecháč - analýzou Shakespeara k propagaci versologie

úterý, 1. červen 2021 09:22

Absolvent Univerzity Karlovy Petr Plecháč se stal světově známou osobností díky své analýze Shakespearova díla Jindřich VIII. Odborníci již delší dobu přijímali jako fakt, že spoluautorem hry byl dramatik John Fletcher, ale Plecháč ve své studii, využívající strojové učení, analyzoval vzorce frekvence slov a rytmů a poskytl touto analýzou další důkaz, že uvedená hra byla kolektivním dílem. 

 WIS4143

Aby mohl stanovit rozdíly mezi jednotlivými částmi díla, Plecháč přistoupil k jeho detailní analýze. „Ve své disertaci jsem zkoumal možnost použití versologických charakteristik, jako je rytmus nebo rým, k určení nebo rozpoznání autorství. Shakespearova Jindřicha VIII. jsem si vybral z mnoha důvodů: Zaprvé je k dispozici velký objem vstupních dat, na nichž lze strojové učení natrénovat – konkrétně všechny hry Williama Shakespeara, Johna Fletchera a Philipa Massingera (jenž byl v minulosti také zvažován jako možný spoluautor), a množství veršů v jambickém pentametru,“ vysvětluje proč byl k takovému výzkumu vhodný právě Shakespeare.

„Už existovala silná hypotéza, že Jindřich VIII. byl kolektivním dílem. Dlouho se tušilo, že tato hra nebyla napsána samotným Shakespearem, což z ní dělalo skvělou volbu. A konečně je tu skutečnost, že veškerá Shakespearova tvorba už je digitalizovaná. To vše byly faktory, které mě vedly k tomu, abych se soustředil právě na tuto hru.“ V praxi to znamenalo samostatně zadat do systému strojového učení nejen toto hru, ale i rozsáhlé dílo obou dramatiků (a také Massingerovo, který byl považován za méně pravděpodobného kandidáta na spoluautorství), a seznámit jej s jejich charakteristickými postupy.

 WIS4153„Obecně jsem postupoval tak, že jsem shromáždil různá díla jednotlivých dramatiků, která vznikla přibližně ve stejném období, ve kterém byl napsán Jindřich VIII., a natrénoval jsem algoritmus tak, aby dokázal rozeznat jejich styly. Po zadání těchto vstupních informací jsem natrénovaný algoritmus použil na Jindřicha VIII. První věc, kterou uděláte, když model trénujete, je, že otestujete, jak funguje na známých datech, a provedete křížovou validaci. To znamená, že vynecháte jednu hru od Shakespeara a natrénujete model na těch zbývajících; pak ho spustíte na té hře, kterou jste před tím vypustili. A to samé pak uděláte s Fletcherem. A model reaguje a označuje data v těch případech, ve kterých už znáte správnou odpověď. Tímto způsobem můžete odhadnout přesnost modelu a jeho spolehlivost. V mém případě spolehlivost dosáhla 99 procent, ve kterých model dokázal správně určit autorství textu,“ říká Plecháč.

„Když mluvíme o versologii, znamená to, že se zaměřujeme na přízvuková schémata, což jsou vlastně bitové řetězce, které představují přízvučné a nepřízvučné slabiky. Dnes je to mnohem jednodušší, protože v dnešní době máme velmi spolehlivé softwarové knihovny, které nabízejí všechny druhy strojového učení, a tu část analýzy, kterou provádí strojové učení, lze snadno implementovat prostřednictvím několika řádků kódu. Co je obtížnější, je tyto bitové řetězce, tyto přízvukové vzorce, extrahovat z textu; měl jsem ale to štěstí, že jsem mohl použít software vyvinutý Ryanem Heuserem na Stanfordské univerzitě, který byl dokonce testován právě na Shakespearově díle. Měl jsem tedy dobrý důvod se domnívat, že bude fungovat docela dobře.“

 WIS4184Tyto vzorce jsou navzájem natolik propojené a existuje jich tak velké množství, že jejich zmapování není v lidských silách, to je prostě nemožné a byla by to ztráta času. A právě tady vstupuje do hry strojové učení, mimo jiné i proto, že software, který použil dr. Plecháč, umožňoval uživatelský upgrade. 

„Parametry strojového učení je možné v hotových knihovnách nastavit tak, aby to odpovídalo vašim datům. Nejprve musíte data označit, musíte je tokenizovat, rozdělit text na slova. Také musíte označit přízvuk, tedy odlišit přízvučné a nepřízvučné slabiky, a pak přijde analýza – musíte stroj naučit rozpoznávat práci jednotlivých autorů, a tam přišlo na řadu moje kódování. Samozřejmě jsem to nekódoval od nuly; některé články, které o mé práci vyšly, chybně uváděly, že jsem použil neuronové sítě. Ty jsem opravdu nepoužil. Jednalo se o velmi populární techniku v oblasti rozpoznávání autorství, které se říká support vector machine; na tu jsem ovšem nepřišel já. Použil jsem obecné softwarové knihovny strojového učení, které byly navrženy pro tento účel.“

Plecháčova zjištění nakonec potvrdila, že Jindřich VIII. byl dílem více autorů, jak to poprvé naznačil už James Spedding v roce 1850. 

„Každý z nás se vyjadřuje trochu jinak a takové rozdíly je možné sledovat na úrovni frekvencí slov. Někdo používá častěji určitý člen, někdo ve významu předložky u nebo vedle používá častěji  slovo by, jiný zase nearby. Na tyto drobné rozdíly, které člověk jen velmi těžko odhalí, se zaměřuje takzvaná stylometrie. Pokud vy nebo já čteme Jindřicha VIII., můžeme se zaměřit na různé aspekty, jako třeba používání zájmena ye namísto you, nebo na ženské zakončení veršů, ale sledování jednoho takového aspektu by plně zaměstnalo naši pozornost. Jako lidé se nemůžeme soustředit na stovky různých detailů současně. Každá scéna v každé hře je představována tisícem proměnných; každá scéna je vlastně vektorem v tisícirozměrném vektorovém prostoru.“

Dr. Plecháč přiznává, že nikdy nepředpokládal, že by jeho práce vyvolala takovou senzaci; nicméně připouští, že je to velmi dobrá propagace oboru versologie, který má ve slovanských zemích včetně České republiky tradici, ale jinde je prakticky neznámý. 

„Ještě poměrně nedávno neměl v anglicky mluvících zemích o versologii prakticky nikdo ponětí, takže pro mnohé je tohle první kontakt s tímto oborem. Nikdy bych ale nečekal, že článek o mém výzkumu způsobí takový rozruch. Letěl jsem do San Franciska na konferenci a poté jsem se od kamaráda dozvěděl, že o mé práci informoval významné maďarské periodikum, potom následovala reportáž CNN, a pak už to jelo jako na běžícím páse, po celém světě. Lidem, kteří se specializují na analýzu básnických děl, se takové věci nestávají nijak často. Dostával jsem e-maily od nositelů opravdu zvučných jmen, kteří mě zvali ke spolupráci na budoucích projektech . To bylo určitě velmi pozitivní a celkový zájem, který má práce vyvolala, byl pro tento obor velmi důležitý,“ dodává na závěr.

 WIS4210

Petr Plecháč, Ph. D.
Svůj první doktorát získal v oboru literární teorie na Univerzitě Palackého v Olomouci, a druhý, v oboru matematické lingvistiky, na FF UK. Do povědomí světové odborné veřejnosti pronikl díky svému výzkumu autorství divadelní hry Jindřich VIII., standardně připisovaného Williamu Shakespearovi. Petr Plecháč pracuje v Ústavu pro českou literaturu AV ČR a na Univerzitě v Basileji. 

Jindřich VIII.: Kolik toho ve skutečnosti víme?

Výzkum Petra Plecháče znamená v problematice určování spoluautorství literárních děl obrovský posun. Následující glosa překladatele a znalce Shakespearova díla Martina Hilského doplňuje určité klíčové informace o samotné hře. Profesor Hilský se v ní zmiňuje o řadě témat, včetně přínosu strojového učení. Podle něj je důležité si uvědomit, že existují detaily, u jejichž rozklíčování stále tápeme, a které se nám možná nikdy nepodaří uspokojivě rozluštit.

  • 0243aa85 4725 4ac4 aea7 54509c1ba935Velmi cenný přínos
    To, že Shakespeare nenapsal Jindřicha VIII. sám, bylo jako pravděpodobné zmiňováno už dávno, a dnes to pokládáme za prokázaný fakt. Nebylo tomu tak ale vždycky; mnozí vědci měli vážné pochybnosti i poté, co Spedding v roce 1850 označil jako pravděpodobného spoluautora hry Johna Fletchera. Po dlouhou dobu byla myšlenka, že Shakespeare není výhradním autorem Jindřicha VIII., prostě nepřijatelná, zatímco dnes víme, že to tak skutečně je. Důvod, proč je práce Petra Plecháče tak cenná, je ten, že potvrzuje – jinými prostředky a jinou metodou – účast spoluautora. Nejsem matematický lingvista, ale ta metoda je nesmírně podmanivá, a tak není divu, že po ní ‚skočil‘ kdekdo od CNN až po MIT Technology Review.
  • Obrysy Shakespearovy a Fletcherovy spolupráce
    O vlastním procesu spolupráce obou spoluautorů toho víme velmi málo; nevíme téměř nic o tom, jak bylo toto spoluautorství organizováno. Požádal Shakespeare Fletchera, aby mu pomohl, nebo to bylo naopak? John Fletcher byl mladý dramatik, který byl v té době mnohem populárnější (mluvíme o Anglii za vlády Jakuba I. na sklonku Shakespearovy kariéry). Kdo požádal koho je důležitá otázka, protože ukazuje důvěru ve schopnosti druhé osoby a naznačuje, na které straně vztahu leží těžiště. Jenže to právě nevíme. Kdo měl rozhodující slovo? Kdo rozhodoval o zápletce?
  • Nepravdy
    Původní název hry nebyl Jindřich VIII., ale Vše je pravdivé (All is True), což mi připadá velmi zábavné, protože v této hře je spousta toho, co pravda není. Sám král Jindřich není vůbec zobrazován jako strůjce anglické reformace. Zpočátku byl Jindřich velmi charismatický král, který se později stal despotou a tyranem, který poslal dvě ze svých žen na popravčí špalek. Ale nic z toho se ve hře neobjevuje. Můžeme říci, že hra se zabývá jen ranou fází Jindřichova panování, zhruba léty 1520–1533, kdy se narodila jeho dcera Alžběta (pozdější slavná Alžběta I.). Bylo Shakespearovým nebo Fletcherovým vědomým rozhodnutím ignorovat to, co přišlo později? Debatovali spolu o tomto problému?
  • Fletcherův styl
    Je jisté, že Fletcherův styl byl odlišný od Shakespearova, ale neřekl bych, že je možné tvrdit, že jeden byl ‚lepší‘ než druhý; byly prostě radikálně odlišné a Fletcherův přístup byl ve své době modernější a populárnější. Jeden příklad za všechny: Shakespeare začal psát takzvané romance (Cymbelína, Zimní pohádku a Bouři) teprve po roce 1608. To proto, že jeho společnost, King’s Men, tehdy už neměla k dispozici pouze divadlo Globe, ale také soukromé divadlo Blackfriars, které umožňovalo scénické efekty potřebné pro inscenace romancí, které na scéně Globu nebyly možné. Romance byly velmi závislé na vizuálních ,barokních‘ efektech a Fletcher byl v tomhle prostě mnohem lepší. Byl mladší, na vzestupu, zatímco Shakespeare, i když se nedá mluvit o úpadku tvorby, se chýlil ke konci své kariéry.
  • Sdílené autorství bylo rozšířeným jevem, avšak jen málo Shakespearových her mělo více autorů
    Je třeba zdůraznit jednu věc, a sice že za Shakespearových dnů bylo spoluautorství běžné. Pozoruhodné a naopak velmi překvapivé je, že Shakespeare napsal ve spolupráci s někým jiným tak málo her. Spoluautorství najdeme na začátku a na konci jeho kariéry – nikoli ale na jejím vrcholu. Nemám pro to žádné vysvětlení, snad kromě toho, že Shakespeare byl také herec, ale zhruba kolem roku 1605 se přestal na jevišti objevovat, takže měl možná více času na autorskou spolupráci a mohl více debatovat s někým dalším. Shakespearovy rané hry byly očividně spoluautorskými díly: spoluautorem Tita Andronika, první tragédie shakespearovského "kánonu", byl podle znalců George Peele, Shakespearův starší současník. Po roce 1605 přichází Macbeth, jehož spoluautorem je Thomas Middleton, stejně jako u Timóna Athénského. Middleton byl přitom úplně jiným typem dramatika, mnohem satiričtějším. A pak tu máme Jindřicha VIII.Dva vznešené příbuzné, prokazatelnou spolupráci s Johnem Fletcherem. A to je vše. Většina Shakespeara byla skutečně napsána samotným Shakespearem. 

cbaaad02 62fe 4491 aacb 85505c7a2495

Autor: Jan Velinger
Foto: Luboš Wišniewski, Vladimír Šigut

Sdílejte článek: