AI si dá překladatele k snídani a olízne si všechny prsty
Viktor Janiš loni v DVTV vysvětloval, jak propastný je rozdíl mezi překladem od profesionála a výtvorem AI. Své postřehy shrnul i na Facebooku, kde výstižně popisuje, že překlad není pouhé hledání ve slovníku, ale složitá socio-lingvistická operace. Že jde o přesazení textu i s celým „kořenovým balem“ kultury – tisíců konceptů, asociací a idiomů, které jsou v jednom jazyce samozřejmé, ale v druhém mohou být zcela nesrozumitelné.
Překladatel musí neustále řešit komplexní problémy na pomezí dvou kultur a činit stovky sofistikovaných rozhodnutí. A proto je Viktor Janiš velmi skeptický k tomu, že by AI mohla takovou operaci zvládnout.
Má naprostou pravdu. Překladatel je umělec a psycholog a stratég. Ale na rozdíl od Viktora jsem naprosto přesvědčený, že tohle AI zvládne.
Janišova skepse je pochopitelná, když se podíváme na současné překladače. Nástroje jako Google Translate nebo DeepL překládají text mechanicky po větách, bez ohledu na širší kontext. Což může vést k bizarním situacím, kdy se v jedné větě mluví o muži a v další už je z něj žena. Nedokáží najít trefné ekvivalenty pro cizí popkulturní odkazy ani překládat slovní hříčky.
Obří jazykové modely jako GPT však fungují fundamentálně jinak a možná právě proto dokáží to, co Janiš správně považuje za klíčové – chápat text v jeho kulturním kontextu. Jejich podstatou není práce se slovy jako takovými, ale se vzory a souvislostmi v textu. GPT při překladu nevyměňuje jedno slovo za druhé, ale pracuje s celkovým významem textu. Díky tomu dokáže překvapivě dobře pracovat i s beletrií, včetně kontextu, ironie či humoru.
Proč se AI překladače chovají jako vystresovaní tlumočníci
Jenže aby model skutečně řešil překladatelské problémy a nehledal jen nejpravděpodobnější slova v cílovém jazyce, musíme ho k tomu explicitně vést. Pokud zadáme jako prompt pouhé „Přelož následující text", dostaneme výsledek na úrovni DeepL. U překladu do češtiny dokonce horší. V takovém případě model generuje překlad průběžně, slovo za slovem, bez skutečného řešení překladatelských výzev.
Tento způsob práce připomíná simultánní tlumočení – tlumočník musí překládat okamžitě, větu po větě, zatímco překladatel má čas text analyzovat, pochopit jeho strukturu a promyšleně jej přesadit do cílového jazyka.
Klíč je v tom dopřát tento čas i AI. Nechat ji nejprve analyzovat text a identifikovat potenciální překladatelské výzvy – idiomy, kulturní odkazy, slovní hříčky nebo stylistické prvky, které nelze přeložit doslovně. Pak ji nechat navrhnout různé možnosti, jak tyto problémy v cílovém jazyce vyřešit, zvážit jejich výhody a nevýhody. A teprve poté požádat o překlad. Výsledek bude nesrovnatelně lepší.
Této technice se říká chain of thought (řetězec myšlenek). Pro ilustraci: když požádáme ChatGPT o třetí odmocninu z astronomicky velkého čísla s tím, že má napsat jen odpověď, dostaneme nesmysl. Když mu ale dovolíme „přemýšlet nahlas“ o postupu výpočtu, vrátí mnohem přesnější výsledek (byť ne dokonalý, není to přece jen kalkulačka). Podobný princip funguje i při překládání.
Tohle všechno je teprve začátek
Věřím, že řešení složitých jazykových hlavolamů, které Viktor Janiš popisuje, je pro AI zvládnutelné. Jen zatím narážíme na praktická omezení. Kontext celého textu včetně všech mezikroků „přemýšlení“ se musí vejít do limitu tokenů, což u delších textů prakticky znemožňuje využít plný potenciál modelu. GPT bylo také zatím trénováno převážně na anglických textech, a proto má omezenější schopnost pracovat s českými kulturními specifiky a popkulturními odkazy.
Tyto limity by se mohly v následujících letech postupně překonávat. Vývoj směřuje k modelům s větším kontextovým oknem, které zvládnou zpracovat delší texty. Je pravděpodobné, že se objeví i modely optimalizované přímo pro překladatelskou práci, které budou lépe zvládat práci s kulturním kontextem. A pak možná budeme muset uznat, že i křemík umí být kreativní.
Mimochodem, v rozhovoru ukazují tento obrázek (vytvořený redakcí DVTV, ne Viktorem Janišem) jako důkaz slabosti současných překladačů. Ve skutečnosti jde ale o chybu při použití DeepL – když se text vloží roztrhaný po řádcích místo souvislého bloku, překladač zcela ztratí kontext a výsledek je katastrofální. Při správném použití dává DeepL nesrovnatelně lepší překlad.