Mají se překladatelé bát o práci?
Viktor Janiš v DVTV vysvětluje, jak propastný je rozdíl mezi překladem od profesionála a výtvorem AI. Své postřehy shrnuje i ve svém příspěvku na Facebooku.
Janiš má v mnohém pravdu, ale ne ve všem. Pojďme se na to podívat blíže.
Jistě, současné nástroje jako GPT nebo DeepL překládají text po větách, bez ohledu na širší kontext. To může vést k bizarním situacím, kdy se v jedné větě mluví o muži a v další už je z něj žena. Nedokáží najít trefné ekvivalenty pro cizí popkulturní odkazy ani překládat slovní hříčky s vědomím, jak budou využity později v textu.
Pro DeepL nebo Google Translate je to dané omezení. Což samozřejmě u technických textů nevadí. DeepL tak skvěle poslouží při překládání návodů, dokumentací, běžných blogpostů nebo novinových článků.
Obří jazykové modely jako GPT však umí víc. Dokáží se popasovat i s beletrií. Umí pochopit kontext, ironii, humor. Ovšem ne v režimu, kdy chrlí jedno slovo za druhým. Pokud zadáme jako prompt „Přelož následující text ###", dostaneme výsledek na úrovni DeepL. U překladu do češtiny dokonce horší.
Klíč je v jiném přístupu. Nejprve necháme AI text vysvětlit, včetně idiomů, ironie nebo humoru. Pak požádáme o návrh možných alternativ v cílovém jazyce a teprve poté o překlad s využitím těchto informací. Výsledek bude o několik tříd lepší.
Této technice se říká chain of thought (řetězec myšlenek).
Pro ilustraci: když požádáme ChatGPT o třetí odmocninu z astronomicky velkého čísla s tím, že má napsat jen odpověď, dostaneme nesmysl. Když mu ale dovolíme „přemýšlet nahlas“ o postupu výpočtu, vrátí mnohem přesnější výsledek (byť ne dokonalý, není to přece jen kalkulačka). Podobný princip funguje i při překládání.
Současná omezení jsou zřejmá: celý vstup a výstup včetně mezifází se musí vejít do limitu tokenů. GPT bylo málo trénováno na češtině. České popkulturní odkazy zná jen povrchně. Ale to se může za pár let radikálně změnit.
Mimochodem, v rozhovoru ukazují tento obrázek (vytvořený redakcí DVTV, ne Viktorem Janišem) jako důkaz slabosti současných překladačů:
Jenže tady je zakopaný pes jinde.
Vsadil bych se, že omylem nechali přeložit text ne jako souvislý blok, ale po řádcích. Tedy první věta „Albus Dumbledore didn't seem to realise that he had just arrived in a", druhá „street where everything from his name to his boots was unwelcome." atd.
Platí zde staré dobré pravidlo: garbage in, garbage out. Když ten samý text vložíme do DeepL jako souvislý blok, dostaneme nesrovnatelně lepší překlad. Jde o záludnost DeepL, na kterou si musíme dávat pozor. Člověk se na tom může snadno spálit.