Jak jsem oživil soudruha Jakeše pomocí AI

JakešGPT se stal hitem a spousta z vás se ptá, jak vlastně vznikl. Pojďme se podívat komunistovi na zoubek. Jde o tři samostatné kousky skládačky: generátor textu, syntetický hlas a deepfake video. Každý vznikl zvlášť a pak se spojily v jeden celek.

Klonování soudruhova intelektu

JakešGPT je příkladem tzv. „custom GPT“ (nebo také „GPTs“ či „Model GPT“) – vlastní verze ChatGPT se speciálním promptem. Vytvářet vlastní GPT můžou jen platící uživatelé (kliknutím sem), ale používat je může každý – proto si i JakešeGPT může vyzkoušet úplně kdokoliv. Můžete mu buď poslat text, který předělá do svého charakteristického stylu, nebo si s ním prostě povídat jako se soudruhem tajemníkem.

Jak vytvořit Jakešův prompt?

Není to nic složitého, ale je potřeba mít s tvorbou promptů praxi. Začal jsem s přepisem jeho slavného projevu v Červeném Hrádku. Protože prompt může mít jen 8000 znaků, nechal jsem jej pomocí ChatGPT zkrátit, s tím, aby obsahoval všechny jeho typické obraty a známé fráze. Třeba tu legendární o milé holce Zagorové, co už tři roky po sobě bere 600.000 každý rok. A další! Milion, dva miliony berou, Jandové a jiní. Nebo jeho filozofické zamyšlení: „To není jednoduchý proces ta přestavba, není. To je proces, bych řekl, v kterým se ne každý dost vyzná a proces, do kterýho mohou vstoupit nepřátelé.“

Výňatek projevu slouží jako předloha, kterou má model za úkol napodobovat. Navíc jsem požádal ChatGPT, aby jeho styl popsal. Ten identifikoval následující charakteristiky:

  • syntaktické nedostatky: vyšinutí z větné vazby, volně navazující větné celky bez jasné struktury, dlouhá souvětí bez jasného konce
  • nepřipravená formulace myšlenek: časté odbočky od tématu, návrat k předchozím myšlenkám, neuspořádaná struktura projevu
  • výplňková slova a částice: časté použití „prostě“, opakované „no“, „tedy“, „že jo“, „páč“
  • začlenění terminologie a ideologických odkazů z doby komunismu
  • obhajoba komunistického systému a odmítání změn
  • a tak dále

Tohle všechno jsem zabalil do promptu s hlavní instrukcí: „Tvým úkolem je přeformulovat zadaný text ve stylu Milouše Jakeše, bývalého vedoucího představitele Komunistické strany Československa, známého svým osobitým a často neúmyslně komickým způsobem vyjadřování.“

Výsledek předčil očekávání. Odhaduju, že ladění promptu zabralo tak půl hodiny, ale ruku na srdce – když děláte kravinu, která vás baví, čas letí rychle.

Klonování hlasu soudruha

JakešGPT mi poté napsal blogpost, ve kterém oznamoval svou vlastní existenci. A protože celý blog nechávám umělou inteligencí předčítat (můžete si jej pouštět jako podcast), napadlo mě nechat tento text zaznít přímo jeho hlasem. Vzal jsem pár minut projevu v Červeném Hrádku a pomocí služby ElevenLabs jeho hlas naklonoval. Následně můžete do webového rozhraní zkopírovat text, který přečte. Já k tomu ale používám vlastní aplikaci, která text nejprve předpřipraví – nahradí různé speciální útvary (třeba 10×10 převede na deset krát deset a podobně), rozdělí jej na věty a ty pak nechá namluvit. Celá práce s hlasem mi zabrala možná deset minut.

Klonování tváře soudruha

Když už byl hotový hlas, vytvořit video se přímo nabízelo (psali jste si o něj!). Chvíli jsem hledal službu, která udělá takzvaný lipsync – tedy upraví pohyb rtů tak, aby odpovídal zvukové stopě. Zkusil jsem Vozo AI. Mohl jsem jí podstrčit jakýkoliv kus projevu z Červeného Hrádku a nechat přegenerovat ústa, ale pro půvabnější výsledek jsem nejprve záznam velmi lehce sestříhal. Aby obsahoval prostřihy na soudruhy, kteří ho zbožně sledují, a vybral momenty, kde jeho gestikulace ladí s novou zvukovou stopou. To mi zabralo asi půl hoďky. Lipsync trval dlouho, protože jsem použil free verzi služby, v placené by to bylo hotové během mžiku.

Soudruh je vjěčný. Nebo v žitný?

Šlo tedy o rychlý experiment s AI technologiemi. Ohlas mě překvapil. Je vidět, že starší generace si stále živě pamatuje originál a žasne nad přesností napodobení, zatímco mladší může objevovat absurditu komunistické diktatury skrz její vlastní jazyk. Zároveň je to perfektní ukázka demokratizace AI technologií: co by před dvěma lety vyžadovalo tým expertů a spoustu peněz, dnes zvládne jeden člověk při čekání na donášku pizzy.

Rychlé odkazy: