Jak naklonovat hlas?
Umělé inteligence pro klonování hlasů nejsou zatím tak dokonalé, jako třeba generátory obrázků. Určitě se to brzy změní, nejspíš s masivnějším příchodem videí generovaných pomocí AI. Ale prozatím nečekej zázraky.
Napodobit hlas někoho jiného totiž neznamená jen napodobit jeho specifickou barvu, ale i způsob řeči, parazitní slovíčka, dýchání a já nevím co ještě. Až uměligence vystřihne Leoše Suchařípu, tak smeknu. Ale letos ještě bude mít Petr Jablonský co jíst.
Jak se dá klonovat hlas? Pro jednodušší projekty ti stačí namluvit jednu minutu textu a za pár okamžiků máš nějaký výsledek. Kvalita odpovídá tomu, že AI měla k dispozici minimum dat – je to fajn na hraní, ale nečekej zázraky. Pokud chceš profi výsledky, potřebuješ aspoň půl hodiny čistých nahrávek, ideálně spíš tři hodiny. Jo, čteš správně. Tři hodiny tvého mluvení. Ale výsledek už stojí za to.
AI se naučí úplně všechno z tvých nahrávek. Takže pokud nahráváš v koupelně s ozvěnou nebo ti za oknem jezdí tramvaje, bude to slyšet i ve výsledku. Mluv tak, jak chceš, aby mluvil tvůj klon. Pokud chceš nahrávat audioknihy, čti při nahrávání knihu. Pokud chceš dělat podcast, mluv jako moderátor.
Většina seriózních služeb tě nenechá jen tak naklonovat cizí hlas. Musíš prokázat, že je to tvůj hlas – třeba tím, že přečteš nějaký specifický text. Je to taková pojistka proti zneužití. Samozřejmě existují i méně seriózní nástroje, které dokážou naklonovat hlas jen z nahrávky. Třeba takhle jsem si kdysi hrál s inauguračním projevem prezidenta Petra Pavla:
Jasně, není to nic moc, dělal jsem to před víc než rokem, dnes už by byla kvalita lepší. Postup vysvětluje video tutoriál na YouTube. Není to úplně easy, daleko jednodušší nástroje nabízí například elevenlabs.
Je jasné, že tahle technologie má obrovský potenciál ke zneužití – falešné telefonáty babičkám nebo fejkové projevy politiků. Proto je důležité k tomu přistupovat zodpovědně. A taky proto ty seriózní služby tolik lpí na ověřování identity.