Jak AI dělá z šumu Scarlett Johanson

Na obrázcích tvořených umělou inteligencí je nejvíc fascinující, na jakém principu to funguje.

Nemá to totiž vůbec nic společného s počítačovou grafikou, kterou jsme si zvykli běžně vídat ve filmech nebo hrách. Ta se postupně vyvinula k naprosté realističnosti, v dobře udělaných filmech už nelze poznat, co je reálné a co vymodelované. A možná jste zaznamenali loňské video Matrix Awakens demonstrující schopnosti nejnovějšího herního engine, kde už taky nepoznáte, jestli koukáte na hru nebo film (dám do komentářů).

No a právě přesně s tímhle nemají AI fotky absolutně nic společného 🙂

To, co běží v pozadí generování fotek, je neskutečná hra pokus-omyl dvou neuronových sítí. Jednu z nich už znáte, umí rozpoznávat, co je na obrázku, a máte ji v mobilu. Takže když ve vyhledávání ve fotkách napíšete pláž, ukáží se vám všechny fotky z pláže.

Ta druhá neuronka umí něco jiného: upravit fotku na základě feedbacku. A tyhle dvě spolu hrají ping-pong, první upravuje fotku, druhá jí to hodnotí, první na základě hodnocení upravuje dál, atd. Je jen na nastavení programu, jak dlouho tato hra trvá.

Takže jedna neuronka hodnotí, druhá dle feedbacku upravuje – co ale stojí na počátku? Kde se vzal prvotní obraz, který se ohodnotil a opravil?

To se podržte. Prvotní obraz je náhodný šum. Zrnění.

Neuronka koukne na šum a řekne: „Hmmm, tyjo, tohle fakt Scarlett Johanson v latexovém oblečku není, ale když hodně přimhouřím digitální oči, tak ty dva fleky tady by mohly být kozy. Ale podle mých záznamů v databázi má větší.“ A druhá neuronka ty dva fleky zvětší. „Co dál, hotovo?“ „Ani náhodou! Čeká nás ještě dost práce. Podle mých záznamů má Scarlett taky obličej, někde nad těmi kozami.“ „Fajn,“ řekne druhá neuronka a několika tahy naznačí oči, nos, pusu.

A tak to pokračuje dál.

Protože i v tomto procesu hraje určitou roli náhoda, ze stejného šumu (říká se mu seed) se mohou vygenerovat různé obrázky. Ukazuje to video Sandman, co dám do komentářů.

Úžasné je, že tento tvůrčí proces lze natočit. A já ho pro vás natočil. Ve videu uvidíte, jak z ničeho, jak z prachu, vznikají obrázky. Někdy to jde docela přímočaře, jindy se původní záměry úplně zahodí a změní. Sledovat to mě baví možná ještě víc, než koukat na výsledek.

Žasnu, jak tento šolíchací proces, kdy ani jedna neuronka nemá tušení, co je to Scarlett, koza, nebo dokonce světlo & stín, vede k tak úžasným výsledkům. Cesty k němu byly složité. Do komentářů dám ještě ukázky, jak strastiplné je strojové učení a co AI generovala ještě před pár lety.