Pamatujete na scénu z filmu Hannibal, kde doktor Lecter při večeři
odkryl lebku Paula Krendlera a pozoroval jeho mozek? Podobně fascinující
zážitek nám nyní nabízí novinka od čínské společnosti DeepSeek
[dý psík]🐕 – její jazykový model nám umožňuje sledovat
myšlenkové pochody, naštěstí bez toho nepříjemného řezání.
Můžete si ji vyzkoušet na webu
(zaklikněte DeepThink) nebo v mobilní apce. Jen mějte na paměti, že
veškerá konverzace putuje
na servery v Číně, takže tam neposílejte nic citlivého, zejména ne
rozmístění strategických zbraní v ČR.
Co dělá tento model výjimečným? Je to jeho schopnost UVAŽOVÁNÍ!
Lidstvo si od nepaměti láme hlavu nad tím, jak se vyhnout práci. Nejprve
jsme za pluhy zapřáhli zvířata. V průmyslové revoluci jsme zkrotili
parní stroje, které vystřídala elektrifikace. V digitální éře nás
v počítání nahradily počítače. A zatím posledním krokem v této
evoluční štafetě je AI.
Přestože máme neustále lepší a lepší technologie, které dokáží
lidskou práci nahradit, práce tu stále je. A pro čím dál víc lidí.
Mění se jen její podoba.
Ještě před sto lety zajišťovaly pohyb po metropolích koně. Boom
dopravy přivedl města do situace, kdy byly doslova zasypány hnojem (a když
říkám hnojem, myslím tím další odpadní produkty od našich čtyřnohých
přátel). Legenda praví, že jeden novinář z Times věštil, že do roku
1930 budou všechny ulice New York City skryty pod třemi metry tohoto
materiálu. Přitom města bez koní si nikdo nedokázal představit.
Dnes víme, že změnu přinesl osobní automobil. Jistě, kočí, podkoní
nebo pěstitelé ovsa ztratili práci. Automobil ale zároveň odstartoval zcela
nové a mnohem větší odvětví. Technická revoluce sice vzala lidem práci
s uklízením hoven po koních, ale dala jim příležitost na záchodcích
v motorestech uklízet hovna po lidech. Po celém světě dala zaměstnání
lidem v ropném průmyslu. Stavbě silnic. A dnes zajišťuje společenské
vyžití mladým lidem pod hlavičkou Poslední generace.
Vývoj nám práci nebere, jen ji mění. Nelítostně a jednou pro vždy.
A v tom je jeho nebezpečí a krása. Tolik jsem vám chtěl říct.
Určitě jste už narazili na radu, že máte ChatGPT napsat „jsi expert ve
svém oboru“ nebo „jsi špičkový copywriter“, abyste dostali lepší
odpovědi. A není to jen mýtus – zkuste si to sami. Ale jak je možné,
že pouhé označení „expert“ dokáže tak dramaticky změnit kvalitu
výstupu AI? Je to podobné jako když člověka povzbudíte a dodáte mu
sebevědomí? Nebo je za tím něco jiného?
Pojďme se ponořit do fascinujícího světa toho, jak funguje
„myšlení“ jazykových modelů – a proč někdy stačí malá změna
v promptu k velkému rozdílu ve výsledku.
Představte si, že diktujete důležitý pracovní email do telefonu.
Všechno jde skvěle, dokud se na konci vašeho textu neobjeví: „Titulky
vytvořil JohnyX.“ Vítejte ve světě halucinací Whisperu, systému pro
převod řeči na text od OpenAI, který pohání přepis řeči v tisících
aplikací, od ChatGPT přes webové služby až po automatické
titulkování videí.
Duchové v tichu
Pokud jste někdy používali hlasové funkce ChatGPT nebo aplikací
založených na Whisperu, možná jste si všimli podivného jevu. Ve chvílích
ticha nebo slabého šumu systém občas „slyší“ věci, které tam ve
skutečnosti nejsou. Někdy je to nevinné „Titulky vytvořil JohnyX“, jindy
mysteriózní odkazy na webové stránky jako „hamskey.com“ nebo
„www.northstarit.co.uk“. A někdy se objeví i celé věty v různých
jazycích, od ruštiny přes čínštinu až po latinu.
Připomeňme si důležité okamžiky vývoje AI nástrojů, jak jsme je
viděli my, Evropané, od prvních chatbotů, až po plnohodnotné asistenty
v telefonech a aplikacích, které dnes ovlivňují každodenní život.
2023
Březen 2023: Anthropic zpřístupňuje veřejnosti svého AI asistenta
Claude, který je schopen provádět širokou škálu konverzačních a
textových úloh s vysokou spolehlivostí a předvídatelností:
OpenAI před pár dny vypustil do světa novou funkci ChatGPT – hledání
na webu. Média okamžitě začala psát o konci Googlu. Pravda je ale, jako
obvykle, někde jinde. ChatGPT Search totiž není ani tak náhrada Googlu, jako
spíš nový způsob, jak získávat informace z internetu. Pojďme se
podívat, v čem je jiný, kdy se hodí použít ho místo klasického
vyhledávače, a kdy je lepší zůstat u starého dobrého Googlu.
Jak se to používá?
V okně pro psaní zprávy najdete nový přepínač search –
když ho zapnete, ChatGPT začne automaticky používat internet pro odpovědi
na vaše dotazy. Je to vlastně totéž, jako když jste dříve ručně napsali
„použij internet“ do dotazu. Takže přímo v přepínači rozdíl není.
Rozdíl je v nástroji, který má ChatGPT pro přístup k internetu interně
k dispozici. Ten je výrazně mocnější.
Novinkou je také postranní panel, ve kterém přehledně zobrazuje odkazy
na všechny zdroje, které ChatGPT při sestavování odpovědi (asi?) použil.
Není to jen obyčejný seznam – ke každému odkazu vidíte krátkou ukázku
obsahu a můžete si ho rozkliknout. OpenAI si dává záležet na tom, aby bylo
vždy jasné, odkud která informace pochází, takže více zvýrazňuje
citační butonky. To je důležité hlavně proto, abyste mohli snadno
ověřit, jestli si nevymýšlí.
JakešGPT se stal hitem a spousta z vás se ptá, jak vlastně vznikl.
Pojďme se podívat komunistovi na zoubek. Jde o tři samostatné kousky
skládačky: generátor textu, syntetický hlas a deepfake video. Každý vznikl
zvlášť a pak se spojily v jeden celek.
Klonování soudruhova intelektu
JakešGPT
je příkladem tzv. „custom GPT“ (nebo také „GPTs“ či „Model
GPT“) – vlastní verze ChatGPT se speciálním promptem. Vytvářet
vlastní GPT můžou jen platící uživatelé (kliknutím sem), ale používat je může
každý – proto si i JakešeGPT může vyzkoušet úplně kdokoliv. Můžete
mu buď poslat text, který předělá do svého charakteristického stylu, nebo
si s ním prostě povídat jako se soudruhem tajemníkem.
Je to překvapivě jednoduché. Stačí například využít službu Rask AI, která se specializuje na
předabování videí. Celý proces je vlastně hračka – nahraješ video,
vybereš jeden z 60 dostupných jazyků a necháš technologii pracovat a pak
se stane zázrak: postavy ve videu mluví svými původními hlasy a
zachovávají osobitou dikci, jen v jiném jazyce. A co je skvělé –
původní hudba i zvukové efekty zůstanou nedotčené.
Ale tématem je přece tvorba deep fake videí! Ano, trik spočívá v tom,
že službu využijeme netradičně: jako cílový jazyk zvolíme ten původní,
třeba češtinu. Tím získáme přístup k technologii klonování hlasů,
kterou pak použijeme k nahrazení původních dialogů vlastním textem.
Dlouho jste si o to psali, no tak vám to teda řeknu. Udělali jsme takový
ten, no, jazykový model, jak se tomu říká. JakešGPT
se to jmenuje. A von ten model vezme ten váš text, prostě, a udělá
z něj takovej ten projev, jak jsem já mluvil na těch schůzích,
že jo.
Já vám řeknu, není to jednoduchý proces, páč ten jazyk, to není jenom
tak, že člověk něco řekne a je to. To musí mít tu formu, tu kulturu
projevu, jak se říká. A tenhle model, von to udělá tak, že to zní jako
já, i když já to samozřejmě nejsem, to je jasný.
No a proč jsme to udělali? Páč lidé si to přáli, že jo. Voni
říkali – udělejte něco takovýho, co by mluvilo jak soudruh Jakeš. No
tak jsme to udělali.
Umělé inteligence pro klonování hlasů nejsou zatím tak dokonalé, jako
třeba generátory obrázků. Určitě se to brzy změní, nejspíš
s masivnějším příchodem videí generovaných pomocí AI. Ale prozatím
nečekej zázraky.
Napodobit hlas někoho jiného totiž neznamená jen napodobit jeho
specifickou barvu, ale i způsob
řeči, parazitní slovíčka, dýchání a já nevím co ještě. Až
uměligence vystřihne Leoše Suchařípu, tak smeknu. Ale letos ještě bude
mít Petr Jablonský co jíst.
Jak se dá klonovat hlas? Pro jednodušší projekty ti stačí namluvit
jednu minutu textu a za pár okamžiků máš nějaký výsledek. Kvalita
odpovídá tomu, že AI měla k dispozici minimum dat – je to fajn na
hraní, ale nečekej zázraky. Pokud chceš profi výsledky, potřebuješ aspoň
půl hodiny čistých nahrávek, ideálně spíš tři hodiny. Jo, čteš
správně. Tři hodiny tvého mluvení. Ale výsledek už stojí za to.