Jednou z nejžhavějších debat v oblasti umělé inteligence je otázka,
zda velké jazykové modely (LLM) skutečně rozumí textům, které píší,
nebo zda jen sofistikovaně papouškují.
Tato otázka rozděluje odborníky v oboru a představuje jedno
z nejzajímavějších témat současného výzkumu AI.
O čem se vlastně přeme? Jde o to, jestli modely opravdu chápou význam
slov, vyvinul se u nich zdravý rozum a mají sociální inteligenci. Nebo je
to všechno trik spočívající ve formálních lingvistických operacích.
Proč je tato debata důležitá? Nejde jen o akademickou diskusi. Odpověď
může mít dalekosáhlé důsledky pro vývoj AI, etiku jejího použití, a
dokonce i pro naše chápání lidské inteligence.
Jedna metafora, která se často v této souvislosti používá, je
„stochastický papoušek“. To je termín popisující systém, který
dokáže generovat text, který se na první pohled může zdát smysluplný a
koherentní, ale ve skutečnosti pouze opakuje nebo kombinuje informace, které
se naučil při tréninku, bez skutečného porozumění obsahu.
OpenAI představila nový nástroj o1.
Aby zdůraznila, že nejde jen o další pokračování v řadě GPT-3, GPT-4,
zcela vypustili písmena GPT z názvu a pojmenovali ho jednoduše „o1".
Hlavní inovací je schopnost přemýšlet nad odpovědí. Zatímco internet
zaplavují nadšené ohlasy, mé pocity jsou rozporuplné. Dovolte mi
vysvětlit proč.
Začnu mírnou odbočkou: Jedna z klíčových znalostí, kterou se snažím
předat účastníkům svých kurzů ChatGPT,
je, že tyto umělé inteligence samy od sebe nepřemýšlejí. To v mnoha
případech nevadí – i vy dokážete bez přemýšlení odpovědět, kolik
je 7×7. Existují však situace, které bez hlubšího zamyšlení
nevyřešíte, což si ukazujeme na jednoduché hře. Podstatné je, že ChatGPT
lze k přemýšlení přimět, a není to nic složitého. Stačí jen
vědět jak.
Slovem „přemýšlení“ myslím činnost, jejímž smyslem je
poskytnout následně co nejlepší odpověď. Pokud odpovídám okamžitě bez
této činnosti, pak nepřemýšlím.
Častá otázka účastníků zní: „Jak poznám, že ChatGPT odpověděl
správně?" Odpovídám, že klíčem je sledovat tok myšlenek a dále s ním
pracovat, nechat AI ověřovat své závěry atd.
V diskusích o umělé inteligenci, zvláště o velkých jazykových
modelech, se často setkáváme s pojmem „papouškování“. Ve smyslu toho,
zda modely skutečně rozumí informacím, které produkují, nebo jen
mechanicky papouškují naučené texty. Vžil se pojem stochastický
papoušek.
Co se ale papouškováním opravdu myslí? Pojďme se na to podívat blíže
a rozplést, co se za tímto termínem skutečně skrývá.
Velké jazykové modely se během tréninku krmí obrovským množstvím
textů a pak, když dostanou nějaký vstup nebo dotaz, vyprodukují
odpovídající text. Když se mluví o „papouškování“, rozhodně tím
odborníci nemyslí, že by model opisoval věty ze svých učebních
materiálů slovo od slova. To by bylo pro model vlastně docela složité.
Tak o co tedy jde? Model se v datech učí rozpoznávat vzory a ty pak
papouškuje. Je to jako byste se učili cizí jazyk – taky si nepamatujete
celou učebnici nazpaměť, ale pochytíte pravidla a vzorce, které pak
používáte k tvoření vlastních vět.
Jazykové modely vlastně učící data komprimují, ale jinak než třeba
ZIP nebo JPEG. Představte si to jako tvorbu myšlenkové mapy nebo výtahu
z knihy. Neuchováváte každé slovo, ale hlavní myšlenky a vztahy mezi
nimi. Model pak z těchto poznámek tvoří nový text.
To, že model vytváří originální věty, není
nic překvapivého. Je to prostě jeho práce, stejně jako práce hodinek je
ukazovat čas. Byl od začátku navržen tak, aby uměl zobecňovat a tvořit
nový obsah.
Někdy se ale může stát, že si model zapamatuje nějakou část textu tak
dobře, že ji pak napíše úplně stejně. To může být problém hlavně
kvůli autorským právům. Může nastat i situace, že model napíše něco,
co vypadá jako plagiát, i když ten konkrétní text nikdy neviděl. Čistě
náhodou. V budoucnu asi budeme potřebovat speciální nástroje na
odhalování takových situací.
Takže když příště uslyšíte o „papouškování“ v souvislosti
s AI, vzpomeňte si, že nejde o doslovné kopírování, ale o složitý
proces učení a tvoření na základě vzorů. Je to fascinující oblast,
která nám poodhaluje, jak funguje strojové učení a jak mohou počítače
pracovat s jazykem. A možná nám to jednou pomůže lépe pochopit i to,
jak se učíme my sami.
Začnu vzpomínkou, když mi bylo 15 let. Už tehdy jsem dobře rozuměl
počítačům. Táta, který je prodával, mě je nechával skládat
z komponent a brával mě ke klientům na servis. Po letech mi jeden z nich
povídal, jakou měl hrůzu, když se do jeho drahocenného PC za 250 tisíc
Kč (dnes by to bylo 850 tisíc) pustilo se šroubovákem malé děcko.
Na počítačích mě bavilo všechno, hlavně grafika a programování.
A docela dobře jsem si tím vydělával. Kapesné od rodičů představovalo
spíš nepodstatný bonus. Vytáčí mě, když nějaký politik prohlásí, že
děti v tomto věku se mají prohánět za mičudou a ne pracovat. Sám kopal
do míče a hle, jaký z něj vyrostl kretén.
V osmnácti jsem už počítačům rozuměl natolik, že bych po probuzení
vyjmenoval všechny instrukce procesoru. Byl jsem odborník? Považovali mě za
něj, i když jsem ještě neměl vysokou školu ani maturitu.
Šel jsem na výšku zaměřenou na počítače. Možná čekáte, že škola
byla pro mě hrozná nuda a nic jsem se tam nedozvěděl, ale tak to není.
Škola člověku vždycky otevře nové obzory. Jen jsem si uvědomoval, že na
rozdíl od medicíny nebo práva je ten finální level, diplom, pro mě
bezcenný papír. Taky jsem viděl, kolik lidí, kterým bych nikdy nesvěřil
žádný úkol, se s obrovskou pílí na tento vrchol vyškrábe, a kolik
takových absolventů škola každý rok vyplivne. Jsou to odborníci?
Můj obor byl v té době tak turbulentní, že spousta věcí, které se
jeden rok tesaly do kamene, příští už vůbec neplatily. Škola byla jen
rozmlžený okamžik v nikdy nekončícím procesu učení. Je odborník
někdo, kdo vystudoval turbulentní obor před deseti lety? To záleží dost na
tom, co během těch deseti let dělal.
Kdo je tedy odborník na AI? Nedávno jsem se vracel z vody se dvěma
advokáty, a jeden z nich mi říká: „Čéče, dnes je každej právník
odborník na AI a školí to.“ Ujišťoval jsem ho, že v jiných oborech je
to úplně stejné.
Znám pár jmen, která za odborníky na AI rozhodně považuji. Pak je
spousta dalších, kteří nemají potřebu být vidět. Žádné jednoduché
vodítko neexistuje. A ještě něco: To, že je člověk špička v jednom
oboru, z něj nedělá hvězdu v oboru jiném. Například v prognostice.
Odborníci na AI předpovídající budoucnost jsou moje guilty pleasure.
Všiml sis toho písmenka „P“ ve zkratce „GPT“? Je těžké si ho
nevšimnout. Tak ono „P“ znamená „předtrénovaný“. Jinými slovy,
tyhle modely se sice učí z neskutečně obrovského množství textů, ale
jakmile jednou dokončí svůj trénink, dál se nenaučí nic. Ani
z rozhovorů s námi, uživateli.
Proč to tak je? Učení je šíleně drahý a náročný proces, takže
učit se průběžně by stálo majlant. Místo toho se vývojáři snaží
vymyslet fígle, jak to obejít. A jedním z nich je zbrusu nová funkce
Memory, tedy paměť.
Paměť funguje jako takový malý zápisníček. Kdykoliv během konverzace
ChatGPT narazí na něco zapamatováníhodného, tak si to do něj poznamená.
A před každou další konverzací si tyhle poznámky připomene. Takže
nemusíš pořád dokola opakovat, že jsi z Brna, máš dvě kočky a rád
jíš pizzu. ChatGPT si to bude pamatovat.
Na ty jeho poznámky se můžeme mrknout i my, uživatelé. V nastavení je
sekce, kde je všechny vidíme, a když se nám něco nezdá, tak to můžeme
smazat. Tedy máme kontrolu nad složkou, co si o nás ten digitální
parťák vede.
Nebo můžeme funkci úplně deaktivovat. Nebo otevřít tzv. „dočasný
chat“, při kterém vůbec nebude vytahovat zápisník s poznámkami.
Tahle funkce zatím funguje jen pro šťastlivce mimo Evropskou unii. My tady
v EU máme tak přísné zákony na ochranu osobních údajů, že si na Memory
budeme muset ještě chvíli počkat. Já vím, funkce je to zcela
transparentní a pamatuje si jen to, co jsi sám řekl, takže s osobními
údaji nemůže … já vím, nedává to smysl. Zvykej si, že v EU holt bude
všechno se zpožděním. Ledaže bys měl po ruce nějakou
šikovnou VPN…
Na svých školeních už
dlouho mluvím o tajném trumfu mezi chatboty – Claude od Anthropic. Co to je Anthropic? Je to
firma, kterou založili někdejší průkopníci OpenAI, tvůrci ChatGPT.
A jejich vlajkovou lodí je právě chatbot Claude.
Až dosud bylo jeho používání pro nás v EU docela oříšek, protože
jsme k němu neměli oficiální přístup a museli vymýšlet složité triky
s VPN a shánět falešná telefonní čísla.
Ale teď se karta obrací. Minulý týden Anthropic konečně otevřel dveře
i pro české uživatele.
Takže pokud jsi ještě neměl tu čest, honem to naprav. Claude je
přeborník v psaní textů. Eseje, povídky, scénáře … jeho výstupy
působí originálně, dost možná proto, že na ChatGPT jsme si za ten rok a
půl zvykli. A jasně, umí i česky.
Navíc má Claude obrovskou výhodu v podobě širokého kontextového
okna. Pojme mnohem delší dokumenty. Jestliže chatboti GPT‑4 a 4o
zvládnou 32 tisíc tokenů,
Claude jich dá 6× tolik. To se skvěle hodí třeba pro analýzu dat nebo
rešerše. A chápe i obrázky. Pošli mu fotku a on ti řekne, co na
ní vidí.
Můžeš si vybrat z několika verzí Clauda, některé jsou zdarma, za
jiné zaplatíš stejný bakšiš jako za ChatGPT.
Upřímně, Claude se u mě pomalu stává chatbotem první volby. Ale je
spousta věcí, hlavně v rozhraní, co mi v něm citelně chybí. Takže
stále pendluju mezi více nástroji. Nicméně Claude je nezastupitelný.
Vyzkoušej ho, ideálně placenou verzi, a myslím, že si ho oblíbíš.
Nemáš placené ChatGPT Plus? Nevadí! OpenAI se rozhodlo vylepšit
i bezplatnou verzi ChatGPT a přidat do ní funkce, které bys čekal spíš
u prémiových modelů.
Takže co se chystá? Zaprvé, free uživatelé dostanou přístup
k inteligenci na úrovni GPT‑4, konkrétně k GPT‑4o. To je hodně
velký skok oproti současnému stavu. Nový model je totiž mnohem chytřejší
a všestrannější než starší modely. Takže se připrav na kvalitnější
konverzace a přesnější odpovědi.
Za druhé, ChatGPT bude schopný čerpat informace z webu. Takže bude mít
i aktuální informace. Nehledě na to, že GPT‑4o se učil na datech
získaných do prosince 2023, zatímco předchozí GPT‑3.5 jen do února 2022
(a nemá dosud páru o tom, že Rusko napadlo Ukrajinu).
A co víc, bude konečně rozumět i obrázkům! Můžeš mu poslat fotku a
nechat ho, ať ti ji popíše, analyzuje nebo třeba přeloží text, který na
ní vidí.
A to pořád není všechno! Free verze zvládne analyzovat data a
vytvářet z nich grafy a tabulky. Stačí mu poslat soubor s čísly a on ti
z nich udělá přehlednou vizualizaci. No a konečně, i free uživatelé
budou moci používat (ale ne vytvářet) tzv. GPTs –
specializované jazykové modely na konkrétní témata či úkoly. A taky paměť.
Hotová Vánoční nadílka takhle zkraje jara. Ok, pojďme si spíš říct,
co budou mít navíc platící diváci:
mohou vytvářet specializované GPTs
mohou generovat obrázky pomocí DALL-E
mají vyšší limit na počet zaslaných zpráv GPT‑4o
Toho moc není. Tak si říkám, jestlipak si to v OpenAI spočítali dobře
a udrží platící uživatele, jestli jim spíš nezačal pricingový model
halucinovat. Každopádně pokud jsi váhal, jestli si připlatit za ChatGPT
Plus, možná teď už nebudeš muset.
OpenAI opět rozvířilo vody světa umělé inteligence představením
nového modelu GPT‑4o. To „o“ na konci znamená „omni“, tedy
všestranný. Ale mohlo by taky znamenat „óóó“, které vydáš, až
uvidíš, co všechno tenhle
model dokáže.
GPT‑4o rozumí videím v reálném čase. Jako fakt. V jedné z ukázek
dokonce pomáhá nevidomému vnímat svět kolem sebe, třeba mu hlásí
přijetí taxíku. Opravdová revoluce.
Neuvěřitelně se také vylepšil hlasový projev. Nezní jako stroj, ale
jako člověk, který se směje, zpívá, nebo na přání imituje robota. Při
sledování videí, kde si ajťáci z OpenAI povídají se sexy ženským
hlasem, který s nimi koketuje a který si sami vytvořili, se nelze ubránit
jistému pocitu bizarnosti. Skoro mě napadá, jestli to nehraničí
s kognitivní (sebe)manipulací, kterou nový akt EU o AI výslovně zakazuje
:-) Každopádně film Her už klepe na dveře.
A teď pikanterie. Scarlett Johanssonová se pořádně naštvala na šéfa
OpenAI Sama Altmana, protože v novém hlasu poznala ten svůj. Přitom loni
jeho nabídku na namluvení ChatGPT odmítla. Altman jako by na to narážel
tweetem „her“
v den uvedení – jasná reference na film, kde Scarlett hrála UI Samanthu.
Docela blbé v případě společnosti proklamující zodpovědný vývoj AI.
Herečka každopádně najala právníky, takže se můžeme těšit na
pořádnou tahanici.
Ale kontroverze stranou, GPT‑4o je další milník ve vývoji umělé
inteligence. Není to revoluce, ale evoluce, kde hlavní inovace spočívá
v propojení různých modelů a úctyhodném zrychlení GPT‑4. Což je
klíčové pro plynulou konverzaci. Kdo čekal GPT‑5 nebo nový vyhledávač,
může být zklamán, ale klídek, všechno bude.
Dobrá zpráva je, že GPT‑4o je dostupné hned pro všechny uživatele
ChatGPT, bez čekání či speciálních pozvánek. Nicméně na ty
nejzajímavější funkce, jako ovládání videem či hlasová konverzace, si
ještě musíme počkat.
Stále panuje tolik nejistot ohledně nebezpečí a rizik, které nám hrozí
ze strany umělé inteligence. A vůbec nejasností kolem jejich
fungování.
Když se téma otevře na internetu, pochopitelně každý má názor: pro
jednoho je ChatGPT „prostý tipovací stroj“, jiný tvrdí, že „rozumí
realitě světa“, že „funguje jako lidský mozek“ a navíc „vědci
přiznávají, že se v něm už nevyznají“. Což diskusi nijak
neposouvá.
Na školeních
ChatGPT věnuju dobrých 30 minut na to, abych poměrně do hloubky
vysvětlil, jak v jádru funguje. Aby lidé odcházeli se střízlivou
představu nezatíženou mýty o tom, co je to neuronová sít a
strojové učení.
Strojové učení jako výchova
orchestru
Právě strojové učení bývá obestřeno největším tajemnem. Lidé si
to často představují jako tajemnou skříňku, kam naházíte kupu fotek a
ona – mávnutím kouzelného proutku – začne rozpoznávat, co na
nich je.
Strojové učení je spíš jako výchova štěněte. Řízená člověkem,
teda programem, který člověk vymyslel a rozumí mu. Tomu, koho učí, se
říká neuronová síť. Technicky vzato je to záplava čísel, ale na chvíli
si ji představme jako partu muzikantů tvořících orchestr.
V začátcích jsou všichni absolutní amatéři. Dáte jim za úkol
zahrát první tóny Mozarta a výsledek? Víc než tragedie.
Ale pak na scénu vstupuje dirigent s andělskou trpělivostí. A začne
s korekcemi. Prvnímu vysvětlí: „Kamaráde, kytara není dechový
nástroj.“ Dalšímu, už trochu pokročilejšímu, jemně naznačí: „Hele,
jsi celých pět tónů vedle.“ A tak dále. Každý si radu částečně
vezme k srdci. Při dalším pokusu je to stále katastrofa, ale už míň
apokalyptická. A s každým dalším pokusem se zlepšují, až se z toho
absolutního chaosu začne pomalu vyklubávat něco, co by se dalo nazvat
hudbou.
Nestihl jsi v mládí založit kapelu a máš pocit, že teď už je pozdě?
Toužil jsi stvořit písničku i s textem? V minulosti něco, co vyžadovalo
hudební talent, praxi a často i peníze na profesionální nahrávání. Teď
je to díky AI o mnoho snazší.
Představ si, že máš chuť na punkovou pecku třeba, co já vím,
o Karlových Varech, o tom, jak ti ty léčivé prameny připomínají domov.
Vezmeš službu Suno, zadáš tyto instrukce a
za pár vteřin – bum! Máš svou vlastní skladbu i se zpěvem.
Jasně, pořád to má své mouchy. Když se pořádně zaposloucháš, tak
hlas zní roboticky. V češtině fakt divně vyslovuje – ale rozhodně ne
hůř než Calin & Viktor Sheen :-) Ale jinak? Kytara jako živá, melodie
chytlavá… Kdybych to pustil mezi ostatními songy v rádiu, vsadím se, že
by si nikdo z posluchačů ničeho divného nevšiml.
A to nejlepší? Většinou to ani nic nestojí. Suno třeba nabízí
10 písniček zdarma denně, pak si musíš připlatit. Ale i tak je to za
pár kaček. Ostatně vyzkoušej si to sám. Zadej pár slov, zvol styl a užij
si vlastní písničku.
My jsme si s tím pohráli ještě víc – nechali jsme Suno složit
písničku a pak jsme k ní natočili videoklip postaru, bez AI. Protože AI
generování videa, to bude šlágr až tak za půl roku.
Tohle je každopádně jen začátek. Dej tomu rok času a ty písničky
budou k nerozeznání od těch od opravdových hudebníků. Není to
děsivé?