Blog Uměligence

Rozumí jazykové modely tomu, co píší, nebo jen papouškují?

Jednou z nejžhavějších debat v oblasti umělé inteligence je otázka, zda velké jazykové modely (LLM) skutečně rozumí textům, které píší, nebo zda jen sofistikovaně papouškují. Tato otázka rozděluje odborníky v oboru a představuje jedno z nejzajímavějších témat současného výzkumu AI.

O čem se vlastně přeme? Jde o to, jestli modely opravdu chápou význam slov, vyvinul se u nich zdravý rozum a mají sociální inteligenci. Nebo je to všechno trik spočívající ve formálních lingvistických operacích. Proč je tato debata důležitá? Nejde jen o akademickou diskusi. Odpověď může mít dalekosáhlé důsledky pro vývoj AI, etiku jejího použití, a dokonce i pro naše chápání lidské inteligence.

Jedna metafora, která se často v této souvislosti používá, je „stochastický papoušek“. To je termín popisující systém, který dokáže generovat text, který se na první pohled může zdát smysluplný a koherentní, ale ve skutečnosti pouze opakuje nebo kombinuje informace, které se naučil při tréninku, bez skutečného porozumění obsahu.

pokračování ➡️

OpenAI o1: revoluce nebo krok zpět pro pokročilé uživatele?

OpenAI představila nový nástroj o1. Aby zdůraznila, že nejde jen o další pokračování v řadě GPT-3, GPT-4, zcela vypustili písmena GPT z názvu a pojmenovali ho jednoduše „o1". Hlavní inovací je schopnost přemýšlet nad odpovědí. Zatímco internet zaplavují nadšené ohlasy, mé pocity jsou rozporuplné. Dovolte mi vysvětlit proč.

Začnu mírnou odbočkou: Jedna z klíčových znalostí, kterou se snažím předat účastníkům svých kurzů ChatGPT, je, že tyto umělé inteligence samy od sebe nepřemýšlejí. To v mnoha případech nevadí – i vy dokážete bez přemýšlení odpovědět, kolik je 7×7. Existují však situace, které bez hlubšího zamyšlení nevyřešíte, což si ukazujeme na jednoduché hře. Podstatné je, že ChatGPT lze k přemýšlení přimět, a není to nic složitého. Stačí jen vědět jak.

Slovem „přemýšlení“ myslím činnost, jejímž smyslem je poskytnout následně co nejlepší odpověď. Pokud odpovídám okamžitě bez této činnosti, pak nepřemýšlím.

Častá otázka účastníků zní: „Jak poznám, že ChatGPT odpověděl správně?" Odpovídám, že klíčem je sledovat tok myšlenek a dále s ním pracovat, nechat AI ověřovat své závěry atd.

pokračování ➡️

Co skutečně znamená papouškování u jazykových modelů?

V diskusích o umělé inteligenci, zvláště o velkých jazykových modelech, se často setkáváme s pojmem „papouškování“. Ve smyslu toho, zda modely skutečně rozumí informacím, které produkují, nebo jen mechanicky papouškují naučené texty. Vžil se pojem stochastický papoušek.

Co se ale papouškováním opravdu myslí? Pojďme se na to podívat blíže a rozplést, co se za tímto termínem skutečně skrývá.

Velké jazykové modely se během tréninku krmí obrovským množstvím textů a pak, když dostanou nějaký vstup nebo dotaz, vyprodukují odpovídající text. Když se mluví o „papouškování“, rozhodně tím odborníci nemyslí, že by model opisoval věty ze svých učebních materiálů slovo od slova. To by bylo pro model vlastně docela složité.

Tak o co tedy jde? Model se v datech učí rozpoznávat vzory a ty pak papouškuje. Je to jako byste se učili cizí jazyk – taky si nepamatujete celou učebnici nazpaměť, ale pochytíte pravidla a vzorce, které pak používáte k tvoření vlastních vět.

Jazykové modely vlastně učící data komprimují, ale jinak než třeba ZIP nebo JPEG. Představte si to jako tvorbu myšlenkové mapy nebo výtahu z knihy. Neuchováváte každé slovo, ale hlavní myšlenky a vztahy mezi nimi. Model pak z těchto poznámek tvoří nový text.

To, že model vytváří originální věty, není nic překvapivého. Je to prostě jeho práce, stejně jako práce hodinek je ukazovat čas. Byl od začátku navržen tak, aby uměl zobecňovat a tvořit nový obsah.

Někdy se ale může stát, že si model zapamatuje nějakou část textu tak dobře, že ji pak napíše úplně stejně. To může být problém hlavně kvůli autorským právům. Může nastat i situace, že model napíše něco, co vypadá jako plagiát, i když ten konkrétní text nikdy neviděl. Čistě náhodou. V budoucnu asi budeme potřebovat speciální nástroje na odhalování takových situací.

Takže když příště uslyšíte o „papouškování“ v souvislosti s AI, vzpomeňte si, že nejde o doslovné kopírování, ale o složitý proces učení a tvoření na základě vzorů. Je to fascinující oblast, která nám poodhaluje, jak funguje strojové učení a jak mohou počítače pracovat s jazykem. A možná nám to jednou pomůže lépe pochopit i to, jak se učíme my sami.


A jak to vlastně je, chápou modely význam slov, mají zdravý rozum, rozumí lidským interakcím, nebo jen opakují a kombinují data z učících dat? O tom je článek Rozumí jazykové modely tomu, co říkají, nebo jen papouškují?

Kdo je a kdo není odborník na AI

Pojďme si říct, kdo je a kdo není odborník na AI.

Začnu vzpomínkou, když mi bylo 15 let. Už tehdy jsem dobře rozuměl počítačům. Táta, který je prodával, mě je nechával skládat z komponent a brával mě ke klientům na servis. Po letech mi jeden z nich povídal, jakou měl hrůzu, když se do jeho drahocenného PC za 250 tisíc Kč (dnes by to bylo 850 tisíc) pustilo se šroubovákem malé děcko.

Na počítačích mě bavilo všechno, hlavně grafika a programování. A docela dobře jsem si tím vydělával. Kapesné od rodičů představovalo spíš nepodstatný bonus. Vytáčí mě, když nějaký politik prohlásí, že děti v tomto věku se mají prohánět za mičudou a ne pracovat. Sám kopal do míče a hle, jaký z něj vyrostl kretén.

V osmnácti jsem už počítačům rozuměl natolik, že bych po probuzení vyjmenoval všechny instrukce procesoru. Byl jsem odborník? Považovali mě za něj, i když jsem ještě neměl vysokou školu ani maturitu.

Šel jsem na výšku zaměřenou na počítače. Možná čekáte, že škola byla pro mě hrozná nuda a nic jsem se tam nedozvěděl, ale tak to není. Škola člověku vždycky otevře nové obzory. Jen jsem si uvědomoval, že na rozdíl od medicíny nebo práva je ten finální level, diplom, pro mě bezcenný papír. Taky jsem viděl, kolik lidí, kterým bych nikdy nesvěřil žádný úkol, se s obrovskou pílí na tento vrchol vyškrábe, a kolik takových absolventů škola každý rok vyplivne. Jsou to odborníci?

Můj obor byl v té době tak turbulentní, že spousta věcí, které se jeden rok tesaly do kamene, příští už vůbec neplatily. Škola byla jen rozmlžený okamžik v nikdy nekončícím procesu učení. Je odborník někdo, kdo vystudoval turbulentní obor před deseti lety? To záleží dost na tom, co během těch deseti let dělal.

Kdo je tedy odborník na AI? Nedávno jsem se vracel z vody se dvěma advokáty, a jeden z nich mi říká: „Čéče, dnes je každej právník odborník na AI a školí to.“ Ujišťoval jsem ho, že v jiných oborech je to úplně stejné.

Znám pár jmen, která za odborníky na AI rozhodně považuji. Pak je spousta dalších, kteří nemají potřebu být vidět. Žádné jednoduché vodítko neexistuje. A ještě něco: To, že je člověk špička v jednom oboru, z něj nedělá hvězdu v oboru jiném. Například v prognostice. Odborníci na AI předpovídající budoucnost jsou moje guilty pleasure.

ChatGPT bude mít paměť jako slon

Všiml sis toho písmenka „P“ ve zkratce „GPT“? Je těžké si ho nevšimnout. Tak ono „P“ znamená „předtrénovaný“. Jinými slovy, tyhle modely se sice učí z neskutečně obrovského množství textů, ale jakmile jednou dokončí svůj trénink, dál se nenaučí nic. Ani z rozhovorů s námi, uživateli.

Proč to tak je? Učení je šíleně drahý a náročný proces, takže učit se průběžně by stálo majlant. Místo toho se vývojáři snaží vymyslet fígle, jak to obejít. A jedním z nich je zbrusu nová funkce Memory, tedy paměť.

Paměť funguje jako takový malý zápisníček. Kdykoliv během konverzace ChatGPT narazí na něco zapamatováníhodného, tak si to do něj poznamená. A před každou další konverzací si tyhle poznámky připomene. Takže nemusíš pořád dokola opakovat, že jsi z Brna, máš dvě kočky a rád jíš pizzu. ChatGPT si to bude pamatovat.

Na ty jeho poznámky se můžeme mrknout i my, uživatelé. V nastavení je sekce, kde je všechny vidíme, a když se nám něco nezdá, tak to můžeme smazat. Tedy máme kontrolu nad složkou, co si o nás ten digitální parťák vede.

Nebo můžeme funkci úplně deaktivovat. Nebo otevřít tzv. „dočasný chat“, při kterém vůbec nebude vytahovat zápisník s poznámkami.

Tahle funkce zatím funguje jen pro šťastlivce mimo Evropskou unii. My tady v EU máme tak přísné zákony na ochranu osobních údajů, že si na Memory budeme muset ještě chvíli počkat. Já vím, funkce je to zcela transparentní a pamatuje si jen to, co jsi sám řekl, takže s osobními údaji nemůže … já vím, nedává to smysl. Zvykej si, že v EU holt bude všechno se zpožděním. Ledaže bys měl po ruce nějakou šikovnou VPN…

Aktualizace: od září 2024 máme Memory i v Evropě!

Memory, all alone in the moonlight 🎵
I can dream of the old days
Life was beautiful then

Claude: Tajný trumf konečně dostupný pro všechny

Na svých školeních už dlouho mluvím o tajném trumfu mezi chatboty – Claude od Anthropic. Co to je Anthropic? Je to firma, kterou založili někdejší průkopníci OpenAI, tvůrci ChatGPT. A jejich vlajkovou lodí je právě chatbot Claude.

Až dosud bylo jeho používání pro nás v EU docela oříšek, protože jsme k němu neměli oficiální přístup a museli vymýšlet složité triky s VPN a shánět falešná telefonní čísla.

Ale teď se karta obrací. Minulý týden Anthropic konečně otevřel dveře i pro české uživatele.

Takže pokud jsi ještě neměl tu čest, honem to naprav. Claude je přeborník v psaní textů. Eseje, povídky, scénáře … jeho výstupy působí originálně, dost možná proto, že na ChatGPT jsme si za ten rok a půl zvykli. A jasně, umí i česky.

Navíc má Claude obrovskou výhodu v podobě širokého kontextového okna. Pojme mnohem delší dokumenty. Jestliže chatboti GPT‑4 a 4o zvládnou 32 tisíc tokenů, Claude jich dá 6× tolik. To se skvěle hodí třeba pro analýzu dat nebo rešerše. A chápe i obrázky. Pošli mu fotku a on ti řekne, co na ní vidí.

Můžeš si vybrat z několika verzí Clauda, některé jsou zdarma, za jiné zaplatíš stejný bakšiš jako za ChatGPT.

Upřímně, Claude se u mě pomalu stává chatbotem první volby. Ale je spousta věcí, hlavně v rozhraní, co mi v něm citelně chybí. Takže stále pendluju mezi více nástroji. Nicméně Claude je nezastupitelný. Vyzkoušej ho, ideálně placenou verzi, a myslím, že si ho oblíbíš.

ChatGPT: dostaneš víc inteligence zdarma

Nemáš placené ChatGPT Plus? Nevadí! OpenAI se rozhodlo vylepšit i bezplatnou verzi ChatGPT a přidat do ní funkce, které bys čekal spíš u prémiových modelů.

Takže co se chystá? Zaprvé, free uživatelé dostanou přístup k inteligenci na úrovni GPT‑4, konkrétně k GPT‑4o. To je hodně velký skok oproti současnému stavu. Nový model je totiž mnohem chytřejší a všestrannější než starší modely. Takže se připrav na kvalitnější konverzace a přesnější odpovědi.

Za druhé, ChatGPT bude schopný čerpat informace z webu. Takže bude mít i aktuální informace. Nehledě na to, že GPT‑4o se učil na datech získaných do prosince 2023, zatímco předchozí GPT‑3.5 jen do února 2022 (a nemá dosud páru o tom, že Rusko napadlo Ukrajinu).

A co víc, bude konečně rozumět i obrázkům! Můžeš mu poslat fotku a nechat ho, ať ti ji popíše, analyzuje nebo třeba přeloží text, který na ní vidí.

A to pořád není všechno! Free verze zvládne analyzovat data a vytvářet z nich grafy a tabulky. Stačí mu poslat soubor s čísly a on ti z nich udělá přehlednou vizualizaci. No a konečně, i free uživatelé budou moci používat (ale ne vytvářet) tzv. GPTs – specializované jazykové modely na konkrétní témata či úkoly. A taky paměť.

Hotová Vánoční nadílka takhle zkraje jara. Ok, pojďme si spíš říct, co budou mít navíc platící diváci:

  • mohou vytvářet specializované GPTs
  • mohou generovat obrázky pomocí DALL-E
  • mají vyšší limit na počet zaslaných zpráv GPT‑4o

Toho moc není. Tak si říkám, jestlipak si to v OpenAI spočítali dobře a udrží platící uživatele, jestli jim spíš nezačal pricingový model halucinovat. Každopádně pokud jsi váhal, jestli si připlatit za ChatGPT Plus, možná teď už nebudeš muset.

GPT‑4o je venku, připrav se na óóó efekt

OpenAI opět rozvířilo vody světa umělé inteligence představením nového modelu GPT‑4o. To „o“ na konci znamená „omni“, tedy všestranný. Ale mohlo by taky znamenat „óóó“, které vydáš, až uvidíš, co všechno tenhle model dokáže.

GPT‑4o rozumí videím v reálném čase. Jako fakt. V jedné z ukázek dokonce pomáhá nevidomému vnímat svět kolem sebe, třeba mu hlásí přijetí taxíku. Opravdová revoluce.

Neuvěřitelně se také vylepšil hlasový projev. Nezní jako stroj, ale jako člověk, který se směje, zpívá, nebo na přání imituje robota. Při sledování videí, kde si ajťáci z OpenAI povídají se sexy ženským hlasem, který s nimi koketuje a který si sami vytvořili, se nelze ubránit jistému pocitu bizarnosti. Skoro mě napadá, jestli to nehraničí s kognitivní (sebe)manipulací, kterou nový akt EU o AI výslovně zakazuje :-) Každopádně film Her už klepe na dveře.

A teď pikanterie. Scarlett Johanssonová se pořádně naštvala na šéfa OpenAI Sama Altmana, protože v novém hlasu poznala ten svůj. Přitom loni jeho nabídku na namluvení ChatGPT odmítla. Altman jako by na to narážel tweetem „her“ v den uvedení – jasná reference na film, kde Scarlett hrála UI Samanthu. Docela blbé v případě společnosti proklamující zodpovědný vývoj AI. Herečka každopádně najala právníky, takže se můžeme těšit na pořádnou tahanici.

Ale kontroverze stranou, GPT‑4o je další milník ve vývoji umělé inteligence. Není to revoluce, ale evoluce, kde hlavní inovace spočívá v propojení různých modelů a úctyhodném zrychlení GPT‑4. Což je klíčové pro plynulou konverzaci. Kdo čekal GPT‑5 nebo nový vyhledávač, může být zklamán, ale klídek, všechno bude.

Dobrá zpráva je, že GPT‑4o je dostupné hned pro všechny uživatele ChatGPT, bez čekání či speciálních pozvánek. Nicméně na ty nejzajímavější funkce, jako ovládání videem či hlasová konverzace, si ještě musíme počkat.

Mýty, fakta a skrytá tajemství strojového učení

Stále panuje tolik nejistot ohledně nebezpečí a rizik, které nám hrozí ze strany umělé inteligence. A vůbec nejasností kolem jejich fungování.

Když se téma otevře na internetu, pochopitelně každý má názor: pro jednoho je ChatGPT „prostý tipovací stroj“, jiný tvrdí, že „rozumí realitě světa“, že „funguje jako lidský mozek“ a navíc „vědci přiznávají, že se v něm už nevyznají“. Což diskusi nijak neposouvá.

Na školeních ChatGPT věnuju dobrých 30 minut na to, abych poměrně do hloubky vysvětlil, jak v jádru funguje. Aby lidé odcházeli se střízlivou představu nezatíženou mýty o tom, co je to neuronová sít a strojové učení.

Strojové učení jako výchova orchestru

Právě strojové učení bývá obestřeno největším tajemnem. Lidé si to často představují jako tajemnou skříňku, kam naházíte kupu fotek a ona – mávnutím kouzelného proutku – začne rozpoznávat, co na nich je.

Strojové učení je spíš jako výchova štěněte. Řízená člověkem, teda programem, který člověk vymyslel a rozumí mu. Tomu, koho učí, se říká neuronová síť. Technicky vzato je to záplava čísel, ale na chvíli si ji představme jako partu muzikantů tvořících orchestr.

V začátcích jsou všichni absolutní amatéři. Dáte jim za úkol zahrát první tóny Mozarta a výsledek? Víc než tragedie.

Ale pak na scénu vstupuje dirigent s andělskou trpělivostí. A začne s korekcemi. Prvnímu vysvětlí: „Kamaráde, kytara není dechový nástroj.“ Dalšímu, už trochu pokročilejšímu, jemně naznačí: „Hele, jsi celých pět tónů vedle.“ A tak dále. Každý si radu částečně vezme k srdci. Při dalším pokusu je to stále katastrofa, ale už míň apokalyptická. A s každým dalším pokusem se zlepšují, až se z toho absolutního chaosu začne pomalu vyklubávat něco, co by se dalo nazvat hudbou.

pokračování ➡️

Nový hit? Napíšete ho za 10 vteřin

Nestihl jsi v mládí založit kapelu a máš pocit, že teď už je pozdě? Toužil jsi stvořit písničku i s textem? V minulosti něco, co vyžadovalo hudební talent, praxi a často i peníze na profesionální nahrávání. Teď je to díky AI o mnoho snazší.

Představ si, že máš chuť na punkovou pecku třeba, co já vím, o Karlových Varech, o tom, jak ti ty léčivé prameny připomínají domov. Vezmeš službu Suno, zadáš tyto instrukce a za pár vteřin – bum! Máš svou vlastní skladbu i se zpěvem.

Poslechni si ji!

Jasně, pořád to má své mouchy. Když se pořádně zaposloucháš, tak hlas zní roboticky. V češtině fakt divně vyslovuje – ale rozhodně ne hůř než Calin & Viktor Sheen :-) Ale jinak? Kytara jako živá, melodie chytlavá… Kdybych to pustil mezi ostatními songy v rádiu, vsadím se, že by si nikdo z posluchačů ničeho divného nevšiml.

A to nejlepší? Většinou to ani nic nestojí. Suno třeba nabízí 10 písniček zdarma denně, pak si musíš připlatit. Ale i tak je to za pár kaček. Ostatně vyzkoušej si to sám. Zadej pár slov, zvol styl a užij si vlastní písničku.

My jsme si s tím pohráli ještě víc – nechali jsme Suno složit písničku a pak jsme k ní natočili videoklip postaru, bez AI. Protože AI generování videa, to bude šlágr až tak za půl roku.

Tohle je každopádně jen začátek. Dej tomu rok času a ty písničky budou k nerozeznání od těch od opravdových hudebníků. Není to děsivé?