Mýty, dohady a zajímavosti o umělé inteligenci

Mezi lidmi je rozšířeno mnoho polopravd a mýtů, které vytvářejí zkreslený obraz o uměligenci. Nadouvají ji do nebeských výšin. Člověk by nabyl dojmu, že AI je zdroj moudrosti, který vyřeší každý problém, od finanční analýzy ve firmě až po navrhování vědeckých hypotéz. Že samořídící auta jsou (tentokrát už doopravdy!) za rohem. Že nás s přehledem porazí v jakékoli hře a navrch si přisvojí práci půlky lidstva. A že je jen otázkou času, kdy si uvědomí sama sebe a převezme kontrolu nad naší planetou.

Skutečnost je poněkud jiná. Silná a mediálně atraktivní prohlášení často slouží k získání pozornosti investorů nebo médií, a ne vždy odrážejí skutečný stav věci. Proto je důležité přistupovat k informacím kriticky a snažit se pochopit, co je za tím vším skutečně. Rozumět tomu, co může a nemůže AI, je klíčové pro správné nastavení našich očekávání.

Má AI křišťálovou kouli?

Ve spojitosti s uměligencí se používá slovo „předpovídat“. Prý dokáže předpovídat počasí, nemoci, nebo který výrobek si zákazník příště koupí. Když jsme se bavili o tom, jak funguje GPT, zmiňoval jsem se o předpovídání dalšího slova.

Má tedy věsteckou kouli? Šlo by nakrmit neuronovou síť historii tahů Sportky a nechat ji předpovědět příští tah? Vyděláme balík? Koupíme Lambo? Zpomal, ne, tohle opravdu nejde.

AI je velmi zdatná ve sledování vzorců a trendů v datech. Tedy dokáže odhadnout, jaké produkty si zákazník pravděpodobně koupí na základě nákupní historie jeho a milionů další lidí. Nebo jak se bude vyvíjet počasí na základě historických meteorologických dat. Předpovědět zdravotní problémy na základě genetických a zdravotních dat. A tak dále. Ale nemůže zjistit, že si třeba zítra zlomíš nohu. To je nahodilá událost, stejně jako tahy v loterii. AI, ať už jakkoliv pokročilá, je nemůže předpovědět.

Je pravda, že se AI naučila sama od sebe bangladéšsky?

Jak se kolem AI nafukuje bublina, narůstá také množství mýtů a nepravd, často šířených vědci nebo lidmi v první linii. Například šéf Google Sundar Pichai v dubnu 2023 v televizním rozhovoru promluvil o překvapivých (emergentních) dovednostech, které se u obřích jazykových modelů objevují a nikdo neví proč. Zmínil konkrétně, že jejich uměligence Bard, což je obdoba GPT, začala z ničeho nic rozumět bangladéšsky, ačkoliv nebyla na tomto jazyce trénována. Wow 🤯

Skutečnost je však taková, že jazyk „bangladéšština“ vůbec neexistuje. V Bangladéši se mluví bengálsky. A bengálština byla jedním z jazyků, na kterém se prokazatelně trénovala umělá inteligence PaLM, jejímž následníkem je právě zmíněný Bard. Takže žádný zázrak se nekoná.

Lze vývoj AI zpomalit nebo zastavit?

V březnu 2023 zveřejnila skupina expertů, podnikatelů a dalších signatářů výzvu k pozastavení experimentů s umělou inteligencí, která získala silný mediální ohlas i díky podpisům osobností jako Elon Musk nebo Steve Wozniak. Přitom Wozniak v rozhovoru o pár měsíců dříve prohlásil: „Ve spojení slov AI (artificial intelligence) věřím v písmeno A, ale inteligence v tom žádná není. Současná AI nepřemýšlí za sebe. Takovou inteligenci dnes nemáme.“ A Elon Musk jen o pár týdnů později založil společnost X.AI, zaměřenou na vytvoření konkurence pro ChatGPT. To, že hlavní signatáři jednají v rozporu s výzvou, může být jedním z důvodů, proč ji brát s rezervou. Především ale požaduje nereálné, už proto, že výzkum AI je veden v mnoha zemích světa. A zároveň půlroční odklad by těžko vyřešil rizika, kterých se signatáři obávají.

Pokročilá umělá inteligence by byla po atomové bombě dalším vynálezem s fatálním dopadem na lidstvo. Logicky k ní musíme přistupovat zodpovědně, zkoumat rizika a usilovat o mezinárodní spolupráci ve výzkumu a vývoji s cílem sladit AI s lidskými zájmy. Ale je třeba si ujasnit, o jakém horizontu se bavíme. Tvrdit, že obecná inteligence je za rohem, nebo že k ní dospějeme pouze škálováním parametrů, je čistá spekulace.

Proč je název OpenAI paradox?

OpenAI vznikla v prosinci 2015 jako nezisková organizace s ambiciózním cílem přinést bezpečnou a prospěšnou umělou inteligenci všem. Namísto toho, aby ji vyvinuli v korporacích, které si ji nechají pro sebe a získají klíčový náskok. Altruistický záměr otevíral dveře darům a udržoval mzdy zaměstnanců skromné. Mezi zakladateli najdeme slavné osobnosti, jako jsou Elon Musk, Sam Altman a Ilya Sutskever.

V roce 2019, když výzkumníci OpenAI vyvinuli model GPT-2, byli tak ohromeni jeho schopností generovat přirozeně znějící texty, že v obavách před zneužitím poskytli veřejnosti pouze omezenou verzi. To byl první signál zásadního posunu v politice OpenAI. O rok později byl představen model GPT-3, který díky své masivní velikosti představoval další vývojový skok. Místo zveřejnění modelu jej OpenAI zpřístupnila prostřednictvím placeného API (zvuk 🔊). V roce 2023 následně přišel model GPT-4, u kterého OpenAI nezveřejnila už ani parametry.

Transformace otevřené organizace na komerční podnik byla dokonána. Hlavním partnerem a investorem se stal Microsoft. Zůstal ale zavádějící název OpenAI. To se těžko svádí na chybu stážisty… Což mi připomíná jednu firmu, která byla dost chytrá na to, aby si své motto „Don't be evil“ nevtělila do názvu, takže ho pak nenápadně vyškrtla, dál se jmenovala stejně – Google :-)

Existují tajnosti okolo velikosti GPT-4?

Možná jsi někdy narazil na obrázek, který koloval na internetu před příchodem GPT-4. Ukazoval, o jak dramaticky větší model jde. Tvrdilo se, že GPT-4 má mít neskutečných 100 bilionů parametrů (tedy 100 000 miliard).

Akorát, že to není pravda. Společnost OpenAI, která model trénovala, skutečný počet parametrů tají. Dohledal jsem jen to, že její šéf na přímou otázku, jestli má tolik parametrů, odpověděl, že rozhodně ne.

King − Man + Woman ≈ Queen? Ne tak úplně.

Word2Vec, technika vynalezená naším rodákem Tomášem Mikolovem v roce 2013, změnila pravidla hry. Vymyslel, jak přeměnit slova na body v prostoru, tzv. embeddings, a najednou jsme si mohli s nimi hrát jako s kalkulačkou. Třeba spočítat, že muž se má ke králi stejně, jako se má žena ke … ano, královně. Vznikla slavná rovnice „King − Man + Woman ≈ Queen“. Dobré, ne? Můžeš si to vyzkoušet a spočítat třeba „Paris − France + Italy ≈ ?“

Ale počkej, co když je všechno trochu jinak? Co když ta pěkná rovnice „King − Man + Woman“ ve skutečnosti vrací… King? Je to tak. Ačkoliv ve všech článcích, prezentacích nebo kurzech se tvrdí, že výsledek je Queen, ve skutečnosti po provedení matematické operace s body v prostoru, které reprezentují slova v rovnici, dostaneme výsledek, který je nejblíže slovu King. Je tam totiž trik: protože slovo King už je v zadání, vzal se jako výsledek druhý nejbližší bod, což je Queen.

Nutno dodat, že to nic nemění na významnosti Word2Vec. Ale vymstilo se to ve chvíli, když se o problematiku začali zajímat odborníci na genderová studia a rovnost pohlaví. Ti odhalili, že je sexistický! Například počítá „Doctor − Man + Woman ≈ Nurse“. Skandál! Jenže opět to není pravda, ve skutečnosti vrací „Doctor“. Teprve s trikem, tedy když vezmeme až druhé nejbližší slovo, tak dostaneme zdravotní sestru.

Jak si zapamatovat Tomáše Mikolova?

Český vědec Tomáš Mikolov položil základy oboru zpracování přirozeného jazyka, jak jej vnímáme dnes. Jeho jméno stojí za to si zapamatovat. Pokud se ti to nedaří, jako mnemotechnická pomůcka ti může pomoci, že je to Mikulov akorát s „o“.

Stay tuned

Doplňují stále nová hesla, v TODO listu mám například:

  • Složila AIVA Dvořáka?