Když se řekne umělá inteligence

Není to jen bublina?

Šílenství kolem umělé inteligence nese všechny znaky bubliny. Už se o ní baví i taxikář, který tě veze z mejdanu domů. Není lepší zachovat chladnou hlavu a počkat, až se to celé přežene?

Tohle se rozhodně nepřežene. Umělá inteligence už dnes přináší ovoce, které pozmění svět. Je rozumné, abys začal zkoumat už teď, jak funguje a dá se využít. Brzy bude běžnou součástí našich životů. A ovlivní i dynamiku na trhu práce. Nechceš, abys s překvapením zjistil, že zvládne dělat tvou práci stejně dobře, rychleji a zadarmo.

Nicméně do AI se vkládají i očekávání, které zatím ani vzdáleně splnit nemůže. To už se několikrát v historii stalo. Období přehnaného nadšení vystřídalo vystřízlivění a těžká kocovina, které se říká zima umělé inteligence. Myslím, že i po současném boomu přijde vystřízlivění, ale všechny ty užitečné nástroje, jako je GPT, tu s námi zůstanou.

Kde se AI využívá?

Umělá inteligence ovlivňuje naše životy už dlouhou dobu. Pohání jazykové překladače, které se v posledních letech znatelně zlepšily. Doporučuje písničky na Spotify. Bez AI by email dnes nejspíš neexistoval, neboť by se stal nekonečnou skládkou spamu. Fotoaparáty v mobilech díky AI dokážou fotit i za šera. AI na fotkách analyzuje objekty a tváře, podle kterých je následně třídí. Zajímavé je, že mnozí lidé o tom ani netuší; zkus si třeba ve fotkách vyhledat „pláž“. Lidé také často nevědí, že mohou do mobilu diktovat místo psaní a slova se přepíší na text. Naopak dobře znají původně snapchatové selfie-efekty, různé zkrášlující nástroje nebo aplikace, které převedou fotografie do uměleckých děl slavných malířů. Telefony od Apple, počínaje iPhone 8, mají dokonce dedikovaný procesor pro umělou inteligenci.

Blížíme se k obecné umělé inteligenci?

Obecnou umělou inteligencí (AGI, Artificial General Intelligence) se nazývá inteligence, která se dokáže přizpůsobit novým podmínkám, samostatně zdokonalovat a rozvíjet své schopnosti. Může se ve všech směrech vyrovnat člověku a překonat jej.

Ale klid, nic takového zatím neexistuje. Ani nejpokročilejší z jazykových modelů, GPT‑4, není program, který by mohl jednat o své vlastní vůli. Jde o úzce specializovaný program, který nedokáže sám o sobě získávat nové schopnosti. Podobně jako myčka se nedokáže sama vyskládat. Jeho vývoj je dílem šikovných programátorů a vědců z OpenAI.

Ačkoliv GPT svými překvapivými schopnostmi a univerzálním využitím v řadě lidí vyvolal dojem, že jde o počátek obecné AI, k té povede ještě dlouhá cesta. Bude potřeba učinit řadu vědeckých objevů. Tvrdit, že obecná AI už je za rohem, není seriózní.

Co se stalo mimořádného v letech 2022–23?

Rok 2022 byl pro obor umělé inteligence mimořádný hlavně v tom, jak zasáhl do veřejného povědomí. Služba ChatGPT během pouhých dvou měsíců přilákala 100 milionů uživatelů, čímž se stala nejrychleji rostoucí aplikací všech dob. A přitom stojí na modelu, který byl vytrénovaný už před pár lety, a myšlenkách objevených ještě dříve. Takový raketový vzestup zájmu nikdo neočekával, dokonce zaskočil i giganty jako Google či Apple.

Rychle se zorientoval naopak Microsoft nebo Adobe. Schválně, jaké průlomové inovace se objevily za posledních 20 let v programech jako Word, Excel či Photoshop? Zkus nějaké vyjmenovat. A teď si představ, že příští verze Wordu ti nabídne, že dokončí dopis za tebe. Excel navrhne přehlednější způsob vizualizace dat. Photoshop za pár vteřin vygeneruje zbytek obrazu. To je největší revoluce v dějinách těchto programů.

A není to jen strojové učení?

„To přece není AI! Je to pouhé strojové učení! Jenom statistika.“

Tohle je opravdu zbytečné slovíčkaření. Technicky vzato, umělá inteligence je široký vědecký obor a strojové učení je jedním z jeho klíčových podoborů. Dnešní generátory textů a obrázků jsou výsledem intenzivního bádání na poli neuronových sítí, které spadají pod strojové učení. Jde o kombinaci statistiky, matematiky, experimentování, náhody, štěstí, peněz a dalších ingrediencí. Po 80 letech se podařilo přijít s průlomovými výsledky v oblasti porozumění psaného textu a mluveného slova. Zdaleka to není obecná AI jako z filmů. Ale stejně je to fascinující. Chytrý člověk zkoumá, jak mu může pomoci, rejpal hloupě slovíčkaří.

Co jsou neuronové sítě?

Když se dnes hovoří o umělé inteligenci, obvykle se myslí neuronové sítě. Počátky jejich výzkumu sahají do poloviny minulého století. Ano, je to sakra dávno. Jejich původním předobrazem byly opravdu biologické neurony, ale brzy se od nich vzdálily, koneckonců sami jsme toho o fungování mozku dost nevěděli.

Neuronové sítě zvládají problémy, kde klasické programování tápe, protože je nelze snadno popsat algoritmicky. Patří sem například rozpoznávání znaků (OCR) nebo řeči. V klasickém programování, kde programátor definuje chování pomocí kroků, podmínek a cyklů, je obtížné definovat, jak třeba vypadá písmeno A, když je tolik různých fontů, nebo jak zní vyřčené A, když lidé mají tolik různých hlasů a intonací. Neuronové sítě k úkolu přistupují jinak, a to tak, že se „učí“ na datech, která jim předložíme, a vytváří si model, který je schopný rozpoznávat znaky nebo rozumět řeči. Tomuto procesu se říká trénování. Proto říkáme, že neuronové sítě jsou založené na strojovém učení.

Co jsou to jazykové modely?

Jazykové modely jsou neuronové sítě, které hrají zásadní roli v počítačovém zpracování přirozeného jazyka. Umožňují počítačům analyzovat a generovat texty, což vyžaduje určitou míru porozumění přirozenému jazyku. Jejich využití je široké, od zpracování nestrukturovaných dat (informace, které nejsou uspořádány v definované struktuře, například texty článků), přes strojový překlad, automatickou korekturu textů až po interakci s virtuálními asistenty (jako Google Now, Siri, Amazon Echo) nebo chatboty.

Historicky se pro různé účely, jako je analýza sentimentu (zjištění, zda je text pozitivní, negativní nebo neutrální), překlady či generování specifických textů, tvořily odlišné modely. Tyto modely byly trénovány různými způsoby, často pomocí označených dat, a dosáhly různých úrovní schopností.

Všechno to však změnil příchod modelu GPT od OpenAI. Ten byl vytrénován na jednoduchém úkolu na obrovském množství textu. Místo invence nových algoritmů šli cestou škálování. K překvapení vědců se tento obří model ukázal být schopen řešit všechny dřívější úlohy, a to mnohem lépe. Začal projevovat určitého druhu inteligenci.

Je AI opravdu inteligentní?

To je záludná otázka, protože existuje mnoho definic, co to inteligence je. Navíc, pokud se nějakou dovednost naučí zvíře nebo stroj, lidé ji často přestanou považovat za projev inteligence. Málokdo by dnes řekl, že počítač Deep Blue, který v roce 1997 porazil šachového mistra světa Garri Kasparova a šokoval tím svět, byl inteligentní. Ale kdybys to dokázal ty, tví rodiče by tě určitě označili za geniálního.

Jedna část lidí schopnosti velkých jazykových modelů, jako je GPT, považuje za projev inteligence. Byť jiné, než je lidská. Neuronovou síť vidí jako podklad, ze kterého inteligence vyvstává (emerguje). Emergenci chápou až jako cosi magického. Proti nim stojí lidé, kteří tvrdí, že jde pouze o stroje bezmyšlenkovitě chrlící text na základě pravděpodobnosti, tzv. stochastické papoušky. Ti první na to namítají, že i lidský mozek je v podstatě stochastickým papouškem, a tedy AI má podobné vlastnosti jako lidé. Můžeš si vybrat, který postoj ti je sympatičtější.

Může AI získat vědomí?

Jestliže panují neshody ohledně definice inteligence, s vědomím je to ještě o řád komplikovanější. Co je vůbec vědomí? Má vědomí někdo jiný kromě tebe? Předpokládáš, že ano, že ho mají všichni lidé – jenže jak to ověřit? Tohle jsou témata, o kterých víme tragicky málo. O to větší prostor pro různé šílené teorie, jako že podstatou vědomí jsou kvantové částice nebo vlastnosti mikrotubulů atd. Do toho ale nechci zabrušovat. Protože otázka umělého vědomí vůbec není na pořadu dne. Současné AI jsou jednoúčelové programy bez schopnosti jednat o své vůli. Nic víc.

Je pravda, že ani tvůrci nechápou, jak AI funguje?

Umělá inteligence je výsledkem lidského úsilí. Je pravda, že při jejich vývoji se mnohdy zkoušely různé cesty, z nichž se některé ukázaly jako funkční, aniž by bylo úplně jasné proč. Podobně jako když při vaření zjistíš, že jídlo lze vylepšit přidáním určité ingredience, ale neděláš chemickou analýzu, která by objasnila důvod. Spokojíš se tím, že to chutná. Účení neuronové sítě, to jsou jasně dané matematické výpočty, které mají za úkol hledat vzory v trénovacích datech. Když komunikuješ s nečím jako ChatGPT, stále jde o matematiku, a inženýři, kteří tyto systémy vytvářejí, jí velmi dobře rozumí.

Co je ale nesmírně komplikované, je interpretace dat vytvořených během tréninku a z toho plynoucí chování AI. To je jako snažit se chápat chování davu na základě znalosti reakcí jednotlivých lidí.

Jak se neuronové sítě trénují?

Strojové učení přistupuje k úkolům úplně jinak než klasické programování. Vezmi si jako příklad rozpoznávání znaků (OCR). Tady klasické programování selhává, protože nelze dost dobře algoritmicky rozlišit jedno písmenko od druhého, navíc když existují tisíce různých fontů. Místo toho, aby programátor vytvořil kód, který přímo řeší problém, naprogramuje neuronovou síť, která se naučí problém řešit sama. Učení (trénování) probíhá tak, že se neuronové síti předloží naskenovaný obrázek písmene a ona vygeneruje svůj odhad. Odhad se porovná s tím, jaké písmeno to skutečně bylo, a pokud se netrefí, provede se korekce, aby příště, když se jí předloží podobný obrázek, byla pravděpodobnost správné odpovědi vyšší. Tento proces se opakuje mnohokrát s mnoha obrázky, dokud se síť nenaučí písmena správně rozpoznávat.

Neuronovou síť si můžeš představit jako obrovskou sadu číselných hodnot, tzv. vah (neboli parametrů). Rozpoznávání znaku je matematická operace, která zahrnuje tyto váhy a pole čísel představujících jednotlivé pixely obrázku. Čísla se mezi sebou různě násobí a sčítají, prostě velká matematika, a ve výsledku vrátí hodnoty pravděpodobností jednotlivých písmen. A zmíněná korekce spočívá v úpravě vah pomocí algoritmu zpětné propagace chyby (backpropagation). Takže celý trénink probíhá tak, že nejprve nastavíme váhy náhodně, takže výsledek operace „rozpoznej písmeno“ bude nesmyslný, a pak dokola provádíme korekce na základě učících dat. Síť se tedy „učí“ tím, že si upravuje své váhy, aby lépe vyřešila úlohu. V jistém smyslu jsou váhy „znalostmi“ neuronové sítě.

Je to trochu jako když se dítě učí rozeznávat písmena. Na začátku mu všechna písmena připadají stejná, ale postupem času se naučí rozpoznávat jejich jednotlivé rysy, a nakonec je dokáže správně identifikovat. Neuronová síť se učí mnohem rychleji, protože nemusí chodit spát a nerozptýlí ji kdejaká ptákovina. (Doporučuji výborné video Co vlastně je neuronová síť)

Lze neuronové sítě vytrénovat na cokoliv?

Moje předchozí vylíčení neuronových sítí znělo jako univerzální návod na šťastný život od nadšeného osobního kouče. Realita je, jak už to bývá, o poznání méně růžová. Může se stát, že spálíš hromadu peněz za trénování, ale síť nebude schopna rozpoznat ani středník od dvojitého W. Nebo bude skvěle rozpoznávat písmena v tréninkové sadě, ale v reálných situacích selže. Nebo třeba se zadaří, bude mít účinnost 98 %, což zní skvěle, ale ve skutečnosti to znamená přibližně jednu chybu v každé větě, což je naprd. Abys dosáhl chybovosti řádově menší, potřebuješ trpělivost a hlavně štěstí, protože jinak vymeteš jednu slepou uličku za druhou. A dokonce i když dílko se podaří, může jakákoliv drobná změna okolností způsobit, že síť náhle selže. Vytvoření neuronové sítě, která by se uměla adaptovat na změnu prostředí, je stále sci-fi.

Spojení slov „neuronová síť“ tedy není zárukou ničeho. Pamatuj na to, až se ti někdo pokusí prodat zázračný produkt, protože je založený na AI. Průlom posledních let v jazykových a obrazových modelech neznamená automaticky průlom v oblastech zcela jiných.

Co je to uměligence?

To je novotvar, který jsem si vymyslel, protože umělá inteligence je příliš dlouhé označení a AI zase moc krátké :-) Mimochodem, zkratka AI (artificial intelligence) se někdy do češtiny překládá jako UI (umělá inteligence), což způsobuje zmatek, protože UI je zaužívaná zkratka pro uživatelské rozhraní (user interface). Takže prosím, AI nepřekládej.

Stay tuned

Stále doplňuji nová hesla. V TODO listu mám například:

  • Co je to alignment / skladění
  • Co je to agent a bot?
  • Jak to, že je kreativní?