Nová šachová hra s Atari 2600 dokazuje, že umělé inteligence s nimi zatím nedokážou držet krok.
Dva v současnosti nejvýznamnější modely umělé inteligence, Copilot a ChatGPT, čelily výzvě, která vypadala, že bude snadná: hra proti „Video Chess“ na Atari 2600, hře z roku 1979, která zabírala pouhé 4 KB. Výsledkem byla k překvapení mnohých potupná porážka.
Tento příběh sdílel na síti Linkedin inženýr Citrix Caruso, který nám minulý měsíc předvedl podobný test, jen s ChatGPT. Nyní se zdá, že mu chtěl dát druhou šanci. Navzdory tomu, že nejmodernější umělá inteligence může mít za sebou spoustu složitostí, stejně jako velkou schopnost zpracovávat jazyk, může ji překonat soupeř z doby před 50 lety.
Tato výzva začala, když se chatbot OpenAI v konverzaci s ChatGPT pochlubil, že je „sám o sobě silným hráčem a snadno porazí video šachy od Atari“. Zaujatý Caruso se rozhodl toto tvrzení otestovat a použil emulátor Atari ke spuštění šachové hry. A tady hra začala.
Výsledek byl zklamáním. Během devadesátiminutového souboje na úrovni začátečníka ChatGPT nejenže pletl figurky, ale neustále ztrácel přehled o tom, jak se figurky na šachovnici nacházejí. Porážka byla stejně jako v minulosti nevyhnutelná.
Caruso se zdaleka nevzdal a pomyslel si: Představte si, jak všem praskne hlava, když produkt Microsoftu porazí ChatGPT. Rozhodl se tedy experiment zopakovat s Copilotem. Umělá inteligence Microsoftu si také věřila a tvrdila, že na rozdíl od svého konkurenta dokáže desku skutečně sledovat. Skutečnost však byla zcela jiná. Caruso ji požádal, aby vykreslila šachovnici tak, jak si ji „představovala“, a obraz neodpovídal skutečné hře.
Aktualizace Copilotu byla rozpačitější než v případě ChatGPT. Podle Carusa:
„V sedmém tahu přišel o dva pěšce, jezdce a střelce – výměnou za jediného pěšce – a nyní mi nařizoval, abych umístil jeho dámu přímo před Atariho dámu, která má být v příštím tahu zajata.“
Tento druh experimentu, ačkoli je anekdotický, je silnou metaforou současného stavu umělé inteligence. Zatímco velké technologické společnosti nás bombardují zprávami o tom, jak umělá inteligence v budoucnu nahradí programátory, realita je zcela jiná. Není schopna překonat „umělou inteligenci“ starou téměř 50 let.
Při testování úloh, které vyžadují abstraktní logiku a trvalou paměť, tyto systémy žalostně selhávají. Jak Copilot, tak ChatGPT nemyslí ani se neučí žádným smysluplným způsobem. V podstatě se jedná o pokročilé systémy pro předvídání dalšího slova, které se má zobrazit, nebo pixelu, který se má vygenerovat v obrázku. Když ale mluvíte o pochopení pravidel a kontextu a chvíli je nosíte v hlavě, zdá se, že vše zapadne na své místo.
Takže… pokud umělá inteligence nedokáže rozeznat věž od střelce v osmibitové hře, proč bychom jí měli svěřovat naše osobní informace nebo rozhodovat o tom, co děláme? Jistě to může být velmi dobrý test, kterému mohou budoucí modely čelit, aby se zjistilo, jak se chovají.
Tento experiment navíc poukazuje na současná omezení umělé inteligence v úlohách, které vyžadují hluboké a kontinuální porozumění. Moderní umělé inteligence, jako jsou ChatGPT a Copilot, jsou sice schopny plnit složité úkoly ve specifických oblastech, jako je generování textu nebo asistence při programování, ale stále se zdaleka nevyrovnají lidské schopnosti porozumět měnícím se a složitým souvislostem a přizpůsobit se jim. Technologie umělé inteligence se stále vyvíjí, a i když se tyto neúspěchy mohou zdát významné, jsou zároveň příležitostí, jak v budoucnu zlepšit a vyvinout robustnější a schopnější systémy.