Poprvé v historii vyřešila umělá inteligence problémy na Mezinárodní matematické olympiádě a vyrovnala se nejlepším lidem na světě.
OpenAI dosáhla nového milníku ve své ambici vyvinout „obecnou umělou inteligenci“. Její experimentální a dosud nepojmenovaný model jazyka a uvažování ukázal výkon odpovídající zlaté medaili na Mezinárodní matematické olympiádě (IMO), a to na základě řešení úloh z minulých ročníků.
IMO je považována za nejprestižnější matematickou soutěž na světě, která je vyhrazena pro nejlepší středoškolské studenty: země z celého světa každoročně vysílají týmy až šesti mladých zázraků, aby řešily pokročilé matematické problémy – algebru, geometrii, teorii čísel a kombinatoriku – které vyžadují nejen technické dovednosti, ale také pozoruhodnou úroveň kreativity.
Model OpenAI vyřešil pět ze šesti úloh oficiální zkoušky a získal 35 ze 42 možných bodů, což mu stačilo k získání prestižní zlaté medaile. Ve skutečnosti takového ocenění dosáhlo pouze 10 % z 630 lidských účastníků.
Podmínky lidské soutěže: Žádné zkratky
Umělá inteligence byla také testována za stejných podmínek jako lidští účastníci: dvě 4,5hodinová sezení, bez přístupu k internetu nebo externím nástrojům a psaní řešení v přirozeném jazyce. Modelová řešení (která jsou k dispozici na GitHubu) byla anonymně hodnocena bývalými medailisty IMO. Slovy Sebastiena Bubecka, výzkumníka OpenAI:
„Aby bylo jasno: stroj na předpovídání slov – protože to je to, co to je – právě vytvořil skutečné tvůrčí ukázky obtížných a nových matematických problémů, a to na úrovni, které dosáhla jen hrstka lidských zázraků.“
Obecnost, ne specializace: Klíč k pokroku
Nejpřekvapivější není jen výsledek, ale i způsob, jakým byl dosažen. Na rozdíl od předchozích modelů, jako je AlphaGeometry společnosti DeepMind – navržený speciálně pro řešení geometrických problémů – je model OpenAI univerzálním jazykovým systémem, který v žádném okamžiku neprošel specifickým školením pro IMO.
Podle Alexandra Weie, vedoucího projektu, bylo jeho výkonu dosaženo díky novým technikám v oblasti posilování učení a výpočetního škálování v čase testů, aniž by bylo nutné specializované ladění.
„Tento model přemýšlí celé hodiny. Nedělá to rychle, ale dělá to dobře,“ vysvětlil Noam Brown, další člen týmu. Klíčem se zdá být kombinace zdlouhavého uvažování, logické struktury a schopnosti narativní syntézy.
To kontrastuje s jinými jazykovými modely, včetně samotného GPT-4 a konkurentů, jako jsou Gemini 2.5 Pro, DeepSeek-R1 nebo Grok-4, které podle údajů z platformy MathArena nedokázaly v podobných testech dosáhnout ani minimálního skóre pro bronzovou medaili.
Jak by mohla vypadat obecná umělá inteligence?
Generální ředitel OpenAI Sam Altman to pohotově označil za „významný ukazatel toho, jak daleko se AI za poslední desetiletí dostala“. Pro OpenAI tento výkon představuje nejen krok vpřed v matematickém mistrovství, ale i zásadní pokrok na cestě k obecné umělé inteligenci (AGI).
Z tohoto důvodu společnost dala jasně najevo, že tato verze modelu nebude v nejbližší době uvolněna pro veřejnost, ačkoli potvrdila blížící se příchod GPT-5, který tuto pokročilou schopnost ještě obsahovat nebude. Společnost zdůrazňuje, že se jedná o výzkumný experiment a že bude trvat několik měsíců, než se začne uvažovat o komerční verzi modelu s těmito schopnostmi.
Přesto tvrdí, že výsledek byl natolik překvapivý, že ani v rámci OpenAI neočekávali výkon tohoto kalibru tak brzy.
Konkurence nespí
Kolují dokonce zvěsti, že DeepMind letos také získal zlatou medaili, ale žádné oficiální oznámení zatím nepadlo. Každopádně víme, že v roce 2024 systém AlphaGeometry společnosti DeepMind dosáhl výkonu odpovídajícího zlaté medaili, když vyřešil čtyři ze šesti problémů.
Na rozdíl od OpenAI se DeepMind vydal specializovanější cestou a při řešení matematických problémů kombinuje umělou inteligenci s klasickými vyhledávacími algoritmy. Nicméně univerzální systém Gemini 2.5 Pro získal ve stejných testech pouhých 13 bodů a jeho odpovědi byly plné logických chyb a neúplných argumentů.
A co si myslí skeptici?
Dokonce i známí kritici optimismu v oblasti umělé inteligence, jako je vědec Gary Marcus, označili úspěch modelu OpenAI za „skutečně působivý“. Vyvolal však také několik klíčových otázek: Jaké byly výpočetní náklady na jeden problém? Jak moc je tento výkon reprodukovatelný? A co je možná nejdůležitější, k jakému účelu to slouží, kromě velkolepé demonstrace? Přesto uznal, že to nemůžeme ignorovat.

Zdroj: Youtube.com
Budoucnost umělé inteligence v matematice i mimo ni
Úspěch OpenAI na IMO je nejen milníkem v oblasti umělé inteligence, ale vyvolává také otázky o budoucnosti matematického vzdělávání a práce. S rozvojem modelů umělé inteligence schopných řešit složité problémy vyvstává otázka, jak by tyto technologie mohly být začleněny do výuky, aby se zlepšilo učení a výuka matematiky.
Schopnost umělé inteligence řešit složité matematické problémy by navíc mohla mít významné důsledky pro další obory, které jsou na matematice závislé, jako jsou fyzika, inženýrství a ekonomie. Tyto pokroky by mohly urychlit tempo vědeckých a technologických objevů a otevřít nové možnosti pro inovace.
Je však také důležité zvážit etické a sociální důsledky tohoto vývoje. Schopnost umělé inteligence překonat člověka ve složitých úlohách vyvolává otázky o budoucnosti práce a o potřebě zajistit, aby byly přínosy umělé inteligence spravedlivě rozděleny.
Závěrem lze říci, že úspěch OpenAI na IMO je důkazem potenciálu umělé inteligence změnit naše chápání a používání matematiky. Při dalším zkoumání možností umělé inteligence je zásadní zvážit příležitosti i výzvy, které tento pokrok přináší.