3 Minuty
Przełom sztucznej inteligencji na Międzynarodowej Olimpiadzie Matematycznej
Międzynarodowa Olimpiada Matematyczna (IMO) to najważniejsze światowe wydarzenie dla młodych matematyków przed rozpoczęciem studiów. Elitarne drużyny uczniów z całego świata mierzą się w niej z sześcioma wyjątkowo trudnymi zadaniami matematycznymi. Tradycyjnie zaledwie około 8% uczestników zdobywa złoty medal, co świadczy o wybitnych umiejętnościach matematycznych wyróżnionych osób.
W przełomowym rozwoju, liderzy rozwiązań opartych na sztucznej inteligencji – OpenAI i Google – postanowili sprawdzić możliwości swoich najnowszych dużych modeli językowych (LLM), wystawiając je jako wirtualnych uczestników symulacji IMO 2025. Obie firmy poddały swoje zaawansowane modele AI rygorystycznej procedurze olimpiady: dwóch oddzielnych egzaminów po 4,5 godziny, bez dostępu do Internetu i z obowiązkiem przygotowywania rozwiązań w formie dowodów w języku naturalnym.
OpenAI wyznacza nowe standardy rozumowania matematycznego AI
W tym tygodniu OpenAI ogłosiło, że ich zaawansowany model rozumowania osiągnął wyniki porównywalne z najlepszymi uczestnikami IMO. Poprzez rozwiązywanie zadań olimpijskich w warunkach zbliżonych do rzeczywistego egzaminu, model OpenAI udowodnił, że potrafi radzić sobie z bardzo złożonymi zadaniami z zakresu dowodzenia twierdzeń i rozumowania matematycznego — obszarami, które do tej pory pozostawały poza zasięgiem nawet najbardziej zaawansowanej sztucznej inteligencji. Firma określiła ten sukces jako znaczący krok naprzód dla AI w matematyce.
Google Gemini Deep Think przekracza oczekiwania
Po ogłoszeniu OpenAI, Google ujawniło, że ich ulepszony model Gemini Deep Think również zdobył wynik na poziomie złotego medalu, rozwiązując pięć z sześciu zadań IMO. Najnowsza wersja tej technologii wykorzystuje przełomowe osiągnięcia w zakresie rozumowania sztucznej inteligencji oraz badania Google DeepMind nad równoległym myśleniem. W przeciwieństwie do tradycyjnych modeli AI, które analizują jedno rozwiązanie na raz, Gemini potrafi równocześnie rozważać wiele strategii rozwiązywania problemów, co znacznie zwiększa efektywność i dokładność.
Zespół Google DeepMind podkreśla, że nowy Gemini został przeszkolony przy użyciu innowacyjnych metod uczenia przez wzmacnianie, co pozwoliło AI na opanowanie wieloetapowego rozumowania oraz korzystanie z zaawansowanych zbiorów danych dotyczących dowodzenia twierdzeń i rozwiązywania złożonych problemów matematycznych. Co więcej, Gemini miał dostęp do starannie wyselekcjonowanego repozytorium wysokiej jakości rozwiązań matematycznych oraz specjalistycznych wskazówek dedykowanych zadaniom w stylu IMO.
Najważniejsze cechy i innowacje AI
- Myślenie równoległe: Jednoczesna analiza wielu rozwiązań skraca czas i zwiększa różnorodność strategii rozwiązywania zadań.
- Uczenie przez wzmacnianie: Nowoczesne techniki pozwalają na opanowanie wieloetapowego rozumowania matematycznego.
- Starannie dobrane dane treningowe: Dostęp do wysokiej klasy dowodów matematycznych i eksperckich podpowiedzi wzmacnia konkurencyjność modelu w zastosowaniach matematycznych.
AI kontra AI: Porównanie Google Gemini i OpenAI
Zarówno Google Gemini Deep Think, jak i zaawansowany model rozumowania OpenAI, udowodniły, że należą do światowej czołówki AI w rozwiązywaniu problemów matematycznych. Oba modele dorównują, a w niektórych aspektach nawet rywalizują z najlepszymi młodymi matematykami na świecie. Podczas gdy OpenAI prezentuje wszechstronne rozumowanie na poziomie olimpijskim, siłą Gemini są zmodernizowane tryby rozumowania, myślenie równoległe i zaawansowane techniki uczenia, co czyni ten model wyjątkowo skutecznym konkurentem także w innych testach akademickich.
Potencjalne zastosowania i wpływ na rynek
Wyniki najnowszych modeli LLM podczas tegorocznej symulacji IMO pokazują ogromny potencjał tych rozwiązań poza konkursami. Możliwe zastosowania obejmują automatyczne generowanie dowodów matematycznych, nowoczesne narzędzia edukacyjne czy wspomaganie profesjonalnych matematyków w pracy naukowej. Takie przełomy mogą przyspieszyć innowacje w badaniach naukowych, edukacji STEM oraz innych dziedzinach wykorzystujących sztuczną inteligencję w matematyce.
Co dalej z Google Gemini Deep Think?
Google zapowiedziało udostępnienie nowej wersji Gemini Deep Think wybranej grupie zaufanych testerów w najbliższym czasie. Po fazie testów model trafi do subskrybentów usługi Google AI Ultra, umożliwiając zaawansowanym użytkownikom i deweloperom wykorzystanie jego doskonałych zdolności rozwiązywania problemów matematycznych.
Ekscytująca rywalizacja między OpenAI a Google wyznacza nową erę przełomów w dziedzinie matematyki wspieranej przez sztuczną inteligencję oraz ustanawia złoty standard dla przyszłych modeli AI.
Źródło: neowin

Komentarze