Nauka

Testy AI, które przerastają technologie! Oto nowa inicjatywa Polaka

2025-08-27

Autor: Ewa

Rewolucja w testach AI

Ostatnie półrocze przyniosło spektakularny rozwój technologii sztucznej inteligencji. Laboratoria takie jak Google DeepMind i OpenAI stworzyły modele, które bez trudu radzą sobie z zadaniami matematycznymi na poziomie matury. Wskutek tego dotychczasowe testy oceniające zdolności matematyczne stały się przestarzałe. Świetnym pomysłem okazało się wprowadzenie nowego wyzwania – projektu FrontierMath, przy którego tworzeniu kluczową rolę odegrał dr Naskręcki z Uniwersytetu Adama Mickiewicza w Poznaniu.

Jak stworzyć zagadki, które zadziwią AI?

Dr Naskręcki był odpowiedzialny za stworzenie najtrudniejszego poziomu testu – Tier 4. To, co wyróżnia te zagadnienia, to ich ekstremalna trudność – obecne modele AI potrafią rozwiązać jedynie cztery z pięćdziesięciu przygotowanych problemów!

"Wymagałem, żeby moje zadania były tak skomplikowane, by AI nie mogła ich przypadkiem zgadnąć. Całe to wyzwanie opierało się na mojej długoletniej pracy naukowej, obejmującej 13 stron gęstego tekstu matematycznego" - wyjaśniał w rozmowie z PAP.

Jak powstał egzamin dla geniuszy?

Trzydziestu ekspertów z całego świata zebrało się w Berkeley, aby wspólnie opracować nowe, nieosiągalne dla AI problemy. Zespół testował fragmenty zadań na najpotężniejszych modelach AI, a ich celem było jeszcze bardziej zwiększenie trudności. Niektóre pomysły zadań zostały odrzucone, ponieważ AI zbyt szybko łapało dobry trop.

O przyszłości testowania AI

W chwili obecnej, laboratoria, które pragną przetestować swoje modele, mogą skorzystać z infrastruktury Epoch AI, gdzie w kontrolowanych warunkach przeprowadzają testy. W każdym teście AI ma wyznaczone limity czasowe oraz ilość tokenów, które może wykorzystać.

Jak przewiduje dr Naskręcki, za 2-3 lata AI może "przełamać" średnią w tych testach, odpowiadając poprawnie na większość zadań. "Wtedy mówilibyśmy o modelu, który naprawdę rozumie matematykę" - dodaje naukowiec.

Bariera między AI a ludźmi

Choć AI staje się coraz bardziej zaawansowana, dr Naskręcki podkreśla, że maszyny wciąż nie potrafią tworzyć nowych koncepcji. "Żaden model AI nie rozwiąże hipotezy Riemanna. Jeśli AI poradzi sobie z naszymi zadaniami, to ostatnią bastionem tajemnicy matematyki będą szalone, nowatorskie pomysły" - twierdzi.

Nowa rzeczywistość pracy i nauczania

Rozwój AI zmusza nas do przewartościowania spojrzenia na edukację i pracę. "Stary model nauczania potrzebuje ważnych zmian – obecnie potrzebujemy myślicieli, którzy podejmują ryzyko i tworzą coś nowego" - mówi dr Naskręcki.

Jego zdaniem, kluczowe staje się rozwijanie tzw. inteligencji płynnej – umiejętności kreatywnego rozwiązywania problemów, co pozostaje wciąż poza możliwościami maszyn.

Nasz talent w obliczu AI

Unikalne ludzkie doświadczenia – takie jak smakowanie sztuki czy czytanie książek – pozostają poza zasięgiem AI. Manewrując w nieoczywistych dziedzinach, możemy generować oryginalne koncepcje i pytania, które będą naszą przewagą w nowej erze technologii.

W nowym świecie ogromną wartością stanie się nie tyle umiejętność rutynowego wykonywania zadań, co zdolność do twórczego myślenia i stawiania odważnych pytań. To właśnie w tych obszarach zawód naukowca zyska na znaczeniu na nowo!