Nauka

ChatGPT i Gemini w Teście Ósmoklasisty: Zaskakujący Wynik Eksperymentu!

2025-07-10

Autor: Marek

AI na egzaminie podstawówki? Co się stało?

Wielu zastanawia się, co się dzieje, gdy sztuczna inteligencja staje przed wyzwaniem, które zdają przed nią uczniowie. W najnowszym eksperymencie zbadano, jak ChatGPT, Gemini i inne chatboty poradziły sobie z pytaniami z testu ósmoklasisty z matematyki. Niestety, wyniki były zaskakujące!

Eksperyment ujawnia słabe punkty AI

Podczas testu, który odbył się 10 lipca 2025 roku, wszystkie sztuczne inteligencje napotkały ten sam problem na jednym z zadań. Użytkownik Reddita postanowił sprawdzić, jak różne modele AI – w tym OpenAI o3, Gemini 2.5 Pro oraz Claude Sonnet 4 – radzą sobie z pytaniami egzaminacyjnymi. Okazało się, że nawet najbardziej zaawansowane boty nie udźwignęły tego jednego wyzwania.

Nieprzeniknione pytanie matematyczne

Wyniki były interesujące: ChatGPT i Gemini zdołały poprawnie odpowiedzieć na 14 z 15 pytań, podczas gdy Claude Sonnet 4 udzielił poprawnych odpowiedzi tylko na 12. Co więcej, wszystkie trzy chatboty zawiodły na tym samym, szczególnie problematycznym pytaniu. Internauci pytają, na czym dokładnie polegał problem.

Dlaczego ten eksperyment był ważny?

W komentarzach na Reddit użytkownicy zauważyli, że użycie terminu 'student' w kontekście ósmoklasisty może budzić kontrowersje, ponieważ w Polsce studenci to osoby uczęszczające na uczelnie wyższe. Sama analiza wyników zainspirowała do dyskusji na temat znaczenia takich testów oraz tego, jak AI interpretuje pytania, które choćby ludzie poradzić sobie z nimi.

Brak wniosków, które wywołują kontrowersje

Jednak najwięcej emocji budził brak konkretnych wniosków z przeprowadzonego badania. Użytkownik, który prowadził eksperyment, nie odpowiedział na pytania dotyczące tego, co wyniki mówią o zdolności AI oraz jak można je zastosować w edukacji. Wiele osób zastanawia się, jakie implikacje mają te wyniki w kontekście rozwoju sztucznej inteligencji.

Podsumowanie: Co oznaczają wyniki dla przyszłości AI?

Jedno jest pewne: eksperyment rzucił nowe światło na to, jak sztuczna inteligencja radzi sobie z zadaniami edukacyjnymi. Choć AI pokazała obiecujące wyniki, to jej porażka w obliczu jednego z pytań może sugerować, że wiele jeszcze przed nią! Co dalej? Jakie wyzwania stoi przed sztuczną inteligencją i jakie możliwości ona przyniesie? Śledźmy rozwój tej sytuacji!