Technológia

Szenzációs Mesterséges Intelligencia Teszt: Az Iskolai Kompetenciamérések Eredményei Megdöbbentőek!

2025-03-15

Szerző: Ádám

Az utóbbi hetekben a sajtó a magyar iskolai kompetenciamérések várható megváltoztatásáról számolt be, azonban a belügyminisztérium tisztázta, hogy Pintér Sándor rendelettervezete még mindig tervezet stádiumnál tart. Az eddig beérkezett észrevételek a mérések osztályozásával kapcsolatban megakadályozták a gyors változtatásokat, így továbbra is folytatódnak az egyeztetések.

Különösen izgalmas fejlemény, hogy a Peak Fintech Solutions Zrt. legújabb kutatásában a mesterséges intelligencia (AI) modellek teljesítményét vizsgálták a magyar oktatási környezetben, a cél a legnagyobb AI modellek, mint az OpenAI GPT-4, a Google Gemini Flash 2.0 és más, neves modellek teljesítőképességének felmérése volt az iskolai kompetenciamérések során. Ez a kutatás azt is megmutatta, vajon a fejlődő AI modellek valóban képesek-e alkalmazni tudásukat a mindennapi helyzetekben, vagy csupán tesztkörnyezetben működnek jól.

Sajtos István, a Peak innovációs részlegének vezetője szerint a mesterséges intelligencia nem csodaszer, és mélyen lelkiismeretes kihívások elé néz, ha valódi alkalmazásokhoz kerül. A kutatás során tesztelték a legnépszerűbb AI modellek képességeit valódi oktatási kontextusban, és az eredmények sok meglepetést hoztak. Az AI-k teljesítménye több benchmark program segítségével került objektív kiértékelésre.

A kutatás során megállapították, hogy a szövegértési feladatokat a legtöbb AI modell jól, akár 90%-os eredménnyel is megoldotta, míg a matematikai feladatokban jelentős nehézségekkel küzdöttek. Sajtos elmondása szerint a képek feldolgozása a mesterséges intelligencia számára különösen problémásnak bizonyult.

A Peak célja, hogy feltárja, hogyan teljesítenek az AI modellek a labor környezeten kívül, hiszen az életből vett példák általában összetettebbek, és a hosszú távú feladatok megoldása komoly kihívásokat tartogat. Sajtos hangsúlyozta, hogy míg az OpenAI modellek kiemelkedtek a tesztelt AI-k közül, a DeepSeek és hasonló modellek nem teljesítettek jól, mivel matematikai feladatokban gyengébben szerepeltek.

A mesterséges intelligencia vezette fejlesztések pontossága és használhatósága tehát nem csupán elméleti kérdés, hiszen a kutatás során kiderült, hogy a betanítás és a gyakorlati feldolgozás jelentős hatással van a modellek teljesítményére. Emellett önálló szupervízor modell is kidolgozásra került, amely még tovább fokozhatja a mesterséges intelligenciák működését az integrált munkafolyamatokban.

A kutatás során feltárt hiányosságok és erősségek rávilágítanak arra, hogy a mesterséges intelligencia nem helyettesíti, hanem kiegészíti az emberi intelligenciát. Az AI nagy lehetőségeket rejt magában, ami a jövő oktatási rendszerét is alapvetően átformálhatja.