Felrobbant az internet péntek este: Sam Altmanék bemutatták az o3 modellt!
2024-12-22
Szerző: Attila
Az OpenAI, a mesterséges általános intelligencia (AGI) határvonalán, pénteken bemutatta új modelljét, az o3-t. Ez a forradalmi újítás az emberi intelligenciához hasonló teljesítményt nyújtott az általános intelligenciát vizsgáló AI-teszten, felülmúlva bármely korábbi modellt.
Az o3 az o1 modell második generációja, amely az óriási sikerű GPT-4o utódja. Az új modellek jelentősen javították a válaszaik „átgondolását”, így a nehezebb matematikai, tudományos és programozási feladatok megoldása sem okoz nekik problémát. Az AGI kapcsán Sam Altman, az OpenAI vezérigazgatója megjegyezte: "Ezek az AI-fejlesztések a következő fázis kezdetét jelentik, ahol a modellek egyre komplexebb feladatokra is képesek lesznek."
A bemutató részeként Altman elmondta, hogy az o3 modellcsalád két változatot fog tartalmazni: a legfejlettebb o3-at, és az olcsóbban futtatható o3 mini-t. A minit január végén tervezik elérhetővé tenni, a teljes o3 modellel pedig nem sokkal később lehet számolni.
Az o3 bemutatója a "12 Days of OpenAI" nevű esemény keretében zajlott, amely a cég által december elején indított bejelentéssorozat része. A korábbi napokban megjelent a havi 200 dolláros ChatGPT Pro előfizetés és a Sora videógenerátor.
Azonban nem mindenki örült az új bejelentésnek. A Google is frissítette AI-portfólióját a December közepén elérhetővé tett Gemini 2.0 chatbotjával, ami szintén komoly riválisa lett az OpenAI-nak. A Redditen már hangosan vitatkoznak arról, hogy a Google máris elhúzta az o3 elől a győzelmet. Altman azonban biztosította a közönséget, hogy jövő héten jelentős bejelentésre készülnek.
A bemutatón Mark Chen, az OpenAI kutatási igazgatója prezentálta az o3 teljesítményét, amely máris kiemelkedő eredményeket ért el. Alternatív tesztelési módszereken keresztül Chen bemutatta, hogy az o3 40%-kal jobb teljesítményt nyújt az o1-nél, bizonyítva, hogy képes lekörözni a legjobbat a kódolási versenyeken is.
Egy különösen figyelemfelkeltő teszt során az o3 25,2%-os teljesítményt ért el az EpochAI Frontier Math teszten, míg az eddigi legjobbak mindössze 2%-ra voltak képesek. A teszt újabb bizonyítékot ad az o3 modell kiemelkedő képességeire, melyek túlmutatnak az AI eddigi határain.
Az ARC-AGI teszt során a 75,7%-os normál, illetve 87,5%-os maximális számítási idővel a tesztelők megerősítették, hogy a mesterséges intelligencia már túllépte az emberi teljesítmény határait. A teszt alapítója, Greg Kamradt azt mondta: "Soha nem teszteltünk még olyan modellt, amelyik erre képes lenne."
A szakértők között is felkeltette az érdeklődést az o3 teljesítménye. Ethan Mollick, a Pennsylvaniai Egyetem professzora hangsúlyozta, hogy az OpenAI valóban nívós tesztelésen ment keresztül, míg Rowan Cheung, a Rundown AI hírlevél szerkesztője áttörésnek nevezte az o3-at, jövendölve, hogy jelentősen lekörözi az előző modelleket.
Az o3 mini modell január végén érkezik, amely az OpenAI szerint gyorsabb válaszidővel és sokféle működési móddal rendelkezik. Altman elmondta, hogy "lenyűgöző növekedést látunk az ár-érték arányban a teljesítmény tekintetében az o1-hez képest."
Mivel az AI jövője már most formálódik, a társadalmi, gazdasági és politikai hatások, amelyek az o3 és utódai bevezetéséből következhetnek, a következő hónapokban és években egyre inkább felnagyítják ezt az izgalmas területet.