
Tech: Megdöbbentő új fejlemény a mesterséges intelligenciában – a GPT-4.5 háromszor jobban csapta be az embereket!
2025-04-03
Szerző: Levente
Csak néhány évvel ezelőtt egyszerű volt megkülönböztetni, hogy egy csevegésben kivel beszélünk – emberrel vagy géppel. Manapság ez már egyáltalán nem ennyire egyértelmű. Az OpenAI által kifejlesztett legújabb mesterséges intelligencia modell, a GPT-4.5, a legújabb Turing-teszt frissített verziójában a tesztelők háromszor annyira gondolták az AI-ról, hogy ember, mint ahogyan arról, hogy egy robot írja az üzenetet.
A Turing-teszt célja
A Turing-teszt célja, hogy megmérje a gépi intelligenciát, és hogy a felhasználók képesek-e észlelni, hogy egy géppel beszélgetnek. A Kaliforniai Egyetem kutatói 300 résztvevő bevonásával végeztek kísérletet, amely során a résztvevőknek egyszerre kellett beszélgetniük az AI-val és egy valódi személlyel, és meg kellett határozniuk, ki melyik üzenetet küldte. A GPT-4.5 teljesítménye hétköznapi, fiatal felnőtt popkultúrába illeszkedő stílusban is meggyőző volt, hiszen az esetek 73%-ában elhitette a felhasználókkal, hogy ő egy emberi beszélgetőpartner.
Ez a teljesítmény messze meghaladja a 50%-os esélyt, amely a Turing-teszt sikerességi küszöbét jelenti. Érdekes módon a nem AI, hanem emberi beszélgetőtársak az esetekben kevésbé voltak sikeresek abban, hogy az emberek elhiggyék, ők emberek.
Mesterséges intelligenciák tesztelése
A kutatás során más mesterséges intelligenciákat is teszteltek, mint például a Meta LLaMA 3-at, az OpenAI legújabb GPT-4o-ját, valamint az ELIZA-t, a világ egyik legismertebb régi chatbotját. Meglepetés, hogy azok a mesterséges intelligenciák, amelyeknél nem határozták meg a használható kommunikációs jelleget, sokkal gyengébben teljesítettek. A GPT-4.5 pontossága 36%-ra csökkent, míg a GPT-4o csupán 21%-ot ért el.
Következtetések
Fontos megjegyezni, hogy ez nem az első alkalom, amikor a kutatók a Turing-tesztnek vetik alá a mesterséges intelligenciát, viszont ezek az eredmények egyértelműen azt mutatják, hogy noha a nyelvi modellek nem „gondolkodnak” úgy, mint az emberek, képesek egyre inkább emberi viselkedést utánzó párbeszédeket folytatni rövid és kötetlen beszélgetésekben.
A kutatók hangsúlyozzák, hogy a mesterséges intelligencia Turing-tesztben elért sikere nem jelenti azt, hogy a modell olyan értelmes, mint az emberek. Azonban a meggyőző teljesítményük figyelmeztet arra, hogy sokkal körültekintőbbnek kell lennünk, amikor ismeretlenekkel kezdünk el beszélgetni. Senki sem szeretne rájönni, hogy tulajdonképpen egy géppel beszélgetett, amikor az emberi empátia és interakciók érdekében kerestek támogatást!