Miért gondolkodik kínaiul az OpenAI új mesterséges intelligenciája? A tudósok fürkészik a titkokat!
2025-01-25
Szerző: Ádám
Egyre több felhasználói beszámoló érkezik arról, hogy az OpenAI legújabb mesterséges intelligenciája, az o1, kínai, perzsa és más nyelveken gondolkodik, függetlenül attól, hogy angolul kérdezik. A híres modell csupán néhány hónapja debütált, és a nagyközönség 2024 decemberétől használhatja. Az o1 a cég megfogalmazása szerint egy érvelő modell, amely válaszait lépésről lépésre alakítja ki.
Például, egy felhasználó a kérdést tette fel: „Hány r betű van az eper szóban?” A válaszadás során a mesterséges intelligencia kínai nyelvre váltott, mielőtt angolul válaszolt volna. Más esetekben, amikor nehezebb, szintetikus biológiával kapcsolatos kérdéseket tettek fel, szintén kínaiul reagált. Az OpenAI egyelőre nem kommentálta ezt a furcsa jelenséget, így a szakértők az X közösségi platformon spekulálnak a háttérben meghúzódó okokkal kapcsolatban. A legvalószínűbb magyarázat szerint ez a modell betanításának eredménye.
A Google DeepMind kutatója, Ted Xiao, rámutatott arra, hogy a kínai nyelvi hatások a modell betanításához használt adathalmazok címkézési folyamatából erednek. Az OpenAI és az Anthropic harmadik fél által biztosított címkézési szolgáltatásokat használnak PhD-szintű tudományos, matematikai és programozási érvelési adatoknál. A szakértelem és a költségek miatt számos ilyen szolgáltató Kínában működik.
„Az annotációk, címkék és kulcsszavak segítik a gépi intelligenciát az adatok feldolgozásában. Például egy ábrán ezek írják le a képen látható személyeket, dolgokat és helyeket.” – tette hozzá Xiao.
A szakértők különbséget tesznek a politikai vagy gazdasági vetélkedés témái között és annak lehetősége között, hogy Kína egy konkurens nagyhatalomként kerülne az amerikai fejlesztésű mesterséges intelligenciák élvonalába. Kína az informatika terén korábban erős pozícióval rendelkezett, de az informatikai szektorban tapasztalható feszültségek és a szigorú cenzúra miatt lemaradt az OpenAI előretörése idején. Az utóbbi időszakban azonban már jelentkeznek az újbóli előretörés jelei, hiszen a Hangcsouban található Deep Seek bejelentette, hogy nyílt forráskódú modelljük, az R1, az o1 szintjén teljesít.
A mesterséges intelligencia különböző nyelveken való gondolkodásával kapcsolatban nem minden szakértő egyetért azzal, hogy a kínai címkézés a modellel összefüggésben van. Matthew Guzdial, az Albertai Egyetem adjunktusa a TechCrunchnak elmondta: „A modell nem tudja, mi egy nyelv, és mi a különbség a nyelvek között. Számára minden csak szöveg.”
Tiezhen Wang, a Hugging Face mérnöke hangsúlyozta, hogy az o1 viselkedése a szöveg természetéből fakad. A nyelvi modellek a szöveget úgynevezett tokenekként kezelik, amelyek egységek, lehetnek teljes szavak, szótagsorozatok vagy egyes betűk. Ez a felszeletelés segíti a rendszert abban, hogy hatékonyan megragadja a logikai kapcsolatok követését az adott szövegben.
Wang szerint, hasonlóan ahhoz, ahogy ő is kínaiul számol és angolul gondolkodik, a gép is a működési hatékonysága érdekében vált nyelvet. Luca Soldaini, az Allen Institute for AI munkatársa, hangsúlyozta, hogy a mesterséges intelligiencia viselkedésének okát nem ismerjük, mivel a mesterséges intelligenciák működése általában nem átlátható. „Ez az eset is azt mutatja, hogy a mesterségesintelligencia rendszerek fejlesztésének átláthatóvá kell válnia.”
Ahogy a mesterséges intelligencia fejlődik, a nyelvi sokszínűség és a globális interakciók mind nagyobb szerepet kapnak. A jövő kihívása az lesz, hogy a technológia minél inkluzívabbá váljon, és úgy tűnik, a kínai nyelvi hatás már elkezdődött.