Az OpenAI új mesterséges intelligenciája: Miért gondolkodik kínaiul?
2025-01-25
Szerző: Attila
Az utóbbi időben egyre több felhasználói visszajelzés érkezik arról, hogy az OpenAI legújabb mesterséges intelligenciája, az o1, úgy tűnik, hogy nemcsak angolul, hanem kínaiul, perzsául és más nyelveken is képes gondolkodni, függetlenül attól, hogy milyen nyelven kérdeznek tőle. Az o1 a cég meghatározása szerint egy érvelő modell, amely a válaszait lépésről lépésre gondolja át. A modell a nagyközönség számára 2024 decemberétől válik elérhetővé.
Egy friss beszámoló szerint, amikor a felhasználó kérdést tett fel például azzal a szöveggel: „Hány r betű van az eper szóban?”, a mesterséges intelligencia váratlanul kínai nyelvre váltott, mielőtt angolul válaszolt volna. Egy másik esetben, amikor egy bonyolultabb, szintetikus biológiával kapcsolatos kérdést tettek fel, a modell szintén kínai nyelvű gondolkodásra váltott. Az OpenAI eddig nem adott magyarázatot erre a jelenségre, és a szakértők is csak találgatnak az okokat illetően. A legvalószínűbb magyarázat a modell betanításához használt adathalmazon keresztül keresendő.
A Google DeepMind kutatója, Ted Xiao szerint a kínai nyelvi hatás az OpenAI által használt adatbázisok címkézéséből ered. Az OpenAI és az Anthropic ugyanis harmadik fél nyújtotta címkézési szolgáltatásokat igénybe vett a PhD-szintű tudományos, matematikai és programozási érvelési adatokhoz. Kínában sok ilyen szolgáltató működik a költségeik és szakértelmük miatt.
A szakértők úgy vélik, hogy a különböző nyelveken megjelenő gondolkodás nemcsak a kínai adatok miatt lehet, hanem más nyelvek, mint például hindi, thai vagy francia is megjelenhetnek a válaszok során. A modell nem képes érzékelni, hogy mi a különbség a különböző nyelvek között. Számára a szöveg csupán szöveg, nem nyelvi kódok összessége.
Matthew Guzdial, az Albertai Egyetem adjunktusa szerint a szöveg természete és a tokenek kezelése játszik szerepet abban, hogy a modell miért vált más nyelvekre, ha úgy tűnik, hogy az adott kontextushoz az jobban megfelel. A Hugging Face mérnöke, Tiezhen Wang szerint a felbontás és a nyelvi modellek működése segíti a hatékony elemzést és értelmezést.
A mesterséges intelligencia fejlődése és működése több kihívást is rejt magában. Luca Soldaini, a Microsoft által 2014-ben alapított Allen Institute for AI munkatársa hangsúlyozta, hogy a mesterséges intelligenciák működése általában nem áttekinthető, amit a közösségi aggályok és a rendszer transzparenciájának szükségessége zárják le. A jövőbeli fejlesztések során elkerülhetetlenül fontos, hogy a mesterséges intelligencia rendszerek átláthatóbbá váljanak, hogy a felhasználók bízhassanak a válaszokban és a döntésekben.