
Apple'dan Şok Araştırma: OpenAI ve DeepSeek Sandığımız Kadar Zeki Değil Mi?
2025-06-10
Yazar: Hatice
Yapay Zeka Yağmurunda Çürükler Ortaya Çıktı
Apple'ın yeni araştırması, OpenAI ve DeepSeek gibi dev teknoloji firmalarının geliştirdiği yapay zeka modellerinin, belirli karmaşıklık seviyelerini aştıklarında tamamen başarısız olabileceğini gösterdi. Bu durum, birçok kişinin inandığı yapay zeka devrinin temellerini sarsabilir.
Gerçekten Zeki Misin?
Meta'nın Claude'u, OpenAI'nin o3 ve DeepSeek'in R1 gibi yapay zeka modelleri, geleneksel büyük dil modellerinden (LLM) daha fazla işlem gücü ve zaman harcıyor. Ancak bu gelişmiş sistemlerin, insan zihni ile yarışan yapay zeka modelleri (AGI) olduğuna dair iddialar artık sorgulanıyor.
Karmaşık Görevlerde Tamamen Çökmek!
Apple'ın araştırmacıları, bu yapay zeka sistemlerinin genelleştirilmiş düşünme yeteneğinden yoksun olduğunu belirtiyor. Özellikle görevler kritik bir karmaşıklık eşiklerini aştığında, bu sistemlerin performansı çarpıcı bir şekilde düşüyor.
Araştırma raporunda, çeşitli bulmacalar üzerindeki testler, bu yapay zeka modellerinin karmaşık görevlerde ciddi doğruluk kaybına uğradığını ortaya koyuyor.
Halüsinasyon Krizi!
Yapay zeka, 'düşünce zinciri' adı verilen bir süreç kullanarak çok adımlı yanıtlar üretmeye çalışıyor. Ancak bu süreç, gerçek anlayış yerine istatistiksel tahminlere dayanıyor ve bu da yapay zekaların yanlış bilgi vermesi ve potansiyel olarak zararlı önerilerde bulunma riskini artırıyor.
Dört Klasik Bulmaca Deneyi
Apple’ın araştırmacıları, OpenAI’nin o1 ve o3, DeepSeek R1 gibi botlara, nehir geçişi, dama tahtası atlama, blok istifleme ve Hanoi Kulesi gibi dört klasik bulmaca denedi. Araştırma, basit görevlerde genel modellerin avantaj sağladığını, ancak daha karmaşık bulmacalarda her iki modelin de performansının sıfıra düştüğünü ortaya koydu.
Karmaşık Görevlerde Düşen Performans!
Kıyaslamalara göre, karmaşıklık belli bir seviyeyi aştığında, yapay zeka modellerinin işleme koydukları 'token' sayısının azaldığı gözlemlendi. Bu da onların daha karmaşık görevleri sürdürme yetilerinin ciddi bir şekilde kısıtlı olduğunu gösteriyor.