Araştırma yapay zekanın temel zayıflığını ortaya çıkardı: Yüzde 26 doğru okuyabildi Sözcü Gazetesi
SonTurkHaber.com, Sozcu kaynağından alınan verilere dayanarak açıklama yapıyor.
Uluslararası Temsillerin Öğrenimi Konferansı (ICLR) 2025’te sunulan ve 18 Mart’ta arXiv platformunda yayımlanan araştırma, yapay zekanın analog saatleri ve takvim tarihlerini okuma konusunda şaşırtıcı derecede başarısız olduğunu gösterdi. Bulgular henüz hakem değerlendirmesinden geçmedi.
Araştırmayı yürüten Edinburgh Üniversitesi’nden Rohit Saxena, “Çoğu insan erken yaşta saat okumayı ve takvim kullanmayı öğrenir. Bu çalışma, AI sistemlerinin gerçek dünyadaki zamana duyarlı görevlerde ne kadar eksik olduğunu ortaya koyuyor” dedi.
Çalışma kapsamında Meta'nın Llama 3.2-Vision, Anthropic'in Claude-3.5 Sonnet, Google'ın Gemini 2.0 ve OpenAI'ın GPT-4o modellerine özel hazırlanmış saat ve takvim görselleri sunuldu. Ancak modeller, saatleri yalnızca yüzde 38,7 oranında, takvim tarihlerini ise sadece yüzde 26,3 oranında doğru okuyabildi.
Saxena, bu başarısızlığın temelinde yapay zekanın görsel algılama ve mekânsal akıl yürütme konularındaki yetersizliğinin yattığını belirtiyor. Saxena, “Analog saat okumak sadece görüntü tanıma değil; açı ölçmek, örtüşen akrep-yelkovanı ayırt etmek ve farklı tasarımlarla başa çıkmak demektir” diyor.

Takvim hesaplamaları da benzer şekilde zayıf sonuçlar verdi. Örneğin "Yılın 153. günü hangi güne denk gelir?" gibi sorularda AI sistemlerinin yanıtları çoğunlukla hatalıydı. Çünkü bu tür sorular, yalnızca bilgiye değil, tutarlı mantıksal işlem becerisine dayanıyor.
Saxena, geleneksel bilgisayarlar için aritmetiğin basit olduğunu ancak büyük dil modellerinin algoritmik olarak işlem yapmadığını, sadece örüntülere göre tahmin yürüttüğünü vurguluyor. Bu da tutarlı ve kural bazlı düşünme gerektiren alanlarda zayıf performansa yol açıyor.
Sonuç olarak araştırma, AI sistemlerinin hala insan benzeri sezgi, soyutlama ve mantıkla hareket edemediğini ve özellikle zaman algısı gibi temel görevlerde insana ihtiyaç duyulduğunu açıkça ortaya koyuyor.


