Yapay Zekâ Ofis İşlerinde Neden Yetersiz Kalıyor?
Son dönemde yapay zekânın birçok mesleği ortadan kaldıracağı yönündeki tartışmalar yoğunlaşmışken, Mercor isimli firmanın yayımladığı yeni araştırma bu beklentileri sorgulatacak sonuçlar ortaya koydu. Araştırmaya göre, yapay zekâ modelleri bilgi gerektiren ofis işlerinde insanların yerini alacak seviyeye henüz ulaşmış değil.
APEX-Agents Testi ve Gerçek Dünya Senaryoları
Mercor tarafından geliştirilen APEX-Agents isimli kıyaslama testi, yapay zekâ modellerini alışılagelmiş testlerden farklı bir şekilde değerlendirdi. Testte avukatlar, danışmanlar ve bankacılardan gelen gerçek sorular kullanıldı. Modellerden, farklı bilgi türleri arasında geçiş yapmayı gerektiren, çok adımlı ve eksiksiz görevler gerçekleştirmeleri istendi. Bu yaklaşım, yapay zekânın gerçek iş ortamlarındaki performansını daha doğru bir şekilde ölçmeyi amaçladı.
Şaşırtıcı Düşük Başarı Oranları
Araştırmanın sonuçları, yapay zekâ teknolojisinin mevcut durumunu gözler önüne serdi. Piyasadaki en gelişmiş modeller bile testte %25 doğruluk oranını aşamadı. Google’ın Gemini modeli %24 oranla en iyi performansı gösterirken, GPT-5.2 %23 ile onu takip etti. Diğer modellerde ise ortalama başarı oranı sadece %10 civarında kaldı. Bu sonuçlar, yapay zekânın karmaşık ofis işlerinde insan seviyesine ulaşmak için hala uzun bir yol katetmesi gerektiğini ortaya koydu.
Karmaşıklıkla Başa Çıkamama Sorunu
Mercor yetkilileri yaptıkları açıklamada, gerçek dünyada cevapların altın tepside sunulmadığını ve yapay zekânın bu tarz konularda hala yeterli seviyede olmadığını vurguladı. Bir avukatın bir soruyu yanıtlamak için iş ortamındaki yazışmaları okuması, ilgili belgeleri incelemesi, tecrübelerini kullanması ve tüm bu bilgileri sentezlemesi gerekiyor. Ancak mevcut yapay zekâ modelleri bu karmaşık süreçlerle başa çıkmakta zorlanıyor.
Bağlam Değiştirme Zorluğu
Araştırmanın ortaya koyduğu bir diğer önemli bulgu, yapay zekâ modellerinin bağlam değiştirme konusundaki yetersizliği oldu. İnsanlar farklı bilgi kaynakları arasında kolayca geçiş yapabilirken, yapay zekâ modelleri dağınık kaynaklardan bilgi aramaya zorlandığında ya kafaları karışıyor, ya yanlış cevap veriyorlar ya da tamamen pes ediyorlar. Bu durum, özellikle çok yönlü düşünme ve analiz gerektiren ofis işlerinde yapay zekânın sınırlarını gösteriyor.
Gelecek Beklentileri ve Yol Haritası
Araştırma sonuçları, yapay zekânın ofis işlerinde insanların yerini alması için henüz erken olduğunu gösteriyor. Ancak bu durum, yapay zekâ teknolojisinin gelişiminin durduğu anlamına gelmiyor. Aksine, araştırma yapay zekâ geliştiricilerine hangi alanlarda iyileştirme yapmaları gerektiği konusunda önemli ipuçları sunuyor. Karmaşık problem çözme, bağlam anlama ve çok kaynaklı bilgi sentezi gibi alanlarda yapılacak geliştirmeler, yapay zekânın ofis ortamlarındaki etkinliğini artırabilir.
Mercor’un bu araştırması, yapay zekâ ve insan işgücü arasındaki ilişkiye dair gerçekçi bir perspektif sunuyor. Teknolojinin hızla geliştiği bir dönemde, yapay zekânın mevcut yeteneklerini ve sınırlarını anlamak, hem iş dünyası hem de teknoloji geliştiricileri için büyük önem taşıyor. Önümüzdeki yıllarda yapay zekânın ofis işlerindeki rolünün nasıl şekilleneceği, bu tür araştırmaların ışığında daha net anlaşılacak gibi görünüyor.
Kaynak: Webtekno