
Photo by Scott Graham on Unsplash
AI, Artık Dünyanın En Prestijli Finans Sınavlarından Birini Geçebilir
New York Üniversitesi Stern İşletme Okulu ve AI şirketi GoodFin’den araştırmacılar tarafından yürütülen yeni bir çalışma, birkaç AI modelinin prestijli Chartered Financial Analyst (CFA) sınavını en zor seviyede başarıyla geçebildiğini ortaya koydu.
Acele mi ediyorsunuz? İşte hızlı gerçekler:
- Çalışma, ileri seviye AI modellerinin prestijli CFA sınavını en zor seviyelerde başarıyla geçebileceğini ortaya koyuyor.
- Araştırmacılar, “düşünce zinciri yönlendirme” özelliğine sahip modellerin, örneğin Claude Opus, Gemini 2.5 Pro ve o4-mini’nin, seviye III’ü geçebileceğini keşfetti.
- Benzer bir çalışma iki yıl önce yapılmıştı ve modeller en zorlu bölümde başarısız olmuştu.
CNBCye göre, insanların üç bölümlük sınavı geçmek için genellikle 1.000 saatlik bir çalışma süresi gerekmektedir. Artık, AI modelleri bunu dakikalar içinde, hatta en zorlu aşama olan Seviye III’te bile tamamlayabilmektedir.
CFA sınavı, yatırımların çeşitli alanlarına dair beceri ve bilgiyi değerlendirmek üzere tasarlanmıştır ve üç seviyeye ayrılmıştır: Seviye I, anahtar terimlere ve temel bilgilere odaklanırken, Seviye II durumsal analizlere vurgu yapar ve Seviye III, gerçek dünya senaryolarında kavramların entegrasyonunu gerektirir.
Araştırmacılar, 23 büyük dil modelinin, deneme CFA Seviye III sınavı için test sorularını yanıtlama ve deneme yazıları üretme yeteneklerini değerlendirdi. Çalışma, “zincirleme düşünme yönlendirmesi” kullanan modellerin – Claude Opus, Gemini 2.5 Pro ve o4-mini dahil – geçebildiğini buldu.
Bulgular, AI akıl yürütmedeki önemli bir evrimi vurgulamaktadır. İki yıl önce yapılan araştırmalar, AI modellerinin Seviye I ve II’yi kolaylıkla geçebildiğini ancak Seviye III ile mücadele ettiğini göstermiştir. Şimdi ise, Mayıs’ta yayınlanan Claude Opus gibi daha yeni modeller, ileri düzeyde analitik akıl yürütme yeteneği sergilemektedir.
“Bu teknolojinin gelecekte endüstriyi dönüştüreceği konusunda kesinlikle bir gelecek olduğunu düşünüyorum,” diye belirtti GoodFin’in kurucusu ve CEO’su Anna Joo Fee. GoodFin, araştırmaya katılan AI destekli servet yönetimi platformudur.
“Makinenin şimdilik değerlendirmekte zorlandığı şeyler var, örneğin bağlam ve niyet gibi,” diyerek ekleyen Fee, görüşüne göre, AI’nin CFA’yı yerine geçemeyeceğini açıkladı. “İşte burada insan parlar, beden dilinizi ve ipuçlarınızı anlamada.”
OpenAI, yakın zamanda “ChatGPT’yi nasıl kullandıklarına dair bugüne kadarki en büyük çalışmayı” duyurdu, burada araştırmacılar, kullanıcıların %49’unun sohbet robotuna çok sayıda konuda tavsiye almak için başvurduğunu ve New York Times’ın insanların teknolojiyi finansal danışman olarak nasıl kullandığını açıkladığını belirtti.