
Image by ThisisEngineering, from Unsplash
Araştırmacılar, OpenAI’nin Botunun Matematiksel Dahi Belirtileri Gösterdiğini Söylüyor
Dünyanın dört bir yanından otuz önde gelen matematikçi, OpenAI’in “o4-mini” güçlü yapay zekasını test etmek için gizlice UC Berkeley’de buluştu. Bu bot, hafta sonu düzenlenen yarışma sırasında en zorlu matematik problemlerini aldı ve verdiği yanıtlarla katılımcıları hayrete düşürdü.
Acelesi olanlar için hızlıca bilgiler:
- Matematikçiler, AI eğitim verilerini kirletmemek için Signal’ı kullandılar.
- AI, canlı problem çözme oturumları sırasında yeni kavramlar öğrendi.
- O4-mini, insan benzeri muhakeme ve literatür inceleme stratejilerini taklit etti.
“Meslektaşlarım var ki, bu modellerin matematiksel deha seviyesine yaklaştığını söylüyorlar,” diye konuştu Virginia Üniversitesi’nde matematikçi olan ve etkinlikte jüri üyesi olan Ken Ono, Scientific American (SCI AM) tarafından rapor edildiği üzere.
Geliştiriciler, SCI AM’ın bildirdiği gibi, karmaşık problem çözme görevlerini ele almak üzere O4-mini’yi, ChatGPT’nin kompakt fakat güçlü bir versiyonu olarak eğittiler.
Araştırmacılar, O4-mini’nin, kar amacı gütmeyen bir organizasyon olarak Epoch AI tarafından geliştirilen FrontierMath testi sırasında yayınlanmamış 300 matematik sorusunun %20’sini çözdüğünde şaşırdılar. Geleneksel modellerin çözdüğünden daha az olan %2’yi, SCI AM belirtti.
“Sayı teorisinde açık bir soru olarak alanımdaki uzmanların tanıyacağı bir problemle karşılaştım,” dedi Ono, SCI AM tarafından bildirildiği gibi. Bot, literatürü iki dakika boyunca inceledi, önce daha basit bir versiyonunu denedi ve sonra çözdü, “Kaynak göstermeye gerek yok çünkü gizemli sayıyı ben hesapladım!” diye ekledi!
“Gerçekten de yüzsüzleşmeye başlıyordu […] Bu korkutucu” diye ekledi Ono, SCI AM tarafından bildirildiği üzere.
Grup, AI sisteminin çözemediği on sorunu keşfetti ancak birçok katılımcı teknolojinin hızlı ilerlemesinden hayrete düştü. “Bu, çok, çok iyi bir yüksek lisans öğrencisinin yapacağı şeydir – hatta daha fazlası,” dedi Londra Enstitüsü’nden Yang Hui He, SCI AM tarafından rapor edildiği gibi.
Matematikçiler, insanların matematiksel çözümleri bağımsız bir şekilde gerçekleştirmek yerine AI sistemlerini yöneteceği potansiyel senaryoları araştırdılar. Ono’nun uyardığı gibi, “Genelleştirilmiş yapay zekanın asla gelmeyeceğini söylemek büyük bir hata […] Bu modeller zaten en iyi yüksek lisans öğrencilerimizin çoğunu geride bırakıyor,” SCI AM tarafından rapor edildiği gibi.