
Image by Freepik
MIT’nin SEAL’ı, Yapay Zekanın Kendini Eğitmesini ve Sürekli Adaptasyonunu Sağlıyor
MIT’nin İmkansız AI Lab araştırmacıları, SEAL (Self-Adapting LLMs) adlı yenilikçi bir çerçeve geliştirdi. SEAL, yapay zeka sistemlerinin ilk eğitimlerinden sonra kendilerini öğreterek yeni beceriler öğrenmelerini sağlar.
Acele mi ediyorsunuz? İşte hızlıca öğrenmeniz gerekenler:
- MIT, AI’nin kendisine yeni yetenekler öğretmesine izin veren SEAL adında bir çerçeve geliştirdi.
- SEAL, kendiliğinden oluşturulan özetler, testler ve notlar kullanarak kendi eğitimini yeniden yazıyor.
- Yüzde 40 daha iyi hatırlama ve yüzde 72.5 başarı oranıyla muhakeme görevlerinde başarılı oldu.
Yeni sistem, araştırmacıların genellikle eğitildikten sonra sabit kalır ve yeni bilgi öğrenmek için geniş çapta yeniden eğitim gerektiren ChatGPT dahil olmak üzere mevcut büyük dil modellerini aşmaktadır.
SEAL’ın ana yeniliği, AI’ın kendi eğitim materyallerini oluşturabilme ve bu materyalleri kendini ince ayarlamak için kullanabilme yeteneğinde yatıyor. Gerçekten de, yeni verilerle – bir haber makalesi veya örnek görevler gibi – karşılaştığında, sistem basitleştirilmiş açıklamalar, ilgili gerçekler veya pratik sorular oluşturur.
Araştırmacılar, açıklıyorlar ki bu süreç, insanların genellikle notlar ve flash kartları yazarak yeni bilgilerin anlaşılmasını ve hatırlanmasını iyileştirdiği insan öğrenme metodlarını taklit eder.
“İç döngü” aşaması sırasında, SEAL küçük bir güncelleme gerçekleştirir ve buna “kendini düzenleme” denir. Sistem, güncelleme sonrası performansının gelişimini doğrulamak için bir “dış döngü” değerlendirmesi yapar. AI, olumlu bir değişiklik belirlediğinde bu değişikliği hatırlar; aksi takdirde, yeni yaklaşımlar dener.
Araştırmacılar, bu tekrarlayan sürecin AI’ın bilgisini sürekli olarak geliştirmesine ve tam yeniden eğitime gerek duymadan yeni zorluklara uyum sağlamasına olanak sağladığını söylüyorlar.
Araştırmacılar, SEAL’in kullandığı yöntemin, tüm geleneksel pekiştirmeli öğrenme (RL) yaklaşımlarından ayrıldığını belirtiyor. Standart RL ortamlarındaki ajanlar, çevreleriyle etkileşime geçtiklerinde ödülleri maksimize etmek için deneme yanılma yöntemiyle öğrenirler.
SEAL, kendi öğrenme kaynaklarını oluşturmak ve uygulamak için AI sistemini eğitmek amacıyla RL’yi bir araç olarak kullanır. Bu, dil modelini hem bir eğitmen hem de bir öğrenci olarak konumlandırır. Sistem, rafine süreci için kişiselleştirilmiş talimatları ve sentetik verileri içeren “kendi kendine düzeltmeler” oluşturur. Bu yaklaşım, model parametrelerini doğrudan ayarlamayan geleneksel RL yöntemlerinin başaramadığı, sürekli ve kendi kendine yönlendirilen güncellemeleri mümkün kılar.
MIT araştırmacıları SEAL’ı iki farklı alanda test etti. Öncelikle, yeni gerçekleri öğrenme konusunda, SEAL ham metni çıkarımlara ve Soru-Cevap formatlarına dönüştürdü, bu da GPT-4.1’in eğitim materyallerini bile aşan %47’lik bir doğruluk artışı elde etti. İkincil olarak, soyut akıl yürütme görevlerinde, SEAL, pekiştirmeli öğrenme veya standart eğitim olmadan modelleri aşarak %72,5 başarı oranı elde etti.
Araştırmacılar, potansiyel uygulamaların çok geniş bir yelpazeye sahip olduğunu savunuyor. SEAL, kişiye özel AI eğitmenlerinden, kendi kendine gelişen araştırma iş birlikçilerine ve deneyimlerinden yararlanarak gelişen otonom ajanlara kadar çeşitli uygulamaları mümkün kılabilir.
Teknolojinin, hızlı veri değişiklikleri ve kullanıcı gerekliliklerini ele almak için maliyetli yeniden eğitim süreçlerinin yerini alan, içsel düşünme yeteneklerini geliştirmelerine izin vererek kurumsal AI sistemlerini dönüştürme potansiyeli vardır.
Ancak, zorluklar hala mevcut, örneğin, araştırmacıların ‘katastrofik unutma’ olarak adlandırdığı bir durumdan SEAL etkilenebilir; burada yeni öğrenme, önceki bilgilerin üzerine yazılır ve kendini düzenleme süreci önemli bilgisayar kaynakları gerektirir.
Bu sorunları hafifletmek için, ekip, geçici hafıza için dış araçlarla SEAL’i birleştiren hibrid sistemler öneriyor, SEAL’in güncellemelerini esas, uzun vadeli bilgi için saklıyor.
Bu engellere rağmen, MIT araştırmacıları, bu teknolojinin makinelerin insan gibi uyum sağlama ve ömür boyu öğrenme yeteneklerine ulaşmasına yardımcı olacağına inanıyor.