
Image by Vecstoc, from Freepik
Yeni AI Modeli, “Makine Unlearning” ile Ses Klonlamayı Durduruyor
Güney Koreli araştırmacılar, yapay zeka ses üreteçlerinin belirli kişilerin seslerini taklit etmeyi “unutmasını” sağlayacak yeni bir yol geliştirdi.
Acele mi ediyorsunuz? İşte hızlıca bilgilere göz atın:
- Yöntem, ses taklit doğruluğunu yüzde 75’in üzerinde azaltır.
- İzin verilen sesler hala çalışır, sadece yüzde 2.8 performans kaybıyla.
- Sistem, bir konuşmacıyı unutmak için 5 dakika ses kaydına ihtiyaç duyar.
“Makine öğrenmesini unutma” sistemi, dolandırıcıların ve derin sahte yaratıcılarının kullandığı ses klonlama teknolojilerinin kötüye kullanılmasını durdurmak için bir çözüm olmayı hedefliyor.
Mevcut sıfır-şot metinden-konuşmaya (ZS-TTS) modelleri, herhangi bir kişinin gerçekçi ses taklitlerini yaratmak için yalnızca birkaç saniyelik ses gerektirir. Sungkyunkwan Üniversitesi’nde profesör olan Jong Hwan Ko, “Herhangi birinin sesi, sadece birkaç saniyelik sesleriyle çoğaltılabilir veya kopyalanabilir” dedi, MIT Technology Review tarafından bildirildiği gibi.
Bu, taklit ve dolandırıcılık gibi ciddi gizlilik ve güvenlik endişelerinin kapısını aralar.
Ko’nun araştırma ekibi, AI modellerini belirli insanların seslerini üretmeyi unutacak şekilde eğiten ilk sistem olan Öğretmen Yönlendirmeli Unutma (TGU) metodunu geliştirdi. Makalelerinde, bu teknikle, istekleri filtreler ( “koruma korkulukları” denir) ile engelleme yerine, AI’nın hafıza alanını değiştirdiklerini ve böylece ses verilerinin sisteme erişilemez hale geldiğini açıklıyorlar.
Unutulan bir sese konuşma üretmesi için yönlendirilen güncellenmiş AI modeli, yerine rastgele bir ses döndürür. Araştırmacılar, bu rastgeleliğin, orijinal sesin başarıyla silindiğini kanıtladığını savunuyorlar. Testlerde, AI’nın silinen sesi taklit etme doğruluğu %75 azalırken, izin verilen seslerdeki performans sadece hafifçe (%2.8) düştü.
Bu yöntem, sürecini tamamlamak için her konuşmacıdan sadece beş dakikalık ses kaydı gerektirir. Erken aşama geliştirme, uzman görüşlerine göre önemli bir potansiyel gösteriyor. “Bu, konuşma için gördüğüm ilk çalışmalardan biri,” dedi UNC-Chapel Hill’de doktora öğrencisi olan Vaidehi Patil, MIT tarafından bildirildiği gibi.