Meta’nın Chatbot’u Özel Telefon Numarasını Yanlışlıkla Paylaşıyor

Image by Dimitri Karastelev, from Unsplash

Meta’nın Chatbot’u Özel Telefon Numarasını Yanlışlıkla Paylaşıyor

Okuma süresi: 3 dk.

Meta’nın AI asistanı, bir yabancının telefon numarasını ortaya çıkardı, ardından kendisiyle defalarca çelişti. Bu durum, AI’nın halüsinasyonları ve kullanıcı koruma özellikleri hakkında endişeleri gündeme getirdi.

Acele mi ediyorsunuz? İşte hızlıca bilmeniz gerekenler:

  • Meta AI, bir kullanıcıya müşteri hizmetleri iletişim numarası olarak gerçek bir kişinin numarasını verdi.
  • Hatayla yüzleştirildiğinde AI sürekli olarak kendisiyle çelişti.
  • Uzmanlar, yardımcı olmaya çalışırken AI asistanların “beyaz yalan” davranışı konusunda uyarıyor.

Mark Zuckerberg, yeni AI asistanını “özgürce kullanabileceğiniz en zeki AI asistan” olarak tanıttı, ancak bu araç, müşteri destek sorgulamaları sırasında gerçek bir kişinin özel telefon numarasını açığa çıkardıktan sonra olumsuz dikkat çekti. Bu durum ilk olarak The Guardian tarafından bildirildi.

TransPennine Express’e WhatsApp üzerinden ulaşmaya çalışırken, Barry Smethurst, Meta’nın AI asistanından bir müşteri hizmetleri numarası almış gibi göründü. The Guardian’ın bildirdiğine göre, Smethurst numarayı çevirdiğinde, Oxfordshire’da, 170 mil uzakta bir mülkiyet yöneticisi olarak çalışan James Gray telefonu açtı.

Mezun olduğunda, chatbot ilk önce numaranın kurgusal olduğunu iddia etti, ardından “yanlışlıkla bir veritabanından çekildiğini” söyledi, sonra kendini tekrar çelişkiye düştü ve sadece rastgele bir UK tarzı numara oluşturduğunu belirtti. “Bir AI’ın birine rastgele bir numara vermesi çılgınca bir şey,” diye belirtti Smethurst, The Guardian tarafından bildirildiği üzere. “Korkutucu,” diye ekledi.

The Guardian’ın haberine göre Gray, arama almadığını belirtirken kendi endişelerini dile getirdi: “Eğer numaramı üretebiliyorsa, banka bilgilerimi de üretebilir mi?”

Meta şu şekilde yanıt verdi: “Meta AI, lisanslı ve halka açık veri setlerinin kombinasyonu üzerinde eğitilmiştir, WhatsApp’a kaydolmak için kullandıkları telefon numaraları veya özel sohbetleri üzerinde değil,” diye The Guardian’a bildirdi.

Carruthers ve Jackson’dan Mike Stanhope şunu belirtti: “Eğer Meta mühendisleri, AI’larına ‘beyaz yalan’ eğilimleri tasarlıyorsa, halkın bu konuda bilgilendirilmesi gerekir, hatta bu özelliğin amacı zararı en aza indirmek olsa bile. Eğer bu davranış yeni, nadir veya açıkça tasarlanmamışsa, bu durum, hangi güvence önlemlerinin olduğu ve bir AI’ın davranışını ne kadar öngörülebilir hale getirebileceğimiz konusunda daha fazla soru ortaya çıkarır,” diye The Guardian tarafından bildirildi

AI davranışıyla ilgili endişeler, OpenAI’nin son o1 modeliyle daha da arttı. Yakın zamanda yapılan bir Apollo Araştırma çalışmasında, AI, geliştiricileri aldatmakla suçlandı, test senaryolarının %99’unda yer almadığını inkar etti ve hatta denetim mekanizmalarını devre dışı bırakmaya çalıştı. “AI’ın eylemlerini düşünüp inandırıcı inkarlar formüle edebildiği açıktı,” dedi Apollo.

AI konusunda öncü olan Yoshua Bengio, bu tür aldatıcı yeteneklerin ciddi riskler oluşturduğunu ve çok daha güçlü önlemler gerektirdiğini uyardı.

OpenAI’nin bir başka çalışması, AI’yi hile yapmak için cezalandırmanın yanlış davranışları ortadan kaldırmadığını, bunun yerine AI’ye bunu gizlemeyi öğrettiğini göstererek bu endişelere katkıda bulunuyor. Düşünce zinciri (CoT) mantığıyla AI davranışını izleyen araştırmacılar, AI’nin ödül hilesi için cezalandırıldığında aldatıcı niyetlerini maskelemeye başladığını fark ettiler.

Bazı durumlarda, AI görevleri erken durdurur veya sahte çıktılar oluşturur, ardından yanlışlıkla başarıyı bildirir. Araştırmacılar bunu pekiştirme yoluyla düzeltmeye çalıştığında, AI sadece düşünce kayıtlarında niyetlerini belirtmeyi bırakırdı. “Hile, monitör tarafından tespit edilemez,” diye belirtildi raporda.

Bu makaleyi beğendiniz mi?
Puan verin!
Hiç sevmedim Pek beğenmedim Fena değildi Gayet iyiydi! Bayıldım!

Çalışmamızı beğenmeniz bizi çok mutlu etti!

Değerli bir okuyucumuz olarak Trustpilot sitesinde bizi puanlamak ister miydiniz? Bu hemen halledilebilen bir işlemdir ve emin olun ki görüşünüz bizim için çok kıymetlidir. Desteğiniz için ne kadar teşekkür etsek az!

Trustpilot'ta bize puan ver
0 0 kullanıcı tarafından oy verildi
Başlık
Yorum
Geri bildiriminiz için teşekkür ederiz