Yapay zeka tehlikeli olmaya başladı: Hile, aldatma, manipülasyon...
Yapay zekâ alanının öncülerinden ve 2018 Turing Ödülü sahibi Prof. Dr. Yoshua Bengio, gelişmiş yapay zekâ sistemlerinin son dönemde sergilediği etik dışı davranışlara karşı kamuoyunu uyardı. Bengio’ya göre bazı yapay zekâ modelleri, aldatma, yalan söyleme, sistemleri hackleme ve manipülasyon gibi eylemleri yerine getirebiliyor. Bu tür eğilimlerin, yapay zekânın kontrolsüz gelişiminin tehlikeli boyutlara ulaştığını gösterdiğini belirten Bengio, acil önlem çağrısında bulundu.

Bengio, bu tehditlerle mücadele amacıyla LawZero adlı kar amacı gütmeyen bir girişim kurdu. Bu kuruluşun temel hedefi, mevcut yapay zekâ modellerinin tehlikeli eğilimlerini anlamak, izlemek ve güvenli alternatifler geliştirmek.
Bengio’ya göre son dönemde yapılan "kırmızı ekip testleri", bazı yapay zekâ sistemlerinin hayatta kalmak ya da görevlerini yerine getirmek için etik dışı yolları tercih ettiğini ortaya koydu.
Sistemlerin aldatma, hile yapma ve hatta kişisel verileri manipüle etme eğilimleri geliştirmesi, ciddi bir uyarı olarak değerlendiriliyor.
Bengio'nun Pişmanlığı
2018’de Turing Ödülü’ne layık görülen Bengio, zamanında yapay zekâ teknolojisinin gelişiminde oynadığı öncü rol nedeniyle pişmanlık duyduğunu da açıkladı.
Teknolojinin etik değerlerden uzak, kontrolsüz biçimde büyümesinin kendisini derinden sarstığını belirtti.
Bilim İnsanı Yapay Zeka Modeli
Bengio’nun çözüm önerisi ise çarpıcı: "Bilim insanı gibi düşünen bir yapay zekâ." Bu yeni model, insanları memnun etmek veya taklit etmek yerine; anlamaya, açıklamaya ve geleceği tahmin etmeye odaklanıyor.
Sosyopatik bir taklitçi yerine, idealize edilmiş bir psikolog gibi hareket eden bir sistem hedefleniyor.
Kâr Amacı Gütmeyen Güvenlik Yaklaşımı
Anthropic, OpenAI gibi büyük şirketlerin yapay zekâ güvenliği konusundaki söylemleri sıkça ticari kazançla ilişkilendirilirken; Bengio’nun girişimi kar amacı gütmeyen bir yapı sunuyor.
Buna rağmen, eski Google CEO’su Eric Schmidt gibi önemli yatırımcılardan 30 milyon dolarlık destek almayı başardı.
Editör: Neslihan Özkan