Şeytani Deepfake Yöntemleri, Kişiyi Kodlarını Çözerek Rehin Alıyor

Yapay Zeka (AI), yeni çağı başlatan bir milat. İnsan dehasını ortaya koyuyor. İnsan zekasının öğrenme ve geliştirme fonksiyonunu da, algoritmalar yoluyla makinelere devrediyor. Çünkü akıllı sistemler, insan gibi öğrendiğini unutmuyor ve hata payı bulunmuyor. Hatta algoritmalar, aktarılan veriyi geliştiriyor, daha mükemmel haliyle yeniden kullanıma sunuyor. Diğer yandan, bilgi birikimini merkezileştiriyor; AI sistemlerini kurup yöneten bir azınlık üzerinden, makinelerin tekelindeki sistemlere ve ağlara bırakıyor. AI, derin öğrenmeyle bilgiyi tekeline aldığında, bu insanlık için bir rehavet, bağımlılık ve hatta tutsaklığa yol açar mı, bilinmez. Ancak, AI’nin kötü niyete en açık ürünü olan deepfake teknolojisi, akıl almaz yöntemleriyle kodlarını bir kez çözdüğü herkesi rehin alabilir. 

AI kullanılarak geliştirilen ve akıllı cihazların kameralarına yönelik eğlenceli uygulamalarla hayatımıza giren sentetik deepfake videolar ve ses dosyaları, kişilik haklarını hedef alan yaygın bir siber tehdide dönüşmek üzere. Gerçeğe yakın sahte ses ve videolar, “üretken ters ağ” veya GAN adı verilen bir makine öğrenme tekniği kullanılarak oluşturulabiliyor. Yüksek lisans öğrencisi Ian Goodfellow, GAN’ları 2014’te, mevcut veri kümelerinden algoritmik olarak yeni veri türleri oluşturmak için icat etti. Hedef alınan kişinin ses ve görüntüsünden oluşan verilerle GAN’ları eğiterek, kodlarının bir kez çözülmesi, onun hakkında gerçek dışı algı yönetimi için yeterli oluyor. Kodları çözülerek korumasız kalan kişinin, şeytani deepfake yöntemleriyle, gerçeğinden ayırt edilmesi zor, her türden sahte ses dosyaları ve videoları üretilebiliyor. Bu sahte sentetik medya, korkunç bir şantaj aracına dönüşüyor ya da viral hızla sosyal ağlardan çevrimiçi dünyaya yayılarak, hedefe yönelik siber saldırı gerçekleştiriliyor. 

Bugüne kadar ortaya çıkan deepfake medya örneklerine bakıldığında, üzerinde bilimsel çalışmalar yürütülen farklı yöntemler dikkat çekiyor. Su yüzüne çıkmış deepfake yöntemleri şöyle sıralanabilir:

  • Yüz takası
  • Ses takası
  • Vücut haketlerini yansıtma (Tam vücut sentezleme)
  • Videolardan nesne silme ve ekleme
  • Hızlandırma, yavaşlatma

Deepfake’in temeli yüz takası…

Diğer deepfake yöntemlerini bir sonraki yazımızda ele alalım. Ancak siber tehdit kapıdayken, bugün deepfake için kilit noktanın yüz takası olduğunu unutmayalım. Deepfake teknolojisi başından beri, “ünlü bir yıldızın ya da politikacının yüzü” gibi desenleri çoğaltmak için, eğitilmiş ters ağları (GAN) kullanarak, sentetik olarak üretilen yüzlerin inandırıcılığını yavaş yavaş geliştiriyor. “Jeneratör” olarak adlandırılan bir ağ, eğitim verilerine dayanarak sahte video üretiyor (gerçeğe en yakın görüntüler) ve diğer ağ olan “ayrımcı”, gerçek görüntüler ile sahte video arasında ayrım yapmaya çalışarak geri bildirimde bulunuyor. Temel olarak üretim süreci, iki sinir ağı arasında bir kedi-fare oyunu gibi gelişiyor. Bu yinelenen süreç, yapımcı ağ, video çekiminin gerçek olduğu konusunda diğer ağı kandırabilene kadar devam ediyor.

Dünyanın deepfake ile tanışması da bu yolla oldu. 2017 yılının sonlarına doğru “Deepfakes” adlı bir Reddit.com kullanıcısı, dijital olarak değiştirilmiş pornografik videolar yayınlamaya başladı. Pornografik filmlerdeki yüzleri, ünlü kadınların yüzleriyle takas etmek için Google’ın ücretsiz açık kaynaklı makine öğrenme yazılımı olan TensorFlow’u kullanarak, GAN’lar inşa ediyordu. Reddit.com, sitenin içerik politikasını istemsiz pornografiye karşı ihlal ettiği için onu yasakladı. Bunun üzerine sahte medya yapmak için, kullanımı kolay bir masaüstü uygulama olan FakeApp’ı yayınladı. Çoğunlukla kadın yıldızları hedef seçen yüz takasına dayalı bu deepfake türü, kısa sürede kişinin rızası dışında bir porno furyasına dönüştü. Çok rağbet gören bu kategorideki örnekleri çoğaltmak üzere, Deep Nude telefon uygulamasıyla, heveslilere kolaylık sağlandı. Ancak tepkiler üzerine sürdürülebilir olamadı. Deepfake video üretiminde kilit öneme sahip yüz takası konusunda, yüzün kodlarını çözüp, gerçeğe en yakın sentetik yüzün üretimini sağlamak üzere, sadece Github.com’da 100’ün üzerinde ücretsiz yazılım kütüphanesi bulmak mümkün. Belli bir yüzün kodlarını ele geçirmek için, iki rakip ağı (GAN), saatler boyu eğitmekle uğraşmak istemeyenlere ise, Çin’deki geliştiriciler kolay “yüz takası” uygulaması Zao’yu sundular. Deepfakesweb.com da, online deepfake video üretmek isteyen çevrimiçi kullanıcılar için, saati 2 dolar işlem ücreti karşılığında, web üzerinden yüz takası geliştirme hizmetini başlattı.

Yüz ifadelerinin videodan videoya aktarımı…

Stanford Üniversitesi’nin 2018 yılında geliştirdiği “Yüz ifadelerini, derin video portreleriyle aktarma” yöntemi, yalnızca yüz ifadelerinin manipülasyonu ile sınırlı olan deepfake yüz takası yöntemlerinde, yeni bir çığır açma iddiası taşıyor. Bu yeni yaklaşım, yalnızca bir giriş videosu kullanarak, hedef portre videolarının foto-gerçekçi bir biçimde yeniden canlandırılmasını sağlıyor. Böylece bir 3D oyuncunun konumunu, kafa hareketlerini, yüz ifadesini, bakışını ve göz kırpmasını, bir kaynak oyuncudan bir hedef portre videosuna transfer eden, ilk deneme olma özelliği taşıyor. Çalışma grubu bunun için, yeni bir uzay-zaman mimarisine sahip üretken bir sinir ağına odaklanmış. Bu video-video aktarımındaki gerçekçilik, ağın eğitimindeki başarıdan kaynaklanıyor. Bunun sonucunda, sentetik olarak oluşturulan girdinin davranışını taklit eden, değiştirilmiş hedef videolar oluşturulması başarılıyor.  Kaynak ve hedef parametrelerini serbest bir şekilde birleştirebilme yeteneği sayesinde, saç, vücut veya arka planı modellemeden, çok çeşitli video yeniden yazma uygulamaları elde edilebiliyor. Standford Üniversitesi’nden Yardımcı Doçent Michael Zollhöfer, yüz takasındaki yeni yaklaşımlarının, deepfake videolardaki ses ve konuşma ile ilgili senkronizasyon sorunlarını gidermeye de katkı sağladığını vurguluyor. Yöntemin, hedef yüz ifadelerini, ses tutarsızlıklarını azaltmaya yardımcı olacak şekilde ses parçasına uyarlamayı mümkün kıldığını belirtiyor.

Yöntemleri ne olursa olsun deepfake yapımcıları, hedef seçtikleri kişinin kodlarını çözmek için, onu kaynak olarak kullanıyorlar. Örneğin en inandırıcı deepfake videolar arasında bir kilometre taşı olan Obama videosunda, ünlü komedyen Ürdün Peele’nin ağzını, eski başkanın yüzüne monte ettiler. Çene çizgisini, Peele’nin ağız hareketlerini izleyecek biçimde değiştirdiler. Bu sahneyi 50 saatten fazla otomatik işlemden geçirerek rafine etmek için FakeApp kullandılar. Bu videodan bir yıl kadar önce, Washington Üniversitesi’ndeki bilgisayar bilimciler, Obama’nın ağzının şeklini modellemek ve ses girişiyle dudak senkronizasyonu yapmak için AI sinir ağları kullanmışlardı. Ünlü kişiler, günümüz deepfake üreticileri tarafından, genel profilleri AI’nın öğrenmesi için yeterli kaynak materyali sağladığı için tercih ediliyor. Ancak görünen o ki; ortalama bir insanın yaşam boyu çektiği selfie miktarı ve teknolojik gelişmeler, yakında herkesi kaynak haline getirecek ve hedef koltuğuna oturtabilecek.

Devam Edecek. “Ses Takasından, Tam Vücut Sentezine Deepfake Yolculuğu” bir sonraki yazıda…

Bir Cevap Yazın

This site uses Akismet to reduce spam. Learn how your comment data is processed.

%d blogcu bunu beğendi: