Sinir Bozucu Deepfake Medyanın Sırrı, Yapay Sinir Ağlarında mı Gizli?

Geleceğin yol haritasını belirleyecek düzeyde teknolojinin gündemini ele geçiren Yapay Zeka (AI), aslında zeka kavramının temelini oluşturan “insan beynini” model alıyor. Bu kaçınılmaz; çünkü evrende, daha gelişmiş bir zeka düzeyi henüz keşfedilmiş değil. Bu yüzden, zekanın sınırlarını genişletecek biçimde AI teknolojileri geliştirmek için, insan zekasının kodlarını çözmek en önemli adımı oluşturuyor. Bu sayede, bilgisayar veya diğer bilgi işlem cihazlarına, insan beynindeki sinir ağlarını taklit eden Yapay Sinir Ağları yardımıyla, çeşitli faaliyetleri, insan zekasının da sınırlarını zorlayan bir düzeyde yerine getirebilme yeteneği kazandırılabiliyor. Bunu yapabilmek için de, Yapay Sinir Ağları’na zaman içinde kendi kendine derin öğrenme becerisi kazandıran algoritmalar geliştiriliyor.

İnsanlığı tehdit eden en tehlikeli siber düşman ilan ettiğimiz Deepfake sentetik medya, AI ürünü olarak geliştirilen teknolojilerle üretildiğine göre, bu büyük kabusa karşı güvenlik stratejileri ve yöntemleri belirlerken, sorunun kaynağına odaklanmak önem kazanıyor. Çünkü büyük olasılıkla çözümün kaynağı da, aynı yerde gizlenmiş, ortaya çıkarılmayı bekliyor. Deepfake hakkında yazılıp çizilenlere baktığımızda, çok büyük bir oranda, Rakip Üretken Ağlar’ın (GAN), Derin Öğrenme yoluyla eğitilerek, inandırıcılığı giderek geliştirilen deepfake sentetik medya çıktıları elde edildiğine dair, içeriklerle karşılaşıyoruz. Oysa GAN, AI temelinde geliştirilen Yapay Sinir Ağı türlerinden sadece bir tanesi…

Deepfake sentetik medyanın üretim biçimini çözümlemek, belki bir kanserli hücre gibi, onu erken evrede yakalamanın en önemli adımını oluşturabilir. Bu doğrultuda, Deepfake sentetik medyanın sırrını çözecek ipuçlarına ulaşmak için, onu üreten Yapay Sinir Ağı’nın yapısını belirlemek, ne kadar geçerli ise, konuyu tek tip Yapay Sinir Ağı’na (GAN) indirgemek, o denli kısıtlayıcı bir yaklaşım gibi görünüyor.

Yapay Sinir Ağları, “derin” öğrenebiliyor…

Deepfake genel olarak, kişilerin yüz, ses, vücut ve uzuvlarının, AI temeline dayanan ses ve görüntü işleme teknolojileriyle modellenerek, olmadıkları halde inandırıcı biçimde varmış gibi gösterildikleri; gerçek türevi ses ve görüntü kayıtlarını barındıran ve orijinal olmayan sentetik medya üretim teknolojisi olarak tanımlanabilir. Meraklı bir çevrimiçi kullanıcı düzeyinde bu konuyla ilgilenen ve ilgili kaynakları takip eden herkes bilir ki, Deepfake medya içeriklerinin üretim sürecinde, Derin Öğrenme ve Yapay Sinir Ağları temel rolleri oynar. Deepfake’in, derin ve sahte olma nitelikleri de zaten buradan gelir.

Derin Öğrenme, bir makine öğrenme yöntemidir. Derin öğrenmeyi sağlayan algoritmalarla Yapay Sinir Ağları’na, belli bir veri kümesi üzerinde işlem gerçekleştirdikten sonra, kendi kendine öğrenme becerisi kazandırılır. Gerçek veri girdilerini, sentetik veri çıktılarına dönüştürme ve sentezleme süreci ise, Yapay Sinir Ağları’nın yapısına göre farklılaşan algoritmalarla, deepfake video veya ses için, hedeflenen sonuç ya da inandırıcılık düzeyi elde edilene kadar devam eder.

Yapay Sinir Ağları, insan beyninin bilgi işleme tekniğinden esinlenerek geliştirilmiş bir bilgiişlem teknolojisi olma özelliği taşıyor. Yukarıda da belirttiğimiz gibi, YSA ile basit biyolojik sinir sisteminin çalışma şekli taklit ediliyor. Taklit edilen sinir hücreleri nöronlar içerirlerken, bu nöronlar çeşitli şekillerde birbirlerine bağlanarak ağı oluşturuyor. Beyindeki nöronların bilgiyi işleme ve transfer etme amaçlı ağ yapısından hareketle, YSA’da da yapay nöronlar, Node adı verilen ve çıktıyı etkileyen özel tasarımlarla birbirlerine bağlanarak ağı meydana getiriyor. Bu bağlar, YSA’nın yapısını ve veri işleme performansını da belirliyor.

Nöronlar, Giriş Katmanı, Gizli Katman ve Çıkış Katmanı olmak üzere üç farklı katmana ayrılıyor. Giriş Katmanı, verileri alır ve ilk Gizli Katman’a iletir. Gizli Katmanlar, matematiksel hesaplamaları yapar. Derin kavramı, birden çok Gizli Katman varlığını ifade eder. Gizli Katmanlar’ın sayısı ve işlevleri, YSA’nın da yapısal farklılıklarını oluşturur. Çıkış Katmanı, ise gerçekleştirilen işlemin sonuçlarını ya da çıktılarını ortaya koyar. Derin Öğrenme, YSA’nın eğitilmesi anlamına gelir. Bunun için, büyük veri kümelerini işlemeye ve güçlü matematiksel hesaplamalara ihtiyaç vardır. Veri kümeleri girdileriyle, çıktılar arasındaki uyumsuzlukları minimize etmek için ise, optimizasyon algoritmalarından yararlanılır.

Yapay Sinir Ağları, GAN’lardan ibaret değil

Konu oldukça teknik ve bilgi işlem mühendisliği altyapısı gerektirdiği için, sistem detayları bu yazının konusu değil. Bununla birlikte, çokça adı geçen YSA çeşitlerini ayrıntıya girmeden sıralamakta yarar var.

Generative Adversarial Networks (GAN) teknolojisinden, zaten birçok yazıda söz ettik. Rakip iki YSA’dan (GAN) biri tarafından üretilen sentetik çıktının, gerçekçiliğini artırmak üzere diğer YSA tarafından denetlendiği, kedi fare oyununa benzetilen üretim süreci, Deepfake alanındaki içeriklerde sıkça anlatılageldi. Yüz değiştirme alanında en yaygın erişilebilen AI temelli iki uygulama FaceSwap ve FakeApp.’da, YSA olarak GAN teknolojisi kullanılır. Conditional GAN seçeneğinde ise, hem üretici hem de ayırıcı bazı ilave bilgiler üzerine şartlandırılmışsa, GAN’lar koşullu bir modele genişletilebilir.

Convolutional Neural Networks (CNN) temel olarak görüntüleri sınıflandırmak (örneğin gördüklerini isimlendirmek), benzerlikle kümelemek (fotoğraf arama) ve sahnelerde nesne tanıma yapmak için kullanılan derin YSA’lardır.

Autoencoders (AE) olarak adlandırılan YSA türünde, temel olarak Girdi-Çıktı Katmanları arasındaki transferde Gizli Katman’daki düğümler (Node) asgari sayıdadır. Gizli Katmanlar’daki hesaplamalar, asgari sayıda düğüm (Node) üzerinden gerçekleştirilebilmektir ki, bu da hız ve verimliliği sağlar. Oto kodlayıcılar, sınıflandırma, kümeleme ve özellik sıkıştırma için kullanılır. Bu grupta, benzer yapı taşımakla birlikte, işleyiş açısından farklılık gösteren diğer alt seçenekler şöyle sıranalabilir: Adversarial Autoencoder (AAE), Conditional Adversarial Autoencoder (CAAE), Variational Autoencoders (VAE) ve Conditional Variational Autoencoders (CVAE)

Çözüm için odak noktası GAN mı olmalı, AE mi?

Deepfake ile mücadele için, kuşkusuz kaynağa inmek ve sentetik medya üretimini mümkün kılan YSA teknolojilerini etkin biçimde çözümlemek gerekiyor. Yayınlanan araştırma ve içeriklerin çoğu, ezber oluşturacak biçimde dikkatimizi GAN’lar üzerine odaklamış olsalar da, belki odağı kaydırmak gerekiyor.

Zemana olarak, dünyada ilk kez geliştirdiğimiz, çevrimiçi Deepfake dedektörü “Deepware Scanner” ile bu büyük siber tehdide karşı, çözüm üretme yolunda çok önemli somut adım attık. Türkiye merkezli bir uluslararası siber güvenlik şirketi olarak, araştırmalarımız bilinenden farklı sonuçlar ortaya koyuyor. Zemana olarak gerçekleştirdiğimiz AR-GE çalışmalarında, aslında Deepfake videoları oluştururken yoğunlukla GAN teknolojisinin kullanılmadığını gözlemledik. Yaptığımız testler sırasında, Deepfake medya üretiminde kullanılan teknolojinin daha çok Autoencoder (AE) olduğunu belirledik.

Deepfake tehdidine karşı koruma sağlayacak siber güvenlik teknolojisi geliştirme yarışında, sentetik medya üretim sürecine yönelik AI uygulamalarının yapısal özellikleri, kuşkusuz öncelikli ipucunu oluşturuyor. Bir yandan “etkin YSA olarak GAN’ların öne çıkarılması” örneğinde olduğu gibi, yazılan ve söylenenlerden çok, AR-GE’mizin ortaya çıkardığı bilimsel sonuçlara dayanarak yolumuza devam ediyoruz. Diğer yandan, kötü niyetli siber saldırganlara karşı verdiğimiz Deepfake mücadelesini, gelişen tüm yeni olasılıkları gözeterek, bizi onların bir adım önüne geçirecek yenilikçi teknolojiler üzerine yapılandırıyoruz.   

Bir Cevap Yazın

This site uses Akismet to reduce spam. Learn how your comment data is processed.

%d blogcu bunu beğendi: