Sentetik Deepfake Müzik, Zamanın Ruhunu Çalıyor

Yapay zeka temelli ses sentezi uygulamaları, deepfake’i müzik dünyası için de giderek daha büyük bir tehdit haline getiriyor. Deepfake geliştiriciler, ünlü müzisyenlerin sadece ses ve melodilerini değil, tarzlarını da kopyalayarak türettikleri sentetik müzik örnekleriyle, hem telif haklarını, hem de kişilik haklarını  ihlal etmekle suçlanıyorlar.

Milenyum çağının, nostaljik yakınmasıdır: Müzik, kulaklarımızdan kayıp gidiyor. Hızlı tüketim alışkanlığı, müziği de insandan koparıyor. Ruhun derinliklerine inen, hücrelere işleyen, beyine kazınan unutulmaz melodiler, artık üretilmez oldu. Onların yerini, hipnotize eden ritimler ve kulağa gizlice sızan frekanslarla, beyni esir alan yapay ticari müzikler almaya başladı.

Müzik, enstrümanlardan bilgisayarlara savruldukça, elektroniğin egemenlik alanı genişledi. Sadece dinlerken etkisi altına alan, ama sonra hatırlanmayan elektronik müzik öne çıktı. DJ yapımı tekno müzik, aslında “yapay gerçeklik” distopyasının sireni gibiydi. Artık ne estrümanlar, ne notalar, ne melodiler, ne sesler, ne de duygular eskisi kadar gerçek olmayacak. Sentetik gıdalar gibi, sentetik müziğin de insan ruhunu ne kadar sağlıklı besleyeceği tartışmalı. Elektronik müzik, yapay zeka (ai) çağında giderek deepfake müziğe evriliyor. Bestecisi de söz yazarı da, hatta şarkıcısı da; insan değil…

Hazır müşteriye pazarlama çağı

Pazarlama algoritmaları, henüz birçok insanı şaşırtmaya devam ediyor. Evde tatil programı konuşulsa, bir bakıyorsunuz, birkaç dakika sonra turistik tesis ya da seyahat acentelerinin tatil promosyonu mesajları telefonda. Google’da bir cep telefonu modelini arıyorsunuz. Hangi web sitesini açsanız, karşınızda cep telefonu reklamları. Önünden geçtiğiniz billboarddaki marka, sizi oradaki en yakın mağazasına davet eden, indirim mesajları yolluyor.

Sanki çevrimiçi bir göz ve kulak, yakın takipte. Pazarlama artık, herkesi etkilemek için büyük kampanyalar düzenlemekten vazgeçti. Nokta atışı yapıyor.  Kişi hedefli çalışıyor. Çarpıcı bir reklam filmi ya da slogan ile tüm tüketicileri etkileyip, olabildiğince büyük bir kitleyi müşteriye dönüştürmekle uğraşmıyor. Satın almaya hazır müşteriye, istediğini sunuyor.

Tek seçenek; HİT müzik

İşte, işin içine teknoloji girdikçe, müzik de bir sanat dalı olmaktan çıktı. Daha çok pazarlanan bir meta haline geldi. Kendi çağına damga vurmuş, Beethoven, Mozart ya da Bach, Elvis, Sinatra ya da Beatles, hatta Michael Jakson, Sting ya da Pavorotti, “satsın” diye mi müzik ürettiler? Sanatçı, kendi kişiliğini, tarzını, duygularını melodilere döker, kendi müziğini üretirdi. O melodilerle bağ kuran milyonlar onun peşine takılırdı. Sentetik müzik ise, HİT olan ne varsa, o müziği türetiyor. Tutan, satan ne varsa, onu kopyalayıp, modifiye ettiği için, eser hırsızlığı ve haksız rekabetle suçlanıyor.

Youtube’da deepfake vokal kanalı

Teknoloji uzmanı ve blog yazarı Andy Baio, Youtube’da yeni bir deepfake kanalı olan Vocal Synthesis’te ünlü sesleri beklenmedik diyaloglarla eşleştiren videolara dikkat çekiyor. İnsan seslerini taklit eden, ai tarafından üretilmiş metinden konuşma sentezleri çok başarılıydı. En son teknolojiye sahip sinir ağını, geniş bir veri üzerinde eğiterek gerçekçi sesler üretiliyordu. Örnekler çarpıcıydı. Bob Dylan. Britney Spears’ın ünlü “Hit me baby one more time” şarkısını söylüyordu.

Objektivizm felsefesiyle tanınan ünlü düşünür-yazar Ayn Rand ve Marksist sosyolog Slavoj žižek, 60’ların ve 70’lerin ünlü rockçı çifti Sonny ve Cher’in “I goot you baby” şarkısının sözlerine düet yapıyorlardı. ABD eski başkanı Bill Clinton, Sir Mix-a-Lot olarak tanınan ünlü hip hop sanatçısı Anthony Ray’in “Baby Got Back” şarkısının sözlerini okuyordu. Videoların çoğu daha sonra hayranları tarafından yeniden düzenlenmiş, eğlenceli ve gerçeküstü müzikal karma yaratmak için müzik eklenmişti. Örneğin Amerikalı rapçi The Notorious BIG’in “Juicy ” isimli parçası ABD eski başkanı Obama’nın sesinden, 50 Cent’in “In Da Club” adlı şarkısı da George W. Bush’un sesinden yeniden düzenlenmişti.

Youtube’a telif ihtarı

Vocal Synthesis Youtube kanalında yayınlanan ses sentezleri ve onlar üzerinden üretilen eğlenceli amatör deepfake videolara, bir kişi kayıtsız kalmadı. Yıl ortasına yaklaşırken, Kovid-19 pandemisinin pik yaptığı bir dönemde, dünya yaşam mücadelesiyle uğraşırken, deepfake müzik belki de ilk kez önemli bir hukuk mücadelesi ile yüzleşiyordu. Çünkü Hip Hop müziğin kralı olarak ün yapan Jay-Z, telif haklarının ihlal edildiği gerekçesiyle harekete geçmişti. Jay-Z sahne adıyla tanınan Shawn Corey Carter, aynı zamanda Universal Music Group’un sahibi olduğu Amerikan müzik şirketi Roc-A-Fella Records’un da CEO’suydu. Ayrıca Roc Nation LLC, The 40/40 Club ve New Jersey Nets şirketlerinin de kurucularından olan, müzik sektöründe güçlü bir iş insanıydı.

Kimliği belirsiz bir programcı, Jay-Z’nin deepfake sesiyle Vocal Synthesis’te, biri William Shakespeare’in “Olmak ya da olmamak…” diye başlayan ünlü Hamlet tiradını seslendiren, diğeri de Billy Joel’in “We Didn’t Start the Fire” adlı parçası için cover niteliğinde iki farklı video üretti. Jay-Z’yi temsil eden ajansı Roc Nation LL, Youtube’a ihtarname göndererek, sanatçısının ai yoluyla sesinin taklit edildiğini bildirdi ve bu videoların yayından kaldırılmasını sağladı. Ancak Youtube, itirazlar üzerine, kısa bir süre sonra Jay-Z’nin telif ihlali başvurusunu eksik bularak, ek bilgiler gelene kadar videoların geçici olarak tekrar yayınlanmasına izin verdi.

Telif hakkı ihlali tartışmalı

Jay-Z sentetik sesiyle üretilen videoların Youtube kanalından kaldırılması hukuk tartışmalarını da beraberinde getirdi. Roc Nation’ın Twitter’a gönderdiği yazılı ihtarda “bu içerikte, yasadışı bir şekilde, müşterimizin sesini taklit etmek için bir AI kullanıyor” şeklinde bir ifade yer almış ve özellikle ai kullanımına vurgu yapılmıştı. Oysa yine Vocal Synthesis Youtube kanalında, Jay-Z deepfake sesinin kullanıldığı “Book of Genesis” ve “Navy Seal” videoları yayınlanmaya devam ediyordu. Üstelik, Hamlet gibi klasikleşmiş bir eser için teliften söz etmenin anlamsız olduğunu öne süren görüşler de  gündeme geldi.

Ayrıca diğerleri gibi bu Voice Synethesis videoları da, Google’ın açık kaynak “Tacotron 2” metin okuma modelini Jay-Z şarkıları ve sözleriyle besleyerek oluşturulmuştu. Sentetik sesin önceden yazılmış metni okuması sağlanıyordu. Sentetik ses bir ünlünün benzerliğini kullanarak farklı bir orijinal içerik üretiyorsa, bu durumda ortada bir telif hakkı ihlali olamayacağı da savunuluyordu. Teknoloji yazarı Andy Baio, tartışmaları değerlendirirken, “Telif hakkıyla korunan ses kayıtlarından üretilen bir modeli ve sesi, “türev çalışmalar” olarak değerlendirmek makul görünüyor. Ama telif hakkı ihlali var mı? Telif hakkı dünyasındaki neredeyse her şey gibi, bu da nasıl ve hangi amaçla kullanıldığına bağlı” şeklinde bir yorum ortaya koyuyordu. Baio’ya göre, izni olmadan yeni bir single’da Jay-Z’nin sesini kullanan bir plak yapımcısı örneği, telif hakkı açısından daha açık bir yasal ihlal olarak görülebilirdi.

Kişilik haklarının korunması, telif haklarından daha öncelikli

Sanatçıların tarzlarının algoritmik biçimde yeniden tasarlanması, karmaşık hukuki soruları gündeme getiriyor. Georgetown Hukuku profesörü ve Fikri Mülkiyet ve Bilgi Politikası Bölümü Kurucu Direktörü Amanda Levendowski, konuya farklı bir açıdan bakıyor. Levendowski, Jay-Z örneğinin, sesi oluşturmak için kullanılan verilerle ilgili olarak, mesele bir telif sorunu gibi görünse de, aslında asıl önemli konunun farklı olduğunu dile getiriyor. Fikri mülkiyet uzmanı Levendowski, kişinin taklit edilmesi nedeniyle, olayın kişilik hakları ile ilgili davalara daha yakın bir konu olduğunu düşünüyor. ABD’de, kişinin adının, imajının ve kişiliğinin ticari istismarlara karşı korunması hakkı, telif haklarının önünde geliyor.

Levendowski, 1988’de Ford Motor Company’nin şarkıcı ve aktris Bette Midler’ın sesini taklit eden bir başka şarkıcı ile gerçekleştirdiği reklamı hatırlatıyor. Midler’ın açtığı davada Temyiz Mahkemesi’nin, sesin korunmasına yönelik değil, “ses taklidinin kişinin kimliğini sömürmesi” durumuna yönelik karar verdiğini vurguluyor. 1991’de yaşanan bir diğer örnekte de, Samsung yine bir reklam için bir robotu TV ve film yıldızı Vanna White gibi giydiriyor. White, Kaliforniya’da aynı gerekçelerle şirkete açtığı davayı kazanıyor. Levendowski, ABD’de telif haklarının federal olarak yönetildiğine, kişilik haklarının ise ulusal hukuk alanı olduğuna vurgu yapıyor.

Doludizgin deepfake müzik uygulaması; Jukebox

Youtube’da, Jay-Z ile Vocal Synthesis kanalı arasındaki deepfake mücadelesi yaşanırken, Elon Musk’ın kurucuları arasında yer aldığı, kar amacı gütmeyen ai araştırma şirketi OpenAI, deepfake müzik uygulaması Jukebox’ı piyasaya sürdü.  Uygulama, Elvis Presley ve Frank Sinatra gibi ünlü müzisyenlerin tarzında, şarkı sözleriyle tamamlanmış müzik üretebilen algoritmik bir sisteme sahip bulunuyor.  Bu algoritmalar, bir sanatçının şarkı koleksiyonlarını analiz edip, ses verilerinden onların müzik tarzının ayırt edici özelliklerini açığa çıkarıyor. Ardından bu kalıpları yeni ses oluşturmak için kullanıyor.

Jukebox ile oluşturulan şarkılardan bazıları inanılmaz derecede iyi.  OpenAI’nin web sitesinde, Sinatra ve Elvis başta olmak üzere, Katy Perry, Stevie Wonder, Natalie Cole, Ella Fitzgerald gibi ünlü sanatçıların “tarzında” birçok örnek yer alıyor. Jukebox, türü, sanatçıyı ve şarkı sözlerini girdi olarak kabul ediyor ve sıfırdan yeni örnekler oluşturuyor. Kullanıcılar veriyi, şarkıların yayınlandığı yıla kadar ince ayar yapabiliyor. Bu ayarları yaptıktan sonra, eğer isterlerse, uygulama sayesinde örneğin Katy Perry’ye benzer şekilde müzik yaratabiliyorlar.

Müzikle birlikte zamanın ruhu da yok olur mu?

Teknoloji gelişime yol açar, ürün ya da hizmet kalitesiyle birlikte toplumun yaşam kalitesini de yükseltir. Oysa deepfake teknolojisi, müziğin gelişimini durduruyor, onu adeta dijital çağa çiviliyor. Yeni sesler, yeni tarzlar ve melodiler, artık nasıl ortaya çıkacak? Yeni sanatçılar, herkese, o güne kadarki en beğendiğini veren deepfake müzikle nasıl rekabet edecek? İnsanları, nasıl yeni seçeneklere sürükleyecek? Gelecek kuşaklar, artık aynı müziğin farklı versiyonlarını dinlerken,duygusal gelişimini nasıl sürdürecek? Zamanın ruhu, müziğini yitirince, maddeden mi ibaret kalacak?

Bir Cevap Yazın

This site uses Akismet to reduce spam. Learn how your comment data is processed.

%d blogcu bunu beğendi: