Üsküdar Üniversitesi Mühendislik ve Doğa Bilimleri Fakültesi, Yazılım Mühendisliği (İngilizce) Bölümü Dr. Öğr. Üyesi Kristin Surpuhi Benli, yapay zekâ destekli ses ve görüntü üretim teknolojilerini değerlendirdi. Bu teknolojilerin genel olarak "deepfake" olarak adlandırıldığını ifade ederek, deepfake'in "deep learning" (derin öğrenme) ve "fake" (sahte) kelimelerinin birleşiminden oluştuğunu belirtti. Deepfake teknolojisi, yüz tanıma, ses analizi ve görüntü işleme alanlarında geliştirilen derin öğrenme algoritmalarını kullanarak gerçeğe son derece yakın sahte video ve sesler üretmektedir.
Dr. Benli, deepfake teknolojisinin kötü niyetli kişiler tarafından da kullanılabileceğine dikkat çekti. Bu teknoloji aracılığıyla bir kişinin yüzü, mimikleri veya sesi taklit edilebilmekte ve gerçekte yaşanmamış konuşmalar sanki yapılmış gibi sunulabilmektedir. Bu durum, içeriklerin yaratıcı amaçlar için kullanılabileceği gibi dezenformasyon yaymak veya dolandırıcılık yapmak için de kötüye kullanılabileceğini gösteriyor.
Yapay zekâ ile üretilen video ve ses içerikleri günümüzde sinema, eğitim, reklam, oyun ve medya gibi birçok alanda yaygın bir şekilde kullanılmakta. Benli, reklamlar, uzaktan eğitim videoları, dijital oyunlardaki karakterler ve sanal haber sunucuları gibi içeriklerin bu teknoloji sayesinde hızlı ve düşük maliyetle hazırlandığını belirtti. Ancak bu teknolojilerin sahte haber üretimi ve bilgi kirliliği yaratmak gibi kötüye kullanım potansiyeli olduğuna da vurgu yaptı.
Deepfake videoların bu denli ikna edici olmasının temelinde, yapay zeka teknolojileri ve derin öğrenme modellerinin sunduğu artan gerçekçilik ve ayrıntı düzeyi yatmaktadır. Benli, yüz ifadeleri, göz kırpma, ışıklandırma ve ten dokusu gibi detayların artık çok daha doğal biçimde taklit edilebilmesi sayesinde sahte içeriklerin inandırıcılığının arttığını ifade etti. Ses klonlama teknolojileri de konuşma ritmi ve tonlamayı başarıyla kopyalayabiliyor. Görüntü ve ses kalitesindeki bu ilerleme, sahte içeriklerin insan gözüyle veya kulağıyla fark edilmesini zorlaştırıyor.
Dijital çağda "gerçeklik" kavramının köklü bir dönüşüm geçirdiğini söyleyen Dr. Benli, artık gördüğümüz, duyduğumuz veya okuduğumuz içeriklerin gerçekten olup olmadığını sorgulamamız gerektiğini belirtti. Bu durum, bilgiye erişimde daha fazla şüpheciliği beraberinde getirirken, doğruluğu ve güvenilirliği teyit edebilecek yeni yöntemlere ve etik standartlara olan ihtiyacın da arttığını gösteriyor.
Yapay zekâ ürünü görüntülerin veya seslerin tespit edilmesine yönelik teknikler ve yöntemler giderek gelişiyor. Dr. Benli, bu tespit süreçlerinin görüntü işleme, ses analizi ve makine öğrenimi tekniklerine dayandığını açıkladı. Görsellerde yüz ifadeleri ve mimiklerin analiz edilerek sahte içeriklerin belirlenmeye çalışıldığını ifade etti. Deepfake videolarda dikkat edilebilecek ayırt edici unsurlar arasında göz kırpmanın doğal olmaması, ağız hareketleri ile ses arasındaki senkronizasyon problemleri, ten rengi geçişlerindeki yapaylık ve ışık yansımalarının doğallıktan uzak olması yer alıyor. Ses analizi de frekans spektrumu, vurgu, tonlama ve nefes alma gibi ayrıntıları içeriyor. Özel olarak eğitilmiş derin öğrenme modellerinin de sahte içeriklerin tespitinde etkin bir şekilde kullanıldığı vurgulandı.
İleri düzey deepfake teknolojilerinin mimiklerden göz hareketlerine kadar birçok ayrıntıyı yüksek başarıyla taklit edebildiğini belirten Dr. Benli, yapay zeka ile üretilen görüntü ve seslerin çoğu zaman insan gözü ve kulağının ayırt edemeyeceği kadar gerçekçi hale geldiğini ifade etti. Ancak dikkatli incelemeyle hala bazı yapaylıkların sezilebildiğini, yüz ifadelerinin doğallıktan uzaklaşması ve göz hareketlerindeki tutarsızlık gibi farkların giderek daha az belirgin hale geldiğini belirtti.
Sosyal medyada paylaşılan bir videonun doğruluğunu sorgularken bireylerin içerik kaynağını araştırmaları gerektiğini vurgulayan Dr. Benli, videonun paylaşıldığı hesabın güvenilirliğinin değerlendirilmesi, içeriğin resmi veya tanınmış platformlardan yayınlanıp yayınlanmadığının kontrol edilmesi gerektiğini söyledi. Ayrıca, aynı olaya dair farklı kaynaklardan gelen videolar veya haberlerle karşılaştırma yapılmasının içerik doğruluğunu teyit etmek açısından etkili bir yöntem olduğunu belirtti. Videodaki ses ve görüntü arasındaki tutarsızlıkların dikkatle analiz edilmesinin yanı sıra yapay zekâ destekli tespit araçlarının da sahte içeriklerin belirlenmesinde önemli bir destek sunduğu ifade edildi.
 
						 
								 
									 
									 
									 
									 
									


