Google, yapay zeka ile oluşturulan görsellerin ortalığı karıştırmasını engellemek ve bu alana şeffaflık getirmek için görünmez bir dijital filigran kullanmaya başladı.

Google, yapay zeka tarafından oluşturulan görsellerde şeffaflığa yönelik bir adım daha attı. Google DeepMind, yapay zeka ile üretilen sanata yönelik bir filigran / tanımlama aracı olan SynthID’yi duyurdu.
Şirket, teknolojinin insan gözüyle görülemeyen dijital bir filigranı direkt manzaranın piksellerine yerleştirdiğini söylüyor. SynthID, Google’ın bulut tabanlı yapay zeka araçları paketinde bulunan sanat üreticisi Imagen’i kullanarak başlangıçta “sınırlı sayıda” müşteriye sunuluyor.
Üretken yapay zeka sanatı ilgili pek çok sorun bulunsa da, deepfake yaratma potansiyeli en büyük sorunlardan biri olarak öne çıkıyor. Örneğin, Papa’nın sosyal medyada viral hale gelen yeni ve tanınan hip-hop kıyafeti (MidJourney ile oluşturulan bir yapay zeka görüntüsü), üretken araçlar geliştikçe neyin daha sıradan hale gelebileceğinin erken bir örneğiydi. Yapay zeka tarafından üretilen sanatı kullanan siyasi reklamlari bir uygulamanın, Twitter’da dolaşan komik bir görselden çok daha fazla zarar verebileceği rahatlıkla söylenebilir. İçeriğin yapay zeka tarafından oluşturulduğunu açıkça belirtmek için görsel ve işitsel içeriğe filigran eklemek, yedi yapay zeka şirketinin Temmuz ayında Beyaz Saray’da yapılan bir toplantı sonrasında geliştirmeyi kabul ettiği istekli taahhütlerden biriydi. Google bu türlü bir sistemi başlatan şirketlerden birincisi oldu.
Google, SynthID’nin teknik uygulamasıyla ilgili çok fazla detay vermiyor, fakat filigranın kolay düzenleme teknikleriyle basitçe kaldırılamayacağını söylüyor. Şirket, DeepMind blog yazısında “Görüntü manipülasyonlarında algılanamazlık ve sağlamlık arasında doğru dengeyi bulmak zordur” diye yazdı. DeepMind’ın SynthID proje önderleri Sven Gowal ve Pushmeet Kohli “SynthID’yi görüntü kalitesinden ödün vermeyecek ve filtre ekleme, renkleri değiştirme ve çeşitli kayıplı sıkıştırma şemalarıyla kaydetme (en yaygın olarak JPEG’ler için kullanılır) değişikliklerden sonra bile filigranın algılanabilir kalmasına izin verecek şekilde tasarladık” diyor.
SynthID’nin tanımlama kısmı, manzarayı üç dijital filigran güven seviyesine göre derecelendiriyor: Algılanan, algılanmayan ve muhtemelen algılanan. Araç, manzaranın piksellerine gömülü olduğundan ötürü Google, sisteminin, Adobe’nin şimdi açık beta sürümünde bulunan Photoshop üretken özellikleriyle kullandığı gibi meta bilgi tabanlı yaklaşımlarla birlikte çalışabileceğini söylüyor.
SynthID, biri filigranlama için, oburu tanımlama için olmak üzere bir çift derin öğrenme modeli içeriyor. Google, ikilinin farklı görseller üzerinde eğitim aldığını ve bunun sonucunda birleşik bir makine tahsili modeli ortaya çıktığını söylüyor. Gowal ve Kohli, “Birleşik model, filigranlı içeriğin doğru şekilde tanımlanması ve filigranı yepyeni içerikle görsel olarak hizalayarak algılanamazlığın uygunlaştırılması de dahil olmak üzere bir dizi hedef doğrultusunda optimize edildi” diye yazıyor.
Google bunun kusursuz bir tahlil olmadığını kabul ediyor ve “aşırı görüntü manipülasyonlarına karşı kusursuz olmadığını” ekliyor. Fakat filigranı “insanların ve kuruluşların yapay zeka tarafından oluşturulan içerikle sorumlu bir şekilde çalışmasına imkan tanıyan umut verici bir teknik yaklaşım” olarak tanımlıyor. Şirket, aracın metin, video ve ses oluşturanlar da dahil olmak üzere diğer AI modellerine genişletilebileceğini söylüyor.