ChatGPT ya da Google Bard gibi yapay zeka sohbet botları, hakkımızda neler biliyor? Pekala, bu bildiklerini öbürleri ile de paylaşıyor mu?

Yapay zeka sohbet botları (Chatbot), teknoloji standartlarına göre nispeten eskidir. Lakin işin içine yapay zekayı tam manasıyla sokan OpenAI’nin ChatGPT’si, Microsoft’un Bing’i ve Google’ın Bard’ı liderliğindeki en yeni eserler, çoğu zaman olumlu nedenlerle olmasa da daha evvelki örneklere göre çok daha yetenekli olduklarını kanıtlıyor.
Yapay zeka gelişimindeki son atılımlar, şimdiden yanlış bilgilendirme, dezenformasyon, intihal ve makine tarafından üretilen kötü hedefli yazılımlar hakkında kaygılar yarattı. Üretken yapay zekanın ortalama bir internet kullanıcısının mahremiyeti için nasıl meseleler oluşturabileceği sorunun karşılığı ise, uzmanlara göre, büyük ölçüde bu botların nasıl eğitildiği ve onlarla ne kadar etkileşim kurmayı planladığımızla ilgili.
Yapay zeka sohbet botları ve Common Crawl
Yapay zeka sohbet botları, insan gibi etkileşimleri taklit etmek için, çok önemli bir kısmı Common Crawl depolardan türetilen büyük ölçüde data üzerinde eğitilir. Common Crawl, açık web’i gezerek yıllar boyunca petabaytlarca data topladı. Stanford’un bilgisayar bilimi kısmında doktora öğrencisi ve Microsoft Research’te eski yapay zeka asistanı olan Megha Srivastava, “Bu modeller, internetteki halka açık dataların büyük bilgi kümeleri üzerinde eğitim veriyor” diyor. Srivastava’nın söylediğine göre ChatGPT ve Bard, Common Crawl’ın datalarının “filtrelenmiş” bir kısmını kullansalar da, modelin devasa boyutu “birinin dataları tamamen inceleyip sterilize etmesini” imkansız kılıyor.

Ortalama bir kullanıcı için erişimi zor olan ve internetin uzak köşelerinde bulunan dikkatsizce oluşturulmuş ya da düşük güvenliğe sahip dataların bir eğitim setine fark edilmeden yerleştirilmiş olması ve sohbet robotu tarafından gelecekte tekrar edilmesi mümkün. Ve bir botun birinin gerçek iletişim bilgilerini vermesi, hiçbir şekilde olmayacak bir şey değil. Bloomberg köşe yazarı Dave Lee, Twitter’da birisi ChatGPT’den şifreli iletileşme platformu Signal’de sohbet etmesini istediğinde, gerçek telefon numarasını tam olarak verdiğini bildirdi. Bunabir etkileşim muhtemelen uç bir durum olsa da, bu öğrenme modellerinin erişebildiği bilgilerin dikkate değer olduğunu vurguluyor.
Ayrıca bu chatbot’lar, sizin onlara sunduğunuz dataları de öğrenme sürecine dahil edebiliyor. Yani siz bir bilgiyi onunla paylaştığınızda, o bu dataları öteki birinin karşısına çıkartabiliyor. Aynı Samsung çalışanlarının başına geldiği…
SANS Enstitüsü güvenlik tertibinden David Hoelzer, Engadget’e “OpenAI’nin sağlık dataları gibi makul bilgileri toplamak ve modellerini eğitmek için bireylere atfetmek istemesi pek muhtemel değil” dedi ve ekledi: “Ama ezkaza orada olabilir mi? Kesinlikle…”
Kısacası yapay zeka sohbet botları hakkımızdaki açık bilgileri toplayabildiği gibi, onlarla paylaştığımız şeyleri de kendi eğitimleri için kullanabiliyor. Bu da, bu botları kullanan herhangi birinin, bize ait verilere tesadüf yapıtı yahut şuurlu olarak ulaşma ihtimali olduğunu gösteriyor.
Open AI, ChatGPT’ede data kapalılığını korumak için hangi tedbirleri aldığını ya da eğitim setlerine yerleşmiş olabilecek şahsî olarak tanımlanabilir bilgileri nasıl ele aldığını açıklamamış olsa da, ChatGPT’nin kendisi “kullanıcıların kapalılığını ve ferdî bilgilerini koruyan etik ve yasal standartları takip edecek şekilde programlandığını” ve “(kendisine) sağlanmadığı sürece ferdî bilgilere erişimi olmadığını” söylüyor.
Google, şahsî olarak tanımlanabilir bilgilerin sohbetler sırasında paylaşılmasını önlemek için Bard’da aynı “korkuluklar” bulunduğunu söylüyor. Bard’ın özel bir saklılık siyaseti bulunmuyor ve bunun yerine diğer Google ürünleri tarafından paylaşılan kapsamlı kapalılık evrakını kullanıyor.