top of page

HIGHLIGHTED

YORUM

Yapay zeka modellerinin eğitildiği veri kaynaklarının çoğunlukla Batı odaklı olması, yerel ve geleneksel öğelerin kaybolmasına mı yol açıyor?

Kültürel Homojenleşme

E. Berhan Yıldız

Büyük yapay zeka modellerinin çoğu İngilizce içerikler üzerinden eğitiliyor. Veri kaynaklarının ağırlığı konusunda, Batı’nın referans çevresi evrenselleştiriliyor. Dolayısıyla, yerel öğeler çoğu zaman veri setinde nadir olarak rastlanır bir veri olduğu için yapay zeka bu data setlerini bazen doğru üretemeyebiliyor. Bu da “yok sayma” etkisini arttırıyor. Örneğin, Karadeniz kemençesi ile ilgili bir görsel ya da metin istediğinde, model bunu klasik bir keman gibi algılayabiliyor.


Kültürel etkileşim açısından, küresel veriler kültürler arası etkileşimi kolaylaştırıyor. Ama öte yandan, çeşitliliği zayıflatıp tek tip estetiğe, yani “homojenleşme”ye sürüklüyor. Bazı düşünceler bunu “dijital sömürgecilik” olarak adlandırıyor. Çünkü Yapay zekanın kültürü şekillendirme gücü, Batı merkezli şirketlerin elinde yoğunlaşıyor. Bu; Doğu sanatının, yerel dillerin ve mikro toplulukların görünürlüğünü giderek azaltıyor. Bazı sanatçılar bu boşluğu/boşlukları doldurmak için yerel verilerle eğitilmiş modeller geliştirmeyi ve yapau zeka çıktılarında manuel düzeltme yapmayı tercih edebiliyor.


Yapay zekanın bu denli kullanıcıya sunulduğu şimdili zamanların öncesinde, Batı gözünde, Doğu dünyasının algısal olarak farklı ve ya çarpıcı tanıtıldığı başka izlerde karşımıza çıkabiliyor. Örneğin, genel olarak Orta Doğu bölgesi için videolarda genellikle sarı veya sepya diyebileceğimiz, egzotik, kurak ve geri kalmış bir filtre kullanılmaktaydı. Böyle bakıldığı zaman, Doğu estetiğini Batı gözünden yapay zekaya anlatmak, bizi zaten Batı gözünden bakmaya zorlamış olmuyor mu? AI Data setlerinin, Batı kaynaklı bir veri sisteminin daha fazla olduğunu da göz önüne alırsak aslında Doğu’nun anlatılma biçiminin yine Batı kaynaklı bir şekilde üretildiğini zaman zaman görebiliyoruz.


Hali hazırda yapay zekanın Batı odaklı veri, değer ve estetiklerle sınırlı kalmasını engelleyecek bazı çalışmalar gerçekleştiriliyor. Mesela, Yapay Zeka Dekolonizasyonu (Decolonising AI) terimi üzerinde duracak olursak, farklı kültürlerin bilgi sistemlerini, estetiklerini ve dillerini teknolojiye dahil etme çabası içindedir. Amaç aslında, daha kapsayıcı, çok kültürlü ve adil bir yapay zeka sistemleri üretmektir. Ayrıca, Dekolonial (Decolonization) yaklaşım aktif bir tavırdır. Batı’nın hakim olduğu bilgi ve temsil sistemlerini sökmek (unlearn) ve kendi bilgi üretme biçimlerini geri kazanmak, yeniden kurmak demektir. 


Qassem Al-Kaabi / AFP / Getty


Bu konuyla ilgili biraz araştırma yaptığımızda karşımıza çok değerli bir kaynak çıkıyor. Nick Couldry ve Ulises A. Mejias’ın The Cost of Connection isimli kitabı kesinlikle bu bahsettiğimiz konuyla doğrudan örtüşüyor. Mesela kitapta veri kolonileşmesi kavramını ortaya koyduklarını görüyoruz. Kitap, içinde bulunduğumuz bağlantılı çağda verinin, insan yaşamının ve toplumsal ilişkilerin nasıl kâr amaçlı sömürü nesnesi haline geldiğini tartışıyor. Bu ilişkiler, kitabı biraz daha inceleyip devam ettiğimizde başka ilişkiler ışığında tekrar şekilleniyor.


Kitabın ışık tuttuğu bazı kilit kavramlardan bahsetmek gerekirse; Veri Kolonileşmesi, Veri İlişkileri, Sosyal Önbellekleme ve Bulut İmparatorluğu gibi kavramlardan bahsettiğine rastlıyoruz. İnsanlarla teknolojik altyapılar arasındaki ilişki ağları kurulması ve insanların veri üretim süreçlerine dahil edilmesi, günümüzde karşımıza çıkan ve kitapla bağlantısının çok güçlü olduğu kısımlardan sadece bazıları diyebiliriz. Yazarlarımıza göre, daha önce kolonileştirilmiş topraklar ve emek buharlaşan kaynaklar iken, bugün kolonileştirilmesi gereken şey “insan yaşamının kendisi” haline geliyor. Çünkü haklı olarak günümüzde neredeyse her hareket, ilişki, içerik ve algı veriye dönüşebiliyor. İnsanlar dijital cihazlarla bağlantılı hale geldikçe, bu ilişkiler birer veri akışı altyapısına dahil ediliyor. Michael Kwet’e ait olan Digital Ecosocialism adındaki eleştiri yazısına değinmeden geçmek istemiyorum. Çünkü ele aldığımız Decolonizing AI konusuyla güçlü bağlantı noktaları var. Mesela yazıda yapılan bir önermede olduğu gibi, fikri mülkiyet sistemleri (copyright, patent gibi) teknoloji şirketlerine kültür üzerindeki kontrolü verir. Bu durum, kültürel motiflerin, yerel desenlerin ya da geleneksel motiflerin ticarileştirilmesine ve dış yorumlarla özünden koparılmasına zemin hazırlamaktadır. Yazı dijital bölünmenin sadece cihaz erişimiyle sınırlı olmadığını; altyapı, sermaye, eğitim, yazılım kapasitesi gibi derin katmanları içeriyor. Bu, daha önceden bu yazıda bahsettiğimiz doğudaki sanatçıların “arka planda kalması” tespitine denk sayılabilir. Çünkü batı ile kıyasladığımızda, doğuda altyapıya erişim, sermaye, eğitim ve etkili platform kullanımı açısından dezavantajlı olabilir.


Nick Couldry ve Ulises A. Mejias, The Costs of Connection: How Data Is Colonizing Human Life and Appropriating It for Capitalism, 2019
Nick Couldry ve Ulises A. Mejias, The Costs of Connection: How Data Is Colonizing Human Life and Appropriating It for Capitalism, 2019

Digital Ecosocialism yazısında vurgulanan Big Tech Hegomanyası esasen bahsetmek istediğim diğer bir konu olan algoritmik önyargıların altyapısıdır. Dijital kapitalizmin kalbinde veri akışları ve algoritmik sıralama sistemleri yer almaktadır. Yani bu sistemler kültürel temsilleri de sıralıyor ve neyin görünür, neyin gizli olacağını belirleyebiliyor. Dolayısıyla, ekosistemsel sömürü ile algoritmik önyargı aynı yapının iki yüzü diyebiliriz. Bu ayrıca Couldry ve Meijas’ın Data Colonialism kavramıyla da örtüşüyor.


“ Veri, insanların yaşamlarından sürekli çıkarılan bir hammaddeye dönüştürülmüştür.”



Peki, nedir bu Algoritmik Kültürel Önyargı?Algoritmik kültürel önyargı, bir yapay zeka modelinin eğitildiği verilerdeki kültürel tercihleri, stereotipleri ve eksikleri aynen veya bozulmuş halde yeniden üretmesini anlamına gelmektedir. Yani model “tarafsız” değil; hangi kültürün daha çok, nasıl ve hangi bağlamda temsil edildiğine bağlı olarak farklı çıktılar üretiyor. Bu başlık altında, veri dengesizliği, etiketleme, proxy özellikleri, değerlendirme metrikleri ve transfer learning gibi önemli konularda bazı sapmalara rastlanıyor. Yapay zeka modellerinde çoğu test, Batı merkezli benchmark’lar kullanır. Bu nedenle model Batı’daki performansı optimize edilince diğer kültürde hata payı artıyor. Büyük, genel modeller Batı merkezli bir Transfer Learning işleminden sonra ince ayar yapılsa bile temel temsilci ağı genelde Batı normlarını taşımaya devam ediyor.


Özetle, Algoritmik kültürel önyargı, yapay zekaların “kendi bildiği” bir dünya yaratmasıdır diyebiliriz. Moda, sokak, renk-kodları gibi yüzeysel görünen seçimler aslında hangi kültürlerin dijital hafızada kalıp hangilerinin silineceğini belirler. Yapay zeka estetiğini eleştirirken sadece görüntüye değil, onu var eden altyapı, enerji, veri, kültürel akış zincirlerine bakmak gerekir. Bu zinciri görünür kılmak, hem estetik hem de politik bir jest olabilir. Bu yüzden estetik kayıp yalnızca görsel bir sorun değil, kültürel mirasın dijital geleceğiyle ilgili bir varoluş meselesidir. 


Bize Ulaşın

bottom of page