ABD’de yapılan bir araştırmada, veri havuzlarının,
halihazırda yaygın olarak kullanılan yapay zeka sohbet robotlarının yapı taşı
niteliğindeki LM’lerin politik görüşlerine etkisi üzerinde incelemeler yapıldı.
Bilim insanları bu kapsamda, 14 farklı LM üzerinde, yatay
eksende sağ ve sol olmak üzere ekonomik değerler, dikey eksende ise liberal ve
muhafazakar olmak üzere sosyal değerler bulunan siyasi pusula testini uyguladı.
Araştırmada ayrıca, LM’leri eğitmek için kullanılan
haberler, tartışma forumları, kitaplar, çevrim içi ansiklopediler gibi çeşitli
veri kaynaklarının içeriğindeki politik eğilimlerin, doğal dil işleme modeli
(NLP) üzerindeki etkisi ve söz konusu etki sonucunda LM’nin ürettiği
dezenformasyon ve nefret söylemleri incelendi.
YAPAY ZEKA, NEFRET SÖYLEMİ VE DEZENFORMASYONA SEBEP
OLUYOR
Araştırma sonucunda, eğitildikleri veri havuzundaki
kaynakların politik eğilimlerini taşıyan LM’lerin, görüşleriyle paralel
yönelimde nefret söylemi ve dezenformasyona sebep olduğu kaydedildi.
Buna ek olarak, Eski ABD Başkanı Donald Trump’ın göreve
başladığı 20 Ocak 2017 tarihi milat alınarak, bu tarihten önceki ve sonraki
veri setleriyle eğitilen LM’ler kıyaslandığında, Trump dönemi ve sonrasına ait
verilerle eğitilen LM’lerin eğilimlerinin, siyasi pusulada daha uçlarda
konumlandığı tespit edildi.
LM’ler arasında “BERT” varyantlarının “GPT” modellerine
kıyasla daha muhafazakar eğilimli olduğu ve aynı firmanın geliştirdiği çeşitli
LM’lerin politik eğilimlerinde de azımsanamaz farklılıklar gözlemlendiği
belirtildi.
Eğitilen LM’lerin ekonomik konulara kıyasla, sosyal konulara
daha taraflı yaklaşması, sosyal konulara ilişkin veri bolluğuna karşın ekonomik
yorumlama için daha geniş bir veri seti gerekliliğine bağlandı.
Hiçbir dil modelinin sosyal taraflılıktan tamamen arınmış
olamayacağını vurgulayan araştırmacılar, aşırı politik görüşleri temsil eden
kaynaklar kullanılarak eğitilen LM’lerin, toplumda var olan kutuplaşmayı daha
da derinleştirebilmesinin teorik olarak mümkün olduğu konusunda uyardı.
Araştırmanın sonuçları, “Association for Computational
Linguistics”in 61’inci yıllık toplantı raporunda yayımlandı.