Arama

Select theme:

Araştırma: İnternetteki tek bir sahte sayfa bile yapay zeka modellerini yanıltabilir

Bir yapay zeka asistanına "en iyi beş kulaklığı öner" dediğinizde asistan yanıtı yalnızca eğitildiği bilgiden üretmez. Çoğu zaman o anda canlı bir internet araması yapar, çıkan sayfaları okur ve bunları derleyerek size sıralı bir öneri sunar. Bu yöntem yanıtları güncel tutar. Ama yeni bir kırılganlık da yaratır. Asistanın güvenilirliği artık yalnızca modele bağlı değildir. İnternette o an ne bulduğuna da bağlıdır. 

Peki birileri o sayfaları kasıtlı olarak kirletirse ne olur?

Hong Kong Çin Üniversitesi’nden Minghao Luo ve Liang Chen'in Haziran 2026'da yayınladığı bir çalışma tam da bunu ölçtü ve rahatsız edici bir sonuca ulaştı. Arama sonuçlarına yerleştirilen tek bir sahte sayfa bile, bir yapay zeka asistanını daha önce hiç duymadığı, tamamen uydurma bir markayı önermeye itebiliyor. 15 Mart 2026'da Çin devlet televizyonu CCTV'nin Tüketici Hakları programı, internete sahte yorumlar pompalayan ticari bir sektörü ifşa etti. South China Morning Post'un aktardığına göre, hedefteki ürün Apollo-9 adlı, var olmayan bir akıllı bileklikti. Sahte içerik internete yayıldıktan sonra iki yapay zeka asistanı bu hayali ürünü "akıllı sağlık bileklikleri" önerilerinin tepesine yerleştirdi.

Yıllarca markalar Google sıralamasında üst sıraya çıkmak için arama motoru optimizasyonu (SEO) kullandı. Yapay zeka asistanları yanıtları doğrudan derlemeye başlayınca oyunun hedefi değişti. Artık bir listede üstte çıkmak değil, asistanın okuduğu içeriğin içine sızmak amaçlanıyor. Sahte yorumlar ve uydurma sıralamalarla internet, asistanın okuyacağı noktada kirletiliyor.

Araştırma ne yaptı ne buldu?

Luo ve Chen, FORGE adını verdikleri bir düzenekle 12 ticari ve açık kaynaklı modeli 225 ürün ve 15 kategoride test etti. Yöntem şuydu: arama sonuçlarındaki gerçek bir markayı yerel olarak sahte bir markayla değiştirip modelin bu sahte markayı kaç kez önerdiğini ölçtüler. Yalnızca marka adı değiştirildiği için, önerideki her değişiklik doğrudan bu müdahaleye bağlanabiliyordu.

Araştırmanın üç bulgusu, beklenenin tam tersini gösteriyor. Arama sonuçlarının ilk sırasına konan tek bir kirli sayfa, en kırılgan modellerde denemelerin yaklaşık dörtte birinde sahte markayı önerttirdi aynı sayfa ikinci ya da onuncu sıraya alındığında etkisi neredeyse sıfıra düştü. Model ilk okuduğu kaynağa orantısız biçimde yaslanıyor, gerisi pek fark etmiyor. Üç kirli sayfayla bazı modellerde kanma oranı yüzde 70'i aştı.

İkincisi, daha büyük ve daha pahalı modeller daha güvenli değil. Kapalı kaynaklı ticari sürümlerin açık kaynaklı modellerden daha dayanıklı olmadığı görüldü. Hatta aynı aileden büyük model, küçük kardeşinden daha sık kandı. Kırılganlık "model ne kadar yetenekli" ekseninde ilerlemiyor.

Üçüncüsü, akıl yürütme durumu kötüleştiriyor. Adım adım düşünme özelliği açık modeller, kapalı olanlara göre daha sık kandı. Model kirli kanıt üzerinde uzun uzun düşününce, sahte markayı eleyeceğine kendini ona ikna ediyor. Dirençli kalan modeller sahte markayı fark edip uzun uzun üzerinde durarak reddediyor; kananlarsa onu yüzeysel bir değerlendirmeyle benimseyip geçiyor. Yani koruyan şey düşünmenin varlığı değil, derinliği.

Teyitçilik açısından önemli bir bulgu da var. Kandırılan modeller çoğu zaman sahte markanın adını öylece tekrarlamadı ona inandırıcılık da kattı. Bir ekran koruyucu örneğinde iki farklı model, uydurma markayı önerirken kaynak sayfalarda hiç bulunmayan referanslar uydurdu. 

Yani model yalnızca yanlış bir bilgiyi aktarmıyor, o bilgiye uydurma bir güvenilirlik zırhı giydiriyor.

Sorun çözülebilir mi?

Akla gelen ilk çözüm, modele "şüpheci ol, tanımadığın markalara güvenme" demek. Araştırmacılar bunu denedi ve sonuç ters çıktı. Bu talimat ortalamada kırılganlığı azaltmadı, özellikle kapalı kaynaklı modellerde belirgin biçimde artırdı. Çünkü talimat, modeli kirli markayı önbilgisiyle baştan elemek yerine onunla uğraşmaya zorluyor ve tam da güvende olacağı yerde onu riske atıyor. 

İkinci yol, yalnızca birden fazla kaynakta doğrulanan markaları kabul eden filtreler kurmaktı bu filtreler sahteyi büyük oranda yakaladı ama meşru önerilerin yarısından fazlasını da eleyerek asistanı işe yaramaz hale getirdi. Araştırmacıların vardığı sonuca göre sorun, kullanıcının daha dikkatli olmasıyla ya da tek bir uyarıyla çözülmüyor asıl iş, bilgi asistana ulaşmadan önce, kaynakların güvenilirliğinin tartıldığı arama katmanında yapılmalı.

Teyitçiler için ne anlama geliyor?

Bu araştırma, yanlış bilgiyle mücadelede dikkati yeni bir katmana taşıyor. Artık yalnızca "bu görsel sahte mi, bu video gerçek mi" diye sormak yetmiyor "bana öneri sunan yapay zeka neyle besleniyor" diye de sormak gerekiyor. Çünkü kirli içerik, alıştığımız hiçbir uyarı işaretini vermiyor model konudan sapmıyor, talebi reddetmiyor, tuhaf bir dil kullanmıyor. İstenen şeyi tam olarak yapıyor, yalnızca listenin tepesinde uydurma bir marka oluyor.

Pratik çıkarım sade. Bir yapay zeka asistanının önerisini nihai bir hüküm değil, kaynağı sorgulanabilir bir derleme olarak görmek en sağlıklısı. Özellikle markaların belirsiz olduğu alanlarda, asistanın saydığı bir ismi tanımıyorsanız onu bağımsız olarak aramak çok özgüvenli ve ayrıntılı görünen gerekçelere fazladan şüpheyle yaklaşmak işe yarar, çünkü o ayrıntının kendisi de üretilmiş olabilir. 

Son olarak bir dürüstlük notu: Araştırmacılar, kullandıkları saldırı yönteminin en gelişmişi olmadığını, dolayısıyla sonuçların gerçek kırılganlığın alt sınırı sayılması gerektiğini açıkça belirtti. Yani tablo, daha iyi değil, muhtemelen daha kötü.

Ali Osman Arabacı teyit.org

Benzer Makaleler: