Yapay zekanın güvenliği ve etkinliğini denetleyen yüzlerce test kusurlu çıktı

TEKNOLOJİ, 04 Kasım 2025 Salı, 15:37

Bilim insanları, yapay zekanın güvenliği ve etkinliğini kontrol eden 445 değerlendirme testinde "sonuçların geçerliliğini zedeleyecek" kusurlar olduğunu tespit etti.

İngiltere Yapay Zeka Güvenlik Enstitüsünden bilgisayar bilimciler ile Stanford, Berkeley ve Oxford üniversitelerinin de aralarında bulunduğu 14 kurumdan 29 araştırmacı, "Önemli Olanı Ölçmek: Büyük Dil Modeli Kıyaslamalarında Yapı Geçerliği" başlıklı bir çalışma yaptı.

Bilim insanları çalışmada, yapay zekanın alt dallarından olan "doğal dil işleme" ve "makine öğrenimi" alanlarının önde gelen konferanslarından alınan 445 değerlendirme testini sistematik olarak inceledi.

İncelemeler sonucunda, testlerin neredeyse hepsinin "sonuçların geçerliliğini zedeleyebilecek" kusurlara sahip olduğu sonucuna ulaşıldı.

Çalışmanın baş yazarı, Oxford İnternet Enstitüsünden Andrew Bean, çalışmaya ilişkin Guardian'a yaptığı açıklamada, kullanılan bu testlerin büyük teknoloji şirketleri tarafından piyasaya sürülen son yapay zeka modellerinin değerlendirilmesinde kullanıldığını söyledi.

Bean, değerlendirme testlerinin yapay zekayla ilgili tüm iddiaların temelini oluşturduğuna vurgu yaparak ortak tanımlar ve sağlıklı ölçümler olmadan modellerin gerçekten gelişip gelişmediğini anlamanın zorlaştığını kaydetti.

TEKNOLOJİ 04 Kasım 2025 Salı, 15:37

Yapay zekanın güvenliği ve etkinliğini denetleyen yüzlerce test kusurlu çıktı

Yıldırım Belediye Başkanı Yılmaz, karne törenine katıldı

Yılbaşından bu yana 23,9 ton uyuşturucu ele geçirildi

Hafta sonu iki Elektronik Yabancı Dil Sınavı yapılacak

Yıldırım'da 'Sokaklar Dönüşüyor' projesine destek

LGS sonuçlarının açıklanacağı tarih belli oldu

Özel'in de olduğu cemevindeki programa katılan CHP'lilerin parti üyelikleri askıya alındı