Çinli teknoloji devinden çapıcı yapay zeka tespiti: Bağlamı anlamıyorlar

İnsanlar anında öğreniyor, modeller hatırlamaya çalışıyor

Araştırmacılar, gelecekte yapay zeka modellerinin denetimli ortamların dışına çıkabilmesi için “bağlam öğrenmenin” model dizaynının merkezine yerleştirilmesi gerektiğini savunuyor. Araştırmacılara nazaran mevcut sistemler, gerekli bilgilere erişebilmelerine karşın bağlamı gerçek formda yorumlayamadıkları için görevleri dengeli biçimde yerine getiremiyor.

Tencent’e nazaran insanlar bu süreçlerde geçmişte ezberlenmiş sabit bilgiye değil, o anda karşılarına çıkan bağlama dayanarak öğreniyor. Buna rağmen mevcut büyük lisan modelleri, yüklü olarak ön eğitim sırasında parametrelerine gömülmüş bilgiyi geri çağırıyor. Çıkarım basamağında ise yeni bilgiyi faal biçimde öğrenmek yerine, statik iç belleğine yaslanıyor.

Araştırmada bu durum, “yapısal bir uyumsuzluk” olarak tanımlanıyor. Modeller, bildikleri şeyler üzerinden akıl yürütmek için optimize edilmiş durumda. Meğer kullanıcılar, daima değişen ve dağınık bağlamlara bağlı sorunları çözebilen sistemlere gereksinim duyuyor.

Bağlam öğrenmeyi ölçmek için yeni standart geliştirildi

CL-bench, klasik bilgi sorularına dayanan kıyaslamalardan farklı olarak her misyonun kendi bağlamını modele sunuyor. Bu yaklaşım temelde insanların öğrenme biçimine daha yakın. Ek olarak bunu daima öğrenme modelleriyle de karıştırmamak gerek. Birisinde model, kendi yüklerini daima güncellerken bağlan öğrenmede temel parametreler değişmeden kalıyor.

Ortalama muvaffakiyet yüzde 17

Öte yandan en yüksek puanı yüzde 23,7 ile OpenAI’ın GPT-5.1 modeli alırken, onu yüzde 21,1 ile Anthropic’in Claude Opus 4.5 modeli izledi. Çin merkezli modeller ortasında en uygun performans, Moonshot AI’ın Kimi K2 modeliyle beşinci sırada ve yüzde 17,6 düzeyinde gerçekleşti. Tencent’in kendi modeli Hunyuan 2.0, yüzde 17,2 skorla altıncı sırada yer aldı.

Ancak üstte saydıklarımız “iyi” istatistikler. En başarılı olan GPT-5.1 modeli bile hiçbir bağlam verilmediğinde vazifelerin yüzde 1’inden daha azını çözebildi.

Araştırma, bağlam öğrenmenin gelişmesi halinde insan-yapay zeka bağının de değişeceğini öngörüyor. Buna nazaran beşerler, modele data sağlayan aktörler olmaktan çıkıp, en hakikat ve varlıklı bağlamı tasarlayan “bağlam sağlayıcılara” dönüşebilir.

Ancak burada kritik bir sorun var. Tencent’e nazaran bağlam öğrenme süreksiz bir süreç. Model, bağlam penceresi kapandığında öğrendiklerini unutuyor. Asıl büyük soru ise şu: Bağlamdan edinilen bilgi nasıl kalıcı hale getirilebilir? Bu sırf olguları değil, hünerleri, tecrübesi ve kalıpları da kapsayan daha derin bir öğrenme manasına geliyor.

Bu ortada CL-Bench’e GitHub yahut Hugging Face ulaşabilirsiniz.

My Blog

Category Name

Meta, AI modellerinin eğitimi için özel işlemci geliştirecek

Ünlü profesörden kritik ihtar: İran savaşı “AI balonu”nun patlamasına yol açabilir

Microsoft, kimlik doğrulama uygulamasında güvenliği artırıyor

Recent Posts

Meta, AI modellerinin eğitimi için özel işlemci geliştirecek

Ünlü profesörden kritik ihtar: İran savaşı “AI balonu”nun patlamasına yol açabilir

Microsoft, kimlik doğrulama uygulamasında güvenliği artırıyor

En tehlikeli asteroid unvanını almıştı: 2024 YR4 için rahatlatan haber

Meta, AI modellerinin eğitimi için özel işlemci geliştirecek

Ünlü profesörden kritik ihtar: İran savaşı “AI balonu”nun patlamasına yol açabilir

Microsoft, kimlik doğrulama uygulamasında güvenliği artırıyor

Meta, AI modellerinin eğitimi için özel işlemci geliştirecek

Ünlü profesörden kritik ihtar: İran savaşı “AI balonu”nun patlamasına yol açabilir

Microsoft, kimlik doğrulama uygulamasında güvenliği artırıyor

Çinli teknoloji devinden çapıcı yapay zeka tespiti: Bağlamı anlamıyorlar

Bir yanıt yazın Yanıtı iptal et

Recent Posts

Categories