Londra’daki King’s College London tarafından yapılan kapsamlı bir çalışma, günümüz önde gelen lisan modellerinin “stratejik karar verme” yeteneklerini memleketler arası kriz senaryolarında test etti. Araştırmada, GPT-5.2, Claude Sonnet 4 ve Gemini 3 Flash üzere büyük modeller “lider” rolleriyle 21 farklı savaş oyunu simülasyonuna sokuldu. Emel, model davranışlarının gerçek dünya kriz idaresine ışık tutup tutmayacağını değerlendirmekti.
Sonuçlar şaşırtıcıydı: 21 senaryonun 20’sinde (yani yaklaşık %95’inde) modellerden en az biri taktik nükleer silah kullanmayı seçti. Stratejik (büyük ölçekli) nükleer saldırılar daha ender olsa da üç kere görüldü. Bazen model yanlış değerlendirmeler sonucu bu kararı tetikledi.
Ayrıca modellerin hiçbiri “teslim olma” seçeneğini tercih etmedi; tansiyonu azaltan adımlar ya çok az kullanıldı ya da büsbütün göz gerisi edildi. Yumuşatma seçenekleri sunulmasına karşın birden fazla durumda tırmanış eğilimi baskın oldu. Bu sonuçlar model davranışlarının sadece teknik bir marifet seti olmadığını, tıpkı vakitte belli riskler taşıyan stratejik eğilimleri de yansıttığını gösteriyor.
Stratejik akıl mı, agresif içgüdü mü?
Bu çalışma yalnızca “şiddet eğilimi” ölçümünden ibaret değil. Modellerin kararları, insan gibisi fikir süreçlerini andıran karmaşık karar sistemleri içeriyordu. Rakibin niyetlerini kestirim etme, aldatıcı sinyaller verme ve kendi yeteneklerini kıymetlendirme üzere stratejik davranışlar gözlemlendi. Fakat bu süreçlerin sonucunda ortaya çıkan eğilimler, klasik insan stratejilerinden farklıydı.
Örneğin birtakım modeller, klasik barışçıl seçenekler yerine saldırgan adımları “daha avantajlı” gördü. Modeller, nükleer seçeneği tırmanış merdiveninde olağan askeri seçeneklerin bir uzantısı üzere ele aldı. Bu durum, nükleer silahı sırf bir savaş aracı değil, bir “stratejik araç” olarak değerlendirmeye açık hale getirdi.
Bu simülasyonların gerçek dünya için birebir geçerli olmayacağı sıkça vurgulansa da, model davranışlarının ulusal güvenlik ve kriz planlaması alanlarında kullanılacak araçlarda nasıl yansıyacağı önemli sorular doğuruyor. Bilhassa bu teknolojiler insan karar vericilere dayanak için kullanılırsa, agresif eğilimlerin tesiri daha da kritik hale gelebilir.
Bu sonuçlar neden değerli?
Bu çalışma iki ana açıdan dikkat çekiyor. Birincisi stratejik belirsizlik. Modeller sırf bilgi üreten araçlar değil; belirsizlik ve risk altında nasıl karar verdiğini gösteren “davranış profillerine” sahip. İkincisi ise nükleer seçenek algısı. Nükleer silah üzere son derece yıkıcı seçenekler, modeller tarafından tekraren ve birden fazla sefer süratli bir karar aracı olarak seçildi. Bu da, modeller insanlardan farklı önceliklere sahip olabileceğini ve birtakım şartlarda riskleri gereğince değerlendirmeden “sert” tahlilleri tercih edebileceğini düşündürüyor.
Bu üzere simülasyonlar, teknolojinin stratejik ortamlarda nasıl davranabileceğine dair erken göstergeler sunuyor. Çalışmanın müellifi da sonuçların “gelecekte insan karar takviyesi sistemlerinde dikkatle kıymetlendirilmesi gereken eğilimler” barındırdığını belirtiyor; bu nedenle geliştiriciler, siyaset yapıcılar ve güvenlik uzmanları bu tıp eğilimleri anlamak için daha fazla çalışma yapmalı. Yapay zekada evvel firmalardan biri olan Anthropic’in ordu ile ortak çalışmada temkinli davranması umut verici. Umarız OpenAI, Google ve X de bu hususta emsal bir yaklaşım gösterir. Araştırma makalesinin tümüne bu adresten ulaşabilirsiniz.







Bir yanıt yazın