Codex’in gerisindeki teknoloji: AI kodlama casuslarının ayrıntıları

Posted by

Geçtiğimiz cuma, OpenAI mühendisi Michael Bolin, şirketin Codex CLI kodlama casusunun nasıl çalıştığını teknik ayrıntılarıyla paylaştı. Geliştiriciler, AI tabanlı bu araçların kod yazma, test çalıştırma ve kusurları düzeltme süreçlerini insan nezaretinde nasıl yönettiğini artık daha düzgün anlayabiliyor. Bolin’in açıklamaları, Aralık ayında yayımladığımız “AI casuslar nasıl çalışıyor?” makalesini tamamlayıcı nitelikte.

Claude Code ve GPT-5.2 takviyeli Codex üzere AI kodlama casusları, prototipleri süratlice üretme, arayüzleri oluşturma ve standart kod bloklarını otomatik yazma hususlarında yeni bir düzeye ulaştı. OpenAI’nin paylaşımı, Codex’in tasarım ideolojisini ve AI casusların günlük işlerde nasıl pratik hale geldiğini gözler önüne seriyor.

Sınırlamalar ve insan gözetimi

Bu araçlar kusursuz değil ve birtakım yazılım geliştiricileri tarafından hâlâ tartışmalı. OpenAI, Codex’i kendi eserini geliştirmek için kullandığını belirtiyor. Bizim tecrübelerimiz de gösteriyor ki, kolay vazifelerde epey süratli çalışıyorlar lakin eğitim verisinin ötesinde hassas ve yanılgıya açık olabiliyorlar. Temel proje çerçevesi süratlice ortaya çıkıyor, fakat ayrıntıların tamamlanması birden fazla vakit kusur ayıklama ve sınırlamaları aşmak için ekstra insan müdahalesi gerektiriyor.

Mühendislik zorluklarına açıklık

Bolin’in paylaşımı, bu zorluklardan kaçınmıyor. Quadratic prompt büyümesinin verimsizliğinden, önbellek yanılgılarının performansı düşürmesinden ve MCP araçlarının tutarsız listelenmesi üzere yanılgılardan bahsediyor.

OpenAI, ekseriyetle eserlerinin iç işleyişine dair bu kadar teknik ayrıntı paylaşmıyor. Fakat Codex için yapılan bu açıklama, programlama misyonlarının büyük lisan modelleri için ne kadar uygun olduğunu gösteriyor. Ayrıyeten, OpenAI Codex CLI istemcisini GitHub üzerinden açık kaynak olarak sunuyor; ChatGPT yahut Claude web arayüzlerinde ise bu imkan yok.

Agent Loop: Kodlama Casusunun Kalbi

Bolin’in yazısı, “agent loop” olarak isimlendirdiği sürece odaklanıyor. Bu döngü, kullanıcı, AI modeli ve modelin kodlama işlerini gerçekleştirmek için çağırdığı yazılım araçları ortasındaki etkileşimi yönetiyor.

AI casuslarının merkezinde tekrar eden bir döngü bulunuyor. Kullanıcıdan alınan giriş, modele gönderilecek metinsel prompt hâline geliyor. Model ya direkt karşılık üretiyor ya da bir araç daveti talep ediyor (örneğin, bir evrak okuma yahut komut çalıştırma). Araç daveti gerçekleştiğinde, casus çıktıyı prompt’a ekliyor ve modeli tekrar sorguluyor. Bu süreç, model araç çağrmayı bırakıp kullanıcıya direkt karşılık verene kadar devam ediyor.

İlk prompt nasıl oluşturuluyor?

Codex, OpenAI’nin Responses API’sine gönderilecek birinci prompt’u birkaç bileşen kullanarak oluşturuyor. Her bileşenin önceliği farklı: sistem, geliştirici, kullanıcı yahut asistan.

Instructions: Kullanıcı tarafından belirlenmiş yapılandırma evrakından yahut CLI ile gelen temel talimatlardan geliyor.

Tools: Modelin çağırabileceği fonksiyonlar; shell komutları, planlama araçları, web arama ve MCP sunucuları aracılığıyla sağlanan özel araçları kapsıyor.

Input: Sandbox müsaadeleri, opsiyonel geliştirici talimatları, ortam bilgisi ve kullanıcının bildirisini içeriyor.
Sohbetler ilerledikçe, her yeni çeşit evvelki bildiri ve araç davetlerini içeriyor. Bu, prompt’un her etkileşimde büyümesine yol açıyor ve performansı etkiliyor. Codex, “previous_response_id” kullanmadığı için her API daveti büsbütün stateless; yani tüm geçmişi tekrar gönderiyor. Bu yaklaşım, bilgi saklamayan kullanıcılar için sistemi kolaylaştırıyor ve “Zero Veri Retention” seçeneğini destekliyor.

Performans ve önbellek yönetimi

Prompt uzunluğunun daima artması, AI modelinin tek seferde işleyebileceği metin ölçüsünü sınırlayan context window ile ilgili. Codex, token sayısı eşik pahasını aştığında sohbetleri otomatik olarak sıkıştırıyor ve evvelki versiyonlardaki manuel komut muhtaçlığını ortadan kaldırıyor.

Bolin, ilerleyen paylaşımlarda CLI’nin mimarisi, araç uygulamaları ve Codex’in sandbox modeli hakkında daha fazla teknik ayrıntı vereceğini belirtiyor.

Bir yanıt yazın

E-posta adresiniz yayınlanmayacak. Gerekli alanlar * ile işaretlenmişlerdir