Google Project Genie ile kendi dünyalarınızı oluşturmak artık mümkün

Posted by

Google DeepMind, geçtiğimiz yaz tanıttığı Genie 3 isimli yapay zeka modelini birinci sefer Google dışındaki kullanıcılara açtı. Project Genie ismiyle sunulan bu deneysel prototip, kullanıcıların kendi etkileşimli dünyalarını oluşturmasına, keşfetmesine ve tekrar kurgulamasına imkan tanıyor. Fakat bu ileri seviye tecrübeye erişmek için kimi kıymetli kısıtlamalar bulunuyor.

Project Genie’ye kimler erişebiliyor?

Project Genie, aylık 250 dolar fiyatlı Google AI Ultra aboneliğine sahip, ABD’de yaşayan ve 18 yaşından büyük kullanıcılara sunulmuş durumda. Google, bu kademede erişimi hudutlu tutarak Genie 3’ün gerçek dünyadaki kullanım senaryolarını ve kullanıcı etkileşimlerini gözlemlemeyi hedefliyor.

Genie 3 nedir ve farklı olan ne?

Genie 3, klasik 3D sahneler üreten sistemlerden farklı olarak bir “world model” yani dünya modeli olarak tanımlanıyor. Bu yaklaşım, sırf bir ortamı görselleştirmek yerine kullanıcının hareketlerine ve etkileşimlerine bağlı olarak ortamın geleceğini gerçek vakitli olarak üretebiliyor. Sistem, fizik kurallarını ve objeler ortası etkileşimleri simüle edebiliyor ve bu sayede robotik, animasyon, kurgu, tarihî yer keşfi üzere pek çok alanda kullanılabilecek esnek bir altyapı sunuyor.

Google DeepMind, Genie 3’ü bilhassa yapay genel zeka (AGI) gayeleri doğrultusunda geliştirdiğini vurguluyor. Satranç yahut Go üzere kapalı sistemlerin tersine Genie 3, gerçek dünyanın çeşitliliğini modellemeye odaklanıyor.

Project Genie nasıl çalışıyor?

Project Genie, Genie 3, Nano Banana Pro ve Gemini modellerinin birlikte çalıştığı bir web uygulaması olarak sunuluyor. Tecrübenin merkezinde üç temel etkileşim biçimi yer alıyor.

World Sketching etabında kullanıcı, metin girdileriyle ya da oluşturulan yahut yüklenen görsellerle kendi dünyasının temelini atıyor. Karakter tarifi, kamera açısı (birinci şahıs, üçüncü şahıs yahut izometrik), hareket biçimi üzere ayrıntılar bu evrede belirleniyor. Nano Banana Pro, oluşturulacak dünyanın bir ön izlemesini “taslak” olarak sunuyor ve kullanıcıya sahneye girmeden evvel ince ayar yapma imkanı veriyor.

Daha sonra World Exploration süreci başlıyor. Kullanıcı dünyada ilerledikçe Genie 3, izlenecek yolu ve çevresel ayrıntıları gerçek vakitli olarak üretmeye devam ediyor. Kamera açıları hareket sırasında değiştirilebiliyor ve ortam, kullanıcının aksiyonlarına nazaran şekilleniyor.

Son basamak olan World Remixing, mevcut dünyaların yine yorumlanmasına odaklanıyor. Kullanıcılar, diğerleri tarafından oluşturulmuş dünyaların istemlerini temel alarak yeni varyasyonlar üretebiliyor, küratörlü galeri içeriklerinden ilham alabiliyor ve ortaya çıkan tecrübeleri görüntü olarak indirebiliyor.

Bir oyun motoru değil

Yukarıda söylediklerim akıllara kusursuz bir oyun motoru üzere gelse de Google, Genie 3’ün bir oyun motoru olmadığının bilhassa altını çiziyor. Ortaya çıkan tecrübeler görsel olarak oyunları andırsa da, klâsik oyun mekaniği bu sistemin bir kesimi değil. Ayrıyeten teknik sınırlamalar da mevcut. Oluşturulan dünyalar en fazla 60 saniyelik bir mühletle hudutlu ve görsel çıktı 24 fps ile 720p çözünürlük düzeyinde sunuluyor.

Google, sistemin birtakım durumlarda istemlere tam ahenk göstermeyebileceğini, fizik kurallarının her vakit gerçeğe birebir karşılık gelmeyebileceğini ve karakter denetiminde gecikmeler yaşanabileceğini de açıkça belirtiyor. Ayrıyeten, geçen yıl duyurulan ve keşif sırasında dünyayı değiştiren tetiklenebilir olaylar üzere kimi gelişmiş özellikler bu sürümde şimdi yer almıyor.

Bir yanıt yazın

E-posta adresiniz yayınlanmayacak. Gerekli alanlar * ile işaretlenmişlerdir