Bugün yaygın olarak kullanılan ChatGPT ve Gemini üzere büyük lisan modelleri (LLM), bir nevi sanal asistanlar olarak konumlandırıldıkları için, kullanıcılarla kurdukları bağlantı de interaktif bir arama motoru tadında oluyor. Lakin son periyotta yapay zekâ alanında yaşanan gelişmeler, daha özgün tecrübeler sunabilecek, daha karakteristik yapay zekâların da vakitle hayatımıza gireceğini gösteriyor. Örneğin Meta, şirketlerin kurumsal kimliklerini yansıtacak özelleştirilmiş yapay zekâlar geliştirmeyi planlıyor. Başka yandan kullanıcıların yapay zekâları kendi tercihleri doğrultusunda şekillendirebileceği imkânlar da giderek artıyor. Tam da bu periyotta ortaya çıkan değişik bir proje, yapay zekâların bugünkünden çok farklı tecrübelere de kapı aralayabileceğini gösteriyor. Reddit’teki r/LocalLLaMA topluluğundan bir geliştirici, yalnızca 1800 ile 1875 yılları ortasına ilişkin metinleri kullanarak sıfırdan bir büyük lisan modeli eğitti. Sonuçta ortaya, çağdaş dünyanın büyük bir kısmından habersiz, bir anda geleceğe atılmış bir vakit yolcusu üzere “gördüklerini” anlamlandırmaya çalışan bir yapay zekâ çıktı. Cep telefonlarının, arabaların ya da 1875’ten sonra yaşanan hiçbir gelişmenin farkında olmayan bu yapay zekâyla yapılan konuşmalar ise hem eğlenceli hem de düşündürücü.
TimeCapsuleLLM olarak isimlendirilen model, toplam 1,2 milyar parametreye sahip ve yaklaşık 90 GB’lık bir data kümesiyle eğitildi. Data seti; periyodun kitapları, akademik mecmuaları, türel metinleri, dini yazılar ve tıbbi makalelerden oluşuyor. Üstelik sırf model değil, kullanılan tokenizer ((yazıyı modelin anlayabileceği token’lara ayıran mekanizma) da tıpkı tarihî data üzerinde özel olarak eğitildi. Böylelikle model, lisanı sadece söz seviyesinde değil, devrin yazım biçimi ve kavram dünyasıyla birlikte öğrenmiş oldu. Eğitim süreci yaklaşık 182 bin adım sürdü ve bunun için bulut servisleri üzerinden kiralanan bir H100 SXM GPU kullanıldı. Teknik açıdan bakıldığında bu, günümüzün dev modelleriyle kıyaslandığında mütevazı sayılabilecek bir ölçek. Fakat asıl farklı olan, bu sonlu ve tarihsel data setinin modelin “dünyayı algılayış biçimini” nasıl şekillendirdiği.
Telefonun İcadından Haberdar Olmayan Model, “Telefon” Denince Gizemli Bir Aygıt Olarak Algılıyor
Ortaya çıkan en dikkat cazip örneklerden biri “telefon” sözüyle ilgili. Bildiğimiz üzere telefon 1876 yılında icat edildi ve modelin data seti bu tarihten çabucak evvel sona eriyor. Münasebetiyle model için “telephone” sözü, somut bir icattan çok belgisiz ve gizemli bir kavram. Kullanıcılar bu sözle ilgili bir komut verdiğinde, model bunu kimi vakit bâtın bir diplomatik aygıt, kimi vakit da devletler ortası haberleşmede kullanılan gizemli bir aygıt olarak yorumluyor. Yani çağdaş manasını bilmediği bir kavramı, kendi tarihi bağlamı içinde “mantıklı” bir yere oturtmaya çalışıyor.
Bu durum birinci bakışta eğlenceli bir deney üzere görünse de, aslında yapay zekâların “düşünme” biçimlerine dair de enteresan ipuçları sunuyor. Baktığımız vakit günümüzdeki modeller, bu stil durumlarda bilgi setlerinde ya da internette bulunan bilgilere bel bağlıyor. Geçmişte kalmış bu yapay zekânın ise bahsedilen şeyi anlamlandırabilmek için kendi uğraşıyla çıkarımlar yapması gerekiyor. Bu da yapay zekâların kendilerine yabancı olan kavramları nasıl anlamlandırdığını görmemizi sağlıyor.
Diğer yandan bu proje, farklı formlarda eğitilmiş yapay zekâların kullanım alanlarına dair de yeni fikirlere ilham verebilir. Örneğin tarihi simülasyonlarda ya da görüntü oyunlarda, yalnızca muhakkak bilgilerle eğitilmiş yapay zekâlara yer verilebilir. Sadece 19. yüzyılı “bilen” bir yapay zekayla sohbet etmek, o periyodun niyet yapısını ve dünyayı algılama biçimini anlamak açısından son derece farklı bir tecrübe sunabilir.
Yapay zekânın GitHub sayfasına buradan, Hugging Face sayfasına ise buradan ulaşabilirsiniz.







Bir yanıt yazın