Yıldız Teknik Üniversitesi’ndeki Cosmos araştırma takımı tarafından, Türkçe doğal lisan sürece (NLP) misyonlarında yüksek performans hedefleyen Cosmos T1 isimli açık kaynaklı yapay zeka lisan modeli resmen kullanıma sunuldu. 9 milyar parametre ile geliştirilen Cosmos T1, Türkçe’nin karmaşık yapısını ve kültürel bağlamını derinlemesine öğrenme yeteneğiyle dikkat çekiyor. Türkçe düşünebilen yeni jenerasyon yapay zeka modeli Cosmos T1, Google’ın yapay zeka modeli Gemma 2 modelinin üzerine inşa edildi. Cosmos T1, Türkçe GSM8K testinde yüzde 77,41 doğruluk oranına ulaşarak 70 milyar parametreli Llama-3.1-70B modelinin (yüzde 66,13) ve Gemma-2-9B modelinin (yüzde 63,10) önüne geçmeyi başardı.
Cosmos T1’in eğitim sürecinde 200 milyar token’dan fazla Türkçe data işlendi. Evvelki lisan modellerinden farklı olarak, Masked Language Modeling (MLM) ile Türkçe’ye mahsus zorluklar üzerine odaklandı. 12 katmanlı decoder-only Transformer mimarisi üzerine inşa edilen model, Türkçe’nin ek-fiil yapılarını ve sondan eklemeli sözdizimini işlemek için optimize edildi. Cosmos T1, Hugging Face platformunda açık kaynak olarak kullanıma sunuldu. Cosmos T1’i ayrıyeten Cosmos LLM’in web sitesinden fiyatsız olarak test edebilirsiniz.
ChatGPT’den farklı olarak cevabın nasıl üretildiğini adım adım gösterdiklerine vurgu yapan Yıldız Teknik Üniversitesi Yapay Zeka ve Data Mühendisliği Kısmı Öğretim Üyesi Prof. Dr. Mehmet Fatih Amasyalı, şunları söyledi:
“ChatGPT ve gibisi modelleri geliştiriyoruz. T1 başkalarından farklı bir niyet sürecine sahip ve bu fikir sürecini Türkçe olarak yansıtıyor. Bütün art planda cevabın nasıl üretildiğini orta yüzden adım adım görebiliyoruz. Aslında Chat GPT ile farklı kulvardalar. Birçok kesim günümüzde bilgilerini sıhhat ve savunma sanayi üzere bu şekil firmalarla paylaşamıyor, paylaşmak istemiyor, paylaşmaması da çok doğal. Bunun yerine on-premise’de tahlil üretmeleri yani kendi makinelerinin çalışması gerekiyor. T1’in ve bizim öteki ürettiğimiz modellerin hepsi aslında açık yüklü olarak yayınlanıyorlar ve beşerler da bu modelleri kendi bilgisayarlarına kurup kendi şirketlerinde özgürce ve rahatça kullanabiliyorlar.”
Cosmos T1’in Google’ın yapay zeka modeli Gemma 2 üzerinde düşünen bir model olarak geliştirildiğini belirten Amasyalı, “Fakat Türkçesini biz burada çok çok güzelleştirmeyi düşündük ve ‘thinking’ düşünen bir model geliştirdik. Gemma 2 modelinde temelde bu türlü bir özellik yok. Gemma 2 soru sorunca yanıt veren bir model, Cosmos T1’de ise bir niyet süreci, onun gerisinden bir yanıt üretme süreci var ki bu da modellerin performansını çok artırıyor. Evvel düşünüp sonra karşılık verdiğinde direkt karşılığa geçmektense çok daha uygun bir performans sergiliyor” tabirlerini kullandı.







Bir yanıt yazın