Google’dan ChatGPT Translate’e rakip: TranslateGemma sahnede

Posted by

Google, açık yüklü Gemma 3 modeli üzerine inşa edilen yeni bir açık çeviri model ailesini duyurdu. TranslateGemma ismi verilen bu yeni model seti, şirket tarafından “açık çeviri alanında kıymetli bir adım” olarak tanımlanıyor. TranslateGemma, İspanyolca, Fransızca, Çince ve Hintçe üzere yaygın lisanların de ortalarında bulunduğu 55 farklı lisanı destekliyor.

Duyuru, ChatGPT Translate’in çabucak akabinde geldi

TranslateGemma’nın tanıtımı, OpenAI’nin ChatGPT Translate özelliğini duyurmasından yalnızca saatler sonra yapıldı. ChatGPT Translate, söz kelime çeviri yerine ton ve bağlamı muhafazaya odaklanmasıyla öne çıkıyor. Araç, otomatik lisan algılamanın yer aldığı çift panelli bir arayüz sunuyor ve bu yapısıyla Google Translate gibisi tahlilleri andırıyor.

Farklı gereksinimlere nazaran üç model seçeneği

Google, TranslateGemma’yı 4B, 12B ve 27B olmak üzere üç farklı parametre boyutuyla kullanıma sundu. Şirketin paylaştığı bilgilere nazaran 12B’lik model, WMT24++ benchmark testlerinde, temel Gemma 3 27B modelinden daha âlâ sonuçlar verdi.

Geliştiriciler açısından bu durum değerli bir avantaj sağlıyor. Daha az parametreyle misal hatta daha âlâ performans sunan modeller, daha yüksek süreç suratı ve daha düşük gecikme müddeti manasına geliyor.

Mobil aygıtlardan buluta kadar geniş kullanım alanı

Google, 4B modelin taşınabilir aygıtlar için optimize edildiğini, 12B modelin ise günlük kullanıcıların dizüstü bilgisayarlarında rahatlıkla çalışabileceğini belirtiyor. En büyük model olan 27B ise tek bir NVIDIA H100 üzere güçlü bulut donanımlarına muhtaçlık duyuyor.

Vistra imaj çeviri benchmark testlerinde yapılan denemelerde, TranslateGemma’nın görsellerin içindeki metinleri çevirme konusunda da başarılı sonuçlar verdiği söz ediliyor. Üstelik bu yetenek, modelin bilhassa bu alan için eğitilmemiş olmasına karşın elde edilmiş durumda.

İki kademeli eğitim süreci dikkat çekiyor

Google, bu düzeydeki performansın gerisinde iki basamaklı özel bir eğitim süreci olduğunu vurguluyor. Birinci evrede, Gemma 3 modelleri; insan çevirileri ile Gemini modelleri tarafından üretilen yüksek kaliteli sentetik bilgiler kullanılarak kontrollü ince ayar sürecinden geçirildi.

İkinci evrede ise pekiştirmeli öğrenme devreye alındı. Bu süreçte MetricX-QE ve AutoMQM üzere gelişmiş kıymetlendirme metriklerini kullanan ödül modelleri, çevirilerin daha doğal ve bağlama uygun hale gelmesini sağladı.

Kaggle ve Hugging Face üzerinden erişilebiliyor

TranslateGemma modelleri, denemek yahut kendi projelerinde kullanmak isteyenler için Kaggle ve Hugging Face üzerinden indirilebilir durumda. Google, bu modellerin açık kaynak ekosisteminde yeni çeviri tahlillerinin önünü açmasını hedefliyor.

Bir yanıt yazın

E-posta adresiniz yayınlanmayacak. Gerekli alanlar * ile işaretlenmişlerdir