Google, açık yüklü Gemma 3 modeli üzerine inşa edilen yeni çeviri modeli ailesi TranslateGemma’yı duyurdu. TranslateGemma, ortalarında Türkçe, İngilizce, İspanyolca, Fransızca, Çince ve Hintçe üzere yaygın lisanların de bulunduğu 55 farklı lisanı destekliyor. Bu geniş lisan yelpazesi modeli hem geliştiriciler hem de çok lisanlı uygulamalar için dikkat cazibeli hale getiriyor. Google’ın duyurusunun zamanlaması ise dikkat cazibeli. Çünkü bir gün evvel OpenAI, sessiz sedasız ChatGPT Translate özelliğini kullanıma almıştı. ChatGPT Translate, söz kelime çeviriden fazla bağlam ve ton doğruluğuna odaklanan bir yaklaşım sunuyor. Fakat yaptığım denemelerde önemli eksiklikleri olduğunu tespit ettim. Çünkü bir çeviri aracından çok çeviri görünüme sokulmuş sohbet robotu üzere davranıyor. Aşağıdaki haberde bahsettiğim önemli sorunu görebilirsiniz.
3 farklı sürüme sahip
Öte yandan TranslateGemma ise daha çok model mimarisi ve performans verimliliği üzerinden konumlanıyor. TranslateGemma, 4B, 12B ve 27B parametre olmak üzere üç farklı sürümle sunuluyor. Google’ın paylaştığı teknik datalara nazaran 12B parametreli model, WMT24++ benchmark testlerinde, temel alınan Gemma 3 27B modelinden daha yüksek performans sergiliyor.
Google, 4B modelin taşınabilir aygıtlarda çıkarım (inference) için optimize edildiğini, 12B modelin ise tüketici sınıfı dizüstü bilgisayarlar için uygun olduğunu belirtiyor. En büyük model olan 27B sürümü ise daha yüksek donanım ihtiyaçlarına sahip ve bulut ortamında tek bir NVIDIA H100 üzere güçlü bir GPU ile çalıştırılması öneriliyor. TranslateGemma’nın yetenekleri sadece metinle hudutlu değil. Vistra manzara çeviri benchmark testlerinde yapılan değerlendirmeler, modelin manzaralar içindeki metinleri çevirme konusunda da başarılı olduğunu ortaya koyuyor. Google, bunun için ince ayarlar yapmadığını söylüyor.
Eğitimde Gemini detayı
Bununla birlikte şirket, TranslateGemma’daki bu yüksek “zeka yoğunluğunun” ardında iki basamaklı özel bir eğitim süreci bulunduğunu açıkladı. Birinci kademede, Kontrollü İnce Ayar (Supervised Fine-Tuning) prosedürü kullanıldı. Bu süreçte Gemma 3 modelleri, hem insan tercümanlar tarafından hazırlanmış metinlerle hem de Gemini modelleri tarafından üretilmiş yüksek kaliteli sentetik bilgilerle eğitildi. İkinci evrede ise Pekiştirmeli Öğrenme (Reinforcement Learning) devreye alındı. Bu etapta MetricX-QE ve AutoMQM üzere gelişmiş ölçüm sistemlerini içeren birden fazla ödül modeli, çevirilerin daha doğal, akıcı ve bağlama uygun hale gelmesi için kullanıldı.
Nasıl kullanılır?
TranslateGemma modelleri, denemek yahut kendi projelerinde kullanmak isteyenler için Kaggle ve Hugging Face platformları üzerinden indirilebilir durumda. Ayrıyeten Gemma Cookbook aracılığıyla keşfedilebiliyor ve Vertex AI üzerinden dağıtıma alınabiliyor.







Bir yanıt yazın