Alibaba’nın yeni AI modelleri akıllı telefonlarda mahallî olarak çalışabiliyor

Posted by

ABD’de yapay zeka dalı sancılı bir periyottan geçerken buna rağmen Çin merkezli şirketlerin model geliştirme yarışında sürat kesmediği görülüyor. Bu kapsamda Alibaba bünyesindeki Qwen grubu, yeni Qwen3.5 Small Model Series ailesini duyurdu.

Seri, sadece performans savıyla değil, düşük donanım ihtiyacıyla de dikkat çekiyor. O denli ki 2B parametreli sürümün iPhone 17 Pro Max’te mahallî olarak çalıştırıldığı, Reddit’te ise 4B versiyonunun aygıt üzerinde çalıştığını gösteren paylaşımların yer aldığı belirtiliyor. Modellerin, boyutunun 4 katı büyüklüğündeki modellere nazaran daha uygun performans gösterdiğinin altı çiziliyor. Dahası, güçlü amiral gemileriyle hudutlu kalmadan Poco F5 gibi Android aygıtlarda da mahallî kullanım mümkün görünüyor.

Bu gelişmenin manası, yapay zekanın nihayet hakikaten “cihaza inmesi”. Yani buluta bağlı, API anahtarı gerektiren ve kullanım başına fiyatlandırma yapan sistemler yerine internet olmadan da çalışabilen, büsbütün lokal bir büyük lisan modeli direkt telefonun içinde vazife yapabiliyor.

Dört model, dört farklı kullanım

Qwen3.5-0.8B, 2B, 4B ve 9B. 0.8B ve 2B parametreli dört ana modelden oluşan seri, bilhassa “tiny” ve “fast” senaryolar için optimize edildi. Bu modeller, batarya tüketiminin kritik olduğu edge aygıtlar ve taşınabilir sistemler için tasarlandı.

Serinin 4B modeli ise 262.144 token’lık mahallî bağlam penceresiyle hafif casus uygulamalarına yönelik güçlü çok modlu temel sunuyor. Ailenin en argümanlı üyesi olan Qwen3.5-9B, kompakt bir akıl yürütme modeli olarak konumlandırılıyor ve üçüncü taraf testlerde ABD merkezli rakiplerini geride bırakıyor. Şirketin paylaştığı datalara nazaran 9B modeli, açık kaynaklı gpt-oss-120B modelini birçok kritik kıyaslamada geçmeyi başarıyor. Üstelik bunu yaklaşık 13,5 kat daha küçük parametre ölçeğiyle gerçekleştiriyor.

[twitter= https://x.com/AlibabaGroup/status/2028729325642809377]

Qwen3.5 Small serisinin temelinde standart Transformer mimarisinden farklı bir yaklaşım bulunuyor. Alibaba, Gated Delta Networks (doğrusal dikkat mekanizması) ile seyrek Mixture-of-Experts (MoE) yapısını birleştiren verimli bir hibrit mimariye yönelmiş durumda.

Bu mimari, küçük modellerde sıkça karşılaşılan “bellek duvarı” meselesini hafifletmeyi hedefliyor. Böylece daha yüksek çıktı suratı ve daha düşük gecikme müddeti elde ediliyor. Ayrıyeten ağın sırf gerekli kısımları aktive edildiği için süreç verimliliği artıyor.

Öte yandan seri, doğal çok modlu eğitim yaklaşımıyla geliyor. Evvelki jenerasyonlarda olduğu üzere sonradan eklenen bir görsel kodlayıcı bu modellerde yer almıyor. Bu sayede 4B ve 9B modelleri arayüz öğelerini okuma, görüntüde obje sayma üzere misyonlarda, geçmişte kendisinden katbekat büyük modellere gereksinim duyulan bir performans düzeyine ulaşıyor.

Paylaşılan kıyaslama sonuçları, Qwen3.5 Small serisinin sadece “küçük” bir model ailesi olmadığını net biçimde ortaya koyuyor. Bilhassa 9B ve 4B sürümleri, çok modlu algılama ve ileri düzey akıl yürütme testlerinde kendi segmentinin çok ötesine geçen bir tablo çiziyor.

Çok modlu görsel akıl yürütme tarafında 9B modeli, hem daha büyük ölçekli alternatifleri hem de hafifletilmiş rakip sürümleri geride bırakmayı başarıyor. Emsal biçimde lisansüstü seviyede akıl yürütme testlerinde de, parametre sayısı kendisinden katbekat yüksek olan gpt-oss-120B modeline karşı üstünlük kurduğu görülüyor. Görüntü manaya ve altyazı dayanaklı tahlil senaryolarında serinin Google’ın hafif model tahlillerinden biri olan Gemini 2.5 Flash-Lite karşısında besbelli bir performans avantajı sağladığı aktarılıyor.

Geliştiriciler, 2B ve 4B modellerini taşınabilir uygulamalar için “oyun değiştirici” olarak nitelendiriyor. Tarayıcı içinde çalıştırılabildiğine dair paylaşımlar da, yüksek süreç gücü gerektiren görüntü tahlilinin artık uç aygıtlarda mümkün olabileceğine işaret ediyor.

Bu ortada Qwen3.5 serisinin tartıları ve yapılandırma evrakları, Apache 2.0 lisansı altında global erişime açıldı. Yani ticari kullanım, değiştirme ve tekrar dağıtım hakkı telif fiyatı olmadan sunuluyor.

Bir yanıt yazın

E-posta adresiniz yayınlanmayacak. Gerekli alanlar * ile işaretlenmişlerdir