Gezegenin en güçlü AI platformu: Karşınızda Nvidia Rubin ve ayrıntıları

Altı farklı çipten oluşan dev platform

Rubin GPU

Bellek tarafında ise Rubin GPU, HBM4 teknolojisine geçiş yapıyor. Çip başına 22 TB/s bellek bant genişliği sunan bu yapı, Blackwell’e nazaran 2,8 kat artış sağlıyor. Ayrıyeten her CPU için 3,6 TB/s NVLink bant genişliği sunuluyor ve bu da evvelki jenerasyonun iki katı düzeyinde.

Vera CPU

Vera CPU 1,8 TB/s NVLink-C2C dengeli bellek irtibatı, 1,5 TB sistem belleği (Grace’e nazaran 3 kat artış) ve 1,2 TB/s LPDDR5x bellek bant genişliği ile dikkat çekiyor. Tüm bu yapı, data sürece, sıkıştırma ve CI/CD iş yüklerinde Grace mimarisine kıyasla 2 kat performans artışı sağlıyor. Ayrıyeten platform, raf ölçeğinde bilinmeyen hesaplama dayanağı sunuyor.

NVLink 6 ve ağ altyapısı

Rubin platformunda kullanılan NVLink 6 Switch, 400G SerDes altyapısı sayesinde CPU başına 3,6 TB/s tümden tüm irtibat bant genişliği sağlıyor. Toplamda 28,8 TB/s ağ kapasitesine ulaşan bu anahtarlar, 14,4 TFLOPS FP8 ağ içi süreç gücü sunuyor ve büsbütün sıvı soğutmalı olarak tasarlanmış durumda.

Ağ tarafında ConnectX-9 SuperNIC, 1,6 TB/s bant genişliği, 200G PAM4 SerDes, programlanabilir RDMA ve gelişmiş güvenlik özellikleriyle öne çıkıyor. BlueField-4 DPU ise 64 çekirdekli Grace CPU’yu ConnectX-9 ile entegre ederek evvelki jenerasyona kıyasla 2 kat ağ, 6 kat işlem ve 3 kat bellek bant genişliği sunuyor.

NVL72 raf sistemi sonları zorluyor

Nvidia’nın bu tüm ögeleri tek bir platformda, yani Nvidia Vera Rubin NVL72 raf sisteminde bir ortaya geliyor. Bu yapı, Blackwell tabanlı sistemlere nazaran 5 kat NVFP4 çıkarım (3,6 EFLOPS) ve 3,5 kat NVFP4 eğitim performansı (2,5 EFLOPS) sağlıyor. Bellek tarafında LPDDR5x kapasitesi 54 TB, HBM4 kapasitesi 20,7 TB düzeyine çıkarken HBM4 bant genişliği 1,6 PB/s ile 2,8 kat artış sunuyor. Ölçekleme bant genişliği ise 260 TB/s ile iki katına ulaşıyor.

Nvidia, Rubin ile birlikte Spectrum-X Ethernet Co-Packaged Optics tahlilini de duyurdu. 102,4 Tb/s ölçeklenebilir anahtarlama altyapısı sunan bu sistem, 200G silikon fotonik entegrasyonu sayesinde ölçek altında %95 aktif bant genişliği sağlıyor. Nvidia’ya nazaran bu tahlil 5 kat verimlilik, 10 kat güvenilirlik ve 5 kat daha yüksek uygulama çalışma müddeti sunuyor.

Rubin SuperPOD için tanıtılan Inference Context Memory Storage platformu ise gigaskala çıkarım senaryolarına odaklanıyor ve Dynamo, NIXL ve DOCA üzere Nvidia yazılım tahlilleriyle tam entegre çalışıyor. Nvidia, Rubin platformunu 8 adet NVL72 raf içeren yeni kuşak DGX SuperPOD sistemlerinde konumlandırırken daha geniş bilgi merkezleri için DGX Rubin NVL8 seçeneğini de sunacak.

Nvidia’ya nazaran Rubin platformu, Blackwell GB200’e kıyasla çıkarım token maliyetini 10 kat, MoE model eğitiminde kullanılan GPU sayısını ise 4 kat azaltıyor. Geniş bir iş ortağı ekosistemiyle desteklenen Rubin platformu halihazırda tam üretim kademesinde bulunuyor ve birinci müşterilerin çipleri bu yıl içinde teslim almaya başlaması planlanıyor.

My Blog

Gezegenin en güçlü AI platformu: Karşınızda Nvidia Rubin ve ayrıntıları

Bir yanıt yazın Yanıtı iptal et

Category Name

Meta, AI modellerinin eğitimi için özel işlemci geliştirecek

Ünlü profesörden kritik ihtar: İran savaşı “AI balonu”nun patlamasına yol açabilir

Microsoft, kimlik doğrulama uygulamasında güvenliği artırıyor

Recent Posts

Meta, AI modellerinin eğitimi için özel işlemci geliştirecek

Ünlü profesörden kritik ihtar: İran savaşı “AI balonu”nun patlamasına yol açabilir

Microsoft, kimlik doğrulama uygulamasında güvenliği artırıyor

En tehlikeli asteroid unvanını almıştı: 2024 YR4 için rahatlatan haber

Categories

Meta, AI modellerinin eğitimi için özel işlemci geliştirecek

Ünlü profesörden kritik ihtar: İran savaşı “AI balonu”nun patlamasına yol açabilir

Microsoft, kimlik doğrulama uygulamasında güvenliği artırıyor

Meta, AI modellerinin eğitimi için özel işlemci geliştirecek

Ünlü profesörden kritik ihtar: İran savaşı “AI balonu”nun patlamasına yol açabilir

Microsoft, kimlik doğrulama uygulamasında güvenliği artırıyor