Microsoft Research, robotların daha dinamik ve az yapılandırılmış ortamlarda işe yarayabilmesi için tasarladığı yeni yapay zekâ modeli Rho-alpha (ρα)‘yı duyurdu. Şirket, bunun Phi serisi görsel-dil modellerinden türetilen birinci robotik model olduğunu söylüyor.
Rho-alpha, “görsel-dil-eylem” yaklaşımını bir adım ileri taşıyor. Microsoft’a nazaran model, robotların çevreyi algılayıp akıl yürüterek harekete geçmesini daha sağlam ve uyarlanabilir hâle getirmeyi hedefliyor.
İnsan geri bildirimiyle daima gelişiyor
En dikkat alımlı fark ise şu… Rho-alpha, algı tarafına dokunsal duyuyu ekliyor. Yani robot sadece kameradan gördüğüne nazaran değil, temas bilgisini de hesaba katarak hareket edebiliyor. Microsoft ayrıyeten ileride kuvvet üzere ek duyusal kanalları da dâhil etmek üzerinde çalıştığını belirtiyor.
Modelin bir başka tezi, insan geri bildirimiyle kendini geliştirebilmesi. Robot bir işi yaparken kusur yaptığında operatörlerin 3D mouse üzere teleoperasyon aygıtlarıyla anlık düzeltme yapması, Rho-alpha’nın bu geri bildirimi “ders” üzere kullanarak daha âlâ öğrenmesine yardımcı oluyor.
Microsoft, robotik dünyasında bilhassa dokunsal bilgi üzere alanlarda ölçeklenebilir eğitim verisinin yetersiz olduğunu kabul ediyor. Bu yüzden Rho-alpha’yı eğitirken üç ana kaynağı birleştiriyor:
- Gerçek robot gösterimleri (physical demonstrations)
- Simülasyon görevleri
- Web ölçeğinde görsel soru-cevap (VQA) verileri
Sentetik data üretimi için de NVIDIA Isaac Sim üzere simülasyon araçlarından yararlanılıyor. NVIDIA’dan Deepu Talla, Isaac Sim’in Azure üzerinde fizikî olarak gerçekçi sentetik data üretmeye yardımcı olarak Rho-alpha üzere modellerin gelişimini hızlandırdığını söylüyor.
Sırada teknik raporlar ve erken erişim var
Microsoft, Rho-alpha’nın şu anda çift kollu sistemler ve insansı robotlar üzerinde değerlendirildiğini, teknik ayrıntıları ise önümüzdeki aylarda yayımlamayı planladığını belirtiyor.







Bir yanıt yazın