Nvidia, AI veri merkezlerini baştan yazıyor: 40 milyon kat işlem gücü artışı

Yapay zekâ ekosistemi son yıllarda yalnızca model tarafında değil, altyapı katmanında da köklü bir dönüşüm sürecine girdi. Özellikle agentic AI tabanlı yeni nesil sistemler, veri merkezlerinde CPU, GPU ve ağ bileşenlerinin birlikte optimize edilmesini zorunlu hale getiriyor. Nvidia ise, GTC 2026 kapsamında bu ihtiyaca yanıt veren Vera Rubin platformunu duyurdu. 10 yılda 40 milyon kat daha fazla işlem gücü
Nvidia, bir sonraki nesil yapay zeka veri merkezleri için geliştirdiği Vera Rubin platformu, toplamda 7 farklı çipi tek bir mimari altında birleştirerek şirketin bugüne kadarki en kapsamlı altyapı hamlelerinden biri olarak geliyor. Nvidia bu yaklaşımı “extreme codesign” (aşırı kod tasarımı) olarak tanımlıyor. Tüm bileşenler bağımsız çalışacak şekilde değil, baştan itibaren birlikte optimize ediliyor.
- Rubin GPU
- Vera CPU
- NVLink 6 Switch
- ConnectX-9
- BlueField-4
- Spectrum-X
- Groq 3 LPU
Bu sayede özellikle çıkarım süreçlerinde maliyetlerin ciddi ölçüde düşürülmesi hedeflenmiş. Şirketin paylaştığı verilere göre, platform Blackwell tabanlı sistemlere kıyasla token maliyetini 10 kata kadar azaltabiliyor. Platformun merkezinde yer alan Vera CPU ise, 88 adet özel Arm tabanlı çekirdekten oluşuyor.
Nvidia’ya göre bu işlemci, geleneksel veri merkezi CPU’larına kıyasla %50 daha yüksek performans ve 2 kat daha iyi enerji verimliliği sunuyor. Ayrıca 1.2 TB/s seviyesine ulaşan LPDDR5X bellek bant genişliği, büyük ölçekli AI iş yüklerinde darboğazların önüne geçmeyi amaçlıyor. GPU tarafında ise Her bir Rubin GPU, 288 GB HBM4 bellek ile geliyor ve 22 TB/s bant genişliği sunuyor. Aynı zamanda 50 PFLOPs’a ulaşan hesaplama gücü, özellikle büyük model eğitim ve çıkarım süreçlerinde önemli bir sıçrama konumunda. 288GB HBM4, 22 TB/s bant genişliği, 50 PFLOP işlem Gücü
Platformun fiziksel tasarımında da dikkat çekici değişiklikler bulunuyor. Tamamen sıvı soğutmalı yapı (sıcak su 45°C) sayesinde veri merkezlerinin kurulum süresi 2 günden 2 saate kadar düşürülebiliyor. Bu arada, Vera Rubin platformu yalnızca donanım tarafıyla sınırlı değil. Nvidia, bu kapsamda farklı rack (raf ölçeği) tasarımları da tanıttı.
Bunlar arasından NVL72 sistemi, 72 GPU ve 36 CPU ile geliyor. Bu sistemin 10 kat daha yüksek performans/verim oranı, 3.6 ExaFLOPs hesaplama gücü ve 260 TB/s NVLink bant genişliği sunduğu paylaşıldı. Bunun yanında 256 CPU içeren büyük ölçekli rack çözümleri de duyuruldu. Son olarak yeni platforma şimdiden birçok büyük şirketin dahil olduğunu söyleyelim. 2027’ye kadar rekor sipariş
Alibaba, Meta ve Oracle gibi firmalar Vera CPU kullanmayı planlarken; Dell, Lenovo ve HPE gibi üreticiler Rubin tabanlı sistemler geliştirecek. Ayrıca Amazon Web Services, Google Cloud ve Microsoft Azure tarafında da entegrasyon hazırlıkları bulunuyor. Jensen Huang, Blackwell ve Vera Rubin platformlarına yönelik siparişlerin 2027’ye kadar 1 trilyon dolar seviyesine ulaşmasını bekliyor.




