|

Roadmap Nvidia AI Rack: Dari GB200 ke Vera Rubin Ultra 600kW

Ringkasan cepat: gambar referensi Morgan Stanley Research yang Anda berikan memperlihatkan arah baru infrastruktur AI Nvidia: dari rack GB200 sekitar 120 kW, naik ke GB300 140 kW, Vera Rubin 200 kW+, Vera Rubin CPX 380 kW+, hingga Vera Rubin Ultra sekitar 600 kW per rack pada 2027. Artinya, persaingan AI bukan hanya soal GPU tercepat, tetapi juga soal siapa yang mampu menyediakan listrik, pendinginan, dan power delivery untuk rack AI dengan kepadatan daya ekstrem.

Roadmap ini penting karena memperlihatkan perubahan kelas data center. Server AI generasi lama masih bisa dipahami sebagai kumpulan node GPU. Generasi baru seperti GB200, GB300, dan Vera Rubin bergerak ke arah rack-scale system: satu rack diperlakukan seperti satu mesin AI besar dengan puluhan GPU, puluhan CPU, jaringan internal NVLink, pendinginan cair, power shelf, dan koneksi antarrack berkecepatan sangat tinggi.

Varian produk Nvidia dalam roadmap

PeriodeGenerasi GPU AIArsitektur rackEstimasi daya per rackCatatan utama
Saat iniGB200Oberon120 kWGenerasi Grace Blackwell awal untuk LLM inference dan training skala besar.
2026GB300Oberon140 kWBlackwell Ultra, diarahkan untuk reasoning dan AI factory output lebih tinggi.
2026GB300Oberon140 kWVarian power supply lebih tinggi, dari 8 kW ke 12 kW per PSU menurut gambar referensi.
2026Vera RubinOberon200 kW+Mulai transisi ke Rubin GPU, Vera CPU, HBM4, LPDDR5X, ConnectX-9, dan BlueField-4.
2027Vera Rubin CPX versionOberon380 kW+Varian lebih ekstrem, membutuhkan HVDC standalone power rack 800 VDC.
2027Vera Rubin UltraKyber600 kWGenerasi puncak roadmap, disiapkan untuk kepadatan komputasi dan inference AI sangat besar.

Kenapa kebutuhan listrik naik begitu cepat?

Penyebab utamanya adalah peningkatan kepadatan komputasi. Satu rack tidak lagi hanya memuat beberapa server GPU, tetapi puluhan akselerator yang dihubungkan sebagai satu domain komputasi besar. Pada Vera Rubin NVL72, Nvidia menyebut konfigurasi 72 Rubin GPU dan 36 Vera CPU. Komponen seperti NVLink 6 switch, ConnectX-9 SuperNIC, BlueField-4 DPU, HBM4, LPDDR5X, dan jaringan scale-out menambah kebutuhan daya di luar GPU utama.

Semakin besar model AI, semakin besar kebutuhan bandwidth memori, komunikasi antarchip, dan daya inference. Model reasoning, agentic AI, multimodal, dan long-context membutuhkan throughput token tinggi. Karena itu, vendor cloud dan lab AI mengejar rack yang bisa menghasilkan lebih banyak token per detik, meski konsekuensinya adalah power density jauh lebih tinggi.

Transisi dari 400V ke 800V DC

Gambar referensi juga menunjukkan perubahan besar pada power architecture. Pada GB200 dan GB300, konversi masih digambarkan dari 400V AC ke 50V DC. Pada Vera Rubin dan generasi setelahnya, roadmap bergerak menuju 400V AC ke 800V DC, terutama saat masuk 2027. Ini masuk akal karena rack 200 kW hingga 600 kW membutuhkan distribusi daya yang lebih efisien. Jika arus terlalu besar, kabel, konektor, panas, dan rugi daya ikut membengkak.

Dengan tegangan lebih tinggi, data center dapat mengurangi arus untuk daya yang sama. Namun konsekuensinya, sistem power shelf, PSU, proteksi listrik, dan standar keselamatan harus naik kelas. Itulah mengapa pada roadmap muncul istilah HVDC standalone power rack, bukan sekadar power shelf biasa.

Nilai power per rack juga melonjak

Dalam gambar referensi, estimasi nilai power per AI server rack ikut naik: GB200 sekitar US$36.000, GB300 sekitar US$57.600 hingga US$69.120, Vera Rubin sekitar US$76.000, lalu Vera Rubin CPX melonjak ke sekitar US$398.160. Untuk Vera Rubin Ultra, nilainya ditandai lebih dari 10x. Ini menunjukkan bahwa power subsystem mulai menjadi bagian biaya yang makin besar dalam AI rack.

Dengan kata lain, membeli GPU saja tidak cukup. Operator data center harus membeli power delivery, pendinginan cair, rack khusus, switch jaringan, kabel optik atau tembaga kelas tinggi, dan sistem monitoring. Biaya infrastruktur pendukung bisa menjadi pembeda besar antara data center biasa dan data center AI generasi baru.

Untuk apa varian-varian ini dipakai?

  • GB200: inference LLM real-time, training model besar, dan HPC dengan liquid-cooled rack NVL72.
  • GB300: AI reasoning, test-time scaling, inference yang lebih intensif, dan peningkatan output AI factory.
  • Vera Rubin: agentic AI, trillion-parameter models, long-context inference, dan training mixture-of-experts dengan efisiensi lebih baik.
  • Vera Rubin CPX: beban kerja yang membutuhkan daya lebih tinggi, kemungkinan untuk inference skala lebih padat dan rack dengan konfigurasi lebih ekstrem.
  • Vera Rubin Ultra: generasi 2027 untuk rack Kyber 600 kW, ditujukan bagi hyperscaler dan lab AI yang mengejar kapasitas token, multimodal, dan agentic AI masif.

Dampak untuk data center

Rack 600 kW bukan sekadar upgrade server. Itu adalah perubahan desain fasilitas. Data center harus menyiapkan jalur listrik besar, transformer, switchgear, UPS, busbar, pendinginan cair, heat rejection, monitoring termal, dan manajemen risiko. Banyak fasilitas lama tidak dirancang untuk kepadatan daya seperti ini, sehingga upgrade fisik bisa sama mahalnya dengan membeli hardware AI.

Bagi pasar cloud, roadmap ini bisa membuat layanan AI semakin terkonsentrasi pada pemain besar. Hanya perusahaan dengan modal, listrik, lahan, pendinginan, dan hubungan supply chain kuat yang bisa menjalankan rack seperti Vera Rubin Ultra dalam jumlah besar.

Kesimpulan

Roadmap Nvidia dari GB200 ke Vera Rubin Ultra memperlihatkan bahwa masa depan AI akan ditentukan oleh tiga hal sekaligus: chip, power, dan cooling. GB200 membuka era rack-scale AI sekitar 120 kW. GB300 menaikkan kapasitas ke 140 kW. Vera Rubin membawa sistem ke 200 kW+. CPX mendorongnya ke 380 kW+. Rubin Ultra masuk kelas 600 kW pada 2027. Ini adalah sinyal bahwa AI factory masa depan akan lebih mirip fasilitas industri energi tinggi daripada ruang server tradisional.

Sumber

Gambar referensi pengguna: Morgan Stanley Research · NVIDIA GB200 NVL72 · NVIDIA Vera Rubin NVL72 · The Register · Tom’s Hardware

Konteks Tambahan untuk Pembaca Indonesia

Berita ini penting karena perkembangan AI global semakin cepat memengaruhi cara orang bekerja, belajar, membuat konten, membangun aplikasi, dan mengambil keputusan bisnis. Untuk pembaca Indonesia, konteks yang perlu diperhatikan bukan hanya siapa perusahaan yang merilis teknologi baru, tetapi juga dampaknya terhadap biaya, akses, regulasi, peluang kerja, dan keamanan data.

Setiap kabar tentang model AI, kebijakan perusahaan besar, investasi, atau regulasi sebaiknya dibaca dengan sikap kritis. Banyak pengumuman teknologi memakai bahasa pemasaran yang terdengar sangat meyakinkan, tetapi belum tentu langsung relevan untuk kebutuhan sehari-hari. Karena itu, pembaca perlu membedakan antara klaim perusahaan, hasil benchmark, pengalaman pengguna, dan bukti penggunaan nyata di lapangan.

Dampak Potensial

  • Untuk pekerja: AI dapat mempercepat drafting, analisis, coding, riset, dan dokumentasi, tetapi tetap butuh verifikasi manusia.
  • Untuk bisnis: adopsi AI dapat menekan biaya operasional, namun juga menambah kebutuhan tata kelola data dan keamanan.
  • Untuk pelajar: AI bisa menjadi tutor personal, tetapi penggunaan yang salah dapat mengurangi kemampuan berpikir mandiri.
  • Untuk developer: model dan API baru membuka peluang produk baru, tetapi juga menuntut pengujian yang lebih disiplin.

Cara Menyikapi Berita Ini

Jangan langsung mengambil keputusan hanya berdasarkan satu sumber. Bandingkan dengan rilis resmi, laporan media lain, dokumentasi produk, dan pengalaman komunitas. Jika berita menyangkut tools yang ingin digunakan, lakukan uji kecil terlebih dahulu. Catat kualitas hasil, biaya, kecepatan, keamanan, dan keterbatasannya. Pendekatan bertahap seperti ini membuat pembaca lebih siap memanfaatkan AI tanpa terjebak hype.

Lanjut Belajar AI

Jika artikel ini membantu, lanjutkan ke materi terstruktur agar pemahaman AI lebih rapi dan praktis.

Similar Posts

Leave a Reply

Your email address will not be published. Required fields are marked *