NVIDIA Vera Rubin NVL72: 5x Lebih Laju, 10x Lebih Murah Dari Blackwell

⚠️ Pendedahan Afiliasi: Artikel ini mungkin mengandungi pautan afiliasi. Kami mungkin mendapat komisyen kecil jika anda membeli melalui pautan kami, tanpa kos tambahan kepada anda. Ini membantu kami terus menyediakan kandungan percuma berkualiti.

Bayangkan anda baru sahaja membeli kereta sport paling laju di pasaran. Setahun kemudian, pengeluar yang sama mengeluarkan model baharu yang 5 kali lebih laju dan 10 kali lebih murah untuk dikendalikan.

Pendedahan: Artikel ini mengandungi pautan affiliate. Jika anda mendaftar melalui pautan kami, kami mungkin menerima komisyen kecil — tanpa sebarang kos tambahan kepada anda. Ini membantu kami terus menghasilkan panduan percuma dalam Bahasa Melayu.

Itulah situasi yang dihadapi oleh ByteDance, Google, Microsoft, dan semua pelanggan NVIDIA Blackwell hari ini.

Pada 5-6 Januari 2026, Jensen Huang berdiri di atas pentas CES Las Vegas dan mengumumkan sesuatu yang mengubah keadaan industri AI global — NVIDIA Vera Rubin NVL72.

Dan Malaysia, yang kini menjadi hab AI paling aktif di ASEAN, perlu faham apa artinya ini.

---

[SCREENSHOT: Tangkapan skrin menunjukkan cara penggunaan alat AI]

Apa Itu NVIDIA Vera Rubin?

Seni Bina Generasi Seterusnya

Vera Rubin adalah nama platform cip AI generasi seterusnya NVIDIA — penerus kepada Blackwell yang kini menjadi standard industri. Nama ini diambil sempena Vera Rubin, ahli astronomi wanita Amerika yang menemui bukti utama kewujudan jisim gelap (dark matter) alam semesta.

Produk utama platform ini ialah Vera Rubin NVL72 — sebuah sistem komputer AI yang menggabungkan 6 jenis cip baharu dalam satu platform bersepadu:

  1. Rubin GPU — cip pemprosesan AI utama dengan memori HBM4
  2. Vera CPU — pemproses utama khusus yang direka berpasangan dengan Rubin GPU
  3. HBM4 — memori bandwidth tinggi generasi ke-4
  4. NVLink 6 — rangkaian sambungan GPU-ke-GPU generasi ke-6
  5. NVSwitch — suis rangkaian untuk komunikasi antara GPU
  6. ConnectX — infrastruktur rangkaian data center

Kenapa 6 Cip Dalam Satu Platform?

NVIDIA mereka bentuk Vera Rubin sebagai "supercomputer AI dalaman satu rak" — bukan sekadar GPU yang dimasukkan ke dalam pelayan biasa. Setiap komponen direka bersama untuk memaksimumkan prestasi AI secara menyeluruh.

Ini berbeza daripada pendekatan sebelumnya di mana GPU NVIDIA dipasangkan dengan CPU Intel atau AMD. Vera Rubin adalah sistem yang sepenuhnya direka oleh NVIDIA dari awal hingga akhir.

---

[SCREENSHOT: Tangkapan skrin menunjukkan cara penggunaan alat AI]

Spesifikasi Teknikal Vera Rubin NVL72

Angka Yang Perlu Anda Tahu

| Spesifikasi | Vera Rubin NVL72 | Blackwell NVL72 | Nisbah |

|------------|------------------|-----------------|--------|

| GPU per sistem | 72 Rubin GPU | 72 B200 GPU | Sama |

| CPU per sistem | 36 Vera CPU | — (CPU luaran) | Vera ada CPU sendiri |

| Prestasi inference (NVFP4) | 3.6 EFLOPS | ~0.72 EFLOPS | 5x lebih tinggi |

| Prestasi latihan | 2.5 EFLOPS | ~0.5 EFLOPS | ~5x lebih tinggi |

| Kapasiti memori HBM | 20.7 TB | ~13.5 TB | ~1.5x lebih besar |

| Bandwidth HBM | 1.6 PB/s | ~0.6 PB/s | ~2.7x lebih tinggi |

| Bandwidth NVLink | 3.6 TB/s per GPU | 1.8 TB/s per GPU | 2x lebih tinggi |

| Kos per token inference | 10x lebih rendah | Rujukan | 10x lebih murah |

Sumber: NVIDIA CES 2026 keynote, Tom's Hardware, VideoCardz

Apa Itu EFLOP?

1 EFLOP = 1 Exaflop = 1 juta million operasi titik terapung sesaat

Untuk konteks:

  • Superkomputer terpantas dunia pada 2023 beroperasi pada ~1-2 EFLOPS
  • Satu sistem Vera Rubin NVL72 tunggal menghasilkan 3.6 EFLOPS untuk inference

Ini bermakna satu rak Vera Rubin NVL72 boleh menandingi atau mengatasi superkomputer terpantas dunia hanya beberapa tahun yang lalu.

Kenapa "10x Lebih Murah"?

Kos per token merujuk kepada berapa banyak yang perlu dibayar untuk menjanakan satu unit output AI (satu "token" teks atau data). Ia bergantung kepada:

  • Kuasa elektrik yang digunakan
  • Bilangan GPU yang diperlukan untuk satu tugas
  • Masa yang diambil untuk siapkan tugas

Dengan Vera Rubin memproses 5x lebih banyak dalam masa yang sama menggunakan tenaga yang lebih cekap, kos operasi untuk menjanakan output AI turun drastik — anggaran 10x berbanding Blackwell untuk beban kerja inference.

---

[SCREENSHOT: Tangkapan skrin menunjukkan cara penggunaan alat AI]

Jensen Huang Di CES 2026: "Dalam Pengeluaran Penuh"

Pengumuman Bersejarah

Di pentas CES Las Vegas pada 5 Januari 2026, Jensen Huang tidak sekadar mengumumkan Vera Rubin — beliau mengumumkan bahawa ia sudah dalam pengeluaran penuh.

Ini adalah langkah luar biasa. Syarikat teknologi biasanya mengumumkan cip baharu 1-2 tahun sebelum ia tersedia. Untuk NVIDIA mengumumkan "dalam pengeluaran penuh" bermakna kilang-kilang pembuat cip (TSMC) sudah menghasilkan Vera Rubin dalam kuantiti besar.

Jensen Huang juga mendedahkan bahawa NVIDIA sudah menerima semua 6 jenis cip daripada kilang dan berpuas hati dengan prestasi beban kerja yang dijalankan pada mereka.

Jadual Penghantaran: 2H 2026

Pengeluaran berskala besar Vera Rubin NVL72 dijangka bermula pada separuh kedua 2026 (Jul-Dis 2026). Penghantaran kepada pelanggan pertama dijangka sekitar Q3-Q4 2026.

Ini bermakna syarikat yang memesan sekarang (atau sudah memesan di GTC Mac 2026) akan menerima unit pertama mereka dalam tempoh 4-6 bulan dari sekarang.

---

Vera Rubin vs Blackwell: Perbandingan Lengkap

Senario Praktikal: Latihan Model AI Besar

Bayangkan anda mahu melatih model bahasa besar (LLM) 100 bilion parameter:

Dengan Blackwell NVL72:

  • Anggaran masa latihan: 7-10 hari
  • Kos cloud (anggaran): $500,000 - $800,000
  • Elektrik yang digunakan: Sangat tinggi

Dengan Vera Rubin NVL72:

  • Anggaran masa latihan: 1.5-2 hari (5x lebih laju)
  • Kos cloud (dijangka): $50,000 - $80,000 (10x lebih murah)
  • Elektrik: Lebih cekap kerana kerja selesai lebih laju

Bagi syarikat yang menjalankan latihan model AI setiap minggu — ini bermakna penjimatan puluhan juta ringgit setahun.

Senario Praktikal: Inference (Melayan Pengguna)

Inference adalah apabila model AI menjawab soalan pengguna sebenar — macam ChatGPT menjawab pertanyaan anda.

Bayangkan platform AI yang melayan 10 juta permintaan sehari:

Dengan Blackwell:

  • GPU diperlukan: ~100 unit
  • Kos elektrik bulanan: ~RM500,000
  • Kos lesen cloud: ~RM2,000,000/bulan

Dengan Vera Rubin (dijangka):

  • GPU diperlukan: ~20 unit (5x lebih cekap)
  • Kos elektrik bulanan: ~RM100,000
  • Kos lesen cloud (dijangka): ~RM200,000/bulan

Penjimatan: Lebih RM2 juta sebulan untuk satu platform saiz sederhana.

---

Impak Untuk Malaysia: Apa Yang Perlu Kita Tahu

ByteDance $2.5B Malaysia — Upgrade Akan Datang?

Ini adalah soalan terbesar dalam industri AI Malaysia sekarang.

ByteDance sedang membina kluster AI $2.5 bilion di Malaysia menggunakan 36,000 unit NVIDIA Blackwell B200 — cip yang kini menjadi generasi sebelumnya.

Adakah ByteDance akan upgrade ke Vera Rubin?

Kemungkinan besar ya, dalam beberapa fasa:

  1. Fasa 1 (kini hingga 2H 2026): ByteDance teruskan pemasangan Blackwell mengikut rancangan — kluster sudah dipesan, kontrak sudah ditandatangani
  2. Fasa 2 (2027+): Bahagian kluster yang diperluaskan mungkin menggunakan Vera Rubin
  3. Fasa 3 (2028+): Upgrade bertahap Blackwell→Vera Rubin apabila ROI membenarkan

Kos penggantian 36,000 Blackwell ke Vera Rubin dalam masa terdekat tidak praktikal — tetapi pelaburan baharu dari ByteDance atau hyperscaler lain di Malaysia hampir pasti akan menggunakan Vera Rubin.

Hyperscaler Lain Di Malaysia

Microsoft, Google, dan AWS yang mempunyai data center di Malaysia akan mempercepatkan rancangan pengembangan mereka dengan Vera Rubin:

  • Kos lebih rendah = ROI pelaburan lebih tinggi = lebih banyak pelaburan
  • Prestasi lebih tinggi = lebih banyak produk AI boleh ditawarkan kepada pelanggan Malaysia
  • Kecekapan tenaga = kos operasi data center lebih rendah

Ini bermaksud lebih banyak pelaburan akan mengalir ke Malaysia — kerana kos untuk menjalankan AI di sini menjadi lebih berbaloi.

Penarikan Balik Peraturan Eksport US + Vera Rubin = Peluang Besar

Gabungan dua berita besar minggu ini:

  1. AS tarik balik larangan eksport cip AI — Malaysia bebas beli cip AI NVIDIA tanpa sekatan tier
  2. Vera Rubin — cip AI paling canggih yang pernah ada kini dalam pengeluaran penuh

Malaysia kini berada dalam kedudukan yang sangat unik: bebas beli cip AI paling canggih di dunia, dengan kos operasi 10x lebih rendah, dari negara dengan infrastruktur AI terbaik di ASEAN.

Ini adalah kombinasi yang hampir tiada tolok bandingnya di rantau ini.

---

Kenapa Dipanggil "Vera Rubin"?

Tradisi penamaan NVIDIA menggunakan nama saintis dan ahli fizik terkenal:

  • Pascal (2016) — Blaise Pascal, ahli matematik Perancis
  • Volta (2017) — Alessandro Volta, penemu bateri
  • Turing (2018) — Alan Turing, bapa komputer moden
  • Ampere (2020) — André-Marie Ampère, penemu elektromagnet
  • Hopper (2022) — Grace Hopper, pencipta bahasa pengaturcaraan COBOL
  • Blackwell (2024) — David Harold Blackwell, ahli statistik pertama kulit hitam di National Academy of Sciences
  • Vera Rubin (2026) — Vera Rubin, ahli astronomi yang menemui bukti pertama dark matter

Vera Rubin (1928-2016) adalah antara saintis wanita paling berpengaruh abad ke-20. Kerja hidupnya tentang pergerakan galaksi membuktikan bahawa 85% jirim alam semesta adalah "gelap" — tidak kelihatan tetapi nyata. Ia adalah salah satu penemuan paling mendalam dalam sejarah sains.

NVIDIA memilih nama ini bukan secara kebetulan — Vera Rubin mewakili penemuan tersembunyi dan kebenaran yang lebih dalam daripada apa yang nampak di permukaan. Sempurna untuk cip yang direka untuk mendedahkan pola tersembunyi dalam data AI.

---

Pesaing: AMD, Intel, dan Google TPU

Adakah Ada Alternatif Kepada Vera Rubin?

Untuk pasaran data center AI, NVIDIA masih mendominasi secara ekstrem. Pesaing utama:

AMD Instinct MI350/MI400 (dijangka 2026-2027)

  • AMD sedang membangunkan generasi seterusnya chip AI mereka
  • Prestasi dijangka setanding dengan Blackwell, bukan Vera Rubin
  • Ekosistem perisian (ROCm) masih jauh di belakang CUDA NVIDIA

Intel Gaudi 3

  • Lebih murah, kurang popular
  • Ekosistem terhad berbanding NVIDIA

Google TPU v5p

  • Hanya tersedia melalui Google Cloud
  • Sangat baik untuk model Google sendiri
  • Tidak boleh dibeli secara langsung

Kesimpulan: Untuk data center AI berskala besar, Vera Rubin tiada pesaing sebenar dalam jangka masa terdekat.

---

NVIDIA GTC 2026: Apa Yang Dijangka Esok (16 Mac)?

Walaupun spesifikasi teknikal Vera Rubin sudah diketahui sejak CES Januari 2026, keynote GTC Jensen Huang pada 16 Mac 2026 (esok) dijangka mendedahkan:

  • Harga rasmi Vera Rubin NVL72 (belum diumumkan secara rasmi)
  • Perkongsian pelanggan — siapa sudah pesan dan berapa banyak
  • Blackwell Ultra — upgrade pertengahan generasi antara Blackwell dan Vera Rubin
  • Roadmap 2027+ — platform generasi seterusnya selepas Vera Rubin
  • Perkongsian Malaysia/Asia Tenggara — NVIDIA semakin fokus kepada rantau ini

CaraAI akan melaporkan pengumuman utama GTC 2026 sebaik keynote selesai.

---

FAQ — Soalan Lazim

Bila boleh beli Vera Rubin NVL72?

Penghantaran berskala besar dijangka bermula Q3-Q4 2026 (Jul-Dis 2026). Pelanggan enterprise yang sudah ada hubungan dengan NVIDIA atau perlu melalui proses pemesanan secara rasmi.

Berapakah harga Vera Rubin NVL72?

Harga belum diumumkan secara rasmi setakat tarikh penulisan ini. Satu sistem Blackwell NVL72 anggaran berharga $3-4 juta USD. Vera Rubin dijangka lebih mahal dari segi harga beli tetapi 10x lebih murah dari segi kos operasi.

Adakah ByteDance akan berhenti beli Blackwell?

Tidak dalam masa terdekat. Kontrak pembelian Blackwell sudah ditandatangani. Vera Rubin akan menjadi pilihan untuk pelaburan baharu dan fasa pengembangan masa hadapan.

Adakah saya perlu tukar GPU saya ke Vera Rubin?

Untuk pengguna individu dan syarikat kecil, Vera Rubin tidak relevan secara langsung — ia adalah untuk data center berskala besar. GPU pengguna macam RTX 5090 (Blackwell) masih adalah pilihan terbaik untuk pengguna desktop.

Apakah "Vera CPU" dan kenapa ia penting?

Vera CPU adalah pemproses utama yang NVIDIA reka khas untuk berfungsi bersama Rubin GPU. Berbeza daripada sistem sebelumnya yang menggunakan CPU Intel/AMD, sistem Vera Rubin sepenuhnya direka oleh NVIDIA — ini bermakna komunikasi antara CPU dan GPU jauh lebih pantas dan cekap.

---

Kesimpulan: NVIDIA Mengubah Kalkulus AI Global

Vera Rubin NVL72 bukan sekadar GPU baharu. Ia adalah pernyataan strategi NVIDIA: bahawa mereka tidak akan perlahan, dan jarak antara NVIDIA dengan pesaing mereka akan terus melebar.

Untuk Malaysia, ini adalah lagi satu alasan mengapa kita berada di tempat yang tepat pada masa yang tepat:

  1. Pelaburan asing yang masuk sekarang (ByteDance, Google, Microsoft) akan mendapat manfaat dari Vera Rubin bila ia tersedia
  2. Kos operasi yang lebih rendah dengan Vera Rubin = lebih banyak projek AI berbaloi secara ekonomi di Malaysia
  3. Bebas daripada sekatan eksport = Malaysia boleh akses Vera Rubin tanpa halangan

Soalan bukan lagi "apakah cip AI terbaru?" — soalannya ialah: "berapa cepat Malaysia boleh jadikan dirinya destinasi pilihan untuk Vera Rubin?"

---

Artikel ini ditulis pada 15 Mac 2026 berdasarkan pengumuman NVIDIA CES 2026 (Jan 5-6, 2026), laporan teknikal Tom's Hardware dan VideoCardz, serta dokumentasi rasmi NVIDIA.

---

Sumber:

---

🎨 Rekomendasi: Canva Pro

Canva Pro bagi akses penuh kepada 100M+ template premium, alat AI (Magic Write, Magic Eraser, Background Remover) dan Brand Kit. Sesuai untuk kreator konten, usahawan, dan pelajar.

→ Cuba Canva Pro Percuma Selama 30 Hari


Rujukan

Artikel Berkaitan

Facebook X / Twitter