AI Generatif Butuh Daya Lebih Besar, Sistem Konvensional Tidak Lagi Bisa Layani

devadmin
4 bulan yang lalu

Penyempurnaan pada sistem AI menuntut kemampuan pemrosesan data yang jauh lebih tinggi. Model AI generatif, khususnya untuk pengodean perangkat lunak dan video, membutuhkan daya komputasi yang melampaui batas sistem konvensional.

NVIDIA memperkenalkan Rubin CPX, kelas GPU baru yang dirancang khusus untuk pemrosesan konteks masif. Rubin CPX bekerja berdampingan dengan CPU NVIDIA Vera dan GPU Rubin di dalam platform NVIDIA Vera Rubin NVL144 CPX. Sistem terintegrasi ini dirancang untuk memberikan performa AI yang jauh lebih baik dari sistem sebelumnya. Perangkat ini juga memiliki memori yang cepat dan bandwidth memori yang sangat tinggi dalam satu rak. NVIDIA juga menawarkan tray komputasi Rubin CPX khusus untuk pengguna yang ingin memanfaatkan sistem Vera Rubin NVL144 yang sudah ada.

Jensen Huang, founder dan CEO NVIDIA, mengatakan, “Sama seperti RTX yang merevolusi grafis dan kecerdasan buatan fisik, Rubin CPX adalah GPU CUDA pertama yang dirancang khusus untuk kecerdasan buatan skala besar. Model dapat memproses jutaan token pengetahuan secara bersamaan.”

NVIDIA Rubin CPX

NVIDIA Rubin CPX memungkinkan performa dan pendapatan token yang paling tinggi untuk pemrosesan konteks panjang, jauh melampaui kemampuan sistem yang ada saat ini. Kelebihan ini mengubah asisten pengodean AI dari alat sederhana menjadi sistem canggih yang bisa memahami dan mengoptimalkan proyek perangkat lunak berskala besar.

Untuk pemrosesan video, Rubin CPX mengintegrasikan dekoder dan enkoder video, serta pemrosesan inferensi konteks panjang dalam satu chip. Hal ini memungkinkan kemampuan yang belum pernah ada sebelumnya untuk aplikasi format panjang, seperti pencarian video dan video generatif berkualitas tinggi.

Selain itu, Rubin CPX juga didukung oleh arsitektur NVIDIA Rubin dan menggunakan desain die monolithic yang hemat biaya. GPU ini dikemas dengan sumber daya komputasi NVFP4 yang kuat, dioptimalkan untuk memberikan performa dan efektivitas energi yang sangat tinggi untuk tugas inferensi AI.

Rubin CPX menghadirkan beberapa peningkatan, di antaranya adalah kemampuan pemrosesan hingga 30 petaflops dengan presisi NVFP4. Perangkat ini memiliki 128GB memori GDDR7 yang hemat biaya untuk mempercepat beban kerja berbasis konteks yang paling berat. Perangkat ini juga memberikan kemampuan attention tiga kali lebih cepat dibandingkan sistem NVIDIA GB300 NVL72, yang meningkatkan kemampuan model AI untuk memproses urutan konteks yang lebih panjang tanpa penurunan kecepatan.

NVIDIA Rubin CPX diharapkan akan tersedia pada akhir 2026. Platform ini didukung oleh tumpukan AI NVIDIA yang lengkap, dari infrastruktur yang dipercepat hingga perangkat lunak siap pakai. Ini termasuk platform NVIDIA Dynamo yang meningkatkan throughput dan mengurangi biaya. Prosesor ini juga akan dapat menjalankan model multimodal terbaru dari keluarga NVIDIA Nemotron untuk AI agent yang siap pakai.