(Source: Freepik)
Tuntutan akan teknologi kecerdasan buatan (AI) telah mendorong pertumbuhan eksplosif dalam kebutuhan komputasi untuk pelatihan dan inferensi model dasar. Arsitektur komputasi tradisional kini kesulitan mengimbangi laju perkembangan ini, menciptakan celah yang membutuhkan solusi inovatif. Mengatasi permasalahan tersebut, Huawei Cloud meluncurkan Layanan Cloud AI generasi terbaru dan Model Pangu 5.5, memposisikan diri sebagai pelopor AI di berbagai industri.
Cloud AI terbaru berkecepatan tinggi
Pada Konferensi Pengembang Huawei (HDC 2025), Huawei Cloud mengumumkan peluncuran Layanan Cloud AI generasi terbaru. Layanan ini dibangun di atas CloudMatrix 384 supernode, yang merupakan yang pertama di industri dalam mengimplementasikan interkoneksi peer-to-peer antara 384 NPU dan 192 CPU Kunpeng milik Huawei melalui jaringan MatrixLink berkecepatan tinggi.
Arsitektur supernode ini memungkinkan peningkatan throughput inference kartu tunggal hingga 2.300 token/detik—peningkatan hampir 4 kali lipat dari non supernode. Selain itu, supernode dapat mendukung inference model mixture of experts (MoE) dengan satu ahli per kartu, secara signifikan meningkatkan efisiensi inference. Fitur ini juga mendukung penugasan operator per kartu, alokasi sumber daya yang fleksibel, dan peningkatan pemanfaatan FLOPS model (MFU) lebih dari 50%.
Pangu 5.5 yang Canggih
Bersamaan dengan peluncuran layanan cloud AI baru, Huawei Cloud juga memperkenalkan Pangu Models 5.5. Model-model ini telah menerima peningkatan signifikan di lima kemampuan utama yaitu pemrosesan bahasa alami (NLP), visi komputer (CV), multimodal, prediksi, dan komputasi ilmiah.
Model Pangu NLP yang baru, misalnya, adalah model deep thinking 718B yang terdiri dari 256 ahli, dengan peningkatan drastis dalam penalaran pengetahuan, pemanggilan alat, dan matematika, menempatkannya di antara model-model teratas di industri. Pangu 5.5 juga telah ditingkatkan untuk meningkatkan pengalaman pengguna dalam pemrosesan urutan panjang, mengurangi halusinasi, integrasi pemikiran cepat dan lambat, serta agen. Contohnya, Pangu DeepDiver dapat menyelesaikan pertanyaan kompleks lebih dari 10 langkah dalam 5 menit dan menghasilkan laporan survei profesional lebih dari 10.000 kata.
Pangu Models dirancang untuk membantu pelanggan industri membangun model mereka sendiri tanpa harus memulai dari awal. Huawei Cloud menyediakan enam kemampuan inti yaitu model dasar Pangu dan model spesifik industri, korpus pra-pelatihan dan pasca-pelatihan, perangkat alat data engineering, perangkat alat pelatihan model, model penilai spesifik industri, dan platform evaluasi spesifik industri.
Chinese Academy of Agricultural Sciences (CAAS) telah melatih model dasar Pangu menggunakan literatur profesional dan data multi-omics lintas spesies untuk membangun Model Penemuan Ilmiah Pertanian mereka sendiri, yang berfokus pada pemuliaan tanaman ilmiah. Model ini telah berhasil meningkatkan varietas padi dengan mengurangi tinggi tanaman sekitar 25% dan meningkatkan ketahanan rebah secara signifikan sambil mempertahankan hasil yang sama.
Teknologi 5 in 1 dari Pangu Huawei
Pengembangan menarik lainnya adalah Pangu Multimodal Model baru, yang melahirkan Pangu World Model. Pangu World Model berfungsi untuk menghasilkan ruang fisik digital guna melatih kendaraan otonom dan robot AI berwujud, serta mendukung optimasi dan iterasi berkelanjutan.
Misalnya, dalam pelatihan mengemudi cerdas, model ini dapat menghasilkan video mengemudi simulasi dan point cloud dari lidar tanpa bergantung pada pengumpulan video jalan nyata yang mahal. Berdasarkan model multimodal ini, Guangzhou Automobile Group (GAC Group) bekerja sama dengan Huawei Cloud untuk mencapai pemetaan tingkat piksel antara video (modalitas 2D) dan point cloud (modalitas 3D). Selain itu, Huawei Cloud juga meluncurkan CloudRobo Embodied AI Platform yang terintegrasi dengan kemampuan multimodal dan pemikiran Model Pangu, serta mengusulkan Robot to Cloud (R2C) Protocol untuk memungkinkan lebih banyak robot mengembangkan kecerdasan yang efisien dan aman.
Model prediksi juga mendapat sorotan dengan Pangu Prediction Model, yang menggunakan arsitektur pra-pelatihan triplet transformer terpadu pertama di industri. Model ini mampu memproses dan melatih data dari berbagai industri termasuk data tabel dari parameter proses manufaktur, data deret waktu dari log operasi perangkat, dan data gambar dari inspeksi produk dalam kerangka kerja yang sama. Hal ini secara signifikan meningkatkan akurasi prediksi dan memberikan kemampuan generalisasi yang lebih baik untuk prediksi di berbagai industri dan skenario.
Pangu CV Model dengan parameter 30B yang berbasis arsitektur MoE baru adalah model CV terbesar di industri. Model ini mendukung persepsi, analisis, dan pengambilan keputusan multi-dimensi serta pan-vision, yang berarti mampu mengidentifikasi gambar, inframerah, point cloud dari lidar, spektrum cahaya, dan radar. Pangu CV Model menggunakan model generasi lintas dimensi untuk membuat pustaka sampel kesalahan pan-vision. Pustaka ini menampilkan sampel kesalahan kasus langka dalam skenario industri seperti minyak dan gas, transportasi, dan pertambangan batu bara, sehingga secara signifikan meningkatkan jenis objek yang diidentifikasi dan akurasi identifikasi.
Huawei Cloud juga meluncurkan ModelArts Versatile, platform agen AI optimal untuk perusahaan, serta meningkatkan asisten cerdasnya, Pangu Doer, dengan deep reasoning model dan agen spesialis. CodeArts Doer, yang merupakan asisten cerdas dalam pipeline pengembangan perangkat lunak Huawei Cloud, dilengkapi dengan enam agen khusus yang meningkatkan efisiensi lebih dari 40% di setiap tahap siklus hidup Litbang. GaussDB Doer memberdayakan perusahaan untuk mengembangkan kemampuan Administrator Basis Data (DBA) mereka sendiri. MetaStudio merevolusi pembuatan virtual human dengan kemudahan dan presisi tingkat berikutnya, sementara solusi keamanan model end-to-end, termasuk Model Application Firewall (MAF), melindungi setiap tahap dari korpus hingga aplikasi.