Alibaba Cloud dan AI Singapore merilis Qwen-SEA-LION-v4, model AI multibahasa yang dioptimalkan untuk Asia Tenggara dengan peningkatan akurasi, pemahaman budaya, serta dukungan 32k konteks dan versi 4-bit. Dirancang agar inklusif, efisien, dan mudah diakses pengembang di Kawasan ini.
Banyak model generative AI komersial masih berfokus pada bahasa Inggris. Asia Tenggara yang memiliki lebih dari 1.200 bahasa sering kurang terwakili dalam model AI arus utama, sehingga pemahaman konteks lokal dan percakapan sehari-hari masih terbatas.
Alibaba Cloud berkolaborasi dengan AI Singapore (AISG) meluncurkan Qwen-SEA-LION-v4, model bahasa besar yang dirancang khusus untuk kebutuhan linguistik dan budaya yang sesuai dengan Asia Tenggara.
Qwen-SEA-LION-v4 dibangun di atas model Qwen3-32B telah mengalami peningkatan akurasi multibahasa dan pemahaman budaya, serta efisien untuk dijalankan pada laptop konsumen dengan RAM 32GB. Model ini menempati peringkat pertama SEA-HELM untuk kategori model sumber terbuka di bawah 200 miliar parameter, berkat kemampuan penalaran, dukungan multibahasa, dan pemahaman konteks panjangnya.
Peningkatan performa diperoleh melalui pelatihan tambahan menggunakan lebih dari 100 miliar token bahasa Asia Tenggara. Kontribusi AISG meliputi kurasi data regional, optimalisasi, serta evaluasi lintas tugas bahasa.
Fondasi model Qwen3 memliki basis linguistik yang kuat karena dilatih 119 bahasa dan dialek dengan total 36 triliun token. Untuk meningkatkan performa pada bahasa lain, porsi tugas penerjemahan dan lintas-bahasa diperbesar selama pasca-pelatihan. Pasca-pelatihan diperluas dengan dataset dari bahasa-bahasa Asia Tenggara seperti Burmese, Filipino, Indonesia, Melayu, Tamil, Thailand, dan Vietnam, sehingga meningkatkan kefasihan budaya dan akurasi respon.
Sebagai hasilnya, Qwen-SEA-LION-v4 mampu menangani masukan multibahasa di dunia nyata, termasuk code-switching, percakapan informal, dan campuran bahasa Inggris dengan bahasa lokal.
Versi terbaru ini juga menghadirkan pembaruan teknis penting. Qwen-SEA-LION-v4 kini menggunakan byte-pair encoding (BPE) sebagai pengganti sentence-piece tokenizer untuk pemrosesan teks multibahasa yang lebih efisien.
“Kerja sama kami dengan Alibaba dalam pengembangan Qwen-SEA-LION-v4 merupakan tonggak penting dalam mendorong inklusi AI dan membuatnya lebih representatif bagi Asia Tenggara,” kata Dr Leslie Teo, Direktur Senior Produk AI, AI Singapore. “Ini mencerminkan visi bersama kami untuk mempercepat inovasi AI di seluruh kawasan dan memastikan bahwa pengembang, perusahaan, dan lembaga publik memiliki akses ke AI yang terbuka, terjangkau, dan relevan secara lokal, serta dirancang untuk benar-benar memahami bahasa, budaya, dan komunitas di kawasan ini.”










