(Source: Stability.ai)
Di era kecerdasan buatan, model-model generatif seperti Stable Diffusion 3.5 (SD3.5) telah membuka gerbang kreativitas tanpa batas bagi para profesional dan pengembang. Namun, sering muncul tantangan terkait kinerja dan kebutuhan memori perangkat keras, terutama bagi mereka yang menggunakan berbagai konfigurasi perangkat keras konsumen. Untuk mengatasi hambatan ini dan memperluas aksesibilitas, telah terjalin kolaborasi penting yang menghasilkan optimasi signifikan pada model SD3.5.
Melalui kolaborasi dengan NVIDIA, model-model keluarga SD3.5 kini telah dioptimalkan menggunakan TensorRT dan FP8. Optimasi ini secara drastis meningkatkan kecepatan pembuatan gambar dan mengurangi kebutuhan memori video (VRAM) pada GPU NVIDIA RTX yang didukung. Sebelumnya, SD3.5 memang sudah dirancang untuk berjalan pada perangkat keras konsumen, namun dengan optimasi NVIDIA ini, aksesibilitasnya semakin luas bagi para profesional kreatif dan pengembang.
Keunggulan SD3.5
Peningkatan kinerja ini membuat kekuatan inti SD3.5 lebih mudah diakses. Model SD3.5 unggul di beberapa area, menjadikannya salah satu model gambar yang paling dapat disesuaikan di pasar, sekaligus mempertahankan kinerja terbaik dalam kepatuhan perintah dan kualitas gambar. Fungsi-fungsi utama SD3.5 meliputi:
-
Gaya serba guna yaitu mampu menghasilkan berbagai gaya dan estetika, seperti 3D, fotografi, lukisan, line art, dan hampir semua gaya visual yang bisa dibayangkan.
-
Output beragam yang menciptakan gambar yang representatif dari dunia nyata, bukan hanya satu jenis orang, dengan warna kulit dan fitur yang berbeda, tanpa perlu perintah yang ekstensif.
-
Kepatuhan perintah ialah Model SD3.5 Large memimpin pasar dalam kepatuhan perintah, memungkinkan model untuk mengikuti perintah teks yang diberikan dengan cermat, menjadikannya pilihan utama untuk kinerja yang efisien dan berkualitas tinggi.
Dibantu Hardware NVIDIA
Optimasi TensorRT tidak hanya mengurangi ukuran model tetapi juga menjaga kualitasnya dengan menyederhanakan cara model beroperasi pada perangkat keras NVIDIA. Kuantisasi FP8 adalah teknik yang digunakan untuk mengurangi ukuran model, sehingga membuatnya lebih efisien. Peningkatan ini berarti kini lima sistem RTX 50 Series dapat menjalankan SD3.5 Large dari memori, dibandingkan hanya satu sistem sebelum optimasi. Model SD3.5 yang dioptimalkan TensorRT berjalan lebih efisien di seluruh GPU NVIDIA GeForce RTX 50 dan 40 Series, serta GPU NVIDIA Blackwell dan Ada Lovelace generasi NVIDIA RTX PRO.
Peningkatan kinerjanya cukup mencolok. Model SD3.5 Large mampu menghasilkan gambar hingga 2,3 kali lebih cepat dan penggunaan memorinya berkurang 40%, yaitu dari 19GB menjadi 11GB, dengan kualitas profesional yang tetap terjaga. Sementara itu, untuk SD3.5 Medium, ada peningkatan kecepatan 1,7 kali. Ini ideal bagi pengguna yang mengutamakan kecepatan dan efisiensi, serta jejak memori yang lebih rendah, cocok untuk kreator yang bekerja dengan perangkat keras RTX kelas menengah.