SAM Audio dari Meta menghadirkan cara baru memisahkan suara dalam rekaman audio dan video melalui perintah teks, visual, dan jangka waktu secara terpadu.
Selama ini, proses pemisahan dan penyuntingan suara sering mengharuskan pengguna berpindah dari satu perangkat lunak ke perangkat lunak lain. Setiap alat biasanya hanya dibuat untuk satu fungsi tertentu, sehingga alur kerja menjadi panjang dan kurang praktis. Kondisi ini menyulitkan kreator audio dan video yang ingin menangani berbagai kebutuhan pemrosesan suara dalam satu sistem terpadu.
Menjawab keterbatasan tersebut, Meta memperkenalkan SAM Audio, model AI yang dirancang untuk mengenali dan memisahkan elemen suara secara langsung dari rekaman audio maupun video. Teknologi ini memungkinkan pengguna mengisolasi suara tertentu dari campuran audio yang rumit tanpa perlu memahami aspek teknis seperti frekuensi atau gelombang suara.
Pendekatan yang digunakan SAM Audio meniru cara manusia mengenali bunyi dalam kehidupan sehari-hari. Dengan antarmuka yang sederhana, pengguna dapat menyaring kebisingan, mengekstrak suara utama, atau memisahkan elemen audio tertentu dengan kontrol yang lebih alami dan mudah dipahami.
Tiga Metode Perintah dalam SAM Audio
Sebagai model terpadu, SAM Audio mendukung tiga jenis perintah yang dapat digunakan secara terpisah maupun bersamaan, yaitu:
- Perintah teks
Pengguna cukup mengetikkan deskripsi suara seperti “gonggongan anjing” atau “suara nyanyian” untuk mengekstrak elemen audio tersebut dari rekaman. - Perintah visual
Pengguna dapat mengeklik orang atau objek tertentu di dalam video untuk mengisolasi suara yang dihasilkan oleh subjek tersebut. - Perintah jangka waktu
Metode ini memungkinkan pengguna menandai rentang waktu tertentu ketika suara target muncul, sebuah pendekatan baru yang belum banyak ditemukan pada alat pemisahan audio sebelumnya.
Ketiga metode ini memberikan kendali yang fleksibel bagi berbagai kebutuhan, mulai dari pemisahan vokal dan instrumen musik, penyaringan kebisingan lalu lintas, hingga pengolahan audio untuk film, podcast, penelitian ilmiah, dan fitur aksesibilitas. Saat ini, SAM Audio dapat dicoba langsung melalui Segment Anything Playground. Pengguna dapat mengunggah berkas audio atau video sendiri maupun menggunakan contoh yang tersedia. Selain itu, model ini juga tersedia untuk diunduh bagi pengembang yang ingin mempelajari dan mengintegrasikannya ke dalam alat kreatif generasi berikutnya.









