Platform AI Google Satu-Satunya Platform Dengan AI Generatif Untuk Musik, Video, Suara Dan Gambar

(Source: Google Cloud)

Di ajang Google Cloud Next ’25 yang diselenggarakan di Las Vegas Sphere, Amerika Serikat,  Google mengumumkan empat pembaruan besar untuk AI generatif di platform Vertex AI. Pembaruan ini mencakup kemampuan menghasilkan musik, video, suara, dan gambar berkualitas tinggi melalui perintah teks atau input sederhana. 

Pembaruan ini menjadikan Vertex AI sebagai satu-satunya platform yang menyediakan model media generatif yang mencakup video, gambar, suara dan musik. Berikut update media generatif yang tersedia di Vertex AI dari Google.

Lyria: Model pertama yang bisa langsung digunakan oleh perusahaan untuk hasilkan musik dari teks

Perusahaan dapat mengubah perintah teks sederhana menjadi klip musik berdurasi 30 detik. Model ini menghasilkan audio dengan fidelitas tinggi, menangkap nuansa dan menyajikan komposisi yang kaya dan detail dalam berbagai genre musik. Organisasi dan perusahaan kini dapat dengan cepat membuat soundtrack yang bisa dipakai di kampanye pemasaran, peluncuran produk, pengalaman di dalam toko, podcast, dan konten digital lainnya yang sesuai dengan suasana dan narasi merek perusahaan. Model text-to-music Lyria tersedia dalam pratinjau privat di Vertex AI melalui Allowlist.

Veo 2: Tawarkan Fitur Baru Penyuntingan dan Kontrol Kamera

Model video generatif ini menawarkan fitur baru yang membantu organisasi membuat video, mengeditnya, dan menambahkan efek visual. Fitur barunya meliputi: inpainting untuk menghapus gambar latar belakang, logo, atau gangguan yang tidak diinginkan, sehingga memungkinkan pengeditan profesional tanpa sentuhan manual; outpainting untuk memperluas frame rekaman video, yang memungkinkan pelanggan mengoptimalkan video pada berbagai ukuran layar dan platform; teknik sinematik yang canggih untuk menghasilkan komposisi gambar, sudut kamera, dan pacing; dan interpolasi yang memungkinkan perusahaan menentukan awal dan akhir dari urutan video dengan menghasilkan frame penghubung. Model Veo 2 tersedia dalam pratinjau privat di Vertex AI melalui Allowlist.

Chirp 3: Buat Suara Kustom dan Transkripsi yang Disempurnakan dari Rekaman Berisi Banyak Pembicara

Model audio generatif ini membuat suara kustom hanya dengan 10 detik input audio. Perusahaan bisa memiliki kemampuan untuk mempersonalisasi call center, mengembangkan konten, dan membangun suara merek yang unik. Semu aini dapat dilakukan dengan tetap mempertahankan identitas merek yang konsisten. Selain itu, fitur transkripsi baru dapat mengidentifikasi pembicaraan masing-masing individu secara terpisah dalam rekaman yang berisikan banyak pembicara. Fitur ini secara signifikan meningkatkan kejelasan dan kegunaan transkripsi untuk aplikasi seperti ringkasan rapat, analisis podcast, dan rekaman panggilan multi-pihak.

Imagen 3: Perbaikan Gambar dan Penghapusan Objek Semakin Natural

Model text-to-image dari Google kini memiliki kemampuan menghasilkan gambar dan inpainting yang ditingkatkan untuk merekonstruksi bagian gambar yang hilang atau rusak. Pembaruan ini secara signifikan meningkatkan kualitas penghapusan objek serta melakukan pengeditan yang lebih alami dan mulus. Imagen memberikan kepatuhan terhadap prompt yang tinggi, sehingga dapat mewujudkan visi kreatif pengguna secara presisi.