Terkadang, hambatan bahasa menjadi penghalang komunikasi antara orang-orang yang berada di belahan dunia berbeda. Hal ini sering terjadi dalam pertemuan daring, baik untuk keperluan profesional, keluarga, maupun pertemanan. Kesulitan ini mendorong tim Google untuk mencari cara agar setiap orang bisa berkomunikasi tanpa batasan bahasa.
Tim Google Meet, DeepMind, dan beberapa tim riset lain berkolaborasi menciptakan fitur penerjemahan ucapan secara waktu nyata. Fitur ini disebut Speech Translation yang memungkinkan pengguna berbicara dengan siapa saja dalam panggilan, bahkan jika mereka menggunakan bahasa yang berbeda. Saat pengguna berbicara, Speech Translation akan menerjemahkan ucapan secara otomatis, hampir dalam waktu nyata, dengan suara yang menyerupai suara asli pembicara.
Terjemahan Secara Real Time
Dulu, teknologi penerjemahan audio mengandalkan proses melalui beberapa langkah yang menyebabkan jeda signifikan, sekitar 10-20 detik, yang membuat percakapan alami menjadi tidak mungkin. Selain itu, suara yang dihasilkan dari penerjemahan terdengar umum dan tidak memiliki karakteristik unik dari pembicara. Namun, terobosan besar berhasil dicapai berkat penggunaan model besar yang memungkinkan penerjemahan satu kali jalan.
Pengembangan fitur ini tidak luput dari kendala, terutama dalam memastikan kualitas penerjemahan yang tinggi. Kualitas ini dipengaruhi oleh berbagai faktor, seperti aksen pembicara, kebisingan latar belakang, atau kondisi jaringan. Tim Google bekerja sama dengan para ahli bahasa untuk memahami nuansa bahasa dan aksen. Saat ini, fitur tersebut menerjemahkan sebagian besar ungkapan secara harfiah, yang kadang-kadang bisa menimbulkan kesalahpahaman. Namun, mereka berharap pembaruan dengan model bahasa besar yang lebih canggih akan mampu menangkap nuansa seperti nada dan ironi dengan lebih akurat.
Saat ini, fitur Speech Translation di Google Meet telah tersedia dalam bahasa Italia, Portugis, Jerman, dan Prancis. Frederic Lindstrom, yang memimpin tim rekayasa audio di Meet, merasa puas melihat penelitian AI yang mutakhir dapat menjadi kenyataan, terutama dalam proyek yang membantu audiens global yang luas. Ia berbagi bahwa teknologi ini membantu menjembatani kesenjangan komunikasi, seperti antara imigran dan kakek-nenek mereka yang berbicara bahasa berbeda.