AI Bantu Upaya Manusia Mengerti Bahasa Lumba-Lumba

(Source: Google)

Komunikasi dengan Binatang adalah salah satu misteri yang dicoba dipecahkan oleh manusia. Google bekerja sama dengan Georgia Tech dan Wild Dolphin Project (WDP), memperkenalkan DolphinGemma, yaitu model bahasa besar (large language model/LLM) yang dirancang untuk mempelajari struktur vokalisasi lumba-lumba dan menghasilkan urutan suara mirip hewan laut tersebut. Proyek ini tidak hanya mendorong batasan AI, tetapi juga membuka potensi koneksi baru antara manusia dengan dunia bawah laut.

Wild Dolphin Project (WDP) menjadi fondasi utama riset ini. Sejak 1985, WDP mempelajari komunitas lumba-lumba tutul Atlantik (Stenella frontalis) di Bahama, dengan mengumpulkan data audio-video bawah laut yang dikombinasikan bersama identitas individu, riwayat hidup, dan perilaku mereka. Pendekatan “di dunia mereka, sesuai syarat mereka” ini memungkinkan peneliti menghubungkan suara dengan konteks perilaku spesifik. Misalnya, siulan unik untuk mengumpulkan induk dan anak, suara “squawk” saat konflik, atau “buzz” dalam ritual kawin.

DolphinGemma memanfaatkan teknologi audio Google, tokenizer SoundStream, untuk merepresentasikan suara lumba-lumba secara efisien. Model ini dirancang khusus untuk memproses urutan suara kompleks dan memprediksi kelanjutannya, mirip cara LLM manusia memprediksi kata berikutnya. Kemampuannya dioptimalkan untuk dijalankan di telepon pintar Pixel yang digunakan WDP di lapangan, sehingga memungkinkan analisis real-time tanpa bergantung pada komputasi awan.

Selain menganalisis komunikasi alami, WDP mengembangkan sistem CHAT (Cetacean Hearing Augmentation Telemetry) bersama Georgia Tech. Sistem komputer bawah air ini bertujuan membangun kosakata sederhana menggunakan siulan sintetis yang dikaitkan dengan objek tertentu, seperti rumput laut atau syal.Proses ini melibatkan empat langkah: mendeteksi suara di kebisingan laut, mengidentifikasi siulan secara real-time, memberi tahu peneliti melalui headphone, dan memberikan respons cepat untuk memperkuat asosiasi.

Google Pixel 6 digunakan WDP untuk menganalisis suara lumba-lumba secara real-time dengan akurasi tinggi. Rencananya, generasi mendatang seperti Pixel 9  akan mengintegrasikan fungsi speaker/mikrofon dan menjalankan model deep learning serta algoritma template matching secara bersamaan. Peningkatan ini memungkinkan sistem CHAT bekerja lebih efisien di lingkungan bawah laut yang dinamis.

Meski masih dalam tahap awal, DolphinGemma dan CHAT membuka jalan bagi interaksi dua arah yang lebih kompleks di masa depan. Jika berhasil, temuan ini tidak hanya mengungkap misteri bahasa lumba-lumba, tetapi juga merevolusi cara manusia berinteraksi dengan keanekaragaman hayati lainnya.