Perplexity memperkenalkan strategi pertahanan berlapis di Comet untuk menghadapi ancaman Prompt Injection. Melalui deteksi waktu nyata, Structured Prompting, kontrol pengguna, dan transparansi, Comet menetapkan standar baru keamanan AI.
AI kini berevolusi dari sekadar menjawab pertanyaan menjadi asisten yang dapat bertindak atas nama pengguna. Comet, browser asisten AI dari Perplexity, dirancang dengan prinsip ini. Tidak hanya menampilkan informasi, Comet membantu pengguna menyelesaikan tugas nyata mulai dari memesan hotel, mengelola akun, hingga membantu aktivitas daring harian. Namun, desain berorientasi aksi ini juga menghadirkan tantangan baru dalam keamanan siber yaitu munculnya ancaman Prompt Injection.
Empat Lapisan Ancaman Prompt Injection
Malicious Prompt Injection (MPI) adalah upaya menyusupkan instruksi tersembunyi ke dalam konten yang diproses AI untuk mengalihkan tindakannya dari maksud asli pengguna. Serangan ini tidak mengeksploitasi bug perangkat lunak, melainkan memanipulasi proses pengambilan keputusan AI itu sendiri. Untuk mengatasinya, Perplexity menerapkan strategi defense in depth, pendekatan pertahanan berlapis, yang memastikan keamanan tetap terjaga bahkan jika satu lapisan dilewati.
1. Klasifikasi Prompt Injection Waktu Nyata
Lapisan pertama pertahanan Comet adalah klasifikator machine learning yang dilatih mendeteksi instruksi berbahaya tersembunyi dalam situs yang dikunjungi pengguna. Setiap kali Comet memuat konten baru, sistem keamanan menjalankan pemeriksaan tanpa menambah latensi. Deteksi mencakup teknik seperti teks tak terlihat, injeksi berbasis gambar yang hanya dibaca oleh model visi, dan Goal Hijacking upaya mengubah tujuan pengguna secara halus. Model ini terus diperbarui melalui kolaborasi dengan peneliti keamanan dan program bug bounty untuk menghadapi pola serangan baru.
2. Penguatan Keamanan Melalui Structured Prompting
Ketika konten lolos pemeriksaan awal, Comet menerapkan Structured Prompting untuk menjaga fokus AI pada niat pengguna. Teknik ini menyisipkan instruksi pengaman di titik-titik keputusan utama. Konten eksternal diberi label tidak tepercaya agar AI dapat membedakan antara perintah pengguna dan data yang diambil. Sistem perutean juga terus merujuk pada kueri asli pengguna guna memastikan keputusan tetap sesuai konteks.
3. Konfirmasi Pengguna untuk Aksi Sensitif
Untuk tindakan penting seperti mengirim email, mengubah jadwal, atau menyelesaikan pesanan Comet akan menjeda dan meminta konfirmasi pengguna. Pendekatan human in the loop ini mencegah AI melakukan tindakan berisiko tanpa sepengetahuan pengguna, sekaligus menjadi lapisan pengaman terhadap kesalahan non-malicious maupun serangan tersembunyi.
4. Transparansi Melalui Notifikasi
Jika sistem mendeteksi dan memblokir potensi prompt injection, pengguna akan menerima notifikasi yang menjelaskan apa yang diblokir dan alasannya. Pendekatan transparan ini tidak hanya membangun kepercayaan, tetapi juga meningkatkan literasi keamanan pengguna terhadap ancaman berbasis AI.
Perplexity menekankan bahwa keamanan bukanlah fitur tambahan, melainkan fondasi utama sejak awal pengembangan Comet. Industri kini menghadapi asimetri serangan pertahanan, di mana penyerang hanya perlu menemukan satu celah, sementara pembela harus menutup semuanya. Melalui kombinasi deteksi waktu nyata, Structured Prompting, kontrol pengguna, dan transparansi, Comet menetapkan standar baru dalam keamanan browser bertenaga AI.






