OpenAI Luncurkan Agen ChatGPT Dengan Kontrol Penuh Pengguna

(Source: Open AI)

Pencarian informasi dan penyelesaian tugas daring sering kali melibatkan serangkaian langkah yang berulang dan memakan waktu. Pengguna sering kali harus berpindah-pindah antara melakukan riset, mengumpulkan data, dan kemudian menerapkan informasi tersebut untuk menyelesaikan suatu pekerjaan. Misalnya, melakukan riset keuangan mendalam, mengisi formulir daring yang banyak, atau membuat tayangan slide profesional, semuanya memerlukan interaksi manual yang signifikan. Keterbatasan ini menghambat produktivitas dan membatasi kemampuan pengguna untuk fokus pada aspek pekerjaan yang lebih kreatif dan bernilai tinggi.

ChatGPT memperkenalkan agen ChatGPT, sistem agen terpadu yang menggabungkan kemampuan berinteraksi dengan situs web, kekuatan riset mendalam untuk menyatukan informasi web, dan keahlian percakapan ChatGPT. Ini adalah langkah yang mengubah ChatGPT tidak hanya menjadi alat berpikir, tetapi juga alat yang dapat bertindak. Dengan agen ChatGPT, pengguna kini dapat memperluas ide dan pertanyaan dengan tindakan, memungkinkan penyelesaian tugas yang rumit dari awal hingga akhir dengan lancar berpindah antara penalaran dan tindakan.

Fungsi Agen ChatGPT

Fungsi utama dari agen ChatGPT adalah mengambil alih pekerjaan pengguna untuk mempercepat keluaran kerja, sekaligus memberi waktu untuk berfokus pada bagian lain. Pengguna dapat meminta ChatGPT untuk menangani permintaan seperti lihat kalender saya dan beri saya pengarahan singkat tentang rapat klien mendatang berdasarkan berita terkini atau analisis tiga pesaing dan buat tayangan slide. Agen ini akan secara cerdas menavigasi situs web, memilih tanggal, memfilter hasil, membuat prompt untuk masuk secara aman, menjalankan kode, serta bahkan memberikan keluaran yang profesional dan dapat diedit seperti tayangan slide dan spreadsheet yang merangkum temuannya.

Yang terpenting, pengguna selalu memegang kendali penuh. ChatGPT akan meminta izin sebelum mengambil tindakan penting, dan pengguna dapat dengan mudah menyela, mengambil alih peramban, atau menghentikan tugas setiap saat. Ini memastikan bahwa meskipun agen bekerja secara otonom, pengguna tetap memiliki kontrol penuh atas prosesnya. Peluncuran ini hanyalah permulaan dari integrasi kemampuan agen secara langsung ke ChatGPT, dengan rencana untuk terus menambahkan perbaikan signifikan secara berkala.

Integrasi Agen ChatGPT

Agen ChatGPT merupakan perkembangan alami dari dua terobosan sebelumnya yaitu Operator, agen pratinjau riset yang mampu berinteraksi langsung dengan situs web menggunakan peramban jarak jauh, dan riset mendalam, alat penalaran web multi-langkah. Sebelumnya, setiap alat memiliki kekuatan unik, namun juga keterbatasan. Operator tidak dapat melakukan analisis mendalam atau menulis laporan terperinci, sementara riset mendalam tidak dapat berinteraksi dengan situs web untuk menyempurnakan hasil atau mengakses konten yang memerlukan autentikasi pengguna. Dengan mengintegrasikan kekuatan pelengkap ini, ChatGPT kini dapat secara aktif terlibat dengan situs web mengeklik, memfilter, dan mengumpulkan hasil yang lebih tepat.

Agen ChatGPT dilengkapi dengan semua alat web yang dimiliki OpenAI yaitu peramban visual yang berinteraksi dengan web melalui antarmuka pengguna grafis, peramban berbasis teks untuk kueri web berbasis penalaran yang lebih sederhana, dan akses API langsung. Memberikan ChatGPT berbagai cara untuk mengakses dan berinteraksi dengan informasi web memungkinkannya memilih jalur optimal untuk melaksanakan tugas secara paling efisien.

Agen ChatGPT dirancang untuk alur kerja kolaboratif dan berulang yang jauh lebih interaktif dan fleksibel. Pengguna dapat menyela setiap saat untuk menjelaskan instruksi, mengalihkan tugas, atau mengarahkannya ke hasil yang diinginkan, dan proses akan berlanjut dari titik terakhir tanpa kehilangan kemajuan sebelumnya. Demikian pula, ChatGPT sendiri secara proaktif mencari detail tambahan dari pengguna apabila dibutuhkan untuk memastikan tugas tetap selaras dengan sasaran. Jika tugas memakan waktu lebih lama atau terasa macet, pengguna dapat menjeda, meminta ringkasan kemajuan, atau berhenti sepenuhnya dan menerima hasil sebagian.

Peningkatan kemampuan model ini tercermin pada kinerja mutakhir dalam evaluasi akademis yang mengukur kemampuan penjelajahan web dan penyelesaian tugas di dunia nyata. Pada Ujian Terakhir Kemanusiaan, agen ChatGPT memperoleh skor tertinggi baru sebesar 43,1. Pada DSBench, agen ChatGPT secara substansial mengungguli model mutakhir sebelumnya dan secara signifikan melampaui kinerja manusia dalam tugas analisis data. Untuk SpreadsheetBench, agen ChatGPT menetapkan status mutakhir yang baru, lebih dari dua kali lipat kinerja GPT-4o. Ketika diberi kemampuan untuk mengedit spreadsheet secara langsung, agen ChatGPT bahkan memperoleh skor lebih baik sebesar 45,5%, dibandingkan dengan Copilot di Excel sebesar 20,0%. Ini membuktikan bahwa agen ChatGPT benar-benar dapat bekerja bersama pengguna, secara proaktif memilih tindakan yang akan diambil ketika menghadapi berbagai informasi dan langkah dalam tugas.