Era Pengalaman dimana AI Belajar Langsung Dengan Dunia

(Source: Scale)

Kemampuan sistem Kecerdasan Buatan (AI) saat ini telah merevolusi interaksi manusia dengan teknologi, didorong oleh era data manusia yang berakar pada data buatan manusia. Namun, para peneliti AI, David Silver dan Richard Sutton, berpendapat bahwa kita berada pada titik balik, di mana AI mendekati batas kemampuannya jika hanya mengandalkan data statis. Mereka membayangkan batas baru yaitu era pengalaman, di mana agen AI belajar melalui interaksi langsung dengan dunia, bukan hanya dari data yang sudah ada.

Visi Di Era Pengalaman

Visi era pengalaman didasari oleh keyakinan bahwa mengandalkan pengetahuan manusia yang sudah ada membatasi potensi kecerdasan buatan (AI). Meskipun pelatihan AI dengan kumpulan data buatan manusia telah memungkinkan replikasi berbagai kemampuan manusia, terobosan signifikan lainnya masih menanti di masa depan. Kerangka kerja AI saat ini memiliki beberapa keterbatasan yaitu laju kemajuan melambat karena pengembangan terlalu bergantung pada dataset statis yang sudah ada, kita mendekati batas pengetahuan yang dapat diekstraksi dari dataset tersebut, terutama saat mencoba menjelajahi domain baru yang kritis, dan banyak wawasan tak terduga yang berada di luar pengetahuan kolektif kita belum terakses oleh sistem AI yang hanya dilatih dengan data yang sudah ada.

Untuk benar-benar melampaui kemampuan manusia, AI harus belajar di luar batasan pengetahuan manusia yang sudah ada, bahkan mungkin melampaui bahasa manusia. Paradigma baru ini mengusulkan penggabungan pemahaman mendalam yang dihasilkan sendiri dengan kecerdasan yang dikembangkan melalui pembelajaran dari dataset statis. Pendekatan ini tidak menggantikan peran dasar data statis, melainkan menambahkan mekanisme kuat untuk berinovasi, terutama di area di mana contoh buatan manusia langka atau tidak ada.

Scale berkontribusi dalam membangun era pengalaman ini dengan mengatasi masalah, di mana sinyal keberhasilan atau kegagalan di dunia nyata seringkali jarang, tertunda, atau sulit diinterpretasikan. Scale menangani ini dengan menciptakan lingkungan dan feedback loops yang lebih kaya mengembangkan lingkungan digital, dan fisik, yang menyediakan sinyal umpan balik yang lebih padat dan informatif. Selain itu, mereka menerapkan Generasi Data Pengalaman yang canggih, memanfaatkan keahlian mereka dalam anotasi data skala besar, kurasi, dan jaminan kualitas untuk mengubah pengalaman mentah menjadi data yang dapat dipelajari, dipandu oleh wawasan manusia.

Suite evaluasi Scale yang terus dirancang untuk memandu pengembangan AI menuju kemampuan yang dibutuhkan untuk era baru ini. Ini mencakup alat seperti EnigmaEval, Fortress, Humanity’s Last Exam (HLE), MASK, MultiChallenge, dan VISTA. Alat-alat ini secara kolektif memastikan AI dapat beradaptasi, memahami konteks, dan menunjukkan penalaran yang mendalam.

4 Pilar Di Era Pengalam

Visi Silver dan Sutton untuk era pengalaman didasarkan pada empat pilar utama. Agen AI akan belajar dari aliran pengalaman berkelanjutan, memungkinkannya beradaptasi terus-menerus dan fokus pada tujuan jangka panjang. Selanjutnya, agen AI akan berinteraksi secara mandiri dengan lingkungannya menggunakan berbagai modalitas, jauh melampaui komunikasi berbasis teks yang ada saat ini. Sinyal pembelajaran akan muncul langsung dari konsekuensi di dunia nyata, tidak hanya bergantung pada penilaian awal manusia. Terakhir, agen akan mengembangkan cara berpikir baru yang unik, yang berpotensi berbeda dari manusia, dipelajari melalui interaksi langsung dengan lingkungan.