
(Source: Google DeepMind)
Olimpiade Matematika Internasional (IMO) merupakan kompetisi paling bergengsi di dunia bagi para matematikawan muda, yang diadakan setiap tahun sejak 1959. Setiap negara yang berpartisipasi diwakili oleh enam matematikawan elit pra-universitas yang bersaing untuk memecahkan enam masalah yang sangat sulit dalam aljabar, kombinatorika, geometri, dan teori bilangan. Medali diberikan kepada separuh kontestan teratas, dengan sekitar 8% menerima medali emas yang prestisius. IMO juga telah menjadi tantangan bagi sistem AI sebagai ujian kemampuan pemecahan masalah dan penalaran matematis tingkat lanjut mereka.
Dua Sistem Dari Google DeepMind
Tahun lalu, sistem gabungan AlphaProof dan AlphaGeometry 2 dari Google DeepMind mencapai standar medali perak, menyelesaikan empat dari enam masalah dan mencetak 28 poin. Ini menunjukkan bahwa AI mulai mendekati penalaran matematis elit manusia. Kini, versi lanjutan dari Gemini Deep Think telah berhasil melampaui pencapaian tersebut. Model ini menyelesaikan lima dari enam masalah IMO dengan sempurna, mendapatkan total 35 poin, dan mencapai kinerja setingkat medali emas.
Pencapaian ini merupakan kemajuan signifikan dibandingkan hasil tahun lalu. Pada IMO 2024, AlphaGeometry dan AlphaProof memerlukan para ahli untuk terlebih dahulu menerjemahkan masalah dari bahasa alami ke bahasa khusus domain, seperti Lean, dan sebaliknya untuk pembuktian. Proses ini juga membutuhkan dua hingga tiga hari komputasi. Tahun ini, model Gemini yang canggih beroperasi secara end-to-end dalam bahasa alami, menghasilkan pembuktian matematis yang ketat langsung dari deskripsi masalah resmi, semuanya dalam batas waktu kompetisi 4,5 jam.
Untuk mencapai hasil ini, digunakan versi lanjutan dari Gemini Deep Think, mode penalaran yang ditingkatkan untuk masalah kompleks yang menggabungkan beberapa teknik riset terbaru, termasuk pemikiran paralel. Pengaturan ini memungkinkan model untuk secara bersamaan mengeksplorasi dan menggabungkan beberapa kemungkinan solusi sebelum memberikan jawaban akhir, daripada mengikuti satu rantai pemikiran linier. Untuk memaksimalkan kemampuan penalaran Deep Think, versi Gemini ini juga dilatih menggunakan teknik pembelajaran penguatan baru yang dapat memanfaatkan lebih banyak penalaran multi-langkah, pemecahan masalah, dan data pembuktian teorema.
Prof. Dr. Gregor Dolinar IMO President, mengatakan, “Kami dapat mengonfirmasi bahwa Google DeepMind telah mencapai pencapaian yang sangat diinginkan, dengan memperoleh 35 poin dari kemungkinan 42 poin sebuah skor medali emas. Solusi mereka sangat menakjubkan dalam banyak hal. Para juri IMO menganggap solusi mereka jelas, tepat, dan sebagian besar mudah diikuti.”
Google DeepMind juga menyediakan Gemini akses ke korpus solusi masalah matematika berkualitas tinggi yang dikurasi, dan menambahkan beberapa petunjuk umum tentang cara mendekati masalah IMO ke dalam instruksinya.
Kolaborasi Komunitas Dengan Google DeepMind
Google DeepMind memiliki kolaborasi berkelanjutan dengan komunitas matematika, namun potensi AI untuk berkontribusi pada matematika masih pada tahap awal. Dengan mengajari sistem mereka untuk bernalar secara lebih fleksibel dan intuitif, mereka makin dekat untuk membangun AI yang dapat memecahkan matematika yang lebih kompleks dan canggih. Meskipun pendekatan tahun ini murni berdasarkan bahasa alami dengan Gemini, kemajuan juga terus dibuat pada sistem formal seperti AlphaGeometry dan AlphaProof. Agen yang menggabungkan kefasihan bahasa alami dengan penalaran yang ketat, termasuk penalaran terverifikasi dalam bahasa formal, akan menjadi alat yang sangat berharga bagi matematikawan, ilmuwan, insinyur, dan peneliti, membantu memajukan pengetahuan manusia dalam perjalanan menuju Kecerdasan Umum Buatan.





