Agen Otonom Mistral AI Ubah Cara Pengkodean

Adopsi alat bantu pengkodean bertenaga AI di lingkungan perusahaan berjalan lambat, meskipun terdapat peningkatan kemampuan. Alasan utamanya bukan terletak pada kinerja model atau antarmuka, melainkan pada cara alat-alat ini dibangun, diterapkan, dan diatur. Ada beberapa hambatan utama yang dihadapi tim perusahaan, termasuk batasan penerapan karena sebagian besar alat hanya berbasis SaaS, terbatasnya kustomisasi, arsitektur yang terfragmentasi, kurangnya visibilitas atau kontrol terpadu, dan ketidaksesuaian dengan alat internal. Masalah-masalah ini bukan sekadar pengecualian, melainkan persyaratan dasar yang harus dipenuhi oleh setiap platform pengembangan perangkat lunak modern.

Mistral AI mengambil pendekatan full stack yang dirancang khusus untuk pengembangan perangkat lunak AI-native. Solusi ini bukan sekumpulan alat yang terisolasi, melainkan sistem terpadu yang mendukung pengembangan perangkat lunak kelas perusahaan di setiap tahap mulai dari saran kode hingga permintaan tarik otonom. Pendekatan ini dimulai dengan penyelesaian yang cepat dan andal, kemudian ditingkatkan hingga pemahaman basis kode yang lengkap dan otomatisasi multi file.

Codestral Untuk Penyelesaian Dengan Presisi Tinggi

Dasar dari tumpukan ini adalah Codestral, keluarga model generasi kode dari Mistral yang dibangun khusus untuk penyelesaian fill in the middle (FIM) presisi tinggi. Codestral 25.08, pembaruan terbaru, membawa peningkatan signifikan, termasuk peningkatan 30% dalam penyelesaian yang diterima dan 50% lebih sedikit generasi yang tidak terkendali. Model ini mendukung berbagai bahasa dan tugas, serta dapat diterapkan di lingkungan cloud, VPC, atau on premise.

Selanjutnya, ada Codestral Embed, yang menetapkan standar baru dalam pencarian dan pengambilan semantik kode. Dirancang khusus untuk kode, bukan teks umum, model ini mengungguli model penyematan terkemuka dari OpenAI dan Cohere dalam tolok ukur pengambilan kode di dunia nyata. Codestral Embed memiliki keunggulan dalam pencarian yang cepat dan latensi rendah di repositori besar, serta dapat diterapkan secara privat untuk kontrol maksimum, memastikan tidak ada kebocoran data melalui API pihak ketiga.

Alur Kerja Menggunakan Agen Otonom

Dengan konteks yang relevan, AI dapat mengambil tindakan yang berarti melalui alur kerja agen otonom. Devstral, didukung oleh kerangka agen OpenHands, memungkinkan alur kerja pengkodean agen yang siap untuk perusahaan. Devstral dibangun khusus untuk tugas rekayasa seperti refaktor lintas file, pembuatan uji, dan penulisan PR. Model ini menunjukkan kinerja model terbuka teratas pada SWE Bench Verified, dengan Devstral Small 1.1 mencetak 53,6% dan Devstral Medium mencapai 61,6%.

Semua kemampuan dalam tumpukan Mistral penyelesaian, pencarian semantik, dan alur kerja agen tersedia melalui Mistral Code, sebuah plugin asli untuk JetBrains dan VS Code. Plugin ini menyediakan fitur seperti penyelesaian inline, otomatisasi tugas satu klik, kesadaran konteks, dan pencarian semantik terintegrasi. Mistral Code dirancang untuk mendukung persyaratan penerapan perusahaan, termasuk penyebaran di lingkungan apa pun dan kontrol penuh atas data. Visibilitas penggunaan juga tersedia melalui Mistral Console.

Alban Alev, VP head of Solutioning di Capgemini Prancis, mengatakan, “Memanfaatkan Codestral Mistral telah menjadi pengubah permainan dalam penggunaan asisten pengkodean pribadi untuk proyek-proyek klien kami di industri yang diatur. Kami telah berevolusi dari dukungan dasar untuk beberapa aktivitas pengembangan menjadi nilai sistematis untuk tim pengembangan kami.”

Tumpukan pengkodean ini dirancang untuk alur kerja pengembangan yang lebih cepat dan lebih mudah diatur. Karena penyelesaian, pencarian, dan agen memiliki arsitektur yang sama, penanganan konteks, dan batas dukungan, tim dapat menghindari penyimpangan, biaya tambahan, dan celah keamanan akibat menyatukan alat-alat pihak ketiga. Hasilnya adalah alur kerja pengembangan yang dirancang untuk produktivitas individu dan skala organisasi, dengan visibilitas penuh dan kontrol keamanan.