Buang Cara Lama, Kini Bangun AI Agen Dengan Model Kecil

(Source: IBM)

Aturan lama dalam pengembangan perangkat lunak, seperti road map enam hingga dua belas bulan, infrastruktur awal yang berat, dan rilis monolitik, kini tidak dapat lagi mengikuti perkembangan dunia bertenaga AI. Sudah waktunya untuk membuang aturan lama tersebut, menemukan kembali pendekatan pengembangan, dan memikirkan ulang cara membangun aplikasi. Pendekatan baru ini berfokus pada enam pergeseran strategis yang dapat membantu perusahaan membangun AI agent dengan model yang kecil, cepat, dan terbuka.

  1. Membangun model yang sesuai dengan kebutuhan bisnis

Model yang tepat untuk aplikasi tidak selalu harus memiliki miliaran parameter. Model yang kecil dan disesuaikan dengan domain sering kali dapat menyamai atau bahkan melampaui model generik yang besar pada tugas-tugas tertentu. Model ini dapat memberikan akurasi yang sebanding dengan biaya yang lebih rendah dan inferensi yang lebih cepat. Dengan fokus pada masalah yang terdefinisi dengan baik, seperti ringkasan teks, pembuatan kode, atau tanya-jawab dokumen, tim pengembangan dapat menurunkan biaya inferensi per kueri, mengurangi latensi, dan menyebarkan model di lingkungan hibrida atau edge.

  1. Membuat platform yang tangkas dan ekosistem yang terbuka

Keberhasilan AI generatif tidak hanya bergantung pada pemilihan model yang tepat. Pengembangan juga membutuhkan alat, platform, dan praktik yang mengubah AI menjadi hasil bisnis yang nyata. Para pengembang disarankan untuk berinvestasi pada model AI sumber terbuka yang menghindari ketergantungan pada satu vendor, arsitektur microfactory, dan alur kerja modular. Pendekatan ini mempersingkat program percontohan menjadi hanya beberapa minggu, sehingga tim dapat menciptakan agen baru dalam hitungan menit dan melepaskan potensi AI generatif di seluruh perusahaan.

  1. Menyematkan AI yang bertanggung jawab sejak awal

AI yang bertanggung jawab bukan sekadar pemikiran tambahan, tetapi harus disematkan di setiap tahapan pengembangan. Saat membangun aplikasi semacam ini, para pengembang perlu fokus pada transparansi pemilihan dan pelatihan model, ketelitian rekayasa data, serta tata kelola yang melibatkan peran manusia. Dengan standarisasi tata kelola dari sumbernya, tim pengembangan dapat membantu mengurangi bias, melindungi privasi, dan menumbuhkan kepercayaan, yang menjadi dasar untuk penerapan AI generatif yang berkelanjutan dan terukur.

  1. Mengoperasikan AI agen melalui siklus hidup penuh

Setelah fondasi yang kuat terbentuk, langkah selanjutnya adalah mengoperasionalkan AI melalui agen. Agen AI adalah pekerja semi otonom yang meninjau masukan, melakukan penalaran tentang tugas, dan bertindak, sering kali berkolaborasi dengan manusia dan agen lain. Mengintegrasikan agen-agen ini ke dalam alur kerja perusahaan dapat mendorong peningkatan produktivitas. Siklus hidup ini mencakup perancangan peran agen yang jelas, pembangunan alur kerja model yang ringkas, penyebaran di platform terpusat, serta pengoperasian dan penyempurnaan yang berkelanjutan.

  1. Memasangkan agen dengan model yang tepat

Kunci untuk mengoperasikan agen dalam skala besar terletak pada seberapa efektif agen dipasangkan dengan model yang cepat dan sesuai untuk bisnis. Pendekatan ini membutuhkan praktik perancangan, orkestrasi, dan pengukuran yang selaras dengan hasil bisnis. Tim perlu memilih model yang tepat dengan membandingkan latensi dan biaya, membangun pabrik dan orkestrasi untuk mengelompokkan agen terkait, mengatur serta memantau performa, dan mengukur nilai yang dihasilkan dengan KPI yang jelas.

  1. Menskalakan model kecil dan cepat untuk dampak perusahaan

Ketika satu model yang cepat dan ringkas hanya menghabiskan sebagian kecil dari biaya model bahasa besar, menambahkan agen-agen tambahan menjadi pengeluaran marginal. Keunggulan ini memungkinkan penskalaan yang cepat, di mana puluhan atau bahkan ratusan agen terspesialisasi dapat berjalan secara bersamaan tanpa menghabiskan anggaran. Hal ini juga memberikan kendali atas kegagalan agen individual sehingga tidak menyebar ke seluruh sistem.