IBM Spyre Accelerator Percepat Generative AI Dan AI Agent

devadmin
4 bulan yang lalu

IT perusahaan mengalami pergeseran mendasar dari alur kerja logika tradisional menuju inferencing agentic AI yang lebih cerdas karena keterlibatan kecerdasan buatan. AI agent membutuhkan inferensi dengan latensi rendah dan daya tanggap sistem real time. IBM menyadari bahwa mainframe dan server harus dapat menjalankan model AI seiring dengan beban kerja perusahaan yang paling menuntut tanpa mengorbankan throughput.

Dalam rangka menjawab kebutuhan pasar ini, IBM mengumumkan ketersediaan umum IBM Spyre Accelerator, akselerator AI yang memungkinkan inferensi latensi rendah untuk mendukung kasus penggunaan Generative AI dan Agentic AI. Solusi ini dirancang dengan memprioritaskan keamanan dan ketahanan beban kerja inti perusahaan. Spyre akan tersedia secara umum pada 28 Oktober 2025 untuk sistem IBM z17 dan LinuxONE 5, dan pada awal Desember 2025 untuk server Power11.

Barry Baker, COO, IBM Infrastructure & GM, IBM Systems, mengatakan, “Dengan Spyre Accelerator, kami memperluas kemampuan sistem kami untuk mendukung kecerdasan buatan multi-model termasuk generative AI dan AI agent. Inovasi ini memungkinkan klien untuk menskalakan beban kerja kritis yang didukung AI dengan keamanan, ketahanan, dan efisiensi yang tak tertandingi, sambil mengoptimalkan nilai data perusahaan mereka.”

Manfaat Spyre Accelerator

IBM Spyre Accelerator mencerminkan kekuatan pipa research to product IBM, menggabungkan inovasi terobosan dari IBM Research AI Hardware Center dengan pengembangan kelas perusahaan. Spyre berevolusi menjadi system on a chip komersial yang diproduksi menggunakan teknologi node 5nm, memiliki 32 accelerator cores individual, dan 25,6 miliar transistor. Dipasang pada kartu PCIe 75 watt, kartu ini dapat dikelompokkan hingga 48 kartu pada sistem IBM Z atau LinuxONE dan 16 kartu pada sistem IBM Power untuk menskala kemampuan AI.

Untuk klien IBM, Spyre Accelerator menawarkan pemrosesan yang cepat dan aman dengan akselerasi AI on-prem. Hal ini memungkinkan bisnis memanfaatkan AI dalam skala besar sambil menjaga data tetap berada di sistem IBM Z, LinuxONE, dan Power. Pada sistem mainframe, Spyre, berpasangan dengan prosesor Telum II, memberikan keamanan yang ditingkatkan, latensi rendah, dan daya pemrosesan transaction rate tinggi. Dengan stack hardware dan software canggih ini, bisnis dapat menskala banyak model AI untuk kasus penggunaan prediktif seperti deteksi penipuan lanjutan dan otomatisasi ritel.

Pada server berbasis IBM Power, Spyre memungkinkan pelanggan memanfaatkan katalog layanan AI untuk AI end-to-end bagi alur kerja perusahaan. Spyre Accelerator for Power, yang dikombinasikan dengan akselerator on-chip (MMA), juga mempercepat konversi data untuk Generative AI guna memberikan throughput tinggi. Kinerja ini memungkinkan penyerapan lebih dari 8 juta dokumen untuk integrasi basis pengetahuan dalam satu jam, mendukung klien dalam mengintegrasikan framework Generative AI ke dalam beban kerja perusahaan mereka.