Google umumkan Gemini 3.1 Pro, raih skor benchmark tertinggi

Google Meluncurkan Gemini 3.1 Pro, Model Bahasa Besar Terbaru yang Menjadi Puncak Performa

Google baru saja meluncurkan versi terbaru dari Large Language Model (LLM) mereka, yaitu Gemini 3.1 Pro. Model ini dirilis pada hari Kamis dan tersedia dalam bentuk pratinjau, dengan rencana untuk segera dirilis secara umum. Diklaim sebagai salah satu LLM paling kuat hingga saat ini, Gemini 3.1 Pro dinilai memberikan lompatan signifikan dibanding pendahulunya, Gemini 3, yang telah dianggap sebagai alat AI yang sangat mumpuni ketika diluncurkan November lalu.

Dalam peluncuran tersebut, Google juga membagikan statistik dari berbagai benchmark independen, termasuk Humanity’s Last Exam. Hasilnya menunjukkan bahwa performa Gemini 3.1 Pro jauh lebih baik dibanding versi sebelumnya. Selain itu, CEO startup AI Mercor, Brendan Foody, memberikan pujian terhadap model terbaru ini. Ia menyatakan bahwa Gemini 3.1 Pro kini berada di puncak papan peringkat APEX-Agents. Menurut Foody, capaian ini menunjukkan seberapa cepat agen meningkat dalam pekerjaan pengetahuan nyata. Sistem benchmarking APEX yang dikembangkan Mercor dirancang untuk mengukur seberapa baik model AI baru menjalankan tugas profesional di dunia nyata.

Peluncuran Gemini 3.1 Pro terjadi di tengah persaingan yang semakin sengit dalam pengembangan model AI. Perusahaan-perusahaan teknologi terus merilis LLM yang semakin kuat, terutama untuk mendukung pekerjaan berbasis agen dan penalaran multi-langkah. Selain Google, sejumlah perusahaan besar lain juga telah meluncurkan model terbaru mereka dalam beberapa waktu terakhir.

Keunggulan Gemini 3.1 Pro

Menurut laman resmi Google, versi 3.1 Pro membawa mesin penalaran canggih yang sebelumnya diperkenalkan melalui Gemini 3 Deep Think ke cakupan pengguna yang lebih luas. Model ini dirancang untuk menangani persoalan yang tidak cukup dijawab secara sederhana. Dalam praktiknya, Gemini 3.1 Pro mampu merangkum dan menyatukan dataset besar menjadi satu gambaran utuh, membuat SVG (Scalable Vector Graphics) animasi langsung dari perintah teks, serta menyelesaikan persoalan teknis dan ilmiah yang kompleks dan bertingkat.

Khusus untuk pembuatan SVG animasi, hasil yang dihasilkan berupa kode murni sehingga tetap tajam di berbagai ukuran dengan ukuran file yang lebih ringkas dibandingkan format video konvensional.

Kinerja yang Signifikan di Berbagai Benchmark

Dari sisi performa, Gemini 3.1 Pro mencatat lonjakan signifikan di berbagai benchmark. Model ini meraih skor 77,1 persen pada ARC-AGI-2, lebih dari dua kali lipat capaian Gemini 3 Pro. Selain itu, ia membukukan 94,3 persen pada GPQA Diamond untuk pengetahuan ilmiah, 80,6 persen pada SWE-Bench Verified untuk pengkodean berbasis agen, serta 85,9 persen pada BrowseComp untuk pencarian berbasis agen. Di LiveCodeBench Pro untuk competitive coding, model ini mencatat rating Elo 2887, melampaui sejumlah pesaingnya.

Kesimpulan

Dengan peluncuran Gemini 3.1 Pro, Google menunjukkan komitmennya untuk terus inovatif dalam pengembangan teknologi AI. Model ini tidak hanya menawarkan kemampuan penalaran yang lebih baik, tetapi juga menunjukkan potensi besar dalam berbagai aplikasi nyata. Dengan peningkatan performa yang signifikan, Gemini 3.1 Pro layak menjadi salah satu model AI yang patut diperhatikan oleh pengguna dan pengembang di seluruh dunia.