Dalam sebuah tinjauan mendalam yang dipublikasikan oleh Tom’s Guide, editor AI Amanda Caswell melakukan serangkaian uji coba ketat untuk membandingkan dua model bahasa besar (LLM) terbaru yang baru saja diluncurkan: Gemini 3.0 dari Google dan ChatGPT 5.1 dari OpenAI.
Berdasarkan hasil pengujian yang mencakup interpretasi visual, kemampuan coding, hingga penalaran logis, Gemini 3.0 dinyatakan keluar sebagai pemenang mutlak yang “menghancurkan” kompetisi pada aspek-aspek teknis krusial.
Salah satu sorotan utama dalam pengujian tersebut adalah kemampuan interpretasi gambar atau multimodal capabilities. Dalam sebuah tes unik bertajuk “Tantangan Kulkas”, Caswell mengunggah foto isi lemari es dan meminta kedua AI untuk menyarankan resep makanan hanya dari bahan yang terlihat. ChatGPT 5.1 memberikan saran menu yang kreatif dan ramah anak, namun melakukan kesalahan fatal dengan “berhalusinasi” atau mengasumsikan adanya bahan-bahan dasar seperti mentega dan kecap asin yang sebenarnya tidak ada di foto. Sebaliknya, Gemini 3.0 menunjukkan disiplin logika yang tinggi dengan hanya menyarankan resep yang benar-benar bisa dibuat dari bahan yang terlihat, serta memberikan solusi alternatif untuk bahan yang tidak tersedia.
Keunggulan Gemini 3.0 semakin terlihat pada sektor pemrograman (coding). Ketika ditantang untuk membuat aplikasi berbasis web (Progressive Web App), Gemini 3.0 mampu memberikan struktur teknis yang lebih matang, baik dari sisi frontend maupun backend, melampaui kemampuan ChatGPT 5.1 yang meskipun mumpuni, masih tertinggal dalam detail arsitektur sistem. Data benchmark juga mendukung temuan ini, di mana Gemini 3 Pro mencatatkan skor 1501 di LMArena, sebuah angka yang mengindikasikan kemampuan penalaran setara tingkat doktoral (PhD).
Namun, ChatGPT 5.1 bukan tanpa perlawanan. Model andalan OpenAI ini dipuji karena kemampuannya yang “lebih hangat” dan konversasional. Fitur adaptive thinking yang baru memungkinkan ChatGPT 5.1 menyesuaikan waktu berpikir berdasarkan kompleksitas pertanyaan, membuatnya terasa lebih manusiawi dalam percakapan santai. Bagi pengguna yang mencari teman bicara atau brainstorming ide kreatif yang cair, ChatGPT 5.1 masih memegang kendali.
Secara kontekstual, peluncuran kedua model ini menandai fase baru dalam evolusi AI generatif, di mana fokus bergeser dari sekadar kemampuan menjawab pertanyaan menjadi kemampuan bertindak (agentic capabilities) dan akurasi tinggi. Jika tahun-tahun sebelumnya adalah tentang siapa yang paling “pintar bicara”, tahun 2025 menjadi pembuktian siapa yang paling “bisa bekerja” dengan akurat dan minim kesalahan (halusinasi). Kemenangan Gemini 3.0 dalam uji coba ini menegaskan bahwa Google telah berhasil mengintegrasikan kemampuan penalaran mendalam (deep reasoning) ke dalam ekosistem pencariannya, menetapkan standar baru bagi utilitas AI sehari-hari.
Bagi profesional dan pengguna yang mengutamakan akurasi data serta kemampuan teknis, Gemini 3.0 tampaknya menjadi pilihan yang lebih superior saat ini. Namun, kompetisi ini masih jauh dari kata usai, dan inovasi selanjutnya dari OpenAI tentu sangat dinantikan.


















