TERKINI24.ID – OpenAI secara resmi meluncurkan model kecerdasan buatan terbaru mereka, GPT-5.2, yang diklaim sebagai pembaruan paling signifikan dalam ekosistem mereka saat ini. CEO OpenAI, Sam Altman, melalui akun media sosial X pribadinya, mengumumkan bahwa model ini sudah dapat diakses oleh publik mulai hari ini, baik melalui platform ChatGPT maupun bagi pengembang melalui API.
Peluncuran ini menandai lompatan besar dalam kemampuan reasoning (penalaran) AI, di mana data benchmark menunjukkan dominasi GPT-5.2 dibandingkan kompetitor utamanya seperti Claude Opus 4.5 dan Gemini 3 Pro.
Peningkatan Signifikan pada Pengetahuan Nyata
Dalam pengumumannya, Sam Altman menegaskan bahwa kehadiran GPT-5.2 membawa nuansa pembaruan yang sangat terasa, meskipun tanpa fitur tambahan yang bersifat kosmetik. Fokus utama model ini adalah peningkatan kecerdasan murni yang dapat diaplikasikan pada pekerjaan sehari-hari.
“Even without the ability to do new things like output polished files, GPT-5.2 feels like the biggest upgrade we’ve had in a long time. Curious to hear what you think!”
Dari pernyataan tersebut, ditegaskan bahwa meskipun model ini mungkin tidak memiliki kemampuan baru dalam menghasilkan fail yang sudah polished secara langsung, pengalaman penggunaannya terasa sebagai peningkatan terbesar yang pernah dilakukan perusahaan dalam waktu yang lama. Altman juga mengajak pengguna untuk segera mencoba dan memberikan umpan balik.
Ia juga menambahkan bahwa model ini dirancang khusus untuk menjadi model yang paling cerdas yang tersedia secara umum (generally-available model) di dunia saat ini. Keunggulannya terutama terletak pada kemampuan menyelesaikan tugas-tugas “real-world knowledge work” atau pekerjaan berbasis pengetahuan di dunia nyata dengan lebih efisien dan akurat.
Lonjakan Performa di Benchmark GDPval
Salah satu indikator utama yang disorot dalam peluncuran ini adalah skor GDPval, sebuah metrik yang mengukur seberapa sering pakar industri lebih memilih hasil keluaran (output) model dibandingkan hasil kerja pakar industri lainnya.
“For example, GDPval measures how often industry experts prefer the model’s output to the output of other industry experts. GPT-5.2 gets a 70% (beat or tie); GPT-5 got a 38%. Try it to make slides, spreadsheets, code, and much more.”
Melalui kutipan di atas, dijelaskan bahwa terjadi lonjakan performa yang sangat drastis. Jika GPT-5 sebelumnya hanya mencapai skor 38% dalam metrik ini, GPT-5.2 berhasil mencapai angka 70% (menang atau seri melawan pakar manusia). Peningkatan ini membuat model tersebut sangat andal untuk membantu pembuatan materi presentasi (slides), pengolahan data (spreadsheets), hingga penulisan kode pemrograman.
Dominasi Skor Teknis dan Kompetisi
Berdasarkan data komparasi teknis yang dirilis, GPT-5.2 menunjukkan performa yang mengesankan di berbagai parameter pengujian yang sulit. Sam Altman merinci beberapa angka kunci dalam utasnya di media sosial.
“Performance is strong across the board: 55.6% on SWE-Bench Pro, 52.9% or ARC-AGI-2, 40.3% on FrontierMath.”
Data tersebut dikonfirmasi oleh tabel perbandingan resmi yang menunjukkan posisi GPT-5.2 di puncak klasemen. Pada pengujian AIME 2025 (kompetisi matematika tanpa alat bantu), GPT-5.2 mencatatkan skor sempurna 100.0%, mengungguli Gemini 3 Pro yang berada di angka 95.0% dan Claude Opus 4.5 di angka 92.8%.
Keunggulan juga terlihat pada GPQA Diamond (pertanyaan sains tanpa alat bantu) dengan skor 92.4%, serta SWE-Bench Pro untuk rekayasa perangkat lunak (software engineering) yang mencapai 55.6%, jauh di atas rata-rata model lainnya. Pada kategori GDPval, GPT-5.2 mencatatkan angka 70.9%, meninggalkan pesaing terdekatnya Claude Opus 4.5 yang berada di angka 59.6% dan Gemini 3 Pro di 53.5%.