Model
Chat GPT 5.2 (konkretno verzije
Thinking i
Pro) izašao je
11. decembra 2025. godine, samo nekoliko nedelja nakon što su Google i Anthropic izbacili svoje nove modele.
Ukratko:
GPT-5.2 Pro je trenutno najjači model za
apstraktno rezonovanje i matematiku, gde pravi značajnu razliku u odnosu na konkurenciju. Međutim, u
kodiranju je praktično izjednačen sa Claude Opus 4.5, dok je u
teškim naučnim zadacima Gemini 3 Deep Think i dalje za nijansu bolji.
Evo detaljne komparacije sa tačnim, proverenim brojkama iz najnovijih benchmark testova (decembar 2025):
1. Apstraktno Rezonovanje (ARC-AGI-2)
Ovo je trenutno najvažniji test za "pravu" inteligenciju i rešavanje novih problema koje model nije video u trening podacima.
- GPT-5.2 Pro: 54.2% (Ubedljivo 1 mesto)
- Gemini 3 Deep Think: 45.1%
- Claude Opus 4.5: 37.6%
Zaključak: GPT-5.2 je drastično bolji u "deep thinking" zadacima koji zahtevaju snalaženje u novim situacijama.
2. Matematika (AIME 2025 - bez alata)
Rešavanje takmičarskih matematičkih problema.
- GPT-5.2 Pro: 100% (Perfektan rezultat)
- Gemini 3 Pro: ~94%
- Claude Opus 4.5: Rezultat je niži (nije primarno fokusiran na takmičarsku matematiku u istoj meri).
3. Kodiranje (SWE-bench Verified)
Rešavanje realnih softverskih problema sa GitHuba.
- Claude Opus 4.5: 80.9% (I dalje kralj kodiranja, ali tesno)
- GPT-5.2 Thinking: 80.0%
- Gemini 3 Pro: 76.2%
Zaključak: Claude Opus 4.5 je i dalje za nijansu bolji za čisto inženjersko kodiranje, ali je razlika sada minimalna (<1%).
4. Ekspertsko Znanje / Nauka (GPQA Diamond)
Testira znanje na nivou doktora nauka (biologija, fizika, hemija).
- Gemini 3 Deep Think: 93.8%
- GPT-5.2 Pro: 93.2% (Statistički skoro izjednačeno, ali blago iza)
- Claude Opus 4.5: 87.0%
Sumarizacija rezultata
Novi
GPT-5.2 Pro predstavlja trenutno
najinteligentniji model za rezonovanje i logiku, dominirajući u ARC-AGI testovima apstraktnog mišljenja i matematici gde postiže savršene rezultate. Iako nije uspeo da skine
Claude Opus 4.5 sa trona u čistom softverskom inženjerstvu (razlika je manja od 1%), postao je daleko sposobniji od njega u opštim zadacima. U poređenju sa
Gemini 3 modelima, GPT-5.2 je bolji u logici, dok Google-ov model zadržava blagu prednost u "enciklopedijskom" naučnom znanju i multimodalnosti (obrada videa/zvuka).
Ako ti treba model za
tešku logiku i matematiku, GPT-5.2 je bez premca; za
kompleksno kodiranje, Claude Opus 4.5 je i dalje vrhunski izbor, dok je Gemini 3 Pro najbolji "svestrani" model za kreativne i naučne zadatke.