OpenAI lansira GPT-5.2: Umjetna inteligencija prvi put nadmašila ljudske stručnjake u 70% zadataka

Tvrtka OpenAI službeno je objavila lansiranje GPT-5.2, svoje vodeće serije modela umjetne inteligencije. Razvojni tim tvrdi da ovo ažuriranje predstavlja značajan skok u razvoju “opće inteligencije” (AGI) te nudi ključna poboljšanja u pisanju programskog koda, razumijevanju velikih količina konteksta i mogućnostima autonomnih agenata.

Novi modeli i dostupnost

Novi modeli izlaze u tri specifične varijante prilagođene različitim potrebama:

Instant (za brze odgovore),
Thinking (za duboko promišljanje),
Pro (za najzahtjevnije zadatke).

Ovi modeli već danas postaju dostupni korisnicima paketa ChatGPT Plus, Enterprise i Business, kao i razvojnim programerima putem API-ja.

OpenAI lansira GPT-5.2: Umjetna inteligencija prvi put nadmašila ljudske stručnjake u 70% zadataka detail 1

Dominacija u GDPval benchmarku

Ključna značajka ovog izdanja postali su rezultati modela u GDPval – novom benchmarku stvorenom za ocjenu kompetentnosti u jasno definiranim radnim zadacima unutar čak 44 različite profesije.

Prema podacima OpenAI-a, model GPT-5.2 Thinking postao je prvi koji radi na razini ili iznad razine čovjeka-stručnjaka. U slijepim usporedbama, koje su ocjenjivali profesionalci iz industrije, GPT-5.2 Thinking nadmašio je ili se izjednačio s vodećim stručnjacima u nevjerojatnih 70,9% zadataka. Ti su zadaci uključivali:

Stvaranje složenih proračunskih tablica,
Razvoj detaljnih prezentacija,
Pripremu opsežne tehničke dokumentacije.

U OpenAI-u su istaknuli zapanjujući podatak da je model izvršavao te zadatke više od 11 puta brže, a trošak je iznosio manje od 1% cijene rada ljudskih stručnjaka.

OpenAI lansira GPT-5.2: Umjetna inteligencija prvi put nadmašila ljudske stručnjake u 70% zadataka detail 2

Revolucija za programere i vizualna analiza

Za inženjere i programere, OpenAI izvještava da je GPT-5.2 Thinking postavio novu ljestvicu kvalitete. Model je postigao rezultat od 55,6% u SWE-Bench Pro – testu stvarnih vještina softverskog inženjeringa koji obuhvaća nekoliko programskih jezika i složene baze kodova.

Model je također dobio drastično poboljšane vizualne mogućnosti. OpenAI tvrdi da se učestalost pogrešaka pri analizi grafikona i tehničkih shema smanjila gotovo dvostruko. To modelu omogućuje bolje interpretiranje:

Upravljačkih ploča (dashboarda),
Snimaka zaslona proizvoda,
Prostornih izgleda (npr. identifikacija komponenti na matičnoj ploči).

Uz to, OpenAI navodi da novi model Thinking “halucinira” (izmišlja podatke) 30% manje nego njegov prethodnik.

Dugoročno zaključivanje i integracija

Kako ističu u OpenAI-u, model pokazuje bolje “pokazatelje dugoročnog zaključivanja” (long-horizon reasoning). U internim testovima korištenjem benchmarka MRCRv2, model je postigao gotovo 100% točnosti u pretraživanju i sintezi informacija u dokumentima opsega do 256.000 tokena. Ova je mogućnost primarno orijentirana na pravni, financijski i znanstveni sektor, u kojima se često analiziraju masivne datoteke.

OpenAI lansira GPT-5.2: Umjetna inteligencija prvi put nadmašila ljudske stručnjake u 70% zadataka detail 3

Nekoliko velikih tehnoloških platformi, uključujući Notion, Zoom, Shopify i Databricks, već su integrirale novi model te izjavile da bilježe “iznimnu produktivnost” u zadacima agenata, gdje umjetna inteligencija autonomno koristi alate za izvršavanje projekata u više faza.

Iako se modeli GPT-5.2 već počinju uvoditi za korisnike, OpenAI za sada neće isključivati starije modele GPT-5.1; oni će ostati dostupni još tijekom naredna tri mjeseca kako bi se osigurala glatka tranzicija.

Novi modeli i dostupnost

Dominacija u GDPval benchmarku

Revolucija za programere i vizualna analiza

Dugoročno zaključivanje i integracija

Nova besplatna funkcija koja stiže na Spotify za sve korisnike: evo kako radi

Pogreška koju svi radimo s neželjenim pozivima: “Svaki put kada ga odbijete, potvrđujete da je vaš broj aktivan, pa se oni množe”

Ako stavljate ruke na leđa dok hodate, psihologija kaže da imate ove zajedničke osobine

Hodanje umjesto odlaska u teretanu je odlično, ali funkcionira samo ako traje barem 30 minuta bez prestanka i tempom od oko 5 km/h

Hodanje je odlično nakon 60. godine, ali stručnjaci preporučuju i ovu vježbu

Muškarac se probudio iz operacije govoreći tečni španjolski na razini ‘izvornog govornika’ iako je znao brojati samo do 10

„Najljepši otok Azije“ cilja na 8,5 milijuna turista 2026. nakon procvata turizma

Arheolozi amateri pronašli su 1.100 godina stare ostatke triju ratnika s tajanstvenom vezom