OpenAI lansira GPT-5.2: Umjetna inteligencija prvi put nadmašila ljudske stručnjake u 70% zadataka

OpenAI je lansirao GPT-5.2, novu seriju AI modela koja po prvi put nadmašuje ljudske stručnjake u više od 70% profesionalnih zadataka. Uz drastična poboljšanja u programiranju i analizi podataka, model je dostupan u Instant, Thinking i Pro varijantama.

Tvrtka OpenAI službeno je objavila lansiranje GPT-5.2, svoje vodeće serije modela umjetne inteligencije. Razvojni tim tvrdi da ovo ažuriranje predstavlja značajan skok u razvoju “opće inteligencije” (AGI) te nudi ključna poboljšanja u pisanju programskog koda, razumijevanju velikih količina konteksta i mogućnostima autonomnih agenata.

Novi modeli i dostupnost

Novi modeli izlaze u tri specifične varijante prilagođene različitim potrebama:

  • Instant (za brze odgovore),
  • Thinking (za duboko promišljanje),
  • Pro (za najzahtjevnije zadatke).

Ovi modeli već danas postaju dostupni korisnicima paketa ChatGPT Plus, Enterprise i Business, kao i razvojnim programerima putem API-ja.

OpenAI lansira GPT-5.2: Umjetna inteligencija prvi put nadmašila ljudske stručnjake u 70% zadataka detail 1

Dominacija u GDPval benchmarku

Ključna značajka ovog izdanja postali su rezultati modela u GDPval – novom benchmarku stvorenom za ocjenu kompetentnosti u jasno definiranim radnim zadacima unutar čak 44 različite profesije.

Prema podacima OpenAI-a, model GPT-5.2 Thinking postao je prvi koji radi na razini ili iznad razine čovjeka-stručnjaka. U slijepim usporedbama, koje su ocjenjivali profesionalci iz industrije, GPT-5.2 Thinking nadmašio je ili se izjednačio s vodećim stručnjacima u nevjerojatnih 70,9% zadataka. Ti su zadaci uključivali:

  • Stvaranje složenih proračunskih tablica,
  • Razvoj detaljnih prezentacija,
  • Pripremu opsežne tehničke dokumentacije.

U OpenAI-u su istaknuli zapanjujući podatak da je model izvršavao te zadatke više od 11 puta brže, a trošak je iznosio manje od 1% cijene rada ljudskih stručnjaka.

OpenAI lansira GPT-5.2: Umjetna inteligencija prvi put nadmašila ljudske stručnjake u 70% zadataka detail 2

Revolucija za programere i vizualna analiza

Za inženjere i programere, OpenAI izvještava da je GPT-5.2 Thinking postavio novu ljestvicu kvalitete. Model je postigao rezultat od 55,6% u SWE-Bench Pro – testu stvarnih vještina softverskog inženjeringa koji obuhvaća nekoliko programskih jezika i složene baze kodova.

Model je također dobio drastično poboljšane vizualne mogućnosti. OpenAI tvrdi da se učestalost pogrešaka pri analizi grafikona i tehničkih shema smanjila gotovo dvostruko. To modelu omogućuje bolje interpretiranje:

  • Upravljačkih ploča (dashboarda),
  • Snimaka zaslona proizvoda,
  • Prostornih izgleda (npr. identifikacija komponenti na matičnoj ploči).

Uz to, OpenAI navodi da novi model Thinking “halucinira” (izmišlja podatke) 30% manje nego njegov prethodnik.

Dugoročno zaključivanje i integracija

Kako ističu u OpenAI-u, model pokazuje bolje “pokazatelje dugoročnog zaključivanja” (long-horizon reasoning). U internim testovima korištenjem benchmarka MRCRv2, model je postigao gotovo 100% točnosti u pretraživanju i sintezi informacija u dokumentima opsega do 256.000 tokena. Ova je mogućnost primarno orijentirana na pravni, financijski i znanstveni sektor, u kojima se često analiziraju masivne datoteke.

OpenAI lansira GPT-5.2: Umjetna inteligencija prvi put nadmašila ljudske stručnjake u 70% zadataka detail 3

Nekoliko velikih tehnoloških platformi, uključujući Notion, Zoom, Shopify i Databricks, već su integrirale novi model te izjavile da bilježe “iznimnu produktivnost” u zadacima agenata, gdje umjetna inteligencija autonomno koristi alate za izvršavanje projekata u više faza.

Iako se modeli GPT-5.2 već počinju uvoditi za korisnike, OpenAI za sada neće isključivati starije modele GPT-5.1; oni će ostati dostupni još tijekom naredna tri mjeseca kako bi se osigurala glatka tranzicija.

vadim/ author of the article

Jmenuji se Vadim. Zajímám se o automobily a rád píšu články o automobilovém průmyslu. Ve svých textech se dělím o praktické rady týkající se výběru a servisu automobilů, diskutuji o novinkách v oboru a píšu o užitečných doplňcích.

Dent cars