Înapoi la știri

7-0: Am testat ChatGPT-5.5 și Claude 4.7 în 7 teste imposibile — rezultatele m-au șocat

26 Apr 2026
4 minute min
Elena Dumitrescu

Două dintre cele mai mari nume din AI au primit actualizări importante. OpenAI a lansat ChatGPT-5.5, axat pe raționament mai inteligent și o execuție mai eficientă, în timp ce Anthropic a lansat Claude Opus 4.7, destinat gândirii atente și performanței pe termen lung. Conform tomsguide.com, am comparat aceste modele prin șapte provocări dificile, acoperind logică, raționament și utilitatea în lumea reală.

👉 Performanța în primele două teste pe probabilități și rotație

Am început testele cu un prompt care implica probabilitatea de a obține "heads" la o monedă. ChatGPT a oferit o structură foarte lizibilă, în timp ce Claude a mers mai departe, prezentând derivarea fracțională exact la final. Claude a câștigat datorită formulei generalizate care a demonstrat o înțelegere mai profundă a probabilității predictive.

Publicitate

Următorul prompt a implicat estimarea schimbării perioadei de rotație a Pământului dacă toată populația s-ar urca pe un tren. ChatGPT a utilizat o estimare simplificată, estimând o modificare de 1.3 nanosecunde. Claude, folosind formula mai precisă, a ajuns la 1.03 nanosecunde, astfel Claude a câștigat din nou pentru precizia sa tehnică.

👉 Rezultate în teste matematice, chimie și raționamente

Un alt test a fost să demonstrăm că pentru orice număr întreg pozitiv n, numărul n⁵ − n este divizibil cu 30. Claude a utilizat teorema lui Fermat mai eficient și a identificat structura matematică de bază, completând triple victorie pentru Claude.

În legătură cu un prompt despre soluția unei probleme de chimie, ChatGPT a oferit un răspuns direct, dar Claude a făcut o analiză mai academică, explicând bine conceptul de capacitate tampon. Claude a câștigat din nou.

Un alt test a fost legat de aranjarea a cinci persoane în rând. ChatGPT a formulat răspunsuri greșite, în vreme ce Claude a identificat corect că problema este imposibilă. La un alt prompt despre un cilinder, Claude a oferit o soluție mai riguroasă, inclusiv o verificare a derivatei pentru a confirma minimum, astfel Claude a câștigat din nou, dar cu o marjă mai mică.

În sfârșit, când a fost întrebat despre un studiu privind consumul de cafea și longevitate, Claude a dat un răspuns mult mai detaliat, ridicând nivelul de analiză la un standard profesional. Claude câștigă din nou acest rând.

În concluzie, Claude Opus 4.7 a demonstrat o capacitate extraordinară, câștigând toate cele șapte teste. ChatGPT-5.5, în ciuda rapidității sale, nu a reușit să egaleze rigurozitatea și profunzimea gândirii lui Claude. Prin urmare, nu doar că Claude a câștigat, dar și-a arătat superioritatea clară în raționament de nivel înalt, oferind indicații despre cât de mult trebuie să îmbunătățească ChatGPT.

Alte postari din Economie
Economie

Small US town left completely isolated and cut off from world after only airlines in town goes under - New York Post

After Spirit Airlines shuttered, some small towns were hit particularly hard — leaving at least one airport with an empty flight schedule. The budget airline ceased operations after 34 years on May 2, 2026, and while many travelers were left scrambling to get new flights, one small airport has been left with no commercial service at all.

Acasa Recente Radio Județe