Înapoi la știri

7-0: Am testat ChatGPT-5.5 și Claude 4.7 în 7 teste imposibile — rezultatele m-au șocat

26 Apr 2026
4 minute min
Elena Dumitrescu

Două dintre cele mai mari nume din AI au primit actualizări importante. OpenAI a lansat ChatGPT-5.5, axat pe raționament mai inteligent și o execuție mai eficientă, în timp ce Anthropic a lansat Claude Opus 4.7, destinat gândirii atente și performanței pe termen lung. Conform tomsguide.com, am comparat aceste modele prin șapte provocări dificile, acoperind logică, raționament și utilitatea în lumea reală.

👉 Performanța în primele două teste pe probabilități și rotație

Am început testele cu un prompt care implica probabilitatea de a obține "heads" la o monedă. ChatGPT a oferit o structură foarte lizibilă, în timp ce Claude a mers mai departe, prezentând derivarea fracțională exact la final. Claude a câștigat datorită formulei generalizate care a demonstrat o înțelegere mai profundă a probabilității predictive.

Publicitate

Următorul prompt a implicat estimarea schimbării perioadei de rotație a Pământului dacă toată populația s-ar urca pe un tren. ChatGPT a utilizat o estimare simplificată, estimând o modificare de 1.3 nanosecunde. Claude, folosind formula mai precisă, a ajuns la 1.03 nanosecunde, astfel Claude a câștigat din nou pentru precizia sa tehnică.

👉 Rezultate în teste matematice, chimie și raționamente

Un alt test a fost să demonstrăm că pentru orice număr întreg pozitiv n, numărul n⁵ − n este divizibil cu 30. Claude a utilizat teorema lui Fermat mai eficient și a identificat structura matematică de bază, completând triple victorie pentru Claude.

În legătură cu un prompt despre soluția unei probleme de chimie, ChatGPT a oferit un răspuns direct, dar Claude a făcut o analiză mai academică, explicând bine conceptul de capacitate tampon. Claude a câștigat din nou.

Un alt test a fost legat de aranjarea a cinci persoane în rând. ChatGPT a formulat răspunsuri greșite, în vreme ce Claude a identificat corect că problema este imposibilă. La un alt prompt despre un cilinder, Claude a oferit o soluție mai riguroasă, inclusiv o verificare a derivatei pentru a confirma minimum, astfel Claude a câștigat din nou, dar cu o marjă mai mică.

În sfârșit, când a fost întrebat despre un studiu privind consumul de cafea și longevitate, Claude a dat un răspuns mult mai detaliat, ridicând nivelul de analiză la un standard profesional. Claude câștigă din nou acest rând.

În concluzie, Claude Opus 4.7 a demonstrat o capacitate extraordinară, câștigând toate cele șapte teste. ChatGPT-5.5, în ciuda rapidității sale, nu a reușit să egaleze rigurozitatea și profunzimea gândirii lui Claude. Prin urmare, nu doar că Claude a câștigat, dar și-a arătat superioritatea clară în raționament de nivel înalt, oferind indicații despre cât de mult trebuie să îmbunătățească ChatGPT.

Alte postari din Economie
Economie

TikTok Video of Woman Dancing in Walmart Checkout Line After Apparent $3,000 EBT Purchase Sparks Debate on X - The Daily Dot

Share on FacebookShare on X (formerly Twitter)Share on RedditShare on PinterestShare on BlueskyViral TikTok showing woman dancing beside two full shopping carts A TikTok video showing a woman dancing in a Walmart checkout line after what a caption described as a $3,000 EBT purchase has sparked debate on X about public assistance programs. The video was uploaded on X by the user MatrixMysteries and got more than 75,000 views as of publication.

Economie

Student loan borrowers will get an interest rate cut if they sign up for auto pay - NPR

Student loan borrowers who sign up for, or already use, auto pay will get a 1 percentage point discount on interest for two years, starting July 1. Daniel de la Hoz/Moment RF via Getty Images hide caption Student loan borrowers who enroll in automatic payments will get a much bigger discount on interest starting July 1, the U.S.

Economie

Wall Street dumped nearly $1 trillion in tech stocks by midday—then clawed it back and bought peanut butter and paint - Fortune

Today, the Nasdaq Composite looked like a V: down more than 4% by lunchtime, closing off just 1%. Around noon, the AI jitters came back, and traders dumped the highest-beta names—the frothiest, most volatile stuff—like Strategy (MSTR), the leveraged Bitcoin vehicle that had popped Monday; AppLovin (APP); and photonics maker Lumentum (LITE).

Acasa Recente Radio Județe