Claude Opus 4.7 învinge GPT-5.4 în lupta…

Anthropic lansează Claude Opus 4.7, un nou model de inteligență artificială, promițător pentru utilizatorii din domeniul programării și al sarcinilor creative mai ample. Anunțul, făcut pe 16 aprilie 2026, marchează o nouă etapă în dezvoltarea inteligenței artificiale, cu accent pe performanță ridicată și securitate sporită. Modelul vizează în special simplificarea vieții creatorilor, de la programatori la cei care dezvoltă mod-uri pentru jocuri.

Rezultate impresionante în testele de inginerie software

Conform evaluărilor făcute publice de Anthropic, Claude Opus 4.7 se remarcă prin rezultate superioare în teste riguroase. Pe SWE-bench Pro, modelul a atins 64,3%, depășind rezultatul predecesorului său, Opus 4.6 (53,4%) și chiar performanțele modelelor concurente precum GPT-5.4 (57,7%) sau Gemini 3.1 Pro (54,2%). În alte teste, precum SWE-bench Verified, a înregistrat 87,6%, iar pe Finance Agent v1.1, 64,4%. Rezultate bune au fost obținute și în OSWorld-Verified (78%) sau Humanity’s Last Exam (46,9% fără instrumente), confirmând creșterea capacităților modelului. Se estimează că 79% dintre companii folosesc deja agenți AI în dezvoltare, cu 96% pregătite să extindă această utilizare până în 2026, generând potențial trilioane în valoare adăugată. Aceste progrese tehnologice ar putea avea un impact major, de pildă, în dezvoltarea de jocuri, facilitând crearea de scenarii fără erori repetate.

Capacități îmbunătățite pentru sarcini creative și de lungă durată

Opus 4.7 se dovedește robust în proiecte complexe și de durată, respectând instrucțiunile, autoverificându-se și gestionând memoria prin intermediul unui sistem de fișiere, evitând astfel omisiunile. De asemenea, modelul îmbunătățește analiza imaginilor la rezoluție înaltă, utilă pentru prototipuri sau crearea de elemente vizuale profesionale. În modul agentic, modelul poate parcurge etapele fără probleme, fiind potrivit pentru dezvoltatorii de jocuri indie. Conform evaluărilor creatorilor, instrumente precum Claude sunt deja folosite pentru a dezvolta jocuri complete, accelerând procesul. Costurile rămân stabile, cu 5 dolari pe milion de tokeni la intrare și 25 la ieșire, cu o tokenizare optimizată pentru eficiență sporită, în ciuda faptului că răspunsurile detaliate ar putea dura mai mult.

Securitate avansată și integrare rapidă

Continuând proiectul Glasswing, o inițiativă de colaborare cu AWS, Apple sau Cisco pentru testarea inteligenței artificiale în domeniul apărării cibernetice, Opus 4.7 include bariere sporite împotriva utilizărilor riscante, limitând în mod deliberat competențele sale ofensive. Anthropic poziționează acest model ca un laborator pentru perfecționarea acestor protecții, înainte de a lansa modele mai avansate, precum Mythos. Modelul este disponibil imediat în aplicațiile Claude, prin API-ul claude-opus-4-7, Amazon Bedrock, Google Vertex AI și Microsoft Foundry. Lansarea acestuia are loc în contextul în care OpenAI pregătește GPT-5.5. Un ghid de migrare este disponibil pentru o tranziție ușoară către noul model.

Lansarea lui Claude Opus 4.7 reprezintă un pas important pentru dezvoltarea de asistenți AI de încredere, aplicabili în diverse domenii, de la programare și până la modelarea lumilor virtuale.

Sursa: Cridutroll.fr