Claude Opus 4.6 și GPT-5.3-Codex: Lansare dublă, actualizare Gemini 3

Lansare dublă la vârf: Anthropic lansează Claude Opus 4.6 cu context de 1M tokeni și echipe de agenți, în timp ce OpenAI răspunde cu GPT-5.3-Codex și o platformă enterprise. Google împinge Gemini 3 pe toate fronturile, iar GitHub răspunde în sfârșit unei cereri vechi de 8 ani.

Claude Opus 4.6: SOTA în agentic coding și context 1M

5 februarie — Anthropic lansează Claude Opus 4.6, o actualizare majoră a celui mai inteligent model al său. Modelul progresează în planificare, sesiuni lungi, revizuire de cod și oferă pentru prima dată un context de 1 milion de tokeni în beta pentru un model Opus.

Benchmark	Scor	Detaliu
Terminal-Bench 2.0	SOTA	Cel mai mare scor la agentic coding
Humanity’s Last Exam	SOTA	Raționament multidisciplinar
GDPval-AA	+144 Elo vs GPT-5.2	Muncă profesională (financiar, juridic)
BrowseComp	SOTA	Regăsire complexă de informații
MRCR v2 (8-needle 1M)	76%	vs 18.5% pentru Sonnet 4.5

Noutăți API și produs

Funcționalitate	Descriere
Agent teams	Mai mulți agenți Claude Code în paralel (research preview)
Adaptive thinking	Modelul alege când să folosească gândirea profundă
Effort controls	4 niveluri: scăzut, mediu, ridicat (implicit), maxim
Context compaction	Rezumare automată a contextului pentru sesiuni lungi
128k output tokens	Ieșiri mai lungi într-o singură cerere
Claude in PowerPoint	Research preview (Max, Team, Enterprise)

Prețuri: Neschimbate la $5/$ 25 pe milion de tokeni (input/output). Prețuri premium peste 200k tokeni ( $10/$ 37.50).

Disponibilitate: claude.ai, API (claude-opus-4-6) și toate platformele cloud majore.

Bloguri de inginerie: zgomot de infrastructură și compilator C

Anthropic publică două articole tehnice în aceeași zi. Primul cuantifică zgomotul de infrastructură în benchmark-urile de agentic coding: pe Terminal-Bench 2.0, configurația resurselor singură poate crea decalaje de 6 puncte procentuale între setup-uri. Al doilea documentează construirea unui compilator C în Rust de către 16 agenți Claude în paralel: 100.000 de linii de cod, capabil să compileze nucleul Linux 6.9 pe x86, ARM și RISC-V, în ~2.000 de sesiuni Claude Code pentru ~$20.000.

Opus 4.6 în GitHub Copilot

În aceeași zi, Claude Opus 4.6 devine disponibil în GA în GitHub Copilot prin Agent HQ, după previzualizarea publică anunțată cu o zi înainte.

🔗 Anunț Opus 4.6 | Zgomot de infrastructură | Construirea unui compilator C

GPT-5.3-Codex: frontieră de codare + cunoștințe pro

5 februarie — OpenAI lansează GPT-5.3-Codex, care îmbină performanța de codare a GPT-5.2-Codex cu capacitățile de raționament ale GPT-5.2, totul cu 25% mai rapid.

Benchmark	Scor
SWE-Bench Pro (Public)	56.8%
Terminal-Bench 2.0	77.3%
OSWorld-Verified	64.7%
GDPval (victorii sau egaluri)	70.9%
Cybersecurity CTF	77.6%
SWE-Lancer IC Diamond	81.4%

GPT-5.3-Codex este primul model care a contribuit la propria sa creare: echipa a folosit versiuni preliminare pentru a depana antrenamentul, a gestiona implementarea și a analiza rezultatele testelor.

Dincolo de cod

Modelul produce prezentări, foi de calcul, analize de date și gestionează sarcini de productivitate într-un mediu desktop (64.7% pe OSWorld-Verified).

Securitate cibernetică: capacitate ridicată

GPT-5.3-Codex este primul model evaluat ca având capacitate ridicată pentru securitate cibernetică în cadrul de pregătire OpenAI și primul antrenat special pentru a identifica vulnerabilități software.

🔗 Blog GPT-5.3-Codex | System Card

OpenAI: Frontier, MCP Apps, securitate și biotehnologie

OpenAI Frontier: platformă de agenți enterprise

5 februarie — OpenAI lansează Frontier, o platformă pentru a dezvolta, implementa și gestiona agenți AI în întreprindere. Agenții primesc un context de afaceri partajat, permisiuni și învață din experiență.

Aspect	Detaliu
Primii clienți	HP, Intuit, Oracle, State Farm, Thermo Fisher, Uber
Parteneri AI	Abridge, Clay, Ambience, Decagon, Harvey, Sierra
Abordare	Forward Deployed Engineers (FDE) integrați în echipe
Standarde	Standarde deschise, compatibil cu sistemele existente

ChatGPT: MCP Apps în beta

5 februarie — MCP Apps ajung în beta în ChatGPT Business, Enterprise și Edu. Noi conectori parteneri: Amplitude, Fireflies, Vercel, Monday.com, Stripe, Hex, Egnyte și alții. Organizațiile pot construi aplicații MCP personalizate prin modul dezvoltator.

Trusted Access for Cyber

5 februarie — OpenAI lansează Trusted Access for Cyber, un program pilot de acces bazat pe încredere pentru capacități cibernetice avansate. Utilizatorii își pot verifica identitatea pe chatgpt.com/cyber. 10 milioane de dolari în credite API sunt alocate apărării cibernetice prin Cybersecurity Grant Program.

GPT-5 reduce costul sintezei proteice

5 februarie — În parteneriat cu Ginkgo Bioworks, OpenAI conectează GPT-5 la un laborator robotizat pentru a optimiza sinteza proteică fără celule (CFPS). Rezultat: 40% reducere a costului de producție și 57% îmbunătățire a costului reactivilor, după 36.000 de compoziții testate pe 580 de plăci automate în șase runde de experimentare.

🔗 OpenAI Frontier | MCP Apps | Trusted Access for Cyber | GPT-5 proteine

Google: Gemini 3, Super Bowl și NotebookLM

Gemini 3: actualizări și Super Bowl

5-6 februarie — Google împinge Gemini 3 pe toate fronturile. Gemini 3 Flash, lansat recent, oferă raționament de nivel Pro la viteză Flash: 90.4% pe GPQA Diamond și 33.7% pe Humanity’s Last Exam (fără instrumente). Gemini 3 devine modelul implicit pentru AI Overviews în Google Search.

Google pregătește, de asemenea, o reclamă Gemini de 60 de secunde pentru Super Bowl LX (8 februarie) — spotul „New Home” arată un copil pregătindu-se pentru o mutare cu ajutorul Gemini, ilustrând capacitățile de căutare în Google Photos și generarea de imagini.

NotebookLM: Infographics și Slide Decks

NotebookLM, construit acum pe Gemini 3, lansează Infographics și Slide Decks pentru utilizatorii Free și Pro. Slide Decks sunt deja al doilea cel mai popular studio de ieșire. Utilizatorii Ultra pot elimina filigranul.

🔗 Gemini 3 Flash | Gemini 3 App | NotebookLM Infographics

GitHub: comentarii fixate pe Issues

5 februarie — GitHub lansează comentarii fixate pe Issues. Acum este posibil să fixați un comentariu în partea de sus a unei probleme din meniul contextual. O funcție solicitată din 2017 pentru a evidenția decizii, actualizări și pași cheie următori în fire lungi.

🔗 Changelog

Ce înseamnă acest lucru

5 februarie 2026 va rămâne o zi de referință: Anthropic și OpenAI își lansează simultan cele mai avansate modele de codare. Claude Opus 4.6 domină benchmark-urile de muncă profesională și regăsire de informații, în timp ce GPT-5.3-Codex excelează în codarea în terminal și utilizarea computerului. Ambele modele revendică SOTA (State Of The Art) pe Terminal-Bench 2.0 — articolul Anthropic despre zgomotul de infrastructură are sens perfect.

Dincolo de modele, bătălia platformelor se intensifică: OpenAI Frontier atacă întreprinderea cu agenți implementați la Oracle și Uber, în timp ce Anthropic pariază pe ecosistemul dezvoltatorilor (GitHub, Xcode, Claude Code). Google avansează pe toate fronturile cu Gemini 3 în Search, Chrome și NotebookLM și pregătește Super Bowl pentru a ancora Gemini în mainstream.