Lansare dublă la vârf: Anthropic lansează Claude Opus 4.6 cu context de 1M tokeni și echipe de agenți, în timp ce OpenAI răspunde cu GPT-5.3-Codex și o platformă enterprise. Google împinge Gemini 3 pe toate fronturile, iar GitHub răspunde în sfârșit unei cereri vechi de 8 ani.
Claude Opus 4.6: SOTA în agentic coding și context 1M
5 februarie — Anthropic lansează Claude Opus 4.6, o actualizare majoră a celui mai inteligent model al său. Modelul progresează în planificare, sesiuni lungi, revizuire de cod și oferă pentru prima dată un context de 1 milion de tokeni în beta pentru un model Opus.
| Benchmark | Scor | Detaliu |
|---|---|---|
| Terminal-Bench 2.0 | SOTA | Cel mai mare scor la agentic coding |
| Humanity’s Last Exam | SOTA | Raționament multidisciplinar |
| GDPval-AA | +144 Elo vs GPT-5.2 | Muncă profesională (financiar, juridic) |
| BrowseComp | SOTA | Regăsire complexă de informații |
| MRCR v2 (8-needle 1M) | 76% | vs 18.5% pentru Sonnet 4.5 |
Noutăți API și produs
| Funcționalitate | Descriere |
|---|---|
| Agent teams | Mai mulți agenți Claude Code în paralel (research preview) |
| Adaptive thinking | Modelul alege când să folosească gândirea profundă |
| Effort controls | 4 niveluri: scăzut, mediu, ridicat (implicit), maxim |
| Context compaction | Rezumare automată a contextului pentru sesiuni lungi |
| 128k output tokens | Ieșiri mai lungi într-o singură cerere |
| Claude in PowerPoint | Research preview (Max, Team, Enterprise) |
Prețuri: Neschimbate la 25 pe milion de tokeni (input/output). Prețuri premium peste 200k tokeni (37.50).
Disponibilitate: claude.ai, API (claude-opus-4-6) și toate platformele cloud majore.
Bloguri de inginerie: zgomot de infrastructură și compilator C
Anthropic publică două articole tehnice în aceeași zi. Primul cuantifică zgomotul de infrastructură în benchmark-urile de agentic coding: pe Terminal-Bench 2.0, configurația resurselor singură poate crea decalaje de 6 puncte procentuale între setup-uri. Al doilea documentează construirea unui compilator C în Rust de către 16 agenți Claude în paralel: 100.000 de linii de cod, capabil să compileze nucleul Linux 6.9 pe x86, ARM și RISC-V, în ~2.000 de sesiuni Claude Code pentru ~$20.000.
Opus 4.6 în GitHub Copilot
În aceeași zi, Claude Opus 4.6 devine disponibil în GA în GitHub Copilot prin Agent HQ, după previzualizarea publică anunțată cu o zi înainte.
🔗 Anunț Opus 4.6 | Zgomot de infrastructură | Construirea unui compilator C
GPT-5.3-Codex: frontieră de codare + cunoștințe pro
5 februarie — OpenAI lansează GPT-5.3-Codex, care îmbină performanța de codare a GPT-5.2-Codex cu capacitățile de raționament ale GPT-5.2, totul cu 25% mai rapid.
| Benchmark | Scor |
|---|---|
| SWE-Bench Pro (Public) | 56.8% |
| Terminal-Bench 2.0 | 77.3% |
| OSWorld-Verified | 64.7% |
| GDPval (victorii sau egaluri) | 70.9% |
| Cybersecurity CTF | 77.6% |
| SWE-Lancer IC Diamond | 81.4% |
GPT-5.3-Codex este primul model care a contribuit la propria sa creare: echipa a folosit versiuni preliminare pentru a depana antrenamentul, a gestiona implementarea și a analiza rezultatele testelor.
Dincolo de cod
Modelul produce prezentări, foi de calcul, analize de date și gestionează sarcini de productivitate într-un mediu desktop (64.7% pe OSWorld-Verified).
Securitate cibernetică: capacitate ridicată
GPT-5.3-Codex este primul model evaluat ca având capacitate ridicată pentru securitate cibernetică în cadrul de pregătire OpenAI și primul antrenat special pentru a identifica vulnerabilități software.
🔗 Blog GPT-5.3-Codex | System Card
OpenAI: Frontier, MCP Apps, securitate și biotehnologie
OpenAI Frontier: platformă de agenți enterprise
5 februarie — OpenAI lansează Frontier, o platformă pentru a dezvolta, implementa și gestiona agenți AI în întreprindere. Agenții primesc un context de afaceri partajat, permisiuni și învață din experiență.
| Aspect | Detaliu |
|---|---|
| Primii clienți | HP, Intuit, Oracle, State Farm, Thermo Fisher, Uber |
| Parteneri AI | Abridge, Clay, Ambience, Decagon, Harvey, Sierra |
| Abordare | Forward Deployed Engineers (FDE) integrați în echipe |
| Standarde | Standarde deschise, compatibil cu sistemele existente |
ChatGPT: MCP Apps în beta
5 februarie — MCP Apps ajung în beta în ChatGPT Business, Enterprise și Edu. Noi conectori parteneri: Amplitude, Fireflies, Vercel, Monday.com, Stripe, Hex, Egnyte și alții. Organizațiile pot construi aplicații MCP personalizate prin modul dezvoltator.
Trusted Access for Cyber
5 februarie — OpenAI lansează Trusted Access for Cyber, un program pilot de acces bazat pe încredere pentru capacități cibernetice avansate. Utilizatorii își pot verifica identitatea pe chatgpt.com/cyber. 10 milioane de dolari în credite API sunt alocate apărării cibernetice prin Cybersecurity Grant Program.
GPT-5 reduce costul sintezei proteice
5 februarie — În parteneriat cu Ginkgo Bioworks, OpenAI conectează GPT-5 la un laborator robotizat pentru a optimiza sinteza proteică fără celule (CFPS). Rezultat: 40% reducere a costului de producție și 57% îmbunătățire a costului reactivilor, după 36.000 de compoziții testate pe 580 de plăci automate în șase runde de experimentare.
🔗 OpenAI Frontier | MCP Apps | Trusted Access for Cyber | GPT-5 proteine
Google: Gemini 3, Super Bowl și NotebookLM
Gemini 3: actualizări și Super Bowl
5-6 februarie — Google împinge Gemini 3 pe toate fronturile. Gemini 3 Flash, lansat recent, oferă raționament de nivel Pro la viteză Flash: 90.4% pe GPQA Diamond și 33.7% pe Humanity’s Last Exam (fără instrumente). Gemini 3 devine modelul implicit pentru AI Overviews în Google Search.
Google pregătește, de asemenea, o reclamă Gemini de 60 de secunde pentru Super Bowl LX (8 februarie) — spotul „New Home” arată un copil pregătindu-se pentru o mutare cu ajutorul Gemini, ilustrând capacitățile de căutare în Google Photos și generarea de imagini.
NotebookLM: Infographics și Slide Decks
NotebookLM, construit acum pe Gemini 3, lansează Infographics și Slide Decks pentru utilizatorii Free și Pro. Slide Decks sunt deja al doilea cel mai popular studio de ieșire. Utilizatorii Ultra pot elimina filigranul.
🔗 Gemini 3 Flash | Gemini 3 App | NotebookLM Infographics
GitHub: comentarii fixate pe Issues
5 februarie — GitHub lansează comentarii fixate pe Issues. Acum este posibil să fixați un comentariu în partea de sus a unei probleme din meniul contextual. O funcție solicitată din 2017 pentru a evidenția decizii, actualizări și pași cheie următori în fire lungi.
Ce înseamnă acest lucru
5 februarie 2026 va rămâne o zi de referință: Anthropic și OpenAI își lansează simultan cele mai avansate modele de codare. Claude Opus 4.6 domină benchmark-urile de muncă profesională și regăsire de informații, în timp ce GPT-5.3-Codex excelează în codarea în terminal și utilizarea computerului. Ambele modele revendică SOTA (State Of The Art) pe Terminal-Bench 2.0 — articolul Anthropic despre zgomotul de infrastructură are sens perfect.
Dincolo de modele, bătălia platformelor se intensifică: OpenAI Frontier atacă întreprinderea cu agenți implementați la Oracle și Uber, în timp ce Anthropic pariază pe ecosistemul dezvoltatorilor (GitHub, Xcode, Claude Code). Google avansează pe toate fronturile cu Gemini 3 în Search, Chrome și NotebookLM și pregătește Super Bowl pentru a ancora Gemini în mainstream.
Surse
- Introducing Claude Opus 4.6
- Quantifying infrastructure noise
- Building a C compiler with parallel Claudes
- Introducing GPT-5.3-Codex
- GPT-5.3-Codex System Card
- Introducing OpenAI Frontier
- Introducing apps in ChatGPT
- Trusted Access for Cyber
- GPT-5 lowers protein synthesis cost
- Gemini 3 Flash
- NotebookLM Infographics
- Pinned comments on GitHub Issues