Căutare

Claude Opus 4.6 și GPT-5.3-Codex: Lansare dublă, actualizare Gemini 3

Claude Opus 4.6 și GPT-5.3-Codex: Lansare dublă, actualizare Gemini 3

Lansare dublă la vârf: Anthropic lansează Claude Opus 4.6 cu context de 1M tokeni și echipe de agenți, în timp ce OpenAI răspunde cu GPT-5.3-Codex și o platformă enterprise. Google împinge Gemini 3 pe toate fronturile, iar GitHub răspunde în sfârșit unei cereri vechi de 8 ani.


Claude Opus 4.6: SOTA în agentic coding și context 1M

5 februarie — Anthropic lansează Claude Opus 4.6, o actualizare majoră a celui mai inteligent model al său. Modelul progresează în planificare, sesiuni lungi, revizuire de cod și oferă pentru prima dată un context de 1 milion de tokeni în beta pentru un model Opus.

BenchmarkScorDetaliu
Terminal-Bench 2.0SOTACel mai mare scor la agentic coding
Humanity’s Last ExamSOTARaționament multidisciplinar
GDPval-AA+144 Elo vs GPT-5.2Muncă profesională (financiar, juridic)
BrowseCompSOTARegăsire complexă de informații
MRCR v2 (8-needle 1M)76%vs 18.5% pentru Sonnet 4.5

Noutăți API și produs

FuncționalitateDescriere
Agent teamsMai mulți agenți Claude Code în paralel (research preview)
Adaptive thinkingModelul alege când să folosească gândirea profundă
Effort controls4 niveluri: scăzut, mediu, ridicat (implicit), maxim
Context compactionRezumare automată a contextului pentru sesiuni lungi
128k output tokensIeșiri mai lungi într-o singură cerere
Claude in PowerPointResearch preview (Max, Team, Enterprise)

Prețuri: Neschimbate la 5/5/25 pe milion de tokeni (input/output). Prețuri premium peste 200k tokeni (10/10/37.50).

Disponibilitate: claude.ai, API (claude-opus-4-6) și toate platformele cloud majore.

Bloguri de inginerie: zgomot de infrastructură și compilator C

Anthropic publică două articole tehnice în aceeași zi. Primul cuantifică zgomotul de infrastructură în benchmark-urile de agentic coding: pe Terminal-Bench 2.0, configurația resurselor singură poate crea decalaje de 6 puncte procentuale între setup-uri. Al doilea documentează construirea unui compilator C în Rust de către 16 agenți Claude în paralel: 100.000 de linii de cod, capabil să compileze nucleul Linux 6.9 pe x86, ARM și RISC-V, în ~2.000 de sesiuni Claude Code pentru ~$20.000.

Opus 4.6 în GitHub Copilot

În aceeași zi, Claude Opus 4.6 devine disponibil în GA în GitHub Copilot prin Agent HQ, după previzualizarea publică anunțată cu o zi înainte.

🔗 Anunț Opus 4.6 | Zgomot de infrastructură | Construirea unui compilator C


GPT-5.3-Codex: frontieră de codare + cunoștințe pro

5 februarie — OpenAI lansează GPT-5.3-Codex, care îmbină performanța de codare a GPT-5.2-Codex cu capacitățile de raționament ale GPT-5.2, totul cu 25% mai rapid.

BenchmarkScor
SWE-Bench Pro (Public)56.8%
Terminal-Bench 2.077.3%
OSWorld-Verified64.7%
GDPval (victorii sau egaluri)70.9%
Cybersecurity CTF77.6%
SWE-Lancer IC Diamond81.4%

GPT-5.3-Codex este primul model care a contribuit la propria sa creare: echipa a folosit versiuni preliminare pentru a depana antrenamentul, a gestiona implementarea și a analiza rezultatele testelor.

Dincolo de cod

Modelul produce prezentări, foi de calcul, analize de date și gestionează sarcini de productivitate într-un mediu desktop (64.7% pe OSWorld-Verified).

Securitate cibernetică: capacitate ridicată

GPT-5.3-Codex este primul model evaluat ca având capacitate ridicată pentru securitate cibernetică în cadrul de pregătire OpenAI și primul antrenat special pentru a identifica vulnerabilități software.

🔗 Blog GPT-5.3-Codex | System Card


OpenAI: Frontier, MCP Apps, securitate și biotehnologie

OpenAI Frontier: platformă de agenți enterprise

5 februarie — OpenAI lansează Frontier, o platformă pentru a dezvolta, implementa și gestiona agenți AI în întreprindere. Agenții primesc un context de afaceri partajat, permisiuni și învață din experiență.

AspectDetaliu
Primii cliențiHP, Intuit, Oracle, State Farm, Thermo Fisher, Uber
Parteneri AIAbridge, Clay, Ambience, Decagon, Harvey, Sierra
AbordareForward Deployed Engineers (FDE) integrați în echipe
StandardeStandarde deschise, compatibil cu sistemele existente

ChatGPT: MCP Apps în beta

5 februarieMCP Apps ajung în beta în ChatGPT Business, Enterprise și Edu. Noi conectori parteneri: Amplitude, Fireflies, Vercel, Monday.com, Stripe, Hex, Egnyte și alții. Organizațiile pot construi aplicații MCP personalizate prin modul dezvoltator.

Trusted Access for Cyber

5 februarie — OpenAI lansează Trusted Access for Cyber, un program pilot de acces bazat pe încredere pentru capacități cibernetice avansate. Utilizatorii își pot verifica identitatea pe chatgpt.com/cyber. 10 milioane de dolari în credite API sunt alocate apărării cibernetice prin Cybersecurity Grant Program.

GPT-5 reduce costul sintezei proteice

5 februarie — În parteneriat cu Ginkgo Bioworks, OpenAI conectează GPT-5 la un laborator robotizat pentru a optimiza sinteza proteică fără celule (CFPS). Rezultat: 40% reducere a costului de producție și 57% îmbunătățire a costului reactivilor, după 36.000 de compoziții testate pe 580 de plăci automate în șase runde de experimentare.

🔗 OpenAI Frontier | MCP Apps | Trusted Access for Cyber | GPT-5 proteine


Google: Gemini 3, Super Bowl și NotebookLM

Gemini 3: actualizări și Super Bowl

5-6 februarie — Google împinge Gemini 3 pe toate fronturile. Gemini 3 Flash, lansat recent, oferă raționament de nivel Pro la viteză Flash: 90.4% pe GPQA Diamond și 33.7% pe Humanity’s Last Exam (fără instrumente). Gemini 3 devine modelul implicit pentru AI Overviews în Google Search.

Google pregătește, de asemenea, o reclamă Gemini de 60 de secunde pentru Super Bowl LX (8 februarie) — spotul „New Home” arată un copil pregătindu-se pentru o mutare cu ajutorul Gemini, ilustrând capacitățile de căutare în Google Photos și generarea de imagini.

NotebookLM: Infographics și Slide Decks

NotebookLM, construit acum pe Gemini 3, lansează Infographics și Slide Decks pentru utilizatorii Free și Pro. Slide Decks sunt deja al doilea cel mai popular studio de ieșire. Utilizatorii Ultra pot elimina filigranul.

🔗 Gemini 3 Flash | Gemini 3 App | NotebookLM Infographics


GitHub: comentarii fixate pe Issues

5 februarie — GitHub lansează comentarii fixate pe Issues. Acum este posibil să fixați un comentariu în partea de sus a unei probleme din meniul contextual. O funcție solicitată din 2017 pentru a evidenția decizii, actualizări și pași cheie următori în fire lungi.

🔗 Changelog


Ce înseamnă acest lucru

5 februarie 2026 va rămâne o zi de referință: Anthropic și OpenAI își lansează simultan cele mai avansate modele de codare. Claude Opus 4.6 domină benchmark-urile de muncă profesională și regăsire de informații, în timp ce GPT-5.3-Codex excelează în codarea în terminal și utilizarea computerului. Ambele modele revendică SOTA (State Of The Art) pe Terminal-Bench 2.0 — articolul Anthropic despre zgomotul de infrastructură are sens perfect.

Dincolo de modele, bătălia platformelor se intensifică: OpenAI Frontier atacă întreprinderea cu agenți implementați la Oracle și Uber, în timp ce Anthropic pariază pe ecosistemul dezvoltatorilor (GitHub, Xcode, Claude Code). Google avansează pe toate fronturile cu Gemini 3 în Search, Chrome și NotebookLM și pregătește Super Bowl pentru a ancora Gemini în mainstream.


Surse