Știri AI 23 Ian 2026: Claude în Excel, Tasks Claude Code, Codex Agent Loop

Săptămână încărcată pentru agenții AI

Din 21 până în 23 ianuarie 2026, mai multe anunțuri majore privind coding agents și infrastructura. Anthropic lansează Claude în Excel și publică trei articole despre sistemele multi-agent, OpenAI detaliază arhitectura internă a Codex și infrastructura sa PostgreSQL, Qwen lansează modelul său text-to-speech ca open-source, iar Runway adaugă Image to Video la Gen-4.5.

Anthropic: Claude în Excel și Claude Code

Claude în Excel

23 ianuarie — Claude este acum disponibil în Microsoft Excel în beta. Integrarea permite analizarea registrelor de lucru Excel complete, cu formulele lor imbricate și dependențele dintre file.

Funcționalități:

Înțelegerea întregului registru de lucru (formule, dependențe multi-filă)
Explicații cu citate la nivel de celulă
Actualizarea ipotezelor păstrând formulele

Disponibil pentru abonații Claude Pro, Max, Team și Enterprise.

🔗 Claude în Excel

Claude Code v2.1.19: sistemul Tasks

23 ianuarie — Versiunea 2.1.19 introduce Tasks, un nou sistem de gestionare a sarcinilor pentru proiecte complexe multi-sesiune.

We’re turning Todos into Tasks in Claude Code. Tasks are a new primitive that help Claude Code track and complete more complicated projects and collaborate on them across multiple sessions or subagents.

🇷🇴 Transformăm Todos în Tasks în Claude Code. Tasks sunt o nouă primitivă care ajută Claude Code să urmărească și să finalizeze proiecte mai complicate și să colaboreze la acestea prin mai multe sesiuni sau sub-agenți. — Thariq (@trq212), echipa Claude Code Anthropic

Funcționalități Tasks:

Aspect	Detaliu
Stocare	`~/.claude/tasks` (fișiere, permite construirea de instrumente deasupra)
Colaborare	`CLAUDE_CODE_TASK_LIST_ID=nume claude` pentru a partaja între sesiuni
Dependențe	Tasks cu dependențe și blocaje stocate în metadate
Broadcast	Actualizarea unui Task difuzată către toate sesiunile de pe aceeași Task List
Compatibilitate	Funcționează cu `claude -p` și AgentSDK

La ce servește: Pe un proiect complex (refactorizare multi-fișier, migrare, funcționalitate lungă), Claude poate împărți munca în tasks, urmări ce este făcut și ce rămâne. Sarcinile sunt persistente pe disc — supraviețuiesc compactării contextului, închiderii sesiunii și repornirii. Mai multe sesiuni sau sub-agenți pot colabora la aceeași listă de sarcini în timp real.

În practică: Claude creează tasks (TaskCreate), le listează (TaskList) și actualizează starea lor (TaskUpdate: pending → in_progress → completed). Exemplu la o refactorizare de autentificare:

#1 [completed] Migrare stocare sesiune către Redis
#2 [in_progress] Implementare rotire refresh token
#3 [pending] Adăugare teste de integrare OAuth
#4 [pending] Actualizare documentație API

Sarcinile sunt stocate în ~/.claude/tasks/ și pot fi partajate între sesiuni via CLAUDE_CODE_TASK_LIST_ID.

Alte noutăți v2.1.19:

Prescurtare $0, $1 pentru argumente în comenzi personalizate
VSCode session forking și derulare înapoi pentru toți
Skills fără permisiuni se execută fără aprobare
CLAUDE_CODE_ENABLE_TASKS=false pentru a dezactiva temporar

🔗 CHANGELOG Claude Code | Thread @trq212

Claude Code v2.1.18: scurtături de tastatură personalizabile

Versiune anterioară care adaugă posibilitatea de a configura scurtături de tastatură per context și de a crea secvențe chord.

Comandă: /keybindings

⚠️ Notă: Această funcționalitate este momentan în preview și nu este disponibilă pentru toți utilizatorii.

🔗 Documentație Keybindings

Petri 2.0: audituri de aliniere automatizate

22 ianuarie — Anthropic publică Petri 2.0, o actualizare a instrumentului său de audit comportamental automatizat pentru modele lingvistice.

La ce servește: Petri testează dacă un LLM s-ar putea comporta problematic — manipulare, înșelăciune, eludarea regulilor. Instrumentul generează scenarii realiste și observă răspunsurile modelului pentru a detecta comportamente nedorite înainte ca acestea să apară în producție.

Îmbunătățire	Descriere
70 scenarii noi	Bibliotecă de seeds extinsă pentru a acoperi mai multe cazuri limită
Mitigări eval-awareness	Modelul nu trebuie să știe că este testat — altfel își adaptează comportamentul. Petri 2.0 îmbunătățește realismul scenariilor pentru a evita această detecție.
Comparații frontier	Rezultate de evaluare pentru modele recente (Claude, GPT, Gemini)

🔗 Petri 2.0 | GitHub

Blog: când să folosești (sau nu) sisteme multi-agent

23 ianuarie — Anthropic publică un ghid pragmatic despre arhitecturile multi-agent. Mesajul principal: nu folosiți multi-agent în mod implicit.

We’ve seen teams invest months building elaborate multi-agent architectures only to discover that improved prompting on a single agent achieved equivalent results.

🇷🇴 Am văzut echipe investind luni de zile construind arhitecturi multi-agent elaborate doar pentru a descoperi că un prompting îmbunătățit pe un singur agent a obținut rezultate echivalente.

Articolul identifică 3 cazuri în care multi-agent aduce cu adevărat valoare:

Caz	Problemă	Soluție multi-agent
Poluarea contextului	Un agent generează date voluminoase din care doar un rezumat este util ulterior	Un sub-agent recuperează 2000 token-uri de istoric, returnează doar “comandă livrată” agentului principal
Paralelizare	Mai multe căutări independente de făcut	Lansați 5 agenți în paralel pe 5 surse diferite în loc să le procesați secvențial
Specializare	Prea multe instrumente (20+) într-un singur agent degradează capacitatea sa de a-l alege pe cel corect	Separare în agenți specializați: unul pentru CRM, unul pentru marketing, unul pentru mesagerie

Capcana de evitat: Divizarea după tipul de muncă (un agent planifică, altul implementează, altul testează). Fiecare predare pierde context și degradează calitatea. Este mai bine ca un singur agent să gestioneze o funcționalitate de la capăt la coadă.

Cost real: 3-10x mai multe token-uri decât un singur agent pentru aceeași sarcină.

Alte articole din serie:

Building agents with Skills (22 ian)

În loc să construiască agenți specializați pe domeniu, Anthropic propune construirea de skills: colecții de fișiere (fluxuri de lucru, scripturi, bune practici) pe care un agent generalist le încarcă la cerere.

Dezvăluire progresivă în 3 niveluri:

Nivel	Conținut	Dimensiune
1	Metadate (nume, descriere)	~50 token-uri
2	Fișier SKILL.md complet	~500 token-uri
3	Documentație de referință	2000+ token-uri

Fiecare nivel este încărcat doar dacă este necesar. Rezultat: un agent poate avea sute de skills fără a-și satura contextul.

🔗 Building agents with Skills

Eight trends 2026 (21 ian)

Anthropic identifică 8 tendințe pentru dezvoltarea software în 2026.

Mesaj cheie: Inginerii trec de la scrierea codului la coordonarea agenților care scriu cod.

Nuuanță importantă: AI este folosită în ~60% din muncă, dar doar 0-20% poate fi complet delegată — supravegherea umană rămâne esențială.

Companie	Rezultat
Rakuten	Claude Code pe bază de cod vLLM (12.5M linii), 7h de muncă autonomă
TELUS	30% mai rapid, 500k ore economisite
Zapier	89% adopție AI, 800+ agenți interni

🔗 Eight trends 2026

OpenAI: arhitectura Codex și infrastructura

Unrolling the Codex agent loop

23 ianuarie — OpenAI deschide culisele Codex CLI. Primul articol dintr-o serie despre funcționarea internă a agentului lor software.

Ce învățăm:

Bucla agentului este simplă în teorie: utilizatorul trimite o cerere → modelul generează un răspuns sau solicită un instrument → agentul execută instrumentul → modelul reia cu rezultatul → până la un răspuns final. În practică, subtilitățile sunt în gestionarea contextului.

Prompt caching — cheia performanței:

Fiecare tur de conversație adaugă conținut la prompt. Fără optimizare, este pătratic în token-uri trimise. Prompt caching permite reutilizarea calculelor din tururile anterioare. Condiție: noul prompt trebuie să fie un prefix exact al celui vechi. OpenAI detaliază capcanele care strică cache-ul (schimbarea ordinii instrumentelor MCP, modificarea configurației la mijlocul conversației).

Compactare automată:

Când contextul depășește un prag, Codex apelează /responses/compact care returnează o versiune comprimată a conversației. Modelul păstrează o înțelegere latentă via un encrypted_content opac.

Zero Data Retention (ZDR):

Pentru clienții care nu doresc ca datele lor să fie stocate, encrypted_content permite păstrarea raționamentului modelului între tururi fără a stoca date pe partea serverului.

Primul articol dintr-o serie — următoarele vor acoperi arhitectura CLI, implementarea instrumentelor și sandboxing-ul.

🔗 Unrolling the Codex agent loop | Codex GitHub

Scaling PostgreSQL: 800 milioane de utilizatori ChatGPT

22 ianuarie — OpenAI detaliază modul în care PostgreSQL alimentează ChatGPT și API-ul pentru 800 de milioane de utilizatori cu milioane de cereri pe secundă.

Metrică	Valoare
Utilizatori	800 milioane
Throughput	Milioane de QPS
Replici	~50 read replicas multi-regiune
p99 Latency	Cifre duble ms partea client
Disponibilitate	Five-nines (99.999%)

Arhitectură:

Single primary Azure PostgreSQL flexible server
PgBouncer pentru connection pooling (latență conexiune: 50ms → 5ms)
Sarcini de lucru write-heavy migrate către Azure Cosmos DB
Cache locking pentru a proteja împotriva furtunilor de cache miss
Replicare în cascadă în testare pentru a depăși 100 de replici

Singurul SEV-0 PostgreSQL în ultimele 12 luni: în timpul lansării virale a ChatGPT ImageGen (100M utilizatori noi într-o săptămână, trafic scriere x10).

🔗 Scaling PostgreSQL

Qwen: Qwen3-TTS open-source

22-23 ianuarie — Alibaba lansează Qwen3-TTS în open-source sub licență Apache 2.0.

Caracteristică	Detaliu
Licență	Apache 2.0
Voice cloning	Da
Suport MLX-Audio	Disponibil

Instalare:

uv pip install -U mlx-audio --prerelease=allow

🔗 Qwen3-TTS pe X

Runway: Gen-4.5 Image to Video

21 ianuarie — Runway adaugă funcționalitatea Image to Video la Gen-4.5.

Funcționalitate	Descriere
Image to Video	Transformarea unei imagini în video cinematic
Camera control	Control precis al camerei
Coherent narratives	Narațiuni coerente în timp
Character consistency	Personaje care rămân consistente

Disponibil pentru toate planurile plătite Runway. Promoție temporară: 15% reducere.

🔗 Runway pe X

Ce înseamnă asta

Această săptămână marchează o maturizare a instrumentelor coding agents. Cei doi giganți (Anthropic și OpenAI) publică documentații tehnice detaliate despre arhitectura agenților lor — semn că piața trece de la faza “demo” la faza “producție”.

Pe partea de infrastructură, articolul PostgreSQL de la OpenAI arată că o arhitectură single-primary poate rezista la scara a sute de milioane de utilizatori cu optimizările potrivite.

Sosirea lui Claude în Excel deschide un nou front: AI integrată direct în instrumentele de productivitate zilnice.