Această săptămână, Google DeepMind face un pas important în cercetarea matematică cu AlphaProof Nexus, un agent capabil să rezolve probleme deschise de câteva decenii. Din partea Anthropic, modul auto al Claude Code se deschide către planul Pro și integrează Sonnet 4.6. GitHub open source pluginul Copilot pentru Eclipse, iar Alibaba activează cache-ul implicit pe Qwen3.7-Max.
AlphaProof Nexus — Un agent IA rezolvă probleme matematice deschise de zeci de ani
25 mai 2026 — Google DeepMind a anunțat AlphaProof Nexus, un cadru agentic (agentic framework) pentru cercetarea demonstrațiilor formale alimentat de Gemini, însoțit de un articol trimis pe arXiv pe 21 mai (arXiv:2605.22763).
Agentul se bazează pe o buclă care alternează generarea prin Gemini și verificarea formală prin limbajul de demonstrație Lean. Această combinație garantează rigoarea matematică a demonstrațiilor produse: LLM-ul propune, Lean validează sau respinge, iar agentul iterează.
Rezultate publicate:
| Domeniu | Rezultate | Context |
|---|---|---|
| Probleme deschise ale lui Erdős | 9 rezolvate din 353 evaluate | Dintre care 2 sunt deschise de 56 de ani |
| Conjecturi OEIS | 44 rezolvate din 492 | Online Encyclopedia of Integer Sequences |
| Geometrie algebrică | 1 problemă deschisă rezolvată | Deschisă de 15 ani |
| Optimizare min-max | 1 întrebare deschisă rezolvată | Deschisă de 7 ani |
Costul pe problemă rezolvată este de câteva sute de dolari — un ordin de mărime care ilustrează eficiența economică a abordării agentice pentru cercetarea matematică formală.
AlphaProof Nexus este deja implementat în colaborare cu matematicieni în mai multe domenii: combinatorică, teoria grafurilor, geometrie algebrică și optică cuantică. Această muncă se înscrie în continuitatea AlphaProof (2024), care viza probleme de nivel olimpiadă. AlphaProof Nexus vizează probleme deschise de cercetare, marcând un pas către utilizarea IA ca instrument autonom de descoperire matematică.
“AI agents are advancing research-level math.”
🇷🇴 Agenții IA duc mai departe matematica la nivelul cercetării. — Pushmeet Kohli, VP Research, Google DeepMind pe X
Claude Code v2.1.149 — Detaliu /usage pe categorie și 25+ corecții
23 mai 2026 — Versiunea 2.1.149 a Claude Code a fost publicată, concretizând funcționalitatea /usage breakdown pe categorie anunțată de Boris Cherny săptămâna precedentă.
| Funcționalitate | Detaliu |
|---|---|
/usage breakdown | Defalcare a consumului pe categorie: skills, subagenți, pluginuri, server MCP |
/diff navigare | Navigare cu tastatura: săgeți, j/k, PgUp/PgDn, Home/End |
| Liste de sarcini GFM | Casete de bifare Markdown ([ ] / [x]) afișate corect |
| Enterprise | Nou parametru gestionat allowAllClaudeAIMcps pentru managed-mcp.json |
Release-ul corectează, de asemenea, aproximativ douăzeci de bug-uri: ocolirea permisiunilor PowerShell în cd, epuizarea tabelei vnode pe macOS cu find, blocarea dialogului managed-settings, modificări fantomă în /config, crash-ul /insights pe câmpuri opționale lipsă și spinnerul de reflecție rămas chihlimbariu între apelurile de instrumente.
Versiunea 2.1.150, publicată în aceeași zi, nu aduce decât îmbunătățiri interne de infrastructură, fără schimbări vizibile.
🔗 Jurnal de modificări Claude Code
Claude Code Auto Mode — Disponibil pe Pro, Sonnet 4.6 integrat
23 mai 2026 — Anthropic anunță două extinderi ale modului auto al Claude Code :
“Two updates to auto mode: · Now available on the Pro plan · Sonnet 4.6 is now supported, alongside Opus 4.7. Shift+tab, and let Claude run.”
🇷🇴 Două actualizări ale modului auto: acum disponibil pe planul Pro; Sonnet 4.6 este suportat, alături de Opus 4.7. Shift+tab, și lăsați-l pe Claude să lucreze. — @ClaudeDevs pe X
Modul auto, activat prin Shift+Tab, îi permite lui Claude să execute acțiuni în mod autonom fără validare manuală la fiecare pas. Până acum rezervat planurilor superioare, este acum accesibil abonaților Pro. Adăugarea Sonnet 4.6 oferă o opțiune mai economică decât Opus 4.7 pentru sesiunile lungi, reducând consumul de credite în modul autonom.
Pentru a accesa aceste schimbări: claude update sau actualizarea aplicației desktop Claude. Anunțul a generat 1,18 milioane de vizualizări pe X.
GitHub Copilot for Eclipse — Open source sub licența MIT
21 mai 2026 — GitHub a făcut open source pluginul GitHub Copilot pentru Eclipse, disponibil pe GitHub sub licența MIT la adresa github.com/microsoft/copilot-for-eclipse.
Întregul set de funcționalități este expus pentru contribuții comunitare:
| Funcționalitate | Stare |
|---|---|
| Code completion (completări în linie) | Open source |
| Next Edit Suggestions (NES) | Open source |
| Chat (flux de conversație, apeluri de instrumente) | Open source |
| Agent mode (workflow-uri agentice multi-step) | Open source |
| Skills și prompt files | Open source |
| BYOK (Bring Your Own Key) | Open source |
| Agenți personalizați, subagenți, plan agent, MCP | Open source |
Motivația este transparența și inovația comunitară în spiritul ecosistemului deschis al Eclipse. Au fost deja primite contribuții din partea comunității încă de la deschidere.
Qwen3.7-Max — Cache implicit activat în producție
25 mai 2026 — Alibaba activează cache-ul implicit (implicit caching) pe Qwen3.7-Max, modelul său emblematic orientat către agenți.
Cache-ul se activează automat pentru toate cererile API — nu este necesară nicio modificare de cod. Dezvoltatorii beneficiază imediat de cereri mai rapide și mai puțin costisitoare pe contexte repetitive. Pentru rate de cache mai ridicate și deterministe, Alibaba recomandă cache-ul explicit, documentat pe Alibaba Cloud.
🔗 Tweet despre Qwen3.7-Max implicit caching
Scurt
-
MiniMax Hailuo AI la AIFF Hong Kong (HKUST) — Cea de-a 2-a ediție a AI Film Festival organizat de HKUST a primit 1 300 de candidaturi din 80 de țări. Hailuo AI a fost reprezentat acolo alături de Tencent și Z.ai într-un panel despre democratizarea cinematografiei IA. 🔗 minimax.io
-
NVIDIA DGX Spark — 16 agenți IA locali simultani — Demonstrație comunitară redistribuită de @NVIDIAAI: 2x DGX Spark (GB10) + MiniMax M2.7 NVFP4 rulează 16 agenți IA în streaming simultan, fără API-uri cloud. 🔗 @NVIDIAAI pe X
Ce înseamnă asta
Un punct de cotitură pentru cercetarea matematică formală. AlphaProof Nexus marchează o ruptură: IA nu se mai limitează la probleme de concurs sau la benchmark-uri academice, ci atacă probleme deschise pe care matematicienii nu au reușit să le rezolve de zeci de ani. Combinația Gemini + Lean creează o buclă de verificare formală care garantează că demonstrațiile sunt corecte, nu doar plauzibile. Costul de câteva sute de dolari pe problemă rezolvată sugerează că această abordare devine accesibilă laboratoarelor de cercetare, nu doar giganților din sector.
Maturitatea instrumentelor agentice la Anthropic. Sosirea modului auto pe planul Pro și integrarea Sonnet 4.6 semnalează că Anthropic consideră utilizarea agentică autonomă suficient de stabilă pentru publicul larg. Versiunea 2.1.149, cu defalcarea /usage pe categorie, răspunde unei nevoi concrete a dezvoltatorilor care construiesc sisteme multi-agent complexe: să înțeleagă precis ce le consumă cota pentru a-și optimiza arhitecturile.
Deschidere vs. suveranitate software. Open source-ul Copilot pentru Eclipse sub licența MIT și activarea cache-ului implicit pe Qwen3.7-Max ilustrează două strategii diferite pentru a cuceri dezvoltatorii. GitHub mizează pe transparență și pe ecosistemul Eclipse pentru a lărgi adoptarea Copilot în mediile Java de întreprindere. Alibaba mizează pe reducerea automată a costurilor, fără fricțiune, pentru a face Qwen3.7-Max mai competitiv față de alternativele cloud.
Industrializarea media generative avansează. Participarea MiniMax la AIFF Hong Kong — 1 300 de candidaturi din 80 de țări — și demonstrația NVIDIA cu 16 agenți locali simultani pe DGX Spark conturează un ecosistem în care creația video prin IA pătrunde în fluxurile profesionale din cinema, atât în festivaluri, cât și în infrastructură locală.
Surse
- Tweet AlphaProof Nexus — Pushmeet Kohli
- Articol arXiv AlphaProof Nexus
- Jurnal de modificări Claude Code — GitHub
- Claude Code pe npm
- Tweet despre Claude Code Auto Mode — @ClaudeDevs
- GitHub Copilot pentru Eclipse open source
- Tweet despre cache-ul implicit Qwen3.7-Max
- MiniMax — AIFF Hong Kong
- Tweet NVIDIA DGX Spark
Articol tradus din fr în ro cu gpt-5.4-mini.