AlphaProof Nexus löser 9 öppna problem, Claude Code Auto Mode på Pro, Copilot Eclipse öppen källkod

Den här veckan tar Google DeepMind ett stort steg inom matematisk forskning med AlphaProof Nexus, en agent som kan lösa öppna problem som har varit olösta i flera decennier. På Anthropic-sidan öppnas Claude Codes autoläge för Pro-planen och integrerar Sonnet 4.6. GitHub öppnar Copilot-pluginet för Eclipse som källkod, och Alibaba aktiverar implicit cache på Qwen3.7-Max.

AlphaProof Nexus — En AI-agent löser öppna matematiska problem som har varit olösta i decennier

25 maj 2026 — Google DeepMind har tillkännagivit AlphaProof Nexus, ett agentiskt forskningsramverk (agentic framework) för formella bevis, drivet av Gemini, tillsammans med en artikel inskickad till arXiv den 21 maj (arXiv:2605.22763).

Agenten bygger på en slinga som växlar mellan generering via Gemini och formell verifiering via bevispråket Lean. Denna kombination garanterar den matematiska stringensen i de bevis som produceras: LLM:en föreslår, Lean validerar eller förkastar, och agenten itererar.

Publicerade resultat:

Område	Resultat	Kontext
Öppna problem av Erdős	9 lösta av 353 utvärderade	Varav 2 har varit öppna i 56 år
OEIS-förmodanden	44 lösta av 492	Online Encyclopedia of Integer Sequences
Algebraisk geometri	1 öppet problem löst	Öppet i 15 år
Min-max-optimering	1 öppet problem löst	Öppet i 7 år

Kostnaden per löst problem är några hundra dollar — en storleksordning som illustrerar den ekonomiska effektiviteten i det agentiska angreppssättet för formell matematisk forskning.

AlphaProof Nexus används redan i samarbete med matematiker inom flera områden: kombinatorik, grafteori, algebraisk geometri och kvantoptik. Arbetet ligger i linje med AlphaProof (2024), som riktade in sig på problem på olympiadnivå. AlphaProof Nexus siktar på öppna forskningsproblem, vilket markerar ett steg mot användning av AI som ett verktyg för autonom matematisk upptäckt.

“AI agents are advancing research-level math.”

🇸🇪 AI-agenter driver matematiken framåt på forskningsnivå. — Pushmeet Kohli, forskningschef, Google DeepMind på X

🔗 ArXiv-artikel 2605.22763

Claude Code v2.1.149 — Detalj `/usage` per kategori och 25+ korrigeringar

23 maj 2026 — Version 2.1.149 av Claude Code har släppts och förverkligar funktionen /usage breakdown per kategori som Boris Cherny tillkännagav veckan innan.

Funktion	Detalj
`/usage` breakdown	Förbrukningsdetalj per kategori: skills, underagenter, plugins, MCP-server
`/diff` navigation	Tangentbordsnavigering: pilar, `j`/`k`, PgUp/PgDn, Home/End
GFM task lists	Markdown-kryssrutor (`[ ]` / `[x]`) visas korrekt
Enterprise	Ny hanterad parameter `allowAllClaudeAIMcps` för `managed-mcp.json`

Versionen rättar också ett tjugotal buggar: kringgående av PowerShell-behörigheter i cd, tömning av vnode-tabellen på macOS med find, frysning av managed-settings-dialogen, spökändringar i /config, krasch i /insights på saknade valfria fält, samt en tänkande spinner som förblev bärnstensfärgad mellan verktygskanrop.

Version 2.1.150, som släpptes samma dag, innehåller endast interna förbättringar av infrastrukturen utan någon synlig förändring.

🔗 Claude Code-changelog

Claude Code Auto Mode — Tillgängligt på Pro, Sonnet 4.6 integrerat

23 maj 2026 — Anthropic tillkännager två utökningar av Claude Codes autoläge:

“Two updates to auto mode: · Now available on the Pro plan · Sonnet 4.6 is now supported, alongside Opus 4.7. Shift+tab, and let Claude run.”

🇸🇪 Två uppdateringar av autoläget: nu tillgängligt på Pro-planen; Sonnet 4.6 stöds, vid sidan av Opus 4.7. Tryck på Shift+tab och låt Claude arbeta. — @ClaudeDevs på X

Autoläget, som aktiveras via Shift+Tab, gör att Claude kan utföra åtgärder autonomt utan manuell bekräftelse i varje steg. Tidigare var det reserverat för högre planer, men det är nu tillgängligt för Pro-prenumeranter. Tillägget av Sonnet 4.6 erbjuder ett mer ekonomiskt alternativ än Opus 4.7 för längre sessioner, vilket minskar kreditförbrukningen i autonomt läge.

För att få tillgång till dessa ändringar: claude update eller uppdatering av Claude desktop-appen. Tillkännagivandet genererade 1,18 miljoner visningar på X.

GitHub Copilot for Eclipse — Öppen källkod under MIT-licens

21 maj 2026 — GitHub har gjort GitHub Copilot-pluginet för Eclipse med öppen källkod, tillgängligt på GitHub under MIT-licens på adressen github.com/microsoft/copilot-for-eclipse.

Hela funktionsuppsättningen är tillgänglig för bidrag från communityn:

Funktion	Status
Code completion (inline-kompletteringar)	Öppen källkod
Next Edit Suggestions (NES)	Öppen källkod
Chat (konversationsflöde, verktygskanrop)	Öppen källkod
Agent mode (agentiska arbetsflöden med flera steg)	Öppen källkod
Skills och prompt-filer	Öppen källkod
BYOK (Bring Your Own Key)	Öppen källkod
Anpassade agenter, underagenter, agentplan, MCP	Öppen källkod

Motivationen är transparens och communitydriven innovation i andan av Eclipses öppna ekosystem. Bidrag har redan tagits emot från communityn redan från öppnandet.

🔗 GitHub Changelog-annonsering

Qwen3.7-Max — Implicit cache aktiverad i produktion

25 maj 2026 — Alibaba aktiverar implicit cache (implicit caching) på Qwen3.7-Max, sin flaggskeppsmodell inriktad på agenter.

Cachen aktiveras automatiskt för alla API-anrop — ingen kodändring krävs. Utvecklare får omedelbart snabbare och billigare anrop för repetitiva kontexter. För högre och deterministiska cachningsgrader rekommenderar Alibaba explicit cache, dokumenterad på Alibaba Cloud.

🔗 Tweet @Alibaba_Qwen

Kortnytt

MiniMax Hailuo AI på AIFF i Hongkong (HKUST) — Det 2:a AI Film Festival som anordnades av HKUST fick 1 300 bidrag från 80 länder. Hailuo AI var representerat där tillsammans med Tencent och Z.ai i en panel om demokratiseringen av AI-film. 🔗 minimax.io
NVIDIA DGX Spark — 16 lokala AI-agenter samtidigt — Communitydemonstration retweetad av @NVIDIAAI: 2x DGX Spark (GB10) + MiniMax M2.7 NVFP4 kör 16 AI-agenter i samtidig streaming, utan moln-API:er. 🔗 @NVIDIAAI på X

Vad detta betyder

En vändpunkt för formell matematisk forskning. AlphaProof Nexus markerar ett brott: AI begränsas inte längre till tävlingsproblem eller akademiska benchmarks, utan angriper öppna problem som matematiker inte har lyckats lösa på decennier. Kombinationen Gemini + Lean skapar en formell verifieringsloop som säkerställer att bevisen är korrekta, inte bara plausibla. Kostnaden på några hundra dollar per löst problem antyder att detta angreppssätt blir tillgängligt för forskningslaboratorier, inte bara för branschjättar.

Mognaden i den agentiska verktygslådan hos Anthropic. Införandet av autoläget på Pro-planen och integreringen av Sonnet 4.6 signalerar att Anthropic ser autonom agentisk användning som tillräckligt stabil för allmänheten. Version 2.1.149, med sin /usage breakdown per kategori, svarar mot ett konkret behov hos utvecklare som bygger komplexa multiagentsystem: att exakt förstå vad som förbrukar deras kvot för att kunna optimera sina arkitekturer.

Öppenhet kontra mjukvarusuveränitet. Copilot för Eclipse som öppen källkod under MIT och aktiveringen av implicit cache på Qwen3.7-Max illustrerar två olika strategier för att vinna utvecklare. GitHub satsar på transparens och Eclipse-ekosystemet för att bredda användningen av Copilot i företagsmiljöer med Java. Alibaba satsar på automatisk kostnadsreduktion utan friktion för att göra Qwen3.7-Max mer konkurrenskraftig mot molnalternativ.

Industrialiserandet av generativa medier går framåt. MiniMaxs deltagande i AIFF i Hongkong — 1 300 bidrag från 80 länder — och NVIDIA:s demonstration av 16 lokala agenter samtidigt på DGX Spark tecknar ett ekosystem där AI-driven videoproduktion tränger in i professionella arbetsflöden inom film, både på festivaler och i lokal infrastruktur.