Cerca

Project Glasswing e Claude Mythos Preview, Meta Muse Spark, Gemini CLI v0.37.0

Project Glasswing e Claude Mythos Preview, Meta Muse Spark, Gemini CLI v0.37.0

La settimana dal 5 al 9 aprile 2026 è stata dominata da due annunci principali: Anthropic ha presentato Project Glasswing, una coalizione di undici grandi aziende tecnologiche attorno a Claude Mythos Preview per rilevare vulnerabilità zero-day su larga scala, mentre Meta faceva il suo ritorno con Muse Spark, il suo primo modello non open-weights in un anno. In parallelo, Google, OpenAI, GitHub e Perplexity hanno pubblicato ciascuno aggiornamenti degni di nota per i loro sviluppatori e utenti.


Project Glasswing e Claude Mythos Preview

7 aprile 2026 — Anthropic ha annunciato Project Glasswing, un’iniziativa di sicurezza software che riunisce undici organizzazioni: Amazon Web Services, Apple, Broadcom, Cisco, CrowdStrike, Google, JPMorganChase, The Linux Foundation, Microsoft, NVIDIA e Palo Alto Networks. L’iniziativa si basa sulle capacità di un nuovo modello frontier ad accesso ristretto: Claude Mythos Preview.

Cosa fa Mythos Preview

Il modello ha dimostrato la capacità di identificare migliaia di vulnerabilità zero-day nei principali sistemi operativi e browser web, alcune delle quali erano rimaste dormienti per decenni. Tre esempi concreti illustrano l’ampiezza delle scoperte:

  • Un bug vecchio di 27 anni in OpenBSD che consente di mandare in crash da remoto qualsiasi macchina connessa
  • Una vulnerabilità di 16 anni in FFmpeg, nascosta in una riga di codice testata più di cinque milioni di volte senza essere rilevata
  • Diverse falle nel kernel Linux che consentono un’escalation di privilegi fino al controllo totale della macchina

Questi esempi mostrano che Mythos Preview non fa rilevamento superficiale — trova errori logici sepolti in basi di codice critiche, sottoposte a revisione continua da migliaia di ricercatori da anni.

Benchmark

Le prestazioni di Mythos Preview sui benchmark di riferimento segnano un chiaro progresso rispetto a Opus 4.6:

BenchmarkMythos PreviewOpus 4.6
SWE-bench Verified93,9 %80,8 %
SWE-bench Pro77,8 %53,4 %
Terminal-Bench 2.082,0 %65,4 %
SWE-bench Multilingue87,3 %77,8 %
CyberGym (cybersicurezza)83,1 %66,6 %
GPQA Diamond94,6 %91,3 %
Humanity’s Last Exam (senza strumenti)56,8 %40,0 %

Il balzo su SWE-bench Verified — da 80,8 % a 93,9 % — è particolarmente significativo: si tratta del benchmark più usato per misurare la capacità di un modello di risolvere bug reali in veri repository open source. Su CyberGym, dedicato alla cybersicurezza, il guadagno di oltre 16 punti colloca Mythos Preview in una categoria a parte per i compiti di sicurezza offensiva e difensiva.

Impegno finanziario e governance

Anthropic si impegna per 100 milioni di dollari in crediti di utilizzo per i partner del progetto, accompagnati da 4 milioni di dollari in donazioni dirette a organizzazioni di sicurezza open source:

  • 2,5 M$ ad Alpha-Omega e a OpenSSF tramite la Linux Foundation
  • 1,5 M$ alla Apache Software Foundation

Questo livello di impegno finanziario segnala che Anthropic posiziona Glasswing come un’iniziativa di lungo termine, non come una semplice partnership di comunicazione. Il rapporto sulle vulnerabilità corrette sarà pubblicato entro 90 giorni.

Disponibilità e pricing

Mythos Preview non viene reso disponibile pubblicamente nell’immediato. Una volta terminata la fase iniziale di crediti, il modello sarà accessibile ai partecipanti al prezzo di 25 /125/125 per milione di token (input/output), tramite l’API Claude, Amazon Bedrock, Google Cloud Vertex AI e Microsoft Foundry.

Un rapporto tecnico dettagliato sulle vulnerabilità e gli exploit scoperti è disponibile sul blog Red Team di Anthropic, e la system card completa è pubblicata su anthropic.com.

“This project represents a watershed moment for AI-assisted cybersecurity — not because of what Claude can do today, but because of what it will be able to do as capabilities continue to scale.”

🇮🇹 Questo progetto rappresenta un momento cruciale per la cybersicurezza assistita dall’IA — non per ciò che Claude può fare oggi, ma per ciò che sarà in grado di fare man mano che le capacità continueranno a scalare. — Annuncio ufficiale Anthropic

🔗 Project Glasswing · System Card Mythos Preview · Rapporto Red Team


Meta Muse Spark : ritorno di Meta con un modello chiuso

8 aprile 2026 — Meta ha annunciato Muse Spark, il primo modello della nuova famiglia “Muse”, sviluppato da Meta Superintelligence Labs (MSL) — una nuova entità interna dedicata alla ricerca in IA avanzata. È il primo modello di Meta da Llama 4 nell’aprile 2025, cioè un anno di silenzio, e soprattutto il primo modello Meta non disponibile in open-weights.

Capacità e posizionamento

Muse Spark è posizionato come un passo verso la “superintelligenza personale” (personal superintelligence). Il modello copre diversi ambiti con capacità avanzate:

AmbitoDescrizione
MultimodalePercezione e comprensione visiva avanzata, integrazione di informazioni visive incrociate
RagionamentoRagionamento passo dopo passo, pensare prima di rispondere (test-time reasoning)
SaluteAnalisi di immagini mediche, raccomandazioni alimentari personalizzate
AgenticoCapacità agentiche per compiti complessi
Contemplating modeOrchestrazione di più agenti che ragionano in parallelo (rilascio progressivo)

Il modello integra la “compressione del pensiero” (thought compression) per ottimizzare i token di ragionamento, e supporta il test-time scaling tramite più agenti paralleli. La modalità Contemplating, ancora in rilascio progressivo, è una delle funzionalità più attese: consente di assegnare più agenti allo stesso problema in parallelo, ciascuno ragionando in modo indipendente prima della sintesi.

Prestazioni

Secondo Artificial Analysis (8 aprile 2026), Muse Spark raggiunge un punteggio di 52 sull’Artificial Analysis Intelligence Index, il che lo colloca nella top 4 mondiale dietro Gemini 3.1 Pro, GPT-5.4 e Claude Opus 4.6. Un ritorno notevole per Meta, che rientra direttamente nella classe dei migliori modelli frontier.

Architettura

Meta descrive tre assi di scaling per Muse Spark:

  1. Pretraining: rifacimento completo dello stack in nove mesi, con miglioramenti di architettura e dati
  2. Apprendimento per rinforzo (Reinforcement Learning): amplificazione scalabile delle capacità post-pretraining
  3. Test-time reasoning: ragionamento esteso senza aumento di latenza grazie alla parallelizzazione degli agenti

Sicurezza e disponibilità

Meta indica di aver condotto valutazioni approfondite tramite il suo Advanced AI Scaling Framework v2. Apollo Research ha effettuato valutazioni di terze parti su un checkpoint pre-lancio e ha riscontrato comportamenti di rifiuto solidi nei domini ad alto rischio (biologia, ecc.).

Muse Spark è disponibile dall’8 aprile su meta.ai e nell’app Meta AI. L’accesso API è in private preview per partner selezionati — nessun accesso pubblico immediato.

🔗 Blog Meta AI — Muse Spark · Tweet annuncio · Benchmark Artificial Analysis


Anthropic : infrastruttura e agenti

Partnership Google + Broadcom — diversi gigawatt di TPU già dal 2027

6 aprile 2026 — Anthropic ha annunciato un accordo con Google e Broadcom riguardante diversi gigawatt di capacità di calcolo TPU di nuova generazione, che entrerà in servizio a partire dal 2027. Si tratta del più importante impegno infrastrutturale nella storia di Anthropic.

Il contesto di crescita è significativo:

  • Il fatturato annualizzato (run-rate revenue) supera ormai i 30 miliardi di dollari, contro circa 9 miliardi a fine 2025
  • Oltre 1.000 clienti professionali spendono ciascuno più di un milione di dollari all’anno, contro oltre 500 a febbraio 2026 — cioè un raddoppio in meno di due mesi

“This groundbreaking partnership with Google and Broadcom is a continuation of our disciplined approach to scaling infrastructure: we are building the capacity necessary to serve the exponential growth we have seen in our customer base while also enabling Claude to define the frontier of AI development.”

🇮🇹 Questa partnership innovativa con Google e Broadcom è la continuazione del nostro approccio rigoroso alla scalabilità dell’infrastruttura: stiamo costruendo la capacità necessaria per servire la crescita esponenziale che abbiamo osservato nella nostra base clienti, consentendo allo stesso tempo a Claude di definire la frontiera dello sviluppo dell’IA. — Krishna Rao, CFO di Anthropic

La maggior parte del nuovo calcolo sarà installata negli Stati Uniti, in continuità con l’impegno di novembre 2025 di investire 50 miliardi di dollari nell’infrastruttura americana. Claude resta l’unico modello frontier disponibile sulle tre grandi piattaforme cloud: AWS Bedrock, Google Cloud Vertex AI e Microsoft Azure Foundry.

🔗 Annuncio partnership

Managed Agents — architettura disaccoppiata, latenza ridotta del 90 %

8 aprile 2026 — L’Engineering Blog di Anthropic ha pubblicato un articolo tecnico che dettaglia l’architettura di Managed Agents, il servizio ospitato per eseguire agenti long-running sulla piattaforma Claude.

L’idea centrale è il disaccoppiamento del cervello (Claude e il suo harness) dalle mani (sandbox di esecuzione, strumenti) e dalla sessione (registro eventi). Ogni componente diventa un’interfaccia indipendente, sostituibile e scalabile separatamente.

Risultati misurati del disaccoppiamento:

MetricaMiglioramento
p50 TTFT (tempo al primo token)-60 %
p95 TTFT-90 %

Il disaccoppiamento risolve anche due problemi di sicurezza: l’isolamento delle credenziali (i token OAuth non sono mai accessibili dalla sandbox di esecuzione del codice) e la resilienza (se l’harness si interrompe, uno nuovo riparte dall’ultimo evento di sessione senza perdita di contesto).

🔗 Scaling Managed Agents


Google Gemini

Gemini CLI v0.37.0 — Sandbox dinamico, Chapters e Browser persistente

8 aprile 2026 — La versione v0.37.0 di Gemini CLI introduce tre evoluzioni per i workflow degli sviluppatori:

FunzionalitàDescrizione
Dynamic Sandbox ExpansionEstensione dinamica del sandbox + supporto worktree per Linux e Windows
Chapters (Narrative Flow)Raggruppamento tematico degli strumenti in “capitoli” per una migliore struttura della sessione
Advanced Browser CapabilitiesSessioni browser persistenti e scoperta dinamica di strumenti nel browser agent

La funzionalità Chapters apporta una continuità narrativa alle sessioni lunghe: ogni gruppo di azioni forma un “capitolo” con una propria logica, facilitando il follow-up e la ripresa di una sessione complessa. Il browser agent guadagna in persistenza — le sessioni rimangono attive tra le chiamate, e gli strumenti disponibili vengono scoperti dinamicamente.

🔗 Changelog Gemini CLI

Simulazioni interattive e modelli 3D in Gemini App

9 aprile 2026 — Gemini App può ora trasformare concetti complessi in visualizzazioni interattive direttamente nella chat. Un utente può regolare parametri fisici in tempo reale (velocità, gravità, massa) e vedere l’effetto su una simulazione funzionante — orbita lunare, rotazione delle molecole, sistemi dinamici. Disponibile a livello globale con il modello Pro nella barra del prompt. Non disponibile nell’immediato per gli account Education e Workspace.

🔗 Simulazioni 3D in Gemini App

Notebooks Gemini — sincronizzazione con NotebookLM

8 aprile 2026 — Google lancia i Notebooks in Gemini App: spazi di lavoro persistenti che sincronizzano Gemini App e NotebookLM per i progetti complessi. I notebooks consentono di organizzare conversazioni, istruzioni personalizzate e file (documenti, PDF). Una fonte aggiunta in Gemini App appare automaticamente in NotebookLM, e viceversa. Disponibile questa settimana per gli abbonati Google AI Ultra, Pro e Plus sul web. Mobile e accesso gratuito in arrivo.

🔗 Notebooks Gemini + NotebookLM


OpenAI

Nuovo livello Pro a 100 $/mese — 5x più Codex

9 aprile 2026 — OpenAI introduce un nuovo livello Pro a **100 /mese,posizionatotraillivelloPlus( 20/mese**, posizionato tra il livello Plus (~20 /mese) e il Pro esistente a 200 $/mese. Offre cinque volte più utilizzo Codex rispetto al livello Plus, pensato per sessioni lunghe e intensive.

LivelloPrezzoUso Codex
Plus~20 $/meseStandard
Pro (nuovo)100 $/mese5× Plus
Pro (esistente)200 $/meseMassimo

In parallelo, OpenAI estende la promozione 2x uso Codex per gli abbonati esistenti a 200 $/mese fino al 31 maggio 2026 e reimposta i loro limiti di throughput.

”Next phase of enterprise AI” — nota di Denise Dresser

8 aprile 2026 — La Chief Revenue Officer Denise Dresser pubblica una sintesi dopo i suoi primi 90 giorni. Punti chiave: l’attività enterprise rappresenta ormai oltre il 40 % del fatturato (sulla traiettoria verso la parità con il grande pubblico entro fine 2026), Codex supera i 3 milioni di utenti settimanali (+5x dall’inizio del 2026), e ChatGPT conta 900 milioni di utenti settimanali. OpenAI presenta due assi strategici: OpenAI Frontier (agenti che attraversano i sistemi aziendali) e una superapp IA unificata per i team.

🔗 Next phase of enterprise AI

Safety Fellowship e Child Safety Blueprint

6-8 aprile 2026 — OpenAI annuncia due iniziative di sicurezza. L’OpenAI Safety Fellowship (6 apr.) è un programma di ricerca esterno aperto fino al 3 maggio 2026, retribuito con risorse di calcolo, per lavori su valutazione, robustezza e supervisione agentica — calendario: 14 settembre 2026 al 5 febbraio 2027. Il Child Safety Blueprint (8 apr.) propone un quadro di lotta contro lo sfruttamento dei bambini tramite IA, co-sviluppato con NCMEC, Thorn e l’Attorney General Alliance, articolato attorno a tre assi: modernizzare le leggi sui contenuti CSAM generati da IA, migliorare la segnalazione e integrare la sicurezza fin dalla progettazione (safety-by-design).

🔗 Safety Fellowship · Child Safety Blueprint


GitHub Copilot

Scan di sicurezza OWASP Top 10 dal terminale 9 aprile 2026 — GitHub Copilot CLI integra un workflow di sicurezza automatizzato direttamente dal terminale. In pochi comandi, gli sviluppatori possono eseguire una scansione completa sul proprio repository, mappare i risultati alle categorie OWASP Top 10 e aprire automaticamente issue GitHub per ogni vulnerabilità rilevata — senza uscire dall’ambiente CLI. Un complemento diretto a Project Glasswing per i team che già utilizzano gli strumenti GitHub.

Agente “Rubber Duck” — review automatica

8 aprile 2026 — Il team GitHub Research pubblica un agente “Rubber Duck” per Copilot CLI. Ispirato alla classica tecnica di debugging (spiegare ad alta voce il proprio codice per individuare i problemi), l’agente analizza automaticamente il codice inviato e formula una review strutturata direttamente nel terminale. Sperimentale ma ufficialmente ripubblicato da @github.

🔗 Tweet Copilot CLI OWASP · Tweet dell’agente Rubber Duck


Perplexity

Integrazione Plaid — finanze personali in Perplexity Computer

9 aprile 2026 — Perplexity lancia un’integrazione con Plaid, che permette agli utenti di collegare conti bancari, carte di credito e prestiti direttamente in Perplexity Computer. L’accesso è in sola lettura — i dati non transitano dai server di Perplexity. La rete Plaid copre oltre 12.000 istituzioni (Chase, Fidelity, Vanguard, Robinhood, ecc.). Casi d’uso: calcolo del patrimonio netto, monitoraggio del budget, pianificatore di rimborso dei debiti, proiezione pensionistica. Disponibile su desktop negli Stati Uniti e in Canada.

TierFunzionalità
StandardCollegare il portafoglio, accesso base a Portfolio
Pro / MaxAnalisi avanzate, dashboard interattive

Billion Dollar Build — competizione startup

8 aprile 2026 — Perplexity lancia il “Billion Dollar Build”, una competizione di 8 settimane in cui team utilizzano Perplexity Computer per costruire un’azienda con una traiettoria verso 1 miliardo di dollari di valutazione. Premi per i finalisti: fino a 1 milione di dollari di investimento dal Perplexity Fund + fino a 1 milione di dollari in crediti Computer.

🔗 Blog sull’integrazione Plaid · Tweet Billion Dollar Build


Agenti e strumenti

Manus si integra in Slack — tre modalità

6 aprile 2026 — Manus (ora affiliato a Meta) lancia una suite completa di integrazioni Slack articolata attorno a tre modalità: un agente in DM con memoria persistente per le attività personali, una menzione @manus nei canali di team per le attività collettive (senza memoria persistente — ogni thread è una nuova attività), e un connettore MCP per automatizzare report e riepiloghi a tuo nome da manus.im. Disponibile su piano Slack a pagamento.

🔗 Blog Manus per Slack

Genspark AI Workspace 4.0 — Claw Desktop, plugin Office

8 aprile 2026 — Genspark lancia la versione 4.0 del suo spazio di lavoro IA con quattro componenti: Claw for Desktop (Computer Use e Browser Use per controllare il computer), plugin Microsoft Office per PowerPoint, Excel e Word, Speakly (traduzione in tempo reale e presa di appunti in riunione) e Advanced Workflows su un nuovo motore OpenCode.

🔗 Blog Genspark


Media generativi e hardware

Stability AI Brand Studio — piattaforma creativa per i brand

8 aprile 2026 — Stability AI lancia Brand Studio, una piattaforma di produzione creativa completa pensata per i team marketing delle aziende. Il cuore del sistema si basa sul Brand Central Hub: modelli Brand ID addestrati sugli elementi visivi di un brand (stile fotografico, palette, motivi, posizionamento del logo). La Producer Mode converte una descrizione in un piano di produzione strutturato ed esegue automaticamente passo dopo passo. Il Curated Model Routing seleziona in modo intelligente il modello più adatto tra le offerte Stability AI e quelle di terze parti (tra cui Seedream e Nano Banana). Sul fronte enterprise: SSO, controlli di accesso basati sui ruoli, workflow di approvazione. Partner di lancio: l’agenzia creativa Huge. Disponibilità: piano Core (prova gratuita) + piano Enterprise.

🔗 Brand Studio di Stability AI

NVIDIA — Settimana Nazionale della Robotica

9 aprile 2026 — In occasione della Settimana Nazionale della Robotica, NVIDIA pubblica un articolo-risorsa sulle sue tecnologie Physical AI: NVIDIA Cosmos (modelli foundation world), Isaac Sim (simulazione), gamma Jetson (edge AI), Nemotron e NemoClaw (open source). Nessuna nuova annuncio hardware — una sintesi didattica dell’ecosistema robotico NVIDIA per gli sviluppatori.

🔗 Settimana della Robotica NVIDIA


Claude Code — aggiornamenti v2.1.94 / v2.1.96 / v2.1.97

Tre nuove versioni pubblicate durante la settimana.

VersioneDataPunti chiave
v2.1.945-6 apr.Supporto Bedrock powered by Mantle, sforzo predefinito high per API-key/Bedrock/Enterprise, visualizzazione compatta dei link Slack MCP
v2.1.967 apr.Correzione regressione Bedrock: errore 403 "Authorization header is missing" con AWS_BEARER_TOKEN_BEDROCK
v2.1.978-9 apr.Toggle vista focus Ctrl+O in modalità NO_FLICKER, parametro refreshInterval della barra di stato, indicatore ● N running in /agents, colorazione sintattica Cedar

La v2.1.94 introduce anche un cambiamento comportamentale significativo: i plugin skills dichiarati tramite "skills": ["./"] utilizzano ora il campo name del frontmatter invece del nome della cartella. La v2.1.97 corregge diversi problemi di permessi Bash (prefissi delle variabili d’ambiente, redirezioni di rete) e un bug per cui regole di permesso il cui nome corrispondeva a una proprietà prototype JavaScript (toString, ecc.) venivano ignorate silenziosamente in settings.json.

🔗 CHANGELOG di Claude Code


Cosa significa

La settimana dal 5 al 9 aprile 2026 segna un’accelerazione in due direzioni che si incrociano. Da un lato, Anthropic esce da una logica di prodotto consumer per entrare in una logica di infrastruttura critica: Project Glasswing e la partnership Google/Broadcom segnalano che Anthropic si posiziona come fornitore di capacità IA a livello dell’ecosistema tech globale, e non solo come concorrente nella corsa ai benchmark. L’impegno di 100 milioni di dollari in crediti e 30 miliardi di dollari di ricavi annualizzati consolida questa lettura.

Dall’altro lato, Meta torna in scena con Muse Spark rompendo con la sua politica open-weights. È un cambiamento strategico significativo: Meta sceglie di competere nel segmento frontier chiuso invece di mantenere il proprio posizionamento open source. La creazione di Meta Superintelligence Labs e il primo modello non Llama segnalano una profonda riconfigurazione della strategia IA del gruppo.

Per gli sviluppatori, la settimana è densa ma coerente: Gemini CLI guadagna in persistenza e struttura, GitHub Copilot estende il proprio perimetro di sicurezza, Perplexity spinge verso i dati personali e Claude Code continua il suo ciclo di aggiornamenti rapidi.


Fonti

Questo documento è stato tradotto dalla versione fr alla lingua it utilizzando il modello gpt-5.4-mini. Per ulteriori informazioni sul processo di traduzione, consulta https://gitlab.com/jls42/ai-powered-markdown-translator