Tydzień od 5 do 9 kwietnia 2026 był zdominowany przez dwa duże ogłoszenia: Anthropic zaprezentowało Project Glasswing, koalicję jedenastu dużych firm technologicznych wokół Claude Mythos Preview do wykrywania podatności zero-day na dużą skalę, podczas gdy Meta wróciła z Muse Spark, swoim pierwszym modelem bez open-weights od roku. Równolegle Google, OpenAI, GitHub i Perplexity opublikowały istotne aktualizacje dla swoich deweloperów i użytkowników.
Project Glasswing i Claude Mythos Preview
7 kwietnia 2026 — Anthropic ogłosiło Project Glasswing, inicjatywę bezpieczeństwa oprogramowania skupiającą jedenaście organizacji: Amazon Web Services, Apple, Broadcom, Cisco, CrowdStrike, Google, JPMorganChase, The Linux Foundation, Microsoft, NVIDIA i Palo Alto Networks. Inicjatywa opiera się na możliwościach nowego modelu frontier o ograniczonym dostępie: Claude Mythos Preview.
Co robi Mythos Preview
Model wykazał zdolność identyfikowania tysięcy podatności zero-day w głównych systemach operacyjnych i przeglądarkach internetowych, w tym takich, które pozostawały niewykryte przez dziesięciolecia. Trzy konkretne przykłady ilustrują skalę odkryć:
- Luka sprzed 27 lat w OpenBSD, pozwalająca zdalnie zawiesić dowolną podłączoną maszynę
- Podatność sprzed 16 lat w FFmpeg, ukryta w jednej linii kodu testowanej ponad pięć milionów razy bez wykrycia
- Kilka luk w jądrze Linux umożliwiających eskalację uprawnień aż do pełnej kontroli nad maszyną
Te przykłady pokazują, że Mythos Preview nie ogranicza się do wykrywania powierzchownych problemów — odnajduje błędy logiczne ukryte w krytycznych bazach kodu, od lat nieustannie audytowanych przez tysiące badaczy.
Benchmarki
Wyniki Mythos Preview na benchmarkach referencyjnych pokazują wyraźny postęp względem Opus 4.6:
| Benchmark | Mythos Preview | Opus 4.6 |
|---|---|---|
| SWE-bench Verified | 93,9 % | 80,8 % |
| SWE-bench Pro | 77,8 % | 53,4 % |
| Terminal-Bench 2.0 | 82,0 % | 65,4 % |
| SWE-bench Multilingual | 87,3 % | 77,8 % |
| CyberGym (cyberbezpieczeństwo) | 83,1 % | 66,6 % |
| GPQA Diamond | 94,6 % | 91,3 % |
| Humanity’s Last Exam (bez narzędzi) | 56,8 % | 40,0 % |
Skok na SWE-bench Verified — z 80,8 % do 93,9 % — jest szczególnie istotny: to najczęściej używany benchmark do mierzenia zdolności modelu do rozwiązywania rzeczywistych błędów w prawdziwych repozytoriach open source. W CyberGym, poświęconym cyberbezpieczeństwu, wzrost o ponad 16 punktów stawia Mythos Preview w osobnej kategorii dla zadań bezpieczeństwa ofensywnego i defensywnego.
Zaangażowanie finansowe i zarządzanie
Anthropic zobowiązuje się do przekazania 100 milionów dolarów w kredytach użycia dla partnerów projektu, wraz z 4 milionami dolarów w bezpośrednich darowiznach dla organizacji bezpieczeństwa open source:
- 2,5 mln $ dla Alpha-Omega i OpenSSF za pośrednictwem Linux Foundation
- 1,5 mln $ dla Apache Software Foundation
Ten poziom zaangażowania finansowego pokazuje, że Anthropic traktuje Glasswing jako inicjatywę długoterminową, a nie zwykłe partnerstwo wizerunkowe. Raport o naprawionych podatnościach zostanie opublikowany w ciągu 90 dni.
Dostępność i ceny
Mythos Preview nie jest od razu publicznie udostępniony. Po wyczerpaniu początkowej puli kredytów model będzie dostępny dla uczestników w cenie 25 za milion tokenów (wejście/wyjście), przez API Claude, Amazon Bedrock, Google Cloud Vertex AI i Microsoft Foundry.
Szczegółowy raport techniczny o odkrytych podatnościach i exploitach jest dostępny na blogu Red Team Anthropic, a pełna system card została opublikowana na anthropic.com.
“This project represents a watershed moment for AI-assisted cybersecurity — not because of what Claude can do today, but because of what it will be able to do as capabilities continue to scale.”
🇵🇱 Ten projekt stanowi przełomowy moment dla cyberbezpieczeństwa wspieranego przez AI — nie ze względu na to, co Claude potrafi dziś, lecz ze względu na to, do czego będzie zdolny, gdy możliwości będą nadal się skalować. — Oficjalne ogłoszenie Anthropic
🔗 Project Glasswing · System Card Mythos Preview · Raport Red Team
Meta Muse Spark: powrót Meta z zamkniętym modelem
8 kwietnia 2026 — Meta ogłosiła Muse Spark, pierwszy model nowej rodziny “Muse”, opracowany przez Meta Superintelligence Labs (MSL) — nowy wewnętrzny podmiot zajmujący się badaniami nad zaawansowaną AI. To pierwszy model Meta od czasu Llama 4 w kwietniu 2025, czyli po roku ciszy, a przede wszystkim pierwszy model Meta niedostępny w open-weights.
Możliwości i pozycjonowanie
Muse Spark jest pozycjonowany jako krok w stronę “personal superintelligence” (personal superintelligence). Model obejmuje kilka obszarów z zaawansowanymi możliwościami:
| Obszar | Opis |
|---|---|
| Multimodalny | Zaawansowana percepcja i rozumienie wizualne, integracja informacji wizualnych z różnych źródeł |
| Rozumowanie | Rozumowanie krok po kroku, myślenie przed odpowiedzią (test-time reasoning) |
| Zdrowie | Analiza obrazów medycznych, spersonalizowane rekomendacje żywieniowe |
| Agentyczne | Możliwości agentowe do złożonych zadań |
| Contemplating mode | Orkiestracja wielu agentów rozumujących równolegle (wdrażanie stopniowe) |
Model integruje “compression of thought” (thought compression) w celu optymalizacji tokenów rozumowania i obsługuje test-time scaling poprzez wielu równoległych agentów. Tryb Contemplating, nadal we wdrażaniu stopniowym, jest jedną z najbardziej oczekiwanych funkcji: pozwala przydzielić kilku agentów do tego samego problemu równolegle, z których każdy rozumuje niezależnie przed syntezą.
Wyniki
Według Artificial Analysis (8 kwietnia 2026), Muse Spark osiąga wynik 52 w Artificial Analysis Intelligence Index, co plasuje go w globalnej czołówce 4 za Gemini 3.1 Pro, GPT-5.4 i Claude Opus 4.6. To zauważony powrót Meta, która wraca bezpośrednio do grona najlepszych modeli frontier.
Architektura
Meta opisuje trzy osie skalowania dla Muse Spark:
- Pretraining: całkowita przebudowa stacku w ciągu dziewięciu miesięcy, z ulepszeniami architektury i danych
- Reinforcement Learning: skalowalne wzmacnianie możliwości po pretrainingu
- Test-time reasoning: rozszerzone rozumowanie bez zwiększania latencji dzięki równoległości agentów
Bezpieczeństwo i dostępność
Meta informuje, że przeprowadziła rozbudowane ewaluacje za pomocą swojego Advanced AI Scaling Framework v2. Apollo Research wykonało niezależne ewaluacje na checkpointcie przedpremierowym i stwierdziło solidne zachowania odmowy w obszarach wysokiego ryzyka (biologia itp.).
Muse Spark jest dostępny od 8 kwietnia na meta.ai oraz w aplikacji Meta AI. Dostęp API jest w prywatnym preview dla wybranych partnerów — brak natychmiastowego publicznego dostępu.
🔗 Blog Meta AI — Muse Spark · Tweet ogłaszający · Benchmark Artificial Analysis
Anthropic: infrastruktura i agenci
Partnerstwo Google + Broadcom — wiele gigawatów TPU od 2027
6 kwietnia 2026 — Anthropic ogłosiło umowę z Google i Broadcom dotyczącą wielu gigawatów nowej generacji mocy obliczeniowej TPU, która ma wejść do użytku od 2027 roku. To największe zobowiązanie infrastrukturalne w historii Anthropic.
Kontekst wzrostu jest znaczący:
- Roczny przychód w ujęciu run-rate (run-rate revenue) przekracza obecnie 30 miliardów dolarów, wobec około 9 miliardów pod koniec 2025
- Ponad 1 000 klientów biznesowych wydaje każdy ponad milion dolarów rocznie, wobec 500+ w lutym 2026 — czyli podwojenie w mniej niż dwa miesiące
“This groundbreaking partnership with Google and Broadcom is a continuation of our disciplined approach to scaling infrastructure: we are building the capacity necessary to serve the exponential growth we have seen in our customer base while also enabling Claude to define the frontier of AI development.”
🇵🇱 To przełomowe partnerstwo z Google i Broadcom jest kontynuacją naszego zdyscyplinowanego podejścia do skalowania infrastruktury: budujemy możliwości niezbędne do obsłużenia wykładniczego wzrostu, jaki obserwujemy w naszej bazie klientów, jednocześnie umożliwiając Claude wyznaczanie granicy rozwoju AI. — Krishna Rao, CFO Anthropic
Większość nowej mocy obliczeniowej zostanie zainstalowana w Stanach Zjednoczonych, zgodnie z listopadowym zobowiązaniem z 2025 roku do zainwestowania 50 miliardów dolarów w amerykańską infrastrukturę. Claude pozostaje jedynym modelem frontier dostępnym na trzech głównych platformach chmurowych: AWS Bedrock, Google Cloud Vertex AI i Microsoft Azure Foundry.
Managed Agents — architektura rozdzielona, latencja mniejsza o 90 %
8 kwietnia 2026 — Engineering Blog Anthropic opublikował artykuł techniczny opisujący architekturę Managed Agents, hostowanej usługi do uruchamiania long-running agentów na platformie Claude.
Centralna idea polega na rozdzieleniu mózgu (Claude i jego harness) od rąk (sandbox wykonawczy, narzędzia) oraz od sesji (dziennik zdarzeń). Każdy komponent staje się niezależnym interfejsem, możliwym do wymiany i skalowania osobno.
Zmierzona poprawa po rozdzieleniu:
| Metryka | Poprawa |
|---|---|
| p50 TTFT (czas do pierwszego tokenu) | -60 % |
| p95 TTFT | -90 % |
Rozdzielenie rozwiązuje także dwa problemy bezpieczeństwa: izolację credentials (tokeny OAuth nigdy nie są dostępne z sandboxu wykonawczego kodu) oraz odporność (jeśli harness ulegnie awarii, nowy uruchamia się od ostatniego wydarzenia sesji bez utraty kontekstu).
Google Gemini
Gemini CLI v0.37.0 — Dynamic Sandbox, Chapters i persistent browser
8 kwietnia 2026 — Wersja v0.37.0 Gemini CLI wprowadza trzy usprawnienia dla workflow deweloperskich:
| Funkcja | Opis |
|---|---|
| Dynamic Sandbox Expansion | Dynamiczne rozszerzanie sandbox + obsługa worktree dla Linux i Windows |
| Chapters (Narrative Flow) | Tematyczne grupowanie narzędzi w “rozdziały” dla lepszej struktury sesji |
| Advanced Browser Capabilities | Trwałe sesje przeglądarki i dynamiczne wykrywanie narzędzi w browser agent |
Funkcja Chapters nadaje długim sesjom narracyjną ciągłość: każda grupa działań tworzy “rozdział” z własną logiką, co ułatwia śledzenie i wznawianie złożonej sesji. Browser agent zyskuje trwałość — sesje pozostają aktywne między wywołaniami, a dostępne narzędzia są wykrywane dynamicznie.
Interaktywne symulacje i modele 3D w Gemini App
9 kwietnia 2026 — Gemini App potrafi teraz przekształcać złożone koncepcje w interaktywne wizualizacje bezpośrednio w czacie. Użytkownik może regulować parametry fizyczne w czasie rzeczywistym (prędkość, grawitacja, masa) i obserwować efekt w działającej symulacji — orbita Księżyca, rotacja cząsteczek, systemy dynamiczne. Dostępne globalnie z modelem Pro w pasku promptu. Tymczasowo niedostępne dla kont Education i Workspace.
Notebooks Gemini — synchronizacja z NotebookLM
8 kwietnia 2026 — Google uruchamia Notebooks w Gemini App: trwałe przestrzenie robocze synchronizujące Gemini App i NotebookLM dla złożonych projektów. Notebooks pozwalają organizować rozmowy, niestandardowe instrukcje i pliki (dokumenty, PDF). Źródło dodane w Gemini App pojawia się automatycznie w NotebookLM i odwrotnie. Dostępne w tym tygodniu dla subskrybentów Google AI Ultra, Pro i Plus w wersji web. Mobile i dostęp bezpłatny wkrótce.
🔗 Notebooks Gemini + NotebookLM
OpenAI
Nowy próg Pro za 100 $/mies. — 5x więcej Codex
9 kwietnia 2026 — OpenAI wprowadza nowy próg Pro za **100 /mies.) a istniejącym Pro za 200 $/mies. Oferuje pięć razy więcej użycia Codex niż próg Plus, zaprojektowany dla długich i intensywnych sesji.
| Próg | Cena | Użycie Codex |
|---|---|---|
| Plus | ~20 $/mies. | Standardowe |
| Pro (nowy) | 100 $/mies. | 5× Plus |
| Pro (istniejący) | 200 $/mies. | Maksymalne |
Równolegle OpenAI przedłuża promocję 2x użycia Codex dla obecnych subskrybentów płacących 200 $/mies. do 31 maja 2026 i resetuje ich limity przepustowości.
”Next phase of enterprise AI” — nota Denise Dresser
8 kwietnia 2026 — Chief Revenue Officer Denise Dresser publikuje podsumowanie po swoich pierwszych 90 dniach. Kluczowe punkty: działalność enterprise odpowiada teraz za ponad 40 % przychodów (na ścieżce do parytetu z rynkiem konsumenckim pod koniec 2026), Codex przekracza 3 miliony użytkowników tygodniowo (+5x od początku 2026), a ChatGPT ma 900 milionów użytkowników tygodniowo. OpenAI przedstawia dwa strategiczne kierunki: OpenAI Frontier (agenci przechodzący przez systemy enterprise) oraz zunifikowaną AI superapp dla zespołów.
Safety Fellowship i Child Safety Blueprint
6-8 kwietnia 2026 — OpenAI ogłasza dwie inicjatywy bezpieczeństwa. OpenAI Safety Fellowship (6 kwi.) to zewnętrzny program badawczy otwarty do 3 maja 2026, wynagradzany zasobami obliczeniowymi, dla prac nad ewaluacją, odpornością i nadzorem agentowym — harmonogram: 14 września 2026 do 5 lutego 2027. Child Safety Blueprint (8 kwi.) proponuje ramy walki z wykorzystywaniem dzieci przez AI, współtworzone z NCMEC, Thorn i Attorney General Alliance, oparte na trzech filarach: modernizacji przepisów dotyczących treści CSAM generowanych przez AI, usprawnieniu zgłaszania oraz wbudowaniu bezpieczeństwa od projektu (safety-by-design).
🔗 Safety Fellowship · Child Safety Blueprint
GitHub Copilot
Skan bezpieczeństwa OWASP Top 10 z terminala 9 kwietnia 2026 — GitHub Copilot CLI integruje zautomatyzowany workflow bezpieczeństwa bezpośrednio z terminala. W kilku komendach deweloperzy mogą uruchomić pełny skan swojego repozytorium, przypisać wyniki do kategorii OWASP Top 10 i automatycznie otworzyć issues GitHub dla każdej wykrytej luki — bez opuszczania środowiska CLI. Bezpośrednie uzupełnienie Project Glasswing dla zespołów, które już korzystają z narzędzi GitHub.
Agent “Rubber Duck” — automatyczny review
8 kwietnia 2026 — Zespół GitHub Research publikuje agenta “Rubber Duck” dla Copilot CLI. Zainspirowany klasyczną techniką debugowania (tłumaczenie kodu na głos, aby znaleźć problemy), agent automatycznie analizuje przesłany kod i formułuje ustrukturyzowany review bezpośrednio w terminalu. Eksperymentalny, ale oficjalnie repostowany przez @github.
🔗 Tweet Copilot CLI OWASP · Tweet agenta Rubber Duck
Perplexity
Integracja Plaid — finanse osobiste w Perplexity Computer
9 kwietnia 2026 — Perplexity uruchamia integrację z Plaid, umożliwiając użytkownikom połączenie kont bankowych, kart kredytowych i pożyczek bezpośrednio w Perplexity Computer. Dostęp jest w trybie tylko do odczytu — dane nie przechodzą przez serwery Perplexity. Sieć Plaid obejmuje ponad 12 000 instytucji (Chase, Fidelity, Vanguard, Robinhood itd.). Przypadki użycia: obliczanie majątku netto, śledzenie budżetu, planista spłaty długów, prognoza emerytalna. Dostępne na komputerach w Stanach Zjednoczonych i Kanadzie.
| Poziom | Funkcje |
|---|---|
| Standard | Połączenie portfela, podstawowy dostęp do Portfolio |
| Pro / Max | Zaawansowane analizy, interaktywne pulpity nawigacyjne |
Billion Dollar Build — konkurs dla startupów
8 kwietnia 2026 — Perplexity uruchamia “Billion Dollar Build”, 8-tygodniowy konkurs, w którym zespoły używają Perplexity Computer do zbudowania firmy z trajektorią do 1 miliarda dolarów wyceny. Nagrody dla finalistów: do 1 miliona dolarów inwestycji z Perplexity Fund + do 1 miliona dolarów w kredytach Computer.
🔗 Blog o integracji Plaid · Tweet Billion Dollar Build
Agenci i narzędzia
Manus integruje się ze Slackiem — trzy tryby
6 kwietnia 2026 — Manus (obecnie powiązany z Meta) uruchamia pełen zestaw integracji Slack oparty na trzech trybach: agent w DM z trwałą pamięcią do zadań osobistych, wzmianka @manus na kanałach zespołowych do zadań zbiorowych (bez trwałej pamięci — każdy wątek to nowe zadanie) oraz łącznik MCP do automatyzowania raportów i podsumowań w Twoim imieniu z poziomu manus.im. Dostępne w płatnym planie Slacka.
Genspark AI Workspace 4.0 — Claw Desktop, pluginy Office
8 kwietnia 2026 — Genspark uruchamia wersję 4.0 swojego środowiska pracy AI z czterema komponentami: Claw for Desktop (Computer Use i Browser Use do sterowania komputerem), pluginy Microsoft Office dla PowerPoint, Excel i Word, Speakly (tłumaczenie w czasie rzeczywistym i notatki ze spotkań) oraz Advanced Workflows na nowym silniku OpenCode.
Media generatywne i hardware
Stability AI Brand Studio — platforma kreatywna dla marek
8 kwietnia 2026 — Stability AI uruchamia Brand Studio, kompleksową platformę produkcji kreatywnej zaprojektowaną dla zespołów marketingowych w firmach. Sercem systemu jest Brand Central Hub: modele Brand ID trenowane na wizualnych elementach marki (styl fotograficzny, paleta, wzory, umiejscowienie logo). Producer Mode przekształca opis w ustrukturyzowany plan produkcji i wykonuje go automatycznie krok po kroku. Curated Model Routing inteligentnie wybiera najbardziej odpowiedni model spośród ofert Stability AI i firm trzecich (w tym Seedream i Nano Banana). Po stronie enterprise: SSO, kontrola dostępu oparta na rolach, workflowy akceptacji. Partner startowy: agencja kreatywna Huge. Dostępność: plan Core (bezpłatny okres próbny) + plan Enterprise.
🔗 Brand Studio przez Stability AI
NVIDIA — Tydzień Narodowy Robotyki
9 kwietnia 2026 — Z okazji Tygodnia Narodowego Robotyki NVIDIA publikuje artykuł-zasób o swoich technologiach Physical AI: NVIDIA Cosmos (fundamentalne modele świata), Isaac Sim (symulacja), gama Jetson (edge AI), Nemotron i NemoClaw (open source). Bez nowej zapowiedzi hardware — pedagogiczne podsumowanie ekosystemu robotycznego NVIDIA dla deweloperów.
Claude Code — aktualizacje v2.1.94 / v2.1.96 / v2.1.97
W ciągu tygodnia opublikowano trzy nowe wersje.
| Wersja | Data | Kluczowe punkty |
|---|---|---|
| v2.1.94 | 5-6 kwi. | Obsługa Bedrock powered by Mantle, domyślny effort high dla API-key/Bedrock/Enterprise, kompaktowe wyświetlanie linków Slack MCP |
| v2.1.96 | 7 kwi. | Poprawka regresji Bedrock: błąd 403 "Authorization header is missing" z AWS_BEARER_TOKEN_BEDROCK |
| v2.1.97 | 8-9 kwi. | Przełącznik widoku focus Ctrl+O w trybie NO_FLICKER, parametr refreshInterval paska statusu, wskaźnik ● N running w /agents, kolorowanie składni Cedar |
Wersja v2.1.94 wprowadza również istotną zmianę zachowania: pluginy skills deklarowane przez "skills": ["./"] korzystają teraz z pola name frontmatter zamiast nazwy katalogu. Wersja v2.1.97 naprawia kilka problemów z uprawnieniami Bash (prefiksy zmiennych środowiskowych, przekierowania sieciowe) oraz błąd, w którym reguły uprawnień, których nazwa odpowiadała właściwości prototypu JavaScript (toString itd.), były cicho ignorowane w settings.json.
Co to oznacza
Tydzień od 5 do 9 kwietnia 2026 r. oznacza przyspieszenie w dwóch kierunkach, które się przecinają. Z jednej strony Anthropic wychodzi z logiki produktu konsumenckiego i wchodzi w logikę krytycznej infrastruktury: Project Glasswing i partnerstwo Google/Broadcom sygnalizują, że Anthropic pozycjonuje się jako dostawca możliwości AI na poziomie globalnego ekosystemu technologicznego, a nie tylko jako konkurent w wyścigu benchmarków. Zaangażowanie 100 milionów dolarów w kredytach i 30 miliardów dolarów rocznych przychodów potwierdza tę interpretację.
Z drugiej strony Meta wraca z Muse Spark, zrywając ze swoją polityką open-weights. To istotna zmiana strategiczna: Meta wybiera konkurencję w zamkniętym segmencie frontier zamiast utrzymywać pozycjonowanie open source. Utworzenie Meta Superintelligence Labs i pierwszy model spoza rodziny Llama sygnalizują głęboką zmianę strategii AI grupy.
Dla deweloperów tydzień jest gęsty, ale spójny: Gemini CLI zyskuje trwałość i strukturę, GitHub Copilot rozszerza zakres bezpieczeństwa, Perplexity idzie w kierunku danych osobistych, a Claude Code kontynuuje szybki cykl aktualizacji.
Źródła
- Project Glasswing — Anthropic
- Claude Mythos Preview System Card
- Raport Red Team Mythos Preview
- Partnerstwo Google + Broadcom — Anthropic
- Managed Agents Engineering Blog
- CHANGELOG Claude Code
- Tweet Project Glasswing @AnthropicAI
- Introducing Muse Spark — Meta AI
- Tweet Meta Muse Spark
- Benchmark Artificial Analysis — Muse Spark
- Dziennik zmian Gemini CLI v0.37.0
- Aplikacja Gemini: symulacje 3D
- Notatniki Gemini + NotebookLM
- Następny etap AI dla firm — OpenAI
- OpenAI Safety Fellowship
- OpenAI Child Safety Blueprint
- Tweet Copilot CLI OWASP
- Tweet agenta Rubber Duck
- Perplexity + Plaid
- Tweet Billion Dollar Build
- Manus dla Slacka
- Genspark AI Workspace 4.0
- Stability AI Brand Studio
- Tydzień Narodowy Robotyki NVIDIA
Ten dokument został przetłumaczony z wersji fr na język pl przy użyciu modelu gpt-5.4-mini. Aby uzyskać więcej informacji na temat procesu tłumaczenia, odwiedź https://gitlab.com/jls42/ai-powered-markdown-translator