Wiadomości AI 9 stycznia 2026: Constitutional Classifiers++, OpenAI for Healthcare, Scribe v2

W tym tygodniu w AI

Pracowity dzień pełen ważnych ogłoszeń: Anthropic publikuje artykuł badawczy na temat bezpieczeństwa LLM po 1700 godzinach intensywnego red-teamingu. OpenAI uruchamia ofertę enterprise dedykowaną szpitalom ze wsparciem HIPAA. ElevenLabs ujawnia Scribe v2, swój nowy model transkrypcji speech-to-text.

Constitutional Classifiers++: Anthropic wzmacnia bezpieczeństwo

9 stycznia 2026 — Anthropic publikuje nowy ważny artykuł badawczy na temat solidności swoich zabezpieczeń przed jailbreakami.

🔗 Artykuł na arXiv | Wątek na X

Kontekst

W zeszłym roku Anthropic wprowadziło Constitutional Classifiers, system, który trenuje klasyfikatory w oparciu o “konstytucję” określającą, na jakie zapytania Claude powinien, a na jakie nie powinien odpowiadać. Ten system zmniejszył wskaźnik sukcesu jailbreaków z 86% do 4,4%, ale miał dwa problemy: był kosztowny obliczeniowo i miał tendencję do odrzucania uzasadnionych zapytań.

Trzy kluczowe innowacje

Nowy system Constitutional Classifiers++ wprowadza trzy główne ulepszenia:

Innowacja	Opis
Exchange Classifiers	Oceniają odpowiedzi w ich pełnym kontekście konwersacyjnym, korygując podatność poprzednich systemów, które badały wyniki w izolacji
Two-Stage Cascade	Lekkie klasyfikatory filtrują cały ruch, eskalując tylko podejrzane wymiany do potężniejszych klasyfikatorów
Linear Probes	Praktyczne zastosowanie interpretowalności: sondy obserwują wewnętrzne aktywacje Claude’a (“gut instincts”), aby wykrywać podejrzane zapytania

Wyniki

Metryka	Wydajność
Redukcja kosztów	40x w porównaniu do baseline
Compute overhead	Tylko ~1%
Wskaźnik odmów na produkcji	0.05%
Spadek fałszywych odmów	87%
Red-teaming	1700h bez uniwersalnego jailbreaka

After 1,700 cumulative hours of red-teaming, we’ve yet to identify a universal jailbreak (a consistent attack strategy that works across many queries) that works on our new system.

🇵🇱 Po 1700 skumulowanych godzinach red-teamingu nie zidentyfikowaliśmy jeszcze uniwersalnego jailbreaka (spójnej strategii ataku, która działa w wielu zapytaniach), który działałby w naszym nowym systemie. — @AnthropicAI

Dlaczego to ważne

System wykorzystuje wewnętrzne aktywacje Claude’a jako “instynkt”, który trudno oszukać. Gdy sonda wykryje podejrzane zapytanie, wysyła je do potężniejszego klasyfikatora “exchange”, który analizuje obie strony rozmowy. Ta kaskadowa architektura pozwala na solidną ochronę bez zaporowych kosztów obliczeniowych poprzednich generacji.

OpenAI for Healthcare: AI wkracza do szpitali

8 stycznia 2026 — OpenAI uruchamia ofertę enterprise dedykowaną sektorowi opieki zdrowotnej, odrębną od ogłoszonego dzień wcześniej ChatGPT Health.

🔗 Oficjalne ogłoszenie

Różnica względem ChatGPT Health

Produkt	Cel	Fokus
ChatGPT Health	Szeroka publiczność	Osobiste samopoczucie, łączenie aplikacji zdrowotnych
OpenAI for Healthcare	Firmy	Szpitale, kliniki, przepływy pracy klinicznej

ChatGPT for Healthcare

Wersja enterprise ChatGPT zaprojektowana dla organizacji opieki zdrowotnej:

Modele zoptymalizowane pod kątem zdrowia: GPT-5.2 z ocenami wystawionymi przez 260+ lekarzy w 60 krajach na HealthBench
Przejrzyste cytaty medyczne: Odpowiedzi ze źródłami z recenzowanych badań, wytycznych klinicznych, z tytułami, czasopismami i datami
Dostosowanie instytucjonalne: Integracja z SharePoint w celu przestrzegania protokołów i ścieżek placówki
Szablony wielokrotnego użytku: Wypisy ze szpitala, instrukcje dla pacjentów, listy kliniczne, wsparcie w zakresie wcześniejszej autoryzacji

Partnerzy startowi

Instytucja	Specjalizacja
Boston Children’s Hospital	Pediatria
Stanford Medicine Children’s Health	Pediatria
Memorial Sloan Kettering	Onkologia
Cedars-Sinai Medical Center	Szpital ogólny
HCA Healthcare	Sieć szpitali
UCSF	Akademickie Centrum Medyczne
AdventHealth	Sieć szpitali
Baylor Scott & White Health	Sieć szpitali

Zgodność z HIPAA

Aspekt	Wsparcie
BAA	Business Associate Agreement z OpenAI
Data residency	Opcje rezydencji danych
Audit logs	Kompleksowe dzienniki audytu
Encryption	Klucze szyfrujące zarządzane przez klienta
Trening	Dane nieużywane do trenowania modeli

Healthcare is among the fastest-growing enterprise markets adopting AI, and hospitals and academic medical centers are already rolling out ChatGPT for Healthcare across their teams.

🇵🇱 Opieka zdrowotna jest jednym z najszybciej rozwijających się rynków enterprise wdrażających AI, a szpitale i akademickie centra medyczne już wdrażają ChatGPT for Healthcare w swoich zespołach. — OpenAI

ElevenLabs Scribe v2: transkrypcja nowej generacji

9 stycznia 2026 — ElevenLabs ogłasza dostępność API Scribe v2 dla deweloperów i przedsiębiorstw.

🔗 Dokumentacja Scribe v2 | Wątek na X

Główne możliwości

Funkcja	Szczegóły
Języki	90+ obsługiwanych języków
Keyterm prompting	Do 100 terminów, aby ukierunkować model na określone słowa
Entity detection	56 typów podmiotów (nazwiska, numery kart, schorzenia, SSN)
Speaker diarization	Do 48 różnych mówców
Timestamps	Precyzja na poziomie słowa
Audio tagging	Automatyczne wykrywanie zdarzeń audio (śmiech, oklaski)

Wersja Realtime

Scribe v2 istnieje również w wersji czasu rzeczywistego:

Metryka	Wydajność
Opóźnienie	~150ms
Języki	90+
Transkrypcja	Czas rzeczywisty przez WebSockets

Zgodność enterprise

ElevenLabs oferuje Business Associate Agreement (BAA) dla klientów wymagających zgodności z HIPAA, dzięki czemu Scribe v2 nadaje się do użytku w kontekstach medycznych.

With Scribe v2, developers and enterprises can automate complex audio pipelines, achieve higher accuracy in global content workflows, and scale with full compliance and data residency controls.

🇵🇱 Dzięki Scribe v2 deweloperzy i przedsiębiorstwa mogą automatyzować złożone potoki audio, osiągać wyższą dokładność w globalnych przepływach pracy z treścią i skalować przy pełnej zgodności i kontroli rezydencji danych. — @elevenlabsio

Co to oznacza

Anthropic nadal przoduje w bezpieczeństwie LLM. Połączenie interpretowalności + kaskady klasyfikatorów jest eleganckie: wykorzystanie “instynktu” Claude’a do wykrywania ataków jest trudniejsze do obejścia niż jawne reguły. 87% redukcji fałszywych odmów jest kluczowe dla adopcji w przedsiębiorstwach.

OpenAI frontalnie atakuje rynek opieki zdrowotnej B2B, jeden z najbardziej regulowanych sektorów. Kompletna oferta z HIPAA, BAA i prestiżowymi partnerstwami szpitalnymi pozycjonuje OpenAI for Healthcare jako poważną alternatywę dla starszych rozwiązań. Zróżnicowanie względem ChatGPT Health (B2C) pokazuje dojrzałą strategię produktową.

ElevenLabs uzupełnia swój stos audio o najnowocześniejsze STT. Połączenie TTS (głos) + STT (transkrypcja) + zgodności z HIPAA czyni go rozwiązaniem full-stack dla głosowych aplikacji korporacyjnych. Keyterm prompting jest szczególnie przydatny w przypadku terminów technicznych lub nazw własnych.