Szukaj

Wiadomości AI 9 stycznia 2026: Constitutional Classifiers++, OpenAI for Healthcare, Scribe v2

Wiadomości AI 9 stycznia 2026: Constitutional Classifiers++, OpenAI for Healthcare, Scribe v2

W tym tygodniu w AI

Pracowity dzień pełen ważnych ogłoszeń: Anthropic publikuje artykuł badawczy na temat bezpieczeństwa LLM po 1700 godzinach intensywnego red-teamingu. OpenAI uruchamia ofertę enterprise dedykowaną szpitalom ze wsparciem HIPAA. ElevenLabs ujawnia Scribe v2, swój nowy model transkrypcji speech-to-text.


Constitutional Classifiers++: Anthropic wzmacnia bezpieczeństwo

9 stycznia 2026 — Anthropic publikuje nowy ważny artykuł badawczy na temat solidności swoich zabezpieczeń przed jailbreakami.

🔗 Artykuł na arXiv | Wątek na X

Kontekst

W zeszłym roku Anthropic wprowadziło Constitutional Classifiers, system, który trenuje klasyfikatory w oparciu o “konstytucję” określającą, na jakie zapytania Claude powinien, a na jakie nie powinien odpowiadać. Ten system zmniejszył wskaźnik sukcesu jailbreaków z 86% do 4,4%, ale miał dwa problemy: był kosztowny obliczeniowo i miał tendencję do odrzucania uzasadnionych zapytań.

Trzy kluczowe innowacje

Nowy system Constitutional Classifiers++ wprowadza trzy główne ulepszenia:

InnowacjaOpis
Exchange ClassifiersOceniają odpowiedzi w ich pełnym kontekście konwersacyjnym, korygując podatność poprzednich systemów, które badały wyniki w izolacji
Two-Stage CascadeLekkie klasyfikatory filtrują cały ruch, eskalując tylko podejrzane wymiany do potężniejszych klasyfikatorów
Linear ProbesPraktyczne zastosowanie interpretowalności: sondy obserwują wewnętrzne aktywacje Claude’a (“gut instincts”), aby wykrywać podejrzane zapytania

Wyniki

MetrykaWydajność
Redukcja kosztów40x w porównaniu do baseline
Compute overheadTylko ~1%
Wskaźnik odmów na produkcji0.05%
Spadek fałszywych odmów87%
Red-teaming1700h bez uniwersalnego jailbreaka

After 1,700 cumulative hours of red-teaming, we’ve yet to identify a universal jailbreak (a consistent attack strategy that works across many queries) that works on our new system.

🇵🇱 Po 1700 skumulowanych godzinach red-teamingu nie zidentyfikowaliśmy jeszcze uniwersalnego jailbreaka (spójnej strategii ataku, która działa w wielu zapytaniach), który działałby w naszym nowym systemie.@AnthropicAI

Dlaczego to ważne

System wykorzystuje wewnętrzne aktywacje Claude’a jako “instynkt”, który trudno oszukać. Gdy sonda wykryje podejrzane zapytanie, wysyła je do potężniejszego klasyfikatora “exchange”, który analizuje obie strony rozmowy. Ta kaskadowa architektura pozwala na solidną ochronę bez zaporowych kosztów obliczeniowych poprzednich generacji.


OpenAI for Healthcare: AI wkracza do szpitali

8 stycznia 2026 — OpenAI uruchamia ofertę enterprise dedykowaną sektorowi opieki zdrowotnej, odrębną od ogłoszonego dzień wcześniej ChatGPT Health.

🔗 Oficjalne ogłoszenie

Różnica względem ChatGPT Health

ProduktCelFokus
ChatGPT HealthSzeroka publicznośćOsobiste samopoczucie, łączenie aplikacji zdrowotnych
OpenAI for HealthcareFirmySzpitale, kliniki, przepływy pracy klinicznej

ChatGPT for Healthcare

Wersja enterprise ChatGPT zaprojektowana dla organizacji opieki zdrowotnej:

  • Modele zoptymalizowane pod kątem zdrowia: GPT-5.2 z ocenami wystawionymi przez 260+ lekarzy w 60 krajach na HealthBench
  • Przejrzyste cytaty medyczne: Odpowiedzi ze źródłami z recenzowanych badań, wytycznych klinicznych, z tytułami, czasopismami i datami
  • Dostosowanie instytucjonalne: Integracja z SharePoint w celu przestrzegania protokołów i ścieżek placówki
  • Szablony wielokrotnego użytku: Wypisy ze szpitala, instrukcje dla pacjentów, listy kliniczne, wsparcie w zakresie wcześniejszej autoryzacji

Partnerzy startowi

InstytucjaSpecjalizacja
Boston Children’s HospitalPediatria
Stanford Medicine Children’s HealthPediatria
Memorial Sloan KetteringOnkologia
Cedars-Sinai Medical CenterSzpital ogólny
HCA HealthcareSieć szpitali
UCSFAkademickie Centrum Medyczne
AdventHealthSieć szpitali
Baylor Scott & White HealthSieć szpitali

Zgodność z HIPAA

AspektWsparcie
BAABusiness Associate Agreement z OpenAI
Data residencyOpcje rezydencji danych
Audit logsKompleksowe dzienniki audytu
EncryptionKlucze szyfrujące zarządzane przez klienta
TreningDane nieużywane do trenowania modeli

Healthcare is among the fastest-growing enterprise markets adopting AI, and hospitals and academic medical centers are already rolling out ChatGPT for Healthcare across their teams.

🇵🇱 Opieka zdrowotna jest jednym z najszybciej rozwijających się rynków enterprise wdrażających AI, a szpitale i akademickie centra medyczne już wdrażają ChatGPT for Healthcare w swoich zespołach.OpenAI


ElevenLabs Scribe v2: transkrypcja nowej generacji

9 stycznia 2026 — ElevenLabs ogłasza dostępność API Scribe v2 dla deweloperów i przedsiębiorstw.

🔗 Dokumentacja Scribe v2 | Wątek na X

Główne możliwości

FunkcjaSzczegóły
Języki90+ obsługiwanych języków
Keyterm promptingDo 100 terminów, aby ukierunkować model na określone słowa
Entity detection56 typów podmiotów (nazwiska, numery kart, schorzenia, SSN)
Speaker diarizationDo 48 różnych mówców
TimestampsPrecyzja na poziomie słowa
Audio taggingAutomatyczne wykrywanie zdarzeń audio (śmiech, oklaski)

Wersja Realtime

Scribe v2 istnieje również w wersji czasu rzeczywistego:

MetrykaWydajność
Opóźnienie~150ms
Języki90+
TranskrypcjaCzas rzeczywisty przez WebSockets

Zgodność enterprise

ElevenLabs oferuje Business Associate Agreement (BAA) dla klientów wymagających zgodności z HIPAA, dzięki czemu Scribe v2 nadaje się do użytku w kontekstach medycznych.

With Scribe v2, developers and enterprises can automate complex audio pipelines, achieve higher accuracy in global content workflows, and scale with full compliance and data residency controls.

🇵🇱 Dzięki Scribe v2 deweloperzy i przedsiębiorstwa mogą automatyzować złożone potoki audio, osiągać wyższą dokładność w globalnych przepływach pracy z treścią i skalować przy pełnej zgodności i kontroli rezydencji danych.@elevenlabsio


Co to oznacza

Anthropic nadal przoduje w bezpieczeństwie LLM. Połączenie interpretowalności + kaskady klasyfikatorów jest eleganckie: wykorzystanie “instynktu” Claude’a do wykrywania ataków jest trudniejsze do obejścia niż jawne reguły. 87% redukcji fałszywych odmów jest kluczowe dla adopcji w przedsiębiorstwach.

OpenAI frontalnie atakuje rynek opieki zdrowotnej B2B, jeden z najbardziej regulowanych sektorów. Kompletna oferta z HIPAA, BAA i prestiżowymi partnerstwami szpitalnymi pozycjonuje OpenAI for Healthcare jako poważną alternatywę dla starszych rozwiązań. Zróżnicowanie względem ChatGPT Health (B2C) pokazuje dojrzałą strategię produktową.

ElevenLabs uzupełnia swój stos audio o najnowocześniejsze STT. Połączenie TTS (głos) + STT (transkrypcja) + zgodności z HIPAA czyni go rozwiązaniem full-stack dla głosowych aplikacji korporacyjnych. Keyterm prompting jest szczególnie przydatny w przypadku terminów technicznych lub nazw własnych.


Źródła