KI-News 9. Januar 2026: Constitutional Classifiers++, OpenAI for Healthcare, Scribe v2

Diese Woche in der KI

Ein geschäftiger Tag mit großen Ankündigungen: Anthropic veröffentlicht ein Forschungspapier zur Sicherheit von LLMs nach 1700 Stunden intensivem Red-Teaming. OpenAI startet ein Enterprise-Angebot speziell für Krankenhäuser mit HIPAA-Unterstützung. ElevenLabs enthüllt Scribe v2, sein neues Speech-to-Text Transkriptionsmodell.

Constitutional Classifiers++: Anthropic stärkt die Sicherheit

9. Januar 2026 — Anthropic veröffentlicht ein wichtiges neues Forschungspapier über die Robustheit seiner Verteidigung gegen Jailbreaks.

🔗 Paper auf arXiv | X-Thread

Der Kontext

Letztes Jahr hatte Anthropic die Constitutional Classifiers eingeführt, ein System, das Klassifikatoren auf Basis einer “Verfassung” trainiert, die festlegt, welche Anfragen Claude beantworten soll und welche nicht. Dieses System hatte die Erfolgsquote von Jailbreaks von 86% auf 4,4% gesenkt, wies jedoch zwei Probleme auf: rechenintensiv und eine Neigung, legitime Anfragen abzulehnen.

Drei Schlüsselinnovationen

Das neue System Constitutional Classifiers++ bringt drei wesentliche Verbesserungen:

Innovation	Beschreibung
Exchange Classifiers	Bewerten Antworten in ihrem vollen Gesprächskontext und korrigieren so die Schwachstelle früherer Systeme, die Outputs isoliert betrachteten
Two-Stage Cascade	Leichte Klassifikatoren filtern den gesamten Datenverkehr und eskalieren nur verdächtige Austausche an leistungsfähigere Klassifikatoren
Linear Probes	Praktische Anwendung der Interpretierbarkeit: Sonden beobachten Claudes interne Aktivierungen (“gut instincts”), um verdächtige Anfragen zu erkennen

Ergebnisse

Metrik	Leistung
Kostenreduktion	40x im Vergleich zur Baseline
Compute overhead	Nur ~1%
Ablehnungsrate Produktion	0,05%
Rückgang falscher Ablehnungen	87%
Red-Teaming	1700 Std. ohne universellen Jailbreak

After 1,700 cumulative hours of red-teaming, we’ve yet to identify a universal jailbreak (a consistent attack strategy that works across many queries) that works on our new system.

🇩🇪 Nach 1700 kumulierten Stunden Red-Teaming haben wir noch keinen universellen Jailbreak (eine konsistente Angriffsstrategie, die bei vielen Anfragen funktioniert) identifiziert, der auf unserem neuen System funktioniert. — @AnthropicAI

Warum das wichtig ist

Das System nutzt Claudes interne Aktivierungen als einen “Instinkt”, der schwer zu täuschen ist. Wenn die Sonde eine verdächtige Anfrage erkennt, sendet sie diese an einen leistungsfähigeren “Exchange”-Klassifikator, der beide Seiten des Gesprächs analysiert. Diese Kaskadenarchitektur ermöglicht einen robusten Schutz ohne die prohibitiven Rechenkosten früherer Generationen.

OpenAI for Healthcare: KI zieht in Krankenhäuser ein

8. Januar 2026 — OpenAI startet ein Enterprise-Angebot speziell für den Gesundheitssektor, getrennt von dem am Vortag angekündigten ChatGPT Health.

🔗 Offizielle Ankündigung

Unterschied zu ChatGPT Health

Produkt	Zielgruppe	Fokus
ChatGPT Health	Breite Öffentlichkeit	Persönliches Wohlbefinden, Verbindung zu Gesundheits-Apps
OpenAI for Healthcare	Unternehmen	Krankenhäuser, Kliniken, klinische Workflows

ChatGPT for Healthcare

Eine Enterprise-Version von ChatGPT, entwickelt für Gesundheitsorganisationen:

Gesundheitsoptimierte Modelle: GPT-5.2 mit Bewertungen von 260+ Ärzten in 60 Ländern auf HealthBench
Transparente medizinische Zitate: Antworten mit Quellenangaben aus Peer-Review-Studien, klinischen Leitlinien, mit Titeln, Journalen und Daten
Institutionelle Ausrichtung: SharePoint-Integration zur Einhaltung der Protokolle und Pathways der Einrichtung
Wiederverwendbare Vorlagen: Entlassungsberichte, Patientenanweisungen, Arztbriefe, Unterstützung bei Vorabgenehmigungen

Startpartner

Institution	Fachgebiet
Boston Children’s Hospital	Pädiatrie
Stanford Medicine Children’s Health	Pädiatrie
Memorial Sloan Kettering	Onkologie
Cedars-Sinai Medical Center	Allgemeines Krankenhaus
HCA Healthcare	Krankenhausnetzwerk
UCSF	Akademisches Medizinisches Zentrum
AdventHealth	Krankenhausnetzwerk
Baylor Scott & White Health	Krankenhausnetzwerk

HIPAA-Konformität

Aspekt	Unterstützung
BAA	Business Associate Agreement mit OpenAI
Data residency	Optionen für Datenresidenz
Audit logs	Umfassende Audit-Protokolle
Encryption	Vom Kunden verwaltete Verschlüsselungsschlüssel
Training	Daten werden nicht zum Trainieren der Modelle verwendet

Healthcare is among the fastest-growing enterprise markets adopting AI, and hospitals and academic medical centers are already rolling out ChatGPT for Healthcare across their teams.

🇩🇪 Der Gesundheitssektor gehört zu den am schnellsten wachsenden Enterprise-Märkten, die KI einführen, und Krankenhäuser sowie akademische medizinische Zentren rollen ChatGPT for Healthcare bereits in ihren Teams aus. — OpenAI

ElevenLabs Scribe v2: Transkription der nächsten Generation

9. Januar 2026 — ElevenLabs kündigt die Verfügbarkeit der Scribe v2 API für Entwickler und Unternehmen an.

🔗 Dokumentation Scribe v2 | X-Thread

Hauptfunktionen

Feature	Details
Sprachen	90+ unterstützte Sprachen
Keyterm prompting	Bis zu 100 Begriffe, um das Modell auf bestimmte Wörter auszurichten
Entity detection	56 Entitätstypen (Namen, Kartennummern, medizinische Zustände, SSN)
Speaker diarization	Bis zu 48 verschiedene Sprecher
Timestamps	Präzision auf Wortebene
Audio tagging	Automatische Erkennung von Audioereignissen (Lachen, Applaus)

Realtime-Version

Scribe v2 gibt es auch als Echtzeit-Version:

Metrik	Leistung
Latenz	~150ms
Sprachen	90+
Transkription	Echtzeit über WebSockets

Enterprise-Konformität

ElevenLabs bietet ein Business Associate Agreement (BAA) für Kunden an, die HIPAA-Konformität benötigen, wodurch Scribe v2 in medizinischen Kontexten einsetzbar wird.

With Scribe v2, developers and enterprises can automate complex audio pipelines, achieve higher accuracy in global content workflows, and scale with full compliance and data residency controls.

🇩🇪 Mit Scribe v2 können Entwickler und Unternehmen komplexe Audio-Pipelines automatisieren, eine höhere Genauigkeit in globalen Content-Workflows erreichen und mit voller Konformität und Datenresidenzkontrollen skalieren. — @elevenlabsio

Was das bedeutet

Anthropic führt weiterhin bei der Sicherheit von LLMs. Die Kombination aus Interpretierbarkeit + Klassifikator-Kaskade ist elegant: Claudes “Bauchgefühl” zu nutzen, um Angriffe zu erkennen, ist schwerer zu umgehen als explizite Regeln. Die 87%ige Reduzierung falscher Ablehnungen ist entscheidend für die Enterprise-Akzeptanz.

OpenAI greift frontal den B2B-Healthcare-Markt an, einen der am stärksten regulierten Sektoren. Das komplette Angebot mit HIPAA, BAA und renommierten Krankenhauspartnerschaften positioniert OpenAI for Healthcare als ernsthafte Alternative zu Legacy-Lösungen. Die Differenzierung zu ChatGPT Health (B2C) zeigt eine reife Produktstrategie.

ElevenLabs vervollständigt seinen Audio-Stack mit einer hochmodernen STT. Die Kombination aus TTS (Sprache) + STT (Transkription) + HIPAA-Konformität macht es zu einer Full-Stack-Lösung für Enterprise-Sprachanwendungen. Keyterm Prompting ist besonders nützlich für technische Begriffe oder Eigennamen.