Diese Woche in der KI
Ein geschäftiger Tag mit großen Ankündigungen: Anthropic veröffentlicht ein Forschungspapier zur Sicherheit von LLMs nach 1700 Stunden intensivem Red-Teaming. OpenAI startet ein Enterprise-Angebot speziell für Krankenhäuser mit HIPAA-Unterstützung. ElevenLabs enthüllt Scribe v2, sein neues Speech-to-Text Transkriptionsmodell.
Constitutional Classifiers++: Anthropic stärkt die Sicherheit
9. Januar 2026 — Anthropic veröffentlicht ein wichtiges neues Forschungspapier über die Robustheit seiner Verteidigung gegen Jailbreaks.
Der Kontext
Letztes Jahr hatte Anthropic die Constitutional Classifiers eingeführt, ein System, das Klassifikatoren auf Basis einer “Verfassung” trainiert, die festlegt, welche Anfragen Claude beantworten soll und welche nicht. Dieses System hatte die Erfolgsquote von Jailbreaks von 86% auf 4,4% gesenkt, wies jedoch zwei Probleme auf: rechenintensiv und eine Neigung, legitime Anfragen abzulehnen.
Drei Schlüsselinnovationen
Das neue System Constitutional Classifiers++ bringt drei wesentliche Verbesserungen:
| Innovation | Beschreibung |
|---|---|
| Exchange Classifiers | Bewerten Antworten in ihrem vollen Gesprächskontext und korrigieren so die Schwachstelle früherer Systeme, die Outputs isoliert betrachteten |
| Two-Stage Cascade | Leichte Klassifikatoren filtern den gesamten Datenverkehr und eskalieren nur verdächtige Austausche an leistungsfähigere Klassifikatoren |
| Linear Probes | Praktische Anwendung der Interpretierbarkeit: Sonden beobachten Claudes interne Aktivierungen (“gut instincts”), um verdächtige Anfragen zu erkennen |
Ergebnisse
| Metrik | Leistung |
|---|---|
| Kostenreduktion | 40x im Vergleich zur Baseline |
| Compute overhead | Nur ~1% |
| Ablehnungsrate Produktion | 0,05% |
| Rückgang falscher Ablehnungen | 87% |
| Red-Teaming | 1700 Std. ohne universellen Jailbreak |
After 1,700 cumulative hours of red-teaming, we’ve yet to identify a universal jailbreak (a consistent attack strategy that works across many queries) that works on our new system.
🇩🇪 Nach 1700 kumulierten Stunden Red-Teaming haben wir noch keinen universellen Jailbreak (eine konsistente Angriffsstrategie, die bei vielen Anfragen funktioniert) identifiziert, der auf unserem neuen System funktioniert. — @AnthropicAI
Warum das wichtig ist
Das System nutzt Claudes interne Aktivierungen als einen “Instinkt”, der schwer zu täuschen ist. Wenn die Sonde eine verdächtige Anfrage erkennt, sendet sie diese an einen leistungsfähigeren “Exchange”-Klassifikator, der beide Seiten des Gesprächs analysiert. Diese Kaskadenarchitektur ermöglicht einen robusten Schutz ohne die prohibitiven Rechenkosten früherer Generationen.
OpenAI for Healthcare: KI zieht in Krankenhäuser ein
8. Januar 2026 — OpenAI startet ein Enterprise-Angebot speziell für den Gesundheitssektor, getrennt von dem am Vortag angekündigten ChatGPT Health.
Unterschied zu ChatGPT Health
| Produkt | Zielgruppe | Fokus |
|---|---|---|
| ChatGPT Health | Breite Öffentlichkeit | Persönliches Wohlbefinden, Verbindung zu Gesundheits-Apps |
| OpenAI for Healthcare | Unternehmen | Krankenhäuser, Kliniken, klinische Workflows |
ChatGPT for Healthcare
Eine Enterprise-Version von ChatGPT, entwickelt für Gesundheitsorganisationen:
- Gesundheitsoptimierte Modelle: GPT-5.2 mit Bewertungen von 260+ Ärzten in 60 Ländern auf HealthBench
- Transparente medizinische Zitate: Antworten mit Quellenangaben aus Peer-Review-Studien, klinischen Leitlinien, mit Titeln, Journalen und Daten
- Institutionelle Ausrichtung: SharePoint-Integration zur Einhaltung der Protokolle und Pathways der Einrichtung
- Wiederverwendbare Vorlagen: Entlassungsberichte, Patientenanweisungen, Arztbriefe, Unterstützung bei Vorabgenehmigungen
Startpartner
| Institution | Fachgebiet |
|---|---|
| Boston Children’s Hospital | Pädiatrie |
| Stanford Medicine Children’s Health | Pädiatrie |
| Memorial Sloan Kettering | Onkologie |
| Cedars-Sinai Medical Center | Allgemeines Krankenhaus |
| HCA Healthcare | Krankenhausnetzwerk |
| UCSF | Akademisches Medizinisches Zentrum |
| AdventHealth | Krankenhausnetzwerk |
| Baylor Scott & White Health | Krankenhausnetzwerk |
HIPAA-Konformität
| Aspekt | Unterstützung |
|---|---|
| BAA | Business Associate Agreement mit OpenAI |
| Data residency | Optionen für Datenresidenz |
| Audit logs | Umfassende Audit-Protokolle |
| Encryption | Vom Kunden verwaltete Verschlüsselungsschlüssel |
| Training | Daten werden nicht zum Trainieren der Modelle verwendet |
Healthcare is among the fastest-growing enterprise markets adopting AI, and hospitals and academic medical centers are already rolling out ChatGPT for Healthcare across their teams.
🇩🇪 Der Gesundheitssektor gehört zu den am schnellsten wachsenden Enterprise-Märkten, die KI einführen, und Krankenhäuser sowie akademische medizinische Zentren rollen ChatGPT for Healthcare bereits in ihren Teams aus. — OpenAI
ElevenLabs Scribe v2: Transkription der nächsten Generation
9. Januar 2026 — ElevenLabs kündigt die Verfügbarkeit der Scribe v2 API für Entwickler und Unternehmen an.
🔗 Dokumentation Scribe v2 | X-Thread
Hauptfunktionen
| Feature | Details |
|---|---|
| Sprachen | 90+ unterstützte Sprachen |
| Keyterm prompting | Bis zu 100 Begriffe, um das Modell auf bestimmte Wörter auszurichten |
| Entity detection | 56 Entitätstypen (Namen, Kartennummern, medizinische Zustände, SSN) |
| Speaker diarization | Bis zu 48 verschiedene Sprecher |
| Timestamps | Präzision auf Wortebene |
| Audio tagging | Automatische Erkennung von Audioereignissen (Lachen, Applaus) |
Realtime-Version
Scribe v2 gibt es auch als Echtzeit-Version:
| Metrik | Leistung |
|---|---|
| Latenz | ~150ms |
| Sprachen | 90+ |
| Transkription | Echtzeit über WebSockets |
Enterprise-Konformität
ElevenLabs bietet ein Business Associate Agreement (BAA) für Kunden an, die HIPAA-Konformität benötigen, wodurch Scribe v2 in medizinischen Kontexten einsetzbar wird.
With Scribe v2, developers and enterprises can automate complex audio pipelines, achieve higher accuracy in global content workflows, and scale with full compliance and data residency controls.
🇩🇪 Mit Scribe v2 können Entwickler und Unternehmen komplexe Audio-Pipelines automatisieren, eine höhere Genauigkeit in globalen Content-Workflows erreichen und mit voller Konformität und Datenresidenzkontrollen skalieren. — @elevenlabsio
Was das bedeutet
Anthropic führt weiterhin bei der Sicherheit von LLMs. Die Kombination aus Interpretierbarkeit + Klassifikator-Kaskade ist elegant: Claudes “Bauchgefühl” zu nutzen, um Angriffe zu erkennen, ist schwerer zu umgehen als explizite Regeln. Die 87%ige Reduzierung falscher Ablehnungen ist entscheidend für die Enterprise-Akzeptanz.
OpenAI greift frontal den B2B-Healthcare-Markt an, einen der am stärksten regulierten Sektoren. Das komplette Angebot mit HIPAA, BAA und renommierten Krankenhauspartnerschaften positioniert OpenAI for Healthcare als ernsthafte Alternative zu Legacy-Lösungen. Die Differenzierung zu ChatGPT Health (B2C) zeigt eine reife Produktstrategie.
ElevenLabs vervollständigt seinen Audio-Stack mit einer hochmodernen STT. Die Kombination aus TTS (Sprache) + STT (Transkription) + HIPAA-Konformität macht es zu einer Full-Stack-Lösung für Enterprise-Sprachanwendungen. Keyterm Prompting ist besonders nützlich für technische Begriffe oder Eigennamen.