Esta semana en la IA
Día ajetreado de anuncios importantes: Anthropic publica un paper de investigación sobre la seguridad de los LLMs tras 1700 horas de red-teaming intensivo. OpenAI lanza una oferta enterprise dedicada a hospitales con soporte HIPAA. ElevenLabs revela Scribe v2, su nuevo modelo de transcripción speech-to-text.
Constitutional Classifiers++: Anthropic refuerza la seguridad
9 de enero de 2026 — Anthropic publica un nuevo paper de investigación importante sobre la robustez de sus defensas contra jailbreaks.
El contexto
El año pasado, Anthropic había introducido los Constitutional Classifiers, un sistema que entrena clasificadores basándose en una “constitución” que especifica qué consultas debe o no debe responder Claude. Este sistema había reducido la tasa de éxito de los jailbreaks del 86% al 4.4%, pero presentaba dos problemas: costoso en cómputo y tendencia a rechazar consultas legítimas.
Tres innovaciones clave
El nuevo sistema Constitutional Classifiers++ aporta tres mejoras mayores:
| Innovación | Descripción |
|---|---|
| Exchange Classifiers | Evalúan las respuestas en su contexto conversacional completo, corrigiendo la vulnerabilidad de sistemas anteriores que examinaban los outputs de forma aislada |
| Two-Stage Cascade | Clasificadores ligeros filtran todo el tráfico, escalando solo los intercambios sospechosos a clasificadores más potentes |
| Linear Probes | Aplicación práctica de la interpretabilidad: sondas observan las activaciones internas de Claude (“gut instincts”) para detectar consultas sospechosas |
Resultados
| Métrica | Rendimiento |
|---|---|
| Reducción de costes | 40x respecto al baseline |
| Compute overhead | ~1% solamente |
| Tasa de rechazo producción | 0.05% |
| Bajada falsos rechazos | 87% |
| Red-teaming | 1700h sin jailbreak universal |
After 1,700 cumulative hours of red-teaming, we’ve yet to identify a universal jailbreak (a consistent attack strategy that works across many queries) that works on our new system.
🇪🇸 Tras 1700 horas acumuladas de red-teaming, aún no hemos identificado un jailbreak universal (una estrategia de ataque consistente que funcione en muchas consultas) que funcione en nuestro nuevo sistema. — @AnthropicAI
Por qué es importante
El sistema utiliza las activaciones internas de Claude como un “instinto” difícil de engañar. Cuando la sonda detecta una consulta sospechosa, la envía a un clasificador “exchange” más potente que analiza ambos lados de la conversación. Esta arquitectura en cascada permite tener una protección robusta sin el coste computacional prohibitivo de las generaciones anteriores.
OpenAI for Healthcare: la IA entra en los hospitales
8 de enero de 2026 — OpenAI lanza una oferta enterprise dedicada al sector de la salud, distinta de ChatGPT Health anunciado el día anterior.
Diferencia con ChatGPT Health
| Producto | Objetivo | Enfoque |
|---|---|---|
| ChatGPT Health | Gran público | Bienestar personal, conexión apps salud |
| OpenAI for Healthcare | Empresas | Hospitales, clínicas, workflows clínicos |
ChatGPT for Healthcare
Una versión enterprise de ChatGPT diseñada para organizaciones de salud:
- Modelos optimizados salud: GPT-5.2 con evaluaciones por 260+ médicos en 60 países en HealthBench
- Citas médicas transparentes: Respuestas con fuentes de estudios peer-reviewed, guías clínicas, con títulos, revistas y fechas
- Alineación institucional: Integración SharePoint para respetar los protocolos y pathways del establecimiento
- Templates reutilizables: Resúmenes de alta, instrucciones para pacientes, cartas clínicas, soporte autorización previa
Socios de lanzamiento
| Institución | Especialidad |
|---|---|
| Boston Children’s Hospital | Pediatría |
| Stanford Medicine Children’s Health | Pediatría |
| Memorial Sloan Kettering | Oncología |
| Cedars-Sinai Medical Center | Hospital general |
| HCA Healthcare | Red hospitalaria |
| UCSF | Centro médico académico |
| AdventHealth | Red hospitalaria |
| Baylor Scott & White Health | Red hospitalaria |
Cumplimiento HIPAA
| Aspecto | Soporte |
|---|---|
| BAA | Business Associate Agreement con OpenAI |
| Data residency | Opciones de residencia de datos |
| Audit logs | Logs de auditoría completos |
| Encryption | Claves de cifrado gestionadas por el cliente |
| Entrenamiento | Datos no utilizados para entrenar los modelos |
Healthcare is among the fastest-growing enterprise markets adopting AI, and hospitals and academic medical centers are already rolling out ChatGPT for Healthcare across their teams.
🇪🇸 El sector de la salud se encuentra entre los mercados enterprise de más rápido crecimiento en adoptar la IA, y los hospitales y centros médicos académicos ya están desplegando ChatGPT for Healthcare en todos sus equipos. — OpenAI
ElevenLabs Scribe v2: transcripción de nueva generación
9 de enero de 2026 — ElevenLabs anuncia la disponibilidad de la API Scribe v2 para desarrolladores y empresas.
🔗 Documentación Scribe v2 | Hilo en X
Capacidades principales
| Feature | Detalles |
|---|---|
| Idiomas | 90+ idiomas soportados |
| Keyterm prompting | Hasta 100 términos para sesgar el modelo hacia palabras específicas |
| Entity detection | 56 tipos de entidades (nombres, números de tarjeta, condiciones médicas, SSN) |
| Speaker diarization | Hasta 48 oradores distintos |
| Timestamps | Precisión a nivel de palabra |
| Audio tagging | Detección automática de eventos de audio (risas, aplausos) |
Versión Realtime
Scribe v2 existe también en versión tiempo real:
| Métrica | Rendimiento |
|---|---|
| Latencia | ~150ms |
| Idiomas | 90+ |
| Transcripción | Tiempo real vía WebSockets |
Cumplimiento enterprise
ElevenLabs ofrece un Business Associate Agreement (BAA) para clientes que requieran cumplimiento HIPAA, haciendo que Scribe v2 sea utilizable en contextos médicos.
With Scribe v2, developers and enterprises can automate complex audio pipelines, achieve higher accuracy in global content workflows, and scale with full compliance and data residency controls.
🇪🇸 Con Scribe v2, los desarrolladores y empresas pueden automatizar pipelines de audio complejos, lograr una mayor precisión en los workflows de contenido global y escalar con total cumplimiento y controles de residencia de datos. — @elevenlabsio
Qué significa esto
Anthropic continúa liderando en la seguridad de los LLMs. La combinación interpretabilidad + cascada de clasificadores es elegante: usar los “gut instincts” de Claude para detectar ataques es más difícil de eludir que reglas explícitas. El 87% de reducción de falsos rechazos es crucial para la adopción enterprise.
OpenAI ataca frontalmente el mercado healthcare B2B, uno de los sectores más regulados. La oferta completa con HIPAA, BAA y asociaciones hospitalarias prestigiosas posiciona a OpenAI for Healthcare como una alternativa seria a las soluciones legacy. La diferenciación con ChatGPT Health (B2C) muestra una estrategia de producto madura.
ElevenLabs completa su stack de audio con un STT de vanguardia. La combinación TTS (voz) + STT (transcripción) + cumplimiento HIPAA lo convierte en una solución full-stack para aplicaciones de voz enterprise. El keyterm prompting es particularmente útil para términos técnicos o nombres propios.