Esta semana na IA
Dia agitado de grandes anúncios: a Anthropic publica um artigo de pesquisa sobre segurança de LLMs após 1700 horas de red-teaming intensivo. A OpenAI lança uma oferta enterprise dedicada a hospitais com suporte HIPAA. A ElevenLabs revela o Scribe v2, seu novo modelo de transcrição speech-to-text.
Constitutional Classifiers++: Anthropic reforça a segurança
9 de janeiro de 2026 — A Anthropic publica um novo artigo de pesquisa importante sobre a robustez de suas defesas contra jailbreaks.
🔗 Artigo no arXiv | Thread no X
O contexto
No ano passado, a Anthropic introduziu os Constitutional Classifiers, um sistema que treina classificadores com base em uma “constituição” especificando quais perguntas o Claude deve ou não responder. Esse sistema reduziu a taxa de sucesso de jailbreaks de 86% para 4,4%, mas apresentou dois problemas: alto custo computacional e tendência a recusar perguntas legítimas.
Três inovações principais
O novo sistema Constitutional Classifiers++ traz três melhorias principais:
| Inovação | Descrição |
|---|---|
| Exchange Classifiers | Avaliam as respostas em seu contexto conversacional completo, corrigindo a vulnerabilidade de sistemas anteriores que examinavam os outputs isoladamente |
| Two-Stage Cascade | Classificadores leves filtram todo o tráfego, escalando apenas as trocas suspeitas para classificadores mais poderosos |
| Linear Probes | Aplicação prática de interpretabilidade: sondas observam as ativações internas do Claude (“gut instincts”) para detectar perguntas suspeitas |
Resultados
| Métrica | Desempenho |
|---|---|
| Redução de custos | 40x em relação ao baseline |
| Compute overhead | Apenas ~1% |
| Taxa de recusa em produção | 0,05% |
| Queda de falsas recusas | 87% |
| Red-teaming | 1700h sem jailbreak universal |
After 1,700 cumulative hours of red-teaming, we’ve yet to identify a universal jailbreak (a consistent attack strategy that works across many queries) that works on our new system.
🇵🇹 Após 1700 horas acumuladas de red-teaming, ainda não identificamos um jailbreak universal (uma estratégia de ataque consistente que funcione em muitas consultas) que funcione em nosso novo sistema. — @AnthropicAI
Por que isso é importante
O sistema usa as ativações internas do Claude como um “instinto” difícil de enganar. Quando a sonda detecta uma pergunta suspeita, ela a envia para um classificador “exchange” mais poderoso que analisa ambos os lados da conversa. Essa arquitetura em cascata permite ter uma proteção robusta sem o custo computacional proibitivo das gerações anteriores.
OpenAI for Healthcare: a IA entra nos hospitais
8 de janeiro de 2026 — A OpenAI lança uma oferta enterprise dedicada ao setor de saúde, distinta do ChatGPT Health anunciado no dia anterior.
Diferença com o ChatGPT Health
| Produto | Público-alvo | Foco |
|---|---|---|
| ChatGPT Health | Público geral | Bem-estar pessoal, conexão com apps de saúde |
| OpenAI for Healthcare | Empresas | Hospitais, clínicas, fluxos de trabalho clínicos |
ChatGPT for Healthcare
Uma versão enterprise do ChatGPT projetada para organizações de saúde:
- Modelos otimizados para saúde: GPT-5.2 com avaliações de mais de 260 médicos em 60 países no HealthBench
- Citações médicas transparentes: Respostas com fontes de estudos revisados por pares, diretrizes clínicas, com títulos, periódicos e datas
- Alinhamento institucional: Integração com SharePoint para respeitar os protocolos e caminhos da instalação
- Modelos reutilizáveis: Resumos de alta, instruções para pacientes, cartas clínicas, suporte a autorização prévia
Parceiros de lançamento
| Instituição | Especialidade |
|---|---|
| Boston Children’s Hospital | Pediatria |
| Stanford Medicine Children’s Health | Pediatria |
| Memorial Sloan Kettering | Oncologia |
| Cedars-Sinai Medical Center | Hospital Geral |
| HCA Healthcare | Rede Hospitalar |
| UCSF | Centro Médico Acadêmico |
| AdventHealth | Rede Hospitalar |
| Baylor Scott & White Health | Rede Hospitalar |
Conformidade HIPAA
| Aspecto | Suporte |
|---|---|
| BAA | Acordo de Associação Comercial (BAA) com a OpenAI |
| Data residency | Opções de residência de dados |
| Audit logs | Logs de auditoria abrangentes |
| Encryption | Chaves de criptografia gerenciadas pelo cliente |
| Treinamento | Dados não usados para treinar os modelos |
Healthcare is among the fastest-growing enterprise markets adopting AI, and hospitals and academic medical centers are already rolling out ChatGPT for Healthcare across their teams.
🇵🇹 O setor de saúde está entre os mercados corporativos de crescimento mais rápido na adoção de IA, e hospitais e centros médicos acadêmicos já estão implantando o ChatGPT for Healthcare em suas equipes. — OpenAI
ElevenLabs Scribe v2: transcrição de nova geração
9 de janeiro de 2026 — A ElevenLabs anuncia a disponibilidade da API Scribe v2 para desenvolvedores e empresas.
🔗 Documentação Scribe v2 | Thread no X
Principais capacidades
| Recurso | Detalhes |
|---|---|
| Idiomas | 90+ idiomas suportados |
| Keyterm prompting | Até 100 termos para enviesar o modelo para palavras específicas |
| Entity detection | 56 tipos de entidades (nomes, números de cartão, condições médicas, SSN) |
| Speaker diarization | Até 48 oradores distintos |
| Timestamps | Precisão no nível da palavra |
| Audio tagging | Detecção automática de eventos de áudio (risos, aplausos) |
Versão Realtime
O Scribe v2 também existe em versão tempo real:
| Métrica | Desempenho |
|---|---|
| Latência | ~150ms |
| Idiomas | 90+ |
| Transcrição | Tempo real via WebSockets |
Conformidade enterprise
A ElevenLabs oferece um Acordo de Associação Comercial (BAA) para clientes que exigem conformidade HIPAA, tornando o Scribe v2 utilizável em contextos médicos.
With Scribe v2, developers and enterprises can automate complex audio pipelines, achieve higher accuracy in global content workflows, and scale with full compliance and data residency controls.
🇵🇹 Com o Scribe v2, desenvolvedores e empresas podem automatizar pipelines de áudio complexos, alcançar maior precisão em fluxos de trabalho de conteúdo global e escalar com total conformidade e controles de residência de dados. — @elevenlabsio
O que isso significa
A Anthropic continua liderando na segurança de LLMs. A combinação de interpretabilidade + cascata de classificadores é elegante: usar os “instintos” do Claude para detectar ataques é mais difícil de contornar do que regras explícitas. A redução de 87% nas falsas recusas é crucial para a adoção corporativa.
A OpenAI ataca frontalmente o mercado de saúde B2B, um dos setores mais regulamentados. A oferta completa com HIPAA, BAA e parcerias hospitalares de prestígio posiciona a OpenAI for Healthcare como uma alternativa séria às soluções legadas. A diferenciação com o ChatGPT Health (B2C) mostra uma estratégia de produto madura.
A ElevenLabs completa seu stack de áudio com um STT de ponta. A combinação TTS (voz) + STT (transcrição) + conformidade HIPAA a torna uma solução full-stack para aplicativos de voz corporativos. O keyterm prompting é particularmente útil para termos técnicos ou nomes próprios.