이번 주 AI 소식
주요 발표로 가득 찬 바쁜 하루입니다. Anthropic은 1700시간의 집중적인 레드팀 활동 후 LLM 안전에 관한 연구 논문을 발표했습니다. OpenAI는 HIPAA 지원을 포함한 병원 전용 엔터프라이즈 서비스를 출시했습니다. ElevenLabs는 새로운 음성 텍스트 변환(speech-to-text) 모델인 Scribe v2를 공개했습니다.
Constitutional Classifiers++: Anthropic, 보안 강화
2026년 1월 9일 — Anthropic은 탈옥(jailbreak)에 대한 방어 견고성에 관한 중요한 새 연구 논문을 발표했습니다.
배경
작년에 Anthropic은 Claude가 답변해야 할 질문과 답변하지 말아야 할 질문을 명시한 “헌법”을 기반으로 분류기를 훈련하는 시스템인 Constitutional Classifiers를 도입했습니다. 이 시스템은 탈옥 성공률을 86%에서 4.4%로 줄였지만, 두 가지 문제가 있었습니다. 계산 비용이 많이 들고 정당한 요청을 거부하는 경향이 있었습니다.
세 가지 핵심 혁신
새로운 Constitutional Classifiers++ 시스템은 세 가지 주요 개선 사항을 제공합니다.
| 혁신 | 설명 |
|---|---|
| Exchange Classifiers | 출력을 고립적으로 검토하던 이전 시스템의 취약점을 수정하여 전체 대화 맥락에서 응답을 평가 |
| Two-Stage Cascade | 경량 분류기가 모든 트래픽을 필터링하고 의심스러운 교환만 더 강력한 분류기로 에스컬레이션 |
| Linear Probes | 해석 가능성의 실용적인 적용: 프로브가 Claude의 내부 활성화(“직감”)를 관찰하여 의심스러운 요청을 감지 |
결과
| 지표 | 성과 |
|---|---|
| 비용 절감 | 기준 대비 40배 |
| Compute overhead | 단 ~1% |
| 프로덕션 거부율 | 0.05% |
| 오류 거부 감소 | 87% |
| Red-teaming | 1700시간 동안 보편적 탈옥 없음 |
After 1,700 cumulative hours of red-teaming, we’ve yet to identify a universal jailbreak (a consistent attack strategy that works across many queries) that works on our new system.
🇰🇷 누적 1,700시간의 레드팀 활동 후에도, 우리는 새로운 시스템에서 작동하는 보편적인 탈옥(많은 쿼리에 걸쳐 작동하는 일관된 공격 전략)을 아직 확인하지 못했습니다. — @AnthropicAI
중요한 이유
이 시스템은 Claude의 내부 활성화를 속이기 어려운 “직감”으로 사용합니다. 프로브가 의심스러운 요청을 감지하면 대화의 양쪽을 분석하는 더 강력한 “exchange” 분류기로 보냅니다. 이 계단식 아키텍처는 이전 세대의 엄청난 계산 비용 없이 강력한 보호를 가능하게 합니다.
OpenAI for Healthcare: AI, 병원에 진출
2026년 1월 8일 — OpenAI는 전날 발표된 ChatGPT Health와 별개로 헬스케어 부문 전용 엔터프라이즈 서비스를 출시했습니다.
🔗 공식 발표
ChatGPT Health와의 차이점
| 제품 | 대상 | 초점 |
|---|---|---|
| ChatGPT Health | 대중 | 개인 웰빙, 건강 앱 연결 |
| OpenAI for Healthcare | 기업 | 병원, 클리닉, 임상 워크플로우 |
ChatGPT for Healthcare
의료 기관을 위해 설계된 ChatGPT의 엔터프라이즈 버전:
- 헬스케어 최적화 모델: HealthBench에서 60개국 260명 이상의 의사가 평가한 GPT-5.2
- 투명한 의료 인용: 제목, 저널 및 날짜가 포함된 동료 심사 연구, 임상 지침의 출처가 있는 답변
- 기관 정렬: 시설의 프로토콜 및 경로를 준수하기 위한 SharePoint 통합
- 재사용 가능한 템플릿: 퇴원 요약, 환자 지침, 임상 서신, 사전 승인 지원
출시 파트너
| 기관 | 전문 분야 |
|---|---|
| Boston Children’s Hospital | 소아과 |
| Stanford Medicine Children’s Health | 소아과 |
| Memorial Sloan Kettering | 종양학 |
| Cedars-Sinai Medical Center | 종합 병원 |
| HCA Healthcare | 병원 네트워크 |
| UCSF | 학술 의료 센터 |
| AdventHealth | 병원 네트워크 |
| Baylor Scott & White Health | 병원 네트워크 |
HIPAA 규정 준수
| 측면 | 지원 |
|---|---|
| BAA | OpenAI와의 비즈니스 제휴 계약(BAA) |
| Data residency | 데이터 거주 옵션 |
| Audit logs | 포괄적인 감사 로그 |
| Encryption | 고객 관리 암호화 키 |
| 훈련 | 모델 훈련에 사용되지 않는 데이터 |
Healthcare is among the fastest-growing enterprise markets adopting AI, and hospitals and academic medical centers are already rolling out ChatGPT for Healthcare across their teams.
🇰🇷 헬스케어는 AI를 도입하는 가장 빠르게 성장하는 엔터프라이즈 시장 중 하나이며, 병원과 학술 의료 센터는 이미 팀 전체에 ChatGPT for Healthcare를 배포하고 있습니다. — OpenAI
ElevenLabs Scribe v2: 차세대 전사(Transcription)
2026년 1월 9일 — ElevenLabs는 개발자 및 기업을 위한 Scribe v2 API의 가용성을 발표했습니다.
🔗 Scribe v2 문서 | X 스레드
주요 기능
| 기능 | 세부 정보 |
|---|---|
| 언어 | 90개 이상의 언어 지원 |
| Keyterm prompting | 모델을 특정 단어로 유도하기 위한 최대 100개의 용어 |
| Entity detection | 56가지 엔티티 유형(이름, 카드 번호, 질병, SSN) |
| Speaker diarization | 최대 48명의 화자 구분 |
| Timestamps | 단어 수준의 정밀도 |
| Audio tagging | 오디오 이벤트(웃음, 박수) 자동 감지 |
실시간 버전
Scribe v2는 실시간 버전으로도 존재합니다.
| 지표 | 성과 |
|---|---|
| 지연 시간 | ~150ms |
| 언어 | 90+ |
| 전사 | WebSocket을 통한 실시간 |
엔터프라이즈 규정 준수
ElevenLabs는 HIPAA 규정 준수가 필요한 고객을 위해 비즈니스 제휴 계약(BAA)을 제공하여 의료 환경에서 Scribe v2를 사용할 수 있도록 합니다.
With Scribe v2, developers and enterprises can automate complex audio pipelines, achieve higher accuracy in global content workflows, and scale with full compliance and data residency controls.
🇰🇷 Scribe v2를 통해 개발자와 기업은 복잡한 오디오 파이프라인을 자동화하고, 글로벌 콘텐츠 워크플로우에서 더 높은 정확도를 달성하며, 완전한 규정 준수 및 데이터 거주 제어로 확장할 수 있습니다. — @elevenlabsio
이것이 의미하는 바
Anthropic은 LLM 안전 분야를 계속 주도하고 있습니다. 해석 가능성 + 분류기 계단식 배열의 조합은 우아합니다. 공격을 감지하기 위해 Claude의 “직감”을 사용하는 것은 명시적인 규칙보다 우회하기 어렵습니다. 오류 거부의 87% 감소는 엔터프라이즈 채택에 매우 중요합니다.
OpenAI는 가장 규제가 심한 분야 중 하나인 B2B 헬스케어 시장을 정면으로 공략하고 있습니다. HIPAA, BAA 및 권위 있는 병원 파트너십을 갖춘 완벽한 서비스는 OpenAI for Healthcare를 레거시 솔루션의 진지한 대안으로 자리매김하게 합니다. ChatGPT Health(B2C)와의 차별화는 성숙한 제품 전략을 보여줍니다.
ElevenLabs는 최첨단 STT로 오디오 스택을 완성합니다. TTS(음성) + STT(전사) + HIPAA 규정 준수의 조합은 엔터프라이즈 음성 애플리케이션을 위한 풀 스택 솔루션이 됩니다. Keyterm prompting은 전문 용어나 고유 명사에 특히 유용합니다.