AI 뉴스 2026년 1월 9일: Constitutional Classifiers++, OpenAI for Healthcare, Scribe v2

이번 주 AI 소식

주요 발표로 가득 찬 바쁜 하루입니다. Anthropic은 1700시간의 집중적인 레드팀 활동 후 LLM 안전에 관한 연구 논문을 발표했습니다. OpenAI는 HIPAA 지원을 포함한 병원 전용 엔터프라이즈 서비스를 출시했습니다. ElevenLabs는 새로운 음성 텍스트 변환(speech-to-text) 모델인 Scribe v2를 공개했습니다.

Constitutional Classifiers++: Anthropic, 보안 강화

2026년 1월 9일 — Anthropic은 탈옥(jailbreak)에 대한 방어 견고성에 관한 중요한 새 연구 논문을 발표했습니다.

🔗 arXiv 논문 | X 스레드

배경

작년에 Anthropic은 Claude가 답변해야 할 질문과 답변하지 말아야 할 질문을 명시한 “헌법”을 기반으로 분류기를 훈련하는 시스템인 Constitutional Classifiers를 도입했습니다. 이 시스템은 탈옥 성공률을 86%에서 4.4%로 줄였지만, 두 가지 문제가 있었습니다. 계산 비용이 많이 들고 정당한 요청을 거부하는 경향이 있었습니다.

세 가지 핵심 혁신

새로운 Constitutional Classifiers++ 시스템은 세 가지 주요 개선 사항을 제공합니다.

혁신	설명
Exchange Classifiers	출력을 고립적으로 검토하던 이전 시스템의 취약점을 수정하여 전체 대화 맥락에서 응답을 평가
Two-Stage Cascade	경량 분류기가 모든 트래픽을 필터링하고 의심스러운 교환만 더 강력한 분류기로 에스컬레이션
Linear Probes	해석 가능성의 실용적인 적용: 프로브가 Claude의 내부 활성화(“직감”)를 관찰하여 의심스러운 요청을 감지

결과

지표	성과
비용 절감	기준 대비 40배
Compute overhead	단 ~1%
프로덕션 거부율	0.05%
오류 거부 감소	87%
Red-teaming	1700시간 동안 보편적 탈옥 없음

After 1,700 cumulative hours of red-teaming, we’ve yet to identify a universal jailbreak (a consistent attack strategy that works across many queries) that works on our new system.

🇰🇷 누적 1,700시간의 레드팀 활동 후에도, 우리는 새로운 시스템에서 작동하는 보편적인 탈옥(많은 쿼리에 걸쳐 작동하는 일관된 공격 전략)을 아직 확인하지 못했습니다. — @AnthropicAI

중요한 이유

이 시스템은 Claude의 내부 활성화를 속이기 어려운 “직감”으로 사용합니다. 프로브가 의심스러운 요청을 감지하면 대화의 양쪽을 분석하는 더 강력한 “exchange” 분류기로 보냅니다. 이 계단식 아키텍처는 이전 세대의 엄청난 계산 비용 없이 강력한 보호를 가능하게 합니다.

OpenAI for Healthcare: AI, 병원에 진출

2026년 1월 8일 — OpenAI는 전날 발표된 ChatGPT Health와 별개로 헬스케어 부문 전용 엔터프라이즈 서비스를 출시했습니다.

🔗 공식 발표

ChatGPT Health와의 차이점

제품	대상	초점
ChatGPT Health	대중	개인 웰빙, 건강 앱 연결
OpenAI for Healthcare	기업	병원, 클리닉, 임상 워크플로우

ChatGPT for Healthcare

의료 기관을 위해 설계된 ChatGPT의 엔터프라이즈 버전:

헬스케어 최적화 모델: HealthBench에서 60개국 260명 이상의 의사가 평가한 GPT-5.2
투명한 의료 인용: 제목, 저널 및 날짜가 포함된 동료 심사 연구, 임상 지침의 출처가 있는 답변
기관 정렬: 시설의 프로토콜 및 경로를 준수하기 위한 SharePoint 통합
재사용 가능한 템플릿: 퇴원 요약, 환자 지침, 임상 서신, 사전 승인 지원

출시 파트너

기관	전문 분야
Boston Children’s Hospital	소아과
Stanford Medicine Children’s Health	소아과
Memorial Sloan Kettering	종양학
Cedars-Sinai Medical Center	종합 병원
HCA Healthcare	병원 네트워크
UCSF	학술 의료 센터
AdventHealth	병원 네트워크
Baylor Scott & White Health	병원 네트워크

HIPAA 규정 준수

측면	지원
BAA	OpenAI와의 비즈니스 제휴 계약(BAA)
Data residency	데이터 거주 옵션
Audit logs	포괄적인 감사 로그
Encryption	고객 관리 암호화 키
훈련	모델 훈련에 사용되지 않는 데이터

Healthcare is among the fastest-growing enterprise markets adopting AI, and hospitals and academic medical centers are already rolling out ChatGPT for Healthcare across their teams.

🇰🇷 헬스케어는 AI를 도입하는 가장 빠르게 성장하는 엔터프라이즈 시장 중 하나이며, 병원과 학술 의료 센터는 이미 팀 전체에 ChatGPT for Healthcare를 배포하고 있습니다. — OpenAI

ElevenLabs Scribe v2: 차세대 전사(Transcription)

2026년 1월 9일 — ElevenLabs는 개발자 및 기업을 위한 Scribe v2 API의 가용성을 발표했습니다.

🔗 Scribe v2 문서 | X 스레드

주요 기능

기능	세부 정보
언어	90개 이상의 언어 지원
Keyterm prompting	모델을 특정 단어로 유도하기 위한 최대 100개의 용어
Entity detection	56가지 엔티티 유형(이름, 카드 번호, 질병, SSN)
Speaker diarization	최대 48명의 화자 구분
Timestamps	단어 수준의 정밀도
Audio tagging	오디오 이벤트(웃음, 박수) 자동 감지

실시간 버전

Scribe v2는 실시간 버전으로도 존재합니다.

지표	성과
지연 시간	~150ms
언어	90+
전사	WebSocket을 통한 실시간

엔터프라이즈 규정 준수

ElevenLabs는 HIPAA 규정 준수가 필요한 고객을 위해 비즈니스 제휴 계약(BAA)을 제공하여 의료 환경에서 Scribe v2를 사용할 수 있도록 합니다.

With Scribe v2, developers and enterprises can automate complex audio pipelines, achieve higher accuracy in global content workflows, and scale with full compliance and data residency controls.

🇰🇷 Scribe v2를 통해 개발자와 기업은 복잡한 오디오 파이프라인을 자동화하고, 글로벌 콘텐츠 워크플로우에서 더 높은 정확도를 달성하며, 완전한 규정 준수 및 데이터 거주 제어로 확장할 수 있습니다. — @elevenlabsio

이것이 의미하는 바

Anthropic은 LLM 안전 분야를 계속 주도하고 있습니다. 해석 가능성 + 분류기 계단식 배열의 조합은 우아합니다. 공격을 감지하기 위해 Claude의 “직감”을 사용하는 것은 명시적인 규칙보다 우회하기 어렵습니다. 오류 거부의 87% 감소는 엔터프라이즈 채택에 매우 중요합니다.

OpenAI는 가장 규제가 심한 분야 중 하나인 B2B 헬스케어 시장을 정면으로 공략하고 있습니다. HIPAA, BAA 및 권위 있는 병원 파트너십을 갖춘 완벽한 서비스는 OpenAI for Healthcare를 레거시 솔루션의 진지한 대안으로 자리매김하게 합니다. ChatGPT Health(B2C)와의 차별화는 성숙한 제품 전략을 보여줍니다.

ElevenLabs는 최첨단 STT로 오디오 스택을 완성합니다. TTS(음성) + STT(전사) + HIPAA 규정 준수의 조합은 엔터프라이즈 음성 애플리케이션을 위한 풀 스택 솔루션이 됩니다. Keyterm prompting은 전문 용어나 고유 명사에 특히 유용합니다.