AIニュース 2026年1月9日：Constitutional Classifiers++、OpenAI for Healthcare、Scribe v2

今週のAI

重要な発表が相次ぐ多忙な一日：Anthropicは、1700時間の集中的なレッドチーミングを経て、LLMの安全性に関する研究論文を発表しました。OpenAIは、HIPAA対応の病院向けエンタープライズ製品を開始しました。ElevenLabsは、新しい音声テキスト変換（speech-to-text）モデルであるScribe v2を公開しました。

Constitutional Classifiers++：Anthropicがセキュリティを強化

2026年1月9日 — Anthropicは、ジェイルブレイクに対する防御の堅牢性に関する重要な新しい研究論文を発表しました。

🔗 arXiv上の論文 | Xのスレッド

背景

昨年、Anthropicは「Constitutional Classifiers（憲法的分類器）」を導入しました。これは、Claudeが回答すべき質問とすべきでない質問を規定した「憲法」に基づいて分類器をトレーニングするシステムです。このシステムにより、ジェイルブレイクの成功率は86%から4.4%に減少しましたが、計算コストが高く、正当な要求を拒否する傾向があるという2つの問題がありました。

3つの主要なイノベーション

新しいConstitutional Classifiers++システムは、3つの大きな改善をもたらします：

イノベーション	説明
Exchange Classifiers	応答を完全な会話の文脈で評価し、出力を分離して検査していた以前のシステムの脆弱性を修正
Two-Stage Cascade	軽量な分類器がすべてのトラフィックをフィルタリングし、疑わしいやり取りのみをより強力な分類器にエスカレーション
Linear Probes	解釈可能性の実用化：プローブがClaudeの内部アクティベーション（「直感」）を観察し、疑わしい要求を検出

結果

指標	パフォーマンス
コスト削減	ベースラインと比較して40倍
Compute overhead	わずか〜1%
本番環境での拒否率	0.05%
誤拒否の減少	87%
Red-teaming	1700時間、普遍的なジェイルブレイクなし

After 1,700 cumulative hours of red-teaming, we’ve yet to identify a universal jailbreak (a consistent attack strategy that works across many queries) that works on our new system.

🇯🇵 累積1,700時間のレッドチーミングの後、私たちの新しいシステムで機能する普遍的なジェイルブレイク（多くのクエリで機能する一貫した攻撃戦略）はまだ特定されていません。 — @AnthropicAI

なぜ重要なのか

このシステムは、Claudeの内部アクティベーションを、騙すのが難しい「直感」として使用します。プローブが疑わしい要求を検出すると、会話の両側を分析するより強力な「エクスチェンジ」分類器に送信します。このカスケードアーキテクチャにより、以前の世代のような法外な計算コストをかけることなく、堅牢な保護が可能になります。

OpenAI for Healthcare：AIが病院へ

2026年1月8日 — OpenAIは、前日に発表されたChatGPT Healthとは別に、ヘルスケア部門向けのエンタープライズ製品を開始しました。

🔗 公式発表

ChatGPT Healthとの違い

製品	ターゲット	フォーカス
ChatGPT Health	一般大衆	個人の健康、健康アプリとの連携
OpenAI for Healthcare	企業	病院、診療所、臨床ワークフロー

ChatGPT for Healthcare

医療機関向けに設計されたChatGPTのエンタープライズ版：

医療向けに最適化されたモデル：GPT-5.2、HealthBenchで60カ国の260人以上の医師による評価済み
透明性のある医療引用：査読付き研究、臨床ガイドラインからのソース付き回答（タイトル、ジャーナル、日付を含む）
組織的な連携：SharePoint統合により、施設のプロトコルと経路を遵守
再利用可能なテンプレート：退院サマリー、患者への指示、診療情報提供書、事前承認サポート

ローンチパートナー

機関	専門
Boston Children’s Hospital	小児科
Stanford Medicine Children’s Health	小児科
Memorial Sloan Kettering	腫瘍学
Cedars-Sinai Medical Center	総合病院
HCA Healthcare	病院ネットワーク
UCSF	大学医療センター
AdventHealth	病院ネットワーク
Baylor Scott & White Health	病院ネットワーク

HIPAA準拠

側面	サポート
BAA	OpenAIとの業務提携契約（BAA）
Data residency	データレジデンシーオプション
Audit logs	包括的な監査ログ
Encryption	顧客管理の暗号化キー
トレーニング	モデルのトレーニングにデータは使用されない

Healthcare is among the fastest-growing enterprise markets adopting AI, and hospitals and academic medical centers are already rolling out ChatGPT for Healthcare across their teams.

🇯🇵 ヘルスケアはAIを採用している最も急成長しているエンタープライズ市場の1つであり、病院や大学医療センターはすでにチーム全体にChatGPT for Healthcareを展開しています。 — OpenAI

ElevenLabs Scribe v2：次世代の文字起こし

2026年1月9日 — ElevenLabsは、開発者および企業向けにScribe v2 APIの提供開始を発表しました。

🔗 Scribe v2 ドキュメント | Xのスレッド

主な機能

機能	詳細
言語	90以上の言語をサポート
Keyterm prompting	特定の単語にモデルを誘導するための最大100の用語
Entity detection	56のエンティティタイプ（名前、カード番号、病状、SSN）
Speaker diarization	最大48人の異なる話者
Timestamps	単語レベルの精度
Audio tagging	音声イベント（笑い声、拍手）の自動検出

リアルタイム版

Scribe v2にはリアルタイム版も存在します：

指標	パフォーマンス
レイテンシ	〜150ms
言語	90+
文字起こし	WebSocket経由のリアルタイム

エンタープライズ準拠

ElevenLabsは、HIPAA準拠を必要とするクライアント向けに業務提携契約（BAA）を提供しており、Scribe v2を医療現場で使用できるようにしています。

With Scribe v2, developers and enterprises can automate complex audio pipelines, achieve higher accuracy in global content workflows, and scale with full compliance and data residency controls.

🇯🇵 Scribe v2を使用すると、開発者や企業は複雑なオーディオパイプラインを自動化し、グローバルコンテンツワークフローでより高い精度を達成し、完全なコンプライアンスとデータレジデンシー制御でスケーリングできます。 — @elevenlabsio

これが意味すること

AnthropicはLLMの安全性においてリードし続けています。解釈可能性と分類器のカスケードの組み合わせはエレガントです。攻撃を検出するためにClaudeの「直感」を使用することは、明示的なルールよりも回避するのが困難です。誤拒否の87%削減は、エンタープライズ導入にとって不可欠です。

OpenAIは、最も規制の厳しいセクターの1つであるB2Bヘルスケア市場に正面から取り組んでいます。HIPAA、BAA、および権威ある病院とのパートナーシップを備えた完全な製品は、OpenAI for Healthcareをレガシーソリューションの深刻な代替手段として位置付けています。ChatGPT Health（B2C）との差別化は、成熟した製品戦略を示しています。

ElevenLabsは、最先端のSTTでオーディオスタックを完成させました。TTS（音声）+ STT（文字起こし）+ HIPAA準拠の組み合わせにより、エンタープライズ音声アプリケーション向けのフルスタックソリューションになります。Keyterm promptingは、専門用語や固有名詞に特に役立ちます。