今週のAI
重要な発表が相次ぐ多忙な一日:Anthropicは、1700時間の集中的なレッドチーミングを経て、LLMの安全性に関する研究論文を発表しました。OpenAIは、HIPAA対応の病院向けエンタープライズ製品を開始しました。ElevenLabsは、新しい音声テキスト変換(speech-to-text)モデルであるScribe v2を公開しました。
Constitutional Classifiers++:Anthropicがセキュリティを強化
2026年1月9日 — Anthropicは、ジェイルブレイクに対する防御の堅牢性に関する重要な新しい研究論文を発表しました。
背景
昨年、Anthropicは「Constitutional Classifiers(憲法的分類器)」を導入しました。これは、Claudeが回答すべき質問とすべきでない質問を規定した「憲法」に基づいて分類器をトレーニングするシステムです。このシステムにより、ジェイルブレイクの成功率は86%から4.4%に減少しましたが、計算コストが高く、正当な要求を拒否する傾向があるという2つの問題がありました。
3つの主要なイノベーション
新しいConstitutional Classifiers++システムは、3つの大きな改善をもたらします:
| イノベーション | 説明 |
|---|---|
| Exchange Classifiers | 応答を完全な会話の文脈で評価し、出力を分離して検査していた以前のシステムの脆弱性を修正 |
| Two-Stage Cascade | 軽量な分類器がすべてのトラフィックをフィルタリングし、疑わしいやり取りのみをより強力な分類器にエスカレーション |
| Linear Probes | 解釈可能性の実用化:プローブがClaudeの内部アクティベーション(「直感」)を観察し、疑わしい要求を検出 |
結果
| 指標 | パフォーマンス |
|---|---|
| コスト削減 | ベースラインと比較して40倍 |
| Compute overhead | わずか〜1% |
| 本番環境での拒否率 | 0.05% |
| 誤拒否の減少 | 87% |
| Red-teaming | 1700時間、普遍的なジェイルブレイクなし |
After 1,700 cumulative hours of red-teaming, we’ve yet to identify a universal jailbreak (a consistent attack strategy that works across many queries) that works on our new system.
🇯🇵 累積1,700時間のレッドチーミングの後、私たちの新しいシステムで機能する普遍的なジェイルブレイク(多くのクエリで機能する一貫した攻撃戦略)はまだ特定されていません。 — @AnthropicAI
なぜ重要なのか
このシステムは、Claudeの内部アクティベーションを、騙すのが難しい「直感」として使用します。プローブが疑わしい要求を検出すると、会話の両側を分析するより強力な「エクスチェンジ」分類器に送信します。このカスケードアーキテクチャにより、以前の世代のような法外な計算コストをかけることなく、堅牢な保護が可能になります。
OpenAI for Healthcare:AIが病院へ
2026年1月8日 — OpenAIは、前日に発表されたChatGPT Healthとは別に、ヘルスケア部門向けのエンタープライズ製品を開始しました。
🔗 公式発表
ChatGPT Healthとの違い
| 製品 | ターゲット | フォーカス |
|---|---|---|
| ChatGPT Health | 一般大衆 | 個人の健康、健康アプリとの連携 |
| OpenAI for Healthcare | 企業 | 病院、診療所、臨床ワークフロー |
ChatGPT for Healthcare
医療機関向けに設計されたChatGPTのエンタープライズ版:
- 医療向けに最適化されたモデル:GPT-5.2、HealthBenchで60カ国の260人以上の医師による評価済み
- 透明性のある医療引用:査読付き研究、臨床ガイドラインからのソース付き回答(タイトル、ジャーナル、日付を含む)
- 組織的な連携:SharePoint統合により、施設のプロトコルと経路を遵守
- 再利用可能なテンプレート:退院サマリー、患者への指示、診療情報提供書、事前承認サポート
ローンチパートナー
| 機関 | 専門 |
|---|---|
| Boston Children’s Hospital | 小児科 |
| Stanford Medicine Children’s Health | 小児科 |
| Memorial Sloan Kettering | 腫瘍学 |
| Cedars-Sinai Medical Center | 総合病院 |
| HCA Healthcare | 病院ネットワーク |
| UCSF | 大学医療センター |
| AdventHealth | 病院ネットワーク |
| Baylor Scott & White Health | 病院ネットワーク |
HIPAA準拠
| 側面 | サポート |
|---|---|
| BAA | OpenAIとの業務提携契約(BAA) |
| Data residency | データレジデンシーオプション |
| Audit logs | 包括的な監査ログ |
| Encryption | 顧客管理の暗号化キー |
| トレーニング | モデルのトレーニングにデータは使用されない |
Healthcare is among the fastest-growing enterprise markets adopting AI, and hospitals and academic medical centers are already rolling out ChatGPT for Healthcare across their teams.
🇯🇵 ヘルスケアはAIを採用している最も急成長しているエンタープライズ市場の1つであり、病院や大学医療センターはすでにチーム全体にChatGPT for Healthcareを展開しています。 — OpenAI
ElevenLabs Scribe v2:次世代の文字起こし
2026年1月9日 — ElevenLabsは、開発者および企業向けにScribe v2 APIの提供開始を発表しました。
主な機能
| 機能 | 詳細 |
|---|---|
| 言語 | 90以上の言語をサポート |
| Keyterm prompting | 特定の単語にモデルを誘導するための最大100の用語 |
| Entity detection | 56のエンティティタイプ(名前、カード番号、病状、SSN) |
| Speaker diarization | 最大48人の異なる話者 |
| Timestamps | 単語レベルの精度 |
| Audio tagging | 音声イベント(笑い声、拍手)の自動検出 |
リアルタイム版
Scribe v2にはリアルタイム版も存在します:
| 指標 | パフォーマンス |
|---|---|
| レイテンシ | 〜150ms |
| 言語 | 90+ |
| 文字起こし | WebSocket経由のリアルタイム |
エンタープライズ準拠
ElevenLabsは、HIPAA準拠を必要とするクライアント向けに業務提携契約(BAA)を提供しており、Scribe v2を医療現場で使用できるようにしています。
With Scribe v2, developers and enterprises can automate complex audio pipelines, achieve higher accuracy in global content workflows, and scale with full compliance and data residency controls.
🇯🇵 Scribe v2を使用すると、開発者や企業は複雑なオーディオパイプラインを自動化し、グローバルコンテンツワークフローでより高い精度を達成し、完全なコンプライアンスとデータレジデンシー制御でスケーリングできます。 — @elevenlabsio
これが意味すること
AnthropicはLLMの安全性においてリードし続けています。解釈可能性と分類器のカスケードの組み合わせはエレガントです。攻撃を検出するためにClaudeの「直感」を使用することは、明示的なルールよりも回避するのが困難です。誤拒否の87%削減は、エンタープライズ導入にとって不可欠です。
OpenAIは、最も規制の厳しいセクターの1つであるB2Bヘルスケア市場に正面から取り組んでいます。HIPAA、BAA、および権威ある病院とのパートナーシップを備えた完全な製品は、OpenAI for Healthcareをレガシーソリューションの深刻な代替手段として位置付けています。ChatGPT Health(B2C)との差別化は、成熟した製品戦略を示しています。
ElevenLabsは、最先端のSTTでオーディオスタックを完成させました。TTS(音声)+ STT(文字起こし)+ HIPAA準拠の組み合わせにより、エンタープライズ音声アプリケーション向けのフルスタックソリューションになります。Keyterm promptingは、専門用語や固有名詞に特に役立ちます。