検索

AIニュース 2026年1月9日:Constitutional Classifiers++、OpenAI for Healthcare、Scribe v2

AIニュース 2026年1月9日:Constitutional Classifiers++、OpenAI for Healthcare、Scribe v2

今週のAI

重要な発表が相次ぐ多忙な一日:Anthropicは、1700時間の集中的なレッドチーミングを経て、LLMの安全性に関する研究論文を発表しました。OpenAIは、HIPAA対応の病院向けエンタープライズ製品を開始しました。ElevenLabsは、新しい音声テキスト変換(speech-to-text)モデルであるScribe v2を公開しました。


Constitutional Classifiers++:Anthropicがセキュリティを強化

2026年1月9日 — Anthropicは、ジェイルブレイクに対する防御の堅牢性に関する重要な新しい研究論文を発表しました。

🔗 arXiv上の論文 | Xのスレッド

背景

昨年、Anthropicは「Constitutional Classifiers(憲法的分類器)」を導入しました。これは、Claudeが回答すべき質問とすべきでない質問を規定した「憲法」に基づいて分類器をトレーニングするシステムです。このシステムにより、ジェイルブレイクの成功率は86%から4.4%に減少しましたが、計算コストが高く、正当な要求を拒否する傾向があるという2つの問題がありました。

3つの主要なイノベーション

新しいConstitutional Classifiers++システムは、3つの大きな改善をもたらします:

イノベーション説明
Exchange Classifiers応答を完全な会話の文脈で評価し、出力を分離して検査していた以前のシステムの脆弱性を修正
Two-Stage Cascade軽量な分類器がすべてのトラフィックをフィルタリングし、疑わしいやり取りのみをより強力な分類器にエスカレーション
Linear Probes解釈可能性の実用化:プローブがClaudeの内部アクティベーション(「直感」)を観察し、疑わしい要求を検出

結果

指標パフォーマンス
コスト削減ベースラインと比較して40倍
Compute overheadわずか〜1%
本番環境での拒否率0.05%
誤拒否の減少87%
Red-teaming1700時間、普遍的なジェイルブレイクなし

After 1,700 cumulative hours of red-teaming, we’ve yet to identify a universal jailbreak (a consistent attack strategy that works across many queries) that works on our new system.

🇯🇵 累積1,700時間のレッドチーミングの後、私たちの新しいシステムで機能する普遍的なジェイルブレイク(多くのクエリで機能する一貫した攻撃戦略)はまだ特定されていません。@AnthropicAI

なぜ重要なのか

このシステムは、Claudeの内部アクティベーションを、騙すのが難しい「直感」として使用します。プローブが疑わしい要求を検出すると、会話の両側を分析するより強力な「エクスチェンジ」分類器に送信します。このカスケードアーキテクチャにより、以前の世代のような法外な計算コストをかけることなく、堅牢な保護が可能になります。


OpenAI for Healthcare:AIが病院へ

2026年1月8日 — OpenAIは、前日に発表されたChatGPT Healthとは別に、ヘルスケア部門向けのエンタープライズ製品を開始しました。

🔗 公式発表

ChatGPT Healthとの違い

製品ターゲットフォーカス
ChatGPT Health一般大衆個人の健康、健康アプリとの連携
OpenAI for Healthcare企業病院、診療所、臨床ワークフロー

ChatGPT for Healthcare

医療機関向けに設計されたChatGPTのエンタープライズ版:

  • 医療向けに最適化されたモデル:GPT-5.2、HealthBenchで60カ国の260人以上の医師による評価済み
  • 透明性のある医療引用:査読付き研究、臨床ガイドラインからのソース付き回答(タイトル、ジャーナル、日付を含む)
  • 組織的な連携:SharePoint統合により、施設のプロトコルと経路を遵守
  • 再利用可能なテンプレート:退院サマリー、患者への指示、診療情報提供書、事前承認サポート

ローンチパートナー

機関専門
Boston Children’s Hospital小児科
Stanford Medicine Children’s Health小児科
Memorial Sloan Kettering腫瘍学
Cedars-Sinai Medical Center総合病院
HCA Healthcare病院ネットワーク
UCSF大学医療センター
AdventHealth病院ネットワーク
Baylor Scott & White Health病院ネットワーク

HIPAA準拠

側面サポート
BAAOpenAIとの業務提携契約(BAA)
Data residencyデータレジデンシーオプション
Audit logs包括的な監査ログ
Encryption顧客管理の暗号化キー
トレーニングモデルのトレーニングにデータは使用されない

Healthcare is among the fastest-growing enterprise markets adopting AI, and hospitals and academic medical centers are already rolling out ChatGPT for Healthcare across their teams.

🇯🇵 ヘルスケアはAIを採用している最も急成長しているエンタープライズ市場の1つであり、病院や大学医療センターはすでにチーム全体にChatGPT for Healthcareを展開しています。OpenAI


ElevenLabs Scribe v2:次世代の文字起こし

2026年1月9日 — ElevenLabsは、開発者および企業向けにScribe v2 APIの提供開始を発表しました。

🔗 Scribe v2 ドキュメント | Xのスレッド

主な機能

機能詳細
言語90以上の言語をサポート
Keyterm prompting特定の単語にモデルを誘導するための最大100の用語
Entity detection56のエンティティタイプ(名前、カード番号、病状、SSN)
Speaker diarization最大48人の異なる話者
Timestamps単語レベルの精度
Audio tagging音声イベント(笑い声、拍手)の自動検出

リアルタイム版

Scribe v2にはリアルタイム版も存在します:

指標パフォーマンス
レイテンシ〜150ms
言語90+
文字起こしWebSocket経由のリアルタイム

エンタープライズ準拠

ElevenLabsは、HIPAA準拠を必要とするクライアント向けに業務提携契約(BAA)を提供しており、Scribe v2を医療現場で使用できるようにしています。

With Scribe v2, developers and enterprises can automate complex audio pipelines, achieve higher accuracy in global content workflows, and scale with full compliance and data residency controls.

🇯🇵 Scribe v2を使用すると、開発者や企業は複雑なオーディオパイプラインを自動化し、グローバルコンテンツワークフローでより高い精度を達成し、完全なコンプライアンスとデータレジデンシー制御でスケーリングできます。@elevenlabsio


これが意味すること

AnthropicはLLMの安全性においてリードし続けています。解釈可能性と分類器のカスケードの組み合わせはエレガントです。攻撃を検出するためにClaudeの「直感」を使用することは、明示的なルールよりも回避するのが困難です。誤拒否の87%削減は、エンタープライズ導入にとって不可欠です。

OpenAIは、最も規制の厳しいセクターの1つであるB2Bヘルスケア市場に正面から取り組んでいます。HIPAA、BAA、および権威ある病院とのパートナーシップを備えた完全な製品は、OpenAI for Healthcareをレガシーソリューションの深刻な代替手段として位置付けています。ChatGPT Health(B2C)との差別化は、成熟した製品戦略を示しています。

ElevenLabsは、最先端のSTTでオーディオスタックを完成させました。TTS(音声)+ STT(文字起こし)+ HIPAA準拠の組み合わせにより、エンタープライズ音声アプリケーション向けのフルスタックソリューションになります。Keyterm promptingは、専門用語や固有名詞に特に役立ちます。


ソース