検索

OpenAIが1220億ドルを調達、Qwen3.5-OmniとClaude Codeの15の隠れ機能

OpenAIが1220億ドルを調達、Qwen3.5-OmniとClaude Codeの15の隠れ機能

月末を支配した発表は三つ:OpenAIが評価額8520億ドルで史上最大級の民間資金調達を1220億ドルで完了、Qwenが視覚・聴覚・コーディングを同時に扱えるネイティブなオムニモーダルモデルを発表、そしてClaude Codeの責任者が同ツールの未発見の15機能を公開するスレッドを投稿しました。週の他のハイライトは、PerplexityのSecure Intelligence Instituteの立ち上げ、GitHub Copilotの新ツール、Runway と NVIDIA によるインフラ関連の取り組みです。


OpenAIが1220億ドルを調達

3月31日 — OpenAIは、1220億ドルの出資を得て、ポストマネーで評価額8520億ドルとなる最新の資金調達ラウンドのクロージングを発表しました。これはテック史上最大級の民間資金調達ラウンドの一つです。

ラウンドはSoftBankとa16zが共同で主導し、Amazon、NVIDIA、Microsoftが戦略的に参加しました。OpenAIは初めて銀行を通じて個人投資家にも参加機会を拡大し、個人から30億ドル超を調達しました。ARK Investは複数の上場インデックスファンド(ETF)にもOpenAIを組み入れます。

この調達を受けて、OpenAIは成長メトリクスを公開しています:

IndicateurValeur
Utilisateurs actifs hebdomadaires ChatGPT900 millions
Abonnés payants ChatGPT50 millions
Revenus mensuels2 milliards de dollars
Tokens traités par l’API (par minute)15 milliards
Utilisateurs hebdomadaires Codex2 millions (+5× en 3 mois)
Croissance Codex d’un mois sur l’autre+70%

同社は「AIスーパ―アプリ」(AI superapp) を軸にしたロードマップを掲げています:ChatGPT、Codex、Web検索、エージェント型ワークフローを統合する単一インターフェースで、週次アクティブユーザー数10億超を目標としています。法人顧客は既に収益の40%を占めています。

最新モデルのGPT-5.4は、推論、コーディング、エージェントワークフローにおける改善をもたらすと説明されています。OpenAIの成長速度は、同段階のGoogleやMetaの4倍とされています。

🔗 OpenAI公式発表


Qwen3.5-Omni:ネイティブオムニモーダルモデル

3月29日 — AlibabaのQwenはQwen3.5-Omniを発表しました。これはテキスト、画像、音声、ビデオを単一の統合モデルでネイティブに扱うよう設計されたモデルです。従来のようにモダリティを層的に追加するのではなく、これらの入力を同時に処理します。

生の処理能力は大きく、ネイティブで最大10時間の音声または720p動画400秒を扱い、1億時間超のデータで訓練され、113言語の音声認識と36言語での表現が可能です。

主要機能:Audio-Visual Vibe Coding

もっとも直接活用できる機能は「Audio-Visual Vibe Coding」です。ユーザーがカメラの前でプロジェクトを声で説明すると、Qwen3.5-Omni-Plusが動作するウェブサイトやゲームを生成します。これは意図に基づくコーディング(vibe coding)を音声とビデオに拡張した応用です。

ベンチマーク比較

CatégorieQwen3.5-Omni-PlusGemini 3.1 Pro
DailyOmni (audio/vision)84,682,7
WorldScene62,865,5
QualocommInteractive68,552,3
OmniClear64,855,5
IFEval (texte)89,793,5
MMLU-Redux94,290,0

このモデルは音声ベンチマークでGemini 3.1 Proを上回り、音声視覚理解では同等の性能を示しています。

音声機能

  • 精密な音声制御:感情、リズム、音量をリアルタイムに調整
  • 短いサンプルからの音声クローン(Voice Cloning)— エンジニアリングでの展開が近日予定
  • 意図を理解して雑音を無視するスマートな発話制御(Semantic Interruption)
  • 組み込みのウェブ検索と複雑な関数呼び出し

モデルファミリー

VariantePositionnement
Qwen3.5-Omni-PlusSOTAパフォーマンス、詳細な音声映像キャプショニング
Qwen3.5-Omni-Plus-RealtimeVoice Control, WebSearch, Voice Clone, Semantic Interruption
Qwen3.5-Omni-Flash高速性
Qwen3.5-Omni-Light軽量性

chat.qwen.ai(VoiceChat/VideoChatボタン)とAlibaba CloudのAPIでアクセス可能です。

補足: Qwen 3.6 Plus Previewは期間限定でOpenRouter上で無料利用可能 — その期間の対話はモデル改善のために収集されます。

🔗 ツイート @Alibaba_Qwen


Claude Codeの隠れた15機能

3月30日 — AnthropicのClaude Code担当責任者であるBoris Chernyが、ツールに関するあまり文書化されていない15の機能を明かすスレッドを投稿しました。スレッドは360万回の閲覧、2,000のリポスト、22,000のいいねを記録しました。

“I wanted to share a bunch of my favorite hidden and under-utilized features in Claude Code. I’ll focus on the ones I use the most. Here goes.”

🇯🇵 Claude Codeであまり知られておらず十分に活用されていない、私のお気に入りの機能のいくつかを共有したいと思いました。特に私が最も多く使っているものに焦点を当てます。それでは始めます。@bcherny の X

モビリティとリモートセッション

  • iOSおよびAndroidのClaudeアプリにはCodeタブがあり、携帯からコーディングできます
  • --teleport(または /teleport)でクラウドセッションをローカルマシンに切り替えられ、/remote-controlで任意のデバイスからローカルセッションを操作できます
  • Cowork Dispatch:モバイルからClaude Desktop Appを安全にリモート制御でき、MCP(Model Context Protocol)サーバやブラウザなどにアクセス可能

自動化

  • /loop/schedule で最大1週間までの定期的な自動起動が可能 — Chernyはレビューと自動リベースを継続的に行うために /loop 5m /babysit を使用しています
  • フック(SessionStart, PreToolUse 等)でエージェントサイクルに決定論的ロジックを注入でき、例えば権限要求をWhatsAppにルーティングすることなどが可能です

並列処理

  • /batch は数十、数百、場合によっては数千のエージェントへ並列に仕事を分配します — 大規模なコード移行に有用
  • claude -w は別個の git worktrees(ワークツリー)で並列セッションを起動します

日常の生産性

  • /btw により、エージェントが作業中でも中断せずにクイックな質問を投げられます
  • /branch でセッションをフォークでき、CLI経由では claude --resume <session-id> --fork-session を使用します
  • --agent.claude/agents/ 内にカスタムエージェントを定義でき、プロンプトとツールを設定可能
  • --add-dir / /add-dir により、Claudeは複数のフォルダやリポジトリに同時アクセスできます
  • --bare はSDKの起動を最大10×高速化します(CLAUDE.md、設定、MCPサーバの読み込みを回避)
  • /voice は音声入力を有効にします(CLIではスペースバー、Desktopでは専用ボタン、iOSの音声入力)
  • Chrome拡張(ベータ):Claude Code + Chromeでウェブアプリのテスト、コンソールログのデバッグ、ブラウザ自動化が可能

🔗 スレッド全文 @bcherny


Claude Code:Auto modeがEnterpriseとAPIにも拡大

3月30日 — 3月24日にProとMaxユーザー向けに導入されたClaude Codeのauto modeが、EnterpriseプランとAPIアクセスの開発者向けにも提供されるようになりました。この機能は、ファイル作成やbashコマンドなどのアクションについて、毎回ユーザーに確認を求める代わりにClaudeが自ら承認判断を下せるようにします。

EnterpriseまたはAPI環境で有効化するには:

claude --enable-auto-mode

Auto modeは、各アクションのリスクを評価する内部の分類器に基づき、許容モード(--dangerously-skip-permissions)と手動承認のバランスを取ります。

3月30日 — Cowork Dispatchは、自然言語で直接指定されたモデルを使ってコーディングタスクを開始できるようになりました。

🔗 ツイート @claudeai


PerplexityがSecure Intelligence Instituteを立ち上げ

3月31日 — PerplexityはSecure Intelligence Institute(SII)を立ち上げました。これは高度なAIシステムのセキュリティ、プライバシー、安全性に専念する研究ラボです。研究所はPurdue大学のSamuel D. Conte教授職にあるDr. Ninghui Liが率い、Dan Bonehの応用暗号グループやNeil GongのGong Labなどとの学術連携を含みます。

SIIは初期の3つの成果物を公開しました:

PublicationTypeDescription
BrowseSafeBenchmark open-source14 700+の実際の攻撃シナリオ、AIによるナビゲーションの14カテゴリのリスク
Sécurisation des agents NIST/CAISIPolitique自律エージェントのセキュリティに関するRFI(Request for Information)への回答
Building Security Into CometArchitectureAIブラウザCometの多層防御設計

SIIは研究成果をPerplexityのシステム改善に反映し、AIエコシステムと成果を共有していきます。

🔗 Secure Intelligence Institute(SII)


CohereとEnsemble:医療の収益サイクル管理に特化したLLM

3月31日 — CohereとEnsembleは、米国医療業界向けの収益サイクル管理(Revenue Cycle Management / RCM)に特化したネイティブな大規模言語モデル(LLM)を構築すると発表しました。

Ensembleは、病院や医療グループに対して、予約から最終請求までのエンドツーエンドのソリューションを提供します。一般的なLLMを特化したプロンプトで使う既存の提供と違い、このモデルはCohereのCommandファミリーに基づき完全にカスタマイズされています。

DomaineCapacité
Financier提出前の支払い拒否予測、継続的な請求品質管理
Clinique診療現場での文書化支援、着信記録の組み立て
Agentique収益サイクルのマルチステップオーケストレーション

モデルはCohereの事前学習データ、Ensembleの運用ログ、公開RCM知識ソース、業界専門家の注釈で訓練されました。ドメイン固有の評価フレームワーク(benchmark)を共同で開発し、RCMの実タスクで一般的なLLMと性能比較を行います。

🔗 Cohereブログ


GitHub Copilot:エージェントファースト開発とSlack統合

3月31日 — GitHubのCopilot Applied Scienceチームのシニアリサーチャー、Tyler McGoffinが、Copilotを主要なコーディングエージェントとして活用した社内ツールの構築についての回顧を公開しました。ツールはTerminalBench2やSWEBench-Proのようなベンチマークでエージェントの軌跡解析を自動化します。

紹介された実践例:コード前に /plan モードを使うこと、人間だけが変更できる「契約テスト」(contract tests) を作ること、短文ではなく詳細なプロンプトを使うこと、毎週の自動メンテナンスを /plan Review the code for any missing tests... で行うこと。結論は、人間の優れたエンジニアに求められる計画性、コンテクスト、コミュニケーション能力はエージェントと協働する際にも同じだということです。

3月30日 — GitHubのSlackアプリがCopilotを統合し、自然言語から直接GitHubのIssueを作成できるようになりました。任意のチャンネルで @GitHub をメンションして作業内容を記述するだけです。

FonctionnalitéDétail
Création en langage naturel説明 → 構造化されたIssue(タイトル、本文、担当者、ラベル、マイルストーン)
Sous-issues1つのメッセージから親/子のIssueに分割
Mode conversation作成前にIssueを対話的に反復

3月31日 — GitHubは、サードパーティアプリにエージェント型ワークフローを組み込むためのCopilot SDKを、3つのアーキテクチャモデルで発表しました。

🔗 GitHubブログ - エージェント駆動開発 🔗 GitHub チェンジログ - Slack から Issues を作成


Runway:投資ファンドとスタートアッププログラム

3月31日 — Runwayは同時に二つのイニシアチブを発表しました。

Runway Fundは、AI、メディア、世界のシミュレーション領域のアーリーステージスタートアップ向けの投資ファンドです。初期のコミット額は最大1,000万ドルで、プレシード/シード段階に最大50万ドルの投資を行います。重点は三つ:世界モデルと生成AIの研究、LLM上のアプリケーション層、新しいメディアとコンテンツ。既にCartesia、LanceDB、Tamarind Bioへの投資が行われています。

Runway Buildersは、生成ビデオやリアルタイム会話型AIを用いた製品を構築するスタートアップ向けの支援プログラムで、シードからシリーズCまでを対象とします。参加者にはAPIクレジットの提供、最高のレートリミット、プライベートコミュニティへのアクセスが与えられます。

🔗 Runway Fund 🔗 Runway Builders


NVIDIA と Emerald AI:電力網上の柔軟なAIファクトリー

3月31日 — NVIDIAとEmerald AIはCERAWeekで、AIファクトリー(AI工場)を固定負荷ではなく電力網の柔軟な資産として扱う新しいアプローチを発表しました。アーキテクチャはNVIDIA Vera Rubin DSXとEmerald AIのConductorプラットフォームに基づきます。

発表パートナーにはAES、Constellation、Invenergy、NextEra Energy、Nscale Energy、Vistraが含まれます。関連発表:

  • Maximo:Bellefieldで稼働中の100MWのロボット式太陽光発電設置(NVIDIA Isaac Sim採用)
  • TerraPower + SoftServe:NVIDIA Omniverseを使った原子力発電所Natirum設計のデジタルツインで設計期間短縮
  • Adaptive Construction Solutions:AI工場建設の全国的な訓練プログラム
  • GE Vernova、Schneider Electric、Vertiv:Vera Rubin向けの参照設計(reference designs)検証

Jensen Huangは、エネルギーを「5層のAIケーキ」の基盤層と表現しました。

🔗 NVIDIAブログ - AIファクトリー


短報

Gemini Live on Gemini 3.1 Flash Live3月30日 — Googleは、Gemini LiveアプリでモデルGemini 3.1 Flash Liveを展開したことを確認しました。すべてのユーザーが利用可能です。 この移行(3月26日に発表)は、より自然な音声会話と雑音の多い環境での精度向上をもたらします。🔗 GeminiAppのツイート

Manus : Desktopを電話から操作3月30日 — ManusはスマートフォンからDesktopアプリを操作する機能を追加しました:タスクの開始、ファイルへのアクセス、ワークフローの起動をコンピュータに触れずに行えます。🔗 ManusAIのツイート

Midjourney V8 ティーザー3月29日 — David Holz(Midjourney創設者)はV8が「radicalement différente」で「arriving very soon」と発表しました。正式な日付は未発表です。🔗 DavidSHolzのツイート

Claude Code v2.1.87 — Cowork Dispatchでメッセージが配信されないバグを修正しました。🔗 CHANGELOG GitHub


これが意味すること

OpenAIの時価総額8520億(注:ユニットは原文)という資金調達は転換点を示しています:この規模になると、主要プレイヤーとその他の事業者とのギャップが構造的に拡大します。週9億人の利用者と10億人を目標にするChatGPTは、単なるテクノロジー製品ではなく、大規模インフラとしての地位を確立しつつあります。

Qwen3.5-Omniのローンチは、オムニモーダルモデルをめぐる競争の激化を示しています。Audio-Visual Vibe Codingは、意図によるコーディング(vibe coding)の具体的な進化を表しており、生成AIへの主要なインターフェースがテキストから音声や映像へ移行していることを示唆します。

開発者向けツールの面では、Boris Chernyのスレッドが示すように、Claude Codeは高度な機能(/batchを用いた大規模並列化、hooksによる自動化、分散セッションなど)を蓄積してきましたが、目に見えるドキュメントが乏しかったためあまり知られていませんでした。Auto modeのEnterpriseプランへの拡張は典型的な軌跡をたどっており:プレビューで検証され、その後段階的に展開されます。

最後に、PerplexityによるSecure Intelligence Instituteの設立やCohereの医療分野での取り組みは、二番手の事業者が一般モデルと真正面から競合するのではなく、専門分野(AIセキュリティ、規制された医療など)で差別化を図ろうとしている傾向を示しています。


情報源

この文書は gpt-5-mini モデルを使用して fr 版から ja 言語に翻訳されました。翻訳プロセスの詳細については、https://gitlab.com/jls42/ai-powered-markdown-translator をご覧ください。