OpenAI 融资 1220 亿美元，Qwen3.5-Omni 及 Claude Code 的 15 个隐藏功能

三条公告主导了本月末的新闻：OpenAI 完成了科技史上规模最大的私募融资之一，筹资 1220 亿美元、估值达 8520 亿美元；Qwen 推出了原生全模态模型，能够同时看、听并编程；Claude Code 的负责人发布了一条热传的线程，揭示了该工具 15 项鲜为人知的功能。本周还见证了 Perplexity 推出 Secure Intelligence Institute、GitHub Copilot 的新工具，以及 Runway 和 NVIDIA 在基础设施方面的多项举措。

OpenAI 融资 1220 亿美元

3 月 31 日 — OpenAI 宣布完成其最新一轮融资，承诺资本总额为 1220 亿美元，融资后估值达 8520 亿美元。这是科技史上最大的私募融资之一。

该轮由 SoftBank 与 a16z 联合领投，Amazon、NVIDIA 与 Microsoft 等作为战略性参与者加入。OpenAI 首次通过银行向个人投资者开放参与，向个人募集了超过 30 亿美元。ARK Invest 也将把 OpenAI 纳入多只交易所交易基金（ETF）。

为支持此次融资，OpenAI 公布了若干增长指标：

Indicateur	Valeur
Utilisateurs actifs hebdomadaires ChatGPT	900 millions
Abonnés payants ChatGPT	50 millions
Revenus mensuels	2 milliards de dollars
Tokens traités par l’API (par minute)	15 milliards
Utilisateurs hebdomadaires Codex	2 millions (+5× en 3 mois)
Croissance Codex d’un mois sur l’autre	+70%

公司描述了围绕“AI superapp”（AI 超级应用）构建的路线图：一个整合 ChatGPT、Codex、网页搜索与 IA 代理的统一界面。目标是超过 10 亿的每周活跃用户。企业客户已占到 40% 的收入。

GPT-5.4 是 OpenAI 最新的模型，被称在推理、编码与 agentic workflows（代理化工作流）上带来提升。OpenAI 的增长被描述为在相当发展阶段上比 Google 与 Meta 快 4 倍。

🔗 OpenAI 官方公告

Qwen3.5-Omni：原生全模态模型

3 月 29 日 — 阿里巴巴 Qwen 推出 Qwen3.5-Omni，一款原生设计用于同时处理文本、图像、音频与视频的单一统一模型。与传统通过分层方式增加模态的多模态方法不同，该模型能同时处理这些输入。

其原生能力显著：最长可处理 10 小时音频或 400 秒 720p 视频，训练数据超过 1 亿小时，支持 113 种语言的语音识别并能以 36 种语言输出。

旗舰功能：Audio-Visual Vibe Coding

最直接可用的功能是“Audio-Visual Vibe Coding”：用户在摄像头前口述项目意图，Qwen3.5-Omni-Plus 即生成一个可运行的网站或游戏。这是将“按意图编码”（vibe coding）概念扩展到实时音频与视频上的应用。

性能对比

Catégorie	Qwen3.5-Omni-Plus	Gemini 3.1 Pro
DailyOmni (audio/vision)	84,6	82,7
WorldScene	62,8	65,5
QualocommInteractive	68,5	52,3
OmniClear	64,8	55,5
IFEval (texte)	89,7	93,5
MMLU-Redux	94,2	90,0

该模型在音频基准上超过 Gemini 3.1 Pro，并在视听理解上表现相当。

语音能力

精细语音控制：实时调整情感、节奏与音量
从短样本进行语音克隆（Voice Cloning），工程部署即将推出
智能插话（Semantic Interruption）：理解真实意图并忽略环境噪声
集成网页搜索与复杂函数调用

模型家族

Variante	Positionnement
Qwen3.5-Omni-Plus	Performances SOTA, captioning audio-visuel détaillé
Qwen3.5-Omni-Plus-Realtime	Voice Control, WebSearch, Voice Clone, Semantic Interruption
Qwen3.5-Omni-Flash	Vitesse
Qwen3.5-Omni-Light	Légèreté

可通过 chat.qwen.ai（VoiceChat/VideoChat 按钮）与 Alibaba Cloud API 访问。

补充说明： Qwen 3.6 Plus Preview 在 OpenRouter 上限时免费开放——在此期间的交互数据将被收集以改进模型。

🔗 推文 @Alibaba_Qwen

Claude Code 的 15 个隐藏功能

3 月 30 日 — Anthropic 的 Claude Code 负责人 Boris Cherny 发布了一条线程，揭示了该工具 15 项文档较少的功能。该线程获得了 360 万次浏览、2 千次转发与 2.2 万次点赞。

“I wanted to share a bunch of my favorite hidden and under-utilized features in Claude Code. I’ll focus on the ones I use the most. Here goes.”

🇨🇳 我想分享一些我最喜欢的、在 Claude Code 中鲜为人知且被低估的功能。我将专注于我最常用的那些功能。开始吧。 — @bcherny 在 X

移动性与远程会话

Claude 的 iOS 与 Android 应用包含一个 Code 选项卡，可在手机上编写代码
--teleport（或 /teleport）可将云会话切换到本地机器；/remote-control 允许从任何设备控制本地会话
Cowork Dispatch：从移动端安全远程控制 Claude Desktop App，可访问 MCP（Model Context Protocol）、浏览器等

自动化

/loop 与 /schedule 允许按设定间隔自动启动 Claude，最长可达一周——Cherny 使用 /loop 5m /babysit 来持续进行代码审查与 rebase 自动化
钩子（SessionStart、PreToolUse 等）允许在 agent 生命周期中注入确定性逻辑，例如将权限请求路由到 WhatsApp

并行化

/batch 将工作分发给数十、数百甚至数千个并行 agent——适用于大规模代码迁移
claude -w 在独立的 git worktrees（git 工作树）中启动并行会话

日常生产力

/btw 允许在 agent 工作时提出快速问题，而不打断当前任务
/branch 允许 fork 会话；或通过 CLI 使用：claude --resume <session-id> --fork-session
--agent 允许在 .claude/agents/ 中定义自定义 agent，并配置提示系统与工具
--add-dir / /add-dir 允许 Claude 同时访问多个文件夹或仓库
--bare 将 SDK 启动速度提高最多 10×（避免加载 CLAUDE.md、参数与 MCP 服务器）
/voice 启用语音输入（CLI 空格键、桌面专用按钮、iOS 语音输入）
Chrome 扩展（测试版）：Claude Code + Chrome 可用于测试 Web 应用、调试控制台日志并自动化浏览器

🔗 完整线程 @bcherny

Claude Code：自动模式扩展到 Enterprise 与 API

3 月 30 日 — Claude Code 的 auto mode（自动模式），自 3 月 24 日为 Pro 与 Max 用户推出以来，现在已在 Enterprise 计划和通过 API 的开发者可用。该功能允许 Claude 在不每次都征求用户确认的情况下，自行决定批准执行某些动作（写文件、执行 bash 命令等）。

在 Enterprise 或 API 环境中激活方法如下：

claude --enable-auto-mode

自动模式依赖内部分类器来评估每个操作的风险，从而在宽松模式（--dangerously-skip-permissions）与人工审批之间取得平衡。

3 月 30 日 — Cowork Dispatch 现在可以使用自然语言在指令中直接指定特定模型来启动编码任务。

🔗 推文 @claudeai

Perplexity 推出 Secure Intelligence Institute

3 月 31 日 — Perplexity 推出 Secure Intelligence Institute（SII），这是一个致力于高级 AI 系统安全、隐私与可靠性的研究实验室。该研究所由 Purdue 大学 Samuel D. Conte 教授、ACM 与 IEEE 会士、前 ACM SIGSAC 主席 Dr. Ninghui Li 领导，并与 Dan Boneh 的应用密码学团队与 Neil Gong 的 Gong Lab 建立学术合作。

SII 发布了三篇首批工作：

Publication	Type	Description
BrowseSafe	Benchmark open-source	14 700+ 场真实攻击场景，涵盖用于 AI 浏览的 14 类风险
Sécurisation des agents NIST/CAISI	Politique	对关于保护自主 agent 的 RFI（Request for Information）的回应
Building Security Into Comet	Architecture	为 AI 浏览器 Comet 构建纵深防御的架构设计

SII 将其研究转化为对 Perplexity 系统的实际改进，并与 AI 生态系统共享其成果。

🔗 安全情报研究所

Cohere 与 Ensemble：面向医疗收入周期管理的专用 LLM

3 月 31 日 — Cohere 与 Ensemble 宣布共同构建业界首个针对美国医疗行业收入周期管理（Revenue Cycle Management / RCM）本地化的专用大规模语言模型（LLM）。

Ensemble 提供面向医院与医疗集团的端到端解决方案，从预约到最终账单结算。与通过专用 prompt 包装通用 LLM 的竞品不同，该模型完全基于 Cohere 的 Command 系列进行定制训练。

Domaine	Capacité
Financier	在提交前预测拒付，持续的账单质量控制
Clinique	在护理点提供文档指导，组装呼叫记录档案
Agentique	实现收入周期的多步骤编排

该模型使用 Cohere 的预训练数据、Ensemble 的运营日志、公共 RCM 知识源与领域专家注释进行训练。一个共同开发的领域特定 benchmark 将用于测量其在真实 RCM 任务上相较通用 LLM 的表现。

🔗 Cohere 博客

GitHub Copilot：以 agent 为先的发展与 Slack 集成

3 月 31 日 — GitHub Copilot Applied Science 团队的高级研究员 Tyler McGoffin 发布了他在用 Copilot 作为主要编码 agent 构建内部工具的经验分享。该工具可自动化分析 agent 在 TerminalBench2 与 SWEBench-Pro 等基准上的轨迹。

文中实践要点包括：在编码前使用 /plan 模式、创建只有人类能修改的“契约测试”（contract tests）、使用详尽的 prompts 而非简短提示、以及通过 /plan Review the code for any missing tests... 实现每周自动维护。结论是：要与 AI agent 高效协作，需要具备优秀工程师的同样素质（计划、上下文、沟通）。

3 月 30 日 — GitHub 的 Slack 应用现已集成 Copilot，可直接在 Slack 中以自然语言创建 GitHub issues。只需在任一频道 @GitHub 并描述工作内容即可。

Fonctionnalité	Détail
Création en langage naturel	描述 → 结构化 issue（标题、正文、分配、标签、里程碑）
Sous-issues	从一条消息中将工作分解为父/子 issue
Mode conversation	在创建前对 issue 进行迭代讨论

3 月 31 日 — GitHub 发布了 Copilot SDK，允许以三种架构模型将 agentic workflows（代理化工作流）集成到第三方应用中。

🔗 GitHub 博客 - 以 agent 驱动的开发 🔗 GitHub 更新日志 - 从 Slack 创建 issues

Runway：投资基金与初创计划

3 月 31 日 — Runway 同时推出了两项举措。

Runway Fund 是面向早期（early-stage）AI、媒体与现实世界模拟初创公司的投资基金。初始承诺最多为 1,000 万美元，对 pre-seed/seed 阶段的投资额度可达 50 万美元。重点关注三大方向：AI 研究（世界模型与生成式 AI）、新型应用（LLM 之上的应用层）以及新媒体与内容。该基金已在 Cartesia、LanceDB 与 Tamarind Bio 进行投资。

Runway Builders 是一个面向从种子轮到 C 轮、构建视频生成与实时会话 AI 产品的初创公司扶持项目。参与者将获赠 API 积分、最高的速率限制与私有社区访问。

🔗 Runway 基金 🔗 Runway Builders 计划

NVIDIA 与 Emerald AI：将 AI 工厂视为电网的灵活资产

3 月 31 日 — NVIDIA 与 Emerald AI 在 CERAWeek 展示了一种面向 AI 工厂（AI factories）的新思路：把它们视为电网的灵活资产，而非静态负载。该架构基于 NVIDIA Vera Rubin DSX 与 Emerald AI 的 Conductor 平台。

公布的能源合作伙伴包括 AES、Constellation、Invenergy、NextEra Energy、Nscale Energy 与 Vistra。相关宣布还包括：

Maximo：在 Bellefield 建成并运行的 100 MW 机器人太阳能装置，基于 NVIDIA Isaac Sim
TerraPower + SoftServe：使用 NVIDIA Omniverse 的数字孪生以缩短 Natrium 核电站的设计周期
Adaptive Construction Solutions：国家级 AI 工厂建设培训项目
GE Vernova、Schneider Electric、Vertiv：为 Vera Rubin 提供经验证的参考设计

Jensen Huang 将能源描述为“五层 AI 蛋糕”（five-layer AI cake）的基础层。

🔗 NVIDIA 博客 - AI 工厂

简讯

Gemini Live 在 Gemini 3.1 Flash Live 上 — 3 月 30 日 — Google 已确认将在 Gemini Live 应用中部署模型 Gemini 3.1 Flash Live，向所有用户开放。这一过渡（于 3 月 26 日宣布）带来更自然的语音对话以及在嘈杂环境中更高的准确性。🔗 推文 @GeminiApp

Manus：从手机控制桌面端 — 3 月 30 日 — Manus 增加了通过智能手机远程操控桌面应用的功能：启动任务、访问文件并在不触碰计算机的情况下启动工作流。🔗 推文 @ManusAI

Midjourney V8 预告 — 3 月 29 日 — David Holz（Midjourney 创始人）宣布 V8 将推出一个“截然不同”的版本，“很快到来”。未公布发布日期。🔗 推文 @DavidSHolz

Claude Code v2.1.87 — 修复了 Cowork Dispatch 中导致消息未被传递的一个 bug。🔗 CHANGELOG GitHub

这意味着什么

OpenAI 获得 8520 亿的估值标志着一个拐点：在这样的数字面前，头部玩家与行业其余部分之间的差距在结构上被拉大。凭借 9 亿每周活跃用户并以 10 亿为目标，ChatGPT 正定位为大众基础设施，而不仅仅是一个科技产品。

Qwen3.5-Omni 的发布展示了对全模态模型日益激烈的竞争。Audio-Visual Vibe Coding 代表了 vibe coding（意向编码）的一个具体演进——从以文本为主的接口向以语音和视频为主的生成式 AI 接口转变。

在开发者工具方面，Boris Cherny 的线程揭示了 Claude Code 积累了许多高级功能（通过 /batch 实现的大规模并行、通过 hooks 的自动化、分布式会话等），这些功能由于缺乏可见文档而较少为人所知。将 auto mode 扩展到 Enterprise 套餐遵循了经典路径：先在预览中验证，然后逐步部署。

最后，Perplexity 成立 Secure Intelligence Institute 以及 Cohere 在医疗领域的举措表明一种趋势：二线参与者正试图在垂直细分领域（AI 安全、受监管的医疗）中寻找差异化，而不是在通用模型上与头部正面竞争。

来源

本文件已使用 gpt-5-mini 模型将 fr 版本翻译为 zh 语言。有关翻译过程的更多信息，请参阅 https://gitlab.com/jls42/ai-powered-markdown-translator