搜索

OpenAI 融资 1220 亿美元,Qwen3.5-Omni 及 Claude Code 的 15 个隐藏功能

OpenAI 融资 1220 亿美元,Qwen3.5-Omni 及 Claude Code 的 15 个隐藏功能

三条公告主导了本月末的新闻:OpenAI 完成了科技史上规模最大的私募融资之一,筹资 1220 亿美元、估值达 8520 亿美元;Qwen 推出了原生全模态模型,能够同时看、听并编程;Claude Code 的负责人发布了一条热传的线程,揭示了该工具 15 项鲜为人知的功能。本周还见证了 Perplexity 推出 Secure Intelligence Institute、GitHub Copilot 的新工具,以及 Runway 和 NVIDIA 在基础设施方面的多项举措。


OpenAI 融资 1220 亿美元

3 月 31 日 — OpenAI 宣布完成其最新一轮融资,承诺资本总额为 1220 亿美元,融资后估值达 8520 亿美元。这是科技史上最大的私募融资之一。

该轮由 SoftBank 与 a16z 联合领投,Amazon、NVIDIA 与 Microsoft 等作为战略性参与者加入。OpenAI 首次通过银行向个人投资者开放参与,向个人募集了超过 30 亿美元。ARK Invest 也将把 OpenAI 纳入多只交易所交易基金(ETF)。

为支持此次融资,OpenAI 公布了若干增长指标:

IndicateurValeur
Utilisateurs actifs hebdomadaires ChatGPT900 millions
Abonnés payants ChatGPT50 millions
Revenus mensuels2 milliards de dollars
Tokens traités par l’API (par minute)15 milliards
Utilisateurs hebdomadaires Codex2 millions (+5× en 3 mois)
Croissance Codex d’un mois sur l’autre+70%

公司描述了围绕“AI superapp”(AI 超级应用)构建的路线图:一个整合 ChatGPT、Codex、网页搜索与 IA 代理的统一界面。目标是超过 10 亿的每周活跃用户。企业客户已占到 40% 的收入。

GPT-5.4 是 OpenAI 最新的模型,被称在推理、编码与 agentic workflows(代理化工作流)上带来提升。OpenAI 的增长被描述为在相当发展阶段上比 Google 与 Meta 快 4 倍。

🔗 OpenAI 官方公告


Qwen3.5-Omni:原生全模态模型

3 月 29 日 — 阿里巴巴 Qwen 推出 Qwen3.5-Omni,一款原生设计用于同时处理文本、图像、音频与视频的单一统一模型。与传统通过分层方式增加模态的多模态方法不同,该模型能同时处理这些输入。

其原生能力显著:最长可处理 10 小时音频或 400 秒 720p 视频,训练数据超过 1 亿小时,支持 113 种语言的语音识别并能以 36 种语言输出。

旗舰功能:Audio-Visual Vibe Coding

最直接可用的功能是“Audio-Visual Vibe Coding”:用户在摄像头前口述项目意图,Qwen3.5-Omni-Plus 即生成一个可运行的网站或游戏。这是将“按意图编码”(vibe coding)概念扩展到实时音频与视频上的应用。

性能对比

CatégorieQwen3.5-Omni-PlusGemini 3.1 Pro
DailyOmni (audio/vision)84,682,7
WorldScene62,865,5
QualocommInteractive68,552,3
OmniClear64,855,5
IFEval (texte)89,793,5
MMLU-Redux94,290,0

该模型在音频基准上超过 Gemini 3.1 Pro,并在视听理解上表现相当。

语音能力

  • 精细语音控制:实时调整情感、节奏与音量
  • 从短样本进行语音克隆(Voice Cloning),工程部署即将推出
  • 智能插话(Semantic Interruption):理解真实意图并忽略环境噪声
  • 集成网页搜索与复杂函数调用

模型家族

VariantePositionnement
Qwen3.5-Omni-PlusPerformances SOTA, captioning audio-visuel détaillé
Qwen3.5-Omni-Plus-RealtimeVoice Control, WebSearch, Voice Clone, Semantic Interruption
Qwen3.5-Omni-FlashVitesse
Qwen3.5-Omni-LightLégèreté

可通过 chat.qwen.ai(VoiceChat/VideoChat 按钮)与 Alibaba Cloud API 访问。

补充说明: Qwen 3.6 Plus Preview 在 OpenRouter 上限时免费开放——在此期间的交互数据将被收集以改进模型。

🔗 推文 @Alibaba_Qwen


Claude Code 的 15 个隐藏功能

3 月 30 日 — Anthropic 的 Claude Code 负责人 Boris Cherny 发布了一条线程,揭示了该工具 15 项文档较少的功能。该线程获得了 360 万次浏览、2 千次转发与 2.2 万次点赞。

“I wanted to share a bunch of my favorite hidden and under-utilized features in Claude Code. I’ll focus on the ones I use the most. Here goes.”

🇨🇳 我想分享一些我最喜欢的、在 Claude Code 中鲜为人知且被低估的功能。 我将专注于我最常用的那些功能。 开始吧。@bcherny 在 X

移动性与远程会话

  • Claude 的 iOS 与 Android 应用包含一个 Code 选项卡,可在手机上编写代码
  • --teleport(或 /teleport)可将云会话切换到本地机器;/remote-control 允许从任何设备控制本地会话
  • Cowork Dispatch:从移动端安全远程控制 Claude Desktop App,可访问 MCP(Model Context Protocol)、浏览器等

自动化

  • /loop/schedule 允许按设定间隔自动启动 Claude,最长可达一周——Cherny 使用 /loop 5m /babysit 来持续进行代码审查与 rebase 自动化
  • 钩子(SessionStartPreToolUse 等)允许在 agent 生命周期中注入确定性逻辑,例如将权限请求路由到 WhatsApp

并行化

  • /batch 将工作分发给数十、数百甚至数千个并行 agent——适用于大规模代码迁移
  • claude -w 在独立的 git worktrees(git 工作树)中启动并行会话

日常生产力

  • /btw 允许在 agent 工作时提出快速问题,而不打断当前任务
  • /branch 允许 fork 会话;或通过 CLI 使用:claude --resume <session-id> --fork-session
  • --agent 允许在 .claude/agents/ 中定义自定义 agent,并配置提示系统与工具
  • --add-dir / /add-dir 允许 Claude 同时访问多个文件夹或仓库
  • --bare 将 SDK 启动速度提高最多 10×(避免加载 CLAUDE.md、参数与 MCP 服务器)
  • /voice 启用语音输入(CLI 空格键、桌面专用按钮、iOS 语音输入)
  • Chrome 扩展(测试版):Claude Code + Chrome 可用于测试 Web 应用、调试控制台日志并自动化浏览器

🔗 完整线程 @bcherny


Claude Code:自动模式扩展到 Enterprise 与 API

3 月 30 日 — Claude Code 的 auto mode(自动模式),自 3 月 24 日为 Pro 与 Max 用户推出以来,现在已在 Enterprise 计划和通过 API 的开发者可用。该功能允许 Claude 在不每次都征求用户确认的情况下,自行决定批准执行某些动作(写文件、执行 bash 命令等)。

在 Enterprise 或 API 环境中激活方法如下:

claude --enable-auto-mode

自动模式依赖内部分类器来评估每个操作的风险,从而在宽松模式(--dangerously-skip-permissions)与人工审批之间取得平衡。

3 月 30 日 — Cowork Dispatch 现在可以使用自然语言在指令中直接指定特定模型来启动编码任务。

🔗 推文 @claudeai


Perplexity 推出 Secure Intelligence Institute

3 月 31 日 — Perplexity 推出 Secure Intelligence Institute(SII),这是一个致力于高级 AI 系统安全、隐私与可靠性的研究实验室。该研究所由 Purdue 大学 Samuel D. Conte 教授、ACM 与 IEEE 会士、前 ACM SIGSAC 主席 Dr. Ninghui Li 领导,并与 Dan Boneh 的应用密码学团队与 Neil Gong 的 Gong Lab 建立学术合作。

SII 发布了三篇首批工作:

PublicationTypeDescription
BrowseSafeBenchmark open-source14 700+ 场真实攻击场景,涵盖用于 AI 浏览的 14 类风险
Sécurisation des agents NIST/CAISIPolitique对关于保护自主 agent 的 RFI(Request for Information)的回应
Building Security Into CometArchitecture为 AI 浏览器 Comet 构建纵深防御的架构设计

SII 将其研究转化为对 Perplexity 系统的实际改进,并与 AI 生态系统共享其成果。

🔗 安全情报研究所


Cohere 与 Ensemble:面向医疗收入周期管理的专用 LLM

3 月 31 日 — Cohere 与 Ensemble 宣布共同构建业界首个针对美国医疗行业收入周期管理(Revenue Cycle Management / RCM)本地化的专用大规模语言模型(LLM)。

Ensemble 提供面向医院与医疗集团的端到端解决方案,从预约到最终账单结算。与通过专用 prompt 包装通用 LLM 的竞品不同,该模型完全基于 Cohere 的 Command 系列进行定制训练。

DomaineCapacité
Financier在提交前预测拒付,持续的账单质量控制
Clinique在护理点提供文档指导,组装呼叫记录档案
Agentique实现收入周期的多步骤编排

该模型使用 Cohere 的预训练数据、Ensemble 的运营日志、公共 RCM 知识源与领域专家注释进行训练。一个共同开发的领域特定 benchmark 将用于测量其在真实 RCM 任务上相较通用 LLM 的表现。

🔗 Cohere 博客


GitHub Copilot:以 agent 为先的发展与 Slack 集成

3 月 31 日 — GitHub Copilot Applied Science 团队的高级研究员 Tyler McGoffin 发布了他在用 Copilot 作为主要编码 agent 构建内部工具的经验分享。该工具可自动化分析 agent 在 TerminalBench2 与 SWEBench-Pro 等基准上的轨迹。

文中实践要点包括:在编码前使用 /plan 模式、创建只有人类能修改的“契约测试”(contract tests)、使用详尽的 prompts 而非简短提示、以及通过 /plan Review the code for any missing tests... 实现每周自动维护。结论是:要与 AI agent 高效协作,需要具备优秀工程师的同样素质(计划、上下文、沟通)。

3 月 30 日 — GitHub 的 Slack 应用现已集成 Copilot,可直接在 Slack 中以自然语言创建 GitHub issues。只需在任一频道 @GitHub 并描述工作内容即可。

FonctionnalitéDétail
Création en langage naturel描述 → 结构化 issue(标题、正文、分配、标签、里程碑)
Sous-issues从一条消息中将工作分解为父/子 issue
Mode conversation在创建前对 issue 进行迭代讨论

3 月 31 日 — GitHub 发布了 Copilot SDK,允许以三种架构模型将 agentic workflows(代理化工作流)集成到第三方应用中。

🔗 GitHub 博客 - 以 agent 驱动的开发 🔗 GitHub 更新日志 - 从 Slack 创建 issues


Runway:投资基金与初创计划

3 月 31 日 — Runway 同时推出了两项举措。

Runway Fund 是面向早期(early-stage)AI、媒体与现实世界模拟初创公司的投资基金。初始承诺最多为 1,000 万美元,对 pre-seed/seed 阶段的投资额度可达 50 万美元。重点关注三大方向:AI 研究(世界模型与生成式 AI)、新型应用(LLM 之上的应用层)以及新媒体与内容。该基金已在 Cartesia、LanceDB 与 Tamarind Bio 进行投资。

Runway Builders 是一个面向从种子轮到 C 轮、构建视频生成与实时会话 AI 产品的初创公司扶持项目。参与者将获赠 API 积分、最高的速率限制与私有社区访问。

🔗 Runway 基金 🔗 Runway Builders 计划


NVIDIA 与 Emerald AI:将 AI 工厂视为电网的灵活资产

3 月 31 日 — NVIDIA 与 Emerald AI 在 CERAWeek 展示了一种面向 AI 工厂(AI factories)的新思路:把它们视为电网的灵活资产,而非静态负载。该架构基于 NVIDIA Vera Rubin DSX 与 Emerald AI 的 Conductor 平台。

公布的能源合作伙伴包括 AES、Constellation、Invenergy、NextEra Energy、Nscale Energy 与 Vistra。相关宣布还包括:

  • Maximo:在 Bellefield 建成并运行的 100 MW 机器人太阳能装置,基于 NVIDIA Isaac Sim
  • TerraPower + SoftServe:使用 NVIDIA Omniverse 的数字孪生以缩短 Natrium 核电站的设计周期
  • Adaptive Construction Solutions:国家级 AI 工厂建设培训项目
  • GE Vernova、Schneider Electric、Vertiv:为 Vera Rubin 提供经验证的参考设计

Jensen Huang 将能源描述为“五层 AI 蛋糕”(five-layer AI cake)的基础层。

🔗 NVIDIA 博客 - AI 工厂


简讯

Gemini Live 在 Gemini 3.1 Flash Live 上3 月 30 日 — Google 已确认将在 Gemini Live 应用中部署模型 Gemini 3.1 Flash Live,向所有用户开放。 这一过渡(于 3 月 26 日宣布)带来更自然的语音对话以及在嘈杂环境中更高的准确性。🔗 推文 @GeminiApp

Manus:从手机控制桌面端3 月 30 日 — Manus 增加了通过智能手机远程操控桌面应用的功能:启动任务、访问文件并在不触碰计算机的情况下启动工作流。🔗 推文 @ManusAI

Midjourney V8 预告3 月 29 日 — David Holz(Midjourney 创始人)宣布 V8 将推出一个“截然不同”的版本,“很快到来”。未公布发布日期。🔗 推文 @DavidSHolz

Claude Code v2.1.87 — 修复了 Cowork Dispatch 中导致消息未被传递的一个 bug。🔗 CHANGELOG GitHub


这意味着什么

OpenAI 获得 8520 亿的估值标志着一个拐点:在这样的数字面前,头部玩家与行业其余部分之间的差距在结构上被拉大。凭借 9 亿每周活跃用户并以 10 亿为目标,ChatGPT 正定位为大众基础设施,而不仅仅是一个科技产品。

Qwen3.5-Omni 的发布展示了对全模态模型日益激烈的竞争。Audio-Visual Vibe Coding 代表了 vibe coding(意向编码)的一个具体演进——从以文本为主的接口向以语音和视频为主的生成式 AI 接口转变。

在开发者工具方面,Boris Cherny 的线程揭示了 Claude Code 积累了许多高级功能(通过 /batch 实现的大规模并行、通过 hooks 的自动化、分布式会话等),这些功能由于缺乏可见文档而较少为人所知。将 auto mode 扩展到 Enterprise 套餐遵循了经典路径:先在预览中验证,然后逐步部署。

最后,Perplexity 成立 Secure Intelligence Institute 以及 Cohere 在医疗领域的举措表明一种趋势:二线参与者正试图在垂直细分领域(AI 安全、受监管的医疗)中寻找差异化,而不是在通用模型上与头部正面竞争。


来源

本文件已使用 gpt-5-mini 模型将 fr 版本翻译为 zh 语言。有关翻译过程的更多信息,请参阅 https://gitlab.com/jls42/ai-powered-markdown-translator