搜索

Claude 安全性公开测试版、Manus 云计算机、NVIDIA OpenShell、xAI 语音克隆

2026年4月29日至5月2日这一周标志着多项重要突破:Claude Security 从预览版升级为企业公开测试版,Manus 推出始终在线的 Ubuntu 云端机器且无需技术技能,NVIDIA 则将一个面向 AI 代理的安全沙箱开源。在多模态领域,xAI 通过 API 开放语音克隆,且相关公告获得了创纪录的 1970 万次浏览。


Claude Security 公开测试版 — 由 Claude Opus 4.7 进行代码审计

4月30日 — Anthropic 面向 Claude Enterprise 客户开放 Claude Security 公开测试版。该产品此前名为 Claude Code Security,它会像人类安全研究员一样进行推理来分析代码库中的漏洞,而不是仅靠静态模式匹配。

“Claude Security is now in public beta for Claude Enterprise customers. Claude scans your codebase for vulnerabilities, validates each finding to cut false positives, and suggests patches you can review and approve.”

🇨🇳 Claude Security 现已面向 Claude Enterprise 客户推出公开测试版。Claude 会分析你的代码库以查找漏洞,验证每一项发现以减少误报,并提供你可以审查和批准的补丁。@claudeai 在 X 上

该工具使用 Claude Opus 4.7 并行执行多代理代码扫描,验证每个结果以减少误报——这是传统扫描器最常见的批评之一——并提出团队可以审查和批准的具体修复方案。自 2026 年 2 月预览版以来,已有数百家组织在生产代码上试用该工具,反馈从扫描到补丁应用可在数小时内完成。

公开测试版新增功能包括定期扫描调度(用于持续覆盖,而不仅是一次性审计)以及针对仓库中指定目录的扫描能力。

方面详情
可用性公开测试版,仅限 Claude Enterprise
模型Claude Opus 4.7
访问方式claude.ai/security 或 claude.ai 侧边栏
预览版自 2026 年 2 月起——数百家组织
新功能定时扫描、按目录定向
集成合作伙伴CrowdStrike、Palo Alto Networks、SentinelOne、TrendAI、Wiz

Anthropic 还将 Opus 4.7 集成到合作伙伴安全平台中:CrowdStrike(Falcon platform、Project Quiltworks)、Palo Alto Networks、SentinelOne(Wayfinder AI)、TrendAI 和 Wiz(Red Agent)。Enterprise 管理员可以从管理控制台启用 Claude Security。

🔗 Claude Security 官方博客


Manus Cloud Computer — 无需编码的 Ubuntu 24/7 机器

4月30日 — Manus 推出 Cloud Computer,这是一台专用、始终开启的云虚拟机,彻底改变了非开发者用户能够构建和自动化的内容。

到目前为止,要让程序持续 24 小时运行,必须租用服务器、配置操作系统并编写代码——这是一道只属于开发者的门槛。Cloud Computer 通过允许用户用自然语言描述目标来消除这一门槛:Manus 负责编写代码并配置环境。

“Introducing Cloud Computer for Manus. Your always on machine in the cloud, so anything you build keeps running.”

🇨🇳 Manus 的 Cloud Computer 介绍。你在云中的始终在线机器,让你构建的一切都能持续运行。@ManusAI 在 X 上

24/7 持久性与临时 Manus 沙箱形成鲜明对比,后者会在每次会话后关闭。Cloud Computer 在会话之间保留共享的 Ubuntu 文件系统,使 Manus 能够基于之前的工作继续推进。

Manus 环境使用场景
Temporary Sandbox一次性的分析、文档、Web 应用
Manus Desktop在本地机器上控制文件和应用
Cloud Computer24/7 机器人、持久数据库、计划任务抓取器

已记录的具体用例包括:持续运行的 Slack、Discord 或 WhatsApp 机器人,带有每周自动报告的 MySQL 数据库,价格监控抓取器,以及开源工具的自托管(Home Assistant、Metabase、WordPress、Plausible)。三个套餐(Basic、Standard、Advanced)可根据需求选择 CPU、内存和存储资源。可通过 SSH 或 Manus 仪表板中的网页终端访问。

🔗 Manus Cloud Computer 博客


NVIDIA OpenShell — 面向企业 AI 代理的开源沙箱

5月2日 — NVIDIA 发布 OpenShell,这是一个开源沙箱环境,旨在保障部署于企业中的 AI 代理安全。该工具由 NVIDIA CEO Jensen Huang 在 2026 年 5 月 2 日发布的视频中介绍,可精确控制代理能够访问、共享和发送的内容。

选择开源,NVIDIA 下注于透明度和可审计性:任何企业都可以检查代码、按需改造并放心使用。这一定位直接回应了安全团队的担忧——他们因害怕数据外泄或不受欢迎的动作而放缓了 LLM 的企业采用。

OpenShell 也属于 NVIDIA 围绕代理推理安全化的更大战略,作为 Dynamo(KV 感知路由)和 NIM(Blackwell 优化 API)的补充。它所解决的核心阻碍,正是阻止自主代理在敏感环境中落地的那个问题:IT 团队无法监督和约束代理的行动范围。

方面详情
类型开源沙箱
介绍者Jensen Huang(NVIDIA CEO)
功能控制 AI 代理的访问 / 共享 / 发送
定位与 Dynamo 和 NIM 互补
互动量几小时内 13K+ 浏览

🔗 NVIDIA OpenShell 公告


xAI 通过 API 进行语音克隆 — 2 分钟内生成个性化声音

5月2日 — xAI 通过其公开 API 推出语音克隆(voice cloning)。开发者现在可以在不到两分钟内创建一个个性化声音,或从预设声音中进行选择。

“Voice Cloning is now live via the xAI API! Create a custom voice in less than 2 minutes or select from our preset voices.”

🇨🇳 语音克隆现已通过 xAI API 提供!在不到 2 分钟内创建个性化声音,或从我们的预设声音中选择。@xai 在 X 上

该公告在数小时内获得了异常高的互动量,浏览量达到 1970 万次,成为本周 AI 生态中最具病毒传播性的公告之一。此功能体现了 xAI 通过 API 提供先进多模态能力的战略,此前一周刚推出 Grok Voice Think Fast 1.0。

指标数值
浏览量1970 万
转发820
点赞5 641
收藏2 481
创建耗时少于 2 分钟

其使用场景涵盖音频内容创作、个性化助手以及交互式应用。通过 API 提供可用性,也为集成到第三方产品中打开了大门。

🔗 xAI Grok Custom Voices 博客


Claude Code — 关于 prompt caching 的经验教训

4月30日 — Claude Code 团队发布了一篇由 Thariq Shihipar(Claude Code 技术负责人)署名的技术文章,介绍他们在 prompt caching 方面的实践。核心信息是:对于一个长期运行的代理,prompt caching 不是可选优化——它是基础架构。

提示词结构从最稳定到最动态依次组织:tools 和 system prompt(跨会话共享的全局缓存)、项目上下文(按项目缓存)、会话上下文,然后是动态对话。稳定部分中的任何变化都会使其后的内容全部失效——团队将其视为内部事故。

文中记录了三种模式:(1) 不要在会话中途修改工具——Claude Code 将 EnterPlanMode / ExitPlanMode 作为模型可调用工具;(2) 数十个 MCP 工具作为 defer_loading: true 形式的 stub 加载,而不是从提示词中移除;(3) 上下文压缩使用与父级具有相同前缀的 fork,以最大化缓存命中。

🔗 Claude Code Prompt Caching 文章


Claude API Skill 在 CodeRabbit、JetBrains、Resolve AI 和 Warp 中可用

4月29日 — Anthropic 将 skill claude-api 扩展到四个新的开发环境:CodeRabbit、JetBrains(及其代理 Junie)、Resolve AI 和 Warp。该 skill 之前已在 Claude Code 中提供。

工具集成
Claude Code已提供
CodeRabbit新增
JetBrains / Junie新增
Resolve AI新增
Warp新增

其作用是:为开发者在常用工具中提供一个内置的 Claude API 专家,了解 prompt caching 规则、代理模式、Claude Managed Agents 配置以及模型迁移。该 skill 会随着 API 的每次演进自动保持更新。它在 GitHub 上开源(anthropics/skills)。

🔗 Claude API Skill 博客


Code with Claude — 5 月 5 日开发者大会

5月1日 — Anthropic 宣布其开发者大会 Code with Claude 将于 2026 年 5 月 5 日那一周回归。该活动面向所有 Claude Code 使用经验层级——从初学者到资深开发者——并将通过直播播出。报名开放于 claude.com/code-with-claude

该公告在数小时内获得了超过 63 万次浏览,表明开发者社区持续保持浓厚兴趣。这场大会紧随首届活动之后推出,后者曾在 Claude Code 生态中引起广泛关注,部分参与者还提到东京可能是某些环节的线下举办地。

🔗 Code with Claude 报名


Anthropic — 通过 Claude 进行个人指导的研究(100 万次对话)

4月30日 — Anthropic 发布了一项研究,分析用户如何向 Claude 提出个人指导类问题,基于对 100 万次对话的分析。该分析使用了 Clio,这是内部开发的隐私保护洞察工具。这项研究旨在理解 Claude 的社会影响,以便为未来模型训练提供依据——将真实使用与负责任的 AI 开发连接成闭环。

🔗 Anthropic 公告


BioMysteryBench — Anthropic 的生物信息学基准测试

4月30日 — Anthropic 发布 BioMysteryBench,这是一个新的基准,用于评估 Claude 的生物信息学研究能力。该评测包含 99 个基于真实生物数据构建的问题,其中 Claude 必须猜测数据类型并设计创造性解决方案——模拟研究者面对未知数据时的工作方式。目标是衡量 Claude 是否能在真实、开放式研究任务上与人类生物信息学专家竞争,而不是只在标准基准上表现。

🔗 BioMysteryBench 公告


Google DeepMind AI co-clinician — 多模态医疗代理

4月30日 — Google DeepMind 宣布了一项名为 AI co-clinician(AI 共同临床医师)的新研究计划。目标是探索多模态代理如何更好地支持医疗专业人员的日常工作。

为保障患者安全,该系统采用双代理(dual agent)架构:主代理负责分析,而第二个集成代理会在任何行动之前检查并验证决策。这种监督架构旨在将人工监督保持在系统核心位置,这是医疗领域采用的前提。该公告在数小时内获得了超过 31.4 万次浏览。

🔗 Google DeepMind AI co-clinician 公告


NotebookLM Notebooks 在 Gemini 应用中上线 — Free 和 Paid 移动端可用

4月30日 — NotebookLM 宣布其 Notebooks 现在已可在 Gemini 应用的移动端使用,面向所有 Free 和 Paid 用户。更多欧洲国家的部署即将到来。这一移动端可用性是在 2026 年 4 月 8 日桌面端初始集成之后推出的,标志着一个重要阶段:用户如今可以在手机上的 Gemini 应用内整理项目、访问个人笔记本并在外出时使用 NotebookLM。

🔗 NotebookLM 移动端公告


Gemini CLI v0.40.0 — 离线 ripgrep 搜索、4 层内存、Gemma 本地运行

4月28日 — Gemini CLI 的 v0.40.0 版本为开发者带来了多项改进。

功能详情
版本v0.40.0
离线搜索集成 ripgrep 打包版
内存新的 4 层分层系统
本地模型简化 gemini gemma 命令
主题受 GitHub 启发的色盲友好主题
MCP 资源引入 MCP 资源工具

Gemini CLI 现已将 ripgrep 打包集成,从而无需网络连接即可在本地代码中搜索。内存系统升级为一个由提示词驱动的四层架构。通过专用命令 gemini gemma,本地配置和使用 Gemma 模型也变得更加简单。

🔗 Gemini CLI 更新日志


GitHub Copilot 在 Visual Studio 中——2026年4月更新

4月30日——GitHub 发布了面向 Visual Studio 的 Copilot 4 月更新,重点聚焦代理式工作流。

功能描述
来自 IDE 的云代理无需离开 Visual Studio 即可启动云代理会话
可移植的自定义代理%USERPROFILE%/.github/agents/ 中定义用户级设置
扩展的 Agent 技能可从 .claude/skills/.agents/skills/ 发现
调试器代理从 issue 中重现、插桩、诊断并修复问题
C++ Code Editing Tools已全面可用(get_symbol_call_hierarchy 等)

云代理允许在代理选择器中选择“Cloud”,描述一个任务,Copilot 就会自动创建 GitHub issue,并在远程基础设施上生成 pull request,而开发者可以继续工作。调试器代理会针对真实的运行时行为验证修复。

🔗 GitHub Copilot Visual Studio 2026年4月更新日志


Genspark × Microsoft——Azure 上的全球战略合作伙伴关系

4月30日——Genspark 宣布 Microsoft 成为全球战略合作伙伴。该合作构建于 Azure 之上,目标是将 Genspark 的 AI 代理直接集成到 Microsoft 的日常工具中——尤其是 PowerPoint 和其他 Microsoft 365 应用。官方表示的目标是把 AI 执行能力直接嵌入现有工具中,而无需迫使用户改变工作习惯。此次宣布紧随 4 月 29 日公布的 Salesforce 合作,并标志着 Genspark 在 Microsoft 生态中的显著扩张。

🔗 Genspark × Microsoft 公告


NVIDIA NeMo-RL + vLLM 推测解码——RL 吞吐提升 1.8×

5月1日——NVIDIA Research 发布了一篇关于强化学习后训练加速的论文(reinforcement learning post-training)。核心问题在于:生成阶段(rollout)形成瓶颈,从而拖慢整个 RL 循环。

该方案将 NeMo-RL 与 vLLM 结合,并使用推测解码(speculative decoding)——一种可并行生成候选 token 且不损失质量的技术。

指标数值
实测吞吐(8B 模型)1.8×
端到端预估2.5×
代码NVIDIA-NeMo/RL 开源

🔗 NVIDIA NeMo-RL 公告


Runway——Android 和 iOS 移动应用

5月2日——Runway 宣布推出 Android 移动应用,补充已上线的 iOS 应用。该 AI 视频生成平台现已覆盖两大主流移动平台,使用户能够从任何设备创建内容。

移动端的上线显著扩展了 Runway 的可访问性,此前其主要通过网页浏览器使用。公告口号——“Make anything. From anywhere. On any device.”——概括了这一诉求:把 AI 视频创作从桌面带到创作者的口袋里。Android 应用可在 Google Play 商店下载。

🔗 Runway Android 公告


ElevenCreative Flows——实时协作与 Basic Seats

5月1日——ElevenLabs 在其 AI 辅助音频与视频内容创作平台 ElevenCreative Flows 中启用实时协作。现在,一个团队的多名成员(创作者、营销人员、利益相关方)可以同时处理同一项目。Basic Seats 让审阅者和管理者无需完整订阅 ElevenCreative 也能访问项目。该公告获得了 769,000 次浏览,显示出对这一协作功能的强烈兴趣。

🔗 ElevenCreative Flows 公告


Grok Imagine——无限画布上的 Agent 模式

5月1日——Grok Imagine 在桌面端的无限画布上推出 Agent 模式(Agent Mode)。这个统一界面可完成完整的创作流程——构思、写作、图像生成、编辑和视频制作——且全程无需离开 grok.com/imagine

无限画布(infinite canvas)代表了 AI 创作工具设计上的一种演进:与其串联多个专用工具,不如让整个创作过程持续在一个工作空间中完成,且仅限桌面端使用。

指标数值
浏览量7.9M
点赞数3,825
可用性仅限桌面端

🔗 Grok Imagine Agent Mode 公告


Qwen-Scope——稀疏自编码器开源套件

4月30日——Qwen 发布了 Qwen-Scope,一个面向 Qwen 系列模型可解释性与控制的开源稀疏自编码器(sparse autoencoders, SAE)套件。SAE 会把模型内部激活分解为可理解的特征,而 Qwen-Scope 将其转化为四个领域的实用工具:

领域应用
推理无需提示词工程即可控制输出
数据对目标数据进行分类与摘要
训练在源头识别问题(code-switching、重复)
评估分析激活模式以选择合适的 benchmark

代码、权重和技术报告均可在 HuggingFace 和 ModelScope 上获取。

🔗 Qwen-Scope 公告


Codex CLI v0.128.0——持久目标、keymaps、MultiAgentV2

4月30日——Codex CLI 0.128.0 版本带来了多项实质性改进。

最主要的新功能是 /goal 命令,它允许通过 app-server API 定义持久目标(persisted goals)。目标可直接在 TUI 界面中创建、暂停、恢复或删除。

功能描述
/goal 持久化由 app-server APIs 管理,并支持 TUI 控制
codex update原地更新
可配置 keymaps可自定义的 TUI 键盘快捷键
扩展的 MultiAgentV2线程上限、等待时间控制、子代理深度
导入外部 agents在后台导入 agent 会话

安装:npm install -g @openai/codex@0.128.0

🔗 Codex CLI 更新日志


OpenAI Advanced Account Security——更强的可选保护

4月30日——OpenAI 推出 Advanced Account Security,这是一套面向 ChatGPT 和 Codex 账户的可选强化保护措施。该设置面向数字攻击高风险用户:记者、民选官员、政治异见者、研究人员。

启用后:密码登录将被禁用(仅接受 passkeys 或符合 FIDO 标准的实体安全密钥),电子邮件和短信恢复将被移除,会话时长缩短,而且对话会自动排除在模型训练之外。与 Yubico 的合作还可让用户从安全设置中以优惠价格购买 YubiKeys。自 2026 年 6 月 1 日起,Trusted Access for Cyber 项目成员必须启用此保护。

🔗 OpenAI Advanced Account Security


GPT-5.5——一周复盘:API 收入翻倍,Codex 营收翻倍

5月1日——OpenAI 在 GPT-5.5 发布一周后给出复盘:API 收入增长速度超过此前任何一次发布,且高出两倍以上。

指标数值
API 收入相较此前发布增长速度 >2x
7 天内 Codex 收入x2
OpenAI 评价“我们历史上最强的一次发布”

Codex 在不到七天内营收翻倍——这表明企业对代理式开发工具(agentic coding tools)的需求依旧强劲。这些数据印证了 4 月 23 日发布的 GPT-5.5 所带来的增长势头。

🔗 OpenAI GPT-5.5 复盘公告


工作中的 Perplexity Computer——Teams、专业金融、70+ 工作流

4月30日——Perplexity 发布了一篇博客文章,详细介绍其自动化代理 Computer 向新场景的扩展。

扩展细节
Microsoft Teams在 Slack 之后(4 月初上线)
可用工作流70+ enterprise workflows 库
Computer for Professional Finance市场金融、尽职调查、私募股权
身份安全已宣布新的合作伙伴关系

Computer 最初可在 Slack 中使用。Perplexity 正将其扩展到 Microsoft Teams,使用户能够直接在消息工具中自动化任务。接下来宣布支持的场景是文档和电子表格。对于专业金融领域,该服务面向私募股权团队、金融分析师和尽职调查团队。

🔗 Perplexity Computer at Work 博客


简讯

  • Claude Code Opus 4.7 黑客松——获胜者公布——与 Cerebral Valley 联合举办的活动中,“Best Use of Claude Managed Agents” 奖项归 ARIA 所有,这是由法国团队 Idriss Benguezzou 和 Adam Hnaien 开发的维护代理。🔗 公告

  • Anthropic Fellows——introspection adapters——Anthropic Fellows 的研究人员发布了关于 “introspection adapters” 的研究:这类适配器可让 LLM 自行报告训练过程中可能学到的不良行为。🔗 公告

  • Claude Cowork 企业部署指南——Anthropic 发布了一份新的实践指南,介绍如何在组织中大规模部署 Claude Cowork。🔗 指南

  • Copilot 中 GPT-5.2 和 GPT-5.2-Codex 将于 2026 年 6 月 1 日弃用——GitHub 将在所有 Copilot 体验中弃用 GPT-5.2(由 GPT-5.5 取代)和 GPT-5.2-Codex(由 GPT-5.3-Codex 取代),但 Copilot Code Review 中的 GPT-5.2-Codex 除外。🔗 更新日志

  • Midjourney V8.1——质量与清晰度更新——Midjourney 推出更新,提升 V8.1 模型的图像质量与清晰度。🔗 公告

  • Qwen + Fireworks AI 合作——Qwen 与 Fireworks AI 正式合作,为 enterprise 团队以更低延迟和更低推理成本部署 Qwen 模型。🔗 公告

  • Mistral AI 入选 TIME100 Most Influential Companies 2026——Mistral 在 TIME100 全球最具影响力公司榜单的 AI 类别中位列前 10。🔗 公告

  • Z.ai “Scaling Pain”——GLM-5 生产环境调试——Z.ai 发布了一篇技术复盘,讲述如何复现罕见的损坏输出、预填充吞吐瓶颈,以及 GLM-5 在大规模下的 GPU 内存占用。🔗 博客 · 公告

  • Codex——从 ChatGPT 导入工作流——参数、插件、agents 和项目配置可在几次点击内导入 Codex,并在遇到 rate limit 时从 ChatGPT 切换。🔗 公告

  • Codex for Work——角色与日常应用——面向工作的全新 Codex 体验:选择角色、连接常用应用、为文档、演示和电子表格提供提示词建议。🔗 公告

  • Codex Pets——互动吉祥物——Codex 中的 /pet 命令可唤醒一个互动虚拟吉祥物。157 万次浏览,@OpenAIDevs 上置顶推文。🔗 公告


这意味着什么

本周各项公告的汇聚勾勒出一个清晰趋势:企业安全正成为 AI 参与者最主要的差异化杠杆。Claude Security 和 OpenAI Advanced Account Security 都在面向组织与高风险用户——前者侧重代码层面,后者侧重账户层面,两者互补。NVIDIA OpenShell 则通过控制自主 agent 的行动边界提供了第三层保障。企业 AI 正进入一个以信任和可审计性优先于 benchmark 竞赛的成熟阶段。

代理式基础设施的普及正在切实推进。Manus Cloud Computer 和 Perplexity Computer at Work 都面向非开发者,允许他们持续运行服务——前者通过持久化的 Ubuntu 机器,后者通过 Teams 和 Slack 中的 enterprise workflows。这两款产品以互补方式降低技术门槛:Cloud Computer 面向构建者,Computer for Work 面向自动化业务流程的人。

合成语音正进入新的可及性阶段。xAI 通过 API 在不到 2 分钟内完成 Voice Cloning,并带来 1970 万次互动浏览量,这反映出市场对可直接嵌入第三方产品的多模态能力的强烈需求。Grok Imagine Agent Mode 和 ElevenCreative Flows 也遵循同样的逻辑:降低从创意到音视频内容创作之间的摩擦。

GPT-5.5 的发布数据(API 收入翻倍、Codex 在 7 天内营收翻倍)证实,企业对代码代理的需求已经成为可衡量的商业现实,而不再只是承诺。这一趋势也解释了 NVIDIA 在 RL 基础设施(NeMo-RL speculative decoding)和可解释性工具(Qwen-Scope)上的同步投入,它们都在应对大规模后训练中的瓶颈问题。


来源

本文档已使用 gpt-5.4-mini 模型从 fr 版本翻译为 zh 语言。有关翻译过程的更多信息,请参阅 https://github.com/jls42/ai-powered-markdown-translator