AI 开发工具领域迎来了紧凑的一周:Anthropic 推出了 Claude Code Security,可直接在代码库中检测漏洞;Runway 将顶级视频模型统一到一个平台;GitHub Copilot 将模型选择器扩展到 Business 和 Enterprise 客户。与此同时,OpenAI 公布了在高级数学挑战赛上的初步结果,Perplexity 详细介绍了其 Comet 浏览器的安全架构。
Claude Code Security:在开源项目中检测出 500+ 漏洞
2026年2月20日 — Anthropic 推出了 Claude Code Security,这是一项集成在 Claude Code(Web 界面)中的功能,目前处于有限研究预览阶段。该工具允许安全团队检测代码库中的漏洞,并获取经过人工验证的针对性补丁。
Anthropic 的 Red Team 使用 Claude Opus 4.6 在生产环境的开源项目中识别出了 500 多个漏洞——这些 bug 存在了几十年,尽管经过专家多年的审查仍未被发现。
与传统的静态分析工具(基于规则和已知模式)不同,Claude Code Security 像人类安全研究员一样对代码进行推理。它理解组件之间的交互,跟踪应用程序中的数据流,并检测传统工具遗漏的复杂漏洞(如业务逻辑、失效的访问控制)。
每一个发现都经过多阶段验证过程:Claude 会重新检查自己的结果以消除误报(false positives),分配严重性级别,并在仪表板中显示结果,附带建议的补丁和置信度评分。在采取任何行动之前,人工批准始终是强制性的。
| 方面 | 详情 |
|---|---|
| 访问 | 有限研究预览 |
| 对象 | Enterprise 和 Team 客户 |
| 开源 | 维护者可获加速免费访问 |
| 批准 | 始终由人工批准 — Claude 建议,人类决定 |
| 使用模型 | Claude Opus 4.6 |
“Introducing Claude Code Security, now in limited research preview. It scans codebases for vulnerabilities and suggests targeted software patches for human review, allowing teams to find and fix issues that traditional tools often miss.”
🇨🇳 隆重介绍 Claude Code Security,现已开启有限研究预览。它扫描代码库中的漏洞,并建议针对性的软件补丁供人工审查,帮助团队发现并修复传统工具经常遗漏的问题。 — @claudeai on X
Claude Code Desktop:预览、CI/PR 监控及会话移动性
2026年2月20日 — Claude Code Desktop 迎来了三项新功能,将其定位为更自主的开发环境:
| 功能 | 描述 |
|---|---|
| Previews | Claude 可以预览正在运行的应用,读取 DOM 和 React 树,并对更改提供第二意见 |
| PR monitoring | 在后台监控 CI;具有自动修复(auto-fix)和自动合并(auto-merge:检查通过后立即合并)功能 |
| Session mobility | 会话跟随开发者 — 使用 /desktop 命令将 CLI 会话带入桌面应用,或推送到云端以便从 Web 或移动端继续 |
带有自动修复功能的 PR 监控代表了迈向真正自主开发代理的具体一步:开启一个 PR,并在 Claude 监控和解决 CI 失败的同时继续工作。
Claude Code CLI 原生支持 Git worktrees
2026年2月21日 — Claude Code 产品经理 Boris Cherny (@bcherny) 宣布 Claude Code CLI 原生支持 git worktrees。该功能此前已在 Desktop 应用中可用,现在也来到了 CLI。
每个代理都有自己的 worktree,并且可以独立工作——这意味着多个 AI 代理可以在不同的任务上并行运行,而不会发生文件冲突。
Runway 成为视频和图像多模型中心
2026年2月20日 — Runway 宣布将主要的视频和图像生成模型直接集成到其平台中。创作者现在无需更换工具即可在最佳模型之间切换。
Runway 上可用的模型:
| 模型 | 类型 |
|---|---|
| Kling 3.0 | 视频 |
| Kling 2.6 Pro | 视频 |
| Kling 2.5 Turbo Pro | 视频 |
| WAN2.2 Animate | 视频 |
| GPT-Image-1.5 | 图像 |
| Sora 2 Pro | 视频 |
这一集成将 Runway 定位为创作的“中心”:一个用于电影、广告、社交媒体帖子或任何其他内容的统一界面,提供更多的控制和保真度。
Midjourney V8:发布前的最终评分阶段
2026年2月20日 — Midjourney 宣布其“V8 Rating Party”进入 Final Round,这是一个收集用户偏好以校准 V8 审美个性化系统的阶段。这一轮将持续到正式发布——这清楚地表明发布迫在眉睫。
用户在代表不同审美的图像对之间进行投票。展示的图像并不代表最终模型,而是用于训练个性化系统。
GitHub Copilot:模型选择器扩展、Zed GA、弃用
2026年2月19日 — GitHub Copilot 同步发布了三项更新:
Business 和 Enterprise 版模型选择器
Copilot 编码代理的模型选择器于 2025 年 12 月面向 Pro 和 Pro+ 计划推出,现已面向 Copilot Business 和 Copilot Enterprise 开放。
| 可用模型 | 提供商 |
|---|---|
| Auto (默认) | — |
| Claude Opus 4.5 / 4.6 | Anthropic |
| Claude Sonnet 4.5 / 4.6 | Anthropic |
| GPT-5.1-Codex-Max | OpenAI |
| GPT-5.2-Codex / GPT-5.3-Codex | OpenAI |
如果管理员未启用任何模型,将自动使用 Claude Sonnet 4.6。
🔗 更新日志 — Model Picker Business/Enterprise
GitHub Copilot in Zed — 全面可用 (GA)
GitHub 正式宣布与 Zed(由 Atom 创始人创建的 Rust 编写的高性能编辑器)建立合作伙伴关系。Copilot 订阅者(Pro, Pro+, Business, Enterprise)可以在 Zed 中使用其现有订阅,无需额外的 AI 许可证。
Copilot 中已弃用的模型
自 2026年2月17日起,以下三个模型不再在任何 Copilot 体验中可用:
| 已弃用模型 | 建议替代 |
|---|---|
| Claude Opus 4.1 | Claude Opus 4.6 |
| GPT-5 | GPT-5.2 |
| GPT-5-Codex | GPT-5.2-Codex |
Enterprise 管理员必须在 Copilot 设置中检查其模型策略。
OpenAI First Proof:验证 10 个数学证明中的 5 个
2026年2月20日 — OpenAI 公布了其提交给 First Proof 挑战赛的结果,该竞赛旨在测试 AI 系统能否针对专业数学研究问题生成正确的证明。
一个内部模型(训练中,未命名)被提交用于挑战赛的 10 个问题。根据专家反馈,至少 5 个证明(问题 4, 5, 6, 9, 10)极有可能是正确的,其他几个仍在审查中。该模型在有限的人工监督下运行。
OpenAI 指出,该模型随着训练“变得越来越有能力”,并按渐进顺序解决了问题。这一结果是一系列成果的一部分:2025 年 7 月的 IMO 金牌(35/42 分),以及随后的 GPT-5 研究实验。
ChatGPT:使用 Mermaid、Vega、HTML 和 React 的交互式代码块
2026年2月19日 — OpenAI 使 ChatGPT 中的代码块具有交互性。用户现在可以直接在聊天界面中创建、编辑和预览代码。
| 功能 | 描述 |
|---|---|
| 图表和迷你应用 | 聊天内实时创建和预览 |
| 分屏视图 | 并排审查代码 |
| 全屏模式 | 全屏编辑 |
| 支持格式 | Mermaid, Vega, HTML, React(未来将支持更多) |
这是一个逐步部署的初始发布(“early launch”),旨在随着时间的推移丰富代码块功能。
Perplexity Comet:详细的安全架构,BrowseSafe 开源
2026年2月20日 — Perplexity 发布了一篇关于其代理 AI 浏览器 Comet 安全架构的深度文章。面对 Comet 的广泛能力(Web 浏览、内容交互、执行复杂任务),团队详细介绍了从一开始就实施的保护措施。
| 日期 | 阶段 |
|---|---|
| 2025年4月 | Trail of Bits 发布前审计 — 威胁建模,对抗性测试 |
| 2025年10月 | 公布 4 层防御架构 + 启动漏洞赏金计划 |
| 2025年12月 | BrowseSafe 开源(检测模型 + benchmark) |
开源的 BrowseSafe 涵盖:
- 14,719 个真实和合成攻击示例
- 11 种攻击类型(隐藏 HTML、CSS、内容混淆、目标劫持等)
- 9 种注入策略记录
- 3 种语言风格测试
🔗 Perplexity Hub 文章 — Comet Security
Gemini CLI v0.29.0:Plan Mode 和默认 Gemini 3
2026年2月17日 — Gemini CLI 版本 v0.29.0 带来了四项改进:
| 功能 | 详情 |
|---|---|
| Plan Mode | 通过 /plan 命令和 enter_plan_mode 工具实现的新规划能力 |
| Gemini 3 Default | 移除预览标志:Gemini 3 默认对所有人启用 |
| Extension Exploration | 用于探索和管理扩展的新 UI |
| Admin Control | 管理员可对特定 MCP 服务器配置进行白名单管理 |
NotebookLM:基于 Prompt 的修订和 PPTX 导出
2026年2月17日 — NotebookLM 为 Slide Decks 推出了两项更新:
- Prompt-Based Revisions:通过自然语言提示直接修改幻灯片(调整、改写、改变风格)
- PPTX Support:以 PowerPoint 格式 (.pptx) 导出 Slide Decks — Google Slides 已宣布为下一步计划
Perplexity Pro 和 Max 集成 Gemini 3.1 Pro
2026年2月19日 — Perplexity 在其 AI 搜索引擎中集成了 Gemini 3.1 Pro。该模型立即可供 Pro 和 Max 订阅者使用(不包括 Free),并在选择器中被介绍为“Google 最先进的模型”。
自 2 月初以来,Perplexity 已集成 Claude Opus 4.6(2月9日)、Claude Sonnet 4.6(2月17日)和 Gemini 3.1 Pro(2月19日)——两周内增加了三个前沿模型。
Qwen3-Coder-Next 可通过阿里云 API 使用
2026年2月20日 — Qwen 通过阿里云 Model Studio API 提供其编码模型 Qwen3-Coder-Next。该模型最初于 2 月 2 日开源发布,现在可以通过可扩展的端点访问。它还被集成到了阿里云专为软件开发提供的 Coding Plan 中。
小更新
Hackathon Claude Code — 结果(2月21日) — 最新的 Claude Code 黑客马拉松圆满结束,500 名构建者花了一周时间探索 Opus 4.6 和 Claude Code。“Keep Thinking”奖颁给了 Kyeyune Kazibwe 的 TARA:一个从行车记录仪到非洲基础设施投资建议的管道,已在乌干达一条建设中的道路上进行了测试。🔗 @claudeai 推文
NotebookLM Video Overviews 移动端(2月21日) — 现在可以直接在 NotebookLM 移动应用中自定义 Video Overviews。🔗 @NotebookLM 推文
Pomelli Photoshoot — Google Labs(2月20日) — Google Labs 在 Pomelli 中推出了 Photoshoot:从单张照片生成可用于营销活动的产品视觉效果(模板、通过 prompt 编辑、从头创建)。🔗 @GoogleAI 推文
组织级 Copilot 指标仪表板(2月20日) — 新的组织级 Copilot 使用指标仪表板已进入公开预览阶段。🔗 GitHub 更新日志
这意味着什么
Claude Code Security 标志着一个转折点:Anthropic 不再仅仅将自己定位为开发者生产力工具,而是防御性网络安全的参与者。在强制人工监督的同时,将漏洞检测直接集成到 AI IDE 中,回应了对 AI 编码工具在不检查安全性的情况下生成代码的反复批评。在实际开源项目中发现的 500 个漏洞是一个具体的论据。
在创意平台方面,Runway 确认了其作为聚合者的战略:它不开发单一的旗舰模型,而是押注于多模型集成(Kling, WAN, Sora, GPT-Image)以提供统一的界面。这与 Midjourney 通过 V8 继续迭代自有模型的赌注不同。
在开发方面,GitHub Copilot 中可用模型的增加(Claude Opus 4.6, GPT-5.x-Codex)及其向 Zed 的扩展表明了一种融合:代码辅助工具正在成为多模型界面,而不是单一提供商的包装器。