한 달 말에는 세 가지 발표가 주도했습니다: OpenAI가 사상 최대 규모의 비공개 자금 조달로 1,220억 달러를 모아 기업가치 8,520억 달러를 기록했고, Qwen이 텍스트·이미지·오디오·비디오를 동시에 처리하는 네이티브 오므니모달 모델로 한 단계 도약했으며, Claude Code 책임자가 도구의 잘 알려지지 않은 15가지 기능을 공개한 바이럴 스레드를 게시했습니다. 이번 주에는 또한 Perplexity의 Secure Intelligence Institute 출범, GitHub Copilot의 새 도구들, Runway와 NVIDIA의 인프라 이니셔티브 출범 소식도 있었습니다.
OpenAI가 1,220억 달러를 조달
3월 31일 — OpenAI는 마지막 자금 조달 라운드를 마감해 1,220억 달러의 자본을 확보했으며, 사후 가치(post-money valuation)는 8,520억 달러였습니다. 이는 테크 역사상 가장 큰 비공개 자금 조달 라운드 중 하나입니다.
이번 라운드는 SoftBank와 a16z가 공동 주도했으며, Amazon, NVIDIA, Microsoft가 전략적 참여를 했습니다. OpenAI는 처음으로 은행을 통해 개인 투자자 참여를 확장해 개인들로부터 30억 달러 이상을 모금했습니다. ARK Invest도 여러 상장지수펀드(Exchange-Traded Funds / ETF)에 OpenAI를 편입할 예정입니다.
이 조달을 뒷받침하기 위해 OpenAI는 성장 지표를 공개했습니다 :
| Indicateur | Valeur |
|---|---|
| Utilisateurs actifs hebdomadaires ChatGPT | 900 millions |
| Abonnés payants ChatGPT | 50 millions |
| Revenus mensuels | 2 milliards de dollars |
| Tokens traités par l’API (par minute) | 15 milliards |
| Utilisateurs hebdomadaires Codex | 2 millions (+5× en 3 mois) |
| Croissance Codex d’un mois sur l’autre | +70% |
회사는 ChatGPT, Codex, 웹 검색, 에이전트형 IA를 통합하는 단일 인터페이스인 “AI superapp”을 중심으로 한 로드맵을 제시했습니다. 목표는 주간 활성 사용자 수 10억 명을 넘기는 것입니다. 기업 고객은 이미 수익의 40%를 차지하고 있습니다.
GPT-5.4는 추론, 코딩, 에이전트 워크플로우(agentic workflows)에서의 향상을 제공하는 최신 모델로 설명됩니다. OpenAI의 성장은 동등한 단계에서 Google과 Meta보다 4배 빠르다고 회사는 주장합니다.
Qwen3.5-Omni : 네이티브 오므니모달 모델
3월 29일 — Alibaba Qwen은 Qwen3.5-Omni를 출시했습니다. 이 모델은 텍스트, 이미지, 오디오, 비디오를 하나의 통합된 모델로 네이티브하게 처리하도록 설계되었습니다. 전통적인 방식처럼 모달리티를 층으로 쌓아 추가하는 대신, 이 모델은 입력을 동시에 처리합니다.
원시 능력은 상당합니다: 최대 10시간의 오디오 또는 400초의 720p 비디오를 네이티브로 처리하고, 1억 시간 이상의 데이터로 학습되었으며, 113개 언어의 음성 인식과 36개 언어의 출력이 가능합니다.
핵심 기능: Audio-Visual Vibe Coding
가장 직접적으로 활용 가능한 기능은 “Audio-Visual Vibe Coding”입니다: 사용자가 카메라 앞에서 프로젝트를 음성으로 설명하면 Qwen3.5-Omni-Plus가 웹사이트나 작동 가능한 게임을 생성합니다. 이는 의도 기반 코딩(vibe coding) 개념을 오디오와 비디오의 실시간 처리로 확장한 사례입니다.
성능 비교
| Catégorie | Qwen3.5-Omni-Plus | Gemini 3.1 Pro |
|---|---|---|
| DailyOmni (audio/vision) | 84,6 | 82,7 |
| WorldScene | 62,8 | 65,5 |
| QualocommInteractive | 68,5 | 52,3 |
| OmniClear | 64,8 | 55,5 |
| IFEval (texte) | 89,7 | 93,5 |
| MMLU-Redux | 94,2 | 90,0 |
이 모델은 오디오 관련 벤치마크에서 Gemini 3.1 Pro를 앞서며, 오디오-비주얼 이해에서는 동등한 성능을 보입니다.
음성 기능
- 정밀 음성 제어: 감정, 리듬, 볼륨을 실시간으로 조정
- 짧은 샘플로부터의 음성 복제(Voice Cloning) (엔지니어링 배포 예정)
- 실제 의도를 이해하고 주변 소음을 무시하는 지능형 발언 제어(Semantic Interruption)
- 통합 웹 검색 및 복잡한 함수 호출
모델 군
| Variante | Positionnement |
|---|---|
| Qwen3.5-Omni-Plus | SOTA 성능, 상세 오디오-비주얼 캡셔닝 |
| Qwen3.5-Omni-Plus-Realtime | 음성 제어, WebSearch, Voice Clone, Semantic Interruption |
| Qwen3.5-Omni-Flash | 속도 |
| Qwen3.5-Omni-Light | 경량화 |
chat.qwen.ai(VoiceChat/VideoChat 버튼)와 Alibaba Cloud의 API를 통해 접근할 수 있습니다.
추가 메모 : Qwen 3.6 Plus Preview는 제한된 기간 동안 OpenRouter에서 무료로 이용 가능하며, 이 기간 동안의 대화는 모델 개선을 위해 수집됩니다.
Claude Code의 숨겨진 15개 기능
3월 30일 — Anthropic의 Claude Code 책임자 Boris Cherny가 도구에 관한 잘 문서화되지 않은 15가지 기능을 공개하는 스레드를 게시했습니다. 해당 스레드는 360만 조회수, 2,000 리포스트, 22,000 좋아요를 기록했습니다.
“I wanted to share a bunch of my favorite hidden and under-utilized features in Claude Code. I’ll focus on the ones I use the most. Here goes.”
🇰🇷 Claude Code에서 제가 가장 좋아하지만 잘 알려지지 않고 덜 사용되는 몇 가지 기능을 공유하고 싶었습니다. 제가 가장 자주 사용하는 기능들에 집중하겠습니다. 시작합니다. — @bcherny X에서
모빌리티 및 원격 세션
- iOS 및 Android용 Claude 앱에는 휴대폰에서 코딩할 수 있는 Code 탭이 포함되어 있습니다
--teleport(또는/teleport)을 사용하면 클라우드 세션을 로컬 머신으로 전환할 수 있고;/remote-control는 어떤 기기에서든 로컬 세션을 제어할 수 있게 합니다- Cowork Dispatch: 모바일에서 Claude Desktop App을 안전하게 원격 제어하여 MCP 서버, 브라우저 등 접근
자동화
/loop및/schedule로 Claude를 정해진 간격으로 자동 실행할 수 있으며, 최장 일주일까지 설정 가능 — Cherny는 코드 리뷰와 지속적인 리베이스를 위해/loop 5m /babysit를 사용한다고 합니다- 훅(
SessionStart,PreToolUse등)은 에이전트 사이클에 결정론적 로직을 주입할 수 있어 예를 들어 허가 요청을 WhatsApp으로 라우팅하는 등 사용 가능
병렬 처리
/batch은 수십, 수백, 심지어 수천 개의 에이전트로 작업을 병렬 분산합니다 — 대규모 코드 마이그레이션에 유용claude -w은 별도의 git worktrees에서 병렬 세션을 시작합니다
일상 생산성
/btw으로 에이전트가 작업 중일 때 빠른 질문을 하여 현재 작업을 중단하지 않고도 질의 가능/branch로 세션을 포크(fork)할 수 있음; 또는 CLI로는claude --resume <session-id> --fork-session--agent으로.claude/agents/내에서 프롬프트와 구성 가능한 도구를 이용해 맞춤 에이전트를 정의--add-dir//add-dir은 Claude에 여러 폴더나 저장소를 동시에 접근하게 함--bare은 SDK 시작을 최대 10× 가속( CLAUDE.md, 설정, MCP 서버 로드를 회피)/voice은 음성 입력 활성화( CLI에서는 스페이스바, Desktop에는 전용 버튼, iOS에서는 받아쓰기)- Chrome 확장(베타): Claude Code + Chrome으로 웹 앱 테스트, 콘솔 로그 디버깅, 브라우저 자동화
Claude Code : 자동 모드(autο mode)가 Enterprise와 API에도 확대
3월 30일 — 3월 24일 Pro 및 Max 사용자에게 출시된 Claude Code의 자동 모드(auto mode)가 이제 Enterprise 요금제와 API 접근 개발자에게도 제공됩니다. 이 기능은 파일 쓰기나 bash 명령 같은 행동의 승인 결정을 사용자 대신 Claude가 스스로 내리도록 허용합니다.
Enterprise 또는 API 환경에서 활성화하려면:
claude --enable-auto-mode
자동 모드는 각 행동의 위험을 평가하는 내부 분류기를 사용하여 실행 전에 위험을 판단하며, 관대한 모드(--dangerously-skip-permissions)와 수동 승인 사이의 균형을 제공합니다.
3월 30일 — Cowork Dispatch는 이제 자연어 지시에서 특정 모델을 직접 언급해 코딩 작업을 시작할 수 있습니다.
Perplexity, Secure Intelligence Institute 출범
3월 31일 — Perplexity는 고도화된 AI 시스템의 보안, 프라이버시, 안전성 연구를 전담하는 연구소인 Secure Intelligence Institute(SII)를 출범했습니다. 연구소장은 Purdue 대학교의 Samuel D. Conte 교수직을 맡고 있는 Dr. Ninghui Li로, ACM 및 IEEE 펠로우이자 전 ACM SIGSAC 의장입니다. 학계 파트너로는 Dan Boneh의 응용 암호화 그룹과 Neil Gong의 Gong Lab이 포함됩니다.
SII는 첫 세 편의 연구를 공개했습니다 :
| Publication | Type | Description |
|---|---|---|
| BrowseSafe | Benchmark open-source | 14 700+ 실제 공격 시나리오, IA 탐색용 14개 리스크 카테고리 |
| Sécurisation des agents NIST/CAISI | Politique | 자율 에이전트 보안에 관한 RFI(Response for Information)에 대한 응답 |
| Building Security Into Comet | Architecture | AI 브라우저 Comet의 심층 방어 설계 |
SII는 Perplexity의 시스템 개선으로 연구를 적용하고 그 결과물을 AI 생태계와 공유합니다.
🔗 Secure Intelligence Institute
Cohere와 Ensemble : 의료 분야 수익 주기 관리(Revenue Cycle Management) 특화 LLM
3월 31일 — Cohere와 Ensemble은 미국 의료 산업의 수익 주기 관리(Revenue Cycle Management / RCM)에 네이티브로 특화된 첫 대형 언어 모델(LLM)을 구축한다고 발표했습니다.
Ensemble은 예약에서 최종 청구에 이르기까지 병원과 의료 그룹을 위한 엔드투엔드 솔루션을 제공합니다. 일반적인 LLM을 전문 프롬프트로 감싼 경쟁사와 달리, 이 모델은 Cohere의 Command 계열에 맞춰 완전히 맞춤화되어 있습니다.
| Domaine | Capacité |
|---|---|
| Financier | 제출 전 거절 예측, 지속적 청구 품질 관리 |
| Clinique | 진료 시점의 문서화 가이드, 통화 기록 조합 |
| Agentique | 수익 주기의 다단계 오케스트레이션 |
이 모델은 Cohere의 사전학습 데이터, Ensemble의 운영 로그, 공개 RCM 지식 소스, 전문가 주석으로 학습되었습니다. 도메인 특화 벤치마크(benchmark) 프레임워크를 공동 개발해 실제 RCM 작업에서의 성능을 일반 LLM과 비교 평가합니다.
GitHub Copilot : 에이전트 우선 개발 및 Slack 통합
3월 31일 — GitHub의 Copilot Applied Science 팀 연구원 Tyler McGoffin은 Copilot을 주된 코딩 에이전트로 사용해 내부 도구를 구축한 경험을 공유했습니다. 이 도구는 TerminalBench2와 SWEBench-Pro 같은 벤치마크에서 에이전트의 궤적 분석을 자동화합니다.
권장 실천법: 코딩 전에 /plan 모드를 사용, 사람만 수정할 수 있는 “계약 테스트”(contract tests) 생성, 간결한 프롬프트보다 상세한 프롬프트 사용, 주간 자동 유지보수에 /plan Review the code for any missing tests... 사용 등이 소개됩니다. 결론: 에이전트와 효과적으로 협업하려면 계획, 컨텍스트, 커뮤니케이션 같은 우수 엔지니어의 자질이 동일하게 중요합니다.
3월 30일 — GitHub의 Slack 앱은 이제 Copilot을 통합해 자연어로 바로 GitHub 이슈를 생성할 수 있습니다. 채널 어디에서든 @GitHub를 멘션하고 작업을 설명하면 됩니다.
| Fonctionnalité | Détail |
|---|---|
| Création en langage naturel | 설명 → 구조화된 이슈(제목, 본문, 담당자, 레이블, 마일스톤) |
| Sous-issues | 한 메시지에서 부모/자식 이슈로 작업 분해 |
| Mode conversation | 이슈 생성 전 대화를 통한 반복 개선 |
3월 31일 — GitHub는 타사 애플리케이션에 agentic workflows를 통합할 수 있는 Copilot SDK를 3가지 아키텍처 모델로 발표했습니다.
🔗 GitHub 블로그 - 에이전트 기반 개발 🔗 GitHub 변경 로그 - Slack에서 이슈 생성
Runway : 투자 펀드 및 스타트업 프로그램
3월 31일 — Runway는 두 가지 이니셔티브를 동시에 발표했습니다.
Runway Fund는 AI, 미디어, 세계 시뮬레이션 분야 초기 단계(early-stage) 스타트업을 위한 투자 펀드입니다. 초기 약정은 최대 1,000만 달러이며, pre-seed/seed 단계에 최대 50만 달러까지 투자합니다. 연구형 AI(세계 모델 및 생성 AI), 새로운 애플리케이션(LLM 위의 애플리케이션 층), 새로운 미디어 및 콘텐츠의 세 축에 집중합니다. 이미 Cartesia, LanceDB, Tamarind Bio에 투자했습니다.
Runway Builders는 비디오 생성 및 실시간 대화형 AI 제품을 구축하는 시리즈 A 이전부터 시리즈 C 단계의 스타트업을 위한 액셀러레이터 프로그램입니다. 참가사는 API 크레딧, 최고 수준의 rate limits, 전용 커뮤니티 접근을 받습니다.
🔗 Runway Fund 🔗 Runway Builders
NVIDIA와 Emerald AI : 전력망 연계형 유연한 AI 팩토리
3월 31일 — NVIDIA와 Emerald AI는 CERAWeek에서 AI 팩토리(AI factories)를 정적인 부하가 아닌 전력망의 유연한 자산으로 다루는 새로운 접근을 발표했습니다. 아키텍처는 NVIDIA Vera Rubin DSX와 Emerald AI의 Conductor 플랫폼을 기반으로 합니다.
발표된 에너지 파트너사: AES, Constellation, Invenergy, NextEra Energy, Nscale Energy, Vistra. 관련 발표 사항들:
- Maximo : NVIDIA Isaac Sim을 활용한 Bellefield의 100 MW 태양광 로봇 설치 운영
- TerraPower + SoftServe : 원자로 설계 기간 단축을 위한 NVIDIA Omniverse 기반 디지털 트윈
- Adaptive Construction Solutions : AI 팩토리 건설을 위한 국가 차원의 교육 프로그램
- GE Vernova, Schneider Electric, Vertiv : Vera Rubin 검증 레퍼런스 디자인
Jensen Huang는 에너지를 “다섯 겹의 AI 케이크(five-layer AI cake)“의 근간이라고 설명했습니다.
간단히
Gemini Live on Gemini 3.1 Flash Live — 3월 30일 — Google은 Gemini Live 앱에서 모델 Gemini 3.1 Flash Live의 배포를 확인했으며, 모든 사용자에게 제공됩니다. 이 변화(3월 26일 발표)는 더 자연스러운 오디오 대화와 소음이 많은 환경에서의 향상된 정확도를 가져옵니다. 🔗 트윗 @GeminiApp
Manus : téléphone으로 Desktop 제어 — 3월 30일 — Manus는 스마트폰으로 Desktop 애플리케이션을 제어할 수 있는 기능을 추가했습니다: 작업 시작, 파일 접근, 워크플로 실행 등으로 컴퓨터를 직접 건드리지 않아도 됩니다. 🔗 트윗 @ManusAI
Midjourney V8 티저 — 3월 29일 — Midjourney 창립자 David Holz는 V8의 “근본적으로 다른” 버전이 “곧 출시될 예정”이라고 발표했습니다. 날짜는 발표되지 않았습니다. 🔗 트윗 @DavidSHolz
Claude Code v2.1.87 — Cowork Dispatch에서 메시지가 전달되지 않던 버그 수정. 🔗 GitHub 변경로그
이것이 의미하는 바
OpenAI의 852 milliards(평가액 8520억)는 전환점을 나타냅니다: 이런 규모에서는 선두 업체들과 업계 나머지 사이의 격차가 구조적으로 벌어집니다. 주간 사용자 9억 명과 10억 명 목표를 가진 ChatGPT는 단순한 기술 제품이 아니라 대중 인프라로 자리매김하고 있습니다.
Qwen3.5-Omni의 출시는 옴니모달 모델 경쟁이 심화되고 있음을 보여줍니다. Audio-Visual Vibe Coding은 의도 기반 코딩(vibe coding)의 구체적인 진화로, 텍스트에서 음성과 비디오를 주요 인터페이스로 전환하여 생성형 AI와의 상호작용 방식을 바꿉니다.
개발자 도구 측면에서는 Boris Cherny의 스레드가 Claude Code에 문서화되지 않았던 고급 기능들(대규모 병렬화 /batch, 후크를 통한 자동화, 분산 세션 등)이 누적되어 왔음을 드러냅니다. Enterprise 플랜으로의 auto mode 확장은 전형적인 경로를 따릅니다: 프리뷰에서 검증한 뒤 점진적으로 배포하는 방식입니다.
마지막으로 Perplexity가 Secure Intelligence Institute를 설립하고 Cohere가 의료 분야에서 추진하는 이니셔티브들은 한 가지 경향을 보여줍니다: 업계 2위권의 플레이어들이 범용 모델과 정면으로 경쟁하기보다 규제가 많은 의료나 AI 보안 같은 전문 수직 분야에서 차별화를 모색하고 있다는 점입니다.
출처
- OpenAI - AI의 다음 단계를 가속화
- OpenAI 트윗 - 자금 조달
- Alibaba Qwen 트윗 - Qwen3.5-Omni
- Boris Cherny 스레드 - Claude Code의 15가지 기능
- 트윗 @claudeai - Auto mode Enterprise
- 트윗 @noahzweben - Dispatch 모델
- GitHub - Claude Code 변경로그
- Perplexity Secure Intelligence Institute
- Perplexity 트윗 - SII
- Cohere 블로그 - 의료용 LLM RCM
- GitHub 블로그 - 에이전트 기반 개발
- GitHub 변경로그 - Slack에서 이슈 생성
- Runway Fund
- Runway Builders
- NVIDIA 블로그 - AI 팩토리
- 트윗 @GeminiApp - Gemini Live 3.1 Flash
- 트윗 @ManusAI - 휴대폰 제어
- 트윗 @DavidSHolz - Midjourney V8
- 트윗 @OpenRouter - Qwen 3.6 Plus 미리보기
이 문서는 gpt-5-mini 모델을 사용하여 fr 버전에서 ko 언어로 번역되었습니다. 번역 프로세스에 대한 자세한 내용은 https://gitlab.com/jls42/ai-powered-markdown-translator 를 참조하세요.