검색

Routines Claude Code, Gemini Robotics-ER 1.6, GLM-5.1 오픈 소스

Routines Claude Code, Gemini Robotics-ER 1.6, GLM-5.1 오픈 소스

2026년 4월 14일은 AI 지원 개발 도구에 있어 매우 밀도 높은 하루였다. Anthropic은 Claude Code에 루틴을 도입해, 계획이나 웹훅을 통해 전체 워크플로를 자동화하고 컴퓨터를 켜둔 채로 둘 필요 없이 실행할 수 있게 했다. Google DeepMind는 Boston Dynamics와 함께 개발한 새로운 산업 인식 기능을 갖춘 Gemini Robotics-ER 1.6을 공개했다. Z.ai는 SWE-Bench Pro에서 오픈 소스 모델 1위로 분류된 GLM-5.1을 MIT 라이선스로 공개했다. GitHub Copilot은 유용한 세 가지 기능을 추가했다: 3번 클릭으로 충돌 해결, US/EU 데이터 리전, 그리고 서드파티 에이전트를 위한 모델 선택.


Claude Code의 루틴 — 예비 연구 (research preview)

4월 14일 — Anthropic이 Claude Code의 루틴을 research preview로 출시했다. 루틴은 프롬프트, 저장소, 커넥터로 한 번만 구성하면 되는 자동화로, 이후 사용자가 연결을 유지하지 않아도 자율적으로 실행된다.

세 가지 트리거 유형을 사용할 수 있다:

유형트리거사용 예시
예약됨 (Scheduled)Cron(시간별, 야간, 주간)Linear 버그 야간 분류, 수정 PR 생성
API전용 엔드포인트로의 HTTP POST 호출Datadog 알림 → 자동 분류 + 수정 초안
웹훅GitHub 이벤트(PR, push…)열려 있는 각 PR에 대한 자동 코드 리뷰

각 루틴에는 자체 엔드포인트와 인증 토큰이 있다. API 루틴은 기존의 어떤 파이프라인(알림, 배포 훅, 내부 도구)에도 통합할 수 있다. 웹훅 루틴은 정의된 필터와 일치하는 각 PR마다 새 세션을 시작하고, 이후 업데이트(댓글, CI 실패)를 해당 세션에 반영한다.

“Configure a routine once (a prompt, a repo, and your connectors), and it can run on a schedule, from an API call, or in response to an event. Routines run on our web infrastructure, so you don’t have to keep your laptop open.”

🇰🇷 루틴은 한 번만 구성하면 됩니다(프롬프트, 저장소, 커넥터). 그러면 일정에 따라, API 호출로, 또는 이벤트에 응답하여 실행할 수 있습니다. 루틴은 우리 웹 인프라에서 실행되므로 컴퓨터를 켜둘 필요가 없습니다.@claudeai X에서

이용 가능 여부 및 제한:

요금제루틴/일
Pro5
Max15
Team / Enterprise25

Claude Code web이 활성화된 모든 유료 요금제(Pro, Max, Team, Enterprise)에서 이용 가능하다. 할당량을 초과한 경우에도 추가 사용은 가능하다. 루틴은 대화형 세션과 마찬가지로 구독 크레딧을 소모한다.

문서화된 사용 사례:

  • 백로그 관리: 야간 분류, 태깅, Slack 요약
  • 문서 드리프트(docs drift): 병합된 PR의 주간 스캔, 업데이트가 필요한 페이지 탐지
  • 배포 후 검증: 각 릴리스 후 스모크 테스트(smoke checks)
  • SDK 포팅: 병합되는 각 Python PR이 Go SDK로의 포팅을 자동 트리거

🔗 Anthropic 블로그 🔗 공지 트윗


Claude Code v2.1.105 — PreCompact 훅, 플러그인 모니터, /proactive

4월 11일~13일 — Claude Code 2.1.105 버전은 여러 주목할 만한 개선 사항을 제공한다:

기능설명
파라미터 path for EnterWorktree현재 저장소의 기존 worktree로 전환할 수 있음
PreCompact 훅이제 훅이 컴팩션을 차단할 수 있음(종료 코드 2 또는 {"decision":"block"})
플러그인용 Background monitors플러그인 매니페스트의 monitors 키 — 세션 시작 시 자동으로 활성화
/proactive/loop의 새 별칭
차단된 Streams API 폐기데이터 없이 5분 후 폐기 + 비스트리밍 모드로 재시도
네트워크 오류 메시지조용한 스피너 대신 즉시 재시도 메시지 표시
긴 파일 표시매우 긴 단일 행 쓰기(예: minified JSON)는 인터페이스에서 잘림
개선된 /doctor상태 아이콘 + 발견된 문제를 Claude에게 수정하도록 요청하는 f

4월 14일2.1.107 버전은 인터페이스 개선을 제공한다. 긴 작업 중에는 진행 힌트(thinking hints)가 더 일찍 표시되어, 시각적 피드백 없이 기다리는 느낌을 줄여준다.

🔗 Claude Code 변경 로그


Anthropic — Vas Narasimhan이 이사회에 합류

4월 14일 — Anthropic의 Long-Term Benefit Trust(LTBT)가 Vas Narasimhan을 이사회에 임명했다. 의사이자 과학자이며 Novartis의 CEO인 그는 세계에서 가장 규제가 엄격한 산업 중 하나에서 35개 이상의 혁신 의약품의 개발과 승인을 감독했다.

이번 임명으로 Trust가 지명한 이사들이 이제 이사회의 과반수를 구성하게 되었다. LTBT는 구성원들이 Anthropic에 어떠한 재정적 이해관계도 갖지 않는 독립 기구이며, 그 역할은 상업적 성공과 장기적인 공익 사명의 균형을 유지하는 것이다.

🔗 Anthropic 공지


Gemini Robotics-ER 1.6 — 산업 인식과 안전

4월 14일 — Google DeepMind가 로보틱스를 위한 embodied reasoning 모델의 업데이트 버전인 Gemini Robotics-ER 1.6을 공개했다. 이 모델은 로봇이 더 큰 자율성으로 실제 작업을 계획하고 수행할 수 있도록 시각 및 공간 이해를 향상시킨다. 내부 로봇 벤치마크에서 Gemini Robotics-ER 1.5와 Gemini 3.0 Flash를 능가한다.

새로운 기능:

기능설명
공간 포인팅 (Pointing)객체 탐지 및 개수 세기, 관계 논리(더 작음/더 큼), 궤적과 파지점, 복잡한 제약 조건
다중 시점 성공 검출여러 카메라 각도를 분석하여 작업이 실제로 완료되었는지 확인
계측기 판독원형 게이지와 투명 튜브(sight glasses)를 판독 — 산업 검사용으로 Boston Dynamics와 함께 개발
안전(ASIMOV v2 벤치마크)안전 지침 준수에서 테스트된 모든 모델 중 최고 점수

계측기 판독 기능은 산업 설비 검사용 로봇 Spot을 위해 Boston Dynamics와 협력하면서 탄생했다. 이는 공간 추론과 코드 실행을 결합해 압력 게이지를 높은 정확도로 해석한다.

이용 가능 여부: Gemini API(gemini-robotics-er-1.6-preview), Google AI Studio, 그리고 GitHub Colab의 시작 노트북.

🔗 Google DeepMind 블로그 🔗 공지 트윗


GLM-5.1 — Z.ai가 MIT 라이선스로 자사 에이전틱 모델을 공개

4월 7일 (뒤늦게 포착된 발표 — 지난주 스캔에서 놓쳤던 내용) — Z.ai(구 ZhipuAI)가 에이전틱 코딩(agentic coding)을 위한 새로운 주력 모델 GLM-5.1을 MIT 라이선스로 오픈 소스 공개했다.

코드 벤치마크 성능:

벤치마크GLM-5.1GLM-5Claude Opus 4.6GPT-5.4Gemini 3.1 Pro
SWE-Bench Pro58,455,157,357,754,2
NL2Repo42,735,949,841,333,4
Terminal-Bench 2.063,556,265,468,5

GLM-5.1은 SWE-Bench Pro, Terminal-Bench, NL2Repo에서 오픈 소스 1위이자 세계 3위를 기록한다.

핵심 차이점: 긴 시간 범위. GLM-5를 포함한 이전 모델들은 처음에는 성능이 빠르게 향상되지만, 이후 정체된다. GLM-5.1은 훨씬 더 긴 시간 범위의 에이전틱 작업에서도 효과를 유지하도록 설계되었다. 즉, 수천 번의 도구 호출을 거치며 전략을 다듬어가면서 8시간 동안 자율적으로 작업할 수 있다.

이 능력을 보여주는 세 가지 시나리오는 다음과 같다:

  • 600회 반복의 벡터 데이터베이스 최적화: GLM-5.1은 VectorDBBench에서 초당 21,500개의 요청을 달성하며, 이는 50회 턴의 단일 세션에서 얻은 최고 결과의 6배다.
  • 1,000회 이상의 턴에 걸친 GPU 커널 최적화: KernelBench Level 3에서 3.6배 가속.
  • 8시간 만에 Linux 데스크톱 구축: 단순한 자연어 프롬프트만으로 GLM-5.1은 브라우저 안에 완전한 데스크톱 환경(파일 탐색기, 터미널, 편집기, 시스템 모니터)을 만들어낸다.

이용 가능 여부: HuggingFace의 오픈 소스 가중치(zai-org/GLM-5.1), api.z.ai 및 BigModel.cn의 API, Claude Code, Cline, Roo Code, Kilo Code, OpenCode와 호환됨.

🔗 GLM-5.1 블로그 🔗 공지 트윗


Codex CLI v0.120.0 — 에이전트의 실시간 스트리밍

4월 11일 — Codex CLI 버전 0.120.0이 안정 버전으로 출시되었다. 여러 기능 개선을 제공한다:

기능세부 내용
Realtime V2백그라운드 에이전트의 진행 상황을 실시간으로 스트리밍하고, 다음 응답을 대기열에 넣음
개선된 TUI 훅활성 훅을 별도로 표시하고, 완료된 훅의 기록을 간소화
상태의 스레드 제목사용자 정의 TUI 상태에 이름이 바뀐 스레드 제목을 포함할 수 있음
code-mode 출력 스키마code-mode 도구 선언에 이제 outputSchema MCP 세부 정보가 포함됨
SessionStart 훅/clear로 생성된 세션과 시작 또는 재개를 구분

이 버전에는 또한 여러 버그 수정이 포함된다: 고도화된 Windows 샌드박스 처리, TLS WebSocket 연결 중 패닉 방지, 도구 검색 결과 순서 보존.

🔗 Release v0.120.0


GitHub Copilot — 세 가지 새 기능

서드파티 에이전트를 위한 모델 선택

4월 14일 — 이제 github.com에서 Claude(Anthropic) 및 Codex(OpenAI) 에이전트로 작업을 시작할 때 모델을 선택할 수 있다.

에이전트사용 가능한 모델
ClaudeClaude Sonnet 4.6, Claude Opus 4.6, Claude Sonnet 4.5, Claude Opus 4.5
CodexGPT-5.2-Codex, GPT-5.3-Codex, GPT-5.4

기존 Copilot 구독(Business 또는 Enterprise)에 포함되지만, 관리자는 기업 또는 조직 수준에서 해당 정책을 활성화해야 한다.

🔗 모델 선택 변경 로그

3번 클릭으로 merge 충돌 해결

4월 13일 — merge 충돌이 있는 pull request에 새 “Fix with Copilot” 버튼이 나타난다. 3번 클릭만으로 Copilot cloud agent가 충돌을 해결하고, 빌드와 테스트가 통과하는지 확인한 뒤, 격리된 클라우드 환경에서 push한다. PR의 @copilot 언급은 실패한 GitHub Actions 워크플로를 수정하거나 코드 리뷰 댓글을 처리하는 데도 사용할 수 있다. 모든 유료 Copilot 요금제에서 사용 가능하다.

🔗 merge conflicts 변경 로그

US/EU 데이터 거주 및 FedRAMP 준수

4월 13일 — GitHub Copilot은 이제 US 및 EU 지역에 대한 데이터 거주를 지원한다. 모든 추론 및 관련 데이터는 지정된 지리적 영역에 남아 있다. 미국 정부 고객은 추가로 FedRAMP Moderate 준수를 이용할 수 있다. data-resident 요청에는 premium requests 곱셈기에 10% 할증이 붙는다. Gemini 모델은 아직 지원되지 않는다(GCP는 아직 데이터 거주 추론 엔드포인트를 제공하지 않는다). 일본과 호주는 2026년 로드맵에 포함되어 있다.

🔗 데이터 거주 변경 로그


생성형 미디어 — Runway, Luma, MiniMax, ElevenLabs

화상 통화의 Runway Characters

4월 14일 — Runway가 Characters 업데이트를 배포해 자신의 AI 아바타를 Zoom, Google Meet 또는 Teams 화상 통화에 보낼 수 있게 했다. 절차는 다음과 같다: Character를 선택하거나 생성 → 회의 링크 붙여넣기 → “Join Meeting” 클릭. 이 기능은 원래 3월 9일부터 개발자용 API로 제공되었으며, 이제 Runway 앱의 모든 사용자에게 이용 가능하다.

🔗 Runway 트윗

Luma — 음성 받아쓰기 및 로고 애니메이션

4월 14일 — Luma Labs가 두 가지 새로운 기능을 출시했습니다: 앱 내 음성 받아쓰기(사용자가 말하면 설명이 생성 프롬프트로 변환됨)와 시네마틱 로고 애니메이션(로고를 업로드하면 에이전트가 브랜딩 중심의 애니메이션 인트로를 생성함)입니다.

🔗 음성 받아쓰기 트윗 · 로고 애니메이션 트윗

MiniMax — 에이전트를 위한 3개의 오픈 소스 Music Skills

4월 14일 — MiniMax가 에이전트를 위한 세 가지 Music Skills를 오픈 소스로 공개했습니다: minimax-music-gen(프롬프트에서 전체 곡을 생성하며, 오리지널·인스트루멘탈·커버 중 자동 선택 포함), buddy-sings(AI 에이전트가 보컬 동반자처럼 노래함), 그리고 Playlist curation(사용자의 라이브러리에서 플레이리스트를 큐레이션함)입니다. 이 구성 요소들은 M2.7 에이전트에 통합하기 위한 것입니다.

🔗 MiniMax 트윗

ElevenLabs — 2026년 1분기 1억 달러의 순 반복 매출

4월 13일 — CEO Mati Staniszewski는 ElevenLabs가 2026년 1분기에 1억 달러 이상의 순 연간 반복 매출을 추가했다고 발표했습니다 — 지금까지의 최고 분기입니다. 성장은 기업 파트너십(Klarna, Revolut, Deutsche Telekom, Toyota)에 의해 주도되었습니다.

🔗 ElevenLabs CEO 트윗


의미하는 바

Claude Code의 루틴은 패러다임의 전환을 의미합니다: 개발 도구가 더 이상 단순히 상호작용 요청에만 응답하는 것이 아니라, 이제 프로젝트 인프라 안에서 계획적이거나 반응적인 이니셔티브를 취할 수 있습니다. scheduled + webhook의 조합은 Claude Code를 저장소에서 상시 동작하는 에이전트로 바꾸며, 설정 비용은 최소화합니다.

오픈 소스 측면에서 GLM-5.1은 중국의 에이전틱 모델들이 코딩 벤치마크에서 최고 수준의 독점 모델에 도달했음을 확인해 줍니다. 수천 번의 도구 호출을 포함해 8시간의 자율 작업 시간을 유지할 수 있는 능력은 전통적인 모델이 한 번의 세션에서 처리할 수 없는 집중적인 최적화 작업에 대한 실질적인 가능성을 엽니다.

Gemini Robotics-ER 1.6은 다른 추세를 보여줍니다: 소프트웨어와 하드웨어(Boston Dynamics/Spot) 간의 협업으로 산업용 계측기 판독과 같은 새로운 능력을 만들어 내는, 현실 세계의 물리적 제약에 맞게 조정된 범용 AI 모델입니다.


출처

이 문서는 gpt-5.4-mini 모델을 사용하여 fr 버전에서 ko 언어로 번역되었습니다. 번역 과정에 대한 자세한 내용은 https://github.com/jls42/ai-powered-markdown-translator를 참조하십시오.