Routines Claude Code, Gemini Robotics-ER 1.6, GLM-5.1 오픈 소스

2026년 4월 14일은 AI 지원 개발 도구에 있어 매우 밀도 높은 하루였다. Anthropic은 Claude Code에 루틴을 도입해, 계획이나 웹훅을 통해 전체 워크플로를 자동화하고 컴퓨터를 켜둔 채로 둘 필요 없이 실행할 수 있게 했다. Google DeepMind는 Boston Dynamics와 함께 개발한 새로운 산업 인식 기능을 갖춘 Gemini Robotics-ER 1.6을 공개했다. Z.ai는 SWE-Bench Pro에서 오픈 소스 모델 1위로 분류된 GLM-5.1을 MIT 라이선스로 공개했다. GitHub Copilot은 유용한 세 가지 기능을 추가했다: 3번 클릭으로 충돌 해결, US/EU 데이터 리전, 그리고 서드파티 에이전트를 위한 모델 선택.

Claude Code의 루틴 — 예비 연구 (research preview)

4월 14일 — Anthropic이 Claude Code의 루틴을 research preview로 출시했다. 루틴은 프롬프트, 저장소, 커넥터로 한 번만 구성하면 되는 자동화로, 이후 사용자가 연결을 유지하지 않아도 자율적으로 실행된다.

세 가지 트리거 유형을 사용할 수 있다:

유형	트리거	사용 예시
예약됨 (Scheduled)	Cron(시간별, 야간, 주간)	Linear 버그 야간 분류, 수정 PR 생성
API	전용 엔드포인트로의 HTTP POST 호출	Datadog 알림 → 자동 분류 + 수정 초안
웹훅	GitHub 이벤트(PR, push…)	열려 있는 각 PR에 대한 자동 코드 리뷰

각 루틴에는 자체 엔드포인트와 인증 토큰이 있다. API 루틴은 기존의 어떤 파이프라인(알림, 배포 훅, 내부 도구)에도 통합할 수 있다. 웹훅 루틴은 정의된 필터와 일치하는 각 PR마다 새 세션을 시작하고, 이후 업데이트(댓글, CI 실패)를 해당 세션에 반영한다.

“Configure a routine once (a prompt, a repo, and your connectors), and it can run on a schedule, from an API call, or in response to an event. Routines run on our web infrastructure, so you don’t have to keep your laptop open.”

🇰🇷 루틴은 한 번만 구성하면 됩니다(프롬프트, 저장소, 커넥터). 그러면 일정에 따라, API 호출로, 또는 이벤트에 응답하여 실행할 수 있습니다. 루틴은 우리 웹 인프라에서 실행되므로 컴퓨터를 켜둘 필요가 없습니다. — @claudeai X에서

이용 가능 여부 및 제한:

요금제	루틴/일
Pro	5
Max	15
Team / Enterprise	25

Claude Code web이 활성화된 모든 유료 요금제(Pro, Max, Team, Enterprise)에서 이용 가능하다. 할당량을 초과한 경우에도 추가 사용은 가능하다. 루틴은 대화형 세션과 마찬가지로 구독 크레딧을 소모한다.

문서화된 사용 사례:

백로그 관리: 야간 분류, 태깅, Slack 요약
문서 드리프트(docs drift): 병합된 PR의 주간 스캔, 업데이트가 필요한 페이지 탐지
배포 후 검증: 각 릴리스 후 스모크 테스트(smoke checks)
SDK 포팅: 병합되는 각 Python PR이 Go SDK로의 포팅을 자동 트리거

🔗 Anthropic 블로그 🔗 공지 트윗

Claude Code v2.1.105 — PreCompact 훅, 플러그인 모니터, /proactive

4월 11일~13일 — Claude Code 2.1.105 버전은 여러 주목할 만한 개선 사항을 제공한다:

기능	설명
파라미터 `path` for `EnterWorktree`	현재 저장소의 기존 worktree로 전환할 수 있음
PreCompact 훅	이제 훅이 컴팩션을 차단할 수 있음(종료 코드 2 또는 `{"decision":"block"}`)
플러그인용 Background monitors	플러그인 매니페스트의 `monitors` 키 — 세션 시작 시 자동으로 활성화
`/proactive`	`/loop`의 새 별칭
차단된 Streams API 폐기	데이터 없이 5분 후 폐기 + 비스트리밍 모드로 재시도
네트워크 오류 메시지	조용한 스피너 대신 즉시 재시도 메시지 표시
긴 파일 표시	매우 긴 단일 행 쓰기(예: minified JSON)는 인터페이스에서 잘림
개선된 `/doctor`	상태 아이콘 + 발견된 문제를 Claude에게 수정하도록 요청하는 `f` 키

4월 14일 — 2.1.107 버전은 인터페이스 개선을 제공한다. 긴 작업 중에는 진행 힌트(thinking hints)가 더 일찍 표시되어, 시각적 피드백 없이 기다리는 느낌을 줄여준다.

🔗 Claude Code 변경 로그

Anthropic — Vas Narasimhan이 이사회에 합류

4월 14일 — Anthropic의 Long-Term Benefit Trust(LTBT)가 Vas Narasimhan을 이사회에 임명했다. 의사이자 과학자이며 Novartis의 CEO인 그는 세계에서 가장 규제가 엄격한 산업 중 하나에서 35개 이상의 혁신 의약품의 개발과 승인을 감독했다.

이번 임명으로 Trust가 지명한 이사들이 이제 이사회의 과반수를 구성하게 되었다. LTBT는 구성원들이 Anthropic에 어떠한 재정적 이해관계도 갖지 않는 독립 기구이며, 그 역할은 상업적 성공과 장기적인 공익 사명의 균형을 유지하는 것이다.

🔗 Anthropic 공지

Gemini Robotics-ER 1.6 — 산업 인식과 안전

4월 14일 — Google DeepMind가 로보틱스를 위한 embodied reasoning 모델의 업데이트 버전인 Gemini Robotics-ER 1.6을 공개했다. 이 모델은 로봇이 더 큰 자율성으로 실제 작업을 계획하고 수행할 수 있도록 시각 및 공간 이해를 향상시킨다. 내부 로봇 벤치마크에서 Gemini Robotics-ER 1.5와 Gemini 3.0 Flash를 능가한다.

새로운 기능:

기능	설명
공간 포인팅 (Pointing)	객체 탐지 및 개수 세기, 관계 논리(더 작음/더 큼), 궤적과 파지점, 복잡한 제약 조건
다중 시점 성공 검출	여러 카메라 각도를 분석하여 작업이 실제로 완료되었는지 확인
계측기 판독	원형 게이지와 투명 튜브(sight glasses)를 판독 — 산업 검사용으로 Boston Dynamics와 함께 개발
안전(ASIMOV v2 벤치마크)	안전 지침 준수에서 테스트된 모든 모델 중 최고 점수

계측기 판독 기능은 산업 설비 검사용 로봇 Spot을 위해 Boston Dynamics와 협력하면서 탄생했다. 이는 공간 추론과 코드 실행을 결합해 압력 게이지를 높은 정확도로 해석한다.

이용 가능 여부: Gemini API(gemini-robotics-er-1.6-preview), Google AI Studio, 그리고 GitHub Colab의 시작 노트북.

🔗 Google DeepMind 블로그 🔗 공지 트윗

GLM-5.1 — Z.ai가 MIT 라이선스로 자사 에이전틱 모델을 공개

4월 7일 (뒤늦게 포착된 발표 — 지난주 스캔에서 놓쳤던 내용) — Z.ai(구 ZhipuAI)가 에이전틱 코딩(agentic coding)을 위한 새로운 주력 모델 GLM-5.1을 MIT 라이선스로 오픈 소스 공개했다.

코드 벤치마크 성능:

벤치마크	GLM-5.1	GLM-5	Claude Opus 4.6	GPT-5.4	Gemini 3.1 Pro
SWE-Bench Pro	58,4	55,1	57,3	57,7	54,2
NL2Repo	42,7	35,9	49,8	41,3	33,4
Terminal-Bench 2.0	63,5	56,2	65,4	—	68,5

GLM-5.1은 SWE-Bench Pro, Terminal-Bench, NL2Repo에서 오픈 소스 1위이자 세계 3위를 기록한다.

핵심 차이점: 긴 시간 범위. GLM-5를 포함한 이전 모델들은 처음에는 성능이 빠르게 향상되지만, 이후 정체된다. GLM-5.1은 훨씬 더 긴 시간 범위의 에이전틱 작업에서도 효과를 유지하도록 설계되었다. 즉, 수천 번의 도구 호출을 거치며 전략을 다듬어가면서 8시간 동안 자율적으로 작업할 수 있다.

이 능력을 보여주는 세 가지 시나리오는 다음과 같다:

600회 반복의 벡터 데이터베이스 최적화: GLM-5.1은 VectorDBBench에서 초당 21,500개의 요청을 달성하며, 이는 50회 턴의 단일 세션에서 얻은 최고 결과의 6배다.
1,000회 이상의 턴에 걸친 GPU 커널 최적화: KernelBench Level 3에서 3.6배 가속.
8시간 만에 Linux 데스크톱 구축: 단순한 자연어 프롬프트만으로 GLM-5.1은 브라우저 안에 완전한 데스크톱 환경(파일 탐색기, 터미널, 편집기, 시스템 모니터)을 만들어낸다.

이용 가능 여부: HuggingFace의 오픈 소스 가중치(zai-org/GLM-5.1), api.z.ai 및 BigModel.cn의 API, Claude Code, Cline, Roo Code, Kilo Code, OpenCode와 호환됨.

🔗 GLM-5.1 블로그 🔗 공지 트윗

Codex CLI v0.120.0 — 에이전트의 실시간 스트리밍

4월 11일 — Codex CLI 버전 0.120.0이 안정 버전으로 출시되었다. 여러 기능 개선을 제공한다:

기능	세부 내용
Realtime V2	백그라운드 에이전트의 진행 상황을 실시간으로 스트리밍하고, 다음 응답을 대기열에 넣음
개선된 TUI 훅	활성 훅을 별도로 표시하고, 완료된 훅의 기록을 간소화
상태의 스레드 제목	사용자 정의 TUI 상태에 이름이 바뀐 스레드 제목을 포함할 수 있음
code-mode 출력 스키마	code-mode 도구 선언에 이제 `outputSchema` MCP 세부 정보가 포함됨
SessionStart 훅	`/clear`로 생성된 세션과 시작 또는 재개를 구분

이 버전에는 또한 여러 버그 수정이 포함된다: 고도화된 Windows 샌드박스 처리, TLS WebSocket 연결 중 패닉 방지, 도구 검색 결과 순서 보존.

🔗 Release v0.120.0

GitHub Copilot — 세 가지 새 기능

서드파티 에이전트를 위한 모델 선택

4월 14일 — 이제 github.com에서 Claude(Anthropic) 및 Codex(OpenAI) 에이전트로 작업을 시작할 때 모델을 선택할 수 있다.

에이전트	사용 가능한 모델
Claude	Claude Sonnet 4.6, Claude Opus 4.6, Claude Sonnet 4.5, Claude Opus 4.5
Codex	GPT-5.2-Codex, GPT-5.3-Codex, GPT-5.4

기존 Copilot 구독(Business 또는 Enterprise)에 포함되지만, 관리자는 기업 또는 조직 수준에서 해당 정책을 활성화해야 한다.

🔗 모델 선택 변경 로그

3번 클릭으로 merge 충돌 해결

4월 13일 — merge 충돌이 있는 pull request에 새 “Fix with Copilot” 버튼이 나타난다. 3번 클릭만으로 Copilot cloud agent가 충돌을 해결하고, 빌드와 테스트가 통과하는지 확인한 뒤, 격리된 클라우드 환경에서 push한다. PR의 @copilot 언급은 실패한 GitHub Actions 워크플로를 수정하거나 코드 리뷰 댓글을 처리하는 데도 사용할 수 있다. 모든 유료 Copilot 요금제에서 사용 가능하다.

🔗 merge conflicts 변경 로그

US/EU 데이터 거주 및 FedRAMP 준수

4월 13일 — GitHub Copilot은 이제 US 및 EU 지역에 대한 데이터 거주를 지원한다. 모든 추론 및 관련 데이터는 지정된 지리적 영역에 남아 있다. 미국 정부 고객은 추가로 FedRAMP Moderate 준수를 이용할 수 있다. data-resident 요청에는 premium requests 곱셈기에 10% 할증이 붙는다. Gemini 모델은 아직 지원되지 않는다(GCP는 아직 데이터 거주 추론 엔드포인트를 제공하지 않는다). 일본과 호주는 2026년 로드맵에 포함되어 있다.

🔗 데이터 거주 변경 로그

생성형 미디어 — Runway, Luma, MiniMax, ElevenLabs

화상 통화의 Runway Characters

4월 14일 — Runway가 Characters 업데이트를 배포해 자신의 AI 아바타를 Zoom, Google Meet 또는 Teams 화상 통화에 보낼 수 있게 했다. 절차는 다음과 같다: Character를 선택하거나 생성 → 회의 링크 붙여넣기 → “Join Meeting” 클릭. 이 기능은 원래 3월 9일부터 개발자용 API로 제공되었으며, 이제 Runway 앱의 모든 사용자에게 이용 가능하다.

🔗 Runway 트윗

Luma — 음성 받아쓰기 및 로고 애니메이션

4월 14일 — Luma Labs가 두 가지 새로운 기능을 출시했습니다: 앱 내 음성 받아쓰기(사용자가 말하면 설명이 생성 프롬프트로 변환됨)와 시네마틱 로고 애니메이션(로고를 업로드하면 에이전트가 브랜딩 중심의 애니메이션 인트로를 생성함)입니다.

🔗 음성 받아쓰기 트윗 · 로고 애니메이션 트윗

MiniMax — 에이전트를 위한 3개의 오픈 소스 Music Skills

4월 14일 — MiniMax가 에이전트를 위한 세 가지 Music Skills를 오픈 소스로 공개했습니다: minimax-music-gen(프롬프트에서 전체 곡을 생성하며, 오리지널·인스트루멘탈·커버 중 자동 선택 포함), buddy-sings(AI 에이전트가 보컬 동반자처럼 노래함), 그리고 Playlist curation(사용자의 라이브러리에서 플레이리스트를 큐레이션함)입니다. 이 구성 요소들은 M2.7 에이전트에 통합하기 위한 것입니다.

🔗 MiniMax 트윗

ElevenLabs — 2026년 1분기 1억 달러의 순 반복 매출

4월 13일 — CEO Mati Staniszewski는 ElevenLabs가 2026년 1분기에 1억 달러 이상의 순 연간 반복 매출을 추가했다고 발표했습니다 — 지금까지의 최고 분기입니다. 성장은 기업 파트너십(Klarna, Revolut, Deutsche Telekom, Toyota)에 의해 주도되었습니다.

🔗 ElevenLabs CEO 트윗

의미하는 바

Claude Code의 루틴은 패러다임의 전환을 의미합니다: 개발 도구가 더 이상 단순히 상호작용 요청에만 응답하는 것이 아니라, 이제 프로젝트 인프라 안에서 계획적이거나 반응적인 이니셔티브를 취할 수 있습니다. scheduled + webhook의 조합은 Claude Code를 저장소에서 상시 동작하는 에이전트로 바꾸며, 설정 비용은 최소화합니다.

오픈 소스 측면에서 GLM-5.1은 중국의 에이전틱 모델들이 코딩 벤치마크에서 최고 수준의 독점 모델에 도달했음을 확인해 줍니다. 수천 번의 도구 호출을 포함해 8시간의 자율 작업 시간을 유지할 수 있는 능력은 전통적인 모델이 한 번의 세션에서 처리할 수 없는 집중적인 최적화 작업에 대한 실질적인 가능성을 엽니다.

Gemini Robotics-ER 1.6은 다른 추세를 보여줍니다: 소프트웨어와 하드웨어(Boston Dynamics/Spot) 간의 협업으로 산업용 계측기 판독과 같은 새로운 능력을 만들어 내는, 현실 세계의 물리적 제약에 맞게 조정된 범용 AI 모델입니다.

출처

이 문서는 gpt-5.4-mini 모델을 사용하여 fr 버전에서 ko 언어로 번역되었습니다. 번역 과정에 대한 자세한 내용은 https://github.com/jls42/ai-powered-markdown-translator를 참조하십시오.