खोजें

AI समाचार 23 जनवरी 2026: Excel में Claude, Tasks Claude Code, Codex Agent Loop

AI समाचार 23 जनवरी 2026: Excel में Claude, Tasks Claude Code, Codex Agent Loop

AI एजेंट्स के लिए व्यस्त सप्ताह

21 से 23 जनवरी 2026 तक, coding agents और बुनियादी ढांचे के संबंध में कई प्रमुख घोषणाएं हुईं। Anthropic ने Excel में Claude लॉन्च किया और मल्टी-एजेंट सिस्टम पर तीन लेख प्रकाशित किए, OpenAI ने Codex के आंतरिक आर्किटेक्चर और इसके PostgreSQL बुनियादी ढांचे का विवरण दिया, Qwen ने अपने टेक्स्ट-टू-स्पीच मॉडल को ओपन-सोर्स किया, और Runway ने Gen-4.5 में Image to Video जोड़ा।


Anthropic: Excel में Claude और Claude Code

Excel में Claude

23 जनवरी — Claude अब Microsoft Excel में बीटा में उपलब्ध है। यह एकीकरण पूर्ण Excel कार्यपुस्तिकाओं (workbooks) का उनके नेस्टेड फ़ार्मुलों और टैब के बीच निर्भरता के साथ विश्लेषण करने की अनुमति देता है।

सुविधाएँ:

  • पूरी कार्यपुस्तिका की समझ (फ़ार्मुले, मल्टी-टैब निर्भरताएँ)
  • सेल-स्तर के उद्धरणों के साथ स्पष्टीकरण
  • फ़ार्मुलों को सुरक्षित रखते हुए मान्यताओं को अपडेट करना

Claude Pro, Max, Team और Enterprise ग्राहकों के लिए उपलब्ध।

🔗 Claude Excel में


Claude Code v2.1.19: Tasks सिस्टम

23 जनवरी — संस्करण 2.1.19 ने Tasks पेश किया, जो जटिल मल्टी-सेशन प्रोजेक्ट्स के लिए एक नई कार्य प्रबंधन प्रणाली है।

We’re turning Todos into Tasks in Claude Code. Tasks are a new primitive that help Claude Code track and complete more complicated projects and collaborate on them across multiple sessions or subagents.

🇮🇳 हम Claude Code में Todos को Tasks में बदल रहे हैं। Tasks एक नया प्रिमिटिव है जो Claude Code को अधिक जटिल प्रोजेक्ट्स को ट्रैक और पूरा करने और कई सत्रों या उप-एजेंटों में उन पर सहयोग करने में मदद करता है।Thariq (@trq212), Claude Code टीम Anthropic

Tasks सुविधाएँ:

पहलूविवरण
स्टोरेज~/.claude/tasks (फ़ाइलें, इसके ऊपर टूल बनाने की अनुमति देती हैं)
सहयोगसत्रों के बीच साझा करने के लिए CLAUDE_CODE_TASK_LIST_ID=name claude
निर्भरताएँमेटाडेटा में संग्रहीत निर्भरता और ब्लॉकर्स के साथ Tasks
प्रसारणएक Task का अपडेट उसी Task List पर सभी सत्रों में प्रसारित किया जाता है
संगतताclaude -p और AgentSDK के साथ काम करता है

यह किस लिए है: एक जटिल प्रोजेक्ट (मल्टी-फ़ाइल रीफैक्टरिंग, माइग्रेशन, लंबी सुविधा) पर, Claude काम को कार्यों (tasks) में विभाजित कर सकता है, ट्रैक कर सकता है कि क्या हो गया है और क्या बचा है। कार्य डिस्क पर बने रहते हैं — वे संदर्भ संघनन (context compaction), सत्र बंद होने और पुनरारंभ होने पर भी बने रहते हैं। कई सत्र या उप-एजेंट वास्तविक समय में एक ही कार्य सूची पर सहयोग कर सकते हैं।

व्यवहार में: Claude कार्य बनाता है (TaskCreate), उन्हें सूचीबद्ध करता है (TaskList), और उनकी स्थिति अपडेट करता है (TaskUpdate: pending → in_progress → completed)। प्रमाणीकरण रीफैक्टरिंग पर उदाहरण:

#1 [completed] सत्र स्टोरेज को Redis में माइग्रेट करें
#2 [in_progress] रीफ़्रेश टोकन रोटेशन लागू करें
#3 [pending] OAuth एकीकरण परीक्षण जोड़ें
#4 [pending] API प्रलेखन अपडेट करें

कार्य ~/.claude/tasks/ में संग्रहीत होते हैं और CLAUDE_CODE_TASK_LIST_ID के माध्यम से सत्रों के बीच साझा किए जा सकते हैं।

अन्य नई सुविधाएँ v2.1.19:

  • कस्टम कमांड में तर्कों के लिए शॉर्टहैंड $0, $1
  • सभी के लिए VSCode सत्र फोर्किंग और रिवाइंड
  • बिना अनुमति के Skills अनुमोदन के बिना चलते हैं
  • अस्थायी रूप से अक्षम करने के लिए CLAUDE_CODE_ENABLE_TASKS=false

🔗 CHANGELOG Claude Code | थ्रेड @trq212


Claude Code v2.1.18: अनुकूलन योग्य कीबाइंडिंग

पिछला संस्करण जो संदर्भ के अनुसार कीबाइंडिंग कॉन्फ़िगर करने और कॉर्ड अनुक्रम बनाने की क्षमता जोड़ता है।

कमांड: /keybindings

⚠️ नोट: यह सुविधा वर्तमान में पूर्वावलोकन में है और सभी उपयोगकर्ताओं के लिए उपलब्ध नहीं है।

🔗 Keybindings दस्तावेज़


Petri 2.0: स्वचालित संरेखण ऑडिट

22 जनवरी — Anthropic ने Petri 2.0 प्रकाशित किया, जो भाषा मॉडल के लिए उनके स्वचालित व्यवहार ऑडिट टूल का अपडेट है।

यह किस लिए है: Petri परीक्षण करता है कि क्या LLM समस्याग्रस्त व्यवहार कर सकता है — हेरफेर, धोखा, नियम परिहार। टूल यथार्थवादी परिदृश्य बनाता है और उत्पादन में होने से पहले अवांछित व्यवहारों का पता लगाने के लिए मॉडल की प्रतिक्रियाओं का निरीक्षण करता है।

सुधारविवरण
70 नए परिदृश्यअधिक किनारे के मामलों को कवर करने के लिए विस्तारित बीज लाइब्रेरी
मूल्यांकन-जागरूकता शमनमॉडल को यह नहीं पता होना चाहिए कि उसका परीक्षण किया जा रहा है — अन्यथा वह अपने व्यवहार को अनुकूलित कर लेता है। Petri 2.0 इस पता लगाने से बचने के लिए परिदृश्यों की वास्तविकता में सुधार करता है।
फ्रंटियर तुलनाहाल के मॉडल (Claude, GPT, Gemini) के लिए मूल्यांकन परिणाम

🔗 Petri 2.0 | GitHub


ब्लॉग: मल्टी-एजेंट सिस्टम का उपयोग कब करें (या कब नहीं)

23 जनवरी — Anthropic ने मल्टी-एजेंट आर्किटेक्चर पर एक व्यावहारिक गाइड प्रकाशित की। मुख्य संदेश: डिफ़ॉल्ट रूप से मल्टी-एजेंट का उपयोग न करें

We’ve seen teams invest months building elaborate multi-agent architectures only to discover that improved prompting on a single agent achieved equivalent results.

🇮🇳 हमने टीमों को विस्तृत मल्टी-एजेंट आर्किटेक्चर बनाने में महीनों का निवेश करते देखा है, केवल यह पता लगाने के लिए कि एकल एजेंट पर बेहतर प्रॉम्पटिंग ने समान परिणाम प्राप्त किए।

लेख 3 मामलों की पहचान करता है जहां मल्टी-एजेंट वास्तव में मूल्य लाता है:

मामलासमस्यामल्टी-एजेंट समाधान
संदर्भ प्रदूषणएक एजेंट भारी डेटा उत्पन्न करता है जिसका केवल सारांश बाद में उपयोगी होता हैएक उप-एजेंट 2000 टोकन इतिहास प्राप्त करता है, मुख्य एजेंट को केवल “ऑर्डर वितरित” लौटाता है
समानांतर्करणकई स्वतंत्र खोजें करनी हैंउन्हें क्रमिक रूप से संसाधित करने के बजाय 5 अलग-अलग स्रोतों पर समानांतर में 5 एजेंट लॉन्च करें
विशेषज्ञताएक ही एजेंट में बहुत अधिक उपकरण (20+) सही उपकरण चुनने की उसकी क्षमता को कम कर देते हैंविशेष एजेंटों में अलग करें: एक CRM के लिए, एक मार्केटिंग के लिए, एक मैसेजिंग के लिए

बचने का जाल: काम के प्रकार से विभाजन (एक एजेंट योजना बनाता है, दूसरा लागू करता है, दूसरा परीक्षण करता है)। प्रत्येक हैंडओवर संदर्भ खो देता है और गुणवत्ता कम कर देता है। बेहतर है कि एक ही एजेंट शुरू से अंत तक एक सुविधा को संभाले।

वास्तविक लागत: समान कार्य के लिए एकल एजेंट की तुलना में 3-10 गुना अधिक टोकन।

श्रृंखला के अन्य लेख:

Building agents with Skills (22 जनवरी)

डोमेन द्वारा विशेष एजेंट बनाने के बजाय, Anthropic skills बनाने का प्रस्ताव करता है: फ़ाइलों का संग्रह (वर्कफ़्लो, स्क्रिप्ट, सर्वोत्तम अभ्यास) जिसे एक सामान्यवादी एजेंट मांग पर लोड करता है।

3 स्तरों में प्रगतिशील प्रकटीकरण:

स्तरसामग्रीआकार
1मेटाडेटा (नाम, विवरण)~50 टोकन
2पूर्ण SKILL.md फ़ाइल~500 टोकन
3संदर्भ दस्तावेज़2000+ टोकन

प्रत्येक स्तर केवल आवश्यक होने पर लोड किया जाता है। परिणाम: एक एजेंट अपने संदर्भ को संतृप्त किए बिना सैकड़ों skills रख सकता है।

🔗 Building agents with Skills


Anthropic 2026 में सॉफ्टवेयर विकास के लिए 8 रुझानों की पहचान करता है।

मुख्य संदेश: इंजीनियर कोड लिखने से कोड लिखने वाले एजेंटों को समन्वित करने की ओर बढ़ रहे हैं।

महत्वपूर्ण बारीकियां: AI का उपयोग ~60% काम में किया जाता है, लेकिन केवल 0-20% पूरी तरह से सौंपा जा सकता है — मानव पर्यवेक्षण आवश्यक बना हुआ है।

कंपनीपरिणाम
RakutenvLLM कोडबेस (12.5M लाइनें) पर Claude Code, 7 घंटे का स्वायत्त काम
TELUS30% तेज़, 500k घंटे बचाए गए
Zapier89% AI अपनाना, 800+ आंतरिक एजेंट

🔗 Eight trends 2026


OpenAI: Codex आर्किटेक्चर और बुनियादी ढांचा

Unrolling the Codex agent loop

23 जनवरी — OpenAI ने Codex CLI के पर्दे के पीछे का दृश्य खोला। उनके सॉफ्टवेयर एजेंट के आंतरिक कामकाज पर एक श्रृंखला का पहला लेख।

हम क्या सीखते हैं:

एजेंट लूप सिद्धांत रूप में सरल है: उपयोगकर्ता अनुरोध भेजता है → मॉडल प्रतिक्रिया उत्पन्न करता है या टूल का अनुरोध करता है → एजेंट टूल निष्पादित करता है → मॉडल परिणाम के साथ फिर से शुरू होता है → अंतिम प्रतिक्रिया तक। व्यवहार में, सूक्ष्मताएं संदर्भ प्रबंधन में हैं।

प्रॉम्प्ट कैशिंग — प्रदर्शन की कुंजी:

बातचीत का प्रत्येक मोड़ प्रॉम्प्ट में सामग्री जोड़ता है। अनुकूलन के बिना, यह भेजे गए टोकन में द्विघातीय (quadratic) है। प्रॉम्प्ट कैशिंग पिछले मोड़ों से गणनाओं का पुन: उपयोग करने की अनुमति देता है। शर्त: नया प्रॉम्प्ट पुराने का सटीक उपसर्ग होना चाहिए। OpenAI उन नुकसानों का विवरण देता है जो कैश को तोड़ते हैं (MCP टूल का क्रम बदलना, बातचीत के बीच में कॉन्फ़िगरेशन को संशोधित करना)।

स्वचालित संघनन:

जब संदर्भ एक सीमा से अधिक हो जाता है, तो Codex /responses/compact को कॉल करता है जो बातचीत का संकुचित संस्करण लौटाता है। मॉडल एक अपारदर्शी encrypted_content के माध्यम से अव्यक्त समझ रखता है।

Zero Data Retention (ZDR):

उन ग्राहकों के लिए जो नहीं चाहते कि उनका डेटा संग्रहीत किया जाए, encrypted_content सर्वर-साइड डेटा संग्रहीत किए बिना मोड़ों के बीच मॉडल के तर्क को संरक्षित करने की अनुमति देता है।

श्रृंखला का पहला लेख — अगले लेख CLI आर्किटेक्चर, टूल कार्यान्वयन और सैंडबॉक्सिंग को कवर करेंगे।

🔗 Unrolling the Codex agent loop | Codex GitHub


Scaling PostgreSQL: 800 मिलियन ChatGPT उपयोगकर्ता

22 जनवरी — OpenAI विवरण देता है कि कैसे PostgreSQL प्रति सेकंड लाखों अनुरोधों के साथ 800 मिलियन उपयोगकर्ताओं के लिए ChatGPT और API को शक्ति प्रदान करता है।

मीट्रिकमान
उपयोगकर्ता800 मिलियन
थ्रूपुटलाखों QPS
प्रतिकृतियां~50 मल्टी-रीजन रीड रेप्लिका
p99 विलंबताक्लाइंट-साइड दो अंकों में ms
उपलब्धताFive-nines (99.999%)

आर्किटेक्चर:

  • सिंगल प्राइमरी Azure PostgreSQL फ्लेक्सिबल सर्वर
  • कनेक्शन पूलिंग के लिए PgBouncer (कनेक्शन विलंबता: 50ms → 5ms)
  • राइट-हैवी वर्कलोड को Azure Cosmos DB में माइग्रेट किया गया
  • कैश मिस तूफानों से बचाने के लिए कैश लॉकिंग
  • 100 प्रतिकृतियों को पार करने के लिए परीक्षण में कैस्केडिंग प्रतिकृति

पिछले 12 महीनों में एकमात्र SEV-0 PostgreSQL: ChatGPT ImageGen के वायरल लॉन्च के दौरान (एक सप्ताह में 100M नए उपयोगकर्ता, राइट ट्रैफ़िक x10)।

🔗 Scaling PostgreSQL


Qwen: Qwen3-TTS ओपन-सोर्स

22-23 जनवरी — Alibaba ने Apache 2.0 लाइसेंस के तहत Qwen3-TTS को ओपन-सोर्स के रूप में जारी किया।

फ़ीचरविवरण
लाइसेंसApache 2.0
वॉयस क्लोनिंगहाँ
MLX-Audio समर्थनउपलब्ध

इंस्टॉलेशन:

uv pip install -U mlx-audio --prerelease=allow

🔗 Qwen3-TTS X पर


Runway: Gen-4.5 Image to Video

21 जनवरी — Runway ने Gen-4.5 में Image to Video कार्यक्षमता जोड़ी।

कार्यक्षमताविवरण
Image to Videoएक छवि को सिनेमाई वीडियो में बदलना
कैमरा नियंत्रणसटीक कैमरा नियंत्रण
सुसंगत कथाएँसमय के साथ सुसंगत कथाएँ
चरित्र स्थिरतापात्र जो सुसंगत रहते हैं

सभी Runway सशुल्क योजनाओं के लिए उपलब्ध। अस्थायी प्रोमो: 15% छूट।

🔗 Runway X पर


इसका क्या मतलब है

यह सप्ताह coding agents टूल की परिपक्वता का प्रतीक है। दो दिग्गज (Anthropic और OpenAI) अपने एजेंट आर्किटेक्चर पर विस्तृत तकनीकी दस्तावेज प्रकाशित करते हैं — एक संकेत है कि बाजार “डेमो” चरण से “उत्पादन” चरण की ओर बढ़ रहा है।

बुनियादी ढांचे की ओर, OpenAI का PostgreSQL लेख दिखाता है कि एक सिंगल-प्राइमरी आर्किटेक्चर सही अनुकूलन के साथ करोड़ों उपयोगकर्ताओं के पैमाने पर टिक सकता है।

Excel में Claude का आगमन एक नया मोर्चा खोलता है: AI सीधे दैनिक उत्पादकता टूल में एकीकृत।


स्रोत