MiniMax M2.5 ने ओपन-सोर्स में SWE-Bench पर 80% हासिल किया, Kling 3.0 ने AI वीडियो को बदला, Perplexity ने Model Council लॉन्च किया

MiniMax ने M2.5 प्रकाशित किया, जो एक फ्रंटियर ओपन-सोर्स मॉडल है और SWE-Bench Verified पर 80.2% तक पहुँच गया है। Kling ने 1080p वीडियो और यथार्थवादी संवाद के साथ अपना 3.0 मॉडल लॉन्च किया। शोध के मोर्चे पर, Perplexity ने तीन मॉडलों को एक साथ चलाने के लिए Model Council तैनात किया, और Claude Opus 4.6 पर Deep Research चलाया। Mistral ने $200K के पुरस्कारों के साथ अपने सबसे बड़े वैश्विक हैकथॉन की घोषणा की।

MiniMax M2.5 — फ्रंटियर ओपन-सोर्स मॉडल

12 फरवरी — MiniMax ने M2.5 की घोषणा की, जो वास्तविक उत्पादकता के लिए डिज़ाइन किया गया एक फ्रंटियर ओपन-सोर्स मॉडल है। मॉडल चार महत्वपूर्ण क्षेत्रों में अत्याधुनिक (state-of-the-art) प्रदर्शन दिखाता है: कोडिंग, वेब खोज, एजेंटिक टूल कॉलिंग (agentic tool calling), और कार्यालय कार्य।

Benchmark	Score	Catégorie
SWE-Bench Verified	80.2%	वास्तविक बग समाधान
BrowseComp	76.3%	वेब खोज और नेविगेशन
BFCL	76.8%	एजेंटिक टूल कॉलिंग
Office Work	अनुकूलित	दस्तावेज़ उत्पादकता

SWE-Bench Verified पर 80.2% का स्कोर M2.5 को सभी श्रेणियों में सर्वश्रेष्ठ कोडिंग मॉडलों में से एक बनाता है। BrowseComp पर, जो OpenAI का वेब नेविगेशन benchmark है, यह 76.3% तक पहुँच गया है — जो एक मजबूत स्वायत्त खोज क्षमता का संकेत है।

MiniMax प्रतिस्पर्धी मॉडलों की तुलना में जटिल कार्यों पर 37% तेज निष्पादन का दावा करता है, जिसकी लागत 100 tokens/सेकंड पर $1 USD प्रति घंटा है। घोषित लक्ष्य: लॉन्ग-होराइजन (long-horizon) एजेंटों के स्केलिंग को आर्थिक रूप से व्यवहार्य बनाना।

मॉडल MiniMax Agent (agent.minimax.io) और डेवलपर API (platform.minimax.io) के माध्यम से उपलब्ध है। एक फ्रंटियर ओपन-सोर्स मॉडल के रूप में, M2.5 सीधे प्रमुख प्रोप्राइटरी (proprietary) मॉडलों के खिलाफ खड़ा है।

🔗 Annonce MiniMax M2.5

MiniMax Forge — प्रोडक्शन एजेंटों के लिए RL फ्रेमवर्क

12 फरवरी — M2.5 के समानांतर, MiniMax ने Forge प्रकाशित किया, जो प्रोडक्शन AI एजेंटों को प्रशिक्षित करने के लिए एक स्केलेबल रीइन्फोर्समेंट लर्निंग (RL) फ्रेमवर्क और एल्गोरिदम है।

Forge एजेंट प्रशिक्षण में बार-बार आने वाली समस्या का समाधान करता है: बड़े पैमाने पर सीखने की अस्थिरता। फ्रेमवर्क स्वायत्त एजेंटों को तैनात करने वाले डेवलपर्स और ML शोधकर्ताओं को लक्षित करते हुए, एजेंट रिवॉर्ड मॉडलिंग (reward modeling) के लिए एक अनुकूलित दृष्टिकोण का प्रस्ताव करता है।

M2.5 + Forge की दोहरी घोषणा AI एजेंटों के लिए पूर्ण स्टैक प्रदान करने की MiniMax की महत्वाकांक्षा का संकेत देती है: फ्रंटियर मॉडल + प्रशिक्षण फ्रेमवर्क।

🔗 Forge sur MiniMax News

Kling 3.0 — « Everyone a Director »

1 फरवरी — Kling AI ने अपना 3.0 मॉडल लॉन्च किया, जो इसके वीडियो जेनरेशन इंजन का एक प्रमुख अपडेट है और « Everyone a Director » (हर कोई निर्देशक) अवधारणा के चारों ओर स्थित है। मॉडल का उद्देश्य तकनीकी विशेषज्ञता के बिना सिनेमाई निर्माण को सुलभ बनाना है।

मुख्य सुधार दृश्य गुणवत्ता और मानवीय अंतःक्रियाओं के यथार्थवाद पर हैं:

Capacité	Détail
रिज़ॉल्यूशन	मूल 1080p
संवाद	यथार्थवादी चेहरे के भाव और इशारे
सुसंगतता	लंबे दृश्यों पर दृश्य शैली बनाए रखना
लचीलापन	साधारण प्रॉम्प्ट से लेकर पूर्ण सिनेमाई स्टोरीबोर्ड तक

रचनात्मक समुदाय से प्रतिक्रिया सकारात्मक है, विशेष रूप से संवादों के यथार्थवाद और ठोस मानवीय अंतःक्रियाओं वाले दृश्यों को बनाने की क्षमता पर — जो AI वीडियो मॉडल की एक ऐतिहासिक कमजोरी है।

🔗 Annonce Kling 3.0

Perplexity ने Model Council लॉन्च किया — मल्टी-मॉडल खोज

5 फरवरी — Perplexity ने Model Council तैनात किया, एक ऐसी कार्यक्षमता जो एक ही प्रश्न को तीन फ्रंटियर मॉडलों पर एक साथ निष्पादित करती है और एक एकल संश्लेषित उत्तर तैयार करती है।

मैन्युअल रूप से मॉडलों के बीच स्विच करने के बजाय, Model Council समानांतर में Claude Opus 4.6, GPT 5.2 और Gemini 3.0 पर प्रश्न चलाता है। एक सिंथेसाइज़र मॉडल (synthesizer model) परिणामों का विश्लेषण करता है, उत्तरों के बीच संघर्षों को सुलझाता है और दिखाता है कि मॉडल कहाँ अभिसरण (converge) या विचलन (diverge) करते हैं।

Cas d’usage	Détail
निवेश	बाजारों पर संतुलित दृष्टिकोण
जटिल निर्णय	कॉर्पोरेट रणनीति, बड़ी खरीदारी
ब्रेनस्टॉर्मिंग	विविध रचनात्मक विचार
सत्यापन	अधिक आत्मविश्वास के साथ जानकारी को मान्य करना

यह सुविधा Perplexity Max ग्राहकों के लिए वेब पर तुरंत उपलब्ध है। मोबाइल संस्करण विकास में है।

🔗 Introducing Model Council

Perplexity Deep Research अब Opus 4.6 पर

9 फरवरी — Perplexity ने घोषणा की कि Deep Research अब Claude Opus 4.6 पर चलता है, जिससे आंतरिक और बाहरी benchmarks पर अत्याधुनिक (state-of-the-art) परिणामों में सुधार हुआ है। अपग्रेड गहन शोध में तर्क क्षमताओं को मजबूत करता है।

यह सुविधा Max उपयोगकर्ताओं के लिए तुरंत उपलब्ध है, और Pro उपयोगकर्ताओं के लिए धीरे-धीरे रोलआउट की जा रही है।

🔗 Annonce Deep Research Opus 4.6

Perplexity ने DRACO Benchmark को ओपन-सोर्स किया

4 फरवरी — Perplexity ने DRACO को सार्वजनिक किया, जो एक ओपन-सोर्स benchmark है जिसे डीप रिसर्च (Deep Research) टूल्स का मूल्यांकन करने के लिए डिज़ाइन किया गया है। रूब्रिक्स और पूर्ण कार्यप्रणाली सार्वजनिक रूप से उपलब्ध हैं।

DRACO पुष्टि करता है कि Perplexity Deep Research बाहरी benchmarks पर अत्याधुनिक (state-of-the-art) प्रदर्शन प्राप्त करता है, जो सटीकता और विश्वसनीयता में अन्य डीप रिसर्च टूल्स को पीछे छोड़ देता है।

🔗 Annonce DRACO

Mistral ने अपने सबसे बड़े हैकथॉन की घोषणा की — $200K के पुरस्कार

10 फरवरी — Mistral AI ने अपना अब तक का सबसे बड़ा वैश्विक हैकथॉन लॉन्च किया, जो 28 फरवरी से 1 मार्च 2026 तक निर्धारित है।

Détail	Information
प्रारूप	48 घंटे
स्थान	पेरिस, लंदन, न्यूयॉर्क, सैन फ्रांसिस्को, टोक्यो, सिंगापुर, सिडनी + ऑनलाइन
पुरस्कार	$200K पुरस्कार
साझेदार	NVIDIA, AWS, Weights & Biases, Hugging Face
विशेष पुरस्कार	ElevenLabs, Hugging Face

यह कार्यक्रम 8 शहरों और ऑनलाइन में एक साथ होता है। साझेदारों की सूची (NVIDIA, AWS, WandB, Hugging Face) Mistral प्लेटफॉर्म के प्रति प्रमुख AI पारिस्थितिकी तंत्र के विश्वास का संकेत देती है।

🔗 Annonce Mistral Hackathon

Cohere ने Magnus Carlsen को एंबेसडर के रूप में साइन किया

13 फरवरी — Cohere ने पांच बार के विश्व शतरंज चैंपियन और दुनिया के नंबर 1 खिलाड़ी Magnus Carlsen के साथ वैश्विक ब्रांड एंबेसडर के रूप में साझेदारी की घोषणा की।

Carlsen, Cohere के विजिबिलिटी अभियानों, थॉट लीडरशिप (thought leadership) पहलों और हाई-प्रोफाइल कार्यक्रमों में भाग लेंगे। साझेदारी का उद्देश्य शतरंज में रणनीति और एंटरप्राइज़ AI के लिए Cohere के दृष्टिकोण के बीच समानताएं दिखाना है: बुनियादी बातों पर ध्यान केंद्रित करना, प्रत्याशा, और स्थायी लाभ।

🔗 Annonce Cohere + Magnus Carlsen

संक्षेप में

12 फरवरी — Runway ने Story Panels लॉन्च किया, एक नया वर्कफ़्लो जो एक ही छवि से पूरी फिल्में या विज्ञापन बनाने की अनुमति देता है, जिसमें पात्रों, स्थानों और शैली की सुसंगतता होती है।

🔗 Runway Story Panels

12-13 फरवरी — Mooncake, एक PyTorch मेमोरी एलोकेटर जिसे Moonshot AI (Kimi) और सिंघुआ यूनिवर्सिटी द्वारा सह-विकसित किया गया है, PyTorch पारिस्थितिकी तंत्र में शामिल हो गया। उपकरण मेमोरी चोटियों में कमी और विखंडन को अनुकूलित करता है, जो लॉन्ग-कॉन्टेक्स्ट (long-context) LLM की तैनाती के लिए प्रासंगिक है।

🔗 Annonce Mooncake

9 फरवरी — Ideogram प्राकृतिक भाषा प्रॉम्प्ट द्वारा अपनी छवि संपादन पर प्रकाश डालता है, जिससे सरल पाठ निर्देशों के माध्यम से उत्पन्न छवियों को संशोधित करने की अनुमति मिलती है।

30 जनवरी — Perplexity ने अपने Pro और Max ग्राहकों के लिए Moonshot AI के ओपन-सोर्स रीज़निंग मॉडल Kimi K2.5 को एकीकृत किया। इन्फेरेंस (inference) संयुक्त राज्य अमेरिका में Perplexity के अपने बुनियादी ढांचे पर चलता है।

4 फरवरी — MiniMax और Hyperbond Studio ने MiniMax के LLM और एजेंट API का उपयोग करते हुए “Call Me Sensei” के साथ संवादी AI साथी विकसित करने के लिए साझेदारी की घोषणा की।

इसका क्या अर्थ है

फरवरी 2026 का पहला पखवाड़ा कई बुनियादी रुझानों की पुष्टि करता है। MiniMax M2.5 साबित करता है कि एक कम प्रचारित खिलाड़ी एक ओपन-सोर्स मॉडल प्रकाशित कर सकता है जो कोडिंग benchmarks पर लीडर्स को टक्कर देता है — SWE-Bench Verified पर 80.2% एक ओपन मॉडल के लिए उल्लेखनीय स्कोर है। पूरक के रूप में Forge के साथ, MiniMax एक पूर्ण एजेंट स्टैक प्रस्तावित करता है।

Perplexity ने Model Council के साथ अपने विभेदीकरण में तेजी ला दी है, एक व्यावहारिक दृष्टिकोण जो मानता है कि कोई भी एकल मॉडल सभी उपयोग के मामलों पर हावी नहीं होता है। Deep Research में Opus 4.6 का एकीकरण और ओपन-सोर्स के रूप में DRACO का प्रकाशन प्लेटफॉर्म की पारदर्शिता और विश्वसनीयता को मजबूत करता है।

Kling 3.0 यथार्थवादी संवादों के साथ वीडियो निर्माण में प्रगति को चिह्नित करता है — सुलभ सिनेमाई उत्पादन उपकरणों की ओर एक कदम। समुदाय की ओर, 8 शहरों में $200K का Mistral हैकथॉन यूरोपीय ओपन-सोर्स पारिस्थितिकी तंत्र की परिपक्वता को दर्शाता है।