MiniMax ने M2.5 प्रकाशित किया, जो एक फ्रंटियर ओपन-सोर्स मॉडल है और SWE-Bench Verified पर 80.2% तक पहुँच गया है। Kling ने 1080p वीडियो और यथार्थवादी संवाद के साथ अपना 3.0 मॉडल लॉन्च किया। शोध के मोर्चे पर, Perplexity ने तीन मॉडलों को एक साथ चलाने के लिए Model Council तैनात किया, और Claude Opus 4.6 पर Deep Research चलाया। Mistral ने $200K के पुरस्कारों के साथ अपने सबसे बड़े वैश्विक हैकथॉन की घोषणा की।
MiniMax M2.5 — फ्रंटियर ओपन-सोर्स मॉडल
12 फरवरी — MiniMax ने M2.5 की घोषणा की, जो वास्तविक उत्पादकता के लिए डिज़ाइन किया गया एक फ्रंटियर ओपन-सोर्स मॉडल है। मॉडल चार महत्वपूर्ण क्षेत्रों में अत्याधुनिक (state-of-the-art) प्रदर्शन दिखाता है: कोडिंग, वेब खोज, एजेंटिक टूल कॉलिंग (agentic tool calling), और कार्यालय कार्य।
| Benchmark | Score | Catégorie |
|---|---|---|
| SWE-Bench Verified | 80.2% | वास्तविक बग समाधान |
| BrowseComp | 76.3% | वेब खोज और नेविगेशन |
| BFCL | 76.8% | एजेंटिक टूल कॉलिंग |
| Office Work | अनुकूलित | दस्तावेज़ उत्पादकता |
SWE-Bench Verified पर 80.2% का स्कोर M2.5 को सभी श्रेणियों में सर्वश्रेष्ठ कोडिंग मॉडलों में से एक बनाता है। BrowseComp पर, जो OpenAI का वेब नेविगेशन benchmark है, यह 76.3% तक पहुँच गया है — जो एक मजबूत स्वायत्त खोज क्षमता का संकेत है।
MiniMax प्रतिस्पर्धी मॉडलों की तुलना में जटिल कार्यों पर 37% तेज निष्पादन का दावा करता है, जिसकी लागत 100 tokens/सेकंड पर $1 USD प्रति घंटा है। घोषित लक्ष्य: लॉन्ग-होराइजन (long-horizon) एजेंटों के स्केलिंग को आर्थिक रूप से व्यवहार्य बनाना।
मॉडल MiniMax Agent (agent.minimax.io) और डेवलपर API (platform.minimax.io) के माध्यम से उपलब्ध है। एक फ्रंटियर ओपन-सोर्स मॉडल के रूप में, M2.5 सीधे प्रमुख प्रोप्राइटरी (proprietary) मॉडलों के खिलाफ खड़ा है।
MiniMax Forge — प्रोडक्शन एजेंटों के लिए RL फ्रेमवर्क
12 फरवरी — M2.5 के समानांतर, MiniMax ने Forge प्रकाशित किया, जो प्रोडक्शन AI एजेंटों को प्रशिक्षित करने के लिए एक स्केलेबल रीइन्फोर्समेंट लर्निंग (RL) फ्रेमवर्क और एल्गोरिदम है।
Forge एजेंट प्रशिक्षण में बार-बार आने वाली समस्या का समाधान करता है: बड़े पैमाने पर सीखने की अस्थिरता। फ्रेमवर्क स्वायत्त एजेंटों को तैनात करने वाले डेवलपर्स और ML शोधकर्ताओं को लक्षित करते हुए, एजेंट रिवॉर्ड मॉडलिंग (reward modeling) के लिए एक अनुकूलित दृष्टिकोण का प्रस्ताव करता है।
M2.5 + Forge की दोहरी घोषणा AI एजेंटों के लिए पूर्ण स्टैक प्रदान करने की MiniMax की महत्वाकांक्षा का संकेत देती है: फ्रंटियर मॉडल + प्रशिक्षण फ्रेमवर्क।
Kling 3.0 — « Everyone a Director »
1 फरवरी — Kling AI ने अपना 3.0 मॉडल लॉन्च किया, जो इसके वीडियो जेनरेशन इंजन का एक प्रमुख अपडेट है और « Everyone a Director » (हर कोई निर्देशक) अवधारणा के चारों ओर स्थित है। मॉडल का उद्देश्य तकनीकी विशेषज्ञता के बिना सिनेमाई निर्माण को सुलभ बनाना है।
मुख्य सुधार दृश्य गुणवत्ता और मानवीय अंतःक्रियाओं के यथार्थवाद पर हैं:
| Capacité | Détail |
|---|---|
| रिज़ॉल्यूशन | मूल 1080p |
| संवाद | यथार्थवादी चेहरे के भाव और इशारे |
| सुसंगतता | लंबे दृश्यों पर दृश्य शैली बनाए रखना |
| लचीलापन | साधारण प्रॉम्प्ट से लेकर पूर्ण सिनेमाई स्टोरीबोर्ड तक |
रचनात्मक समुदाय से प्रतिक्रिया सकारात्मक है, विशेष रूप से संवादों के यथार्थवाद और ठोस मानवीय अंतःक्रियाओं वाले दृश्यों को बनाने की क्षमता पर — जो AI वीडियो मॉडल की एक ऐतिहासिक कमजोरी है।
Perplexity ने Model Council लॉन्च किया — मल्टी-मॉडल खोज
5 फरवरी — Perplexity ने Model Council तैनात किया, एक ऐसी कार्यक्षमता जो एक ही प्रश्न को तीन फ्रंटियर मॉडलों पर एक साथ निष्पादित करती है और एक एकल संश्लेषित उत्तर तैयार करती है।
मैन्युअल रूप से मॉडलों के बीच स्विच करने के बजाय, Model Council समानांतर में Claude Opus 4.6, GPT 5.2 और Gemini 3.0 पर प्रश्न चलाता है। एक सिंथेसाइज़र मॉडल (synthesizer model) परिणामों का विश्लेषण करता है, उत्तरों के बीच संघर्षों को सुलझाता है और दिखाता है कि मॉडल कहाँ अभिसरण (converge) या विचलन (diverge) करते हैं।
| Cas d’usage | Détail |
|---|---|
| निवेश | बाजारों पर संतुलित दृष्टिकोण |
| जटिल निर्णय | कॉर्पोरेट रणनीति, बड़ी खरीदारी |
| ब्रेनस्टॉर्मिंग | विविध रचनात्मक विचार |
| सत्यापन | अधिक आत्मविश्वास के साथ जानकारी को मान्य करना |
यह सुविधा Perplexity Max ग्राहकों के लिए वेब पर तुरंत उपलब्ध है। मोबाइल संस्करण विकास में है।
Perplexity Deep Research अब Opus 4.6 पर
9 फरवरी — Perplexity ने घोषणा की कि Deep Research अब Claude Opus 4.6 पर चलता है, जिससे आंतरिक और बाहरी benchmarks पर अत्याधुनिक (state-of-the-art) परिणामों में सुधार हुआ है। अपग्रेड गहन शोध में तर्क क्षमताओं को मजबूत करता है।
यह सुविधा Max उपयोगकर्ताओं के लिए तुरंत उपलब्ध है, और Pro उपयोगकर्ताओं के लिए धीरे-धीरे रोलआउट की जा रही है।
🔗 Annonce Deep Research Opus 4.6
Perplexity ने DRACO Benchmark को ओपन-सोर्स किया
4 फरवरी — Perplexity ने DRACO को सार्वजनिक किया, जो एक ओपन-सोर्स benchmark है जिसे डीप रिसर्च (Deep Research) टूल्स का मूल्यांकन करने के लिए डिज़ाइन किया गया है। रूब्रिक्स और पूर्ण कार्यप्रणाली सार्वजनिक रूप से उपलब्ध हैं।
DRACO पुष्टि करता है कि Perplexity Deep Research बाहरी benchmarks पर अत्याधुनिक (state-of-the-art) प्रदर्शन प्राप्त करता है, जो सटीकता और विश्वसनीयता में अन्य डीप रिसर्च टूल्स को पीछे छोड़ देता है।
Mistral ने अपने सबसे बड़े हैकथॉन की घोषणा की — $200K के पुरस्कार
10 फरवरी — Mistral AI ने अपना अब तक का सबसे बड़ा वैश्विक हैकथॉन लॉन्च किया, जो 28 फरवरी से 1 मार्च 2026 तक निर्धारित है।
| Détail | Information |
|---|---|
| प्रारूप | 48 घंटे |
| स्थान | पेरिस, लंदन, न्यूयॉर्क, सैन फ्रांसिस्को, टोक्यो, सिंगापुर, सिडनी + ऑनलाइन |
| पुरस्कार | $200K पुरस्कार |
| साझेदार | NVIDIA, AWS, Weights & Biases, Hugging Face |
| विशेष पुरस्कार | ElevenLabs, Hugging Face |
यह कार्यक्रम 8 शहरों और ऑनलाइन में एक साथ होता है। साझेदारों की सूची (NVIDIA, AWS, WandB, Hugging Face) Mistral प्लेटफॉर्म के प्रति प्रमुख AI पारिस्थितिकी तंत्र के विश्वास का संकेत देती है।
Cohere ने Magnus Carlsen को एंबेसडर के रूप में साइन किया
13 फरवरी — Cohere ने पांच बार के विश्व शतरंज चैंपियन और दुनिया के नंबर 1 खिलाड़ी Magnus Carlsen के साथ वैश्विक ब्रांड एंबेसडर के रूप में साझेदारी की घोषणा की।
Carlsen, Cohere के विजिबिलिटी अभियानों, थॉट लीडरशिप (thought leadership) पहलों और हाई-प्रोफाइल कार्यक्रमों में भाग लेंगे। साझेदारी का उद्देश्य शतरंज में रणनीति और एंटरप्राइज़ AI के लिए Cohere के दृष्टिकोण के बीच समानताएं दिखाना है: बुनियादी बातों पर ध्यान केंद्रित करना, प्रत्याशा, और स्थायी लाभ।
🔗 Annonce Cohere + Magnus Carlsen
संक्षेप में
12 फरवरी — Runway ने Story Panels लॉन्च किया, एक नया वर्कफ़्लो जो एक ही छवि से पूरी फिल्में या विज्ञापन बनाने की अनुमति देता है, जिसमें पात्रों, स्थानों और शैली की सुसंगतता होती है।
12-13 फरवरी — Mooncake, एक PyTorch मेमोरी एलोकेटर जिसे Moonshot AI (Kimi) और सिंघुआ यूनिवर्सिटी द्वारा सह-विकसित किया गया है, PyTorch पारिस्थितिकी तंत्र में शामिल हो गया। उपकरण मेमोरी चोटियों में कमी और विखंडन को अनुकूलित करता है, जो लॉन्ग-कॉन्टेक्स्ट (long-context) LLM की तैनाती के लिए प्रासंगिक है।
9 फरवरी — Ideogram प्राकृतिक भाषा प्रॉम्प्ट द्वारा अपनी छवि संपादन पर प्रकाश डालता है, जिससे सरल पाठ निर्देशों के माध्यम से उत्पन्न छवियों को संशोधित करने की अनुमति मिलती है।
30 जनवरी — Perplexity ने अपने Pro और Max ग्राहकों के लिए Moonshot AI के ओपन-सोर्स रीज़निंग मॉडल Kimi K2.5 को एकीकृत किया। इन्फेरेंस (inference) संयुक्त राज्य अमेरिका में Perplexity के अपने बुनियादी ढांचे पर चलता है।
4 फरवरी — MiniMax और Hyperbond Studio ने MiniMax के LLM और एजेंट API का उपयोग करते हुए “Call Me Sensei” के साथ संवादी AI साथी विकसित करने के लिए साझेदारी की घोषणा की।
इसका क्या अर्थ है
फरवरी 2026 का पहला पखवाड़ा कई बुनियादी रुझानों की पुष्टि करता है। MiniMax M2.5 साबित करता है कि एक कम प्रचारित खिलाड़ी एक ओपन-सोर्स मॉडल प्रकाशित कर सकता है जो कोडिंग benchmarks पर लीडर्स को टक्कर देता है — SWE-Bench Verified पर 80.2% एक ओपन मॉडल के लिए उल्लेखनीय स्कोर है। पूरक के रूप में Forge के साथ, MiniMax एक पूर्ण एजेंट स्टैक प्रस्तावित करता है।
Perplexity ने Model Council के साथ अपने विभेदीकरण में तेजी ला दी है, एक व्यावहारिक दृष्टिकोण जो मानता है कि कोई भी एकल मॉडल सभी उपयोग के मामलों पर हावी नहीं होता है। Deep Research में Opus 4.6 का एकीकरण और ओपन-सोर्स के रूप में DRACO का प्रकाशन प्लेटफॉर्म की पारदर्शिता और विश्वसनीयता को मजबूत करता है।
Kling 3.0 यथार्थवादी संवादों के साथ वीडियो निर्माण में प्रगति को चिह्नित करता है — सुलभ सिनेमाई उत्पादन उपकरणों की ओर एक कदम। समुदाय की ओर, 8 शहरों में $200K का Mistral हैकथॉन यूरोपीय ओपन-सोर्स पारिस्थितिकी तंत्र की परिपक्वता को दर्शाता है।