खोजें

MiniMax M2.5 ने ओपन-सोर्स में SWE-Bench पर 80% हासिल किया, Kling 3.0 ने AI वीडियो को बदला, Perplexity ने Model Council लॉन्च किया

MiniMax M2.5 ने ओपन-सोर्स में SWE-Bench पर 80% हासिल किया, Kling 3.0 ने AI वीडियो को बदला, Perplexity ने Model Council लॉन्च किया

MiniMax ने M2.5 प्रकाशित किया, जो एक फ्रंटियर ओपन-सोर्स मॉडल है और SWE-Bench Verified पर 80.2% तक पहुँच गया है। Kling ने 1080p वीडियो और यथार्थवादी संवाद के साथ अपना 3.0 मॉडल लॉन्च किया। शोध के मोर्चे पर, Perplexity ने तीन मॉडलों को एक साथ चलाने के लिए Model Council तैनात किया, और Claude Opus 4.6 पर Deep Research चलाया। Mistral ने $200K के पुरस्कारों के साथ अपने सबसे बड़े वैश्विक हैकथॉन की घोषणा की।


MiniMax M2.5 — फ्रंटियर ओपन-सोर्स मॉडल

12 फरवरी — MiniMax ने M2.5 की घोषणा की, जो वास्तविक उत्पादकता के लिए डिज़ाइन किया गया एक फ्रंटियर ओपन-सोर्स मॉडल है। मॉडल चार महत्वपूर्ण क्षेत्रों में अत्याधुनिक (state-of-the-art) प्रदर्शन दिखाता है: कोडिंग, वेब खोज, एजेंटिक टूल कॉलिंग (agentic tool calling), और कार्यालय कार्य।

BenchmarkScoreCatégorie
SWE-Bench Verified80.2%वास्तविक बग समाधान
BrowseComp76.3%वेब खोज और नेविगेशन
BFCL76.8%एजेंटिक टूल कॉलिंग
Office Workअनुकूलितदस्तावेज़ उत्पादकता

SWE-Bench Verified पर 80.2% का स्कोर M2.5 को सभी श्रेणियों में सर्वश्रेष्ठ कोडिंग मॉडलों में से एक बनाता है। BrowseComp पर, जो OpenAI का वेब नेविगेशन benchmark है, यह 76.3% तक पहुँच गया है — जो एक मजबूत स्वायत्त खोज क्षमता का संकेत है।

MiniMax प्रतिस्पर्धी मॉडलों की तुलना में जटिल कार्यों पर 37% तेज निष्पादन का दावा करता है, जिसकी लागत 100 tokens/सेकंड पर $1 USD प्रति घंटा है। घोषित लक्ष्य: लॉन्ग-होराइजन (long-horizon) एजेंटों के स्केलिंग को आर्थिक रूप से व्यवहार्य बनाना।

मॉडल MiniMax Agent (agent.minimax.io) और डेवलपर API (platform.minimax.io) के माध्यम से उपलब्ध है। एक फ्रंटियर ओपन-सोर्स मॉडल के रूप में, M2.5 सीधे प्रमुख प्रोप्राइटरी (proprietary) मॉडलों के खिलाफ खड़ा है।

🔗 Annonce MiniMax M2.5


MiniMax Forge — प्रोडक्शन एजेंटों के लिए RL फ्रेमवर्क

12 फरवरी — M2.5 के समानांतर, MiniMax ने Forge प्रकाशित किया, जो प्रोडक्शन AI एजेंटों को प्रशिक्षित करने के लिए एक स्केलेबल रीइन्फोर्समेंट लर्निंग (RL) फ्रेमवर्क और एल्गोरिदम है।

Forge एजेंट प्रशिक्षण में बार-बार आने वाली समस्या का समाधान करता है: बड़े पैमाने पर सीखने की अस्थिरता। फ्रेमवर्क स्वायत्त एजेंटों को तैनात करने वाले डेवलपर्स और ML शोधकर्ताओं को लक्षित करते हुए, एजेंट रिवॉर्ड मॉडलिंग (reward modeling) के लिए एक अनुकूलित दृष्टिकोण का प्रस्ताव करता है।

M2.5 + Forge की दोहरी घोषणा AI एजेंटों के लिए पूर्ण स्टैक प्रदान करने की MiniMax की महत्वाकांक्षा का संकेत देती है: फ्रंटियर मॉडल + प्रशिक्षण फ्रेमवर्क।

🔗 Forge sur MiniMax News


Kling 3.0 — « Everyone a Director »

1 फरवरी — Kling AI ने अपना 3.0 मॉडल लॉन्च किया, जो इसके वीडियो जेनरेशन इंजन का एक प्रमुख अपडेट है और « Everyone a Director » (हर कोई निर्देशक) अवधारणा के चारों ओर स्थित है। मॉडल का उद्देश्य तकनीकी विशेषज्ञता के बिना सिनेमाई निर्माण को सुलभ बनाना है।

मुख्य सुधार दृश्य गुणवत्ता और मानवीय अंतःक्रियाओं के यथार्थवाद पर हैं:

CapacitéDétail
रिज़ॉल्यूशनमूल 1080p
संवादयथार्थवादी चेहरे के भाव और इशारे
सुसंगततालंबे दृश्यों पर दृश्य शैली बनाए रखना
लचीलापनसाधारण प्रॉम्प्ट से लेकर पूर्ण सिनेमाई स्टोरीबोर्ड तक

रचनात्मक समुदाय से प्रतिक्रिया सकारात्मक है, विशेष रूप से संवादों के यथार्थवाद और ठोस मानवीय अंतःक्रियाओं वाले दृश्यों को बनाने की क्षमता पर — जो AI वीडियो मॉडल की एक ऐतिहासिक कमजोरी है।

🔗 Annonce Kling 3.0


Perplexity ने Model Council लॉन्च किया — मल्टी-मॉडल खोज

5 फरवरी — Perplexity ने Model Council तैनात किया, एक ऐसी कार्यक्षमता जो एक ही प्रश्न को तीन फ्रंटियर मॉडलों पर एक साथ निष्पादित करती है और एक एकल संश्लेषित उत्तर तैयार करती है।

मैन्युअल रूप से मॉडलों के बीच स्विच करने के बजाय, Model Council समानांतर में Claude Opus 4.6, GPT 5.2 और Gemini 3.0 पर प्रश्न चलाता है। एक सिंथेसाइज़र मॉडल (synthesizer model) परिणामों का विश्लेषण करता है, उत्तरों के बीच संघर्षों को सुलझाता है और दिखाता है कि मॉडल कहाँ अभिसरण (converge) या विचलन (diverge) करते हैं।

Cas d’usageDétail
निवेशबाजारों पर संतुलित दृष्टिकोण
जटिल निर्णयकॉर्पोरेट रणनीति, बड़ी खरीदारी
ब्रेनस्टॉर्मिंगविविध रचनात्मक विचार
सत्यापनअधिक आत्मविश्वास के साथ जानकारी को मान्य करना

यह सुविधा Perplexity Max ग्राहकों के लिए वेब पर तुरंत उपलब्ध है। मोबाइल संस्करण विकास में है।

🔗 Introducing Model Council


Perplexity Deep Research अब Opus 4.6 पर

9 फरवरी — Perplexity ने घोषणा की कि Deep Research अब Claude Opus 4.6 पर चलता है, जिससे आंतरिक और बाहरी benchmarks पर अत्याधुनिक (state-of-the-art) परिणामों में सुधार हुआ है। अपग्रेड गहन शोध में तर्क क्षमताओं को मजबूत करता है।

यह सुविधा Max उपयोगकर्ताओं के लिए तुरंत उपलब्ध है, और Pro उपयोगकर्ताओं के लिए धीरे-धीरे रोलआउट की जा रही है।

🔗 Annonce Deep Research Opus 4.6


Perplexity ने DRACO Benchmark को ओपन-सोर्स किया

4 फरवरी — Perplexity ने DRACO को सार्वजनिक किया, जो एक ओपन-सोर्स benchmark है जिसे डीप रिसर्च (Deep Research) टूल्स का मूल्यांकन करने के लिए डिज़ाइन किया गया है। रूब्रिक्स और पूर्ण कार्यप्रणाली सार्वजनिक रूप से उपलब्ध हैं।

DRACO पुष्टि करता है कि Perplexity Deep Research बाहरी benchmarks पर अत्याधुनिक (state-of-the-art) प्रदर्शन प्राप्त करता है, जो सटीकता और विश्वसनीयता में अन्य डीप रिसर्च टूल्स को पीछे छोड़ देता है।

🔗 Annonce DRACO


Mistral ने अपने सबसे बड़े हैकथॉन की घोषणा की — $200K के पुरस्कार

10 फरवरी — Mistral AI ने अपना अब तक का सबसे बड़ा वैश्विक हैकथॉन लॉन्च किया, जो 28 फरवरी से 1 मार्च 2026 तक निर्धारित है।

DétailInformation
प्रारूप48 घंटे
स्थानपेरिस, लंदन, न्यूयॉर्क, सैन फ्रांसिस्को, टोक्यो, सिंगापुर, सिडनी + ऑनलाइन
पुरस्कार$200K पुरस्कार
साझेदारNVIDIA, AWS, Weights & Biases, Hugging Face
विशेष पुरस्कारElevenLabs, Hugging Face

यह कार्यक्रम 8 शहरों और ऑनलाइन में एक साथ होता है। साझेदारों की सूची (NVIDIA, AWS, WandB, Hugging Face) Mistral प्लेटफॉर्म के प्रति प्रमुख AI पारिस्थितिकी तंत्र के विश्वास का संकेत देती है।

🔗 Annonce Mistral Hackathon


Cohere ने Magnus Carlsen को एंबेसडर के रूप में साइन किया

13 फरवरी — Cohere ने पांच बार के विश्व शतरंज चैंपियन और दुनिया के नंबर 1 खिलाड़ी Magnus Carlsen के साथ वैश्विक ब्रांड एंबेसडर के रूप में साझेदारी की घोषणा की।

Carlsen, Cohere के विजिबिलिटी अभियानों, थॉट लीडरशिप (thought leadership) पहलों और हाई-प्रोफाइल कार्यक्रमों में भाग लेंगे। साझेदारी का उद्देश्य शतरंज में रणनीति और एंटरप्राइज़ AI के लिए Cohere के दृष्टिकोण के बीच समानताएं दिखाना है: बुनियादी बातों पर ध्यान केंद्रित करना, प्रत्याशा, और स्थायी लाभ।

🔗 Annonce Cohere + Magnus Carlsen


संक्षेप में

12 फरवरीRunway ने Story Panels लॉन्च किया, एक नया वर्कफ़्लो जो एक ही छवि से पूरी फिल्में या विज्ञापन बनाने की अनुमति देता है, जिसमें पात्रों, स्थानों और शैली की सुसंगतता होती है।

🔗 Runway Story Panels

12-13 फरवरीMooncake, एक PyTorch मेमोरी एलोकेटर जिसे Moonshot AI (Kimi) और सिंघुआ यूनिवर्सिटी द्वारा सह-विकसित किया गया है, PyTorch पारिस्थितिकी तंत्र में शामिल हो गया। उपकरण मेमोरी चोटियों में कमी और विखंडन को अनुकूलित करता है, जो लॉन्ग-कॉन्टेक्स्ट (long-context) LLM की तैनाती के लिए प्रासंगिक है।

🔗 Annonce Mooncake

9 फरवरीIdeogram प्राकृतिक भाषा प्रॉम्प्ट द्वारा अपनी छवि संपादन पर प्रकाश डालता है, जिससे सरल पाठ निर्देशों के माध्यम से उत्पन्न छवियों को संशोधित करने की अनुमति मिलती है।

30 जनवरीPerplexity ने अपने Pro और Max ग्राहकों के लिए Moonshot AI के ओपन-सोर्स रीज़निंग मॉडल Kimi K2.5 को एकीकृत किया। इन्फेरेंस (inference) संयुक्त राज्य अमेरिका में Perplexity के अपने बुनियादी ढांचे पर चलता है।

4 फरवरीMiniMax और Hyperbond Studio ने MiniMax के LLM और एजेंट API का उपयोग करते हुए “Call Me Sensei” के साथ संवादी AI साथी विकसित करने के लिए साझेदारी की घोषणा की।


इसका क्या अर्थ है

फरवरी 2026 का पहला पखवाड़ा कई बुनियादी रुझानों की पुष्टि करता है। MiniMax M2.5 साबित करता है कि एक कम प्रचारित खिलाड़ी एक ओपन-सोर्स मॉडल प्रकाशित कर सकता है जो कोडिंग benchmarks पर लीडर्स को टक्कर देता है — SWE-Bench Verified पर 80.2% एक ओपन मॉडल के लिए उल्लेखनीय स्कोर है। पूरक के रूप में Forge के साथ, MiniMax एक पूर्ण एजेंट स्टैक प्रस्तावित करता है।

Perplexity ने Model Council के साथ अपने विभेदीकरण में तेजी ला दी है, एक व्यावहारिक दृष्टिकोण जो मानता है कि कोई भी एकल मॉडल सभी उपयोग के मामलों पर हावी नहीं होता है। Deep Research में Opus 4.6 का एकीकरण और ओपन-सोर्स के रूप में DRACO का प्रकाशन प्लेटफॉर्म की पारदर्शिता और विश्वसनीयता को मजबूत करता है।

Kling 3.0 यथार्थवादी संवादों के साथ वीडियो निर्माण में प्रगति को चिह्नित करता है — सुलभ सिनेमाई उत्पादन उपकरणों की ओर एक कदम। समुदाय की ओर, 8 शहरों में $200K का Mistral हैकथॉन यूरोपीय ओपन-सोर्स पारिस्थितिकी तंत्र की परिपक्वता को दर्शाता है।


Sources