検索

MiniMax M2.5がオープンソースでSWE-Bench 80%を達成、Kling 3.0がAIビデオを変革、PerplexityがModel Councilを開始

MiniMax M2.5がオープンソースでSWE-Bench 80%を達成、Kling 3.0がAIビデオを変革、PerplexityがModel Councilを開始

MiniMaxは、SWE-Bench Verifiedで80.2%を達成したフロンティアオープンソースモデルM2.5を公開しました。Klingは1080pビデオとリアルな対話を備えた3.0モデルをリリースしました。検索面では、Perplexityが3つのモデルを同時に実行するModel Councilを展開し、Claude Opus 4.6でDeep Researchを実行しています。Mistralは賞金総額20万ドルの世界最大のハッカソンを発表しました。


MiniMax M2.5 — フロンティアオープンソースモデル

2月12日 — MiniMaxは、実際の生産性のために設計されたフロンティアオープンソースモデル M2.5 を発表しました。このモデルは、コーディング、Web検索、エージェントツール呼び出し、事務作業という4つの重要な領域で最先端(state-of-the-art)のパフォーマンスを示しています。

BenchmarkScoreCatégorie
SWE-Bench Verified80.2%実際のバグ解決
BrowseComp76.3%Web検索とナビゲーション
BFCL76.8%エージェントツール呼び出し
Office Work最適化済ドキュメントの生産性

SWE-Bench Verifiedでの80.2%というスコアは、M2.5を全カテゴリーを含めた最高のコーディングモデルの1つに位置付けています。OpenAIのWebナビゲーションbenchmarkであるBrowseCompでは76.3%に達しており、これは堅牢な自律検索能力の表れです。

MiniMaxは、複雑なタスクにおいて競合モデルと比較して 37%高速 な実行を謳っており、コストは100 tokens/秒で1時間あたり1米ドルです。掲げられた目標は、ロングホライズンなエージェントのスケーリングを経済的に実行可能にすることです。

モデルはMiniMax Agent(agent.minimax.io)および開発者API(platform.minimax.io)を通じて利用可能です。フロンティアオープンソースモデルとして、M2.5は主要なプロプライエタリモデルと直接競合する位置にあります。

🔗 Annonce MiniMax M2.5


MiniMax Forge — 本番エージェント向けRLフレームワーク

2月12日 — M2.5と並行して、MiniMaxは本番AIエージェントをトレーニングするためのスケーラブルな強化学習(RL)フレームワークおよびアルゴリズムである Forge を公開しました。

Forgeは、エージェントのトレーニングにおいて繰り返し発生する問題である、大規模学習の不安定さに対処します。このフレームワークは、自律エージェントを展開する開発者やML研究者をターゲットに、エージェントの報酬モデリング(reward modeling)に最適化されたアプローチを提案しています。

M2.5とForgeの同時発表は、AIエージェントのための完全なスタック(フロンティアモデル + トレーニングフレームワーク)を提供するというMiniMaxの野心を示しています。

🔗 Forge sur MiniMax News


Kling 3.0 — « Everyone a Director »

2月1日 — Kling AIは、動画生成エンジンのメジャーアップデートである 3.0 モデルをリリースしました。これは「Everyone a Director(誰もが監督)」というコンセプトを中心に位置付けられています。このモデルは、専門的な技術なしに映画制作を身近にすることを目指しています。

主な改善点は、視覚的な品質と人間同士の対話のリアリズムにあります:

CapacitéDétail
解像度ネイティブ1080p
対話リアルな表情とジェスチャー
一貫性長いシーケンスでも視覚スタイルを維持
柔軟性シンプルなプロンプトから完全な映画の絵コンテまで

クリエイティブコミュニティからのフィードバックは肯定的で、特に対話のリアリズムと、説得力のある人間同士の対話を含むシーンを作成する能力(AIビデオモデルの歴史的な弱点)について高く評価されています。

🔗 Annonce Kling 3.0


PerplexityがModel Councilを開始 — マルチモデル検索

2月5日 — Perplexityは、同じクエリを3つのフロンティアモデルで同時に実行し、統合された単一の回答を生成する機能 Model Council を展開しました。

手動でモデルを切り替える代わりに、Model CouncilはClaude Opus 4.6、GPT 5.2、Gemini 3.0でクエリを並列に実行します。シンセサイザーモデルが結果を分析し、回答間の矛盾を解決し、モデルが収束または発散している箇所を示します。

Cas d’usageDétail
投資市場に関するバランスの取れた視点
複雑な意思決定企業戦略、主要な購入
ブレインストーミング多様な創造的アイデア
検証確信を持って情報を検証

この機能は、Perplexity Max加入者向けにWebですぐに利用可能です。モバイル版は開発中です。

🔗 Introducing Model Council


Perplexity Deep ResearchがOpus 4.6に移行

2月9日 — Perplexityは、Deep ResearchがClaude Opus 4.6で動作するようになった ことを発表し、内部および外部のbenchmarkで最先端(state-of-the-art)の結果を向上させました。このアップグレードにより、詳細な調査における推論能力が強化されます。

この機能はMaxユーザー向けにすぐに利用可能で、Proユーザーへも順次展開されます。

🔗 Annonce Deep Research Opus 4.6


PerplexityがDRACO Benchmarkをオープンソースで公開

2月4日 — Perplexityは、Deep Researchツールを評価するために設計されたオープンソースのbenchmarkである DRACO を公開しました。評価基準と完全な方法論が公開されています。

DRACOは、Perplexity Deep Researchが外部benchmarkで最先端(state-of-the-art)のパフォーマンスを達成し、精度と信頼性において他のDeep Researchツールを上回っていることを検証しています。

🔗 Annonce DRACO


Mistralが過去最大のハッカソンを発表 — 賞金総額20万ドル

2月10日 — Mistral AIは、これまでに組織された中で 世界最大のハッカソン を、2026年2月28日から3月1日にかけて開催すると発表しました。

DétailInformation
形式48時間
場所パリ、ロンドン、ニューヨーク、サンフランシスコ、東京、シンガポール、シドニー + オンライン
賞金20万ドルの報酬
パートナーNVIDIA、AWS、Weights & Biases、Hugging Face
特別賞ElevenLabs、Hugging Face

イベントは8都市とオンラインで同時に開催されます。パートナーリスト(NVIDIA、AWS、WandB、Hugging Face)は、主要なAIエコシステムがMistralプラットフォームに対して寄せている信頼を示しています。

🔗 Annonce Mistral Hackathon


Cohereがマグヌス・カールセンとアンバサダー契約

2月13日 — Cohereは、チェスの世界チャンピオンで世界ランク1位の マグヌス・カールセン と、グローバルブランドアンバサダーとしてのパートナーシップを発表しました。

カールセンは、Cohereの知名度向上キャンペーン、ソートリーダーシップ(thought leadership)の取り組み、注目度の高いイベントに参加します。このパートナーシップは、チェスの戦略とCohereのエンタープライズAIへのアプローチ(基礎への集中、先読み、持続的な優位性)との間の類似性を示すことを目的としています。

🔗 Annonce Cohere + Magnus Carlsen


ニュース・ブリーフ

2月12日Runway は、単一の画像から完全な映画や広告を作成できる新しいワークフロー Story Panels を開始しました。キャラクター、場所、スタイルの一貫性が保たれます。

🔗 Runway Story Panels

2月12-13日Moonshot AI (Kimi) と 清華大学 が共同開発したPyTorchメモリアロケータ Mooncake が、PyTorchエコシステムに参加しました。このツールはメモリピークの削減と断片化を最適化し、ロングコンテキストLLMの展開に関連しています。

🔗 Annonce Mooncake

2月9日Ideogram は、自然言語プロンプトによる画像編集を強調し、簡単なテキスト指示で生成された画像を変更できるようにしました。

1月30日Perplexity は、ProおよびMax加入者向けにMoonshot AIのオープンソース推論モデル Kimi K2.5 を統合しました。推論は、米国にあるPerplexity独自のインフラストラクチャ上で実行されます。

2月4日MiniMaxHyperbond Studio は、MiniMaxのLLMとエージェントAPIを使用して、「Call Me Sensei」という会話型AIコンパニオンを開発するためのパートナーシップを発表しました。


その意味するところ

2026年2月の前半は、いくつかの根本的なトレンドを確認させています。MiniMax M2.5 は、あまり知られていないプレイヤーでも、コーディングbenchmarkでリーダーと競合するオープンソースモデルを公開できることを証明しました — SWE-Bench Verifiedでの80.2%は、オープンモデルとしては驚くべきスコアです。Forgeを補完的に備えることで、MiniMaxは完全なエージェントスタックを提案しています。

Perplexity は、単一のモデルがあらゆるユースケースを支配するわけではないという実用的なアプローチであるModel Councilによって差別化を加速させています。Deep ResearchへのOpus 4.6の統合とDRACOのオープンソース公開は、プラットフォームの透明性と信頼性を強化しています。

Kling 3.0 は、リアルな対話によるビデオ生成の進歩を示しています — これは、利用しやすい映画制作ツールへの一歩です。コミュニティの側面では、8都市で開催される賞金20万ドルのMistralハッカソンが、ヨーロッパのオープンソースエコシステムの成熟度を示しています。


Sources