بحث

Claude Opus 4.6 و GPT-5.3-Codex: إطلاق مزدوج، تحديث Gemini 3

Claude Opus 4.6 و GPT-5.3-Codex: إطلاق مزدوج، تحديث Gemini 3

إطلاق مزدوج في القمة: أطلقت Anthropic نموذج Claude Opus 4.6 بسياق 1 مليون رمز (token) وفرق الوكلاء، بينما ترد OpenAI بنموذج GPT-5.3-Codex ومنصة للمؤسسات. تدفع Google بنموذج Gemini 3 على جميع الجبهات، وتستجيب GitHub أخيراً لطلب عمره 8 سنوات.


Claude Opus 4.6: الأحدث (SOTA) في agentic coding وسياق 1M

5 فبراير — أطلقت Anthropic نموذج Claude Opus 4.6، وهو تحديث رئيسي لنموذجها الأكثر ذكاءً. يتقدم النموذج في التخطيط، والجلسات الطويلة، ومراجعة الكود، ويقدم لأول مرة سياقاً بحجم 1 مليون رمز في إصدار تجريبي لنموذج Opus.

المعيارالنتيجةالتفاصيل
Terminal-Bench 2.0SOTAأعلى نتيجة في agentic coding
Humanity’s Last ExamSOTAالتفكير متعدد التخصصات
GDPval-AA+144 Elo vs GPT-5.2العمل المهني (المالية، القانون)
BrowseCompSOTAاسترجاع المعلومات المعقدة
MRCR v2 (8-needle 1M)76%مقابل 18.5% لنموذج Sonnet 4.5

ميزات API والمنتج الجديدة

الميزةالوصف
Agent teamsعدة وكلاء Claude Code على التوازي (معاينة بحثية)
Adaptive thinkingيختار النموذج متى يستخدم التفكير العميق
Effort controls4 مستويات: منخفض، متوسط، مرتفع (افتراضي)، أقصى
Context compactionتلخيص تلقائي للسياق للجلسات الطويلة
128k output tokensمخرجات أطول في طلب واحد
Claude in PowerPointمعاينة بحثية (Max, Team, Enterprise)

التسعير: بدون تغيير عند 5/25/25 لكل مليون رمز (إدخال/إخراج). تسعير ممتاز ما بعد 200 ألف رمز (10/37.50/37.50).

التوفر: claude.ai، و API (claude-opus-4-6)، وجميع المنصات السحابية الرئيسية.

مدونات الهندسة: ضوضاء البنية التحتية ومترجم C

نشرت Anthropic مقالين تقنيين في نفس اليوم. الأول يحدد كمية ضوضاء البنية التحتية في معايير agentic coding: في Terminal-Bench 2.0، يمكن لتكوين الموارد وحده أن يخلق فجوات بمقدار 6 نقاط مئوية بين الإعدادات. الثاني يوثق بناء مترجم C بلغة Rust بواسطة 16 وكيل Claude على التوازي: 100,000 سطر من الكود، قادر على تجميع نواة Linux 6.9 على x86 و ARM و RISC-V، في حوالي 2000 جلسة Claude Code مقابل حوالي 20,000 دولار.

Opus 4.6 في GitHub Copilot

في نفس اليوم، أصبح Claude Opus 4.6 متاحاً بشكل عام (GA) في GitHub Copilot عبر Agent HQ، بعد المعاينة العامة التي تم الإعلان عنها في اليوم السابق.

🔗 إعلان Opus 4.6 | ضوضاء البنية التحتية | بناء مترجم C


GPT-5.3-Codex: حدود البرمجة + المعرفة المهنية

5 فبراير — أطلقت OpenAI نموذج GPT-5.3-Codex، الذي يدمج أداء البرمجة في GPT-5.2-Codex مع قدرات التفكير في GPT-5.2، وكل ذلك أسرع بنسبة 25%.

المعيارالنتيجة
SWE-Bench Pro (عام)56.8%
Terminal-Bench 2.077.3%
OSWorld-Verified64.7%
GDPval (فوز أو تعادل)70.9%
Cybersecurity CTF77.6%
SWE-Lancer IC Diamond81.4%

يعد GPT-5.3-Codex أول نموذج يساهم في إنشائه الخاص: استخدم الفريق إصدارات أولية لتصحيح التدريب وإدارة النشر وتحليل نتائج الاختبار.

ما وراء الكود

ينتج النموذج عروضاً تقديمية وجداول بيانات وتحليل بيانات ويتعامل مع مهام الإنتاجية في بيئة سطح المكتب (64.7% على OSWorld-Verified).

الأمن السيبراني: قدرة عالية

يعد GPT-5.3-Codex أول نموذج يتم تصنيفه بقدرة عالية (High Capability) للأمن السيبراني بموجب إطار عمل الاستعداد الخاص بـ OpenAI، والأول الذي تم تدريبه خصيصاً لتحديد ثغرات البرامج.

🔗 مدونة GPT-5.3-Codex | System Card


OpenAI: منصة Frontier، تطبيقات MCP، الأمن والتكنولوجيا الحيوية

OpenAI Frontier: منصة وكلاء المؤسسات

5 فبراير — أطلقت OpenAI منصة Frontier، لتطوير ونشر وإدارة وكلاء الذكاء الاصطناعي في المؤسسات. يتلقى الوكلاء سياق عمل مشتركاً، وأذونات، ويتعلمون من التجربة.

الجانبالتفاصيل
العملاء الأوائلHP, Intuit, Oracle, State Farm, Thermo Fisher, Uber
شركاء الذكاء الاصطناعيAbridge, Clay, Ambience, Decagon, Harvey, Sierra
النهجمهندسو النشر المتقدم (FDE) مدمجون في الفرق
المعاييرمعايير مفتوحة، متوافقة مع الأنظمة الحالية

ChatGPT: تطبيقات MCP في النسخة التجريبية

5 فبراير — وصلت تطبيقات MCP إلى النسخة التجريبية في ChatGPT Business و Enterprise و Edu. موصلات شركاء جدد: Amplitude و Fireflies و Vercel و Monday.com و Stripe و Hex و Egnyte وغيرهم. يمكن للمؤسسات بناء تطبيقات MCP مخصصة عبر وضع المطور.

Trusted Access for Cyber

5 فبراير — أطلقت OpenAI برنامج Trusted Access for Cyber، وهو برنامج تجريبي للوصول القائم على الثقة للقدرات السيبرانية المتقدمة. يمكن للمستخدمين التحقق من هويتهم على chatgpt.com/cyber. تم تخصيص 10 ملايين دولار من أرصدة API للدفاع السيبراني من خلال برنامج المنح للأمن السيبراني.

GPT-5 يخفض تكلفة تخليق البروتين

5 فبراير — بالشراكة مع Ginkgo Bioworks، تربط OpenAI نموذج GPT-5 بمختبر آلي لتحسين تخليق البروتين الخالي من الخلايا (CFPS). النتيجة: تخفيض بنسبة 40% في تكلفة الإنتاج و تحسن بنسبة 57% في تكلفة الكواشف، بعد اختبار 36,000 تركيبة على 580 لوحة آلية في ست جولات من التجارب.

🔗 OpenAI Frontier | تطبيقات MCP | Trusted Access for Cyber | بروتينات GPT-5


Google: Gemini 3، و Super Bowl، و NotebookLM

Gemini 3: تحديثات و Super Bowl

5-6 فبراير — تدفع Google بنموذج Gemini 3 على جميع الجبهات. يقدم Gemini 3 Flash، الذي تم إطلاقه مؤخراً، تفكيراً بمستوى Pro بسرعة Flash: بنسبة 90.4% على GPQA Diamond و 33.7% على Humanity’s Last Exam (بدون أدوات). يصبح Gemini 3 النموذج الافتراضي لـ AI Overviews في بحث Google.

تقوم Google أيضاً بإعداد إعلان لـ Gemini مدته 60 ثانية لبطولة Super Bowl LX (8 فبراير) — يظهر إعلان “New Home” طفلاً يستعد للانتقال بمساعدة Gemini، موضحاً قدرات البحث في صور Google وتوليد الصور.

NotebookLM: الرسوم البيانية (Infographics) وعروض الشرائح (Slide Decks)

يقوم NotebookLM، المبني الآن على Gemini 3، بطرح الرسوم البيانية وعروض الشرائح للمستخدمين المجانيين والمحترفين (Pro). تعد عروض الشرائح بالفعل ثاني أكثر استوديوهات الإخراج شعبية. يمكن لمستخدمي Ultra إزالة العلامة المائية.

🔗 Gemini 3 Flash | Gemini 3 App | NotebookLM Infographics


GitHub: التعليقات المثبتة على Issues

5 فبراير — أطلقت GitHub التعليقات المثبتة على Issues. أصبح من الممكن الآن تثبيت تعليق في الجزء العلوي من issue من القائمة السياقية. ميزة تم طلبها منذ عام 2017 لتسليط الضوء على القرارات والتحديثات والخطوات التالية الرئيسية في المحادثات الطويلة.

🔗 سجل التغييرات


ما يعنيه هذا

سيبقى يوم 5 فبراير 2026 يوماً بارزاً: تطلق Anthropic و OpenAI في وقت واحد نماذج البرمجة الأكثر تقدماً لديهما. يهيمن Claude Opus 4.6 على معايير العمل المهني واسترجاع المعلومات، بينما يتفوق GPT-5.3-Codex في البرمجة الطرفية (terminal coding) واستخدام الكمبيوتر. يدعي كلا النموذجين الوصول إلى الأحدث (SOTA) في Terminal-Bench 2.0 — مقال Anthropic حول ضوضاء البنية التحتية منطقي تماماً.

وبعيداً عن النماذج، تشتد معركة المنصات: تهاجم OpenAI Frontier المؤسسات بوكلاء تم نشرهم في Oracle و Uber، بينما تراهن Anthropic على النظام البيئي للمطورين (GitHub, Xcode, Claude Code). تتقدم Google على جميع الجبهات مع Gemini 3 في البحث و Chrome و NotebookLM، وتجهز لـ Super Bowl لترسيخ Gemini في التيار الرئيسي.


المصادر