نهاية حقبة وبداية أخرى: وداعاً لـ GPT-4o وأهلاً بنماذج GPT-5.4 الجديدة

مع بدء شركة أوبن إيه آي في سحب بعض نماذج الذكاء الاصطناعي القديمة من الخدمة، برز اسم “GPT-4o” كأبرز الغائبين عن الساحة. هذا النموذج، الذي اعتبره الكثيرون المساعد الشامل والأهم للشركة، شكل نقطة تحول حقيقية في علاقتنا بالتكنولوجيا. فقد نقل الذكاء الاصطناعي من مجرد آلة تنفذ الأوامر إلى شريك محادثة فعال. وتكمن أهميته الكبرى في كونه مساعداً متعدد الوسائط يتعامل مع النصوص والصور والصوت في نفس الوقت وبسلاسة لم نعهدها في الأجيال التي سبقته.

سر الارتباط بنموذج يودعنا تميز GPT-4o بتدفق طبيعي للمحادثات، حيث ابتعد عن الردود الآلية المعتادة ليحاكي نبرة المستخدم وإيقاعه الخاص. هذه الميزة تحديداً جعلت من جلسات العصف الذهني والنقاشات السريعة تبدو وكأنها دردشة إنسانية حقيقية وليست إملاءً للأوامر. إلى جانب ذلك، أظهر النموذج قدرة استثنائية على الفهم البديهي للصور. لم يكن يكتفي بتحديد العناصر المكتوبة أو المرسومة، بل كان يقرأ سياق لقطات الشاشة وواجهات التطبيقات بذكاء، ويقدم المعلومات المهمة فوراً دون إغراق المستخدم في تفاصيل مبهمة، وهو ما جعله الخيار المثالي لحل المشكلات اليومية السريعة.

تفاعلات حية وتجربة مستخدم غير مسبوقة التفاعلات الصوتية مع هذا المساعد كانت فورية وتلقائية بشكل ملحوظ. قصر الفجوة الزمنية بين السؤال والجواب جعل المقاطعات الصوتية تبدو طبيعية تماماً، مما أعطى إحساساً بحوار حي ومستمر. كما اتسمت نبرته بالدفء والتعبير، مقدماً لمسات من الفكاهة والتعاطف بعيداً عن التكلف المزعج. هذه الروح العفوية جعلته الخيار المفضل للمبتدئين في عالم الذكاء الاصطناعي؛ إذ كسر حاجز الرهبة لديهم، وقدم لهم الشروحات ببساطة وبعيداً عن المصطلحات التقنية المعقدة. وكان دمج هذه الوسائط المتعددة دون الحاجة لإعادة ضبط التفاعل في كل مرة عاملاً حاسماً في تفوقه، خاصة عند كتابة رسائل البريد الإلكتروني أو تلخيص المقالات وتنظيم الأفكار.

دماء جديدة في عروق الذكاء الاصطناعي تزامن هذا الوداع مع إطلاق أوبن إيه آي لجيل جديد ومختلف تماماً يتمثل في نماذج GPT-5.4 mini و GPT-5.4 nano. تم تصميم هذه النماذج الأصغر لتكون أسرع وأقل تكلفة بكثير من النموذج الرئيسي الضخم للشركة. أصبح إصدار mini متاحاً بالفعل للمستخدمين عبر واجهة برمجة التطبيقات (API) وCodex وتطبيق ChatGPT، في حين انطلق إصدار nano حصرياً عبر واجهة برمجة التطبيقات في الوقت الحالي. توجه الشركة إصدار mini بوضوح نحو مهام البرمجة المعقدة واستخدام الأدوات المتعددة، بينما تضع nano في خانة المهام القياسية الرخيصة التي تتطلب حجماً كبيراً من العمل السريع.

حسابات التكلفة والأسعار للمطورين تحمل هذه التغييرات الجذرية في طياتها تفاصيل مالية محورية للمطورين. يكلف تشغيل نموذج GPT-5.4 mini حوالي 0.75 دولار لكل مليون توكن للمدخلات، و0.075 دولار للمدخلات المخزنة مؤقتاً، و4.50 دولار للمخرجات. وتهبط التكلفة بشكل درامي مع إصدار nano ليصل إلى 0.20 دولار للمدخلات، و0.02 دولار للمدخلات المخزنة، و1.25 دولار للمخرجات. هذه الأرقام تضع الإصدار الأصغر كخيار اقتصادي صريح لأعباء العمل البسيطة والمكثفة، وتبقي إصدار mini كأداة قوية للمهام البرمجية وسير العمل الأكثر تعقيداً.

أرقام واختبارات الأداء على أرض الواقع تعكس نتائج الاختبارات الفنية هذه الفروق بوضوح شديد. سجل GPT-5.4 mini نسبة 54.4% في اختبارات SWE-Bench Pro الخاصة بالبرمجة، مقترباً جداً من النسخة الأكبر الأساسية التي سجلت 57.7%، بينما حقق nano نسبة 52.4%. تباينت النتائج أكثر عند اختبار استخدام الأدوات والوكلاء الذكية؛ إذ تفوق mini في اختبار Terminal-Bench 2.0 بنسبة 60% مقابل 46.3% فقط لـ nano. أما في مهام استخدام الكمبيوتر المعقدة مثل OSWorld-Verified، فقد أثبت mini جدارته بنسبة 72.1%، بينما تراجع nano إلى 39% متأخراً حتى عن الأجيال السابقة، مما يجعله خياراً غير مناسب للمهام البصرية المتقدمة على سطح المكتب.

قدرات برمجية تعيد هيكلة العمل تراهن الشركة على إصدار mini كنموذج عمل أساسي ومتكامل. يتيح النظام في منصة Codex للنموذج الكبير التخطيط والتقييم، بينما يتولى mini المهام الفرعية كوكيل مساعد للبحث في الأكواد أو مراجعة الملفات، وهو ما يستهلك حوالي 30% فقط من حصة الاستخدام المعتادة للنموذج الأساسي. يدعم هذا الإصدار مدخلات النصوص والصور، واستدعاء الوظائف، والبحث عبر الويب، ويمتلك نافذة سياق ضخمة تستوعب 400 ألف توكن مع قدرة على إنتاج 128 ألف توكن كمخرجات. وعلى الجانب الآخر، يركز nano بشكل مكثف على التصنيف واستخراج البيانات وترتيبها والمهام البرمجية البسيطة. ترسم هذه الخطوات ملامح استراتيجية جديدة وواضحة تدرج الخيارات أمام مجتمع التكنولوجيا بين القوة الفائقة، والعملية اليومية، والكفاءة الاقتصادية الشاملة.