في السنوات الأخيرة، استطاعت “أوبن إيه آي” أن تدهش العالم بابتكاراتها الثورية التي تتجاوز الحدود التقليدية للذكاء الاصطناعي.
ويأتي نموذج “أو3” (o3) كأحدث إنجازات الشركة، حيث أظهر تقدما لافتا في اختبار “إيه آر سي-إيه جي آي” (ARC-AGI). هذا التقدم لا يمثل مجرد خطوة جديدة، بل يعكس تحولا ملموسا نحو تحقيق الذكاء الاصطناعي العام، وهو هدف لطالما سعت “أوبن إيه آي” لتحقيقه.

مصدر الصورة
فجر جديد
بحلول نهاية عام 2024، شهد مجال الذكاء الاصطناعي مراجعات كبيرة، حيث عبّر بعض الخبراء في الصناعة عن مخاوف من تباطؤ التقدم نحو تطوير أنظمة ذكاء أكثر تطورا.
ومع ذلك، جاء نموذج “أو3” (o3) الجديد من “أوبن إيه آي” الذي تمّ الإعلان عنه في ديسمبر/كانون الأول من العام الماضي، ليُشعل موجة جديدة من الحماس والنقاش، مؤكدا أن الابتكارات الكبرى ما زالت ممكنة في عام 2025 وما بعده.
وعلى الرغم من أنه قد تم الكشف عن هذا النموذج لغرض اختبارات السلامة بين الباحثين ولم يطلق للجمهور بعد، فإنه أظهر تقدما لافتا على مقياس “إيه آر سي” (ARC)، وهو معيار تم تطويره عن طريق فرانسوا شولت، الباحث الشهير في مجال الذكاء الاصطناعي ومبتكر إطار العمل “كيراس” (Keras).
ويُعدّ هذا المعيار أداة حيوية لقياس قدرة النماذج على التعامل مع المهام الجديدة بذكاء، مما يعزز دلالته لتقييم التقدم نحو أنظمة ذكاء اصطناعي حقيقية.
من جهة مماثلة، يتعامل نموذج “أو3” (o3) مع عقبات رئيسية في مجالي الاستدلال والتكيف، وهي مشكلات لَطالما أعاقت تقدم النماذج الكبيرة. ومع ذلك يكشف عن تحديات جديدة، بما في ذلك التكاليف المرتفعة والاختناقات في الكفاءة المرتبطة بدفع هذه الأنظمة إلى أقصى إمكانياتها.
لكن ما الميزات التي تجعل نموذج “أو3” مختلفا؟
1- “توليف البرامج”
يقدم نموذج “أو3” من “أوبن إيه آي” قدرة جديدة تُعرَف بـ”توليف البرامج”، وهي ميزة تمكّنه من إعادة تكوين ما تعلمه أثناء مرحلة التدريب المسبق، مثل الأنماط، والخوارزميات، في تكوينات جديدة تماما.
والأهم من ذلك، أن “توليف البرامج” يسمح للنموذج بمعالجة مهام لم يصادفها بشكل مباشر أثناء تدريبه، مثل حل تحديات برمجية متقدمة، أو التعامل مع ألغاز منطقية جديدة تتطلب استدلالا يتجاوز تطبيق المعرفة المكتسبة.
2- البحث البرمجي باستخدام اللغة الطبيعية
تتمحور قدرة “أو3” (o3) على التكيف حول استخدامه لسلاسل التفكير (Chains of Thought, CoTs) وعملية بحث متقدمة تتم أثناء الاستدلال، أي عندما يكون النموذج في حالة تفاعل نشط للإجابة على الأسئلة أو حل المشكلات.
إذ تمثل هذه السلاسل تعليمات تدريجية مكتوبة بلغة طبيعية يقوم النموذج بإنشائها لاستكشاف الحلول بفعالية. وبالاستعانة بنموذج مقيّم، يتمكن “أو3” من توليد مسارات حلول متعددة وتقييمها بدقة لاختيار الخيار الأكثر ملاءمة.
3- نموذج المقيّم.. نوع جديد من التفكير
يعمل “أو3” بنشاط على توليد مسارات حلول متعددة أثناء عمليات الاستدلال، مع تقييم كل منها بدقة بمساعدة نموذج مقيّم مدمج، بهدف اختيار الخيار الأكثر وعدا.
حيث تتيح هذه الخاصية للنموذج العمل كقاضٍ على تفكيره الخاص، الأمر الذي يجعله أقرب للقدرة على التفكير بشكل حقيقي بدلا من الاكتفاء بمجرد الردّ.
4- تنفيذ برامجه الخاصة
تعدّ قدرة “أو3” على تنفيذ برامج سلاسل التفكير (CoTs) الخاصة به كأدوات لحل المشكلات التكيفية واحدة من أبرز ميزاته.
تقليديا كانت سلاسل التفكير (CoTs) تُستَخدم كأُطر تفكير منظمة خطوة بخطوة لحل مشكلات معينة، ولكن “أوبن إيه آي” قامت بتوسيع هذا المفهوم، مستغلة هذه السلاسل ككتل بناء قابلة لإعادة الاستخدام، مما يمنح النموذج مرونة أكبر في التعامل مع التحديات الجديدة.
5- البحث البرمجي الموجه بالتعلّم العميق
يستخدم نموذج “أو3” نهجا مبتكرا يعتمد على التعلّم العميق أثناء عملية الاستدلال، حيث يقوم بتقييم وتحسين الحلول المحتملة للمشاكل المعقدة. وتشمل هذه العملية توليد مسارات متعددة للحلول، ثم تقييم مدى جدواها باستخدام الأنماط المكتسبة خلال مرحلة التدريب.
ومع ذلك، أشار شولت وعدد من الخبراء إلى أن الاعتماد على “التقييمات غير المباشرة”، حيث يتم الحكم على الحلول استنادا إلى مقاييس داخلية بدلا من اختبارها في سيناريوهات حقيقية، قد يشكّل تحديا للنموذج عند تطبيقه في بيئات غير متوقعة أو مخصصة للاستخدامات التجارية.

مصدر الصورة
اختراق جديد أم تقدم تدريجي؟
يعتمد معيار “إي آر سي-إيه جي آي” (ARC-AGI) على تحديات التفكير المجرد التي تختبر قدرة أنظمة الذكاء الاصطناعي على التكيف مع المهام الجديدة وإظهار الذكاء السائل، حيث تتكون هذه المجموعة من ألغاز بصرية تتطلب فهما عميقا لمفاهيم مثل الأجسام، والحدود، والعلاقات المكانية.
فبينما يتمكّن البشر من حل هذه الألغاز بسهولة عبر عدد محدود من المحاولات، تجد أنظمة الذكاء الاصطناعي صعوبة كبيرة في التعامل معها، لهذا السبب، تُعدّ مجموعة التفكير المجرد واحدة من أصعب المقاييس لاختبار الذكاء الاصطناعي.
في هذا السياق، حقق نموذج “أو3” من “أوبن إيه آي” نتائج مثيرة في معيار “إيه آر سي-إيه جي آي” (ARC-AGI) بنسبة 75.5% باستخدام قدرات حوسبة قياسية، و87.5% باستخدام حوسبة عالية الأداء، متجاوزا الأداء السابق للنماذج بزيادة واضحة.
وفي منشور مدونة، وصف شولت أداء “أو3” بأنّه تقدم مفاجئ ومهم في قدرة الذكاء الاصطناعي على التكيف مع مهام جديدة لم تُر من قبل في نماذج عائلة “جي بي تي” (GPT).
وللتوضيح، استغرق الأمر 4 سنوات لتتقدّم النماذج من 0% مع “جي بي تي-3” (GPT-3) في عام 2020 إلى 5% مع “جي بي تي-4 أو” (GPT-4o) في أوائل 2024.
الأداء مقابل التكلفة
على الرغم من الأداء المبهر، فإن تكلفة تشغيل “أو3” في معيار “إيه آر سي-إيه جي آي” لا تزال مرتفعة، ففي التكوين منخفض الحوسبة، يكلف النموذج حوالي 17 إلى 20 دولارا و33 مليون وحدة نصية “توكن” (Token) لكل لغز.
أما في الميزانية عالية الحوسبة، تزداد التكلفة بشكل كبير، حيث يستخدم مليارات التوكنات لحل المشكلة الواحدة. وهذه الطريقة المكلفة هي التحدي الأكبر للنموذج، حيث يبرز شولت، ونات مكاليز، مهندس “أوبن إيه آي”، وآخرون المخاوف بشأن الجدوى الاقتصادية لمثل هذه النماذج، مؤكدين على الحاجة إلى ابتكارات توازن بين الأداء والقدرة على تحمل التكاليف.

مصدر الصورة
ماذا قال الخبراء؟
يتكهّن شولت بأن “أو3” يستخدم نوعا من توليد البرامج الذي يعتمد على التفكير المتسلسل (CoT)، وآلية بحث مدمجة مع نموذج مكافأة يقيّم وينقّح الحلول، بينما يقوم النموذج بتوليد الرموز، وهو ما يشبه ما كانت نماذج التفكير مفتوحة المصدر تكتشفه في الأشهر القليلة الماضية.
من جهة أخرى، يقترح علماء آخرون مثل ناثان لامبرت من معهد ألين للذكاء الاصطناعي أن “أو1″ و”أو3” يمكن أن يكونا في الواقع مجرد تمريرات أمامية من نموذج لغوي واحد.
وفي اليوم الذي تم فيه الإعلان عن “أو3″، كتب نات مكاليز، باحث في “أوبن إيه آي”، على منصة “إكس”: “أو1 كان مجرد نموذج لغوي كبير تم تدريبه باستخدام الواقع المعزز، وأو3 مدعوم بتوسيع نطاق التعلّم المعزز أكثر من أو1”.
في اليوم نفسه، وصف ديني زو من فريق التفكير في “غوغل ديب مايند” مزيج البحث، وأساليب التعلّم المعزز الحالية بأنها “طريق مسدود”، ونشر على منصة “إكس” يقول: “أجمل شيء في تفكير نماذج اللغة الكبيرة هو أن عملية التفكير تتولد بطريقة تلقائية، بدلا من الاعتماد على البحث مثل “إم سي تي إس” (mcts) في فضاء التوليد، سواء من خلال نموذج مُعَد جيدا أو من خلال موجه مصمم بعناية”.
الذكاء الاصطناعي والتفكير البشري
وفقا لتقرير نشره موقع “فينتشر بيت” (Venturebeat)، فإن “أو3” ما زال يفشل في بعض المهام السهلة جدا، مما يدل على اختلافات أساسية مع الذكاء البشري”، كما لا يمكنه تعلّم هذه المهارات بشكل مستقل، ويعتمد على المراجعين الخارجيين أثناء الاستدلال وسلاسل التفكير المعلمة بشريا أثناء التدريب.
كما أشار علماء آخرون إلى عيوب النتائج المبلغ عنها من قِبل “أوبن إيه آي”، حيث قالت العالمة ميلاني ميتشل: “يجب ألا يحتاج الحل إلى الكثير من التدريب المحدد، سواء على المجال نفسه أو على كل مهمة محددة”.
وللتحقق مما إذا كانت هذه النماذج تمتلك نوع التجريد والتفكير الذي تم إنشاء معيار “إيه آر سي” لقياسه، تقترح ميتشل التحقق مما إذا كانت هذه الأنظمة يمكن أن تتكيف مع متغيرات المهام المحددة، أو مع مهام التفكير باستخدام المفاهيم نفسها، ولكن في مجالات أخرى غير إيه آر سي”.
في النهاية، فإن عصرا جديدا تقوده خوارزميات التفكير البرمجي، حيث ستظل الحدود الفاصلة بين الذكاء الاصطناعي المتقدم والذكاء الاصطناعي العام غامضة ومفتوحة، فالتحديات ما زالت قائمة، ويبدو أن المستقبل يحمل المزيد من المفاجآت.
