إعداد: محمد كمال
الزلزال التكنولوجي الذي أحدثه برنامج ديب سيك (DeepSeek) الصيني للذكاء الاصطناعي في وادي السيلكون مقر عمالقة التكنولوجيا الأمريكيين، لا يأتي فقط بسبب تفوقه على نظرائه في الولايات المتحدة، لكن أيضاً لأنه قلب العديد من الفرضيات الأساسية حول تقدم الذكاء الاصطناعي، والأكثر إثارة أن كل ذلك تم بكلفة زهيدة عن طريق إحدى الشركات الناشئة قليلة الخبرة في هذا المجال.
وبحسب الخبراء والمتخصصين، فإن اختراق السياج الأمريكي للذكاء الاصطناعي يرسل موجات صادمة لعمالقة وادي السليكون؛ بل ويدور حول نهاية الهيمنة التكنولوجية الأمريكية، وجاء ذلك من دون ضجيج عبر ورقية بحثية بسيطة. حملت عنوان: «تحفيز القدرة على التفكير في ماجستير إدارة الأعمال عبر التعلم المعزز».
الورقة البحثية المكونة من 22 صفحة، والتي صدرت الأسبوع الماضي من قبل شركة صينية ناشئة تعمل في مجال الذكاء الاصطناعي تدعى DeepSeek، لم تطلق أجراس الإنذار على الفور، حيث استغرق الباحثون بضعة أيام لاستيعاب ما جاء فيها، والآثار المترتبة عليه.
وأنشأت الشركة نموذجاً جديداً للذكاء الاصطناعي يسمى DeepSeek-R1، تم بناؤه بواسطة فريق من الباحثين استخدموا عدداً متواضعاً من شرائح الذكاء الاصطناعي من الدرجة الثانية لمطابقة أداء النماذج الأمريكية الرائدة بجزء بسيط من الكلفة.
شركة DeepSeek قالت إنها فعلت ذلك باستخدام هندسة ذكية لتحل محل القدرة الحاسوبية الفائقة. وقد فعلت ذلك في الصين، وهي الدولة التي يعتقد العديد من الخبراء أنها كانت في المركز الثاني بفارق كبير في السباق العالمي للذكاء الاصطناعي، وفق صحيفة نيويورك تايمز.
ـ سر عمل ديب سيك ـ
كان تكتيك شركة DeepSeek هو تقليل معالجة البيانات اللازمة لتدريب النماذج، وذلك باستخدام بعض الاختراعات الخاصة بها والتقنيات التي تبنتها شركات الذكاء الاصطناعي الصينية التي تعاني قيوداً مماثلة.
ويقول لينارت هايم، الباحث في مجال الذكاء الاصطناعي: «تخيل الإصدارات السابقة من ChatGPT كأمين مكتبة قرأ جميع الكتب الموجودة. وعندما يُطرح عليه سؤال، فإنه يعطي إجابة بناء على الكتب التي قرأها»، لكن هذه العملية تستغرق وقتاً طويلاً ومكلفة.
لكن DeepSeek اتخذت نهجاً آخر، حيث لا يبحث التطبيق في جميع الكتب، لكنه تم تدريبه على استهداف الكتاب المناسب للحصول على الإجابة.
وفوق ذلك هناك تقنية أخرى تسمى «خليط الخبراء»، حيث يقوم DeepSeek بشيء يشبه تفويض الأسئلة إلى قائمة من الخبراء، وليس شخصاً واحداً يعرف كل شيء، كأن يتم توجيه أسئلة عن الخيل أو الطب أو الفن لمتخصص في كل مجال، وبذلك يحتاج كل خبير إلى تدريب أقل، ما يخفف الطلب على الرقائق للقيام بكل شيء في وقت واحد، وفق ما ذكرت صحيفة وول ستريت جورنال. كما يتطلب أسلوب DeepSeek وقتاً وطاقة أقل قبل طرح السؤال، لكنه يستخدم المزيد من الوقت والقوة أثناء الإجابة.
ـ نظريات المؤامرة ـ
وفي البداية لم يصدق مراقبو الصناعة إنجاز الشركة الصينية الناشئة، حيث اعتقدوا أن DeepSeek قد غشت لتحقيق نتائج ابتكارها، أو أنها تلاعبت بأرقام النماذج الأمريكية، لجعل نموذجها يبدو أكثر إثارة للإعجاب مما كان عليه، ثم افترض هؤلاء أنه ربما كانت الحكومة الصينية تروج لتقويض هيمنة الذكاء الاصطناعي الأمريكي، أو ربما كانت الشركة تخفي مجموعة من رقائق Nvidia H100، المحظورة بموجب ضوابط التصدير الأمريكية.
لكن كان الاكتشاف الدرامي، مع بحث المزيد من الأشخاص في تفاصيل DeepSeek-R1، الذي تم إصداره كبرنامج مفتوح المصدر، على عكس معظم نماذج الذكاء الاصطناعي الرائدة، ما يسمح للجهات الخارجية بفحصه عن كثب.
ـ أعلى معدل تحميل ـ
وفي أواخر الأسبوع الماضي، عندما بدأ الكثير من الأمريكيين في استخدام نموذج DeepSeek، وحقق التطبيق الخاص به على الهواتف المحمول المركز الأول في متجر تطبيقات Apple، تحول الأمر إلى حالة من الذعر الكامل.
ـ خديعة الإنفاق الضخم ـ
بالفعل أنفقت شركات مثل Microsoft وMeta وGoogle عشرات المليارات من الدولارات لتأسيس البنية التحتية التي اعتقدت أنها ضرورية لتشغيل نماذج الذكاء الاصطناعي من الجيل التالي. كما أن خططها المستقبلية تتضمن إنفاق عشرات المليارات الإضافية، أو في حالة ChatGPT لشركة OpenAI، ما يصل إلى 500 مليار دولار من خلال مشروع مشترك مع Oracle وSoftBank تم الإعلان عنه الأسبوع الماضي.
لكن يبدو أن DeepSeek قد أنفقت مبالغ أقل بكثير مقارنة بالإنفاق الأمريكي، وسط ترجيحات أن المبلغ أعلى من 5.5 مليون دولار، وهو الذي تدعي الشركة أنها أنفقته على تدريب نموذج سابق.
ولكن حتى لو كانت كلفة النموذج الصيني أكثر بعشر مرات مما تدعي DeepSeek، وحتى إذا أخذت في الاعتبار التكاليف الأخرى التي ربما تم استبعادها، مثل رواتب المهندسين أو تكاليف إجراء البحوث الأساسية، فإنها ستظل أقل من حيث الحجم مما ينفقه الذكاء الاصطناعي الأمريكي.
والإنجاز الذي حققته شركة DeepSeek فيما يتعلق بالكلفة يتحدى مقولة «الأكبر هو الأفضل»، التي أججت سباق التسلح بالذكاء الاصطناعي في السنوات الأخيرة من خلال إظهار أن النماذج الصغيرة نسبياً، عندما يتم إعدادها بشكل صحيح، يمكن أن تضاهي أو تتجاوز أداء النماذج الأكبر حجماً.
ويشير ذلك إلى أن الفترات المقبلة يمكن أن تشهد تدفقاً للاستثمارات في الشركات الناشئة الأصغر حجماً في مجال الذكاء الاصطناعي، ومنافسة أكبر بكثير لعمالقة وادي السيليكون. والتي، بسبب التكاليف الهائلة لنماذجها، كانت في الغالب تتنافس مع بعضها حتى الآن.
وهناك أسباب أخرى تجعل الجميع في وادي السيليكون يهتمون ببرنامج DeepSeek، حيث كشفت الشركة عن بعض التفاصيل حول كيفية بناء نموذجها فعلياً، والتي تتضمن بعض التقنيات المتطورة التي ساعدت على ضغط نماذج الذكاء الاصطناعي الكبيرة في نماذج أصغر، ما يجعلها أقل كلفة في التشغيل من دون التضحية بمميزات كبيرة من حيث الأداء.
ـ أسهم عملاقة في خطر ـ
ويشير خبراء الأسواق المالية، إلى أنه حتى لو انتعشت أسعار أسهم شركات التكنولوجيا الأمريكية العملاقة في الأيام المقبلة، فإن نجاح DeepSeek يثير تساؤلات مهمة حول استراتيجيات الذكاء الاصطناعي طويلة المدى. بمعنى أنه إذا كانت شركة صينية قادرة على بناء نماذج رخيصة ومفتوحة المصدر تضاهي أداء النماذج الأمريكية الباهظة الثمن، فلماذا يدفع أي شخص ثمناً باهظاً؟
ـ تقدم صيني مذهل ـ
ويقوض نموذج DeepSeek بعض الافتراضات الجيوسياسية التي طرحها العديد من الخبراء الأمريكيين حول موقف الصين في سباق الذكاء الاصطناعي، حيث يتحدى افتراض أن الصين تتخلف بسنوات عن التقدم الأمريكي في هذا المجال.
لكن نتائج DeepSeek تظهر أن الصين لديها قدرات متقدمة في مجال الذكاء الاصطناعي يمكنها أن تضاهي أو تتجاوز نماذج شركة OpenAI وغيرها من شركات الذكاء الاصطناعي الأمريكية.
كما تثير النتائج أيضاً تساؤلات حول ما إذا كانت الخطوات التي اتخذتها الحكومة الأمريكية للحد من انتشار أنظمة الذكاء الاصطناعي إلى من تصفهم بالخصوم، تؤدي الغرض منها أو أنها بحاجة إلى التكيف لتأخذ في الاعتبار طرقاً جديدة وأكثر كفاءة.
ـ انتقادات ـ
من بين الانتقادات لنموذج DeepSeek أن القائمين عليه يرفضون بشكل روتيني الإجابة عن أسئلة حول مواضيع حساسة داخل الصين، لكن ذلك قد لا يعني الكثير بالنسبة للملايين من مستخدمي البرنامج.
كما ثارت مخاوف في الولايات المتحدة بشأن حقيقة أن البيانات التي تتم مشاركتها مع نماذج DeepSeek قد تكون متاحة للحكومة الصينية، وهي المخاوف ذاتها التي تثار بشأن استخدام TikTok، ونفته مراراً بكين.
ـ بداية القصة ـ
كان التفكير التقليدي يرى أن تطوير الذكاء الاصطناعي الرائد يتطلب كميات كبيرة من رقائق الكمبيوتر المتطورة باهظة الثمن، لكن قام ليانج وينفينج، رئيس شركة DeepSeek، ببناء شركته في مركز التكنولوجيا في مدينة هانغتشو، حيث نشأت من صندوق تحوط لاستخدام الذكاء الاصطناعي في العثور على تداولات مربحة في الأسواق المالية.
وفي مقابلة مع إحدى الصحف الصينية في عام 2023، قال ليانغ إن معظم المناصب الفنية في الشركة يشغلها خريجون جدد أو أشخاص يتمتعون بخبرة سنة أو سنتين.
ويقول بات جيلسنجر، الرئيس التنفيذي السابق لشركة إنتل، على موقع إكس: «الهندسة تتعلق بالقيود. وكان لدى المهندسين الصينيين موارد محدودة، وكان عليهم إيجاد حلول إبداعية»، ولا يفسر الإبداع سوى جزء من نجاح DeepSeek.
وعلى الرغم مما يثار مع أو ضد النموذج الصيني الجديد، فإن الواقع يقر أنه أطلق عصراً جديداً في مجال الذكاء الاصطناعي، حيث لم تعد أكبر وأغنى شركات التكنولوجيا الأمريكية تفوز بشكل افتراضي، وفي أقل تقدير أظهر DeepSeek أن سباق التسلح بالذكاء الاصطناعي قد بدأ بالفعل، وأنه بعد عدة سنوات من التقدم المذهل، لا يزال هناك المزيد من المفاجآت.
0 تعليق